Nous avons cette année pu nous rendre au salon Internet Librarian International qui avait lieu à Londres les 16 et 17 octobre derniers et qui fêtait cette année ses 20 ans. Cette conférence de deux jours précédée d’une journée de Workshops se définit comme « The library innovation conference » et vise tous les professionnels de l’information dans leur ensemble qu’ils travaillent dans des bibliothèques publiques, universitaires ou des centres de documentation ou services de veille publics ou d’entreprise.
Pour beaucoup de professionnels qui avaient l’habitude de se rendre au salon Online et dont la dernière édition date de 2013, ce salon est devenu le rendez-vous incontournable de la profession, du moins en Europe. Nous avons ainsi pu y croiser des professionnels du monde entier, des anglais et américains surtout mais également de nombreux représentants des pays du nord de l’Europe et quelques personnes venues d’Asie.
Le modèle de la conférence est assez loin de ce qu’on a l’habitude de voir sur des salons comme I-expo par exemple. Ici, il n’est pas véritablement question d’exposants - seuls quelques sponsors disposaient d’une table dans le hall d’entrée avec quelques prospectus - mais de conférences plénières (une trentaine) réparties dans trois parcours thématiques. L’accès à l’ensemble de l’événement est entièrement payant.
La veille de l’ouverture se tenaient également quelques Workshops payants dédiés au Marketing des bibliothèques et à la recherche d’information.
Et parallèlement à cet événement, avait lieu la même conférence aux Etats-Unis sous le nom de « Internet Librarian », cette dernière s’étalant sur 3 jours.
Si globalement, on constatera que le public comme les sujets de conférences étaient tout de même plus orientés bibliothèques universitaires et publiques, il y avait quelques Workshops et quelques interventions particulièrement intéressantes dédiées à la recherche d’information et la veille. Nous reviendrons dans cet article sur tout ce qui concerne les dernières grandes tendances, innovations et l’avenir du métier.
Comme dans toutes les conférences et salons du domaine qui ont eu lieu en 2018, impossible d’échapper à l’Intelligence Artificielle et son impact sur le métier et les outils.
On retrouvera donc cette thématique en filigrane de plusieurs interventions.
Déjà abonné ? Connectez-vous...
Anne-Marie Libmann, directrice opérationnelle de FLA Consultants, et précédemment co-présidente de l'ADBS, a lu le nouveau livre de Jean-Philippe Accart, écrit en collaboration avec Clotilde Vaissaire-Agard : « Bibliothécaires, documentalistes, tous entrepreneurs ?
Comment un professionnel de l’information, héritier de décennies de croyances dans le bien-fondé intrinsèque de la pratique documentaire, peut-il se construire une nouvelle carrière, voire se reconstruire après le passage de Google et la fragilisation des métiers de « l’info-doc »?
Comment, sur ce terrain déconstruit par Internet et une information devenue (très) globalement accessible, développer un nouveau modèle, de nouvelles pratiques, un nouveau système de croyances et, osons le terme, un « business » ?
C’est dans le fond le problème, dramatique, que pose ce livre. Un dilemme semble d'ailleurs d’emblée s’inscrire dans le point d’interrogation même du titre. Un dilemme entre la volonté, et même la nécessité, de regarder l’avenir avec courage et la difficulté à sortir d’un passé glorieux, intellectuel, désormais intellectualisé et fantasmé.
Il est pour toute personne difficile, parfois douloureux, de devoir faire le choix d’un nouveau chemin professionnel. A la lecture de ce livre on peut se demander si ce n’est pas encore plus difficile pour un professionnel de l’information, documentaliste, bibliothécaire, archiviste, dont on sent qu’il s’est retrouvé véritablement dépossédé d’un métier et des valeurs nobles qu’il portait. L’auteur nous rappelle à juste titre : « une histoire riche remontant aux plus anciennes civilisations qui avaient pour souci de consigner les savoirs sous différentes formes et supports ». Un héritage lourd à porter pour certains d’entre nous…
Déjà abonné ? Connectez-vous...
BREVETS
• Intelligence artificielle et propriété intellectuelle
EN BREF
• Une actualité des moteurs très chargée
MÉTHODOLOGIE
• Comment retrouver sur le Web des articles de presse écrite au format original ?
Déjà abonné ? Connectez-vous...
Depuis plus d’un an maintenant, l’intelligence artificielle (IA) est au cœur de l’actualité et des discussions professionnelles. Mais s’il est beaucoup question d’IA et de machine learning, appliqués aux moteurs de recherche grand public, aux outils de traduction ou encore aux outils de veille, elle se fait plus discrète pour tout ce qui a trait à l’information scientifique et technique et les brevets. Et pourtant, elle y est bien présente et mérite qu’on s’y intéresse.
Lors de la dernière réunion annuelle du CFIB, le Club Francophone de l’Information Brevet, elle a d’ailleurs été au centre des discussions. L’une des présentations consacrée à l’intelligence artificielle et la propriété intellectuelle a ensuite fait l’objet d’un article très intéressant dans la lettre du CFIB.
Rappelons que le CFIB (Club Francophone de l’Information Brevet) réunit environ 160 membres tous pratiquant effectivement des recherches d’information brevet, à l’exception donc des vendeurs de solutions (serveurs, logiciels, etc.), afin de laisser la parole libre. Les personnes intéressées par une adhésion doivent la soumettre au bureau de l’association (https://lecfib.net) qui valident ou non ces demandes.
Le marché de l’IA devrait passer de 8 milliards $ en 2016 à plus de 47 milliards $ en 2020. Les investissements dans l’IA ont augmenté de plus de 300% en 2017 par rapport à l’année précédente. Des machines intelligentes, des algorithmes IA envahissent notre quotidien.
Aussi, la réglementation des activités liées à l’intelligence artificielle est devenue un enjeu majeur de politique publique. Les juristes, les décideurs mais également les entreprises doivent maîtriser les principaux défis juridiques de l’IA pour être bien positionnés dans cette révolution, parce que les effets perturbateurs de l’IA se feront sentir très vite sur les modèles d’affaires traditionnels et en particulier sur la propriété intellectuelle.
En effet, l’IA défie les notions juridiques les plus traditionnelles en matière de propriété intellectuelle, telles que la «copie», l’«originalité», le «créateur», l’«auteur» ou l’«inventivité».
Il n’est question ici que d’exposer les problèmes qui se posent, pas d’apporter des réponses à des questions qui font encore débat chez les juristes eux-mêmes.
Un robot peut faire l’objet de plusieurs protections : droit d’auteur, droit de modèle, brevet… Mais qu’en est-il de l’oeuvre du robot lui-même ?
Vis-à-vis du droit d’auteur, le robot a-t-il une personnalité et fait-il des choix libres et créatifs ? Vis-à-vis des bases de données, le robot est-il le producteur, en prend-il l’initiative, assume-t-il les risques de l’investissement ? Vis-à-vis du droit des brevets, que veut dire l’inventivité d’une solution technique quand elle est apportée par un robot ?
Voilà quelques-unes des questions qui se posent.
Déjà abonné ? Connectez-vous...
Pas toujours facile de suivre toutes les évolutions de Google quand on sait par exemple qu’il modifie son algorithme plus de 1 600 fois par an. Heureusement, toutes ces modifications ne revêtent pas la même importance et toutes n’ont pas d’impact sur la recherche d’information professionnelle.
Toujours est-il qu’en ce mois de septembre, les nouveautés sont nombreuses et méritent d’être signalées.
On commencera donc par le lancement d’un nouveau moteur dédié aux données publiques appelé « Google Dataset Search » accessible à l’adresse suivante : https://toolbox.google.com/datasetsearch.
On rappellera qu’un dataset ou jeu de données en français est « un ensemble de données où chaque valeur est associée à une variable et un commentaire. Ces données sont stockées dans des tables qui contiennent des colonnes et des lignes comme dans un tableau Excel. Ainsi, une base de données, ou database, est constituée de plusieurs jeux de données, structurés afin d’être exploitables par un programme informatique. » (source : www.matlo.com ).
Depuis le développement de l’Open Data, de nombreux organismes publics mettent à disposition des jeux de données librement accessibles tels que les horaires ou la ponctualité des trains, l’emplacement des lampadaires dans une ville, le Cadastre, la liste des organismes de formation, etc. Et du côté de l’information scientifique et technique, on voit également se développer la mise à disposition des données de la recherche par les chercheurs sous la forme de jeux de données accessibles sur le Web.
Les premiers retours d’experts et blogueurs sur le produit sont plutôt mitigés et pointent la faiblesse et l’absence de fonctionnalités de recherche dignes de ce nom mais également le fait que le moteur est très loin de donner accès à l’ensemble des jeux de données éparpillés sur le Web.
Voir aussi notre dossier spécial : Datasets : un nouvel enjeu pour la recherche d’information et la veille ?
Concernant le moteur Web, on a ainsi pu apprendre que :
Google a également décidé de revoir l’interface et les fonctionnalités de Google Images en proposant :
Comme Google, il a annoncé des améliorations à son moteur d’images Bing Visual Search :
Seul problème, on ne sait pas encore si cela sera accessible à tout le monde où bien uniquement aux internautes américains.
Enfin, Microsoft a annoncé vouloir unifier ses outils de recherche sur ses différents produits et services.
Microsoft Search deviendra l’outil de recherche principal pour Windows, Office et Bing. Les utilisateurs pourront donc obtenir des résultats Web (venant de Bing) mais également des résultats internes et locaux liés aux applications et services de Microsoft auxquels ils ont accès. Et comme on sait que la veille et la recherche d’information nécessitent bien souvent de combiner de l’information externe et interne, on suivra donc ces évolutions avec intérêt même si elle ne sont limitées qu’aux produits Microsoft...
La recherche d’articles de presse est un exercice classique pour les professionnels de l’information.
Pour autant, s’il existe de multiples outils et méthodes pour retrouver en ligne le contenu textuel d’articles parus dans des revues et journaux papier, cela s’avère nettement plus compliqué lorsque l’on souhaite retrouver les articles avec leur mise en page originale.
Bien souvent, lorsque l’on effectue des recherches dans la presse, seul le fond et le contenu ont de l’importance. La forme n’est que très secondaire.
Cependant, il existe des cas où il est préférable et parfois même requis de fournir l’article dans son format original :
Déjà abonné ? Connectez-vous...
CAS PRATIQUE
• Recherche d’information académique : enfin une comparaison concrète entre gratuit et payant
IC-SDV 2018
• Le premier IC-SDV à Nice
Déjà abonné ? Connectez-vous...
Les outils de recherche scientifiques et académiques gratuits, qui permettent de rechercher principalement des articles scientifiques mais également des monographies, compte-rendus de conférences ou encore thèses sont en pleine expansion.
Depuis le début de l’année, on a déjà pu voir apparaître deux nouveaux venus assez similaires, Dimensions et 1findr. Et à l’heure où nous écrivons ces lignes, les créateurs d’Unpaywall, l’extension de navigateur qui permet de savoir si un article est disponible ou non en libre accès (voir BASES n 350 – juillet/août 2017) vient d’annoncer le lancement prochain d’un moteur dopé à l’intelligence artificielle permettant de découvrir plus de 20 millions d’articles scientifiques en libre accès appelé Get the Research (http://gettheresearch.org/).
Et c’est sans compter sur Google Scholar qui est un quasi-réflexe pour bon nombre de chercheurs et qui existe quant à lui depuis 2004.
La plupart de ces outils disposent de corpus dont le volume est tout sauf ridicule. Google Scholar indexerait même, d’après les estimations que nous avons détaillées dans notre précédent numéro de BASES (N 360 – juin 2018), un volume de documents du même ordre de grandeur que ce que propose Proquest Dialog ou STN (chiffres vérifiés dans ce cas).
Mais peut-on pour autant confier sa recherche bibliographique ou sa revue de littérature à ces seuls outils gratuits ?
Dans ce même numéro de BASES, nous avions regardé de près la littérature comparant les outils de recherche scientifiques et académiques payants comme les grands serveurs et bases de données et les outils de recherche gratuits comme Google Scholar, 1findr, Dimensions, etc.
On constatait alors que les comparaisons réalisées par les auteurs de ces articles tournaient pratiquement toujours autour du nombre d’articles et de la taille des corpus. Mais un élément crucial, les fonctionnalités de recherche et la capacité à construire des requêtes sophistiquées était systématiquement occulté.
Nous avons donc choisi de réaliser nos propres tests sur deux sujets distincts afin de voir ce qu’il en retournait : le premier nécessitant la création d’une requête un minimum élaborée, couvrant plusieurs disciplines et un second beaucoup plus simple sur une seule thématique.
Déjà abonné ? Connectez-vous...
La première édition de IC-SDV née de la fusion des manifestations ICIC et II-SDV organisées par Christoph Haxel vient d’avoir lieu à Nice, incontestablement plus facile d’accès qu’Heidelberg, mais peu accueillante.
On a retrouvé le format et les caractéristiques des deux manifestations qui avaient fusionné avec légèrement plus de monde, ce qui est logique. Nous avons également remarqué une plus grande fluidité dans les échanges entre les congressistes à leur grande satisfaction.
On pouvait craindre que, comme l’intelligence artificielle est à la mode, la manifestation serait centrée sur l’IA. Ce ne fut heureusement pas le cas même si ce concept était souvent présent en filigrane dans les différentes thématiques abordées lors du congrès. Par ailleurs il y a suffisamment d’autres manifestations qui lui sont spécifiquement consacrées.
Comme à chaque édition et comme dans toute conférence, le choix des conférenciers n’était pas parfait, certains conférenciers étaient excellents et passionnants, d’autres simplement banals faisant l’historique de choses archi-connues ou tout simplement incompréhensibles.
Mais le comité de sélection des conférences a encore quelques progrès à faire car INNOVATIONQ Plus n’avait qu’un stand vendu avec seulement une présentation de produit de 10 mn alors qu’il s’agit d’une vraie innovation qui aurait mérité une conférence plénière.
Nous avons présenté en détail ce produit dans le numéro 358 de BASES (Avril 2018). Rappelons simplement qu’il s’agit d’une joint-venture entre ip.com et IEEE qui propose de rechercher à la fois dans les brevets et la littérature dans les domaines de l’électricité et de l’électronique au sens large.
La première conférence à éveiller notre intérêt a été celle présentée par Patrick Fiévet, de l’Organisation mondiale de la propriété intellectuelle (OMPI) et Jacques Guyot de la Fondation Olanto, une fondation suisse sans but lucratif basée à Genève. L’objectif d’Olanto est de créer et de diffuser des logiciels gratuits dans les domaines de la traduction assistée par ordinateur, de la traduction machine et de la recherche multilingues et d’autres domaines liés au langage.
L’OMPI s’était intéressée dès 2003 à la création d’un système IPCCAT pour aider les utilisateurs à trouver les bonnes classifications d’un brevet mais aussi d’aider les petits offices à mieux classer les brevets et, d’une façon plus générale, d’automatiser ce type de classement.
De 2004 à 2009, l’approche a consisté à développer un système s’appuyant sur des outils puissants de machine learning entraînés par l’analyse de documents classés manuellement.
Cette approche était néanmoins limitée par la puissance informatique disponible et la couverture des niveaux les plus fins de la CIB par les collections d’entraînement disponibles.
En 2017, l’OMPI a décidé de reprendre la recherche sur IPCCAT visant une catégorisation de l’ensemble de la CIB au niveau des sous-groupes au nombre de 72 981 dans la version 2017.01 de la CIB. Précisons qu’un sous-groupe se présente sous la forme H013 3/02 tandis que le groupe principal correspondant à cet exemple s’écrit H013 3/00.
Déjà abonné ? Connectez-vous...
DOSSIER SPECIAL INFORMATION SCIENTIFIQUE ET ACADÉMIQUE
• Google Scholar est-il un véritable outil de recherche scientifique ?
BILLET D’HUMEUR
• La perversité de Google Scholar
PANORAMA
• Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
Déjà abonné ? Connectez-vous...