Si Google a choisi de lancer un nouveau moteur dédié aux datasets (https://toolbox.google.com/datasetsearch), ce n’est certainement pas par pur philanthropisme. Il y voit très certainement son intérêt et ambitionne de refaire avec les données ce qu’il a déjà fait avec les publications scientifiques et académiques à travers le moteur académique Google Scholar.
Google a très justement perçu l’importance de ce mouvement d’ouverture des données qu’il s’agisse de données publiques ou de données de la recherche, le manque d’homogénéité et de visibilité des initiatives existantes et l’importance de pouvoir y accéder facilement.
Et il ne compte pas passer à côté de cette opportunité de fédérer la recherche sur les données et de devenir la source de référence sur le sujet. Il le dit d’ailleurs lui-même :
« Dataset Search permet aux utilisateurs de trouver des ensembles de données sur le Web grâce à une simple recherche par mot-clé. L’outil présente des informations sur des ensembles de données hébergés dans des milliers de référentiels sur le web. Ces ensembles de données deviennent ainsi accessibles et utiles à tous. »
Lire aussi dans ce dossier :
Les Datasets : un nouvel enjeu pour la recherche d’information et la veille ?
Les données de la recherche : un nouveau pan de la recherche d’information scientifique et technique
Quelques rappels sur l’open data au service de la recherche d’information
Quand on pense recherche d’information et veille scientifique et technique, on pense essentiellement articles, revues scientifiques mais aussi brevets. Mais jusqu’à encore récemment, les données de la recherche ne faisaient pas vraiment partie du spectre.
La raison en est simple : Ces données, produites par les chercheurs dans le cadre de leurs recherches étaient rarement diffusées et rendues publiques. Et lorsque c’était le cas, très peu d’outils de recherche ou sources d’information capitalisaient dessus.
Et encore aujourd’hui, bon nombre de sources classiques comme les bases de données, serveurs, moteurs académiques, archives ouvertes, etc. ne proposent pas de datasets ou bien fort peu.
Lire aussi dans ce dossier :
Les Datasets : un nouvel enjeu pour la recherche d’information et la veille ?
Google Dataset Search : peut-il devenir le Google Scholar des données ?
Quelques rappels sur l’open data au service de la recherche d’information
Nous avons déjà eu l’occasion de parler de l’open data à de multiples reprises, dans BASES et dans NETSOURCES et nous lui avions même consacré un article de fond en janvier 2016 («Open Data : une mine d’or brute pour les professionnels de l’information», BASES n°333 - Janvier 2016).
Pour autant, le volume de données liées à l’open data continue de s’accroître et de nouvelles sources en la matière voient le jour régulièrement.
Lire aussi dans ce dossier :
Les Datasets : un nouvel enjeu pour la recherche d’information et la veille ?
Google Dataset Search : peut-il devenir le Google Scholar des données ?
Les données de la recherche : un nouveau pan de la recherche d’information scientifique et technique
Les plus anciens de nos lecteurs ont certainement entendu parler de Madeleine Wolff-Terroine, l’ont rencontrée ou ont travaillé avec elle.
Elle vient de nous quitter à l’âge de 99 ans.
Personnalité marquante du monde de l’infodoc, elle a eu une carrière extrêmement riche tant en France (elle a été présidente de l’ADBS dans les années 70) qu’à l’étranger, en travaillant pour de nombreux organismes internationaux.
Elle a aussi écrit régulièrement dans BASES dans les années 90.
PANORAMA
• L’information sur le Web est éphémère : quel impact et quelles solutions pour la recherche d’information ?
COMPTE-RENDU DE CONFÉRENCE
• Internet Librarian International : le salon incontournable des professionnels de l’information anglophones
A LIRE
• Le professionnel de l’information peut-il se réinventer en entrepreneur ?
Quand on recherche de l’information sur le Web, on a souvent l’impression que tout ce qui a, un jour, été publié sur le Web ouvert doit pouvoir se retrouver d’une manière ou d’une autre, notamment en tirant parti des fonctionnalités avancées des moteurs de recherche comme Google. Or l’information sur le Web ouvert est bien plus éphémère qu’on ne pourrait le croire...
Dans la réalité, une très grande partie de ce qui a été publié sur le Web dans les années 1990 et 2000 n’existe plus en tant que tel. Les sites Web ont été refaits ou ont tout simplement disparu. Et de fait, bon nombre de ces contenus sont désormais inaccessibles par les moteurs de recherche classiques.
Nous avons cette année pu nous rendre au salon Internet Librarian International qui avait lieu à Londres les 16 et 17 octobre derniers et qui fêtait cette année ses 20 ans. Cette conférence de deux jours précédée d’une journée de Workshops se définit comme « The library innovation conference » et vise tous les professionnels de l’information dans leur ensemble qu’ils travaillent dans des bibliothèques publiques, universitaires ou des centres de documentation ou services de veille publics ou d’entreprise.
Pour beaucoup de professionnels qui avaient l’habitude de se rendre au salon Online et dont la dernière édition date de 2013, ce salon est devenu le rendez-vous incontournable de la profession, du moins en Europe. Nous avons ainsi pu y croiser des professionnels du monde entier, des anglais et américains surtout mais également de nombreux représentants des pays du nord de l’Europe et quelques personnes venues d’Asie.
Anne-Marie Libmann, directrice opérationnelle de FLA Consultants, et précédemment co-présidente de l'ADBS, a lu le nouveau livre de Jean-Philippe Accart, écrit en collaboration avec Clotilde Vaissaire-Agard : « Bibliothécaires, documentalistes, tous entrepreneurs ?
Comment un professionnel de l’information, héritier de décennies de croyances dans le bien-fondé intrinsèque de la pratique documentaire, peut-il se construire une nouvelle carrière, voire se reconstruire après le passage de Google et la fragilisation des métiers de « l’info-doc »?
Comment, sur ce terrain déconstruit par Internet et une information devenue (très) globalement accessible, développer un nouveau modèle, de nouvelles pratiques, un nouveau système de croyances et, osons le terme, un « business » ?
C’est dans le fond le problème, dramatique, que pose ce livre. Un dilemme semble d'ailleurs d’emblée s’inscrire dans le point d’interrogation même du titre. Un dilemme entre la volonté, et même la nécessité, de regarder l’avenir avec courage et la difficulté à sortir d’un passé glorieux, intellectuel, désormais intellectualisé et fantasmé.
Il est pour toute personne difficile, parfois douloureux, de devoir faire le choix d’un nouveau chemin professionnel. A la lecture de ce livre on peut se demander si ce n’est pas encore plus difficile pour un professionnel de l’information, documentaliste, bibliothécaire, archiviste, dont on sent qu’il s’est retrouvé véritablement dépossédé d’un métier et des valeurs nobles qu’il portait. L’auteur nous rappelle à juste titre : « une histoire riche remontant aux plus anciennes civilisations qui avaient pour souci de consigner les savoirs sous différentes formes et supports ». Un héritage lourd à porter pour certains d’entre nous…
Depuis plus d’un an maintenant, l’intelligence artificielle (IA) est au cœur de l’actualité et des discussions professionnelles. Mais s’il est beaucoup question d’IA et de machine learning, appliqués aux moteurs de recherche grand public, aux outils de traduction ou encore aux outils de veille, elle se fait plus discrète pour tout ce qui a trait à l’information scientifique et technique et les brevets. Et pourtant, elle y est bien présente et mérite qu’on s’y intéresse.
Lors de la dernière réunion annuelle du CFIB, le Club Francophone de l’Information Brevet, elle a d’ailleurs été au centre des discussions. L’une des présentations consacrée à l’intelligence artificielle et la propriété intellectuelle a ensuite fait l’objet d’un article très intéressant dans la lettre du CFIB.