La journée s’est finalement terminée sur la remise de prix des « search industry awards » avec le meilleur projet de recherche d’une part et la startup la plus prometteuse d’autre part.
Dans la première catégorie, c’est Datasearch, le moteur de données de la recherche développé par Elsevier qui a remporté le prix face à Trip Database, un outil de recherche en médecine par les preuves qui a récemment été amélioré et chatnoir, un projet de moteur de recherche web.
Pour la start-up, c’est searchhub.io qui a remporté la palme face à Nalanda. Searchhub.io est une solution qui s’intègre à n’importe quel moteur de recherche et qui recourt à l’intelligence artificielle pour améliorer la pertinence des résultats et mieux comprendre l’intention de l’utilisateur. Avec son produit Nalytics, Nalanda propose une solution pour extraire de la connaissance à partir de données non structurées.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
Entretien croisé entre Vera Lúcia Vieira, professionnelle de l’information indépendante au Brésil et Carole Tisserand-Barthole, rédactrice en chef de BASES et NETSOURCES :
"Je n’ai pas le sentiment que le métier soit en voie de disparition mais il y a nécessité de se renouveler en permanence."
J’ai une formation en Lettres Français-Portugais avec une spécialisation en Marketing et je suis diplômée en Français des Affaires par la Chambre de Commerce et d’Industrie de Paris.
Pendant dix ans, j’ai été professeur de français et de portugais dans l’enseignement secondaire et supérieur. C’est durant cette période que j’ai découvert avec intérêt la recherche d’information, pour suivre les nouvelles méthodes d’enseignement bien sûr, mais aussi pour m’informer sur les questions de marché impactant le métier.
J’ai très vite senti la nécessité d’aller au-delà de l’enseignement du français. Et c’est pour cette raison que j’ai décidé de m’adresser à la Chambre de Commerce France-Brésil où j’ai trouvé (et accepté) une offre d’emploi chez Rhodia Brasil (Rhône-Poulenc) au début des années 80. L’entreprise recherchait alors un professionnel pour participer à l’implantation de l’accès aux bases de données internationales.
Déjà abonné ? Connectez-vous...
On savait que Questel travaillait avec la société hongroise Chemaxon pour réaliser ses modules chimie. Comme les logiciels utilisés par Intellixir et Orbit sont différents, cela s’est fait en deux temps.
Intellixir a été le premier à offrir le module chimie, avec la contrainte de limiter la recherche aux données déchargées dans Intellixir mais avec l’avantage de fonctionner aussi bien sur des documents brevets que sur la littérature ou les essais cliniques.
En ce qui concerne Orbit, une première étape vient d’être franchie avec la mise a disposition en beta du module chimie qui permet, lui, d’effectuer des recherches sur l’ensemble de la base.
Pour y avoir accès, il suffit de le demander à son interlocuteur commercial, Questel étant très en demande de retours.
Précisons que, pour limiter le bruit, et comme dans Patentscope, ces recherches sont limitées aux brevets ayant au moins un code CIB dans le domaine de la chimie. Par contre, Orbit utilise un algorithme de détection de noms de molécules, ce qui signifie que cette détection n’est pas limitée par la mise à jour d’un thésaurus. L’algorithme sera donc capable de comprendre le nom d’une nouvelle molécule et de l’indexer.
Auteur : François Libmann, Directeur de Publication
SERVEURS • STN lance une interface Web plus conviviale
MÉTHODOLOGIE • Se former au-delà des frontières de l’infodoc
MÉTIER • Google Scholar : ami ou ennemi des outils professionnels ?
EN BREF • L’actualité du mois de Novembre 2017
Déjà abonné ? Connectez-vous...
La dernière édition de la manifestation ICIC en tant que telle vient d’avoir lieu à Heidelberg en Allemagne, citée universitaire charmante mais toujours aussi peu pratique d’accès.
Le schéma précis de cette organisation est original. Il a été créé il y a bien longtemps par Harry Collier et sa société Infonortics et a résisté fort longtemps, bien plus que le fameux Online de Londres qui a aussi duré longtemps mais s’est effondré totalement en quelques années, son modèle n’ayant finalement pas résisté aux évolutions, en particulier celle du Web.
On ne reviendra pas en détail sur les facteurs de succès de l’ICIC mais on rappellera l’originalité du couplage de la mini-exposition attenante à la conférence plénière sans sessions parallèles avec les présentations de 10 minutes des exposants. Autre détail bien pensé et pourtant évident, que nous n’avons jamais rencontré ailleurs, des badges de taille normale mais écrits en gros caractères, et surtout, imprimés recto-verso. C’est unique et pourtant élémentaire.
Cette session était une session de transition car malgré le format performant, tant le nombre de participants que le nombre d’exposants a inéluctablement décru depuis plusieurs années.
Déjà abonné ? Connectez-vous...
Nous avons déjà évoqué à la suite de l’édition 2016 de l’ICIC la généralisation de la reconnaissance automatique des éléments chimiques dans le texte, et ce quelle que soit la façon de les écrire (BASES n° 345, février 2017).
Comme on l’avait vu, au moins quatre acteurs étaient présents sur ce créneau : Infochem, en particulier avec l’OMPI, Ontochem IT Solution avec Infoapps, Chemaxon avec Questel, NextMove Software avec Minesoft (pour PatBase), sans oublier STN avec PatentPack basé sur la reconnaissance intellectuelle et non pas automatique des noms chimiques au sens large.
A l’occasion de l’édition 2017 de l’ICIC, Infochem (filiale de Springer Nature depuis 2015) a annoncé de nouveaux développements dans l’informatique appliqué à la chimie et en particulier a précisé l’ensemble des langues dans lesquelles son outil de reconnaissance fonctionnait désormais à savoir, l’anglais, l’allemand, le français, le russe, le coréen, le japonais et le chinois.
Infochem a notamment insisté sur le fait qu’ils adaptent précisément leurs prestations aux besoins précis de leurs clients, généralement dans le cadre d’un projet.
Lighthouse IP est une société néerlandaise créée en 2006 ayant de nombreux bureaux dans le monde. Son objectif est d’être la plus exhaustive possible dans le recensement de l’information sur les brevets et les marques.
En matière de brevets, Lighthouse IP couvre en texte intégral plus de 65 offices dans le monde. Ce texte intégral est dans la langue d’origine accompagné de traductions machine en anglais. Les deux versions sont « recherchables ».
La couverture inclut, en particulier, l’essentiel des offices asiatiques et sud américains.
Un double fichier baptisé DIAMOND sera disponible au premier trimestre 2018.
Le premier est un fichier bibliographique qui couvre 140 pays, l’objectif étant d’inclure tous les membres de l’accord PCT pour arriver à 152.
Le deuxième contient les informations légales dans un format analogue à celui d’Inpadoc. Mais, alors que seules les informations légales de 33 pays sont mises à jour régulièrement dans Inpadoc, Diamond offrira ces mises à jour pour une centaine de pays.
Déjà abonné ? Connectez-vous...
On connaissait déjà les accès professionnels à STN par STN Express ou par STN on the Web (attention pour cet accès à bien se connecter sur le site de FIZ Karlsruhe et pas sur celui de CAS). S’est ajouté en fanfare, il y a quelques années le «New STN» supposé remplacer et rendre obsolète les deux interfaces précédentes.
Le New STN, longtemps mis en avant, ne mettait toujours pas à disposition toutes les bases du catalogue et son développement apparaissait long et quelque peu problématique. Et effectivement, STN a fini par annoncer que cette interface utilisait des technologies nouvelles pour lesquelles des contraintes non prévues étaient apparues.
Cela a finalement conduit STN à arrêter le développement de cette nouvelle plateforme qui, pour le moment, reste accessible en l’état.
De leur côté, les interfaces STN on the Web et STN Express rencontrent, toujours d’après STN, des contraintes techniques rendant impossible de nouveaux développements.
C’est la raison pour laquelle une nouvelle interface, qui est une interface Web, a été développée et baptisée STNext.
Déjà abonné ? Connectez-vous...
On ne le répétera jamais assez mais se former en permanence à de nouvelles compétences est une qualité essentielle des professionnels de l’information.
Mettre à jour ses connaissances en veille, recherche d’informations ou tout autre sujet relatif à l’infodoc est bien évidemment indispensable, mais il serait dommage de s’y restreindre et de ne pas aller explorer des domaines annexes (formation, communication, etc.).
Cette idée d’article nous avait été suggérée par un visiteur d’un précédent salon i-expo qui nous avait expliqué les difficultés à identifier des formations dès lors que l’on sort du champ traditionnel de l’infodoc.
Effectivement, les organismes de formation, associations, conférences, salons gravitant autour de l’infodoc sont généralement bien connus des professionnels du domaine mais dès que l’on souhaite se former à des compétences nouvelles en dehors de cet univers, on arrive alors dans un monde complètement nouveau avec ses propres acteurs, experts et ses propres éléments de langage.
Déjà abonné ? Connectez-vous...
Dans l’imaginaire collectif des professionnels de l’information, Google Scholar, le moteur de recherche académique de Google, apparaît comme un concurrent des serveurs et bases de données payantes comme Scopus, Web of Science, Proquest, Proquest Dialog, etc.
S’il est de notoriété publique qu’une grande partie du contenu des sites et outils des éditeurs scientifiques se retrouvent sur Google Scholar, cela paraît moins évident pour le contenu des bases de données disponibles sur les grands serveurs.
Pourtant, on apprenait il y a peu que Google étendait sa collaboration avec Proquest en indexant près d’un demi million de thèses disponibles dans la base de données ProQuest Dissertations & Theses Global™ database (PQDT).
Rappelons que Google Scholar est un moteur de recherche dédié à la littérature scientifique lancé par Google à la fin de l’année 2004. Le moteur indexe le texte intégral ou les références bibliographiques de très nombreuses revues et ouvrages scientifiques et académiques, de thèses, d’actes de conférences et colloques, de preprints et même de brevets.
En terme de couverture, Google ne communique pas sur le nombre exact de documents indexés dans son moteur ni sur la liste exacte de ses partenariats avec des éditeurs ou des bases de données de professionnelles.
Ce que l’on sait, c’est qu’une grande partie du contenu des sites des éditeurs scientifiques et académiques sont indexés dans Google Scholar (Science Direct, Wiley Online, IEEE, ACM, etc.). On rappellera que l’accès au site des éditeurs scientifiques est gratuit et que les références des documents et le texte intégral des articles en Open Access sont accessibles gratuitement mais que l’accès au texte intégral des autres articles et ouvrages est quant à lui payant.
Plusieurs études ont également essayé d’estimer la taille de Google Scholar, certains l’évaluant à 100 millions de documents et d’autres à 160 millions.
Certaines voix laissent également entendre que Google Scholar propose une meilleure couverture des publications pour les Sciences dites « dures » que pour les Sciences Humaines et Sociales (SHS).
Google Scholar, contrairement aux grands serveurs et bases de données souvent utilisés pour la veille scientifique, a l’avantage d’être gratuit et accessible à tous. Cependant, ses fonctionnalités de recherche, de veille et d’analyse sont et restent bien en deçà de ce que peuvent proposer les grands serveurs ou agrégateurs.
Google Scholar n’a cessé de gagner en popularité au cours des dix dernières années. Très souvent, les chercheurs, étudiants, ingénieurs, etc. vont plus naturellement avoir le réflexe de se rendre sur Google Scholar que sur les serveurs et bases de données accessibles au sein de leurs institutions/entreprises.
Google Scholar peut donc apparaître comme un concurrent des serveurs et bases de données, et pourtant, certains de ces acteurs ont choisi de s’associer au géant américain...
Déjà abonné ? Connectez-vous...
