En quelques années, la recherche Web via les moteurs a considérablement évolué. Alors que pendant très longtemps, les moteurs se conformaient à la requête entrée par l’utilisateur, ce n’est plus le cas chez les géants du Web avec l’intégration de technologies alliant recherche sémantique, machine learning ou encore reconnaissance vocale ou visuelle.
L’une des évolutions majeures concerne les interactions entre l’utilisateur et la machine qui ont ainsi connu des mutations profondes ces dernières années.
Et au regard des présentations auxquelles nous avons assisté, l’avenir devrait être également riche en nouveautés.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
Au-delà de la recherche Web
Déjà abonné ? Connectez-vous...
La dernière session s’intéressait à la recherche au-delà de la recherche Web.
On retiendra de la présentation que les équipes de Microsoft à Londres qui travaillaient avant exclusivement sur le moteur de recherche Bing ont vu leurs attributions changer récemment et travaillent désormais uniquement au développement de solutions de recherche pour les produits Microsoft.
Cela a été illustré par la présentation du nouveau projet sur lequel travaillent les équipes à Londres : il s’agit d’un système permettant de répondre quasi-automatiquement à une demande de document par email.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
En effet, de nombreux mails professionnels ne sont en réalité que des demandes de documents ou fichiers (« Peux-tu m’envoyer le dernier compte-rendu de réunion ? » « Peux-tu m’envoyer la dernière version du fichier excel », etc.). Face à une telle demande, le système suggérerait directement à l’utilisateur le fichier présent sur son ordinateur à intégrer en réponse à son mail.
Le redéveloppement des équipes de Bing sur d’autres projets est en soi une information et n’a rien de rassurant pour l’avenir du moteur, surtout quand on sait qu’il traverse actuellement une mauvaise passe. Cependant, à l’heure où nous écrivons cet article, Bing vient d’annoncer le lancement de fonctionnalités de « recherche intelligente » et Microsoft sa volonté de relancer Bing pour contrer Google.
A suivre donc ...
Un des grands sujets de l’année 2017 a bien évidemment été celui des fake news et des bulles de filtres.
Si l’on a déjà pu lire une multitude de choses sur le sujet, ces quelques interventions avaient le mérite d’apporter des éclairages différents en proposant notamment des solutions techniques et méthodologiques pour lutter contre ce phénomène et évaluer les contenus.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
L’intervenant, Mark Harwood, développeur chez Elastic, était bien évidemment là pour mettre en avant les produits open source développés par sa société mais fort heureusement, pas seulement, en proposant une approche intéressante et des éléments de méthodologie pour lutter contre les fake news et les contenus dits « toxiques ».
La suite d’outils développés par Elastic permet de rechercher, analyser et visualiser des données issues de n’importe quelle source et sous n’importe quel format. Parmi ces outils, on citera Elasticsearch qui est un moteur de recherche et d’analyse ou encore Kibana, un outil de visualisation des données.
A travers ces outils, il a voulu montrer qu’il était possible de mettre en place un système similaire à celui des outils de recommandation de contenus disponibles aujourd’hui (recommandations de morceaux de musique similaires à ceux déjà écoutés sur les plateformes musicales, recommandations d’articles suite à ceux déjà consultés, etc.) mais dans un but inverse : se faire recommander des contenus illicites, « toxiques » ou déformant la réalité à partir de ceux déjà identifiés afin de les blacklister ou du moins les marquer comme indésirables.
Déjà abonné ? Connectez-vous...
La journée s’est finalement terminée sur la remise de prix des « search industry awards » avec le meilleur projet de recherche d’une part et la startup la plus prometteuse d’autre part.
Dans la première catégorie, c’est Datasearch, le moteur de données de la recherche développé par Elsevier qui a remporté le prix face à Trip Database, un outil de recherche en médecine par les preuves qui a récemment été amélioré et chatnoir, un projet de moteur de recherche web.
Pour la start-up, c’est searchhub.io qui a remporté la palme face à Nalanda. Searchhub.io est une solution qui s’intègre à n’importe quel moteur de recherche et qui recourt à l’intelligence artificielle pour améliorer la pertinence des résultats et mieux comprendre l’intention de l’utilisateur. Avec son produit Nalytics, Nalanda propose une solution pour extraire de la connaissance à partir de données non structurées.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
Entretien croisé entre Vera Lúcia Vieira, professionnelle de l’information indépendante au Brésil et Carole Tisserand-Barthole, rédactrice en chef de BASES et NETSOURCES :
"Je n’ai pas le sentiment que le métier soit en voie de disparition mais il y a nécessité de se renouveler en permanence."
J’ai une formation en Lettres Français-Portugais avec une spécialisation en Marketing et je suis diplômée en Français des Affaires par la Chambre de Commerce et d’Industrie de Paris.
Pendant dix ans, j’ai été professeur de français et de portugais dans l’enseignement secondaire et supérieur. C’est durant cette période que j’ai découvert avec intérêt la recherche d’information, pour suivre les nouvelles méthodes d’enseignement bien sûr, mais aussi pour m’informer sur les questions de marché impactant le métier.
J’ai très vite senti la nécessité d’aller au-delà de l’enseignement du français. Et c’est pour cette raison que j’ai décidé de m’adresser à la Chambre de Commerce France-Brésil où j’ai trouvé (et accepté) une offre d’emploi chez Rhodia Brasil (Rhône-Poulenc) au début des années 80. L’entreprise recherchait alors un professionnel pour participer à l’implantation de l’accès aux bases de données internationales.
Déjà abonné ? Connectez-vous...
On savait que Questel travaillait avec la société hongroise Chemaxon pour réaliser ses modules chimie. Comme les logiciels utilisés par Intellixir et Orbit sont différents, cela s’est fait en deux temps.
Intellixir a été le premier à offrir le module chimie, avec la contrainte de limiter la recherche aux données déchargées dans Intellixir mais avec l’avantage de fonctionner aussi bien sur des documents brevets que sur la littérature ou les essais cliniques.
En ce qui concerne Orbit, une première étape vient d’être franchie avec la mise a disposition en beta du module chimie qui permet, lui, d’effectuer des recherches sur l’ensemble de la base.
Pour y avoir accès, il suffit de le demander à son interlocuteur commercial, Questel étant très en demande de retours.
Précisons que, pour limiter le bruit, et comme dans Patentscope, ces recherches sont limitées aux brevets ayant au moins un code CIB dans le domaine de la chimie. Par contre, Orbit utilise un algorithme de détection de noms de molécules, ce qui signifie que cette détection n’est pas limitée par la mise à jour d’un thésaurus. L’algorithme sera donc capable de comprendre le nom d’une nouvelle molécule et de l’indexer.
Auteur : François Libmann, Directeur de Publication
SERVEURS • STN lance une interface Web plus conviviale
MÉTHODOLOGIE • Se former au-delà des frontières de l’infodoc
MÉTIER • Google Scholar : ami ou ennemi des outils professionnels ?
EN BREF • L’actualité du mois de Novembre 2017
Déjà abonné ? Connectez-vous...
La dernière édition de la manifestation ICIC en tant que telle vient d’avoir lieu à Heidelberg en Allemagne, citée universitaire charmante mais toujours aussi peu pratique d’accès.
Le schéma précis de cette organisation est original. Il a été créé il y a bien longtemps par Harry Collier et sa société Infonortics et a résisté fort longtemps, bien plus que le fameux Online de Londres qui a aussi duré longtemps mais s’est effondré totalement en quelques années, son modèle n’ayant finalement pas résisté aux évolutions, en particulier celle du Web.
On ne reviendra pas en détail sur les facteurs de succès de l’ICIC mais on rappellera l’originalité du couplage de la mini-exposition attenante à la conférence plénière sans sessions parallèles avec les présentations de 10 minutes des exposants. Autre détail bien pensé et pourtant évident, que nous n’avons jamais rencontré ailleurs, des badges de taille normale mais écrits en gros caractères, et surtout, imprimés recto-verso. C’est unique et pourtant élémentaire.
Cette session était une session de transition car malgré le format performant, tant le nombre de participants que le nombre d’exposants a inéluctablement décru depuis plusieurs années.
Déjà abonné ? Connectez-vous...
Nous avons déjà évoqué à la suite de l’édition 2016 de l’ICIC la généralisation de la reconnaissance automatique des éléments chimiques dans le texte, et ce quelle que soit la façon de les écrire (BASES n° 345, février 2017).
Comme on l’avait vu, au moins quatre acteurs étaient présents sur ce créneau : Infochem, en particulier avec l’OMPI, Ontochem IT Solution avec Infoapps, Chemaxon avec Questel, NextMove Software avec Minesoft (pour PatBase), sans oublier STN avec PatentPack basé sur la reconnaissance intellectuelle et non pas automatique des noms chimiques au sens large.
A l’occasion de l’édition 2017 de l’ICIC, Infochem (filiale de Springer Nature depuis 2015) a annoncé de nouveaux développements dans l’informatique appliqué à la chimie et en particulier a précisé l’ensemble des langues dans lesquelles son outil de reconnaissance fonctionnait désormais à savoir, l’anglais, l’allemand, le français, le russe, le coréen, le japonais et le chinois.
Infochem a notamment insisté sur le fait qu’ils adaptent précisément leurs prestations aux besoins précis de leurs clients, généralement dans le cadre d’un projet.
Lighthouse IP est une société néerlandaise créée en 2006 ayant de nombreux bureaux dans le monde. Son objectif est d’être la plus exhaustive possible dans le recensement de l’information sur les brevets et les marques.
En matière de brevets, Lighthouse IP couvre en texte intégral plus de 65 offices dans le monde. Ce texte intégral est dans la langue d’origine accompagné de traductions machine en anglais. Les deux versions sont « recherchables ».
La couverture inclut, en particulier, l’essentiel des offices asiatiques et sud américains.
Un double fichier baptisé DIAMOND sera disponible au premier trimestre 2018.
Le premier est un fichier bibliographique qui couvre 140 pays, l’objectif étant d’inclure tous les membres de l’accord PCT pour arriver à 152.
Le deuxième contient les informations légales dans un format analogue à celui d’Inpadoc. Mais, alors que seules les informations légales de 33 pays sont mises à jour régulièrement dans Inpadoc, Diamond offrira ces mises à jour pour une centaine de pays.
Déjà abonné ? Connectez-vous...