Les longues requêtes booléennes n’ont pas encore dit leur dernier mot surtout dans les outils de recherche professionnels.
Savoir construire des requêtes expertes reste une compétence indispensable pour le professionnel de l’information.
Mais cela n’est pas toujours simple. Car il faut d’une part penser aux différentes composantes de sa requête sans oublier certains concepts ou mots-clés importants. Et d’autre part, il est nécessaire de savoir correctement traduire sa question dans la syntaxe de l’outil de recherche que l’on utilise.
Et comme dans toute construction humaine, on n’est jamais à l’abri d’une erreur.
D’ailleurs, il n’est pas rare qu’en soumettant une même question à plusieurs professionnels de l’information, on arrive souvent à des stratégies de recherche différentes d’une personne à l’autre.
En effet et malgré une bonne connaissance des sources, des outils et des méthodes, il reste toujours une part de subjectivité dans une recherche d’information.
Lors de la récente journée d’étude Search Solutions 2018 dont nous avons eu l’occasion de parler dans le précédent numéro de BASES, l’un des intervenants, Tony Russell-Rose, créateur d’un nouvel outil d’aide à la création de requête, 2dSearch dont nous parlons par la suite, a justement abordé cette question de l’erreur et des approximations qui sont au cœur des stratégies de recherche.
Il a notamment cité une étude menée en 2006 sur les erreurs dans les stratégies de recherche pour les revues systématiques (« Errors in search strategies were identified by type and frequency » Journal of Clinical Epidemiology, octobre 2006).
Les auteurs de cette étude ont ainsi analysé 63 stratégies de recherche Medline issues de The Cochrane Library: Issue Number 3 for 2002. Deux professionnels de l’information ont ensuite été chargés d’analyser ces stratégies à la recherche de potentielles erreurs.
Et les résultats montrent que les erreurs étaient nombreuses :
Parmi les erreurs les plus communes, on trouvait :
Dans la même veine, il a également cité un article paru en 2018 intitulé « Identification of problems in search strategies in Cochrane Reviews » (https://onlinelibrary.wiley.com/doi/full/10.1002/jrsm.1302) où les auteurs ont cette fois-ci analysé 70 stratégies de recherche. Ils arrivaient alors à la conclusion qu’il existait des erreurs dans ces stratégies dans 73% des revues systématiques analysées.
Si ces deux articles se concentrent exclusivement sur les stratégies de recherche dans un contexte de revues systématiques, les autres types de recherche ne sont pas pour autant épargnés par les erreurs.
Il est important de préciser que nous ne développerons pas ici en détail la question des outils et méthodes permettant d’identifier des mots-clés pour enrichir sa recherche car nous avions déjà publié récemment dans NETSOURCES un article sur le sujet : « Comment identifier les bons mots-clés ? » (NETSOURCES n°135 - juillet/août 2018).
Déjà abonné ? Connectez-vous...
La prochaine édition d’IC-SDV aura lieu les 8 et 9 avril prochains à Nice. Cette conférence/exposition a, dans sa présentation, pour thématiques générales la recherche elle-même, les data, le text mining et la visualisation.
Cette année, les thèmes qui seront le plus traités concerneront le machine learning, l’intelligence artificielle et différents types de visualisation.
Le mercredi 10 sera spécifiquement consacré à l’analyse et à la visualisation. Les intervenants seront VantagePoint et Bizint Smart Charts.
AGENDA : Conférence i-expo 2019
TENDANCES : La recherche d’information aux mille visages en 2019
PANORAMA : Un regain d’énergie et de vitalité pour les outils de recherche
MÉTHODOLOGIE : Bien interroger les outils de recherche gratuits : une multitude de méthodes
Déjà abonné ? Connectez-vous...
La recherche d’information est au cœur des métiers de l’information depuis toujours et on a parfois le sentiment de tout savoir à son sujet. Mais la recherche d’information telle qu’elle était pratiquée il y a plus de 30 ans (lors du lancement de BASES par exemple) n’a plus grand chose à voir avec celle que nous pratiquons aujourd’hui. Elle se transforme d’ailleurs plus vite que jamais...
D’un côté, rechercher de l’information n’a jamais eu l’air aussi simple et accessible. On dispose en effet de nombreux outils gratuits proposant des interfaces intuitives et que l’on peut interroger en langage naturel.
Mais de l’autre, nous vivons aujourd’hui dans un monde avec une surabondance de sources, outils, méthodes et informations.
La recherche d’information n’a en réalité peut-être jamais été aussi complexe et multiple.
Lire aussi :
Un regain d’énergie et de vitalité pour les outils de recherche
Bien interroger les outils de recherche gratuits : une multitude de méthodes
Nous abordons régulièrement dans BASES et NETSOURCES la question de l’évolution de la recherche d’information, de ses méthodes et outils, soit par l’intermédiaire de comptes-rendus de conférences, soit en nous focalisant sur des aspects précis.
Mais en ce début d’année, nous avons décidé de proposer un panorama global de la recherche d’information professionnelle et experte en 2019 :
Cet aspect sera abordé dans ce numéro de BASES.
Il y a une vingtaine d’années, les outils de recherche d’information dans un contexte professionnel se divisaient en deux catégories bien distinctes.
- d’un côté les bases de données et serveurs professionnels qui donnaient accès à des contenus payants (articles de presse, articles scientifiques et académiques, brevets, études de marché, données financières, profils pays et d’entreprise, etc.)
- de l’autre, les outils de recherche gratuits du Web ouvert (moteurs de recherche, annuaires généralistes et spécialisés, métamoteurs, portails sectoriels, etc.) qui donnaient essentiellement accès à des contenus gratuits.
Lire aussi :
Bien interroger les outils de recherche gratuits : une multitude de méthodes
Mais en 1998, Google est arrivé et a progressivement pris toute la place sur le créneau de la recherche sur le Web ouvert.
Ses concurrents directs mais aussi les annuaires, métamoteurs, etc. ont progressivement fermé leurs portes. Et tous ceux qui ont tenté par la suite de le concurrencer ont vite disparu des écrans radars. Seul Bing(Microsoft) a réussi à survivre mais toujours très loin derrière...
Ainsi, au cours des dix dernières années, on avait de plus en le plus le sentiment que la recherche professionnelle sur le Web ouvert se limitait quasi-exclusivement à interroger Google et ses moteurs dérivés (Google Images, Blogs, Scholar, etc.) en tirant parti le mieux possible, de leurs fonctionnalités avancées.
Déjà abonné ? Connectez-vous...
Si, comme nous avons pu le voir, le paysage des outils de recherche a évolué, c’est également la façon de les interroger qui a beaucoup changé en quelques années.
Au départ, tous les outils ou presque proposaient au minimum une recherche booléenne simple.
Par recherche booléenne, nous faisons référence ici à des requêtes structurées plus ou moins longues où l’on combine des mots-clés grâce aux opérateurs booléens classiques AND, OR, NOT mais aussi des opérateurs avancés (opérateur de proximité, recherche dans le titre, recherche sur un type de fichier, troncature, etc.).
Lire aussi :
Un regain d’énergie et de vitalité pour les outils de recherche
Google évolue, les documentalistes plus utiles que jamais
Comment bien interroger Google en 2018
L'information sur le Web est éphémère : quel impact et quelles solutions pour la recherche d’information ?
Au départ donc, tous les outils ou presque proposaient au minimum une recherche booléenne simple. Mais la seule différence, c’est que les outils de recherche Web étaient souvent extrêmement simplistes comparés aux outils de recherche professionnels mis à disposition par les serveurs et bases de données payantes.
Ces derniers proposaient en effet :
Déjà abonné ? Connectez-vous...
Toujours sur le sujet de la recherche d’information, nous vous invitons à venir assister lors du prochain salon i-expo le 21 mars 2019 à 10h.
Cette conférence sera animée par Anne-Marie LIBMANN, directrice opérationnelle de FLA CONSULTANTS, cabinet d’intelligence économique et technologique et à laquelle participeront, entre autres,
Les thèmes discutés seront :
PANORAMA
• Les banques de données brevet gratuites ou freemium
SERVEURS PROFESSIONNELS
• STN : de nombreuses nouveautés
SEARCH SOLUTIONS 2018
• Les moteurs de recherche vers toujours plus de recommandations de contenus
• De la recherche par mot-clé à la recherche vocale et visuelle
INDEX
• Index BASES 2018
Déjà abonné ? Connectez-vous...
Le Web d’aujourd’hui s’émancipe de plus en plus du contenu textuel avec une part toujours plus importante de contenus multimédias. Et de fait, la recherche Web traditionnelle par mot-clé évolue également avec une progression importante de la recherche vocale et de la recherche visuelle et d’images.
Durant cette deuxième session de la journée Search Solutions 2018, il a été question de recherche vocale chez Google d’une part et de recherche d’images chez les journalistes d’autre part.
Lire aussi dans ce dossier :
Les moteurs de recherche vers toujours plus de recommandations de contenus
Cette année encore, Google était présent à la journée d’étude par l’intermédiaire d’Enrique Alfonseca, Research Tech Lead/Manager. Et comme l’année dernière, il était question de recherche conversationnelle appliquée cette fois-ci à l’Assistant Google, l’assistant personnel intelligent développé par Google dont la première version date de 2016.
Preuve en est que la recherche conversationnelle (ici conversation orale entre un internaute et un assistant personnel) est un sujet-clé pour Google.
La recherche d’information dans un cadre professionnel sur Google Assistant n’est pas encore pour demain. L’assistant personnel de Google n’a pour le moment vocation qu’à répondre à des questions du quotidien comme la météo, la réservation d’un restaurant ou de places de cinéma.
Mais comprendre les angles de recherche de Google, c’est aussi comprendre sa stratégie sur le long-terme et son adéquation ou inadéquation potentielle avec les problématiques des professionnels de l’information.
L’assistant Google permet aujourd’hui à l’utilisateur d’interagir avec la machine dans le but de réaliser une tâche. C’est l’utilisateur qui guide la machine et non l’inverse.
Quand les gens interrogent un assistant personnel, ils souhaitent :
Et, par la même occasion, ils souhaitent apprendre quelque chose.
Et tout cela doit fonctionner sans aucun visuel et uniquement grâce à des réponses orales.
La principale difficulté, c’est qu’une très grande partie des sources d’informations Web sont « non structurées » à l’image des pages Web, Wikipédia, etc. Il n’y a pas de champs pour indiquer que telle information correspond à un horaire, une définition, un tarif, une date de naissance, etc.
Déjà abonné ? Connectez-vous...
On sait que l’offre en matière de banques de données brevets est assez pléthorique. Cela reflète d’abord l’évolution des technologies rendant plus facile la création d’une offre sophistiquée. Cette évolution coïncide avec l’importance croissante de l’intérêt pour les brevets pour un grand nombre d’entreprises, de la start-up à la multinationale en passant par les laboratoires publics en mal de valorisation. Un élément facilitant est que ces informations sont a priori gratuites et ne font pas l’objet d’un copyright.
En revanche, la demande croissante de la traduction en anglais des brevets de plus en plus nombreux déposés dans des langues « exotiques », en particulier asiatiques, et n’ayant pas d’équivalent en anglais, génère des coûts non négligeables. Cela est d’autant plus vrai que l’évolution rapide des logiciels de traduction oblige à refaire assez souvent, en les améliorant, les traductions d’une langue essentiellement vers l’anglais. Néanmoins, dans certains cas, les traductions sont disponibles gratuitement.
On peut classer l’offre des banques de données brevets en quatre catégories :
La revue World Patent Information d’Elsevier a publié en mars dernier un article intitulé « Study and comparison of the unique selling propositions (USPS) of free-to-use multinational patent search systems » écrit par Björn Jürgen et Nigel Clarke analysant de façon détaillée six de ces services gratuits.
Leur analyse a été extrêmement fouillée puisqu’ils ont utilisé 66 critères pour évaluer ces six services.
Le minimum de fonctionnalités exigées pour retenir ces six services a été la possibilité de rechercher par mots-clés, par inventeur, par déposant, par date et numéro de priorité, de dépôt ou de publication.
Nous avons exploré ces six sites en privilégiant une présentation générale de chacun d’entre eux plutôt que la reprise détaillée des éléments de l’article auquel on pourra toujours se référer.
On notera la grande variété de ces sites, certains se limitant aux brevets d’autres offrant des brevets et des articles de littérature scientifique. Certains sont totalement gratuits tandis que d’autres sont des sites freemium, sachant que la version gratuite offre déjà des possibilités significatives de recherche. A l’exception de l’un d’entre eux consacré à la chimie, tous sont généralistes.
Enfin, même s’ils sont gratuits, au moins en partie, ce sont des sites plutôt sophistiqués offrant de nombreuses possibilités. Si l’on souhaite vraiment les exploiter au maximum de ce qu’ils offrent, il est nécessaire d’investir un minimum de temps, afin de les maîtriser.
Déjà abonné ? Connectez-vous...