Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

La mort annoncée de la recherche booléenne ?

Carole Tisserand-Barthole
Bases no
340
publié en
2016.09
630
La mort annoncée de la recherche booléenne ? Image 1
La mort annoncée de la recherche booléenne ? Image 1

On reconnait bien souvent un professionnel de l’information à son utilisation intensive et souvent experte des opérateurs booléens et autres opérateurs avancés.

Chaque question est ainsi décortiquée, traduite en une liste de mots-clés avec leurs variantes et synonymes et combinés entre eux avec des opérateurs booléens et de multiples opérateurs avancés (termes dans la même phrase, termes cités au moins n fois, opérateurs de proximité, etc.).

Les autres professions ont quant à elles généralement tendance à méconnaître ces différentes fonctionnalités et à préférer des requêtes en langage naturel.

A l’origine, le terrain de jeu des professionnels de l’information était celui des serveurs et bases de données qui proposaient des fonctionnalités de recherche poussées avec la possibilité de construire des requêtes complexes voire même très complexes et supposaient une formation poussée pour y parvenir.

Par la suite, l’avènement du Web a démocratisé la recherche d’information au travers des moteurs de recherche et notamment Google. Même si les fonctionnalités de recherche étaient bien moindre que sur les serveurs, le principe restait néanmoins le même avec une utilisation des opérateurs booléens classique (AND, OR et NOT) et quelques opérateurs avancés (comme la possibilité de limiter la recherche au titre des pages, de limiter à certains formats de fichiers, à certains termes dans l’url ou l’extension de sites).

Mais récemment, on a pu voir fleurir sur le Web (principalement dans la blogosphère infodoc anglo-saxonne) divers articles et commentaires sur la mort de la recherche booléenne notamment sur Google. D’après ces sources, une requête en langage naturel produirait de bien meilleurs résultats qu’une requête booléenne sur Google (du moins en langue anglaise).

Cela s’expliquerait par les nombreuses avancées de Google en matière de sémantique et l’utilisation intensive des opérateurs booléens et avancés pourrait même brider les résultats du moteur. L’utilisateur ne tirant ainsi pas parti des différentes fonctionnalités sémantiques.

Nous avons donc voulu dans un premier temps faire le point sur les différentes théories qui ont émergé au cours des dernières années sur les meilleures méthodes pour interroger Google. Dans un second temps, nous avons mené une série de tests pour vérifier si une requête en langage naturel produisait bien de meilleurs résultats en anglais mais également en français. Ensuite, nous avons cherché à savoir si cette tendance à savoir la disparition progressive des méthodes de recherche traditionnelles au profit de la recherche sémantique s’appliquait également aux autres moteurs de recherche.

Enfin nous nous sommes également demandés si cette évolution vers la recherche sémantique et l’utilisation d’une syntaxe simplifiée était une tendance observée chez les serveurs et bases de données (pourtant le lieu idéal pour expérimenter des recherches booléennes complexes et élaborées) ou les autres outils de veille et de recherche utilisés par les professionnels de l’information. Nous traiterons en détail cet aspect dans le prochain numéro de Bases et nous nous consacrerons dans ce numéro à la recherche sur Google et les autres moteurs Web.

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...