Alors qu’à ses débuts Google était un moteur de recherche qui se limitait exclusivement aux mots-clés entrés par les internautes, la recherche sémantique prend aujourd’hui une part de plus en plus prépondérante dans le fonctionnement de Google.
Ces évolutions représentent un changement important pour tous les professionnels de l’information et de la veille qui n’ont plus nécessairement besoin d’entrer une longue requête avec les différentes formes d’un mot et synonymes puisque le moteur élargit en principe automatiquement la recherche à ses différentes variantes.
Nous avions d’ailleurs eu l’occasion d’aborder en détail cette question dans un article de Bases intitulé : « la mort annoncée de la recherche booléenne » (Bases n°340 – septembre 2016) où l’on découvrait d’ailleurs que les longues requêtes booléennes sur Google pouvaient en réalité avoir l’effet inverse à celui escompté.
Mais alors qu’on pourrait penser qu’il n’est plus nécessaire de se soucier de la forme d’un mot dans Google puisqu’il va, de toutes manières, élargir la recherche aux variantes et synonymes, on constate que de petits détails peuvent tout de même faire varier les résultats de recherche.
La question a été mise en lumière le mois dernier lors d’une discussion sur le forum de discussion de MOZ. Comme personne ne réussissait à se mettre d’accord, la question a été posée à John Mueller, Webmaster Trends Analyst chez Google. Sa réponse : pour certains mots-clés, Google fournira les mêmes résultats, que le mot ait été entré avec ou sans tiret. Pour d’autres, les résultats pourront différer.
Pas très pratique... Toujours est-il qu’il vaudra mieux tester les différentes possibilités avec ou sans tiret.
En principe, Google n’est pas sensible aux accents. Que l’on entre le terme avec ou sans accent, nous devrions donc obtenir le même résultat.
Nous avons donc fait le test sur le mot éléphant.
Sur la première page, on constate que les deux recherches mêlent des résultats en français et en anglais mais l’ordre de certains résultats diffèrent et surtout, certains résultats apparaissent dans un cas mais pas dans l’autre.
Encore une fois, mieux vaut donc se méfier...
A savoir : Si l’on souhaite limiter à la forme française du mot avec les accents, il faudra entrer le terme avec des guillemets ("éléphant").
Encore une fois, Google n’est en principe pas sensible à la casse et donc aux majuscules et minuscules.
Les quelques tests que nous avons effectués confirment que les résultats sont bien identiques que l’on entre les mots-clés avec des minuscules ou majuscules.
Finalement, ce n’est peut-être pas une si bonne nouvelle car la prise en compte de la casse aurait pu permettre de désambiguïser un certain nombre de mots-clés et notamment toutes ces marques et noms d’entreprises utilisant des noms communs, adjectifs, etc. comme Total, Apple, etc.
Rappelons que rares sont les outils et moteurs offrant ce type de fonctionnalités : on citera par exemple l’agrégateur de presse Nexis ou encore les plateformes de veilles sur les médias sociaux Visibrain ou Brandwatch.
Auteur : Carole Tisserand-Barthole, rédactrice en chef BASES et NETSOURCES