Pour la troisième année consécutive, nous avons assisté à la journée « Search Solutions » à Londres où se côtoient ceux qui font les moteurs (ingénieurs, data scientists, informaticiens, etc.) et ceux qui les utilisent (professionnels de l’information et du SEO).
L’intelligence artificielle et plus particulièrement le machine learning et le NLP (Natural Language Processing) étaient encore une fois au cœur de la très grande majorité des présentations.
Lire aussi :
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Après les moteurs spécialisés sur le juridique, le recrutement ou la santé, il a également été question de nouveaux moteurs qui tirent parti des contenus multimédia.
On le sait, les contenus multimédia prolifèrent et il est de plus en plus important de les inclure dans son dispositif de veille et ses recherches d’information. Pourtant, ce sont des contenus difficiles d’accès car peu représentés dans les outils traditionnels et surtout peu « recherchables » car la recherche ne porte généralement que sur les métadonnées.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Le SEO et la veille au défi des moteurs
TENDANCES • La révolution multimédia bouscule la veille
PANORAMA
• Outils de recherche de vidéos : des métadonnées au speech to text
• Outils de recherche sur les contenus audios : un segment encore pauvre
• Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
METHODOLOGIE • Mettre en place une veille sur les contenus multimédias
OUTILS DE VEILLE • Comment valoriser les contenus multimédias dans un livrable de veille ?
INDEX • Index NETSOURCES 2019
Etre un expert de la veille et de la recherche d’information, et maintenir son expertise, est plus que jamais un challenge car le monde de l’information est en perpétuel mouvement.
Les outils de recherche et de veille évoluent très rapidement, de nombreux acteurs apparaissent et disparaissent régulièrement, les sources d’information évoluent et changent de business model, ce qui nécessite une surveillance large de son environnement.
La veille ou la recherche de contenus connaît certainement aujourd’hui un réel bouleversement qu’il est encore difficile de bien mesurer : la présence de plus en plus forte de vidéos, podcasts, infographies comme médias d’information à part entière.
Coexistant à côté des sources d’information traditionnelles, ou encore, cas plus complexe, intégrés dans ces mêmes médias traditionnels, de plus en plus de journaux, surtout dans la sphère économique, sociale et politique, en créent et diffusent (incluent) dans leur version numérique.
Les veilleurs et plus généralement tous les professionnels de l’information, traditionnellement orientés vers la recherche et l’analyse de contenus textuels, vont devoir rapidement se préoccuper de l’intégration de ces nouveaux réservoirs d’informations pour au moins deux raisons.
- D’une part, les données présentes dans ces vidéos, podcasts ou encore infographies risquent de ne pas se retrouver sur les supports textuels.
- D’autre part, ces nouveaux formats sont plus que de simples supports, ils constituent, du fait de leur professionnalisation, de plus en plus des moyens d’information à part entière, avec leurs propre dynamiques, recherches et analyses.
Lire aussi :
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : vers la reconnaissance de texte, objet et visage
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
La première intervention de cette conférence annuelle à Londres revenait en détail sur le fonctionnement de la recherche sémantique, qui, rappelons-le, est aussi mise en œuvre dans des moteurs comme Google depuis quelques années.
Andreas Kaltenbrunner est directeur de la recherche chez NTENT, une société qui propose un moteur de recherche sémantique en marque blanche pour les entreprises.
Il est revenu en détail sur le fonctionnement de leur moteur. Pour créer un moteur sémantique, il faut tout d’abord une ontologie, un lexique (un par langue) associé à l’ontologie, un « onomasticon » (une sorte de glossaire des noms propres) et des règles linguistiques.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Intéressons-nous maintenant à la recherche d’images. Nous avons choisi ici de nous focaliser sur la recherche d’images pour trouver des informations ou répondre à une question dans un cadre professionnel.
Nous n’aborderons pas la question des images libres de droits ou photos de stocks pour illustrer ses livrables.
La recherche d’images est plus complexe qu’elle n’y paraît au premier abord, car il coexiste différentes façons de rechercher :
il y a tout d’abord la recherche classique par mot-clé où la recherche porte sur des métadonnées ou - c’est encore très rare - sur du contenu textuel présent dans des images ;
la recherche inversée par l’image où le point de départ est une image et non du texte et où l’on recherche des images identiques ou similaires.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Les moteurs de recherche spécialisés (recrutement, juridique, santé) étaient à l’honneur cette année.
Et tous ces acteurs s’intéressent à la façon dont ils peuvent faire évoluer leurs outils en tirant parti du développement de l’IA tout en restant à l’écoute de leurs utilisateurs.
Trois acteurs étaient venus présenter certains axes de recherche sur lesquels ils ont travaillé récemment pour améliorer leurs moteurs.
Nous commencerons avec un outil de recherche spécialisé dans le recrutement et les ressources humaines appelé Texternel, fondé en 2011 à Amsterdam. Il s’agit d’un moteur principalement utilisé par les services RH des entreprises et qui permet de rechercher sur des bases de CV et réseaux sociaux afin d’identifier les bons candidats pour un poste.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
On ne recherche pas des vidéos comme on recherche des images ou des contenus audio. Chaque type de contenus multimédias dispose de ses propres outils et il y a finalement assez peu d’outils qui englobent toutes ces dimensions.
Pour rechercher des vidéos, il existe trois grandes catégories de sources et d’outils :
d’une part les moteurs de vidéos développés par les grands acteurs du Web comme Google, Bing, Qwant, Yandex, etc. ;
il y a ensuite les grandes plateformes d’hébergement de vidéos comme YouTube, Dailymotion (de moins en moins utilisé) ou encore Vimeo qui disposent tous trois de leurs propres moteurs internes.
enfin, il existe toute une panoplie de petits outils plus confidentiels et spécialisés à connaître et à savoir mobiliser dans certains cas précis.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Très éloignée des autres présentations, celle de Dawn Anderson, spécialiste du SEO (Search Engine Optimization) était néanmoins intéressante dans la mesure où elle faisait écho à ce que vivent les professionnels de l’information.
Le monde du SEO et de ceux qui développent les moteurs sont des mondes avec très peu de connexions.
Le SEO est encore trop souvent perçu par les informaticiens comme des personnes qui manipulent les résultats de recherche et sont souvent associés à l’image du spam.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia