Lorsqu’on souhaite mettre en place une veille concurrentielle, une typologie de sources classiques est à surveiller : site du concurrent, presse nationale, locale, spécialisée, etc. La publicité en ligne comme les résultats sponsorisés et annonces publicitaires sur Google et Facebook peut également représenter une piste très intéressante.
Car comprendre la stratégie publicitaire d’un acteur peut en dire long sur sa stratégie globale à court, moyen et long terme. Quels produits ou services choisit-il de mettre en valeur, dans quels pays et quelles régions focalise-t-il ses actions ?
En matière de publicité en ligne, le marché est très largement dominé par Google et Facebook puis dans une moindre mesure Amazon. Ainsi, si nos concurrents ont choisi d’investir dans la publicité en ligne, il y a toutes les chances qu’ils aient choisi Google, Facebook ou bien les deux. Il va donc falloir trouver des solutions pour accéder aux données de Google Ads et de Facebook Ads.
Pendant des années, c’était tout simplement mission impossible, car ni Google ni Facebook ne partageaient librement la moindre donnée en la matière. Une veille sur la publicité en ligne ne pouvait donc se faire qu’en testant des requêtes susceptibles de faire apparaître les publicités de ses concurrents, ce qui ne fournissait que des résultats aléatoires et évidemment incomplets ou en faisant appel à des acteurs spécialisés sur les mesures d’audience et la veille publicitaire.
Lire aussi :
Information et publicité : des liaisons dangereuses pour la veille ?
L’opus 2022 de l’Artificial Intelligence Conference on Search, Data and Text Mining, Analytics and Visualization plus connue sous le vocable « AI-SDV » vient de se terminer dans une atmosphère particulière.
Si les contributions ont été, pour la plupart, de qualité et le réseautage efficace, nous retiendrons que c’est une manifestation de plus que les professionnels de l’information ne connaîtront probablement plus, la faute du Covid qui a « tué » la manifestation à petit feu.
Les plus anciens se souviennent d’un temps où les événements se bousculaient parfois à l’agenda, autant que le public à ces événements. Ces derniers risquent maintenant de se limiter aux dates proposées par l’EPO (European Patent Office) ou les groupes d’utilisateurs. Dans cet article, Benoit Sollie et François Libmann soulignent quelques présentations (disponibles sur Internet) et lignes de force qui ont marqué cette dernière édition.
Eutopia est l’une des 44 alliances labellisées « Université Européenne » par la Commission européenne et vient de lancer un portail avec les publications de ses membres. Elle regroupe dix universités (pour un total de 100 facultés), dont celle de Cergy, en France.
Le portail commun à l’alliance (https://eutopia.openaire.eu/) suit deux objectifs majeurs :
1. Faciliter la visibilité des productions scientifiques et des chercheurs de l’alliance ;
2. Fluidifier le travail au sein de l’alliance.
Ce portail recueille, à l’heure où nous imprimons, plus de 570 000 publications (dont plus de 368 000 ouvertes) et 21 000 datasets de recherche. L’alliance est généraliste et le portail couvre donc de nombreux domaines, des mathématiques aux sciences naturelles en passant par la médecine ou l’informatique.
Lire aussi :
Le Canada explore un portail pour accéder aux résultats de la recherche canadienne
On a pu assister ces dernières années à des progrès spectaculaires dans le traitement et l’exploitation des données : traitement du langage, analyse sémantique, réseaux de neurones ou IA, pour n’en citer que quelques-uns. Le monde du brevet n’échappe pas à cette tendance, et on a pu voir au cours des dernières années plusieurs initiatives dans les domaines de la traduction, de la classification automatisée ou de la recherche.
IPRally dont nous avons eu l’occasion de parler en détail dans le n° 395 de BASES de septembre 2021 est d’ailleurs un exemple concret de l’application de ces nouvelles technologies au service de la recherche dans les bases de données.
Sur quelles thématiques travaillent aujourd’hui les spécialistes du domaine ? Quelles futures révolutions nous attendent dans les années à venir pour la veille et la recherche d’information brevet ?
C’est ce que nous avons essayé de déterminer dans cet article avec une approche qui nous a paru originale : aller regarder dans les brevets eux-mêmes «ce qui les attend» à plus ou moins long terme - autrement dit , essayer de lire l’avenir du brevet en tant qu’objet d’innovation dans les brevets eux-mêmes.
Lire aussi :
Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise
Nous avons testé IPRally, l'outil qui veut révolutionner la recherche brevets avec de l'IA
Espacenet, un acteur clé en mutation
The Lens, un outsider au fort potentiel pour la recherche brevet gratuite
L’heure est indéniablement aux bonnes nouvelles du côté des moteurs. Alors qu’il n’y avait jusqu’à présent aucune alternative crédible à Google sur le terrain des moteurs Web pour la veille et la recherche d’information professionnelle, on voit enfin arriver sur le marché une nouvelle génération de moteurs en phase avec les problématiques des professionnels de l’information.
Après le lancement du très prometteur Neeva (voir notre article « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » - BASES n°406 - septembre 2022) voici venir un autre moteur tout aussi intéressant appelé Kagi Search (https://kagi.com/).
Kagi a lui aussi opté pour un positionnement où la qualité des résultats et de la recherche et le respect de la vie privée priment. Et ce choix passe également par un modèle économique freemium.
Dans cet article, nous présentons en détail ce nouveau moteur, son positionnement et ses fonctionnalités et nous évaluons sa capacité à intégrer la panoplie des veilleurs et des professionnels de l’information.
Lire aussi :
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Utiliser la fonctionnalité Goggles de Brave Search en complément de Google CSE
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Elsevier vient d’annoncer le lancement de la base de données Embase Preprints.Cette base propose des documents de travail et preprints issus des deux principaux sites de preprints dans le domaine biomédical à savoir MedRXiv et, depuis décembre 2021, BioRXiv.
Un algorithme d’indexation automatique permet d’affecter à chaque document l’essentiel de l’indexation du thesaurus EMTREE propre à Embase.
La mise à jour se fait tous les jours de la semaine.
Elsevier tient à garder la différence de nature entre les contenus d’Embase et ceux d’Embase Preprints. En effet, les alertes d’Embase n’incluront pas automatiquement les mises à jour d’Embase Preprints ; il reste la possibilité, bien sûr, d’enregistrer une alerte dans chaque base.Mise à part la création de cette base, il faut signaler qu’un nombre croissant de bases offrent des références de preprints.
Nous avons fait un test pour voir si les preprints de Medrxiv étaient bien référencés dans Embase Preprints.
Les 400 clients de FIZ Autodoc ont reçu un mail leur annonçant la fermeture du service à la fin de l’année.
Ce service est, ou était, l’un des rares services européens de fourniture de documents primaires après la disparition du service de l’INIST aux entreprises. FIZ Autodoc (https://autodoc.fiz-karlsruhe.de/) sous-traitait d’ailleurs une partie de ses prestations à des « confrères » comme la British Library ou l’américain Reprints Desk…
Auparavant, déjà, la possibilité de voir les prestations de FIZ Autodoc imputées sur la facture STN, ce qui était bien pratique, avait disparu au début de l’année.
Cet arrêt du service tient très vraisemblablement au désengagement de FIZ dans STN, les bases présentes sur FIZ ayant vocation à basculer sur les serveurs de l’American Chemical Society, qui reste le seul opérateur de ce serveur, à l’origine une association entre l’allemand FIZ Karlsruhe et l’American Chemical Society, rejoints pendant quelques années par le japonais JICST.
Cela fait des années que le mouvement de l’open dans le monde scientifique et académique ne cesse de prendre de l’ampleur : l’open access d’abord puis l’open citations, mais aussi l’ouverture des données de la recherche,
Pour rappel, les données de la recherche correspondent à « l’ensemble des informations collectées, observées ou créées sous une forme numérique ou non, par les chercheurs dans le cadre d’un projet de recherche et à partir desquelles ils bâtissent leurs hypothèses. » (source : https://bu.univ-amu.libguides.com/donneesrecherche/definition-DR).
Il n’existait pas jusqu’ici d’initiative nationale pour la diffusion et la recherche des données de la recherche française (alors qu’il existe depuis des années un portail national pour les données publiques issues des collectivités et de l’État appelé data.gouv.fr). C’est désormais chose faite avec le lancement le 8 juillet dernier de la plateforme Recherche Data Gouv (https://entrepot.recherche.data.gouv.fr/).
Cela fait 20 ans que de nouveaux moteurs apparaissent avec pour ambition de concurrencer voire détrôner Google. Et pratiquement tous ont le même créneau : le respect de la vie privée, domaine où il est clair que Google n’excelle pas.
Quand on recherche de l’information dans un contexte professionnel, le respect de la vie privée est certes important, mais il faut aussi pouvoir obtenir des résultats pertinents et de qualité et avoir à disposition des fonctionnalités de recherche dignes de ce nom. Et c’est malheureusement rarement le cas des différents moteurs que nous avons pu tester ces dernières années tels que Qwant, DuckDuckGo, Yep.com ou encore You.
Un nouvel entrant pourrait bien venir changer les règles du jeu dans le monde des moteurs grâce à sa bonne compréhension des requêtes et la qualité de ses résultats.
Il s’agit du moteur Neeva qui arrive enfin en Europe après avoir été lancé aux États-Unis en 2021. Et le moins que l’on puisse dire, c’est que ce moteur a de très nombreuses qualités, allant de la longue expérience de ses fondateurs chez Google à des fonctionnalités qui servent vraiment les professionnels de l’information.
Le moteur Brave fait partie des moteurs prometteurs à avoir dans sa boîte à outils de recherche.
Il a récemment introduit une fonctionnalité intéressante appelée « Goggles », permettant à tout internaute de créer un moteur pour rechercher sur des corpus de sources personnalisés.
Les moteurs personnalisés sont une véritable aubaine pour les professionnels de l’information et de la veille et on note d’ailleurs un regain d’intérêt pour ces outils, comme en témoigne le lancement de cette fonctionnalité chez Brave, les possibilités de personnalisation chez Neeva ou encore le lancement de l’Atlas.pro
Voir nos articles « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » et « Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable », BASES n° 402, avril 2022.
Tous ces outils et fonctionnalités ne sont d’ailleurs pas sans rappeler le moteur personnalisé proposé par Google appelé Google CSE, qui existe toujours et qui vient d’ailleurs de rajeunir son interface. Créer un moteur personnalisé sur Brave n’est malheureusement pas aussi simple que la création du moteur CSE sur Google, mais ce n’est pas insurmontable.
Dans cet article, nous vous expliquons pas à pas comment créer vos propres corpus de recherche sur Brave et nous évaluons la valeur ajoutée de ces moteurs personnalisés par rapport à Google CSE.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable
Faut-il préférer l’opérateur site: de Google ou la création d’un moteur CSE ?