Quand on réalise une veille sur les nouveaux outils de recherche et de veille, il n’est pas rare de voir apparaître de nouveaux outils gratuits, uniquement disponibles sur Github. Et cela peut être quelque peu déconcertant quand on ne maîtrise pas les rudiments de cette plateforme avant tout destinée aux développeurs et informaticiens.
Car Github est aujourd’hui surtout connu pour être le plus gros hébergeur de codes sources au monde.
Mais dans cette masse de petits programmes et morceaux de codes en libre accès, on trouve de plus en plus d’éléments pouvant être utiles pour le veilleur : outils de surveillance de pages web, lecteurs RSS, outils de création de flux RSS, outils pour l’OSINT, outils de recherche, listes de ressources thématiques, etc.
Lire aussi :
Comment se repérer dans le paysage des outils de veille gratuits et bon marché ?
Les outils de surveillance de pages gratuits et freemiums au banc d’essai
Comment trouver des outils de recherche d’information thématiques ?
L’OSINT : illusion marketing ou nouveau champ d’investigation pour les professionnels de l’info ?
Questel est, depuis plusieurs années, une société en fort développement.
En effet, si, en avril 2015, elle comptait environ 140 salariés, 3 000 clients et 100 000 utilisateurs, en mars ces chiffres sont devenus 1 400 salariés, 15 000 clients et plus de 1,5 million d’utilisateurs.
Cette croissance importante est due pour une bonne part à l’acquisition d’un grand nombre de sociétés offrant des produits et/ou des services dans le domaine de la propriété intellectuelle (voir notre article « Questel double sa taille avec plusieurs acquisitions en 2021» dans ce même numéro).
L’ensemble de ces acquisitions a été réalisé avec le soutien de fonds de Private Equity.
Ce souci de développement ne pouvait, bien sûr, mettre de côté l’utilisation de l’intelligence artificielle.
Lire aussi :
Brevets : les évolutions d’Orbit
Les "combination sets" dans la classification des brevet
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip
Questel multiplie les acquisitions depuis des années déjà. En effet, durant ces cinq dernières années pas moins de quinze ont été réalisées.
Les dernières acquisitions ont permis à Questel de doubler sa taille.
Questel vient d’annoncer le bouclage de l’acquisition de NovumIP, groupe mondial de technologies, résultat de la fusion des sociétés Pavis et Novagraaf.
Questel vient aussi de finaliser le rachat de la minorité restante des actions de la société allemande Brandstock, fondée en 1993, qui propose un ensemble de services, en particulier juridiques, ainsi que sur la transparence des coûts des prestations dans le domaine de la propriété intellectuelle.
Lire aussi :
Brevets : les évolutions d’Orbit
Les "combination sets" dans la classification des brevet
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip
ResearchGate est un réseau professionnel de chercheurs qui revendique plus de 20 millions de membres, sachant que l’inscription est libre, sous condition d'appartenir d'une façon ou d'une autre à la communauté scientifique ; seule la navigation reste possible pour les autres internautes.
Créé en 2008, le site a pour but de faciliter la collaboration entre chercheurs, en particulier en leur permettant de partager librement leurs publications.
Au milieu des années 2010, Il y avait eu un premier bras de fer entre ResearchGate et les éditeurs scientifiques qui l’accusaient de donner accès librement à des articles scientifiques qui n’étaient absolument pas en open access. En 2017, après des menaces de poursuites en justice, ResearchGate avait décidé de réagir à sa façon en supprimant un certain nombre de publications présentes dans son système. Certaines publications ont ainsi été rendues privées avec un accès restreint à certaines personnes et d’autres ont tout simplement été supprimées sans que l’auteur n’ait été prévenu au préalable.
Au final 1.7 million d’articles avaient ainsi été supprimés ou rendus privés.
Lire aussi :
Comment bien rechercher l’information scientifique et technique ?
Recherche d’information académique : enfin une comparaison concrète entre gratuit et payant
IA, deep learning, recherche sémantique, classification automatique : ces termes sont de plus en plus fréquents dans le monde des bases de données brevets.
Vont-ils renvoyer les tenants de la recherche traditionnelle au rayon des archives du monde des professionnels de l’information brevet ? Les codes CIB, CPC, les mots-clés représenteront-ils bientôt des techniques démodées à remiser au placard ? Qui sont ces nouveaux outils et condamnent-ils réellement des techniques éprouvées depuis plusieurs dizaines d’années, ou au contraire ne font-ils que les complémenter ? Enfin, quel est leur niveau de performance et comment les utilise-t-on ?
Les informations ici présentées résultent également d’un échange avec les équipes d’IPRally.
Depuis plus d’un an, on voit apparaître de plus en plus de liens vers des veilles gratuites sur LinkedIn. Il ne s'agit pas ici de news partagées régulièrement par des experts sur un secteur ou un pays, mais des veilles thématiques ou sectorielles produites et diffusées par des entreprises ou consultants qui ne sont pas spécialisés dans le domaine de la veille.
Derrière l’effort de contribution à la plateforme de partage social qu'est LinkedIn, on peut supposer qu’il s’agit dans la plupart des cas d’une stratégie de référencement dans un cadre commercial ou d’une simple recherche de notoriété.
L’utilisation de la veille comme outil de marketing serait finalement une nouvelle forme de publicité sophistiquée, qui aurait a priori de bonnes chances de toucher une cible professionnelle structurellement qualifiée, comme celle « offerte » par LinkedIn.
La cible client serait plus aisée à atteindre, à la fois grâce à la nature du canal de communication et à un contenu potentiellement plus riche qu’un post sur un blog ou une newsletter d’actualités.
Le veilleur professionnel pourra dans un premier temps qualifier ces veilles gratuites de « pseudo prestations » et s’alarmer de ce nouveau pas vers la « commoditisation »(1) du secteur de l’information, avec une dilution de valeur du service expert que représente une prestation de veille, qui suppose rigueur et technicité.
Depuis quelques années déjà, Google ne permet plus de rechercher sur les versions locales de son navigateur. Que vous lanciez votre recherche sur google.fr, google.com, google.com.br ou encore google.co.uk, les résultats seront les mêmes.
Google détermine en effet les résultats en fonction de la localisation de l’internaute, c’est-à-dire à partir de son adresse IP. L’internaute risque donc de se retrouver dans une sorte de « bulle de filtres » géolocalisée.
Quand on fait de la veille et des recherches d’information à l’international, cela représente un risque majeur : passer complètement à côté de résultats locaux (issus de la presse locale, de sites de collectivités locales, de blogs locaux, de sites d’entreprises locales, etc.) qui pourraient pourtant apporter des informations stratégiques.
Lire aussi :
Depuis l’annonce en mai 2021 du rachat de Proquest par Clarivate , tout semblait se passer sans trop de problèmes pour cette acquisition qui concernait tant ses bases de données que les logiciels destinés aux bibliothèques et à différents services des entreprises.
Clarivate et, dans une moindre mesure, Proquest ont déjà racheté de nombreuses entreprises.
Clarivate, en particulier, a racheté récemment Decision Resources Group, Customer First View, CPA Global, et Darts-ip, ce dernier étant spécialisé dans les litiges de propriété intellectuelle
Il semble que ces opérations de rachat se sont passées sans problèmes majeurs. Manifestement, ce n’est pas le cas pour le rachat de Proquest par Clarivate.
Lire aussi :
Le rachat de Proquest par Clarivate : quelles conséquences pour le monde de l’information ? , BASES n°392, mai 2021
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip , BASES n°377, janvier 2020
Dialog devient une source pour l’open access avec la base Publicly Available Content , BASES n°394, juillet-août 2021
Depuis quelques années, les Knowledge Graphs ("graphes de connaissances"), ces réseaux sémantiques construits à partir des relations établies entre des entités de types différents (personnes, évènements, lieux, situations, concepts, etc.) ont la cote auprès des outils de recherche et de veille professionnels. Nombre d’entre eux mettent d’ailleurs en avant leur utilisation dans leur discours commerciaux. On notera bien qu’il s’agit ici d’une technologie utilisée en arrière-plan sur laquelle l’utilisateur final n’a pas directement la main.
D’une part, de nouveaux outils indiquent mettre cette technologie au cœur de leurs produits, ce qui, selon eux, viendrait « révolutionner » la recherche et la veille. C’est par exemple le cas d’IP Rally, un nouvel outil de recherche brevets qui met en avant « une technologie unique basée sur un Knowledge Graph ». IP Rally se présente comme une alternative aux outils à base d’IA qui sont de véritables boîtes noires et les outils fondés sur la recherche par mots-clés classique.
D’autre part, des outils, déjà bien en place, communiquent également régulièrement sur l’intégration de Knowledge Graphs dans leurs produits. C’est par exemple le cas du lecteur RSS Feedly pour son « assistant intelligent » Leo mais aussi d’EBSCO pour sa nouvelle interface EDS lancée fin 2020 ou encore de Dow Jones (Factiva) dans son produit DNA lancé à la fin de l’année 2019.
Lire aussi :
Outils de recherche payants à l’heure de la recherche booléenne « augmentée »
Comment construire ses propres outils de recherche d’information thématiques ?
Les sources permettant d’obtenir des articles scientifiques et académiques en libre accès sont de plus en plus nombreuses. Les serveurs et bases de données classiques, après avoir longtemps été réticents à les inclure à leur corpus, commencent à les intégrer à leurs offres soit en les intégrant directement à leurs bases existantes, soit en créant des bases spécifiques dédiées à l’open access. C’est à cette dernière catégorie qu’appartient la nouvelle base de Dialog, appelée Publicly Available Content.
Les serveurs payants (Dialog, Scopus, STN…) en référencent certains, mais il existe de nombreux sites en accès libre qui proposent gratuitement l'accès à des références, avec dans la plupart des cas, un lien vers le document original. Mais il faut noter que très souvent, seule une partie des documents eux-mêmes est en libre accès, les autres étant payants.
Les possibilités de recherche sur ces sites ne sont pas inexistantes mais plus ou moins développées.
On peut citer parmi les plus connus, sachant qu’il en existe de nombreux autres :
Bielefeld Academic Search Engine (BASE) qui propose plus de 240 millions de références de documents de toutes natures provenant de plus de 9 000 partenaires parmi lesquels environ 60 % sont en libre accès, la part de documents en libre accès pour chaque partenaire étant très variable ("variant de 1 à 100 %" selon l'éditeur).
Lire aussi :