Les universités américaines publient de grandes quantités de journaux et disposent également d’« entrepôts de données » bien garnis, mais ces informations ne sont pas facilement accessibles et il est exclu de les rechercher sur chaque site d’université.
Ce ne sont pas, en général, des articles « validés par les pairs » tels que ceux dont on trouve les références dans beaucoup de banques de données classiques. Mais ils ne sont pas, pour autant, sans intérêt, car on peut difficilement croire que ces publications sont des « revues prédatrices ».
Nous avons dans ce cadre identifié une source originale et peu connue, qui offre l’accès à des données produites par 655 universités grâce au Digital Commons Network.
La fiabilité des sources est un critère essentiel pour les professionnels de la veille. En effet, ils doivent s’assurer que les informations qu’ils collectent sont exactes et fiables afin de pouvoir les transmettre à leurs clients.
Pour cela, ils vérifient davantage la fiabilité des sources en amont en bâtissant un dispositif solide, plutôt que via un «fact-checking après coup» des sources des informations. Cette opération serait en effet bien trop chronophage, le temps devant être consacré à la validation et l’analyse du contenu de l’information lui-même.
C’est ainsi que pour les zones géographiques que l’on maîtrise, on a son échelle de valeur de qualité des sources. Sur des zones que l’on connaît mal, c’est plus difficile.
Aujourd’hui, devant l’impact des IA génératives sur la chaîne de l’information et par souci d’exhaustivité, le veilleur n’a d’autre choix que d’explorer les solutions alimentées à l’IA. Il s’expose ainsi à une masse de contenu non fiable, en provenance des générateurs de texte comme ChatGPT ou Bard, ainsi que des moteurs de recherche dopés à l’IA comme Bing Chat ou Perplexity.
Pour en évaluer le contenu, ces textes générés par IA, dits « synthétiques », doivent être a minima vérifiables. Pour cela, trois éléments sont à vérifier : la source, les faits et leur interprétation. Or, non seulement l’IA génère de fausses informations, mais elle ne permet pas actuellement de les vérifier. Ce faisant, elle va jusqu’à inverser le rapport au temps du veilleur entre la production d’une analyse (qui devient très rapide) et sa vérification (chronophage).
Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
Nous en avons sélectionné quatre, en accès gratuit ou freemium, parmi une vingtaine d’outils explorés.
Nous les avons choisis pour la qualité du son généré par IA, c’est-à-dire le plus proche possible de la voix humaine, et pour la richesse de ce qu’ils offrent déjà dans leur version gratuite.
ElevenLabs, le plus reconnu (freemium)
ElevenLabs est sans conteste celui qui produit la meilleure qualité de voix pour générer un livrable en contenu audio dans plusieurs langues.
Il existe de très nombreuses banques de données bibliographiques de littérature scientifique. Selon les cas, les possibilités de recherche sont plutôt rustiques ou, au contraire, plus ou moins sophistiquées (indexation, opérateurs de proximité, troncatures, conversion des orthographes américaine et anglaises, reconnaissance des abréviations, recherche sur des valeurs numériques, liens citants/cités, recherche par structures chimiques, recherche dans plusieurs banques de données à la fois…).
Europe PMC va plus loin même si elle n’offre pas toutes ces possibilités et nous n’hésitons pas à la qualifier de banque de données augmentée car elle permet, d’une part, de focaliser la recherche sur certaines parties d’un article, par exemple les éléments de méthodologie ou les figures. Elle permet aussi, ce qui est original, d’établir, à partir du contenu d’une référence des liens avec plusieurs banques de données externes plutôt factuelles/numériques, spécialisées dans le domaine des sciences de la vie telles que ChEMBL-small molecules ou MGnify-Metagenomics.
Sur Dialog, nous effectuons en général, pour commencer, une recherche sur l’ensemble des banques de données disponibles et, dans un deuxième temps, sélectionnons, au vu des résultats, les banques de données dans lesquelles nous allons poursuivre la recherche.
Voilà un moment que, sur Dialog, nous avions remarqué qu’il arrivait souvent qu’une référence d’Embase (coût 13,24 $) apparaisse alors que la référence au même document dans Medline (coût 3,29 $) était également disponible sur le serveur.
Bien sûr, ces deux bases de données ne sont pas identiques, mais les références communes sont nombreuses et si les abstracts semblent identiques pour ces références communes, les indexations sophistiquées sont propres à chaque base.
Nous avons enfin fini, grâce au service assistance, par comprendre le mécanisme et pouvoir choisir d’obtenir la référence issue de Medline plutôt que celle issue d’Embase.
Cela fait plusieurs années que Questel n’avait pas organisé physiquement une réunion d’utilisateurs comme c’était le cas auparavant, ce qui a fait que celle organisée récemment a été fort bien accueillie.
Pendant ce temps, la vie ne s’est pas pour autant arrêtée pour Questel, qui a continué ses acquisitions de sociétés dans le domaine de la propriété intellectuelle, 18 en cinq ans, portant le groupe à un effectif de 1 700 salariés.
Ces acquisitions ont conduit Questel à ne plus être juste un fournisseur de logiciel mais une plateforme de gestion de la propriété intellectuelle au service de tous types de professionnels de la propriété intellectuelle. Questel définit maintenant sa mission de la façon suivante : « répondre à tous les besoins au long du cycle de vie des titres de propriété intellectuelle ». Cela se traduit par une proposition d’externalisation de la plupart des actes administratifs dans la gestion d’un portefeuille de brevets, en liaison avec le conseil en propriété intellectuelle ou l’expert interne.
Ne dites plus « lecteurs de flux RSS » mais « lecteurs d’information » ou « App d’actualité ». Nouvelles applis, nouvelles fonctionnalités, nouveaux looks, nouvelles promesses… Au cours de leur veille outils, les professionnels de l’info ont vu apparaître dernièrement de nouveaux acteurs, avec un discours marketing prometteur. Les lecteurs se moderniseraient-ils au point de gagner en notoriété ? Faut-il se préparer à remplacer Feedly ou Inoreader ? C’est à ces questions que nous nous proposons de répondre.
Apparues dans le sillage du déploiement de l’IA à grande échelle, ces plateformes sont de deux natures différentes. Il y a celles qui se présentent comme des « apps d’actualité », conçues pour être consultées principalement ou uniquement sur mobile, et celles qui se présentent davantage comme des lecteurs RSS consultables sur le web, même si leur fonctionnement est parfois différent.
Si leur défi d’apparaître (enfin!) comme une solution face à la « fatigue informationnelle » qui touche le grand public réussit, cela pourrait normaliser l’usage des lecteurs et créer le réflexe du grand public de centraliser son actualité pour mieux s’approprier l’information. Un rêve éveillé pour les veilleurs souvent seuls à s’émerveiller devant le potentiel d’un lecteur de flux RSS.
Et si les lecteurs RSS reviennent sur le devant de la scène auprès du grand public, cela entraînerait aussi des conséquences positives pour les professionnels car cela pourrait engendrer de nouveaux développements : des sites qui remettent du RSS, de nouveaux outils et nouvelles fonctionnalités, etc. En attendant, qu’ont-elles vraiment à offrir aux veilleurs, grands consommateurs d’information ?
Lire aussi :
Maîtriser le RSS, le socle inamovible de la veille (Netsources N° 159 - juil/août 2022)
Comment choisir la méthode la plus adaptée pour mettre une source en veille à partir d'un flux RSS ? (Netsources N° 159 - juil/août 2022)
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ? (Netsources N° 159 - juil/août 2022)
Comment récupérer des flux RSS sur les réseaux sociaux ? (Netsources N° 159 - juil/août 2022)
Comment transformer une newsletter en flux RSS ? (Netsources N° 159 - juil/août 2022)
Comment récupérer un flux RSS sur la majorité des sites web ? (Netsources N° 159 - juil/août 2022)
Quel lecteur de flux RSS choisir en 2020 ? (Bases N° 384 - sept 2020)
Pour ce nouvel article de « Focus IA », nous avons décidé de nous intéresser spécifiquement aux outils qui permettent de résumer et d’interroger des vidéos YouTube.
Nous avons identifié une vingtaine d’outils répondant à nos critères et nous les avons tous testés sur quatre vidéos : une vidéo d’actualité en français émanant d’un grand média français et une autre en anglais émanant d’un média américain, un webinaire d’une heure proposé par un éditeur de veille en français et enfin une vidéo tech en anglais recommandant plusieurs extensions ChatGPT.
Parmi la vingtaine d’outils, nombreux sont très décevants mais quatre sortent du lot et produisent des résultats intéressants pour les professionnels de l’information. Voici notre sélection !
Lire aussi :
Les meilleurs outils IA pour résumer et interroger les contenus de la veille (Netsources N° 164 - mai/juin 2023)
Notre sélection d’annuaires d'outils IA - Article en accès libre (Bases N° 414 - mai 2023)
Comment intégrer YouTube dans votre dispositif de veille (Netsources N° 157 - mars/avril 2022)
Nous avons testé Azure Video Indexer, un outil puissant pour les transcriptions automatiques de vidéos et podcasts (Bases N° 403 - mai 2022)
Sur le Web, les commentaires publiés sous des articles, billet de blogs et sous les posts des réseaux sociaux peuvent parfois receler de véritables pépites mais ce sont des contenus difficiles à intégrer dans ses veilles et recherche d’information. En effet, on peut ponctuellement avoir besoin de plonger dans les commentaires sur les réseaux sociaux, par exemple pour une étude d’image, pour obtenir des informations complémentaires à l’article lui-même, pour y trouver des réponses, pour les analyser en vue d’une étude ou les sauvegarder en vue d’un usage futur.
Mais comment extraire les commentaires associés à un tweet sur Twitter, ou à un post sur Facebook, Instagram, LinkedIn, YouTube et les autres surtout quand ils sont nombreux et qu’on on ne dispose pas de budget ni d’un besoin suffisant pour acquérir une grosse plateforme payante ? Nous avons choisi ici l’angle des outils gratuits ou peu onéreux car l’extraction de commentaires ne représente souvent qu’un besoin ponctuel pour les professionnels de l’information et ne justifie donc pas l’acquisition d’une plateforme très onéreuse.
C’est ce que nous avons exploré dans cet article en testant différentes méthodes et outils et en vous proposant la meilleure issue de nos tests.
Lire aussi :
Comment surveiller Twitter après la fermeture en cascade des outils dédiés ? (Bases N° 413 - avril 2023)
Réussir à utiliser LinkedIn pour la veille et la recherche d’information (Netsources N° 158 - mai/juin 2022)
Veille Instagram : quoi, comment, pour quoi faire ? (Netsources N° 158 - mai/juin 2022)
Comment intégrer YouTube dans votre dispositif de veille (Netsources N° 157 - mars/avril 2022)
Facebook : toutes les clefs pour ouvrir ce coffre bien fermé à la veille ou la recherche (Netsources N° 158 - mai/juin 2022)
Il y a quelques années, on avait pu voir émerger des outils d’exploration des réseaux de citations des articles scientifiques. Ces outils s’avèrent très utiles pour trouver des articles scientifiques pertinents que l’on n’aurait pas forcément identifiés lors d’une recherche par mot-clé classique et sont donc complémentaires aux moteurs académiques.
Parmi cette première génération d’outils, il existait deux grandes catégories : ceux qui étaient visuels proposant donc une représentation graphique, et ceux qui étaient uniquement textuels
Voir notre article « La recherche de citations et de références boostées par l’IA et les “open citations” », Bases N° 369 - avril 2019.
Si les outils textuels ont bien résisté et ont aujourd’hui une place de choix dans le paysage de l’IST, les outils visuels n’ont pour la plupart pas eu le même destin. Parmi les outils de dataviz de première génération, on comptait des acteurs comme Citigraph, Yewno ou encore Citation Gecko, qui ont tous fermé leurs portes. Dans cette catégorie, seul VosViewer continue sa route et a été intégré très discrètement au moteur académique Dimensions.
Au cours des deux dernières années, une nouvelle génération d’outils visuels d’exploration des réseaux de citations est apparue, avec une petite dizaine d’acteurs cette fois-ci, toujours portée par l’amplification du mouvement de l’open (open access et open citations) dans le monde académique.
Dans cet article, nous dressons un panorama de ces différents outils et de leurs spécificités. Nous les avons également tous testés pour évaluer leur performance et vous aider à faire le bon choix.
On découvre chaque jour, dans la déferlante des applis, extensions et plug-ins, tout le potentiel de ChatGPT et de l’IA pour nos métiers de l’information. Malgré les réserves très compréhensibles que l’on peut avoir, on ne peut nier l’intérêt de ces puissants modèles d’intelligence linguistique pour l’ensemble des opérations de traitement des données qui sont pour partie le socle de la veille et de l’activité documentaire.
Nul doute que le professionnel de l’information doive évaluer tous les outils en fonction de leur apport technique et fonctionnel sur l’ensemble de la chaîne de valeur des opérations. Leur intégration conduit progressivement à l’optimisation, voire le ré-engineering, des processus internes.
● Face aux enjeux, nos méthodologies et recommandations d’outils dans BASES et NETSOURCES intègrent de plus en plus les contributions des premières IA commercialisées. À titre d'exemple : la « Revue des moteurs de recherche à l’heure de ChatGPT », Bases N°413 - avril 2023, et notre prochain NETSOURCES dédié à ChatGPT et autres outils d'IA.
● Nous consacrerons désormais notre rubrique ACTUALITES à l’exploration des outils «du moment» dans un domaine fonctionnel donné, afin de sortir des discours euphoriques et faire émerger ceux qui nous paraissent les plus prometteurs dans un contexte incertain.
Nous avons décidé de commencer cette nouvelle série d’articles par les nouveaux annuaires IA car c’est une des portes d’entrée de choix vers les nouveaux outils dopés à l’IA générative. Parmi les nombreux annuaires sur le marché, nous en avons sélectionné quatre que nous avons jugés les plus pertinents.
La recherche de financements est souvent au cœur des préoccupations des entreprises, des instituts de recherche et des universités, ainsi que des associations.
Réussir à identifier des financements demande une rigueur certaine car il existe des milliers de dispositifs d’aide à l’entreprise en France, et la même information est relayée par beaucoup de moteurs de recherche et quelques listes de sources à ne pas omettre.
Nous vous proposons ici une démarche méthodes/outils complète pour agir de façon structurée et la plus exhaustive possible dans la recherche de financements.
Le professionnel de l’information n’est pas forcément un expert en financements, et, un brief client sur les questions financières demande un haut niveau de confiance. Car les types d’aides sont divers et les filtres des moteurs de recherche touchent le cœur de la stratégie financière d’un client puisqu’ils concernent les sources et la nature des financements (emprunts bancaires, partage de capital, subventions par quel type d’organisme, avec ou sans apport, etc.).
En cas de création ou de reprise d’entreprise, on pourra s’aider de ce questionnaire de Bpifrance, qui commence par distinguer les financements pour une étude de faisabilité/un prototype, le projet dans son ensemble, un besoin de trésorerie, des investissements.
À côté des outils de reconnaissance faciale payants créés par Clearview, Thales ou Amazon, des moteurs de recherche faciale sont accessibles gratuitement sur le web, et à tout public. Mais que peut-on en tirer dans un contexte de recherche et de veille professionnelle ?
On pourrait penser que la reconnaissance faciale n’est rien d’autre que de la recherche d’image inversée, consacrée aux visages. Il existe d’ailleurs une option « Face » dans Google Images. Mais à la lecture des résultats, on comprend que l’outil n’a vraisemblablement pas été conçu pour prendre en charge la reconnaissance faciale individuelle.
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
Les moteurs de recherche Web dans leur ensemble se sont tous précipités pour intégrer cette dimension à leurs moteurs, certains intégrant directement GPT-3 ou 4 comme Bing et d’autres préférant utiliser d’autres modèles.
Cette intégration de l’IA générative et conversationnelle dans les moteurs apporte sans conteste une dimension nouvelle à la recherche d’information sur le Web.
Mais est-ce que cela améliore réellement les moteurs Web ? Cela permet-il de trouver plus rapidement de l’information, de trouver des informations qui n’arrivaient pas à émerger dans les moteurs de recherche, d’explorer plus en profondeur la fameuse longue traîne ?
Lire aussi :
Les moteurs gratuits, c’est fini (avril 2023)
L’actu du Veilleur : plein phare sur l’IA (Bases N° 411 - fev 2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (Bases N° 410 - jan 2023)
Nous avons testé Kagi Search, un nouveau challenger de Google (Bases N° 407 - oct 2022)
Presearch permet de chercher depuis la localisation de son choix (Bases N° 410 - jan 2023)
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info (Bases N° 406 - sept 2022)
Des changements dans les flux algorithmiques qui modifient la veille
Les réseaux sociaux proposent pratiquement tous par défaut un flux d’information algorithmique que l’utilisateur peut faire défiler pour trouver des contenus susceptibles de l’intéresser.
Pendant longtemps, le flux des utilisateurs des réseaux sociaux était constitué essentiellement de contenus publiés par ses amis, les personnes ou comptes suivis et agrémentés de quelques contenus sponsorisés. Comme tout flux algorithmique, il s’agit d’une sélection de contenus et non de l’intégralité des contenus publiés par ses contacts.
Si la notion de sélection ne change pas, les contenus proposés, eux, sont en train de changer et on voit de plus en plus de contenus émanant de personnes en dehors de notre réseau.
Lire aussi :
Comment récupérer des flux RSS sur les réseaux sociaux ? (Netsources N° 159 - juil/août 2022)
Comment surveiller TikTok : un réseau social atypique pour le veilleur (Netsources N° 157 - mars/avril 2022)
Facebook : toutes les clefs pour ouvrir ce coffre bien fermé à la veille ou la recherche (Netsources N° 158 - mai/juin 2022)
Reddit, réseau social méconnu en France, mais véritable atout pour la recherche spécialisée (Netsources N° 158 - mai/juin 2022)
Réussir à utiliser LinkedIn pour la veille et la recherche d’information (Netsources N° 158 - mai/juin 2022)
Search Quiz : Êtes-vous à jour dans votre veille réseaux sociaux
Veille Instagram : quoi, comment, pour quoi faire ? (Netsources N° 158 - mai/juin 2022)
Il y a quelques mois maintenant, Twitter avait annoncé la fin de son API gratuite au profit d’une API payante. Après quelques mois de flottement, Twitter n’a finalement pas coupé l’accès à son API à la date prévue et a tout même annoncé garder une API gratuite allégée pour pouvoir publier du contenu directement sur Twitter. En revanche, impossible pour l’utilisateur de collecter, récupérer et analyser les contenus. Il y a quelques semaines, le couperet est finalement tombé, l’accès à l’API gratuite a été révoqué pour tous les acteurs qui l’utilisaient.
Si au départ, tous les acteurs proposant des fonctionnalités de veille, de création de flux RSS, d’analyse pour Twitter se voulaient rassurants, l’optimisme n’a été que de courte durée. Et en quelques jours seulement, on a assisté à une véritable hécatombe avec des fermetures et des retraits de fonctionnalités en cascade.
Les agrégateurs de flux RSS Feedly et Inoreader ont annoncé le retrait de leurs fonctionnalités de surveillance de Twitter. Une majorité de plateformes de veille classiques ont été dans l’obligation de faire de même (à l’exception des plateformes de social media monitoring). Les petits outils de création de flux RSS qui avaient une option spécifique pour Twitter sont également concernés. Et les nombreux outils uniquement centrés sur Twitter comme Twitterdaily, Tweetbeaver ou encore Hoaxy n’ont eu d’autre choix que de fermer boutique.
À ce stade, il n’est pas question d’abandonner toute tentative de faire de la veille sur Twitter. Les multiples réseaux sociaux qui se sont positionnés comme des alternatives à Twitter n’ont pas encore trouvé leur public et de nombreux internautes continuent de publier des contenus pertinents pour la veille sur Twitter.
Quelles méthodes et outils nous reste-t-il pour faire de la veille sur Twitter ? C’est ce que nous avons exploré dans cet article.
Lire aussi :
Le guide ultime de la veille et la recherche d’information sur Twitter (Netsources N° 158 - mai/juin 2022)
Réussir à utiliser LinkedIn pour la veille et la recherche d’information (Netsources N° 158 - mai/juin 2022)
Reddit, réseau social méconnu en France, mais véritable atout pour la recherche spécialisée (Netsources N° 158 - mai/juin 2022)
Veille Instagram : quoi, comment, pour quoi faire ? (Netsources N° 158 - mai/juin 2022)
Comment intégrer YouTube dans votre dispositif de veille (Netsources N° 157 - mars/avril 2022)
Comment surveiller TikTok : un réseau social atypique pour le veilleur (Netsources N° 157 - mars/avril 2022)
OpenAlex est un nouvel outil qui vient se positionner sur le créneau de Google Scholar, Dimensions, Lens.org et les autres. Son but : devenir un catalogue qui recense un maximum de publications scientifiques, mais aussi chercheurs et institutions, une sorte de bibliothèque d’Alexandrie de l’IST version Web.
OpenAlex est un projet de l’organisation à but non lucratif OurResearch financé par Arcadia, un fonds qui œuvre pour la préservation de la culture et la promotion du libre accès.
Nous avons testé la version Alpha (la bêta sortira en juillet prochain) pour savoir ce qu’elle avait à nous offrir et quelle pouvait être sa valeur ajoutée par rapport aux outils déjà en place.
Lire aussi :
De nouveaux moteurs gratuits pour concurrencer Google Scholar (September 2018)
Elicit, un nouveau moteur scientifique au banc d’essai (Bases N° 404 - juin 2022)
Déconstruction de l’article scientifique : une nouvelle façon de rechercher l’information ? (Bases N° 409 - dec 2022)
Recherche bibliographique : moteurs gratuits ou grands serveurs payants, que choisir ? (Bases N° 405 - juil/août 2022)
Comment faire évoluer sa recherche d’information scientifique avec les nouveautés de Google Scholar ? (Bases N° 404 - juin 2022)
Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.
Dès 2006, nous avions évoqué cette question notamment dans un article consacré au marché chinois de l’information à partir d’une conférence donnée au Salon Online de Londres (demander le Bases N° 233 - décembre 2006 à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.).
Depuis, les initiatives chinoises se sont multipliées et l’offre et l’accessibilité se sont élargies de plusieurs façons :
Lire aussi :
Retour de l’indexation de la littérature chinoise dans Chemical Abstracts (Bases N° 398 - fev 2021)
DBpia une base de données académique coréenne (Bases N° 381 - mai 2020)
Littérature scientifique et technique : forte chute des références d’articles en langues asiatiques dans Chemical Abstracts (Bases N° 372 - juil/août 2019)
Brevets et littérature scientifique: l'irrésistible développement de la Chine (Bases N° 328 - juil/août 2015)
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La volonté de partager des listes de sources sur le Web a toujours existé, surtout avec l’avènement du Web 2.0. Mais le format ainsi que les outils de partage et d’hébergement de ces listes ont évolué. Il y a eu le temps des annuaires (qui sont finalement des sortes de listes), le temps des blogrolls sur les blogs, des outils de bookmarking, des FollowFriday et des listes sur Twitter, etc.
Aujourd’hui, outre Google Sheets, de nouveaux outils de création de bases de données ‘no-code’ et de tableurs en ligne ont vu le jour, dont le plus connu est Airtable. Ces tableurs sont souvent partagés publiquement par des experts, consultants ou autres acteurs d’un secteur particulier, qui disposent en échange de la gratuité du service.
Ces listes plus ou moins exhaustives peuvent se révéler précieuses, car elles constituent un pré-tri de l’information opéré par une personne suffisamment intéressée et experte pour entreprendre ce travail de recherche et de structuration. Elles permettent donc d’aller au-delà pour dénicher des sources utiles, voire des pépites, ou même des idées de structuration de l’information.
Recherche législative française et européenne facilitée, augmentation de la visibilité des questions citoyennes…
Le début d’année 2023 a été riche pour l’information institutionnelle. Or, le suivi et l’analyse de l’activité des institutions publiques et de leurs représentants permettent d’anticiper l’évolution d’un cadre réglementaire et d’y déceler des opportunités. Mais, doté d’un jargon et d’un circuit de l’information propres, ce type de sources reste parfois difficile d’accès. Zoom sur les nouveautés à retenir et les nouveaux outils à découvrir !
Après les agrégateurs de sources ouvertes Pappers Entreprise, puis Pappers Justice, Pappers Politique met en avant l’information institutionnelle française et européenne, de l’élaboration à la promulgation d’une loi.
Voir notre article Une nouvelle fonctionnalité pour Pappers, BASES n° 409, décembre 2022
Lire aussi :
Bercy crée son propre annuaire des entreprises
Une nouvelle fonctionnalité pour Pappers
Sélection des sources d’information institutionnelles (françaises et internationales)
L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.
Premièrement, car ce type de contenu est en grande partie diffusé dans un format audiovisuel, alors que les méthodes et les outils des professionnels de la veille reposent surtout sur du texte. Et même quand ces discours, interviews et citations existent au format textuel (dans des articles de presse par exemple), ils restent très difficiles à identifier et il est nécessaire d’avoir recours à des requêtes longues et complexes pour explorer tout le champ lexical de la prise de parole. Pour savoir comment rechercher des déclarations au format textuel, on pourra se référer à l’article « Retrouver les déclarations d’une personnalité : sources et méthodes », Bases N° 341 - oct 2016, qui reste encore d’actualité pour ce qui est des méthodes proposées.
Deuxièmement, parce que ces sources audiovisuelles restent difficiles à intégrer dans un livrable de veille. Cette étape peut alors nécessiter une écoute longue et minutieuse, une transcription parfois coûteuse, quand il ne s’agit pas de faire soi-même un montage pour en supprimer des extraits… Et tout cela, pour en tirer une ou deux lignes de citations pertinentes, généralement, donc… au format écrit.
Retrouver des discours et déclarations de personnalités publiques issues de sources audiovisuelles représente donc un double défi !
Retrouver les déclarations d’une personnalité : sources et méthodes (Bases N° 341 - oct 2016)
Mediatreeveut faire profiter les veilleurs et professionnels de l’information de sa technologie de veille audiovisuelle (Bases N° 380 - avril 2020)
Une citation est, dans un document donné, une référence à un autre document antérieur, traitant en général d’un sujet connexe. Les citations sont bien connues dans le domaine des articles scientifiques où leur nombre est souvent utilisé pour évaluer la qualité d’une publication.
Le développement du mouvement de la science ouverte (open access mais aussi open citations) donne un coup de projecteur aux citations et références, ainsi qu’à leur rôle dans le processus de recherche d’informations et de veille.
De nombreux outils s’emparent de ces données, désormais accessibles librement, pour proposer des fonctionnalités de recherche spécifiques et on voit également l’apparition de nombreux petits outils, souvent gratuits, qui se donnent pour mission d’explorer les réseaux de citations, offrant une autre manière de rechercher des documents pertinents et/ou d’identifier des experts.
On trouve aussi les citations dans les brevets. Et même si elles sont librement accessibles depuis longtemps, la recherche par les citations reste un champ trop peu exploré lors d’une recherche brevets.
Lire aussi :
Le brevet est-il un signal faible pour l'innovation ? (Bases N° 407 - oct 2022)
Savoir utiliser les publications défensives dans une stratégie brevet (Bases N° 403 - mai 2022)
Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise (Bases N° 401 - mars 2022)
La recherche de citations et de références boostée par l’IA et les « open citations » (Bases N° 369 - avril 2019)
2023 sera-t-elle l’année où l’utilisation de l’intelligence artificielle (IA) se démocratise au sein de l’activité de veille ? En attendant de le confirmer, notre sélection dans l’actualité de la veille montre que l’IA s’intègre, doucement mais sûrement, dans nos outils quotidiens. Florilège.
L’outil de traduction automatique DeepL Translator, devenu incontournable pour les professionnels de l’information, étend son champ de compétences à la réécriture. Auréolé de son nouveau statut de Licorne, DeepL vient de sortir la version bêta de DeepL Write, un outil de rédaction par une Intelligence artificielle.
Quels outils pour bénéficier de ChatGPT (Bases N° 410 - jan 2023)
C’est une question qui revient régulièrement : retrouver la trace d’une personne décédée aux siècles précédents dans le but d’identifier dans quel cimetière elle a été enterrée, retrouver des informations pour comprendre les raisons de son décès, garder une trace d’un fait divers pour l’inclure et illustrer un dossier documentaire ou une biographie, etc.
Toutes ces demandes ont un point commun : elles nécessitent d’entrer dans le monde des archives et dans l’idéal même le monde des archives en ligne, ce qui évite de se déplacer.
On sort alors complètement des sources que l’on peut avoir l’habitude d’interroger sur le Web et ce type de requête demande une démarche spécifique.
Lire aussi :
Tous les outils pour rechercher dans les archives du Web (02/2022)
La recherche d’information appliquée aux personnes (04/2019)
Depuis le rachat effectif de Twitter par Elon Musk en octobre dernier (après des mois de tergiversations et de retournements en tous genres), le volume d’information et d’articles publiés à propos de Twitter a été très important avec une grande diversité de thèmes abordés : changements au niveau de la politique, licenciements massifs, avis négatifs et positifs sur le rachat, prospective sur l’avenir de ce réseau social, nouvelles fonctionnalités ou disparition de fonctionnalités existantes, etc.
Mais avec l’annonce il y a quelques semaines du départ d’Elon Musk du poste de PDG, même s’il reste propriétaire de Twitter, le soufflé médiatique est rapidement retombé.
Maintenant que la situation se stabilise, il est temps de se pencher sur ce qui a changé chez Twitter au cours des derniers mois surtout en termes de services et de fonctionnalités. Car il y a eu de nombreux changements, souvent éclipsés par les nombreuses polémiques et ces changements viennent modifier certaines pratiques de veille et de recherche d’information que l’on pouvait avoir sur Twitter.
Le ministère de l’Économie et des Finances a annoncé il y a quelques semaines l’arrivée d’un nouvel annuaire des entreprises, officiel. Ce dernier a été créé par Etalab, le département d’ouverture des données de la Direction Interministérielle du Numérique, et la Direction Générale des Entreprises.
Trois filtres de recherche sont proposés : la zone géographique, le nom du dirigeant et la situation administrative (état administratif/type de structure/labels et certificats/Domaine d’activité/Code NAF ou APE).
Ils permettent de retrouver les données publiques détenues par l’administration sur une entreprise, une association ou une administration.
Le moteur de recherche décentralisé Presearch a lancé récemment une option de géolocalisation au choix, une pratique essentielle pour identifier des sources et rechercher des informations au niveau international.
Depuis l’arrêt de l’option de localisation des recherches chez Google il y a quelques années, le plus simple pour localiser sa recherche où on le souhaite consistait souvent à utiliser des VPNs ou petites extensions spécialisées comme Geolocalized Search, USearch from… (« Sortir de la recherche géolocalisée sur Google », BASES n° 395, septembre 2021).
D’autres moteurs, récemment lancés, intègrent également directement cette fonctionnalité comme Kagi Search ou encore Neeva.
Au cours des derniers mois, Facebook a retiré une multitude de fonctionnalités intéressantes pour le pro de l’info, souvent après à peine un an d’utilisation : les newsletters « Bulletin » qui devaient concurrencer Substack, le moteur d’offres d’emploi, les podcasts, et même l’onglet Facebook News semble sur la sellette après l’annonce en novembre dernier du remplacement des journalistes en charge de la curation par des algorithmes.
En France, le contrat de Facebook avec une filiale de l’AFP pour la vérification des informations s’est aussi arrêté. Les médias, dont le contenu n’est vu que par 3 % des utilisateurs, ne seraient pas rentables pour la plateforme. D’autant qu’en France Facebook rémunère la diffusion des contenus en provenance des médias au titre des droits voisins.
Depuis la mise à jour du moteur en juillet dernier (et le remplacement de son interface), nombreux sont les professionnels qui regrettent l’ancienne interface.
Qu’à cela ne tienne, Légifrance a procédé à quelques améliorations récemment au niveau de la recherche. Outre une dizaine de corrections de bugs, on notera les nouveautés suivantes :
Nul n’a pu y échapper. Dans les médias, au bureau… on ne parle que de cela : ChatGPT est-il en train de ringardiser Google ?
Au regard de la recherche d’informations, ChatGPT n’est pourtant pas assez fiable pour être utilisé de façon professionnelle. D’ailleurs, ce bot conversationnel n’a pas vocation à devenir un moteur de recherche. En revanche, son impact sur la recherche d’information est réel et il est intéressant d’explorer dès maintenant les usages en la matière, en ce qu’ils préfigurent ceux des années à venir.
Difficile de résumer ChatGPT, un bot gonflé à l’intelligence artificielle, à une seule fonctionnalité : créateur de contenu (et de code), moteur de réponse, traducteur, générateur de résumé… ChatGPT fait tout cela à la fois. Il peut donc être utilisé à chaque étape de la veille, qu’il s’agisse de l’identification des besoins, du sourcing, ou de l’analyse.
Pourquoi est-il populaire ? Du fait de son interface de dialogue simplifiée, à laquelle on accède après inscription. Une fois cette formalité établie, une barre de dialogue s’ouvre en bas de page. C’est là que l’on pose ses questions. L’outil y répond en haut et la conversation défile, comme une conversation avec n’importe quel chatbot.