Cette rubrique « FICHE DE SYNTHESE » se propose d’aider à comprendre en un clin d’œil les informations clés de chaque numéro de NETSOURCES. Cette rubrique sera également déclinée en version pédagogique « pas à pas » et commentée dans nos fiches pédagogiques « Les essentiels de la veille». Bonne lecture !
Le déluge informationnel auquel nous faisons face quotidiennement accapare nos ressources mentales à tel point que nous craignons sans cesse d’oublier quelque chose. Et quand on n’oublie pas, on passe son temps à rechercher.
Cette situation explique sans doute le succès de la méthode prodiguée par Tiago Forte dans son best-seller « Construire un second cerveau : une méthode complète pour organiser votre vie numérique et libérer votre potentiel créatif », mais aussi celui des outils dopés à l’intelligence artificielle et leurs promesses de gains de productivité.
Dans cette fiche, nous vous expliquons comment adapter sa veille métier infodoc et son système de gestion des connaissances personnelles (PKM) pour avoir un système simple, flexible, actionnable et pas trop chronophage que vous pourrez réussir à intégrer à votre quotidien.
Déjà abonné ? Connectez-vous...
Le déploiement massif de ChatGPT et autres modèles d’IA entraîne une transformation significative des tâches, des processus et de la valeur ajoutée des professionnels de l’information, qui se trouvent en première ligne de cette révolution en cours.
Il est à craindre que les valeurs d’exhaustivité et de qualité de la recherche soient encore plus difficiles à défendre que par le passé, quel que soit le niveau d’«hallucination» de l’IA…
L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT https://openai.com/blog/chatgpt s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Selon l’OCDE, 14 % des emplois seront ainsi exposés à un enjeu majeur d’automatisation, tandis que 32 % des emplois pourraient être transformés substantiellement. Qu’en est-il pour les professionnels de la veille ?
Face à cette ascension fulgurante, il reste difficile d’appréhender son nouvel environnement. Nous nous proposons donc de partager les bases de fonctionnement d’un système IA utiles aux métiers de la veille et de la recherche d’information et d’esquisser, à chaque étape du processus de veille, les premiers bouleversements expérimentés.
Le professionnel de la veille, parce qu’il manipule l’information qui transite entre l’intelligence humaine et l’intelligence artificielle, doit ainsi apprendre de nouveaux modèles de langage et d’apprentissage : ceux utilisés par l’IA.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (04/2023)
Revue des moteurs de recherche à l’heure de ChatGPT (04/2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (01/2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA (article en accès libre)
La notion d’algorithme ne lui est pas étrangère : le moteur de recherche Google et les médias sociaux sont notamment dotés d’algorithmes de recommandation et les outils de reconnaissance faciale, les assistants virtuels (Siri, Alexa…) ou le classement des emails... en utilisent encore d’autres. Mais jusqu’ici, il n’interagissait pas directement avec les algorithmes.
Comment IA et veilleur peuvent-ils se comprendre ? Entre les flux RSS et les requêtes booléennes, le veilleur avait appris à parler aux machines. Avec l’IA, il apprend un autre langage, mais découvre aussi un autre univers : pour comprendre le langage humain, l’IA utilise des modèles de langage constitués de deux choses :
● Des algorithmes (de Machine Learning que l’on traduit par « apprentissage automatisé ») ;
● Un type d’apprentissage plus ou moins supervisé.
Les modèles de langage automatique les plus usités actuellement sont les LLM, Large Language Models (par exemple : ChatGPT d’OpenAI, Bard de Google, Bloom de Hugging Face, Llama de Facebook disponible sous forme brute en open source, etc. Il en existe plus de 10 000 !). Ainsi, ChatGPT est un modèle de LLM, créé avec l’algorithme GPT-4, en apprentissage semi-autonome.
Le cycle classique de la veille commence par la définition du sujet.
Brainstorming avec le destinataire de son produit de veille, sourcing, identification de mots-clés… se faire une culture sur un sujet constitue une phase intense de recherche d’information, et la tentation est grande de « griller les étapes » avec les réponses toutes faites de ChatGPT plutôt que respecter toutes les étapes de recherche. Faut-il sauter le pas ?
Déjà abonné ? Connectez-vous...
L’un des thèmes récurrents autour de ChatGPT et autres IA génératives concerne la question des prompts - c’est-à-dire les requêtes utilisées pour communiquer avec l’IA - avec l’idée que la qualité des réponses et contenus produits par ces outils dépendraient de la qualité des prompts.
A priori rien d’insurmontable pour les professionnels de l’information qui ont toujours appris à interroger et manipuler les différentes générations d’outils pertinents pour l’exercice de leur métier.
Toutefois, cette fois-ci, cette compétence vaudrait de l’or à en croire la société Anthropic (créateur de Claude, l’un des concurrents de ChatGPT) qui propose un poste de « Prompt Engineer and Librarian » avec un salaire débutant à 300 000$ (Source Time et Jobs Lever), bien loin des standards habituels.
Le professionnel de l’information va-t-il enfin être reconnu à sa juste valeur ? Rien n’est moins sûr… Mais toujours est-il qu’aujourd’hui, on ne peut pas faire l’impasse sur l’IA dans l’exercice de son métier.
La compréhension et la maîtrise des prompts est donc un axe-clé qu’il va falloir comprendre et maîtriser.
C’est ce que nous aborderons dans cet article en démêlant le vrai du faux pour faire la différence entre ce qui est vraiment utile pour communiquer avec l’IA et ce qui relève d’arguments purement commerciaux et marketing puis en proposant des éléments de méthodes pour tirer parti au mieux des outils à base d’IA à partir de nos propres tests et de discussions avec plusieurs professionnels qui utilisent l’IA dans leurs pratiques.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (04/2023)
Revue des moteurs de recherche à l’heure de ChatGPT (04/2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (01/2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA (article en accès libre)
Il n’est pas question d’entrer ici des requêtes booléennes ou des opérateurs. Le prompt est rédigé en langage naturel et peut être plus ou moins long. Tous ces outils étant des outils conversationnels, le dialogue avec l’IA consiste en une série de prompts, un peu comme dans une discussion avec un humain. L’IA a une dimension de mémoire et est en principe capable de se souvenir de ce que vous lui avez dit quelques minutes avant.
Derrière la notion de prompt se cachent en réalité différents niveaux.
● Le premier niveau est celui qui va nous intéresser ici et qui consiste à dialoguer avec les outils du marché pour obtenir la meilleure réponse possible.
Déjà abonné ? Connectez-vous...
L’IA générative a un rôle à jouer à certaines étapes de la veille et de la recherche d’information et notamment lors de la phase d’analyse notamment pour tout ce qui a trait aux résumés de documents, de pages Web ou encore contenus audio et vidéo et à la possibilité d’interroger et d’interagir avec ces documents.
Sur le papier, tous ces outils pourraient permettre de gagner un temps considérable quand il s’agit de passer au travers de très nombreux et très longs documents. Mais dans la pratique, ces outils sont-ils aussi miraculeux qu’ils le laissent paraître, quels sont leurs avantages mais aussi leurs limites, sont-ils fiables ou bien inventent-ils du contenu, comment les intégrer intelligemment à ses pratiques et comment choisir le bon outil parmi la masse d’outils disponibles.
Dans cet article, nous avons donc exploré l’écosystème de tous ces nouveaux outils de résumés et d’interrogation de contenus textuels car ils sont très nombreux.
Nous en avons ainsi identifié et testé plus de 40, tous apparus au cours de l’année 2023. Seuls quelques-uns sortent véritablement du lot. C’est à eux que nous nous intéresserons dans cet article.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (04/2023)
Notre sélection d’annuaires d'outils IA (article en accès libre)
Les outils de Business Intelligence pour créer des analyses visuelles dans un livrable de veille
Kagi Search intègre le résumé automatique aux résultats de recherche
Les résumés automatiques de nouvelle génération au service de la veille
Les outils de résumés automatiques ne sont pas nouveaux. On rappellera que le résumé automatique est l’une des premières applications de traitement automatique du langage (TAL) à avoir vu le jour, avec la traduction automatique dès les années 50-60.
En 2019 déjà, nous avions pu voir apparaître une nouvelle génération d’outils de résumé automatique, intégrant de l’IA, un peu meilleurs que les générations précédentes mais toujours peu utilisables dans un contexte professionnel.
Nous avions alors fait une article intitulé « Les résumés automatiques de nouvelle génération au service de la veille » (BASES n°370 - mai 2019).
L’arrivée de ChatGPT et des IA génératives auprès du grand public change la donne et permet l’apparition d’une nouvelle génération d’outils de résumé. Mais ça ne s’arrête pas là, parmi ces nouveaux outils, un nombre non négligeable permet d’interagir avec les documents pour leur poser des questions.
Déjà abonné ? Connectez-vous...
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
Pour un professionnel de la veille, celle-ci prend des formes variées, allant d’un format court (une synthèse par exemple) à une littérature plus élaborée (debrief client, plan de veille, étude de marché, etc.).
L’apparition rapide de milliers d’outils IA bouscule les usages et les méthodes de travail, au point de poser la question de l’optimisation de ses livrables. Nous verrons donc :
● En quoi les différents formats sont-ils affectés par les tâches automatisées à l’IA ?
● Comment les outils IA gratuits et freemiums testés modifient-ils les étapes de création d’un livrable ?
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (04/2023)
Revue des moteurs de recherche à l’heure de ChatGPT (04/2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (01/2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA (article en accès libre)
La génération de contenu par IA utilise des algorithmes pour créer du texte, des images ou du son, originaux à partir de modèles (modèles d’emails marketing, modèles de slides de présentation, modèles d’images, etc.). Ces modèles sont eux-mêmes constitués de corpus en provenance du web, d’autres bases de données, ou même du contenu chargé par l’utilisateur.
Comme les logiciels « classiques », les « générateurs » sont spécialisés selon le format : les présentations, le document texte, le son ou l’image. Leurs points différenciants concernent la rapidité d’exécution des tâches automatisées, la facilité de prise en main (quand on maîtrise l’art du prompt), la possibilité d’inclure différents médias et surtout la nature multitâches des outils.
Tout d’abord, on peut choisir de n’être aidé à la rédaction que dans la phase du plan et de rédiger par soi-même, ce qui constitue déjà un gain de temps précieux. C’est là qu’excelle ChatGPT d’OpenAI. Encore faut-il avoir cerné ses besoins assez précisément pour formuler des consignes comme : Fais-moi un plan pour une formation en [notre sujet] de 2 jours
. Puis affiner sa demande après une première proposition.
Rappelons toutefois que cela n’est qu’une base, et que le résultat reste à personnaliser (attention la version gratuite de ChatGPT ne prend pas en compte l’actualité puisque son corpus s’arrête à septembre 2021, un frein levé dans la version payante).
Nous avons comparé ses résultats à ceux de Bing Chat, accessible sur le navigateur Edge uniquement (alimenté par l’algorithme GPT4 et accédant au web), sur le sujet suivant : le plan d’une étude de marché réalisée par un expert en café dont l’objectif est la création d’une nouvelle marque
. Sans surprise, le contenu de Bing Chat est bien moins précis que celui de ChatGPT, davantage entraîné à la formalisation des textes que le moteur de recherche.
Nous avons aussi testé HuggingChat, l’alternative OpenSource de ChatGPT, mais elle n’a pas (encore) été capable de nous fournir un plan.
Déjà abonné ? Connectez-vous...
Cette rubrique « FICHE DE SYNTHESE » se propose d’aider à comprendre en un clin d’œil les informations clés de chaque numéro de NETSOURCES. Cette rubrique sera également déclinée en version pédagogique « pas à pas » et commentée dans nos fiches pédagogiques « Les essentiels de la veille». Bonne lecture !
Pour comprendre le langage humain, l’IA utilise des modèles de langage constitués de deux choses :
● Des algorithmes (de Machine Learning que l’on traduit par « apprentissage automatisé ») ;
● Un type d’apprentissage plus ou moins supervisé.
Les modèles de langage automatique les plus usités actuellement sont les LLM, Large Language Models (par exemple : GPT-4 d’OpenAI, Bert de Google, Bloom de Hugging Face, Llama de Facebook, etc. Il en existe plus de 10 000 !). Par exemple, ChatGPT est un modèle LLM, qui utilise l’algorithme GPT-4, en apprentissage semi-autonome.
Déjà abonné ? Connectez-vous...
Nous sommes à un moment charnière où l’intelligence humaine va s’enrichir considérablement de l’intelligence artificielle pour devenir encore plus puissante. Et les secteurs de l’information, de la communication et de la langue, terrains de prédilection d’un modèle de langage tel que ChatGPT, sont certainement parmi les premiers bénéficiaires de cet enrichissement inédit et renversant. Même si l’on peut naturellement craindre l’autre versant, beaucoup moins optimiste, de cette promesse, avec des effets négatifs encore difficiles à caractériser et à évaluer à ce stade.
Jusqu’à présent le domaine de la veille multilingue exigeait du professionnel qu’il associe à son expertise technique en matière de veille à l’international, une certaine «agilité linguistique», voire de véritables compétences linguistiques. Il est dorénavant boosté par l’irruption de l’IA dans tous les process, du sourcing à la production de livrables, en passant par l’élaboration des stratégies de recherche.
Et c’est cette transformation des process et des pratiques que ce nouveau numéro de NETSOURCES se propose d’expliciter afin d’en faciliter la mise en œuvre. Des méthodes de recherche hybrides alliant humain et machine, plus performantes dans le cadre d’une mission de veille internationale, des outils dopés à l’IA conversationnelle, de même que de nouvelles formes de restitution de l’information, plus lisibles, plus «internationalisées», vont avoir une valeur ajoutée extrêmement forte pour des groupes internationaux où la diffusion des produits de veille et recherche doit atteindre un public disséminé dans plusieurs pays.
Les outils d’IA sont présentés ici non pas comme des solutions universelles, mais plutôt comme des options à évaluer avec soin en fonction des besoins de chaque situation. Étrangement, dans la mesure où la veille, augmentée de la traduction automatique, génère des volumes de données considérables et met le veilleur face à de multiples biais multiculturels et linguistiques, elle oblige plus que jamais celui-ci à faire appel à son esprit critique. En fin de compte, le veilleur «augmenté à l’IA» doit développer encore plus d’expertise humaine, à la fois dans son domaine d’activité et dans les méthodes et les outils de veille utilisés.
Toute veille débute par une phase d’identification des mots-clés qui serviront aux futures requêtes et alertes. Cette étape cruciale se complexifie quand la veille est internationale et nécessite de prendre en compte la question du multilinguisme.
Mais a-t-on encore besoin de maîtriser plusieurs langues étrangères pour identifier les mots-clés d’une veille multilingue ? Les dernières avancées de l’IA et l’arrivée de ChatGPT peuvent-elles nous être utiles lors de cette étape ? Et faut-il à tout prix se lancer directement à la recherche de mots-clés en langues locales que l’on ne maîtrise pas ?
Lire aussi :
Comment identifier des sources d’information locales ?
Conseil veille : boostez votre veille à l’international
Presearch permet de chercher depuis la localisation de son choix
Dossier spécial « Rechercher différemment », La recherche d’information par géolocalisation
On pourrait penser qu’il faut impérativement commencer par identifier des mots-clés en langue locale alors qu’il est souvent plus judicieux de commencer avec les langues que l’on maîtrise le mieux et pour lesquelles on a des repères et connaissances solides.
Dans cet article, nous proposons une méthodologie et des outils permettant d’identifier efficacement les mots-clés pertinents dans le cadre d’une veille internationale multilingue. Et pour l’illustrer, nous prendrons l’exemple de la mise en place d’une veille sur le marché du café au Vietnam.
Comme une recherche classique et quelle que soit la langue des informations recherchées et livrées, on prendra soin de commencer par le brief client, afin de saisir les concepts clés, le vocabulaire, les noms de produits, d’entreprises ou d’innovations, etc.
1. C’est une particularité de la veille multilingue, dans notre recherche de mots-clés pour définir notre périmètre de recherche, on donne la priorité aux mots-clés qui ne sont pas soumis aux traductions : le nom des entreprises, des dirigeants.
Déjà abonné ? Connectez-vous...
Identifier des sources dans une langue étrangère nécessite de sortir de sa zone de confort. Il faut non seulement se plonger dans un paysage médiatique et culturel différent, mais aussi minimiser son risque d’erreur d’interprétation.
Pour illustrer la méthodologie à suivre, nous prendrons comme exemple la réalisation d’un sourcing pour la mise en place d’une veille sur le marché de la restauration en Malaisie.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Sourcing : les outils professionnels suffisent-ils pour s’aventurer en terrain inconnu
Sourcing : peut-on faire l’impasse sur les recherches en langue locale ?
Fiche Pratique : Les sources-clés pour la veille à l’international
Comme pour la recherche de mots clés dans une veille multilingue, identifier des sources d’un autre pays passe d’abord par l’exploration de la littérature dans sa propre langue et en anglais. Dès cette étape, on constate d’ailleurs pour notre exemple le caractère incontournable des sources anglophones.
Voici quelques fiches pays proposant un panorama des médias locaux :
● En français, les fiches pays du classement annuel de Reporters sans frontières (RSF) (https ://rsf.org/fr/pays/malaisie) nous décrivent le paysage médiatique des pays, allant jusqu’à préciser la ligne éditoriale des principaux supports (ici : l’agence de presse Bernama, le groupe audiovisuel Radio Televisyen Malaysia, la presse grand public et les médias en ligne indépendants Malaysiakini, Between The Lines ou Sinar Harian.
● Le rapport annuel de Reuters Digital News Report (https ://reutersinstitute.politics.ox.ac.uk/digital-news-report/2022/malaysia) est également doté d’une déclinaison par pays. Il précise le modèle économique des médias et propose des classements basés sur leur notoriété.
● L’ONG Freedom House (https ://freedomhouse.org/country/malaysia/beijings-global-media-influence/2022) dresse un état des lieux des libertés générales, mais aussi numériques. Elle nous confirme ici l’importance des médias chinois, en langue malaise (via Radio Chine Internationale (https://french.cri.cn/) et chinoise.
À ce stade, la langue française ne nous est déjà plus d’aucun secours pour améliorer notre sourcing local (nous avons visité les sources du Courrier international (https://www.courrierinternational.com/notule-source/pays), les rubriques internationales des médias français, les annuaires, etc., mais les informations fournies étaient déjà bien moindres qu’après la consultation de ces trois fiches pays).
Déjà abonné ? Connectez-vous...