Tous nos articles - Bases & Netsources

FOCUS IA : générer un quiz en moins d’une minute

Céline Boileau

Bases no

422

Créé le

jeudi 15 février 2024

860

Tags

évaluation outils | IA

FOCUS IA : générer un quiz en moins d’une minute Image 1

Pour rendre un livrable et une formation efficaces en vérifiant le niveau de compréhension de son public ou tout simplement pour rajouter une touche de divertissement, le quiz est un outil pédagogique qui peut s’avérer un précieux allié. Et aujourd’hui avec les modèles d’IA générative, un quiz peut être créé en une minute, ou presque. Florilège de nos 4 outils préférés.

Lire aussi :

Nos quiz search et veille

Livrables : trois outils IA pour maximiser vos présentations (11/2023)

4 générateurs de videos freemiums au banc d’essai (10/2023)

Le text to mindmap depoussiere les cartes mentales (09/2023)

Opexams, un quiz gratuit par jour

Opexams est une plateforme pédagogique qui propose la génération de quiz parmi d’autres fonctionnalités.

Son « Quiz Generator » est accessible sans inscription. Le quiz est généré à partir d’un texte à fournir (jusqu’à 3000 signes environ) et, comme toujours avec ces outils IA, le procédé est simplifié au maximum : on copie son texte, puis on sélectionne les options suivantes : le type de quiz (choix multiples, vrai/faux ou questions ouvertes), la langue, le nombre d’options par question (cinq maximum), puis on clique sur « Générer un quiz ».

L’option « par sujet » permet d’entrer uniquement un thème de son choix, qu’il soit dans le domaine scolaire ou professionnel. Aux options précédentes, s’ajoute le niveau de difficulté souhaité (facile/moyen/difficile).

Nous avons testé les contenus des différents outils de recherche d’information scientifique en accès libre

François Libmann

Netsources no

168

Créé le

jeudi 15 février 2024

697

Tags

open access | information scientifique et technique

Nous avons testé les contenus des différents outils de ... Image 1

Notre habitude est de construire des stratégies complexes, mêlant synonymes, mots écrits de différentes façons (crosslink ou « cross link » par exemple), avec des opérateurs booléens, de proximité, des possibilités d’exclure des thématiques et, enfin, de multiples possibilités de combiner des étapes. Autant le dire tout de suite, ces stratégies ne sont pas transposables en l’état dans ces nouveaux outils.

Pour réaliser nos tests, nous avons donc dû utiliser des stratégies relativement simples qui puissent fonctionner sur tous les outils. Nous nous sommes limités aux références d’articles ou de conférences, incluant les preprints qui sont de plus en plus pris en compte. En revanche nous n’avons pas, dans la mesure du possible, pris en compte les chapitres d’ouvrages et les thèses. Les recherches se font dans le titre, ce qui n’est pas toujours simple, certains systèmes n’offrant pas cette option, obligeant à faire des comptages manuels. Nous avons envisagé de tester une recherche par affiliation mais cette fonctionnalité n'est pas disponible dans tous les moteurs.

Cette comparaison entre les serveurs et les outils gratuits ne pouvant se faire que sur des stratégies simples, on laisse de côté la puissance de recherche et le confort d’utilisation pour ne comparer que le nombre de réponses. Par ailleurs, il est évident que ces tests n’ont aucune valeur statistique et que l’on ne peut rien généraliser à partir de leurs résultats.

Maîtriser l'Open Data et l'IA pour transformer et exploiter les données différemment

Céline Boileau

Netsources no

168

Créé le

jeudi 15 février 2024

683

Tags

open data | méthodologie

Maîtriser l'Open Data et l'IA pour transformer et exploiter ... Image 1

En France, pays champion européen de l’open data, on parle souvent des startups qui parviennent à exploiter des données accessibles en accès gratuit, pour en faire des services, avec parfois une option payante, à l’instar de Pappers ou Doctrine.

Depuis la démocratisation de l’IA amorcée il y a plus d’un an avec la mise à disposition au public de ChatGPT, suivie depuis par d’autres IA génératives et services afférents, comment le traitement des données ouvertes a-t-il évolué et surtout, est-il davantage accessible à un utilisateur sans formation technique particulière en amont ? Exploration, étape par étape, du traitement des données, de l’extraction à la publication.

Extraction facilitée

Première étape : la collecte des données. Celle-ci peut se faire de deux façons : en téléchargeant un dataset ou en procédant à l’extraction des données sur un document. C’est dans ce second cas que les outils IA interviennent. S’offrent alors deux possibilités d’extraction de données :

● Avec un outil IA où l’on importe un fichier de données.

● Avec un tableur habituel, auquel on ajoute un module IA.

Avec un outil IA

Les outils IA qui permettent d’importer gratuitement des documents à traiter ne prennent pas en charge les formats de bases de données, mais uniquement les formats textes et PDF. Dans ce cas, extraire les données d’un document pour les récupérer sous forme texte ou de tableau est un jeu d’enfant.

STN : Des stratégies astucieuses pour la recherche brevet

François Libmann

Bases no

422

Créé le

jeudi 15 février 2024

801

Tags

brevets | méthodologie

STN : Des stratégies astucieuses pour la recherche brevet Image 1

Après la période de vide laissé par le départ en retraite de Martine Michel, CAS (Chemical Abstracts Services qui gère STN en collaboration avec FIZ Karlsruhe) vient de recréer son équipe en charge de la France.

Cette nouvelle équipe a organisé une réunion en présentiel, ce qui n’était pas arrivé depuis fort longtemps.

Cette réunion était centrée sur la chimie et les brevets. Les autres banques de données présentes sur STN seront, quant à elles, évoquées lors d’une prochaine rencontre.

Cette réunion a été marquée par la présentation de nombreux exemples détaillés très intéressants concernant diverses problématiques. Ce fut l’occasion d’illustrer la puissance du langage de requête Messenger utilisé par STN dont la contrepartie est une certaine complexité qui n’a, cependant, rien d’insurmontable.

IA open source : une opportunité pour le veilleur ?

Céline Boileau

Netsources no

168

Créé le

jeudi 15 février 2024

672

Tags

open source | IA

IA open source : une opportunité pour le veilleur ? Image 1

L’année 2023 a été marquée par la démocratisation des IA génératives. Cette technologie de pointe, qui a émergé sur le marché en 2020, était alors réservée à quelques experts qui payaient une API. Amorcée par la mise sur le marché de l’interface gratuite ChatGPT d’OpenAI, dont la plupart des produits sont devenus payants dans les mois qui ont suivi, cette démocratisation pourrait néanmoins perdurer grâce au développement de modèles de langage sous licence ouverte (ou « open source »).

Cette licence permet en effet d’exploiter un modèle de langage pré-entraîné à moindres frais (moins de 500 dollars dans la plupart des cas et avec des ressources de calcul modestes), ouvrant ainsi l’accès à un large éventail de chercheurs, de développeurs et d’organisations.

Le paysage du veilleur

Des outils difficilement identifiables

Il existe néanmoins quelques freins pour que le veilleur puisse en profiter.

Premièrement, ces outils restent difficilement identifiables et utilisables malgré les effets d'annonce. La première raison qui rend difficilement identifiables les outils d’IA open source réside dans la définition même d’une « IA open source », laquelle est trop souvent confondue avec la gratuité. Toutefois, pour l’Open Source Initiative (OSI), l’organisation qui défend « une économie du logiciel dépendant de la vente de prestations et non de celle des licences d’utilisation » l’IA open source doit permettre :

● L’étude du fonctionnement du système et l’inspection de ses composants ;

● L’utilisation de son système à n’importe quelle fin, sans avoir à demander la permission ;

● La modification du système pour changer ses recommandations, prédictions ou décisions afin de l’adapter à ses besoins ;

● Le partage du système avec ou sans modifications, à quelque fin que ce soit.

La deuxième raison qui rend ces outils difficilement identifiables est la difficulté à identifier ce qui est open source dans une IA.

Les nouvelles promesses de la recherche multilingue en action

Carole Tisserand-Barthole

Bases no

422

Créé le

jeudi 15 février 2024

832

Tags

recherche Web | outils de recherche | IA | évaluation outils

Les nouvelles promesses de la recherche multilingue en ... Image 1

Cela fait des années que l’on entend parler de Cross-Language Information Retrieval (CLIR) pour la recherche d’information. Il s’agit de la capacité à rechercher dans une langue et à recueillir des résultats dans d’autres langues. Jusqu’à maintenant, les produits ou fonctionnalités de ce type étaient rares et n’ont jamais véritablement décollé, à l’instar de la fonctionnalité proposée par Google de 2007 à 2013.

Et pourtant, il y a là un vrai besoin notamment pour les professionnels de l’information : dans un monde globalisé, il est en effet souvent nécessaire d’élargir à des sources en anglais (ce qui est souvent gérable), mais aussi à des sources dans des langues dont on ne maîtrise pas toujours les rudiments.

Si on peut malgré tout à mettre en place un système qui fonctionne en s’aidant de dictionnaires et d’outils de traduction, le processus reste long et fastidieux (voir NETSOURCES n°163, Avril 2023 consacré à la veille multilingue).

Lire aussi :

Sourcing, de la théorie à l’épreuve de la pratique

Les nouvelles dimensions du multilinguisme pour la veille

Veille multilingue : comment trouver ses mots ?

Veille internationale : comment trouver des sources en langue étrangère ?

Comprendre les résultats de sa veille multilingue en un clin d’œil

Comment l’IA enrichit les livrables de veille multilingue ?

L’idéal dans cette situation serait de rechercher dans sa langue ou en anglais et de récupérer les contenus publiés dans d’autres langues, mais traduits en anglais ou français pour les analyser.

Bonne nouvelle : cela existe déjà, et c’est même en train de prendre de l’ampleur.

L’arrivée de l’IA dans la panoplie d’outils des veilleurs et documentalistes

Carole Tisserand-Barthole

Bases no

421

Créé le

samedi 20 janvier 2024

2303

Tags

outils de veille | information scientifique et technique | tendances | serveur de bases de données

L’arrivée de l’IA dans la panoplie d’outils des veilleurs ... Image 1

Si 2023 a été l’année de ChatGPT et de la déferlante de nouveaux outils dopés à l’IA générative, 2024 sera celle de l’intégration de l’IA générative dans les outils traditionnels du pro de l’info. Explorez avec nous les diverses innovations des acteurs traditionnels en matière d’IA et interrogeons-nous sur la pertinence de délaisser les outils IA de la cuvée 2023 au profit des outils classiques.

En 2023, l’arrivée de ChatGPT et de l’IA générative a conduit les professionnels de l’information à adapter leur arsenal d’outils pour marier habilement les outils traditionnels (qu’ils soient grand public, tels que les moteurs de recherche Web, ou spécialisés, tels que les outils de veille et bases de données) avec les nouveaux outils boostés par l’IA générative (résumés automatiques, assistants IA, dialogues avec des PDFs ou vidéos, etc.).

Aujourd’hui, c’est cette même panoplie traditionnelle qui intègre progressivement des fonctionnalités d’IA générative, avec des annonces nombreuses et difficiles à suivre.

Lire aussi :

La vague d’outils IA pour l’Information Scientifique et Technique (IST)

Les clés pour s’approprier l’IA dans son métier de veilleur

Revue des moteurs de recherche à l’heure de ChatGPT

FOCUS IA : maîtriser et gérer ses prompts

Céline Boileau

Bases no

421

Créé le

samedi 20 janvier 2024

913

Tags

IA | évaluation outils

FOCUS IA : maîtriser et gérer ses prompts Image 1

S’il n’est pas la seule clé du succès pour garantir un résultat satisfaisant d’un outil IA, un bon prompt augmente néanmoins ses chances d’obtenir satisfaction. Des milliers d’outils permettent de copier, améliorer ou encore stocker ses prompts. Ils varient en fonction des algorithmes concernés, des thèmes et des formats à générer et/ou des usages. En voici quatre sur une trentaine testés, sélectionnés pour leur efficacité et leur facilité de prise en main : Prompt Genius, PromptBase, SnackPrompt et FlowGPT.

AI Prompt Genius, pour stocker ses prompts personnels

AI Prompt Genius s’adresse aux personnes ayant déjà trouvé des prompts (ou « invites » en français) qui répondent à leurs besoins et ont besoin de les stocker dans un endroit accessible quelle que soit l’IA générative utilisée. Plutôt qu’une longue liste ingérable, cette extension accessible sans inscription permet de créer sa propre bibliothèque de prompts.

Elle s’ouvre sur une barre de recherche au centre et les prompts sont rangés en dossiers dans la barre de gauche.

Pour stocker un prompt, on clique sur « Nouveau prompt » et une fenêtre s’ouvre. Les champs à remplir pour créer son prompt sont « Titre », Texte (avec les variables), Description, Étiquette et on sélectionne le nom du dossier.

Prompt Genius s’utilise sur toutes les plateformes. L’outil suggère de créer des dossiers en fonction du modèle de langage concerné (ChatGPT, Bard, DALL-E, etc.) et des étiquettes sur des tonalités différentes. Ce qui rappelle qu’un même prompt n’aura pas le même résultat avec des modèles différents. Et comme chaque modèle d’IA a son propre langage, les invites doivent s’adapter à chacune.

En termes d’ergonomie, il s’affiche soit en pop-up comme la plupart des extensions, soit en barre latérale à droite de l’écran, sur ordinateur ou sur mobile. Il est aussi possible d’importer des prompts au format CSV et de les exporter en CSV ou JSON. L’outil, souvent recommandé par les professionnels de l’information et qui s’avère facile à utiliser et pratique à l’usage, est gratuit et disponible en français.

Promptbase, le supermarché des prompts

Promptbase est LA Marketplace de prompts. Intuitivement, on y choisit son domaine d’usage (éditorial, marketing, création de logos, illustrations, etc.) et son thème (animal, santé, finances, etc.) ou le modèle de langage de l’IA générative utilisée (Midjourney, DALL-E, Stable Diffusion, GPT).

Matilda, le nouveau moteur académique sans IA

Carole Tisserand-Barthole

Bases no

421

Créé le

samedi 20 janvier 2024

814

Tags

évaluation outils | information scientifique et technique

Matilda, le nouveau moteur académique sans IA Image 1

En septembre dernier, le nouveau moteur académique Matilda était officiellement lancé. Explorez ses fonctionnalités de recherche avancées, ses fonctionnalités de veille, son vaste corpus et découvrez comment il se positionne par rapports aux outils de recherche académique.

À l’origine du projet, une équipe de chercheurs français coordonnée par Didier Torny du CNRS qui a pour ambition « de redonner une place équitable aux contenus académiques exclus des outils propriétaires actuellement utilisés, WoS et Scopus » et de « permettre aux bibliothécaires et aux chercheurs d’exercer le plus grand contrôle possible dans la manière dont ils recherchent et réutilisent les informations textuelles et les métadonnées. »

Lire aussi :

La vague d’outils IA pour l’Information Scientifique et Technique (IST)

Consensus, un moteur académique dopé à l’IA (01/2023)

Zendy : un moteur académique 100 % open access (09/2022)

Elicit, un nouveau moteur scientifique au banc d’essai (06/2022)

Comment faire évoluer sa recherche d’information scientifique avec les nouveautés de Google Scholar ?(06/2022)

Quel corpus ?

Premier aspect important : le corpus. Matilda se base sur la littérature scientifique indexée depuis 2019 dans Crossref, Pubmed Central, ArXiv et RePec soit plus de 128 millions d’articles. À cela s’ajoutent les données d’auteurs venant d’ORCID, et les articles référencés dans Unpaywall et pour lesquels on a directement accès au texte intégral.

Pour chaque article, on dispose des citations et références si elles sont disponibles.

Comment utiliser Threads pour la recherche et la surveillance de l’information ?

Céline Boileau

Bases no

421

Créé le

samedi 20 janvier 2024

1299

Tags

évaluation outils | médias sociaux | réseaux sociaux

Comment utiliser Threads pour la recherche et la ... Image 1

Threads, le réseau de micro-blogging de Meta, est accessible en France depuis quelques semaines. Le public commence à s’y rendre, y faire sa veille peut-il donc devenir intéressant ?

Threads a été créé par Meta en juillet 2023. Lancé au départ aux États-Unis, il lui a fallu plusieurs mois pour se conformer à la législation européenne. S’il a très vite dépassé les 100 millions d’utilisateurs, laissant croire à une relève assurée de X (ex. Twitter), les chiffres sont aussi très vite retombés et le manque de fonctionnalités essentielles perdure. Le terme Threads désigne ces longs fils de discussions - un post et les commentaires auxquels il donne lieu - apparus pour la première fois sur X.