La concurrence féroce entre les modèles d’IA n’a pas ralenti cet été, avec la poursuite des annonces de nouvelles versions commerciales et open source, et progrès en matière de traitement vocal, visuel et textuel. Parmi ces innovations, nous avons identifié certaines fonctionnalités et nouveautés dont certaines ont un impact sur nos pratiques de l’IA générative.
Anthropic vient d’annoncer la disponibilité d’une nouvelle fonctionnalité sur toutes les versions du modèle, tant payantes que gratuites (bien que beaucoup plus limitées).
Cette fonctionnalité permet de générer et d’afficher de façon interactive les réponses du chatbot dans une fenêtre distincte de la conversation principale. Il est important de noter que le terme « artefacts », sans définition très précise, est également utilisé pour désigner le contenu produit par le modèle (textes, visualisations, interfaces, etc.).
À l’arrivée de ChatGPT, nous avons vu fleurir sur le web et les réseaux sociaux une quantité de conseils sur l’art subtil de la formulation des prompts. On a vu également émerger une multitude d’outils et de bibliothèques de prompts prêts à l’emploi, souvent payants, adaptés à divers secteurs et types de questions (cf. FOCUS IA : maîtriser et gérer ses prompts - BASES no421- Janvier 2024). Cette révolution IA a même donné naissance à un nouveau métier : le prompt engineering, qui semble se professionnaliser de plus en plus.
Rappelons au passage qu’un prompt (ensemble d’instructions ou encore d’invites) est adressé à un modèle de langage (LLM) via une interface utilisateur, qui peut prendre la forme d’un chatbot (interface conversationnelle) pour générer des réponses ou des contenus spécifiques. Par exemple, Open AI a développé le modèle GPT (avec ses déjà nombreuses versions) et a mis à disposition des utilisateurs le chatbot ChatGPT.
Ces conseils et outils se concentrent principalement autour de ChatGPT, ce qui ne surprend pas au regard de la large et rapide démocratisation de l’IA générative qu’OpenAI a su orchestrer : il était urgent de fournir un « mode d’emploi » pour utiliser efficacement ce chatbot.
Cependant, une question fondamentale demeure : peut-on utiliser les mêmes prompts pour tous les modèles d’IA établis sur le marché (outre GPT : Gemini, Claude, Mistral, Llama principalement) ? Par exemple, Claude répond-il de manière aussi satisfaisante à un prompt conçu pour ChatGPT ?
Perplexity se définit comme un «moteur de réponses» innovant, combinant les fonctionnalités d’un moteur de recherche traditionnel avec celles d’un agent conversationnel alimenté par l’IA : une sorte d’hybride entre ChatGPT et Google Search.
Son ambition affichée est de concurrencer Google sur le marché de la recherche en ligne, en proposant une approche radicalement différente : plutôt que de fournir une simple liste de liens, Perplexity génère des réponses textuelles rédigées en s’appuyant sur des sources d’information récentes, variées et toujours indiquées en référence par l’outil.
La start-up californienne fondée en 2022 par un ancien d’Open AI, a rapidement attiré l’attention des investisseurs, atteignant une valorisation d’un milliard de dollars en 2024.
Le nom «Perplexity AI» fait référence à la notion de perplexité en théorie de l’information, qui mesure l’incertitude, mais il est utilisé ici de manière inverse. L’objectif de Perplexity AI est de réduire l’incertitude (ou la perplexité) des utilisateurs en fournissant des réponses claires et précises, transformant ainsi la haute perplexité en basse perplexité dans le domaine de la recherche d’information.
Pour fonctionner, Perplexity extrait les données d’internet au moment où la question lui est posée, de sorte que les réponses sont réputées être toujours à jour. Il s’appuie ensuite sur plusieurs modèles de langage, le sien propre mais aussi celui d’OpenAI, le modèle open source Llama de Meta ou encore Claude 3, pour produire ses réponses. De plus, il propose des questions connexes à la requête initiale (rappelant un peu les requêtes suggérées de Google), permettant ainsi d’affiner progressivement la recherche.
L’accès peut se faire sans obligation de créer un compte, via le site web de l’application ou une application mobile, avec fonction de recherche vocale disponible sur iPhone. Il existe enfin une extension Chrome qui permet d’y accéder à partir de n’importe quelle page web, de lui faire résumer la page ou répondre à des questions sur ce qu’elle contient.
Voici un peu plus d’un an que le brevet européen à effet unitaire est entré en vigueur, le 1er juin 2023, après plusieurs dizaines d’années d’âpres discussions. Cette arrivée représente un changement majeur pour l’ensemble des déposants de brevets, et pas seulement en Europe. Elle implique une nouvelle procédure, de nouvelles actions et dates, d’autant plus qu’y est associé un nouveau tribunal, la Juridiction Unifiée des Brevets. Nécessairement, tous ces nouveaux évènements doivent apparaître dans les bases de données. Comment ? C’est ce que nous allons voir.
Le brevet européen à effet unitaire est né sur des fondations : le brevet européen classique.
Valoriser une invention par un dépôt de demande de brevet dans son pays, la France par exemple, c’est bien, mais les produits créés par nos entreprises ayant rarement un marché uniquement en France, il peut être sage d’étendre le dépôt de demande de brevet national par des dépôts à l’étranger, générant une famille de brevets qui sera constituée de l’ensemble des titres valorisant une même invention dans plusieurs pays.
Si votre marché se trouve dans plusieurs pays - France, Allemagne, Espagne… - il est nécessaire d’effectuer un dépôt auprès des offices de chacun de ces pays, dans des langues différentes, initiant des procédures qui risquent de ne pas avancer à la même vitesse, générant un ensemble difficile à gérer, et coûteux.
Pour remédier à cet inconvénient, a été mis en place en 1973 le brevet européen classique, qui n’est pas un brevet de l’Union européenne.
« Publish or Perish » est une expression très courante dans les milieux universitaires et de la recherche.
Elle signifie que sans un flux suffisant d’articles publiés dans de « bonnes revues », la carrière d’un chercheur est sérieusement compromise.
Cette préoccupation des chercheurs concernant la publication de leurs articles est une constante dans une carrière et elle est très souvent évoquée, en particulier dans le milieu de la recherche. Elle fait souvent aussi l’objet de polémiques.
L’expression « Publish or Perish » est, en effet, très fréquemment utilisée, et ce, depuis longtemps, si l’on en juge par le nombre de réponses affichées par Google, à savoir 964 000, même si l’on sait que l’on ne pourra pas toutes les visualiser. Le serveur Dialog quant à lui annonce que 19 400 documents contiennent l’expression, documents que l’on peut, en théorie, effectivement visualiser.
Peu d’expressions couramment employées, surtout dans le milieu professionnel, en particulier si elles sont quelque peu polémiques, deviennent le prétexte d’un jeu de société. C’est pourtant ce qui est en train d’arriver avec cette expression. En effet, d’après la publication bien connue NATURE, un psychosociologue américain du nom de Max BAI a lancé en bêta un jeu s’appelant « The Publish or Perish game ».
Ce jeu de société centré sur la publication académique — ce qui est très original — ressemble au bien connu et historique Monopoly, à ceci près que le vainqueur est celui qui a obtenu le plus grand nombre de citations d’articles qu’il a publiés. Mais tout cela se passe de façon caricaturale, le plagiat étant possible, voire encouragé, de même que le sabotage des actions des chercheurs concurrents au moyen de dénigrement ou en leur faisant subir des restrictions budgétaires.
Nous ne résistons pas au plaisir de citer les titres de certains de ces articles improbables :
« Unpacking the Aerodynamics of Flying Pigs », « Why Dogs Follow You Into the Bathroom: Insights into Canine Codependency » ou encore « The economics of Santa Claus: an analysis of infinite resource management ».
Ce jeu peut tout à fait séduire le grand public, mais les éléments satiriques auront une résonance particulière pour ceux qui auront passé suffisamment de temps dans le milieu universitaire.
D’après l’article de Nature dans lequel nous avons trouvé cette information, le jeu sera en vente dans quelques mois sur la plateforme Kickstarter. Pour être informé du lancement effectif du jeu, vous pouvez vous inscrire ici.
Fulltext Sources Online recense depuis de très nombreuses années les publications du monde entier disponibles en texte intégral sur au moins un agrégateur, parmi les 17 qu’il prend en compte.
Il n’y a plus qu’une édition annuelle au lieu de deux précédemment, mais il y a une version en ligne librement recherchable, les détails des publications étant réservées aux abonnés.
Un total de 64 636 publications sont recensées dont 467 françaises (BASES et NETSOURCES en font partie), mais 1 928 en français, tandis qu’il y a une publication en occitan et trois en islandais.
Sans surprise, pour les titres en français, plus de 80 commencent par Journal, plus de 70 par Revue, 28 par ECHO ou L’Echo, 17 par La Lettre, etc.
On notera l’absence d’agrégateurs de presse européens tels que ADAY pour la France, GBI Genios pour l’Allemagne, Swissdox pour la Suisse et Belga pour la Belgique.
Leur prise en compte aurait conduit à largement dépasser le nombre actuel de publications recensée.
La société allemande DEEPL, un des acteurs majeurs de la traduction automatique, annonce qu’il va surpasser ses concurrents que sont Google Translate et ChatGPT.
Cela devrait se faire grâce à son dernier modèle de langage LLM.
En effet, ce nouvel LLM ne s’appuie pas, pour s’entrainer, sur des données d’Internet en général, mais sur son propre jeu de données propriétaires sélectionnées et adaptées à la création de contenu et à la traduction linguistique.
Il prétend donc qu’il sera meilleur que Google Translate qui rencontre des problèmes de traduction littérale ou incorrecte.
Quant à ChatGPT, son offre de traduction automatique serait secondaire par rapport à l’ensemble de son offre alors que "DeepL est très spécialisé, ce qui est particulièrement utile dans des domaines exigeant une haute précision ». Bref, il sera meilleur là aussi.
Ces améliorations devraient faire gagner en temps et en efficacité, car il y aura moins de temps consacré à la vérification et à la correction.
Loin de vouloir concurrencer les traducteurs professionnels il se positionne comme leur « allié indispensable », une affirmation qui peut laisser songeur...
Google intensifie sa politique de diversité linguistique en annonçant l'ajout de huit nouvelles langues aux options de traduction de ses résultats de recherche, portant le total à 21. Parmi les langues ajoutées figurent l'arabe, le gujarati (une langue indienne), le coréen, le persan, le thaï, l'ourdou (parlé en Inde et au Pakistan), et le vietnamien.
Par ailleurs, Google Translate s'enrichit considérablement avec l'introduction de 110 nouvelles langues, y compris des langues régionales de France telles que le breton et l'occitan.
Les langues africaines sont également mises à l'honneur, un quart des nouvelles langues étant parlées sur le continent africain, comme le wolof, le fon, le kikongo.
Par ailleurs, on notera le tibétain et le cantonais, principal dialecte chinois depuis longtemps réclamé. Ces ajouts permettent à Google Translate de toucher plus de 614 millions de personnes supplémentaires.
Cette initiative s'inscrit dans le cadre du projet ambitieux lancé en 2022 visant à traduire les 1 000 langues les plus parlées à travers le monde.
En outre, Google améliore la reconnaissance vocale en apprenant à comprendre une multitude d'accents issus de diverses langues, renforçant ainsi son accessibilité et sa pertinence à l'échelle mondiale.
Nous signalons ici un post très intéressant sur le site de CLARIVATE : “'Sleeping beauties’: Yesterday’s findings fuel today’s research breakthroughs”
Valentin Bogorov, l’auteur, explique en se basant sur de nombreux exemples que l’art antérieur récent ou les connaissances les plus récentes ne sont pas nécessairement les plus intéressantes à prendre en compte dans la recherche.
Les exemples qu’il cite proviennent de domaines très différents. Il illustre son propos avec l’évolution des citations d’un article publié en 1948 intitulé “An Approach Toward a Rational Classification of Climate” écrit par Charles W. Thornthwaite, un éminent géographe et climatologue américain qui a peu retenu l’attention jusqu’à l’année 2 000. À aujourd’hui, il a été cité plus de 5 900 fois par des chercheurs de 143 pays, sachant que plus de 90 % des citations sont postérieures à l’an 2000.
CLARIVATE est l’éditeur du Journal Citation Reports. Il produit le facteur d’impact (Impact Factor) qui est calculé par une formule qui prend en compte le nombre de citations des articles d’une publication.
Bien qu’il soit controversé, le facteur d’impact est l’indicateur de la notoriété d’une publication le plus utilisé actuellement. Il contribue, en particulier, à évaluer la qualité du travail des chercheurs.
Pour l’édition 2024, 17 publications ont perdu leur facteur d’impact à cause d’une suspicion de manipulation des citations. Il leur est reproché, en particulier, d’avoir abusé des autocitations.
Grâce à La licence Creative Commons CCBY 4.0, l’OCDE adopte un modèle libre d’accès. Le site offre un catalogue de près de 30 000 éléments consultables, téléchargeables et partageables.
Notre article sur SCOPUS AI paru dans le numéro 425 (Mai 2024) de BASES a été publié en anglais parmi les « featured articles » sur la plateforme de l’éditeur américain Information TODAY.
Cette solution d’IA générative permet d’interagir avec la base de données juridique de LexisNexis et ses contenus exclusifs. Elle fournit des liens directs vers les sources citées dans les réponses, permettant ainsi de réduire le risque de sources inventées.
Cela ne concerne cependant pas tous les articles, sans que l’on sache quel est le critère.
Rand Fishkin est cofondateur et CEO de SparkTORO qui propose des logiciels dans le domaine de l’analyse des audiences.
Il vient de publier un article faisant apparaître qu’environ 37% des recherches menées sur Google ne sont suivies d’aucun clic, ce résultat étant valable aussi bien aux Etats-Unis qu'en Europe.