IA open source : une opportunité pour le veilleur ?

Céline Boileau

Netsources no

168

publié en

2024.02

2197

Acheter ce no

Le paysage du veilleur

Des outils difficilement identifiables

Il existe néanmoins quelques freins pour que le veilleur puisse en profiter.

Premièrement, ces outils restent difficilement identifiables et utilisables malgré les effets d'annonce. La première raison qui rend difficilement identifiables les outils d’IA open source réside dans la définition même d’une « IA open source », laquelle est trop souvent confondue avec la gratuité. Toutefois, pour l’Open Source Initiative (OSI), l’organisation qui défend « une économie du logiciel dépendant de la vente de prestations et non de celle des licences d’utilisation » l’IA open source doit permettre :
- L’étude du fonctionnement du système et l’inspection de ses composants ;
- L’utilisation de son système à n’importe quelle fin, sans avoir à demander la permission ;
- La modification du système pour changer ses recommandations, prédictions ou décisions afin de l’adapter à ses besoins ;
- Le partage du système avec ou sans modifications, à quelque fin que ce soit.
La deuxième raison qui rend ces outils difficilement identifiables est la difficulté à identifier ce qui est open source dans une IA.

Disons-le franchement, la confusion règne entre les noms des produits/outils (par exemple, un chatbot), des modèles de langage et des algorithmes. Ils ont parfois le même nom alors qu’il s’agit de trois entités distinctes. Le veilleur, en tant qu’utilisateur final, manipule des outils. Ces derniers reposent sur un modèle de langage (LLM), qui lui-même repose sur un algorithme (et un mode d’apprentissage).

Par exemple, chatGPT est un outil (un chatbot) qui fonctionne avec le LLM propriétaire GPT 3.5, qui désigne aussi son algorithme. Gemini est à la fois un chatbot de Google accessible gratuitement, mais aussi le nom de son modèle de langage (LLM) qui n’est pas en open source non plus, ainsi que de son algorithme !

Enfin, certains outils, comme le moteur de recherche Perplexity, reposent sur un modèle mixte. Il a développé son propre modèle mais il utilise aussi Copilot (outil propriétaire de Microsoft) et LLaMA (modèle ouvert de Meta).

Des modèles peu nombreux … mais de qualité

Par ailleurs, malgré une expansion marquée récemment par la success story de Mistral, la startup « française » créée il y a quelques mois et déjà valorisée à deux milliards de dollars pour son modèle de langage open source, cette licence reste minoritaire dans les outils IA du veilleur.

Sur le portail d’outils IA Futurepedia qui recense plus de 5 000 outils (voir notre article en accès libre, Focus IA : notre sélection d’annuaires d’outils IA, Bases N°414 - mai 2023) et dispose d’un filtre Open source, on note cette proportion :

20 générateurs de prompts sur 132 sont en open source
15 générateurs de texte sur 294
0 outil de réécriture sur 28
7 outils de copywriting/aide à la rédaction sur 209
2 outils marketing sur 81

Mais dans la dizaine d’outils consultés, rares sont ceux qui précisent leur modèle de langage !

Cette faible proportion d’outils s’explique par le fait que les modèles de langage accessibles en open source s’adressent davantage aux développeurs qu’aux utilisateurs finaux.

Une autre explication réside sans doute dans le fait que les LLM open source manquent encore de fine tuning, ou ajustement. Or, c’est cette phase finale qui assure un niveau de précision suffisant, pour être exploité par un utilisateur final.

Déjà abonné ? Connectez-vous...

Connexion

Précédent 43 / 343 Suivant

L’intelligence économique commence par une veille intelligente

IA open source : une opportunité pour le veilleur ?

Le paysage du veilleur

Des outils difficilement identifiables

Des modèles peu nombreux … mais de qualité

Menu principal