Bases & Netsources - Accueil

L’expertise humaine qui donne du sens à l'IA

LLM : l’alignement éthique, le critère qu’on oublie d’évaluer 

Anne-Marie LIBMANN
Bases no
444
publié en
2026.02
1270
LLM : l’alignement éthique, le critère qu’on oublie ... Image 1
LLM : l’alignement éthique, le critère qu’on oublie ... Image 1

Depuis 2023, les grands modèles de langage sont intégrés dans les workflows quotidiens (recherche, synthèse, rédaction, relation client, développement, formation). Leur diffusion massive fait de l’ alignement éthique * une variable opérationnelle : ce que le modèle accepte ou refuse selon des principes précis. Par exemple, un modèle « équilibrant » les perspectives peut réduire la visibilité de positions minoritaires, sans que l’utilisateur s’en rende compte. L’alignement agit comme un «cadrage» implicite de l’information.

Deux évolutions rendent ces choix lisibles : la publication de documents de gouvernance par plusieurs LLM, et l’affaire Grok de janvier 2026 - plus de 3 millions d’images sexualisées générées en deux semaines, dont environ 23 000 impliquant des mineurs. Ces documents et ces incidents permettent désormais de mesurer l’écart entre les principes affichés et les effets réels.

* L’expression, issue de l’anglais alignment _, désigne la conception d’un système d’IA pour qu’il soit conforme aux valeurs humaines.

Trois logiques d’alignement

Anthropic a structuré son approche autour de la Constitutional AI (CAI). Les principes sont intégrés dès l’entraînement par renforcement (RLAIF) : ils ne filtrent pas seulement les réponses, ils façonnent le modèle . La Constitution publiée en 2026 hiérarchise les priorités - sécurité, éthique, conformité interne, utilité - et pose des interdits absolus (armes de destruction massive, exploitation sexuelle de mineurs, concentration illégitime du pouvoir).

Le modèle est soumis à une exigence stricte de véracité : il ne doit ni énoncer sciemment une fausseté ni induire l’utilisateur en erreur. Il peut en revanche refuser de répondre ou signaler l’absence d’information fiable. Le silence est permis ; la fabrication délibérée d’informations ne l’est pas.

Cet affichage de principes marque un effort de transparence réel, mais laisse subsister des limites : vulnérabilité aux jailbreaks , règles définies en cercle restreint sans consultation externe formalisée. La contradiction la plus vive : via Palantir, Claude opère dans des réseaux classifiés du Pentagone, mais refuse d'en lever les lignes rouges sur les armes autonomes et la surveillance de masse - ce que le Pentagone exige.

Anthropic, arbitre moral autoproclamé

Dario Amodei part du postulat que des systèmes puissants sont inévitables : mieux vaut donc qu’ils soient développés par des acteurs conscients des risques. Mais en intégrant des jugements moraux à grande échelle, Anthropic s’arroge un rôle normatif que nulle institution démocratique ne lui a attribué..

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...