15/07/2025
Décrypter le numérique sur 6 thématiques : découvertes, réflexions et créations de la semaine.
Nous développons une affirmation plus forte : l'équité, au sens rigoureux défini par ces cadres pour une utilisation restreinte, même sur une seule mesure non triviale, est intraitable avec des LLM à usage général.
Leur affirmation peut sembler péremptoire mais leur démonstration est juste. Pour nous, leur démarche est tout aussi pertinente sur les points suivants :
L'équité comme critère d'analyse pose avec clairvoyance les possibilités et limites des LLMs et nous permettent de nous positionner sur ce type d'outil.
Le cadre sociotechnique comme support de cette analyse définit ce que produisent ces LLM, c'est à dire des aliud pas des alter, c'est à dire "objet qui existe pour moi dans une altérité générale en attente d'une identification." (DESCOLA, 2005: 205)
Article en ligne :
Jacy Anthis, Kristian Lum, Michael Ekstrand and others, ‘The Impossibility of Fair LLMs’, 2025 https://arxiv.org/abs/2406.03198
🎯 Les limites de données non-structurées, obsolescentes, multi-contextes et non-composables empêchent d'appliquer ce principe d'équité de manière générale.
Ce problème pourrait ressembler à un jeu de tri mais où il n'y aurait plus qu'une seule entrée dans la boîte, tandis que les pièces, elles, sont toujours diverses.
↪️ Par cette image, vous comprenez de suite qu'il sera plus simple d'adapter le couvercle que les éléments !
Et les piste d'amélioration envisagées vont d'ailleurs dans ce sens, en modifiant l'outil (la boîte) pour mieux tenir compte des données (les pièces) :
Solution 1: Responsabilité des Développeurs
• Standards de transparence obligatoires
• Documentation des données d'entraînement
• Design participatif avec stakeholders
• Audits tiers réguliers
Solution 2: Évaluations Contextuelles
• Abandon des tests génériques
• Focus sur cas d'usage spécifiques
• Connexion préjudices réels
• Métriques adaptées au contexte
Solution 3: Méthodes Évaluatives
• RLHF avec cadres techniques
• LLM-as-a-judge pour équité
• Outils d'interprétabilité participatifs
• IA pour évaluer l'IA (avec prudence)
Leur conclusion amène à plusieurs constats :
REFERENCES
Jacy Anthis, Kristian Lum, Michael Ekstrand and others, ‘The Impossibility of Fair LLMs’, 2025 https://arxiv.org/abs/2406.03198 Philippe Descola, Par-delà nature et culture, Paris, Gallimard, 2005.Un article particulièrement révélateur des tensions et inquiétudes inhérentes au sujet des IA génératives concernant les artistes-auteurs, menée par une enquête journalistique claire et factuelle. On aime.
➡️ Comme le rappelle le philosophe Gilbert SIMONDON, l'objet technique n'est pas déconnecté de son environnement, bien au contraire, il existe toujours dans un réseau complexe dont il transforme à la fois son environnement qui lui-même transforme l'objet technique et avec lequel ce dernier évolue avec les humains.
Cette co-évolution est bien tracée dans cet article qui évite l'écueil de la technique "aliénante" (trop facilement relayée dans les médias), si ce n'est dans la mauvaise application de cette relation par ce constat de "l'engrenage de la déqualification" : cette pratique consiste à traduire les textes générés automatiquement du fait de leur qualité médiocre !
⚠️ L'investissement dans l'implémentation des cas d'usages (juste traduire les intentions de l'auteur, je vous laisse réfléchir à tout ce que cela implique 😰) : les coûts en énergie, en suivi et évaluation (biais d'ancrage), une dépense plus qu'un gain de passer par cette technologie pour ce type de tâche cognitive !
🤔 Pourquoi lire une oeuvre traduite par un modèle LLM, si vous ne pouvez plus exercer votre imagination, votre capacité propre de traduction ? C'est quand même tout ce que vous offre un traducteur humain (monnayant l'achat de l'oeuvre généralement) à travers toutes ses expériences vécues que vous devez à votre tour traduire, en plus de celles de l'auteur.
↪️ Cette pratique du monde singulière dont chacun d'entre nous est porteur : rendez-vous compte (pour revenir à du pratico-pratique) de tout ce qu'il faudrait implementer dans un modèle pour arriver à en esquisser correctement les contours pour une seule personne !
↪️ Les niveaux de lecture ne sont pas uniquement des compétences liées à une grille d'évaluation : lire est une aptitude liée à notre cognition humaine. Nous avons tous un cerveau.
↪️ Cette capacité de l'expérience non-vécue nous l'avons tous, ensuite chacun en fait ce qu'il veut/peut.
⚠️⚠️ Rappelons qu'un modèle mathématique (à la différence d'une loi mathématique) varie selon les données entrées !
🎯 Lire est toujours une proposition. On peut pousser le vice en disant qu'en variant les données ce seront d'autant plus de traductions possibles 😈 ! Mais ce type de représentation (la traduction en est une autre) se base sur une illusion de sens : il ne s'agit pas de choisir ce que me dit l'oeuvre avant de la lire, j'accepte d'abord de lire l'oeuvre de l'auteur et/ou sa traduction, avec laquelle je ne serai peut-être pas d'accord ensuite.
🤔 Quoi comprendre sur ce que je lis, puisque un modèle ne réfléchit pas : sans information sur comment le modèle est construit, comment puis-je évaluer la qualité du contenu ? (Lire aussi notre billet Actualités !)
Limiter le champ d'action de ces outils IA n'est pas les interdire (ce n'est pas ce que demande cette profession) : autrement dit, ce n'est pas parce que vous avez une voiture que cela vous autorise à rouler comme bon vous semble !
Défendre le droit d'auteur en interdisant effectivement l'entraînement des robots linguistiques sur des textes d'auteurs aiderait à reconnaître ce qui relève des automatismes de la réflexion.
Poser des contraintes à ces modèles LLM exige déjà d'accepter de les poser. Tout est encore à faire, mais le droit est bien le cadre qu'il faut pour donner toute sa place à cette innovation et protéger les artistes-auteurs.
Notre relation à l'écrit est bien malmenée et des illusions se créent de toute part : la sincérité est exigeante, cela n'a rien de nouveau, et ne dépend pas d'un élitisme, d'une authenticité de l'oeuvre (les artises de la Renaissance nous prendraient vraiment pour des fous...) ou pire de vérité, mais d'une forme de reconnaissance.
Le modèle LLM n'est pas sincère, il est neutre et il est évident que c'est tout sauf ce que l'on recherche dans une traduction! Clairement, leur artefact est avant tout un aliud : un objet qui existe pour soi dans une altérité générale en attente d'une identification.
Le glissement entre cette reconnaissance et cette identification est tentant mais là encore on tomberait dans une certaine forme de facilité (consummériste) ; les contraintes, les limites sont des gardes-fou : nous percevons des réalités, pas le réel (notre propos n'est pas la physique quantique 😅). Certains pourraient ou voudraient nous le faire croire, danger !
Toute la portée de ces deux références bibilographiques ci-après sont sur cette clairvoyance nécessaire au piège courant de “ce qui est c’est ce qui doit être” : l’outil induit faussement "une connaissance universelle" sur une altérité en devenir.
SIMONDON Gilbert, Du Mode d'existence des objets techniques, Paris, Aubier, 1958 (rééd. 2012).
Une réflexion fondamentale sur la relation entre l'humain et la technique qui éclaire aussi les enjeux de maîtrise et d'aliénation technologique au cœur du débat libre/propriétaire.
DESCOLA Philippe, Par-delà nature et culture, Paris, Gallimard, 2005.
Une anthropologie qui questionne nos catégories de pensée.
Preuve de l'évolution de la communication scientifique, la mise en ligne par ce site de présentation de l'étude de Standford sur l'adoption des agents IA au travail : la possibilité de visualiser directement les résultats de leur audit rend leur propos d'autant plus percutant et confirme tout l'intérêt de ce type de représentation graphique.
A l'heure où le paysage de l'intelligence artificielle est déjà largement dominé par les Big Tech, il nous paraît important de montrer que parallèlement et même conjointement se développent toujours les projets de l'Open-source.
Véritable vivier de nos futurs produits et service numériques, ce domaine professionnel sert très souvent de tremplin aux futures start-up, et maintient aussi des pratiques collaboratives importantes dans le domaine informatique.
La page de Wikipedia Hugging Face décrit notamment comment Clément Delangue, Julien Chaumond et Thomas Wolf ont développé une plateforme collaborative de modèles pré-entraînés et de datasets nécessaires à l'apprentissage automatique, permettant éventuellement, du même coup, l'entraînement de nouveaux modèles.
💪 La force de Hugging Face réside dans sa position de "GitHub du machine learning" - une plateforme neutre où chercheurs et entreprises partagent librement leurs travaux.
La valorisation de Hugging Face (90x les revenus, c'est à dire valoriser à 90 fois ses revenus annulels) reflète son potentiel de croissance énorme, bien que ses revenus actuels (50M$) restent modestes comparés aux solutions cloud établies.
Comme tous services Open-source, gratuits et mis à disposition de tous, cela ne devrait pas enlever l'évaluation avant l'usage : les modèles malveillants existent aussi dans le "monde" de l'apprentissage automatique.
Pour rappel, il s'agit de référentiels de dépôts mais pouvant contenir du code malveillant dans le modèle exploité.
📢 Article qui a relevé ces failles de sécurité : Data Scientists Targeted by Malicious Hugging Face ML Models with Silent Backdoor de la société JFrog, Février 2024
🛡️ Depuis des corrections ont bien été apportées mais cela a permis aussi à cette société (en cybersécurité) de pointer le peu de sécurité encore des modèles d'apprentissage automatique.
L'ecosystème IA est loin d'être stabilisé, la nécessité d'un cadre, des normes de responsabilité des développeurs, de formation des utilisateurs etc. sont des sujets actuels.
Cette article souligne aussi le lien sur une pratique courante dans l'industrie tech : le "bug bounty", c'est à dire la "prime" ou "récompense" pour trouver des bugs.
...et oui cela est un moyen efficace de renforcer la sécurité en mobilisant une communauté mondiale de chercheurs. Moins coûteux qu'une équipe de sécurité interne en permanence, cette pratique permet de découvrir des failles avant qu'elles ne soient exploitées malicieusement.
😂 Dans cette coïncidence amusante, il s'agit bien d'un usage littéral du terme "bounty" ; où rien n'empêche de pratiquer le bug bounty en mangeant des bounty!
Le but est de pouvoir assurer un niveau élévé de sécurité, en testant dans des conditions réelles ; aujourd'hui, des plateformes comme HackerOne, Bugcrowd ou YesWeHack facilitent la mise en relation entre entreprises et chercheurs en sécurité. Des géants comme Google, Facebook, Microsoft ou Apple ont d'ailleurs leurs propres programmes de "bug bounty" très actifs.
C'est ici un processus d'amélioration continue propre au domaine de la cybersécurité.
Finalement, rien de nouveau puisque le "beta perpétuel" ('perpetual beta' en anglais) ou le "produit perpétuellement beta" est devenu un modèle économique à part entière : vous avez déjà dû constater sur des voitures Tesla reçevant des mises à jour OTA ('Over The Air'), des jeux vidéo avec leurs "day one patches", les smartphones qui changent radicalement avec les mises à jour OS, ou même les assistants IA comme vos LLM habituels qui évoluent constamment.
C'est un changement profond du rapport au produit : on n'achète plus un objet fini mais un "service évolutif". Les attentes vis-à-vis des modèles d'apprentissage automatique vont aussi dans cet ordre d'idée orientées plutôt vers une évaluation spécifique liée aux contextes et de manière continue, finalement de la transparence pour créer de la confiance.
Confiante en l'expérience pratique, nous continuons de déconstruire le fonctionnement de notre agent "cognitif" qui s'assemble et de désassemble comme un jeu de Légo.
🎯 Le but est toujours de générer des parcours archéologiques automatisés selon une demande de l'utilisateur.
🤔 Notre version précédente ressemblait surtout à une coquille vide et nous tentons à présent de la "remplir" et pour ce faire, la méthode RAG associée à une base de données vectorielles enrichit le système.
Depuis une interface, l'utilisateur choisit un mode (déductif/abductif/inductif) où l'Agent IA devra décider COMMENT "raisonner" :
L'Agent devient donc le "cerveau" qui comprend ce que veut l'utilisateur et coordonne tous les outils pour produire la meilleure réponse possible. C'est lui qui décide :
C'est un agent logiciel "autonome" (les analogies aident à la compréhension mais peuvent aussi fausser la réalité de ce que font ces objets techniques, le modèle traite uniquement nos données entrées)
Il faut concevoir :
Sans RAG : Le LLM n'a que la demande brute, problème que nous évoquions dans notre précédent billet sur cet Agent IA :Contexte peu en relation avec le graphe
Avec RAG : Le LLM reçoit :
Métadonnées enrichies
➡️ Le LLM peut faire du raisonnement informé plutôt que de "deviner".
⚠️ Ce type d'anthropomorphisme crée de la confusion, il n'y a aucun "raisonnement" dans cet agent logiciel mais une manière de traiter l'information que nous avons identifié par des modes d'inférence.
La nouvelle architecture implémentée reprend donc les bases de la version précédente avec ces nouvelles fonctionnalités.
🚀 En cours de développement...
Avec 'Le Lama déchaîné' d'April comme fil conducteur pédagogique
Pour la plupart d'entre nous, il semble assez évident de reconnaître cette réalité hybride entre libre et propriétaire : l'exemple de Hugging Face (voir billet Culture numérique) est un cas concret de ces frontières de plus en plus floues, entre ce qui apparaît aujourd'hui comme un combat d'arrière-garde tant ces deux "mondes" convergent (Linux dans Windows, contributions open source des GAFAM, etc.)
🔥 Mais cela n'enlève en rien toute l'actualité de savoir défendre un esprit critique et le journal du 'Le Lama déchaîné' offre cette latitude avec un ton acéré, clairement militant, qui peut déplaire.
Toutefois, un contre-pouvoir est toujours bénéfique dans n'importe quel système, si l'on veut qu'il soit pérenne.
Le Lama déchaîné de l'association April symbolise parfaitement l'esprit critique et la liberté de pensée que nous devons cultiver.
↪️ Après soyons pragmatiques, chacun fait au mieux comme il peut ou veut ! ...Alors je vous laisse sur cette info hypra-sourcée avant de passer aux choses concrètes : cultivez son Lama déchaîné intérieur réduirait le vieillissement, vous aurez meilleure mine !
😜 Comme cet animal réputé pour son caractère indépendant et sa capacité à "cracher" sur ce qui ne lui convient pas, nous devons apprendre à questionner, analyser voire rejeter certaines solutions propriétaires, et aussi être en mesure de critiquer les solutions libres.
Objectif : Développer le réflexe de questionnement face aux technologies
Actions concrètes :
Exercice pratique : Comme le lama qui scrute attentivement avant d'agir, prenez 5 minutes par jour pour analyser un outil numérique que vous utilisez.
Objectif : Maîtriser les concepts clés dans un écosystème en transformation
Analogie mécanique - Le libre comme contre-pouvoir : Imaginez deux approches pour réparer votre voiture :
Le logiciel libre fonctionne comme un contre-pouvoir face aux monopoles technologiques. Il restaure votre capacité de choix, de compréhension et d'action.
Concepts essentiels réactualisés :
Nouvelles réalités à intégrer :
Méthode d'apprentissage : et pourquoi pas ne pas organiser des sessions de découverte où chaque participant analyse un exemple concret de coexistence libre/propriétaire, comme le lama qui observe les changements de son environnement.
Objectif : Maîtriser l'art de faire cohabiter libre et propriétaire
Réalité contemporaine : Les frontières entre libre et propriétaire s'estompent progressivement. Microsoft intègre Linux dans Windows (WSL), Google contribue massivement à l'open source, et de nombreuses entreprises adoptent des modèles hybrides. Le Lama déchaîné doit savoir évoluer dans cet écosystème mixte.
Approche pragmatique de coexistence
Niveau débutant - Hybridation douce :
Niveau intermédiaire - Coexistence maîtrisée :
Niveau avancé - Orchestration hybride :
Conseil du lama : Comme l'animal qui s'adapte à différents terrains, apprenez à tirer parti des deux mondes sans compromis sur vos valeurs fondamentales.
Objectif : Créer un écosystème favorable au Libre
Stratégies communautaires :
Activité groupe : Organisez un "Café Libre" mensuel où chacun présente une découverte, comme les lamas qui se regroupent pour échanger.
Objectif : Influencer positivement son écosystème
Leviers d'action :
Dans la sphère personnelle :
Dans la sphère professionnelle :
Dans la sphère citoyenne :
Développer une culture du Libre aujourd'hui n'est plus une question de rupture totale, mais de progression intelligente dans un écosystème en mutation.
Comme Le Lama déchaîné d'April qui s'adapte aux nouveaux territoires tout en préservant son indépendance, nous devons apprendre à faire coexister libre et propriétaire de manière éclairée.
La réalité contemporaine : Les frontières s'estompent. Linux tourne dans Windows, les GAFAM contribuent massivement à l'open source, et les entreprises adoptent des modèles hybrides. Cette évolution ne dilue pas les valeurs du Libre, elle les rend plus accessibles et pragmatiques.
L'esprit critique reste essentiel : Dans ce monde hybride, notre capacité à analyser, questionner et choisir devient encore plus cruciale. Il faut savoir distinguer l'engagement authentique du marketing, comprendre les implications à long terme, et maintenir notre autonomie de décision.
Stratégie d'adaptation : Privilégions une approche progressive et pragmatique. Utilisons les outils libres là où ils excellent, acceptons les solutions propriétaires quand elles sont nécessaires, mais toujours en gardant à l'esprit nos valeurs fondamentales et en préparant les transitions futures.
Le Libre nous offre les outils pour reprendre le contrôle de notre environnement numérique et construire une société plus démocratique et respectueuse des libertés individuelles - même dans un monde où les modèles convergent.
Alors, prêt à déchaîner votre lama hybride ? 🦙⚡🔄
Ce guide est lui-même un exemple de création libre adaptée aux réalités contemporaines : partagez-le, modifiez-le, améliorez-le, et utilisez-le dans vos environnements mixtes !