Notebookcheck Logo

Vous formez l'IA gratuitement - et elle ne vous remercie même pas

Vous formez l'IA gratuitement à chaque demande. Robot humanoïde générique en photo. (Source de l'image : Vjulien Tromeur - Unsplash)
Vous formez l'IA gratuitement à chaque demande. Robot humanoïde générique en photo. (Source de l'image : Vjulien Tromeur - Unsplash)
Vous formez l'IA gratuitement avec chaque demande, chaque clic et chaque CAPTCHA. Voici comment les commentaires humains alimentent des modèles d'une valeur d'un milliard de dollars... sans aucun remerciement.
Avis par Darryl Linington
Les points de vue, pensées et opinions exprimés dans le texte n'appartiennent qu'à l'auteur.

Vous n'avez jamais eu l'impression que votre ChatGPT de fin de soirée faisait plus pour la Silicon Valley que votre propre productivité due à l'insomnie ? C'est parce que c'est le cas. Si vous utilisez des outils d'IA gratuits, félicitations, vous avez été enrôlé dans une force de travail mondiale non rémunérée, et personne n'a même pris la peine de vous offrir une tasse de courtoisie.

Comment cela fonctionne-t-il réellement (oui, vous en faites partie) ?

Tirons le rideau. La plupart des chatbots IA gratuits, comme ChatGPT, Claude et Gemini, utilisent des modèles qui s'améliorent grâce à ce que l'on appelle l'apprentissage par renforcement à partir du feedback humain (Reinforcement Learning from Human Feedback - RLHF). Cela semble compliqué, mais voici la version la plus simple :

Vous posez une question. L'IA y répond. Vous l'évaluez en lui donnant un pouce vers le haut ou vers le bas. Vous préférez peut-être une réponse plutôt qu'une autre. Félicitations... vous venez d'entraîner le modèle. Vos préférences sont enregistrées et analysées, et le modèle finit par s'adapter pour être plus "utile"

Ces outils ne se contentent pas de vivre dans le nuage pour le plaisir. Ils apprennent de vous. En fait, vous ne faites pas que chatter, vous êtes un annotateur de données très abordable (c'est-à-dire non rémunéré).

Oui, même les utilisateurs payants aident à former les robots

Vous pensez avoir échappé à l'usine à données en payant pour GPT-4 ? Détrompez-vous. À moins que vous ne vous soyez explicitement désengagé dans les paramètres de votre ChatGPT, vos interactions sont toujours utilisées pour affiner le comportement de l'IA. C'est exact. Vous payez 20 dollars par mois pour contribuer au développement du produit. À grande échelle. Sans royalties. Un bon tour de passe-passe, non ?

OpenAI, par exemple, utilise les conversations des utilisateurs gratuits et payants pour améliorer ses modèles, à moins que vous ne désactiviez "l'historique des conversations" Gemini de Google ? Même chose. Claude, d'Anthropic ? Il recueille également les préférences pour améliorer ses modèles d'alignement.

RLHF, ce n'est pas que de la magie technique... C'est un tapis roulant humain

Derrière chaque acronyme fantaisiste comme RLHF se cache un processus très réel et très humain. Des contractants sont engagés pour classer les réponses, signaler les hallucinations et classifier les messages-guides.

Des entreprises comme Sama (autrefois liée à OpenAI), Surge AI et Scale AI fournissent cette main-d'œuvre, souvent par l'intermédiaire d'entrepreneurs mal payés travaillant de longues heures, souvent dans les pays en développement. En 2023, des rapports ont confirmé que les étiqueteurs de la RLHF gagnaient entre 2 et 15 dollars de l'heure, selon la région et le rôle. Donc, oui, de vraies personnes cliquent encore et encore sur "cette réponse est meilleure". Et c'est cette boucle de rétroaction qui alimente les robots.

Si vous fournissez le même type de retour d'information par le biais de pouces en l'air, vous faites en quelque sorte une mini version de leur travail... gratuitement.

Comment ce retour d'information est-il utilisé ?

C'est là que les choses deviennent intéressantes. Votre feedback n'entraîne pas directement le modèle principal. Il alimente les modèles de récompense, des systèmes plus petits qui indiquent à l'IA principale comment se comporter. Ainsi, lorsque vous dites "Je préfère cette réponse", vous participez à la construction de la boussole interne que suit le modèle principal. Lorsque suffisamment de personnes le font, l'IA commence à se sentir plus humaine, plus polie, plus serviable... ou à ressembler davantage à un chroniqueur ayant des problèmes de limites.

Qu'en est-il de votre style d'écriture ?

L'IA se souvient du ton. Lorsque vous interagissez régulièrement avec elle dans un certain style (sarcastique, académique ou brutal), le système apprend à répondre de la même manière. Il ne s'agit pas de voler votre voix et de la vendre à d'autres (pour l'instant), mais vos habitudes font partie de l'expérience collective de formation, en particulier si le robot constate que d'autres personnes apprécient votre phraséologie ou votre ton.

Il s'agit moins de vous cloner que de reproduire ce qui fonctionne. Et ce qui fonctionne vient souvent de quelqu'un qui n'a jamais consenti à la reproduction du style.

Les CAPTCHA ne sont plus réservés aux robots

Oh, et ces puzzles CAPTCHA que vous résolvez pour prouver que vous êtes humain ? Vous ne vous contentez pas de cliquer sur des feux de circulation et des passages piétons pour accéder à votre messagerie. Vous étiquetez des données pour des modèles d'apprentissage automatique. ReCAPTCHA de Google, hCaptcha et Turnstile de Cloudflare alimentent tous les pipelines d'apprentissage en données visuelles, aidant les IA à voir le monde un panneau de signalisation flou à la fois.

Oui, même votre vérification de sécurité fait désormais partie de l'économie du retour d'information.

Des milliards de valeur... Reconnaissance nulle

Il ne s'agit pas d'une conspiration marginale. Le marché des données de formation est en plein essor. Selon MarketsandMarkets, la taille du marché mondial des données de formation devrait passer de 1,5 milliard de dollars en 2023 à plus de 4,6 milliards de dollars en 2030. Et bien que ce chiffre comprenne des données synthétiques et des ensembles de données curatées, la valeur des données réelles étiquetées par des humains, c'est-à-dire celles que vous fournissez tous les jours, est en train de grimper.

Pourtant, la plupart des utilisateurs pensent encore que leur conversation avec le chatbot disparaît dans l'éther. Spoiler : ce n'est pas le cas. À moins que vous n'ayez explicitement désactivé l'enregistrement (et même dans ce cas... faites confiance, mais vérifiez).

Dernière réflexion : Vous n'êtes pas paranoïaque... vous êtes simplement impliqué

C'est là que le bât blesse. Vous participez à la construction de ce qui pourrait un jour remplacer votre emploi, dépasser votre créativité ou transformer vos tweets en échantillons de produits. Cela ne signifie pas que vous devez cesser d'utiliser l'IA, mais vous devez savoir à quoi vous contribuez. Et peut-être, juste peut-être, demander un peu de transparence en retour.

Après tout, si votre travail gratuit est suffisamment bon pour façonner la prochaine génération de modèles d'IA d'une valeur d'un milliard de dollars, le moins qu'ils puissent faire est de vous remercier.

Source(s)

Recherche et expérience propres

AI Training Dataset Market Share, Forecast | Analyse de la croissance et rapport sur les tendances [2032]

Source de l'image : Vjulien Tromeur - Unsplash

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2025 07 > Vous formez l'IA gratuitement - et elle ne vous remercie même pas
Darryl Linington, 2025-07-22 (Update: 2025-07-22)