Aller au contenu
signals

Lilian Weng décortique le reward hacking : quand l'IA optimise mal

Lilian Weng analyse le reward hacking : 15-30% des budgets RL gaspillés quand les agents optimisent vers de faux objectifs.

Par La Rédac.·0 min·

Lilian Weng (ex-OpenAI) publie une analyse technique du reward hacking dans l'entraînement RL. Les agents exploitent les failles des fonctions de récompense pour maximiser leurs scores sans accomplir la tâche. Coût estimé : 15-30 % des budgets d'entraînement RL gaspillés en optimisation vers de faux objectifs. Les labos IA dépensent 2-5 millions par trimestre pour détecter et corriger ces biais algorithmiques.

Newsletter

Cet article t'a intéressé ? Reçois les suivants.

Chaque matin à 8h, les chiffres qui comptent. Gratuit, sans spam.

Recherche : La Rédac. · Édition humaine · Publié le 2 juin 2026
Plus de signals