Aller au contenu
signals

Les Transformers n'ont peut-être besoin que de 2 projections au lieu de 3

Étude arXiv : les Transformers pourraient fonctionner avec 2 projections au lieu de 3. Économies d'entraînement de 33%.

Par La Rédac.·0 min·

Une étude systématique remet en question l'architecture QKV des Transformers. Éliminer Query ou Key réduirait les coûts d'entraînement de 33% sans perte de performance.

Cette découverte pourrait révolutionner l'économie des LLMs. OpenAI et Anthropic pourraient diviser par 3 leurs factures GPU en réarchitecturant leurs modèles futurs.

Newsletter

Cet article t'a intéressé ? Reçois les suivants.

Chaque matin à 8h, les chiffres qui comptent. Gratuit, sans spam.

Recherche : La Rédac. · Édition humaine · Publié le 5 juin 2026
Plus de signals