Sundar Pichai à Google I/O : 190 milliards de CapEx, 3,2 quadrillions de tokens par mois et un OS construit en 12h pour 1 000 $

Sundar Pichai, CEO Google

Pour la keynote Google I/O 2026, Sundar Pichai a livré un état des lieux brutal de la course IA chez Alphabet : 180 à 190 Md$ de CapEx en 2026 (six fois le niveau de 2022), 3,2 quadrillions de tokens traités par mois sur ses services, et un Antigravity capable de construire un OS fonctionnel en 12h pour moins de 1 000 $ d'API. L'angle qui compte pour les opérateurs : Pichai a publiquement chiffré le levier d'arbitrage Flash vs Pro qui peut faire économiser 1 Md$ par an aux gros consommateurs cloud.

La vidéo

L'analyse Skeyli

1. CapEx : 31 → 190 Md$ en quatre ans, la facture infra est multipliée par six

Pichai assume le ramp : « En 2022, on dépensait 31 milliards de CapEx annuels. Cette année, on attend environ six fois ce chiffre : 180 à 190 milliards. » C'est l'investissement le plus violent de l'histoire d'Alphabet, et il est justifié par une thèse simple : qui contrôle le stack complet (silicon → modèles → produits) itère plus vite que les autres. Pour les entrepreneurs, le signal est clair : la course frontière restera concentrée sur 3-4 acteurs capables d'aligner ce niveau de capital. Le marché de la valeur se déplace une couche au-dessus — applications, agents verticaux, intégrations.

2. 3,2 quadrillions de tokens par mois : x330 en deux ans

La courbe d'usage est devenue la vraie métrique : 9,7 trillions de tokens/mois il y a deux ans, 480 trillions l'an dernier, 3,2 quadrillions aujourd'hui. Sept fois plus en douze mois. Côté API, ce sont 19 milliards de tokens par minute, et 375 clients ont chacun traité plus d'1 trillion de tokens sur l'année. Pour les fondateurs, cette donnée permet de calibrer le marché adressable : la consommation explose, mais la marge dépend du modèle utilisé. C'est exactement le point #7.

3. TPU 8e génération : training distribué sur plus d'1 million de TPUs

Google a annoncé sa huitième génération de TPU en double approche : TPU 8t (training, x3 puissance brute vs précédente) et TPU 8i (inference). Avec JAX + Pathways, le training n'est plus contraint par un datacenter unique : Google entraîne désormais sur plus d'1 million de TPUs distribués globalement. C'est le plus gros cluster d'entraînement au monde, et il sort des modèles en semaines au lieu de mois. Bonus efficacité : 2x meilleure performance par watt sur les deux puces.

4. Gemini 3.5 Flash : 4x plus rapide, 12x dans Antigravity, à moitié prix

Gemini 3.5 Flash sort aujourd'hui et bat 3.1 Pro sur quasiment tous les benchmarks, avec un saut majeur sur GDPval (tâches économiques réelles). Le chiffre qui compte : 4x plus rapide que les frontier models concurrents sur les tokens/seconde, et 12x plus rapide dans Antigravity grâce au co-optimisation modèle+harness. Tarif : moins de 50 % du prix des frontier comparables. Pro arrive en juin.

5. Antigravity : un OS construit par 93 subagents en 12h pour moins de 1 000 $

La démo qui a marqué la salle : à partir d'un projet vide, l'équipe Antigravity a demandé aux agents de construire un système d'exploitation fonctionnel. Résultat en 12 heures : 93 subagents travaillant en parallèle, 15 000 requêtes modèle, 2,6 milliards de tokens consommés, moins de 1 000 $ de crédits API. L'OS fait tourner Doom en démo live. Antigravity 2.0 est dispo aujourd'hui, gratuit, avec subagents + hooks + orchestration multi-agents. C'est la preuve la plus concrète du shift "tooling → agents" : ce qui prenait des mois prend des heures.

6. Spark + Universal Cart + AP2 : Google attaque l'agentic commerce avec Amazon, Meta, Stripe et Microsoft

Côté grand public, Gemini Spark est l'agent personnel autonome (tournant sur VM Google Cloud 24/7). Côté commerce, Google déploie trois protocoles : UCP (Universal Commerce Protocol, open-source, équivalent HTTP pour les agents), AP2 (paiements agentiques avec mandats numériques signés), et Universal Cart (panier intelligent inter-marchands). Le casting derrière UCP : Amazon, Meta, Microsoft, Salesforce, Stripe. Quand ces cinq acteurs poussent un même standard, le sujet est sérieux. Lancement US été 2026.

7. L'arbitrage Flash vs Pro : 1 Md$/an d'économies pour les gros clients cloud

Le calcul que Pichai a posé sur scène vaut la peine d'être copié-collé : les top clients Google Cloud traitent ~1 trillion de tokens par jour. S'ils basculent 80 % de leurs workloads des frontier models vers Gemini 3.5 Flash, l'économie annuelle dépasse 1 milliard de dollars. Implication directe pour tout fondateur ou CTO : la prochaine ligne de votre P&L IA n'est pas le choix de modèle premium, c'est le routing intelligent Flash/Pro. Ceux qui n'ont pas encore industrialisé cet arbitrage le paient cher.

Ce qu'il faut retenir pour les entrepreneurs

1. Le mix modèle est devenu un sujet de marge. Si vous tournez à 100 % sur un frontier model premium, vous laissez 50 %+ de marge sur la table. Bench Flash sur vos workloads non-critiques cette semaine.

2. Les protocoles agentiques (UCP, AP2, MCP) ne sont plus du buzz. Amazon + Meta + MS + Stripe + Salesforce alignés sur UCP, c'est le signal d'industrialisation. Si vous faites du e-commerce ou du SaaS marchand, regardez la spec dès maintenant.

3. La barre de productivité dev a bougé. Un OS en 12h pour 1 000 $, ça ne veut pas dire que votre prochaine startup va se coder seule — mais ça veut dire que les équipes qui n'utilisent pas d'orchestration multi-agents en 2026 perdent 5-10x en vitesse.

L'essentiel

Google passe à 190 Md$ de CapEx en 2026 (x6 vs 2022), traite 3,2 quadrillions de tokens/mois, et sort Gemini 3.5 Flash 4x plus rapide à moitié prix. La démo Antigravity (OS construit en 12h pour < 1 000 $) est la preuve la plus crédible que l'orchestration multi-agents est passée du POC à la production. Pour les opérateurs, le vrai sujet n'est plus "quel modèle ?" mais "quel arbitrage de routing ?".

À surveiller

Juin 2026 : sortie Gemini 3.5 Pro (le frontier model qui complète Flash).
Été 2026 : Spark grand public (beta Ultra US la semaine prochaine, puis Workspace + Enterprise).
Été 2026 : Universal Cart + AP2 en production sur Search, Gemini app, puis YouTube et Gmail.
Fin 2026 : Android Halo, le hub agent natif sur mobile.
Adoption UCP : qui rejoint après Amazon/Meta/MS/Stripe/Salesforce ? Apple et Shopify sont les absents notables.

Newsletter

Cet article t'a intéressé ? Reçois les suivants.

Chaque matin à 8h, les chiffres qui comptent. Gratuit, sans spam.