DeepSeek 4 Flash tourne désormais en local sur Apple Silicon via le moteur ds4 qui collecte 308 étoiles GitHub. L'outil élimine les 20 dollars mensuels d'API en faisant tourner le modèle directement sur Mac M1/M2/M3.
L'inférence locale atteint 47 tokens par seconde sur MacBook Pro M3, rivalisant avec les API payantes. Les développeurs économisent 240 dollars par an en compute cloud tout en gardant leurs données privées. L'adoption locale menace 30 % des revenus d'inférence selon les estimations de l'écosystème.
Newsletter
Cet article t'a intéressé ? Reçois les suivants.
Chaque matin à 8h, les chiffres qui comptent. Gratuit, sans spam.