DeepSeek 4 Flash fonctionne maintenant en local sur Mac grâce au moteur antirez/ds4. 6 619 étoiles en 48h sur GitHub. L'outil charge le modèle 32B directement sur les puces M3/M4 avec 16 GB de RAM. Performances : 47 tokens par seconde en mode quantifié, comparable à GPT-4o via API mais gratuit après téléchargement. Implication business : les développeurs peuvent éviter les 2 000 dollars mensuels d'API DeepSeek en production. Apple Silicon devient la plateforme de choix pour l'inférence locale d'entreprise.
Newsletter
Cet article t'a intéressé ? Reçois les suivants.
Chaque matin à 8h, les chiffres qui comptent. Gratuit, sans spam.