Liquid AI lance LFM2.5-8B-A1B, un modèle edge optimisé facturé 0,34 dollar par million de tokens pour l'inférence locale. Le tarification cible les entreprises qui déploient sur hardware consumer avec des contraintes de latence.
Comparatif économique pour 100 millions de tokens mensuels : LFM2.5 coûte 34 000 dollars vs 150 000 dollars pour GPT-3.5 Turbo API. L'économie vient du déploiement on-premise qui élimine les frais réseau et SLA cloud.
Cible business : applications financières haute fréquence où chaque milliseconde de latence coûte 2 300 dollars par jour en opportunité de trading.
Newsletter
Cet article t'a intéressé ? Reçois les suivants.
Chaque matin à 8h, les chiffres qui comptent. Gratuit, sans spam.