Groq exécute des modèles ouverts comme Llama et Mixtral sur son matériel LPU personnalisé, et sa renommée est vitesse: des centaines de jetons par seconde, bien plus rapides que l'inférence GPU classique. Le prix est par jeton, comme pour tout le monde, mais la latence est l'argument de vente : idéal pour les chatbots, les agents vocaux et tout ce pour lequel les utilisateurs attendent une réponse. Voici ce que cela coûte et comment obtenir votre clé.
| Modèle | Entrée $/1M | Production $/1M | Idéal pour |
|---|---|---|---|
| Lama 3.3 70B | $0.59 | $0.79 | Equilibre qualité + rapidité |
| Lama 3.1 8B le moins cher | $0.05 | $0.08 | Volume élevé, tâches simples |
| Mixtral 8x7B | $0.24 | $0.24 | Mélange d'experts bon marché |
→ Estimez votre facture sur le Calculateur de coût de l'API IA ou modélisez une application entière avec le Estimateur du coût des applications d'IA.
Oui - GroqCloud comprend un niveau gratuit avec des limites de débit généreuses par minute et par jour, idéales pour le développement et les applications à faible volume sans carte requise pour démarrer. Pour le débit de production, vous passez au paiement à la demande. Si un quota gratuit est important, comparez-le avec Google Gémeaux et Mistral, qui proposent également de véritables niveaux gratuits.
1. Aller à console.groq.com et créez un compte.
2. Ouvrez le Clés API page et cliquez Créer une clé API; copiez-le une fois.
3. Utilisez le niveau gratuit immédiatement, ou ajoutez une facturation sous Paramètres → Facturation pour des limites plus élevées.
4. L'API est compatible avec OpenAI ; la plupart des SDK OpenAI fonctionnent en pointant l'URL de base vers Groq.
Testez-le avec une simple requête :
Utilisez le Calculateur de coût de l'API IA pour prendre en compte le nombre de vos jetons et le volume de vos demandes : il classe les modèles ouverts de Groq par rapport à GPT-4o, Claude, Gemini et DeepSeek, du moins cher au plus cher pour votre charge de travail.
Le Llama 3.1 8B de Groq fait déjà partie des modèles hébergés les moins chers du monde. Pour une qualité frontalière comparablement bon marché, DeepSeek-V3 et Mistral Petit sont les comparaisons évidentes. Si vous souhaitez une clé pour plusieurs fournisseurs et un routage automatique, voir OuvrirRouter.
Vitesse. Groq propose des modèles ouverts avec un nombre de jetons par seconde très élevé, de sorte que les réponses semblent instantanées, ce qui est précieux pour les boucles de chat, de voix et d'agent. Vous échangez des modèles frontières propriétaires contre une latence brute et un faible coût.
Oui, le niveau gratuit de GroqCloud a des limites de débit et aucun coût initial, idéal pour les tests et une utilisation à faible volume.
Inscrivez-vous sur console.groq.com, ouvrez les clés API, créez une clé, copiez-la une fois et utilisez l'offre gratuite ou ajoutez la facturation.
Oui, il expose un point de terminaison de discussion de style OpenAI, de sorte que la plupart des bibliothèques clientes OpenAI fonctionnent en modifiant l'URL et la clé de base.
Non affilié à Groq. Les prix sont des estimations de référence – vérifiez toujours sur la page de tarification officielle.