Groq executa modelos abertos como Llama e Mixtral em seu hardware LPU personalizado, e sua fama é velocidade: centenas de tokens por segundo, muito mais rápido que a inferência típica de GPU. O preço é por token, como todos os outros, mas a latência é o ponto de venda – ideal para chatbots, agentes de voz e qualquer coisa em que os usuários esperem pela resposta. Veja quanto custa e como obter sua chave.
| Modelo | Insira $/1 milhão | Saída $/1 milhão | Melhor para |
|---|---|---|---|
| Lhama 3.3 70B | $0.59 | $0.79 | Equilíbrio qualidade + velocidade |
| Lhama 3.1 8B mais barato | $0.05 | $0.08 | Alto volume, tarefas simples |
| Mixtral 8x7B | $0.24 | $0.24 | Mistura barata de especialistas |
→ Estime sua fatura no Calculadora de custos de API de IA ou modele um aplicativo inteiro com o Estimador de custos de aplicativos de IA.
Sim - GroqCloud inclui um nível gratuito com limites generosos de taxa por minuto e por dia, ideais para desenvolvimento e aplicativos de baixo volume sem necessidade de cartão para iniciar. Para o rendimento da produção, você passa para o pagamento sob demanda. Se uma cota gratuita for importante, compare com Google Gêmeos e Mistral, que também oferece níveis gratuitos reais.
1. Vá para console.groq.com e crie uma conta.
2. Abra o Chaves de API página e clique Criar chave de API; copie-o uma vez.
3. Use o nível gratuito imediatamente ou adicione cobrança em Configurações → Faturamento para limites mais altos.
4. A API é compatível com OpenAI; a maioria dos SDKs OpenAI funcionam apontando o URL base para Groq.
Teste-o com uma solicitação simples:
Use o Calculadora de custos de API de IA para conectar suas contagens de tokens e volume de solicitações - ele classifica os modelos abertos da Groq em relação ao GPT-4o, Claude, Gemini e DeepSeek, do mais barato ao mais caro para sua carga de trabalho.
O Llama 3.1 8B da Groq já está entre os modelos hospedados mais baratos do mundo. Para uma qualidade de fronteira comparativamente barata, DeepSeek-V3 e Mistral pequeno são as comparações óbvias. Se você quiser uma chave em vários provedores e roteamento automático, consulte OpenRouter.
Velocidade. Groq atende modelos abertos com tokens por segundo muito altos, para que as respostas pareçam instantâneas – valiosas para chat, voz e loops de agente. Você negocia modelos de fronteira proprietários por latência bruta e baixo custo.
Sim – o nível gratuito GroqCloud tem limites de taxa e nenhum custo inicial, bom para testes e uso de baixo volume.
Cadastre-se em console.groq.com, abra as chaves de API, crie uma chave, copie-a uma vez e use o nível gratuito ou adicione cobrança.
Sim - ele expõe um endpoint de conclusão de bate-papo no estilo OpenAI, portanto, a maioria das bibliotecas de cliente OpenAI funcionam alterando o URL base e a chave.
Não afiliado à Groq. Os preços são estimativas de referência – verifique sempre na página oficial de preços.