HomeAPIs ›Groq

API Groq – preços, nível gratuito e como obter uma chave

Groq executa modelos abertos como Llama e Mixtral em seu hardware LPU personalizado, e sua fama é velocidade: centenas de tokens por segundo, muito mais rápido que a inferência típica de GPU. O preço é por token, como todos os outros, mas a latência é o ponto de venda – ideal para chatbots, agentes de voz e qualquer coisa em que os usuários esperem pela resposta. Veja quanto custa e como obter sua chave.

Preços da API Groq (referência, junho de 2026)

ModeloInsira $/1 milhãoSaída $/1 milhãoMelhor para
Lhama 3.3 70B$0.59$0.79Equilíbrio qualidade + velocidade
Lhama 3.1 8B mais barato$0.05$0.08Alto volume, tarefas simples
Mixtral 8x7B$0.24$0.24Mistura barata de especialistas
⚠️ Preços de referência, junho de 2026 – Groq adiciona e retira modelos com frequência e ajusta os preços. Confirmar em groq.com/pricing antes de fazer o orçamento. Os preços são por 1 milhão de tokens; a saída é cobrada separadamente.

→ Estime sua fatura no Calculadora de custos de API de IA ou modele um aplicativo inteiro com o Estimador de custos de aplicativos de IA.

Existe um nível gratuito?

Sim - GroqCloud inclui um nível gratuito com limites generosos de taxa por minuto e por dia, ideais para desenvolvimento e aplicativos de baixo volume sem necessidade de cartão para iniciar. Para o rendimento da produção, você passa para o pagamento sob demanda. Se uma cota gratuita for importante, compare com Google Gêmeos e Mistral, que também oferece níveis gratuitos reais.

Como obter uma chave API Groq (passo a passo)

1. Vá para console.groq.com e crie uma conta.
2. Abra o Chaves de API página e clique Criar chave de API; copie-o uma vez.
3. Use o nível gratuito imediatamente ou adicione cobrança em Configurações → Faturamento para limites mais altos.
4. A API é compatível com OpenAI; a maioria dos SDKs OpenAI funcionam apontando o URL base para Groq.

Teste-o com uma solicitação simples:

# quick test (replace $GROQ_API_KEY)
curl https://api.groq.com/openai/v1/chat/completions \
-H "Autorização: Portador $GROQ_API_KEY" \
-H "Tipo de conteúdo: aplicativo/json" \
-d '{"modelo":"llama-3.1-8b-instant","mensagens":[{"role":"usuário","content":"oi"}]}'

Estime seu custo

Use o Calculadora de custos de API de IA para conectar suas contagens de tokens e volume de solicitações - ele classifica os modelos abertos da Groq em relação ao GPT-4o, Claude, Gemini e DeepSeek, do mais barato ao mais caro para sua carga de trabalho.

Alternativas mais baratas

O Llama 3.1 8B da Groq já está entre os modelos hospedados mais baratos do mundo. Para uma qualidade de fronteira comparativamente barata, DeepSeek-V3 e Mistral pequeno são as comparações óbvias. Se você quiser uma chave em vários provedores e roteamento automático, consulte OpenRouter.

Perguntas frequentes

Por que usar Groq em vez de OpenAI?

Velocidade. Groq atende modelos abertos com tokens por segundo muito altos, para que as respostas pareçam instantâneas – valiosas para chat, voz e loops de agente. Você negocia modelos de fronteira proprietários por latência bruta e baixo custo.

Groq tem um nível gratuito?

Sim – o nível gratuito GroqCloud tem limites de taxa e nenhum custo inicial, bom para testes e uso de baixo volume.

Como obtenho uma chave de API Groq?

Cadastre-se em console.groq.com, abra as chaves de API, crie uma chave, copie-a uma vez e use o nível gratuito ou adicione cobrança.

A API Groq é compatível com OpenAI?

Sim - ele expõe um endpoint de conclusão de bate-papo no estilo OpenAI, portanto, a maioria das bibliotecas de cliente OpenAI funcionam alterando o URL base e a chave.

Não afiliado à Groq. Os preços são estimativas de referência – verifique sempre na página oficial de preços.