Does Groq have a free API tier?

Yes. GroqCloud has a free tier with generous rate limits for development and testing, alongside paid on-demand pricing. It's one of the easiest ways to try fast open-model inference without a credit card upfront.

How much does the Groq API cost?

Reference pricing (June 2026): Llama 3.3 70B is around $0.59 input / $0.79 output per million tokens, Llama 3.1 8B around $0.05 / $0.08, and Mixtral around $0.24. Groq bills per token like other providers but is known for very high tokens-per-second speed.

How do I get a Groq API key?

Sign up at console.groq.com, open the API Keys page, create a new key and copy it once. The free tier works immediately within its rate limits; add billing for higher on-demand throughput.

Groq API – Preise, kostenloses Kontingent und wie man einen Schlüssel erhält

Groq betreibt offene Modelle wie Llama und Mixtral auf seiner maßgeschneiderten LPU-Hardware und ist für seinen Ruhm bekannt Geschwindigkeit: Hunderte von Token pro Sekunde, viel schneller als typische GPU-Inferenz. Die Preise gelten wie bei allen anderen Token pro Token, aber die Latenz ist das Verkaufsargument – ideal für Chatbots, Sprachagenten und alles, wo Benutzer auf eine Antwort warten. Hier erfahren Sie, was es kostet und wie Sie Ihren Schlüssel erhalten.

Groq API-Preise (Referenz, Juni 2026)

Modell	Geben Sie 1 Mio. $ ein	Ausgabe $/1 Mio	Am besten für
Lama 3,3 70B	$0.59	$0.79	Qualität + Geschwindigkeitsbalance
Lama 3.1 8B am günstigsten	$0.05	$0.08	Großes Volumen, einfache Aufgaben
Mixtral 8x7B	$0.24	$0.24	Günstige Mischung aus Experten

⚠️ Referenzpreise, Juni 2026 – Groq fügt häufig Modelle hinzu und zieht sie zurück und passt die Preise an. Bestätigen Sie am groq.com/pricing vor der Budgetierung. Die Preise gelten pro 1 Mio. Token; Die Leistung wird gesondert in Rechnung gestellt.

→ Schätzen Sie Ihre Rechnung am KI-API-Kostenrechner oder modellieren Sie eine ganze App mit dem Kostenschätzer für KI-Apps.

Gibt es eine kostenlose Stufe?

Ja - GroqCloud beinhaltet a Kostenlose Stufe mit großzügigen Tariflimits pro Minute und Tag, ideal für die Entwicklung und Anwendungen mit geringem Volumen, für deren Start keine Karte erforderlich ist. Für den Produktionsdurchsatz wechseln Sie zu kostenpflichtigem On-Demand. Wenn ein kostenloses Kontingent wichtig ist, vergleichen Sie mit Google Gemini Und Mistral, die auch echte kostenlose Stufen anbieten.

So erhalten Sie einen Groq-API-Schlüssel (Schritt für Schritt)

1. Gehe zu console.groq.com und ein Konto erstellen.
2. Öffnen Sie die API-Schlüssel Seite und klicken Sie API-Schlüssel erstellen; kopiere es einmal.
3. Benutzen Sie die Kostenlose Stufe sofort, oder fügen Sie die Abrechnung unter Einstellungen → Abrechnung für höhere Limits hinzu.
4. Die API ist OpenAI-kompatibel; Die meisten OpenAI-SDKs funktionieren, indem sie die Basis-URL auf Groq verweisen.

Testen Sie es mit einer einfachen Anfrage:

# quick test (replace $GROQ_API_KEY)
Curl https://api.groq.com/openai/v1/chat/completions \
  -H „Autorisierung: Inhaber $GROQ_API_KEY“ \
  -H „Inhaltstyp: application/json“ \
  -d '{"model": "llama-3.1-8b-instant", "messages":[{"role": "user", "content": "hi"}]}'

Schätzen Sie Ihre Kosten

Benutzen Sie die KI-API-Kostenrechner um Ihre Token-Anzahl und das Anforderungsvolumen einzubinden – es ordnet die offenen Modelle von Groq im Vergleich zu GPT-4o, Claude, Gemini und DeepSeek vom günstigsten bis zum teuersten für Ihre Arbeitslast.

Günstigere Alternativen

Das Llama 3.1 8B von Groq gehört bereits zu den günstigsten gehosteten Modellen überhaupt. Für vergleichsweise günstige Grenzqualität, DeepSeek-V3 Und Mistral Klein sind die offensichtlichen Vergleiche. Wenn Sie einen Schlüssel für viele Anbieter und automatisches Routing wünschen, lesen Sie OpenRouter.

FAQ

Warum Groq anstelle von OpenAI verwenden?

Geschwindigkeit. Groq stellt offene Modelle mit sehr hohen Tokens pro Sekunde bereit, sodass sich Antworten sofort anfühlen – wertvoll für Chat-, Sprach- und Agentenschleifen. Sie tauschen proprietäre Frontier-Modelle gegen reine Latenz und niedrige Kosten.

Hat Groq ein kostenloses Kontingent?

Ja – das kostenlose Kontingent von GroqCloud hat Ratenbegrenzungen und keine Vorabkosten und eignet sich gut zum Testen und für die Nutzung in geringem Umfang.

Wie erhalte ich einen Groq-API-Schlüssel?

Registrieren Sie sich unter console.groq.com, öffnen Sie API Keys, erstellen Sie einen Schlüssel, kopieren Sie ihn einmal und nutzen Sie das kostenlose Kontingent oder fügen Sie die Abrechnung hinzu.

Ist die Groq-API OpenAI-kompatibel?

Ja – es stellt einen Chat-Abschlussendpunkt im OpenAI-Stil bereit, sodass die meisten OpenAI-Clientbibliotheken funktionieren, indem sie die Basis-URL und den Schlüssel ändern.

Nicht mit Groq verbunden. Bei den Preisen handelt es sich um Richtwerte – überprüfen Sie diese stets auf der offiziellen Preisseite.