Groq betreibt offene Modelle wie Llama und Mixtral auf seiner maßgeschneiderten LPU-Hardware und ist für seinen Ruhm bekannt Geschwindigkeit: Hunderte von Token pro Sekunde, viel schneller als typische GPU-Inferenz. Die Preise gelten wie bei allen anderen Token pro Token, aber die Latenz ist das Verkaufsargument – ideal für Chatbots, Sprachagenten und alles, wo Benutzer auf eine Antwort warten. Hier erfahren Sie, was es kostet und wie Sie Ihren Schlüssel erhalten.
| Modell | Geben Sie 1 Mio. $ ein | Ausgabe $/1 Mio | Am besten für |
|---|---|---|---|
| Lama 3,3 70B | $0.59 | $0.79 | Qualität + Geschwindigkeitsbalance |
| Lama 3.1 8B am günstigsten | $0.05 | $0.08 | Großes Volumen, einfache Aufgaben |
| Mixtral 8x7B | $0.24 | $0.24 | Günstige Mischung aus Experten |
→ Schätzen Sie Ihre Rechnung am KI-API-Kostenrechner oder modellieren Sie eine ganze App mit dem Kostenschätzer für KI-Apps.
Ja - GroqCloud beinhaltet a Kostenlose Stufe mit großzügigen Tariflimits pro Minute und Tag, ideal für die Entwicklung und Anwendungen mit geringem Volumen, für deren Start keine Karte erforderlich ist. Für den Produktionsdurchsatz wechseln Sie zu kostenpflichtigem On-Demand. Wenn ein kostenloses Kontingent wichtig ist, vergleichen Sie mit Google Gemini Und Mistral, die auch echte kostenlose Stufen anbieten.
1. Gehe zu console.groq.com und ein Konto erstellen.
2. Öffnen Sie die API-Schlüssel Seite und klicken Sie API-Schlüssel erstellen; kopiere es einmal.
3. Benutzen Sie die Kostenlose Stufe sofort, oder fügen Sie die Abrechnung unter Einstellungen → Abrechnung für höhere Limits hinzu.
4. Die API ist OpenAI-kompatibel; Die meisten OpenAI-SDKs funktionieren, indem sie die Basis-URL auf Groq verweisen.
Testen Sie es mit einer einfachen Anfrage:
Benutzen Sie die KI-API-Kostenrechner um Ihre Token-Anzahl und das Anforderungsvolumen einzubinden – es ordnet die offenen Modelle von Groq im Vergleich zu GPT-4o, Claude, Gemini und DeepSeek vom günstigsten bis zum teuersten für Ihre Arbeitslast.
Das Llama 3.1 8B von Groq gehört bereits zu den günstigsten gehosteten Modellen überhaupt. Für vergleichsweise günstige Grenzqualität, DeepSeek-V3 Und Mistral Klein sind die offensichtlichen Vergleiche. Wenn Sie einen Schlüssel für viele Anbieter und automatisches Routing wünschen, lesen Sie OpenRouter.
Geschwindigkeit. Groq stellt offene Modelle mit sehr hohen Tokens pro Sekunde bereit, sodass sich Antworten sofort anfühlen – wertvoll für Chat-, Sprach- und Agentenschleifen. Sie tauschen proprietäre Frontier-Modelle gegen reine Latenz und niedrige Kosten.
Ja – das kostenlose Kontingent von GroqCloud hat Ratenbegrenzungen und keine Vorabkosten und eignet sich gut zum Testen und für die Nutzung in geringem Umfang.
Registrieren Sie sich unter console.groq.com, öffnen Sie API Keys, erstellen Sie einen Schlüssel, kopieren Sie ihn einmal und nutzen Sie das kostenlose Kontingent oder fügen Sie die Abrechnung hinzu.
Ja – es stellt einen Chat-Abschlussendpunkt im OpenAI-Stil bereit, sodass die meisten OpenAI-Clientbibliotheken funktionieren, indem sie die Basis-URL und den Schlüssel ändern.
Nicht mit Groq verbunden. Bei den Preisen handelt es sich um Richtwerte – überprüfen Sie diese stets auf der offiziellen Preisseite.