Groq はカスタム LPU ハードウェア上で Llama や Mixtral などのオープン モデルを実行しており、その名声は次のとおりです。 スピード: 1 秒あたり数百のトークン。一般的な GPU 推論よりもはるかに高速です。価格は他のものと同様にトークンごとですが、待ち時間がセールスポイントであり、チャットボット、音声エージェント、およびユーザーが応答を待つあらゆる用途に最適です。費用と鍵の入手方法は次のとおりです。
| モデル | $/1M を入力 | 出力 $/1M | こんな方に最適 |
|---|---|---|---|
| ラマ 3.3 70B | $0.59 | $0.79 | 品質とスピードのバランス |
| ラマ 3.1 8B 最安 | $0.05 | $0.08 | 大量の単純なタスク |
| ミストラル 8x7B | $0.24 | $0.24 | 安価な専門家の混合 |
→ 請求書を見積もる AI API コスト計算ツール または、アプリ全体をモデル化します。 AI アプリのコスト見積りツール.
はい - グロククラウド が含まれています 無料枠 1 分あたりと 1 日あたりのレート制限が寛大で、カードを起動する必要がない開発や少量のアプリに最適です。実稼働スループットについては、有料のオンデマンドに移行します。無料割り当てが重要な場合は、以下と比較してください Google ジェミニ そして ミストラル、実質の無料枠も提供されます。
1. に行く console.groq.com そしてアカウントを作成します。
2. を開きます。 APIキー ページをクリックして APIキーの作成;一度コピーしてください。
3. を使用します。 無料枠 すぐに請求を追加するか、[設定] → [請求] で制限を引き上げて請求を追加します。
4. API は OpenAI と互換性があります。ほとんどの OpenAI SDK は、ベース URL を Groq に指定することで機能します。
簡単なリクエストでテストします。
を使用します。 AI API コスト計算ツール トークン数とリクエスト量を入力します。Groq のオープン モデルを、GPT-4o、Claude、Gemini、DeepSeek に対して、ワークロードに応じて安いものから最も高価なものまでランク付けします。
Groq の Llama 3.1 8B は、すでにどこでも最も安価なホスト型モデルの 1 つです。比較的安価なフロンティアっぽい品質で、 DeepSeek-V3 そして ミストラル スモール は明らかな比較です。多くのプロバイダーと自動ルーティングにわたって 1 つのキーが必要な場合は、次を参照してください。 オープンルーター.
スピード。 Groq はオープン モデルを非常に高いトークン/秒で提供するため、応答が即座に感じられ、チャット、音声、エージェント ループにとって価値があります。独自のフロンティア モデルと引き換えに、生のレイテンシと低コストを得ることができます。
はい。GroqCloud の無料枠にはレート制限があり、前払い料金はかからないため、テストや少量の使用に適しています。
console.groq.com でサインアップし、API キーを開いてキーを作成し、それを一度コピーして、無料枠を使用するか、課金を追加します。
はい - OpenAI スタイルのチャット完了エンドポイントを公開するため、ほとんどの OpenAI クライアント ライブラリはベース URL とキーを変更することで機能します。
Groqとは関係ありません。価格は参考見積りです。必ず公式の価格ページでご確認ください。