公開日 2026-06-12 · 参考価格、予算を立てる前に確認してください
「どの AI API が一番安いですか?」ワークロードを修正するまで答えはありません。それで私たちはそうしました。すべての主要モデルで同じ作業が行われます。 1,000,000 件のリクエスト、それぞれ 1,000 入力トークン そして 500 出力トークン (典型的な短いチャットボットまたは生成呼び出し)。これは、10 億の入力トークンと 5 億の出力トークンに相当します。各プロバイダーの料金は次のとおりです。
| モデル | 100 万ドルあたり | アウト $/100 万 | 100万リクエストのコスト |
|---|---|---|---|
| ジェミニ 2.0 フラッシュ 最安 | $0.10 | $0.40 | $300 |
| GPT-4oミニ | $0.15 | $0.60 | $450 |
| DeepSeek-V3 | $0.27 | $1.10 | $820 |
| ジェミニ 2.5 フラッシュ | $0.30 | $2.50 | $1,550 |
| クロード俳句 3.5 | $0.80 | $4.00 | $2,800 |
| GPT-4o | $2.50 | $10.00 | $7,500 |
| クロード・ソネット 4 | $3.00 | $15.00 | $10,500 |
同じ仕事量。 Gemini 2.0 Flash で $300、Claude Sonnet 4 で $10,500 — スプレッド35倍 まったく同じ数のリクエストに対して。どのモデルを選択するかが、AI の請求額に大きく影響します。
正直な比較には注意が必要です。2 回の試行が必要な、または長い回答を書く必要がある安価なモデルは、一度で成功する高価なモデルよりもコストが高くなる可能性があります。品質は重要です。ほとんどのチームがたどり着く賢いパターンは次のとおりです。 階層化: 日常的な大量通話用の安価なモデル (Gemini Flash、GPT-4o mini、DeepSeek) と、ハードなリクエストのみ用のフロンティア モデル (GPT-4o、Claude Sonnet) です。トラフィックの 20% をフロンティア モデルに送信したとしても、この表の最安値に近くなります。
モデルを選択したら、次の 2 つのことが重要になります。 出力長さ (ここでは、出力はすべてのプロバイダーで入力の 4 ~ 5 倍の料金が請求されます。上限を設けます) プロンプトキャッシュ (OpenAI、Anthropic、DeepSeek では、繰り返しのコンテキストが大幅な割引で請求されます)。システムプロンプトをトリミングし、キャップを付けます max_tokens、繰り返されるものをキャッシュします。
あなたのトークンは私たちのものではありません。実際の入出力の長さとボリュームを AI API コスト計算ツール — すべてのモデルをランク付けします あなたの 数字。何か具体的なものを構築しますか?を使用します。 AI アプリのコスト見積りツール、 チャットボットのコスト計算ツール または RAG コスト計算ツール。モデルごとの詳細: GPT-4o, クロード, ジェミニ, ディープシーク.
AI API コスト計算ツールを開く → · OpenAI vs クロード vs ジェミニ →
参考価格(2026年6月)。予算を立てる前に、各プロバイダーの料金ページを確認してください。どのプロバイダとも提携していません。