HomeBlog › 100 万リクエストで最も安価な AI API

2026 年に最も安価な AI API — 100 万リクエスト時の実質コスト

公開日 2026-06-12 · 参考価格、予算を立てる前に確認してください

「どの AI API が一番安いですか?」ワークロードを修正するまで答えはありません。それで私たちはそうしました。すべての主要モデルで同じ作業が行われます。 1,000,000 件のリクエスト、それぞれ 1,000 入力トークン そして 500 出力トークン (典型的な短いチャットボットまたは生成呼び出し)。これは、10 億の入力トークンと 5 億の出力トークンに相当します。各プロバイダーの料金は次のとおりです。

数字

モデル100 万ドルあたりアウト $/100 万100万リクエストのコスト
ジェミニ 2.0 フラッシュ 最安$0.10$0.40$300
GPT-4oミニ$0.15$0.60$450
DeepSeek-V3$0.27$1.10$820
ジェミニ 2.5 フラッシュ$0.30$2.50$1,550
クロード俳句 3.5$0.80$4.00$2,800
GPT-4o$2.50$10.00$7,500
クロード・ソネット 4$3.00$15.00$10,500

同じ仕事量。 Gemini 2.0 Flash で $300、Claude Sonnet 4 で $10,500スプレッド35倍 まったく同じ数のリクエストに対して。どのモデルを選択するかが、AI の請求額に大きく影響します。

しかし、最安が常に正しいとは限りません

正直な比較には注意が必要です。2 回の試行が必要な、または長い回答を書く必要がある安価なモデルは、一度で成功する高価なモデルよりもコストが高くなる可能性があります。品質は重要です。ほとんどのチームがたどり着く賢いパターンは次のとおりです。 階層化: 日常的な大量通話用の安価なモデル (Gemini Flash、GPT-4o mini、DeepSeek) と、ハードなリクエストのみ用のフロンティア モデル (GPT-4o、Claude Sonnet) です。トラフィックの 20% をフロンティア モデルに送信したとしても、この表の最安値に近くなります。

他のレバー

モデルを選択したら、次の 2 つのことが重要になります。 出力長さ (ここでは、出力はすべてのプロバイダーで入力の 4 ~ 5 倍の料金が請求されます。上限を設けます) プロンプトキャッシュ (OpenAI、Anthropic、DeepSeek では、繰り返しのコンテキストが大幅な割引で請求されます)。システムプロンプトをトリミングし、キャップを付けます max_tokens、繰り返されるものをキャッシュします。

実際のワークロードの価格を設定する

あなたのトークンは私たちのものではありません。実際の入出力の長さとボリュームを AI API コスト計算ツール — すべてのモデルをランク付けします あなたの 数字。何か具体的なものを構築しますか?を使用します。 AI アプリのコスト見積りツールチャットボットのコスト計算ツール または RAG コスト計算ツール。モデルごとの詳細: GPT-4o, クロード, ジェミニ, ディープシーク.

AI API コスト計算ツールを開く → · OpenAI vs クロード vs ジェミニ →

参考価格(2026年6月)。予算を立てる前に、各プロバイダーの料金ページを確認してください。どのプロバイダとも提携していません。