GPT-4o と安価なモデル - 同じワークロード
同一のトークンとボリューム、各モデルの価格。
| モデル | $/1M を入力 | 出力 $/1M | 月額料金 |
|---|
GPT-4o の価格設定の仕組み
GPT-4o はトークンごとに請求され、次のように分割されます。 入力 (プロンプト + 任意のコンテキスト) および 出力 (モデルが書き返す内容)。おおよそで $2.50 / 100万インプット そして $10.00 / 100万出力、アウトプットにはインプットの 4 倍のコストがかかります。したがって、請求の唯一の最大の要因は、回答の長さです。キャッピング max_tokens、簡潔な回答を求め、トリミングシステムはすべてのコストを直接削減するよう促します。
2本目のレバーは、 モデルの選択。 GPT-4o は最先端のモデルです。日常的な分類、抽出、短い返信のために、 GPT-4o ミニまたはジェミニ フラッシュ 十分な出力を得るには 15 ~ 25 倍安くなる可能性があります。一般的なパターンは、デフォルトでハード リクエスト専用の GPT-4o を備えた安価なモデルです。上の表は、そのスイッチが実際のボリュームでどれだけの価値があるかを示しています。アプリの全体像を確認するには、 AI アプリのコスト見積りツール;サポートボットの場合、 チャットボットのコスト計算ツール。完全なセットアップと主要な手順については、 OpenAI ガイド.
よくある質問
GPT-4o の 100 万トークンあたりのコストはいくらですか? 約 2.50 ドルのインプットと 10.00 ドルのアウトプット (参考、2026 年 6 月)。
GPT-4o の請求額を下げるにはどうすればよいですか? 出力を短縮し、繰り返されるコンテキストをキャッシュし、簡単なリクエストを GPT-4o mini にルーティングします。