毎月(継続)
クエリごと
ワンタイムインデックス作成
最大の月額費用

この RAG の最も安価な回答モデル

同じ検索とトラフィックで、すべてのモデルが月額コストでランク付けされています。

モデル月額料金クエリごと
⚠️ 参考価格 (2026 年 6 月) を使用した編集可能な見積り。 Vector DB のコストはプロバイダーとプランによって大きく異なります。独自に設定してください。実際の請求額は、再ランキング、キャッシュ、メタデータのフィルタリング、インデックスの再作成の頻度によっても変化します。

RAGのお金が実際にどこに行くのか

人々は、埋め込みが RAG の高価な部分であると考えています。通常はそれらが最も安いです。 10,000 の短いドキュメントの埋め込みは、多くの場合、数セントで、一度の支払いで済みます。実際の経常コストは、 すべてのクエリに対する LLM — そして具体的には 取得されたコンテキスト あなたはそれに餌を与えます。 400 トークンの 5 つのチャンクを取得すると、ユーザーが入力を終える前に、すべての質問に 2,000 の入力トークンが追加されたことになります。クエリ量を掛けると、それが請求額となります。

大きなレバーの順序: 取得 チャンクが少ない/小さい (top-k とチャンク サイズ)、 より安価な回答モデル 日常的なクエリの場合は、回答の長さに上限を設けます。 (コーパス全体ではなく) 変更されたドキュメントのみを再埋め込むことで、1 回限りのコストが再発することを防ぎます。残りのアプリを構築しますか?サポート ボットの価格を設定するには、 チャットボットのコスト計算ツール、機能全体が AI アプリのコスト見積りツール、または完全なバックエンド APIスタックコスト計算ツール.