Replicate を使用すると、数千のオープンソース AI モデル (画像、ビデオ、オーディオ、言語) を 1 回の API 呼び出しで実行でき、GPU 時間の秒単位で課金されます。あなたはサーバーを管理しません。料金はモデルの実行中にのみお支払いいただきます。費用とトークンの取得方法は次のとおりです。
| ハードウェア | ≈ $/秒 | ≈ $/1,000 実行* | こんな方に最適 |
|---|---|---|---|
| CPU | $0.0001 | ~$5 | 軽い前処理/後処理 |
| Nvidia T4 GPU | $0.000225 | ~25ドル | 小型画像・音声モデル |
| Nvidia A100 (40GB) | $0.00115 | ~140ドル | LLM、SDXL、ビデオ |
| エヌビディア H100 | $0.00250 | ~300ドル | 大規模/高速推論 |
→ 言語モデルを実行しますか?トークン価格の API を比較します。 AI API コスト計算ツール — 場合によっては、ホスト型 LLM の方が 1 秒あたりの GPU よりも安価です。
Replicate では、モデルを試すために少額の無料クレジットが提供され、その後は月額最低料金なしで 2 秒ごとの従量課金制となります。永続的な無料利用枠はありませんが、モデルが実際に実行されている間のみ料金が発生するため、アイドル状態のコストはゼロです。
1. でサインアップしてください 複製.com (GitHub ログインは機能します)。
2. 開ける アカウント → APIトークン そしてトークンをコピーします。
3. 無料クレジットを超えて使用するための支払い方法を追加します。
4. バージョン ID でモデルを呼び出します。実行が開始されると課金が開始され、終了すると課金が停止されます。
簡単なリクエストでテストします。
トークンによるホスト型 LLM (多くの場合、1 秒あたりの GPU よりも安価) については、次を参照してください。 OpenAI, ディープシーク または 一緒にAI。特に画像生成に関しては、Stability AI と Fal.ai が価格で競合します。 RAW モデルのホスティングでは、Hugging Face Inference Endpoints が最も近いライバルです。
料金は、モデルの実行中にハードウェア (CPU、T4、A100、H100) によって設定されたレートで 1 秒ごとのコンピューティングに対して支払います。月額料金はかかりません。アイドルタイムには費用はかかりません。
言語タスクの場合、DeepSeek や GPT-4o mini などのトークン価格の API の方が通常は安価で簡単です。ホストされた API では提供されない特定のオープン モデル (画像、ビデオ、オーディオ) が必要な場合は、レプリケートが最適です。
少額の無料トライアル クレジットがあり、その後は従量課金制となります。永続的な無料利用枠はありません。
replicate.com にサインアップし、「アカウント」→「API トークン」を開き、トークンをコピーします。
レプリケートとは無関係です。価格は参考見積りです。必ず公式の価格ページでご確認ください。