How does Replicate billing work?

You pay per second of compute while a model runs, at a rate set by the hardware (CPU, T4, A100, H100). No monthly fee; idle time costs nothing.

Is Replicate cheaper than an LLM API?

For language tasks, a token-priced API like DeepSeek or GPT-4o mini is usually cheaper and simpler. Replicate wins when you need a specific open model (image, video, audio) that hosted APIs don't offer.

Does Replicate have a free tier?

A small free trial credit, then pay-as-you-go. No perpetual free tier.

How do I get a Replicate API token?

Sign up at replicate.com, open Account → API tokens, and copy your token.

API のレプリケート — 価格、無料利用枠、キーの取得方法

Replicate を使用すると、数千のオープンソース AI モデル (画像、ビデオ、オーディオ、言語) を 1 回の API 呼び出しで実行でき、GPU 時間の秒単位で課金されます。あなたはサーバーを管理しません。料金はモデルの実行中にのみお支払いいただきます。費用とトークンの取得方法は次のとおりです。

レプリケート API の価格 (参考、2026 年 6 月)

ハードウェア	≈ $/秒	≈ $/1,000 実行*	こんな方に最適
CPU	$0.0001	~$5	軽い前処理/後処理
Nvidia T4 GPU	$0.000225	~25ドル	小型画像・音声モデル
Nvidia A100 (40GB)	$0.00115	~140ドル	LLM、SDXL、ビデオ
エヌビディア H100	$0.00250	~300ドル	大規模/高速推論

⚠️ 参考価格、2026 年 6 月 — 更新価格を定期的に複製します。確認してください レプリケート.com/価格設定 予算を立てる前に。 *概算: 実行あたり最大 5 秒を想定しています。実際のコスト = 使用秒数 × ハードウェア速度。コールドスタートでは時間が追加されます。

→ 言語モデルを実行しますか?トークン価格の API を比較します。 AI API コスト計算ツール — 場合によっては、ホスト型 LLM の方が 1 秒あたりの GPU よりも安価です。

無料利用枠はありますか?

Replicate では、モデルを試すために少額の無料クレジットが提供され、その後は月額最低料金なしで 2 秒ごとの従量課金制となります。永続的な無料利用枠はありませんが、モデルが実際に実行されている間のみ料金が発生するため、アイドル状態のコストはゼロです。

レプリケート API キーを取得する方法 (ステップバイステップ)

1. でサインアップしてください 複製.com (GitHub ログインは機能します)。
2. 開ける アカウント → APIトークン そしてトークンをコピーします。
3. 無料クレジットを超えて使用するための支払い方法を追加します。
4. バージョン ID でモデルを呼び出します。実行が開始されると課金が開始され、終了すると課金が停止されます。

簡単なリクエストでテストします。

# run a model (replace $REPLICATE_API_TOKEN)
curl -s -X POST https://api.replicate.com/v1/predictions \
  -H "認可: ベアラー $REPLICATE_API_TOKEN" \
  -H "コンテンツ タイプ: application/json" \
  -d '{"バージョン":"MODEL_VERSION","input":{"プロンプト":"猫"}}'

より安価な代替品

トークンによるホスト型 LLM (多くの場合、1 秒あたりの GPU よりも安価) については、次を参照してください。 OpenAI, ディープシークまたは一緒にAI。特に画像生成に関しては、Stability AI と Fal.ai が価格で競合します。 RAW モデルのホスティングでは、Hugging Face Inference Endpoints が最も近いライバルです。

よくある質問

複製請求はどのように機能しますか?

料金は、モデルの実行中にハードウェア (CPU、T4、A100、H100) によって設定されたレートで 1 秒ごとのコンピューティングに対して支払います。月額料金はかかりません。アイドルタイムには費用はかかりません。

Replicate は LLM API よりも安価ですか?

言語タスクの場合、DeepSeek や GPT-4o mini などのトークン価格の API の方が通常は安価で簡単です。ホストされた API では提供されない特定のオープンモデル (画像、ビデオ、オーディオ) が必要な場合は、レプリケートが最適です。

Replicate には無料利用枠がありますか?

少額の無料トライアルクレジットがあり、その後は従量課金制となります。永続的な無料利用枠はありません。

レプリケート API トークンを取得するにはどうすればよいですか?

replicate.com にサインアップし、「アカウント」→「API トークン」を開き、トークンをコピーします。

レプリケートとは無関係です。価格は参考見積りです。必ず公式の価格ページでご確認ください。