HomeAPIs › Replizieren

Replikate-API – Preise, kostenloses Kontingent und wie man einen Schlüssel erhält

Mit Replicate können Sie Tausende von Open-Source-KI-Modellen – Bild, Video, Audio und Sprache – mit einem API-Aufruf ausführen und die GPU-Zeit pro Sekunde abrechnen. Sie verwalten keine Server; Sie zahlen nur, solange ein Modell läuft. Hier erfahren Sie, was es kostet und wie Sie Ihren Token erhalten.

API-Preise replizieren (Referenz, Juni 2026)

Hardware≈ $/Sekunde≈ $/1.000 Läufe*Am besten für
CPU$0.0001~5 $Leichte Vor-/Nachbearbeitung
Nvidia T4-GPU$0.000225~25 $Kleine Bild-/Audiomodelle
Nvidia A100 (40 GB)$0.00115~140 $LLMs, SDXL, Video
Nvidia H100$0.00250~300 $Große/schnelle Schlussfolgerung
⚠️ Referenzpreise, Juni 2026 – Aktualisieren Sie die Preise regelmäßig. Bestätigen Sie am Replicate.com/pricing vor der Budgetierung. *Grob: Geht von ca. 5 Sekunden pro Lauf aus; Tatsächliche Kosten = genutzte Sekunden × Hardwarerate. Kaltstarts verlängern die Zeit.

→ Sprachmodelle ausführen? Vergleichen Sie APIs zum Token-Preis auf der KI-API-Kostenrechner – Manchmal ist ein gehostetes LLM günstiger als eine sekundengenaue GPU.

Gibt es eine kostenlose Stufe?

Replicate gewährt einen kleinen Betrag an Gratisguthaben, um Modelle auszuprobieren. Anschließend erfolgt die sekundenweise Bezahlung ohne monatliches Mindestmaß. Es gibt kein unbefristetes kostenloses Kontingent, aber Sie zahlen nur, während ein Modell tatsächlich läuft, sodass die Leerlaufkosten gleich Null sind.

So erhalten Sie einen Replikat-API-Schlüssel (Schritt für Schritt)

1. Melden Sie sich an unter replizieren.com (GitHub-Login funktioniert).
2. Offen Konto → API-Tokens und kopieren Sie Ihren Token.
3. Fügen Sie eine Zahlungsmethode für die Nutzung über das kostenlose Guthaben hinaus hinzu.
4. Rufen Sie jedes Modell anhand seiner Versions-ID auf – die Abrechnung beginnt, wenn die Ausführung beginnt, und stoppt, wenn sie endet.

Testen Sie es mit einer einfachen Anfrage:

# run a model (replace $REPLICATE_API_TOKEN)
curl -s -X POST https://api.replicate.com/v1/predictions \
-H „Autorisierung: Inhaber $REPLICATE_API_TOKEN“ \
-H „Inhaltstyp: application/json“ \
-d '{"version":"MODEL_VERSION","input":{"prompt":"a cat"}}'

Günstigere Alternativen

Informationen zu gehosteten LLMs per Token (oft günstiger als eine GPU pro Sekunde) finden Sie unter OpenAI, DeepSeek oder Gemeinsam KI. Speziell bei der Bilderzeugung konkurrieren Stability AI und Fal.ai preislich; Beim Rohmodell-Hosting ist Hugging Face Inference Endpoints der größte Konkurrent.

FAQ

Wie funktioniert die Replikatabrechnung?

Sie zahlen pro Rechensekunde, während ein Modell ausgeführt wird, zu einem von der Hardware festgelegten Preis (CPU, T4, A100, H100). Keine monatliche Gebühr; Leerlaufzeit kostet nichts.

Ist Replicate günstiger als eine LLM-API?

Für Sprachaufgaben ist eine API mit Token-Preis wie DeepSeek oder GPT-4o mini normalerweise günstiger und einfacher. Replizieren Sie erfolgreich, wenn Sie ein bestimmtes offenes Modell (Bild, Video, Audio) benötigen, das gehostete APIs nicht bieten.

Gibt es für Replicate ein kostenloses Kontingent?

Ein kleines kostenloses Probeguthaben, dann nutzungsbasierte Bezahlung. Kein unbefristetes kostenloses Kontingent.

Wie erhalte ich ein Replicate-API-Token?

Melden Sie sich bei Replicate.com an, öffnen Sie Konto → API-Tokens und kopieren Sie Ihr Token.

Nicht mit Replicate verbunden. Bei den Preisen handelt es sich um Richtwerte – überprüfen Sie diese stets auf der offiziellen Preisseite.