Mit Replicate können Sie Tausende von Open-Source-KI-Modellen – Bild, Video, Audio und Sprache – mit einem API-Aufruf ausführen und die GPU-Zeit pro Sekunde abrechnen. Sie verwalten keine Server; Sie zahlen nur, solange ein Modell läuft. Hier erfahren Sie, was es kostet und wie Sie Ihren Token erhalten.
| Hardware | ≈ $/Sekunde | ≈ $/1.000 Läufe* | Am besten für |
|---|---|---|---|
| CPU | $0.0001 | ~5 $ | Leichte Vor-/Nachbearbeitung |
| Nvidia T4-GPU | $0.000225 | ~25 $ | Kleine Bild-/Audiomodelle |
| Nvidia A100 (40 GB) | $0.00115 | ~140 $ | LLMs, SDXL, Video |
| Nvidia H100 | $0.00250 | ~300 $ | Große/schnelle Schlussfolgerung |
→ Sprachmodelle ausführen? Vergleichen Sie APIs zum Token-Preis auf der KI-API-Kostenrechner – Manchmal ist ein gehostetes LLM günstiger als eine sekundengenaue GPU.
Replicate gewährt einen kleinen Betrag an Gratisguthaben, um Modelle auszuprobieren. Anschließend erfolgt die sekundenweise Bezahlung ohne monatliches Mindestmaß. Es gibt kein unbefristetes kostenloses Kontingent, aber Sie zahlen nur, während ein Modell tatsächlich läuft, sodass die Leerlaufkosten gleich Null sind.
1. Melden Sie sich an unter replizieren.com (GitHub-Login funktioniert).
2. Offen Konto → API-Tokens und kopieren Sie Ihren Token.
3. Fügen Sie eine Zahlungsmethode für die Nutzung über das kostenlose Guthaben hinaus hinzu.
4. Rufen Sie jedes Modell anhand seiner Versions-ID auf – die Abrechnung beginnt, wenn die Ausführung beginnt, und stoppt, wenn sie endet.
Testen Sie es mit einer einfachen Anfrage:
Informationen zu gehosteten LLMs per Token (oft günstiger als eine GPU pro Sekunde) finden Sie unter OpenAI, DeepSeek oder Gemeinsam KI. Speziell bei der Bilderzeugung konkurrieren Stability AI und Fal.ai preislich; Beim Rohmodell-Hosting ist Hugging Face Inference Endpoints der größte Konkurrent.
Sie zahlen pro Rechensekunde, während ein Modell ausgeführt wird, zu einem von der Hardware festgelegten Preis (CPU, T4, A100, H100). Keine monatliche Gebühr; Leerlaufzeit kostet nichts.
Für Sprachaufgaben ist eine API mit Token-Preis wie DeepSeek oder GPT-4o mini normalerweise günstiger und einfacher. Replizieren Sie erfolgreich, wenn Sie ein bestimmtes offenes Modell (Bild, Video, Audio) benötigen, das gehostete APIs nicht bieten.
Ein kleines kostenloses Probeguthaben, dann nutzungsbasierte Bezahlung. Kein unbefristetes kostenloses Kontingent.
Melden Sie sich bei Replicate.com an, öffnen Sie Konto → API-Tokens und kopieren Sie Ihr Token.
Nicht mit Replicate verbunden. Bei den Preisen handelt es sich um Richtwerte – überprüfen Sie diese stets auf der offiziellen Preisseite.