Hugging Face beherbergt Hunderttausende offener Modelle und lässt Sie diese durch das laufen lassen Serverlose Inferenz-API, gewidmet Inferenzendpunkte, oder Räume. Hier erfahren Sie, was es kostet, das kostenlose Kontingent und wie Sie Ihr Zugriffstoken erhalten.
| Plan / Produkt | Preis | Was Sie bekommen |
|---|---|---|
| Kostenloses Konto Kostenlose Stufe | $0 | Begrenzte monatliche serverlose Credits, ratenbegrenzte Inferenz, freie CPU-Speicherplätze |
| PRO | ~9 $/Monat | Mehr serverlose Credits, höhere Ratenlimits, ZeroGPU Spaces |
| Inferenzendpunkte (CPU) | ab ca. 0,03 $/Std | Dediziert, automatische Skalierung, Abrechnung pro Stunde |
| Inferenzendpunkte (GPU) | ab ca. 0,50 $/Std | Kleine GPU; Größere GPUs lassen sich auf mehrere US-Dollar pro Stunde skalieren |
| Team / Unternehmen | ab ~20 $/Benutzer/Monat | SSO, privater Hub, Support, Kontrollen |
Ein kostenloses Hugging Face-Konto beinhaltet a kleines monatliches Guthaben für die Serverless Inference API plus gebührenbegrenztem Zugriff auf viele gehostete Modelle und kostenlos CPU-Speicherplätze für Demos. Es reicht aus, Prototypen zu erstellen und Modelle zu testen. Für stabilen Datenverkehr können Sie entweder auf upgraden PRO (~9 $/Monat) für größere Credits und Limits, oder richten Sie ein eigenes Konto ein Inferenzendpunkt Abrechnung pro Stunde nach Hardware.
1. Erstellen Sie ein Konto unter Huggingface.co.
2. Gehe zu Einstellungen → Zugriffstoken.
3. Klicken Neuer Token, wähle a feinkörnig Geben Sie einen Namen für den Geltungsbereich (oder einfaches Lesen/Schreiben) ein.
4. Kopieren Sie die hf_… Einmaliges Token – behandeln Sie es wie ein Passwort.
Rufen Sie ein gehostetes Modell auf:
Wenn Sie eine gehostete Pay-per-Token-API anstelle der Verwaltung von Modellen wünschen, vergleichen Sie Gemeinsam KI, Replizieren, Groq Und OpenRouter – alle nutzen offene Modelle mit einfacher Abrechnung pro Token. Für Closed-Frontier-Modelle siehe OpenAI Und Anthropisch. Um diese für Ihre Nutzung abzuschätzen, verwenden Sie die KI-Kostenrechner.
Ja – ein kostenloses Konto mit begrenzten monatlichen Serverless-Credits, ratenbegrenzter Inferenz und kostenlosen CPU-Speicherplätzen. Bei stärkerer Nutzung wird auf PRO (~9 $/Monat) oder Inferenzendpunkte pro Stunde umgestellt.
Konto → Einstellungen → Zugriffstoken → Neues Token. Wählen Sie einen feingranularen oder Lese-/Schreibbereich und kopieren Sie das hf_-Token einmal.
Serverless wird gemeinsam genutzt, ist ratenbegrenzt und eignet sich hervorragend zum Testen. Bei Inference Endpoints handelt es sich um dedizierte, automatisch skalierende Bereitstellungen, die pro Stunde nach der von Ihnen ausgewählten Hardware abgerechnet werden – vorhersehbar für den Produktionsverkehr.
Nicht mit Hugging Face verbunden. Bei den Preisen handelt es sich um Richtwerte – überprüfen Sie diese stets auf der offiziellen Preisseite.