HomeAPIs › Visage câlin

API Hugging Face – tarifs, niveau gratuit et comment obtenir un jeton

Hugging Face héberge des centaines de milliers de modèles ouverts et vous permet de les exécuter via le API d'inférence sans serveur, dédié Points de terminaison d’inférence, ou Espaces. Voici ce que cela coûte, le niveau gratuit et comment obtenir votre jeton d'accès.

Tarifs Hugging Face (référence, juin 2026)

Plan / produitPrixCe que vous obtenez
Compte gratuit niveau gratuit$0Crédits mensuels sans serveur limités, inférence à débit limité, espaces CPU gratuits
PRO~9$/moisPlus de crédits sans serveur, limites de débit plus élevées, espaces ZeroGPU
Points de terminaison d'inférence (CPU)à partir de ~0,03$/hDédié, autoscaling, facturé à l'heure
Points de terminaison d'inférence (GPU)à partir de ~0,50 $/heurePetit GPU ; les GPU plus grands évoluent jusqu'à plusieurs $/h
Équipe / Entrepriseà partir de ~20 $/utilisateur/moisSSO, hub privé, support, contrôles
⚠️ Prix de référence, juin 2026 — Hugging Face modifie souvent les crédits, les tarifs du matériel et les noms des forfaits. Confirmez sur huggingface.co/tarification. Les appels sans serveur acheminés vers des fournisseurs d'inférence tiers sont facturés au tarif par jeton de ce fournisseur.

Le niveau gratuit

Un compte Hugging Face gratuit comprend un petit crédit mensuel pour l'API Serverless Inference plus un accès limité à de nombreux modèles hébergés et gratuit Espaces CPU pour les démos. Il suffit de prototyper et de tester des modèles. Pour un trafic régulier, vous passez soit à PRO (~ 9 $/mois) pour des crédits et des limites plus importants, ou créez un compte dédié Point de terminaison d’inférence facturé à l'heure par matériel.

Comment obtenir un jeton Hugging Face (étape par étape)

1. Créez un compte sur câlins.co.
2. Aller à Paramètres → Jetons d'accès.
3. Cliquez Nouveau jeton, choisissez un à grain fin scope (ou simple lecture/écriture), nommez-le.
4. Copiez le hf_… jeton une fois – traitez-le comme un mot de passe.

Appelez un modèle hébergé :

# replace $HF_TOKEN and the model id
boucle https://api-inference.huggingface.co/models/google/flan-t5-base \
-H "Autorisation : Porteur $HF_TOKEN" \
-H "Type de contenu : application/json" \
-d '{"inputs":"Traduire en français : Bonjour"}'

Options moins chères/alternatives

Si vous souhaitez une API hébergée et payante par jeton au lieu de gérer des modèles, comparez Ensemble IA, Reproduire, Groq et OuvrirRouter - tous exécutent des modèles ouverts avec une facturation simple par jeton. Pour les modèles à frontière fermée, voir OpenAI et Anthropique. Pour estimer l'un de ces éléments pour votre utilisation, utilisez le Calculateur de coût de l'IA.

FAQ

Hugging Face propose-t-il un niveau gratuit ?

Oui : un compte gratuit avec des crédits mensuels sans serveur limités, une inférence à débit limité et des espaces CPU gratuits. Une utilisation plus intensive passe à PRO (~ 9 $/mois) ou aux points de terminaison d'inférence par heure.

Comment puis-je obtenir un jeton d'accès Hugging Face ?

Compte → Paramètres → Jetons d'accès → Nouveau jeton. Choisissez une portée à granularité fine ou en lecture/écriture et copiez le jeton hf_ une fois.

Quelle est la différence entre l'inférence sans serveur et les points de terminaison d'inférence ?

Le sans serveur fonctionne de manière partagée, à débit limité et est idéal pour les tests. Les points de terminaison d'inférence sont des déploiements dédiés à mise à l'échelle automatique, facturés à l'heure en fonction du matériel que vous choisissez, prévisibles pour le trafic de production.

Non affilié à Hugging Face. Les prix sont des estimations de référence – vérifiez toujours sur la page de tarification officielle.