Hugging Face héberge des centaines de milliers de modèles ouverts et vous permet de les exécuter via le API d'inférence sans serveur, dédié Points de terminaison d’inférence, ou Espaces. Voici ce que cela coûte, le niveau gratuit et comment obtenir votre jeton d'accès.
| Plan / produit | Prix | Ce que vous obtenez |
|---|---|---|
| Compte gratuit niveau gratuit | $0 | Crédits mensuels sans serveur limités, inférence à débit limité, espaces CPU gratuits |
| PRO | ~9$/mois | Plus de crédits sans serveur, limites de débit plus élevées, espaces ZeroGPU |
| Points de terminaison d'inférence (CPU) | à partir de ~0,03$/h | Dédié, autoscaling, facturé à l'heure |
| Points de terminaison d'inférence (GPU) | à partir de ~0,50 $/heure | Petit GPU ; les GPU plus grands évoluent jusqu'à plusieurs $/h |
| Équipe / Entreprise | à partir de ~20 $/utilisateur/mois | SSO, hub privé, support, contrôles |
Un compte Hugging Face gratuit comprend un petit crédit mensuel pour l'API Serverless Inference plus un accès limité à de nombreux modèles hébergés et gratuit Espaces CPU pour les démos. Il suffit de prototyper et de tester des modèles. Pour un trafic régulier, vous passez soit à PRO (~ 9 $/mois) pour des crédits et des limites plus importants, ou créez un compte dédié Point de terminaison d’inférence facturé à l'heure par matériel.
1. Créez un compte sur câlins.co.
2. Aller à Paramètres → Jetons d'accès.
3. Cliquez Nouveau jeton, choisissez un à grain fin scope (ou simple lecture/écriture), nommez-le.
4. Copiez le hf_… jeton une fois – traitez-le comme un mot de passe.
Appelez un modèle hébergé :
Si vous souhaitez une API hébergée et payante par jeton au lieu de gérer des modèles, comparez Ensemble IA, Reproduire, Groq et OuvrirRouter - tous exécutent des modèles ouverts avec une facturation simple par jeton. Pour les modèles à frontière fermée, voir OpenAI et Anthropique. Pour estimer l'un de ces éléments pour votre utilisation, utilisez le Calculateur de coût de l'IA.
Oui : un compte gratuit avec des crédits mensuels sans serveur limités, une inférence à débit limité et des espaces CPU gratuits. Une utilisation plus intensive passe à PRO (~ 9 $/mois) ou aux points de terminaison d'inférence par heure.
Compte → Paramètres → Jetons d'accès → Nouveau jeton. Choisissez une portée à granularité fine ou en lecture/écriture et copiez le jeton hf_ une fois.
Le sans serveur fonctionne de manière partagée, à débit limité et est idéal pour les tests. Les points de terminaison d'inférence sont des déploiements dédiés à mise à l'échelle automatique, facturés à l'heure en fonction du matériel que vous choisissez, prévisibles pour le trafic de production.
Non affilié à Hugging Face. Les prix sont des estimations de référence – vérifiez toujours sur la page de tarification officielle.