Replicate vous permet d'exécuter des milliers de modèles d'IA open source (image, vidéo, audio et langage) avec un seul appel d'API, facturés à la seconde du temps GPU. Vous ne gérez pas de serveurs ; vous ne payez que pendant qu'un modèle fonctionne. Voici ce que cela coûte et comment obtenir votre jeton.
| Matériel | ≈ $/seconde | ≈ $/1 000 courses* | Idéal pour |
|---|---|---|---|
| Processeur | $0.0001 | ~5 $ | Pré/post-traitement léger |
| GPU Nvidia T4 | $0.000225 | ~25$ | Petits modèles image/audio |
| Nvidia A100 (40 Go) | $0.00115 | ~140$ | LLM, SDXL, vidéo |
| Nvidia H100 | $0.00250 | ~300 $ | Inférence grande/rapide |
→ Exécuter des modèles de langage ? Comparez les API à prix de jeton sur le Calculateur de coût de l'API IA - Parfois, un LLM hébergé est moins cher qu'un GPU par seconde.
Replicate offre une petite quantité de crédit gratuit pour essayer des modèles, puis il est payé à la seconde près sans minimum mensuel. Il n'y a pas de niveau gratuit perpétuel, mais vous ne payez que pendant qu'un modèle fonctionne réellement, donc les coûts d'inactivité sont nuls.
1. Inscrivez-vous à répliquer.com (La connexion GitHub fonctionne).
2. Ouvrir Compte → Jetons API et copiez votre jeton.
3. Ajoutez un mode de paiement pour une utilisation au-delà du crédit gratuit.
4. Appelez n'importe quel modèle par son identifiant de version : la facturation commence au début de l'exécution et s'arrête à la fin.
Testez-le avec une simple requête :
Pour les LLM hébergés par jeton (souvent moins chers que le GPU par seconde), voir OpenAI, Recherche profonde ou Ensemble IA. Pour la génération d'images en particulier, Stability AI et Fal.ai sont en concurrence sur les prix ; pour l'hébergement de modèles bruts, Hugging Face Inference Endpoints est le rival le plus proche.
Vous payez par seconde de calcul pendant l'exécution d'un modèle, à un tarif défini par le matériel (CPU, T4, A100, H100). Pas de frais mensuels ; le temps d'inactivité ne coûte rien.
Pour les tâches linguistiques, une API à prix symbolique comme DeepSeek ou GPT-4o mini est généralement moins chère et plus simple. Répliquez les gains lorsque vous avez besoin d'un modèle ouvert spécifique (image, vidéo, audio) que les API hébergées n'offrent pas.
Un petit crédit d'essai gratuit, puis un paiement à l'utilisation. Pas de niveau gratuit perpétuel.
Inscrivez-vous sur replite.com, ouvrez Compte → Jetons API et copiez votre jeton.
Non affilié à Replicate. Les prix sont des estimations de référence – vérifiez toujours sur la page de tarification officielle.