HomeAPIs › Répliquer

API de réplication – tarification, niveau gratuit et comment obtenir une clé

Replicate vous permet d'exécuter des milliers de modèles d'IA open source (image, vidéo, audio et langage) avec un seul appel d'API, facturés à la seconde du temps GPU. Vous ne gérez pas de serveurs ; vous ne payez que pendant qu'un modèle fonctionne. Voici ce que cela coûte et comment obtenir votre jeton.

Tarification de l’API de réplication (référence, juin 2026)

Matériel≈ $/seconde≈ $/1 000 courses*Idéal pour
Processeur$0.0001~5 $Pré/post-traitement léger
GPU Nvidia T4$0.000225~25$Petits modèles image/audio
Nvidia A100 (40 Go)$0.00115~140$LLM, SDXL, vidéo
Nvidia H100$0.00250~300 $Inférence grande/rapide
⚠️ Prix de référence, juin 2026 — Répliquez régulièrement les mises à jour des prix. Confirmez sur répliquer.com/tarification avant de budgétiser. *Rough : suppose environ 5 s par exécution ; coût réel = secondes utilisées × tarif matériel. Les démarrages à froid ajoutent du temps.

→ Exécuter des modèles de langage ? Comparez les API à prix de jeton sur le Calculateur de coût de l'API IA - Parfois, un LLM hébergé est moins cher qu'un GPU par seconde.

Existe-t-il un niveau gratuit ?

Replicate offre une petite quantité de crédit gratuit pour essayer des modèles, puis il est payé à la seconde près sans minimum mensuel. Il n'y a pas de niveau gratuit perpétuel, mais vous ne payez que pendant qu'un modèle fonctionne réellement, donc les coûts d'inactivité sont nuls.

Comment obtenir une clé API de réplication (étape par étape)

1. Inscrivez-vous à répliquer.com (La connexion GitHub fonctionne).
2. Ouvrir Compte → Jetons API et copiez votre jeton.
3. Ajoutez un mode de paiement pour une utilisation au-delà du crédit gratuit.
4. Appelez n'importe quel modèle par son identifiant de version : la facturation commence au début de l'exécution et s'arrête à la fin.

Testez-le avec une simple requête :

# run a model (replace $REPLICATE_API_TOKEN)
curl -s -X POST https://api.replicate.com/v1/predictions \
-H "Autorisation : Porteur $REPLICATE_API_TOKEN" \
-H "Type de contenu : application/json" \
-d '{"version": "MODEL_VERSION", "input": {"prompt": "un chat"}}'

Alternatives moins chères

Pour les LLM hébergés par jeton (souvent moins chers que le GPU par seconde), voir OpenAI, Recherche profonde ou Ensemble IA. Pour la génération d'images en particulier, Stability AI et Fal.ai sont en concurrence sur les prix ; pour l'hébergement de modèles bruts, Hugging Face Inference Endpoints est le rival le plus proche.

FAQ

Comment fonctionne la facturation répliquée ?

Vous payez par seconde de calcul pendant l'exécution d'un modèle, à un tarif défini par le matériel (CPU, T4, A100, H100). Pas de frais mensuels ; le temps d'inactivité ne coûte rien.

La réplication est-elle moins chère qu’une API LLM ?

Pour les tâches linguistiques, une API à prix symbolique comme DeepSeek ou GPT-4o mini est généralement moins chère et plus simple. Répliquez les gains lorsque vous avez besoin d'un modèle ouvert spécifique (image, vidéo, audio) que les API hébergées n'offrent pas.

Replicate propose-t-il un niveau gratuit ?

Un petit crédit d'essai gratuit, puis un paiement à l'utilisation. Pas de niveau gratuit perpétuel.

Comment puis-je obtenir un jeton API de réplication ?

Inscrivez-vous sur replite.com, ouvrez Compte → Jetons API et copiez votre jeton.

Non affilié à Replicate. Les prix sont des estimations de référence – vérifiez toujours sur la page de tarification officielle.