HomeAPIs › Replicar

API replicada: precios, nivel gratuito y cómo obtener una clave

Replicate le permite ejecutar miles de modelos de IA de código abierto (imagen, vídeo, audio e idioma) con una llamada API y facturación por segundo de tiempo de GPU. No administras servidores; usted paga sólo mientras se ejecuta un modelo. Esto es lo que cuesta y cómo obtener su token.

Precios de API replicados (referencia, junio de 2026)

Hardware≈ $/segundo≈ $/1000 carreras*Lo mejor para
UPC$0.0001~$5Pre/postprocesamiento ligero
GPU Nvidia T4$0.000225~$25Modelos de imagen/audio pequeños
Tarjeta gráfica Nvidia A100 (40 GB)$0.00115~$140LLM, SDXL, vídeo
NVIDIA H100$0.00250~$300Inferencia grande/rápida
⚠️ Precios de referencia, junio de 2026: replicar los precios de las actualizaciones periódicamente. Confirmar en replicate.com/precios antes de presupuestar. *Aproximado: se supone ~5 s por ejecución; Costo real = segundos utilizados × tasa de hardware. Los arranques en frío añaden tiempo.

→ ¿Ejecutando modelos de lenguaje? Compare las API con precio de token en Calculadora de costos de API de IA — A veces, un LLM alojado es más barato que una GPU por segundo.

¿Existe un nivel gratuito?

Replicate ofrece una pequeña cantidad de crédito gratuito para probar modelos, luego se paga por segundo sin mínimo mensual. No existe un nivel gratuito perpetuo, pero solo paga mientras un modelo realmente se ejecuta, por lo que los costos de inactividad son cero.

Cómo obtener una clave API replicada (paso a paso)

1. Regístrese en replicar.com (El inicio de sesión en GitHub funciona).
2. Abierto Cuenta → Tokens API y copia tu token.
3. Agregue un método de pago para uso más allá del crédito gratuito.
4. Llame a cualquier modelo por su ID de versión: la facturación comienza cuando comienza la ejecución y se detiene cuando finaliza.

Pruébelo con una simple solicitud:

# run a model (replace $REPLICATE_API_TOKEN)
curl -s -X POST https://api.replicate.com/v1/predictions \
-H "Autorización: Portador $REPLICATE_API_TOKEN" \
-H "Tipo de contenido: aplicación/json" \
-d '{"versión":"MODEL_VERSION","input":{"prompt":"un gato"}}'

Alternativas más baratas

Para LLM alojados por token (a menudo más baratos que GPU por segundo), consulte AbiertoAI, búsqueda profunda o Juntos IA. Específicamente para la generación de imágenes, Stability AI y Fal.ai compiten en precio; para el alojamiento de modelos sin formato, Hugging Face Inference Endpoints es el rival más cercano.

Preguntas frecuentes

¿Cómo funciona la facturación replicada?

Paga por segundo de cómputo mientras se ejecuta un modelo, a una tarifa establecida por el hardware (CPU, T4, A100, H100). Sin tarifa mensual; el tiempo muerto no cuesta nada.

¿Es Replicate más barato que una API LLM?

Para tareas de lenguaje, una API con precio de token como DeepSeek o GPT-4o mini suele ser más barata y sencilla. La replicación gana cuando necesita un modelo abierto específico (imagen, video, audio) que las API alojadas no ofrecen.

¿Replicate tiene un nivel gratuito?

Un pequeño crédito de prueba gratuito y luego pago por uso. Sin nivel gratuito perpetuo.

¿Cómo obtengo un token de API replicado?

Regístrese en replicate.com, abra Cuenta → Tokens API y copie su token.

No afiliado a Replicate. Los precios son estimaciones de referencia; verifique siempre en la página oficial de precios.