por mes
por usuario / mes
por año
Llamadas LLM / mes

Modelos más baratos para esta carga de trabajo.

Mismo uso, todos los modelos clasificados por costo mensual.

ModeloCosto / mesPor usuario
⚠️ Estimación utilizando precios de referencia (junio 2026) y tarifas de lista. Los costos reales varían según el almacenamiento en caché, el procesamiento por lotes, la región, los niveles y los complementos. Escriba su recuento de tokens reales para obtener la cifra más cercana.

como leer esto

Su factura de IA es mayoritariamente usuarios × llamadas × tokens × precio. Las palancas más importantes, en orden: que modelo (pequeño frente a frontera suele ser entre 20 y 50 veces más barato), longitud de salida (la producción cuesta entre 3 y 5 veces la entrada; limite el costo), y longitud de entrada (recortar mensajes del sistema y contexto recuperado). El almacenamiento en caché de contexto repetido y el procesamiento por lotes de trabajos no urgentes reducen más.

¿Elegir un modelo? Compárelos cara a cara en el Calculadora de costos de API de IA, o leer GPT contra Claude contra Géminis. ¿Construyendo RAG o un chatbot? Estos tienen sus propios factores de costos (incrustaciones, base de datos vectorial, tamaño de recuperación): próximamente habrá guías.