HomeAPIs › Groq

API de Groq: precios, nivel gratuito y cómo obtener una clave

Groq ejecuta modelos abiertos como Llama y Mixtral en su hardware LPU personalizado, y su fama es velocidad: cientos de tokens por segundo, mucho más rápido que la inferencia típica de GPU. El precio es por token como todos los demás, pero la latencia es el punto de venta: ideal para chatbots, agentes de voz y cualquier cosa en la que los usuarios esperen la respuesta. Esto es lo que cuesta y cómo obtener su clave.

Precios de Groq API (referencia, junio de 2026)

ModeloIngrese $/1 millónProducción $/1 millónLo mejor para
Llama 3.3 70B$0.59$0.79Equilibrio calidad + velocidad
Llama 3.1 8B mas barato$0.05$0.08Tareas simples y de gran volumen
Mixtral 8x7B$0.24$0.24Mezcla barata de expertos
⚠️ Precios de referencia, junio de 2026: Groq agrega y retira modelos con frecuencia y ajusta los precios. Confirmar en groq.com/precios antes de presupuestar. Los precios son por 1 millón de tokens; La producción se factura por separado.

→ Calcule su factura en el Calculadora de costos de API de IA o modelar una aplicación completa con el Estimador de costos de aplicaciones de IA.

¿Existe un nivel gratuito?

Sí - GroqCloud incluye un nivel gratuito con generosos límites de tarifas por minuto y por día, ideal para desarrollo y aplicaciones de bajo volumen sin necesidad de tarjeta para comenzar. Para el rendimiento de la producción, pasa al pago bajo demanda. Si una cuota gratuita es importante, compárela con Google Géminis y Mistral, que también ofrecen niveles gratuitos reales.

Cómo obtener una clave API de Groq (paso a paso)

1. Ir a consola.groq.com y crear una cuenta.
2. Abre el Claves API página y haga clic Crear clave API; cópialo una vez.
3. Utilice el nivel gratuito inmediatamente, o agregue facturación en Configuración → Facturación para límites más altos.
4. La API es compatible con OpenAI; la mayoría de los SDK de OpenAI funcionan apuntando la URL base a Groq.

Pruébelo con una simple solicitud:

# quick test (replace $GROQ_API_KEY)
rizo https://api.groq.com/openai/v1/chat/completions \
-H "Autorización: Portador $GROQ_API_KEY" \
-H "Tipo de contenido: aplicación/json" \
-d '{"modelo":"llama-3.1-8b-instant","messages":[{"rol":"usuario","content":"hola"}]}'

Calcule su costo

Utilice el Calculadora de costos de API de IA para conectar su recuento de tokens y el volumen de solicitudes: clasifica los modelos abiertos de Groq frente a GPT-4o, Claude, Gemini y DeepSeek del más barato al más caro para su carga de trabajo.

Alternativas más baratas

Llama 3.1 8B de Groq ya se encuentra entre los modelos alojados más baratos que existen. Para obtener una calidad comparable a la de una frontera barata, DeepSeek-V3 y Mistral Pequeño son las comparaciones obvias. Si desea una clave para muchos proveedores y enrutamiento automático, consulte enrutador abierto.

Preguntas frecuentes

¿Por qué utilizar Groq en lugar de OpenAI?

Velocidad. Groq ofrece modelos abiertos con tokens por segundo muy altos, por lo que las respuestas se sienten instantáneas, lo que es valioso para los bucles de chat, voz y agentes. Se intercambian modelos de frontera propietarios por latencia bruta y bajo costo.

¿Groq tiene un nivel gratuito?

Sí, el nivel gratuito de GroqCloud tiene límites de tarifas y no tiene costo inicial, lo que es bueno para pruebas y uso de bajo volumen.

¿Cómo obtengo una clave API de Groq?

Regístrese en console.groq.com, abra las claves API, cree una clave, cópiela una vez y use el nivel gratuito o agregue facturación.

¿La API de Groq es compatible con OpenAI?

Sí, expone un punto final de finalización de chat estilo OpenAI, por lo que la mayoría de las bibliotecas cliente de OpenAI funcionan cambiando la URL base y la clave.

No afiliado a Groq. Los precios son estimaciones de referencia; verifique siempre en la página oficial de precios.