Groq ejecuta modelos abiertos como Llama y Mixtral en su hardware LPU personalizado, y su fama es velocidad: cientos de tokens por segundo, mucho más rápido que la inferencia típica de GPU. El precio es por token como todos los demás, pero la latencia es el punto de venta: ideal para chatbots, agentes de voz y cualquier cosa en la que los usuarios esperen la respuesta. Esto es lo que cuesta y cómo obtener su clave.
| Modelo | Ingrese $/1 millón | Producción $/1 millón | Lo mejor para |
|---|---|---|---|
| Llama 3.3 70B | $0.59 | $0.79 | Equilibrio calidad + velocidad |
| Llama 3.1 8B mas barato | $0.05 | $0.08 | Tareas simples y de gran volumen |
| Mixtral 8x7B | $0.24 | $0.24 | Mezcla barata de expertos |
→ Calcule su factura en el Calculadora de costos de API de IA o modelar una aplicación completa con el Estimador de costos de aplicaciones de IA.
Sí - GroqCloud incluye un nivel gratuito con generosos límites de tarifas por minuto y por día, ideal para desarrollo y aplicaciones de bajo volumen sin necesidad de tarjeta para comenzar. Para el rendimiento de la producción, pasa al pago bajo demanda. Si una cuota gratuita es importante, compárela con Google Géminis y Mistral, que también ofrecen niveles gratuitos reales.
1. Ir a consola.groq.com y crear una cuenta.
2. Abre el Claves API página y haga clic Crear clave API; cópialo una vez.
3. Utilice el nivel gratuito inmediatamente, o agregue facturación en Configuración → Facturación para límites más altos.
4. La API es compatible con OpenAI; la mayoría de los SDK de OpenAI funcionan apuntando la URL base a Groq.
Pruébelo con una simple solicitud:
Utilice el Calculadora de costos de API de IA para conectar su recuento de tokens y el volumen de solicitudes: clasifica los modelos abiertos de Groq frente a GPT-4o, Claude, Gemini y DeepSeek del más barato al más caro para su carga de trabajo.
Llama 3.1 8B de Groq ya se encuentra entre los modelos alojados más baratos que existen. Para obtener una calidad comparable a la de una frontera barata, DeepSeek-V3 y Mistral Pequeño son las comparaciones obvias. Si desea una clave para muchos proveedores y enrutamiento automático, consulte enrutador abierto.
Velocidad. Groq ofrece modelos abiertos con tokens por segundo muy altos, por lo que las respuestas se sienten instantáneas, lo que es valioso para los bucles de chat, voz y agentes. Se intercambian modelos de frontera propietarios por latencia bruta y bajo costo.
Sí, el nivel gratuito de GroqCloud tiene límites de tarifas y no tiene costo inicial, lo que es bueno para pruebas y uso de bajo volumen.
Regístrese en console.groq.com, abra las claves API, cree una clave, cópiela una vez y use el nivel gratuito o agregue facturación.
Sí, expone un punto final de finalización de chat estilo OpenAI, por lo que la mayoría de las bibliotecas cliente de OpenAI funcionan cambiando la URL base y la clave.
No afiliado a Groq. Los precios son estimaciones de referencia; verifique siempre en la página oficial de precios.