HomeAPIs › Replicar

Replicar API – preços, nível gratuito e como obter uma chave

O Replicate permite executar milhares de modelos de IA de código aberto — imagem, vídeo, áudio e linguagem — com uma chamada de API, faturando por segundo de tempo de GPU. Você não gerencia servidores; você paga apenas enquanto um modelo é executado. Veja quanto custa e como obter seu token.

Replicar preços de API (referência, junho de 2026)

Hardware≈ $/segundo≈ US$/1.000 corridas*Melhor para
CPU$0.0001~$5Pré/pós-processamento leve
GPU Nvidia T4$0.000225~$25Modelos pequenos de imagem/áudio
Nvidia A100 (40 GB)$0.00115~$140LLMs, SDXL, vídeo
Nvidia H100$0.00250~$300Inferência grande/rápida
⚠️ Preços de referência, junho de 2026 — Replique as atualizações de preços regularmente. Confirmar em replicate.com/pricing antes de fazer o orçamento. *Áspero: assume aproximadamente 5s por corrida; custo real = segundos usados ​​​​× taxa de hardware. Partidas a frio adicionam tempo.

→ Executando modelos de linguagem? Compare APIs com preços de token no Calculadora de custos de API de IA – às vezes, um LLM hospedado é mais barato que uma GPU por segundo.

Existe um nível gratuito?

O Replicate oferece uma pequena quantia de crédito grátis para experimentar modelos e, em seguida, é pré-pago por segundo, sem mínimo mensal. Não existe um nível gratuito perpétuo, mas você só paga enquanto um modelo realmente está em execução, portanto, os custos de inatividade são zero.

Como obter uma chave de API replicada (passo a passo)

1. Inscreva-se em replicate.com (O login do GitHub funciona).
2. Abrir Conta → tokens de API e copie seu token.
3. Adicione uma forma de pagamento para uso além do crédito gratuito.
4. Chame qualquer modelo pelo ID da versão — o faturamento começa quando a execução começa e termina quando termina.

Teste-o com uma solicitação simples:

# run a model (replace $REPLICATE_API_TOKEN)
curl -s -X POST https://api.replicate.com/v1/predictions\
-H "Autorização: Portador $REPLICATE_API_TOKEN" \
-H "Tipo de conteúdo: aplicativo/json" \
-d '{"versão":"MODEL_VERSION","input":{"prompt":"um gato"}}'

Alternativas mais baratas

Para LLMs hospedados por token (geralmente mais barato que GPU por segundo), consulte OpenAI, DeepSeek ou Juntos IA. Especificamente para geração de imagens, Stability AI e Fal.ai competem em preço; para hospedagem de modelo bruto, Hugging Face Inference Endpoints é o rival mais próximo.

Perguntas frequentes

Como funciona o faturamento replicado?

Você paga por segundo de computação enquanto um modelo é executado, a uma taxa definida pelo hardware (CPU, T4, A100, H100). Sem mensalidade; o tempo ocioso não custa nada.

O Replicate é mais barato do que uma API LLM?

Para tarefas de linguagem, uma API com preço de token, como DeepSeek ou GPT-4o mini, geralmente é mais barata e simples. A replicação vence quando você precisa de um modelo aberto específico (imagem, vídeo, áudio) que as APIs hospedadas não oferecem.

O Replicate tem um nível gratuito?

Um pequeno crédito de teste gratuito e depois pague conforme o uso. Nenhum nível gratuito perpétuo.

Como obtenho um token de API de replicação?

Cadastre-se em replicate.com, abra Conta → Tokens de API e copie seu token.

Não afiliado à Replicar. Os preços são estimativas de referência – verifique sempre na página oficial de preços.