Pinecone é um gerenciado banco de dados vetorial - a parte de um RAG ou pilha de pesquisa semântica que armazena embeddings e encontra rapidamente as correspondências mais próximas. Veja como funciona o preço sem servidor, o que o nível Starter gratuito oferece e como obter uma chave.
| Plano | Preço | O que você ganha |
|---|---|---|
| Iniciante nível gratuito | $0 | sem servidor, ~2 GB de armazenamento, bom para testes |
| Padrão | a partir de ~$25/mês min | com base no uso: armazenamento + leituras + gravações, pagamento conforme o uso |
| Empresa | de ~$500/mês min | limites mais altos, SSO, SLA, suporte |
O O plano inicial é gratuito e sem servidor – cerca de 2 GB de armazenamento, sem cartão de crédito para começar, o que é suficiente para algumas centenas de milhares de incorporações e uma demonstração RAG funcional. O problema com os bancos de dados vetoriais é que o custo aumenta com ambos quanto você armazena e com que frequência você consulta, então um chatbot barato no lançamento pode aumentar à medida que a base de conhecimento e o tráfego aumentam. Modele-o antes de se comprometer.
1. Inscreva-se em pinha.io.
2. Abra o console e crie um índice (escolha a dimensão que corresponde ao seu modelo de incorporação, por exemplo, 1536 para OpenAI text-embedding-3-small).
3. Vá para Chaves de API e copie sua chave.
4. Conecte-se ao SDK usando essa chave e seu host de índice.
Upsert e consulta (Python):
Se você já executa o Postgres, vetor pg é gratuito e muitas vezes abaixo de alguns milhões de vetores. Qdrant e Tecer são de código aberto e auto-hospedáveis; Croma é ótimo para prototipagem local. Rivais gerenciados como Milvus/Zilliz competir em preço em escala. A Pinecone vence por ser totalmente gerenciada e com poucas operações. Combine-o com embeddings + um LLM de OpenAI ou Cláudioe alimente-o com páginas raspadas com Fogo de artifício. Para estimar a pilha inteira, use nosso Calculadora de custos de IA.
Sim – o plano Starter é gratuito e sem servidor, com cerca de 2 GB de armazenamento e sem cartão de crédito, o suficiente para criar e testar um pequeno aplicativo RAG.
Cadastre-se em pinecone.io, crie um índice no console (correspondendo à sua dimensão de incorporação), vá para API Keys e copie a chave. Use-o com o SDK e seu host de índice.
A cobrança sem servidor é baseada no uso: você paga pelo armazenamento (por GB/mês) mais leituras e gravações (por milhão de unidades), com um mínimo mensal em planos pagos. O custo aumenta com o tamanho dos dados e com o volume de consultas, e não por usuário.
O pgvector é gratuito se você já executa o Postgres e geralmente é mais barato, até alguns milhões de vetores. A Pinecone custa mais, mas é totalmente gerenciada, pode ser ampliada ainda mais e não precisa de trabalho operacional – a compensação é dinheiro por tempo.
Não afiliado à Pinha. Os preços são estimativas de referência – verifique sempre na página oficial de preços.