Полная таблица цен — ваша загруженность
Ссылка на токены $/1M (июнь 2026 г.), ежемесячная стоимость указана выше.
| Поставщик | Модель | В $/1 млн. | Выход $/1 миллион | Стоимость / мес. |
|---|
Самый дешевый по варианту использования
- Большой объем/простой (классификация, извлечение, маршрутизация): Gemini 2.0 Flash или GPT-4o mini — копейки за тысячу запросов.
- Чат-боты и поддержка: GPT-4o mini или Gemini 2.5 Flash — дешево, быстро, достаточно хорошо; увидеть калькулятор стоимости чат-бота.
- RAG/длинный контекст: Gemini 2.5 Flash или Pro (низкая цена ввода помогает при загрузке извлеченных фрагментов); увидеть Калькулятор стоимости Тряпки.
- Жесткие рассуждения/кодирование: Клод Сонет 4 или GPT-4o; Клод Опус/о3 только тогда, когда вам это действительно нужно.
- Нужен бесплатный уровень: Gemini (AI Studio) — единственная из трех, имеющая действительно бесплатную квоту.
Как на самом деле выбрать
Лояльность к бренду — самая дорогая привычка в сфере ИИ. Три провайдера постоянно обгоняют друг друга, и реальная разница в стоимости возникает из-за двух вещей, которые вы контролируете: уровень модели ты выбираешь и как длинные ваши результаты являются. Пограничная модель с короткими ответами может быть дешевле, чем «дешевая» модель с бессвязными ответами. Оцените рабочую нагрузку, а не логотип — таблица выше делает именно то же самое с вашими цифрами.
Детализация одного поставщика с помощью Калькулятор GPT-4o, Калькулятор Клода или Калькулятор Близнецов, сравните все модели сразу на Полный калькулятор стоимости AI APIили оцените весь продукт с помощью Оценщик стоимости приложения с искусственным интеллектом.
Часто задаваемые вопросы
Что в целом дешевле? Для мощных, но дешевых моделей Gemini 2.0 Flash и GPT-4o mini. Для флагманов это ближе и зависит от нагрузки.
Означает ли самая дешевая модель самая низкая общая стоимость? Не всегда — победителем может стать более дорогая модель, отвечающая меньшим количеством токенов. Сравните реальное количество токенов.