Все новинки
7 августа, OpenAI GPT-5 Nano, Mini и Chat – новые модели стали доступны в течение 3 часов после запуска!
7 августа, OpenAI GPT OSS 120B и 20B – модели доступны, в том числе в быстром варианте (скорость генерации 500–600 токенов в секунду!)
7 августа, Claude Opus 4.1 – улучшенный вариант Opus 4.1. Доступен в режиме «с размышлениями» и «без размышлений».
16 июля, Google отключила preview-версии Gemini 2.5 Flash. Мы сделали перенаправление в релизную версию 2.5 Fllash, но а) не везде, б) она дороже. Если вы пользовались этими моделями – поправьте свои настройки!
15 июля, Llama 4 Scout на 10М контекста – уже вышедшая Scout, но с поставщиком, поддерживающим крупнейший в мире контекст этой модели – 10М токенов! Обычно книгу можно уложить в 1М токенов, так что тут модель может обработать целых 10 книг!
12 июля, Kimi K2 – топовая китайская опенсорс модель размером в 1Т, которая соперничает с лучшими сетями типа Sonnet 4, OpenAI o3 по значительно более низкой цене
10 июля, AI Transform – 14(!) нейросетей для разнообразных операций с изображениями: восстановление, смена стиля, смена фона, трансформация в профессиональное фото...
10 июля, Grok 4 – самая свежая модель от xAI Илона Маска. Согласно бенчмаркам, обгоняет o3, Opus 4, Gemini 2.5 Pro.
2 июля, Imagen 4 Fast, Imagen 4 Ultra – топовые модели генерации изображений от Google
17 июня, Gemini Pro 2.5, Flash 2.5 – официальный выход 2.5 моделей от Google
10 июня, OpenAI o3 – цены снижены на 80% вслед за OpenAI!
5 июня, Gemini Pro 2.5 Preview – обновление топовой модели от Google
2 июня, FLUX.1 Kontext Pro/Max – топовая нейросеть для генерации и редактирования изображений. Поддерживает: генерацию по тексту, редактирование изображения, генерацию по нескольким изображениям/референсам
22 мая, Claude Sonnet 4 и Opus 4 от Anthropic – модели стали доступны в течение 2 часов после запуска!
20 мая, Gemini Flash 2.5 Preview 05 20. Вышла на презентации Google IO, мы подключили в течение пары часов :)
17 мая, LTX 0.9.7, генерация Image-To-Video и Text-to-Video, быстрая и дешевая
16 мая, ряд нейросетей для редактирования изображений – Recraft Edit, Recraft Upscale, Colorization, Ideogram V3 Replace Background, Ideogram V3 Edit
8 мая, Mistral Medium 3
2 мая, модели генерации изображений Ideogram V3 и Recraft V3 (У Recraft V3 более 30 стилей генерации!)
29 апреля, модели Qwen 3 от Alibaba
18 апреля, Gemini Flash 2.5 от Google
16 апреля, o4-mini от OpenAI – модели стали доступны в течение 1.5 часов после запуска!
14 апреля, GPT 4.1 от OpenAI – модели стали доступны в течение 1.5 часов после запуска!
7 апреля, Google Flash Edit – модель, позволяющая редактировать изображения по простому текстовому запросу.
6 апреля, Gemini Pro 2.5 Preview – топ 1 модель по оценкам пользователей! Поддержка 1 млн токенов контекста!
6 апреля, LLama 4 Scout и Maverick
30 марта, PDF OCR 1.0 – модель для распознавания PDF в текст, включая графические PDF. Поддерживает PDF до 1000 страниц.
26 марта, gpt-4o-mini-transcribe и gpt-4o-transcribe от OpenAI – новые модели распознавания речи-в-текст.
22 марта, gpt-4o-mini-tts от OpenAI – новая качественная модель озвучки с возможностью задавать характер.
19 марта, 7 новых vision-моделей – т.е. моделей для запросов по изображениям. Flash 2.0, Sonnet 3.7 в vision-вариантах, Mistral 24B, Gemma 27B, Qwen 2.5 72B, Qwen VL Plus, Qwen VL Max.
10 марта – 4 research модели поверх Sonnet 3.7 – Online High Quality, Deep Online, Research, Deep Research для формирования полноценных исследований на 8–9 страниц A4! Подробнее о Research-моделях + примеры
28 февраля, GPT-4.5 Preview от OpenAI уже доступна!
26 февраля, Sonnet 3.7 c размышлениями доступна! Поддерживается 3 варианта модели, предлагающие разный бюджет на размышления: low, medium (по умолчанию), high. Модели полностью совместимы с обычным OpenAI API, доработок не требуется.
25 февраля, новая Sonnet 3.7 – новая Sonnet 3.7 уже доступна на сервисе!
14 февраля, версии модели OpenAI: o3-mini – o3-mini-high с предустановленным пресетом глубоких размышлений, и o3-mini-online с возможностью поиска в Интернете.
5 февраля, Google Gemini Flash 2.0 – новая модель от Google!
1 февраля, o3-mini от OpenAI уже доступна! (Также модель o1 возвращена на сервис после долгого отключения)
1 февраля, Qwen Turbo, Plus, Max – доступны свежие модели от Alibaba group! Max по метрикам превосходят другие модели, включая западные (кроме рассуждающих)
29 января, Deepseek R1 от Perplexity – R1 с онлайн-поиском информации!
28 января, альтернативные провайдеры для Deepseek R1 и V3 – поскольку оригинальный DeepSeek сейчас находится под нагрузкой.
25 января, серия online-моделей – теперь целый ряд моделей могут отвечать с учетом интернет-поиска, т.е. текущих данных. Доступны в онлайн-варианте: GPT-4o-mini, GPT-4o, Sonnet/Haiku 3.5, Google Pro 1.5, Llama 3.3, EVA Qwen 72B.
20 января, подключена Deepseek R1 – топовая рассуждающая модель от Deepseek, по метрикам сравнимая с o1, но по цене дешевле, чем o1-mini; она также быстрее o1 и o1-mini.
8 января, Kling Standart 1.6, Kling Pro V1.6 – топовые модели для генерации видео от Kling.
Более старые новости по подключенным моделям

Текстовые модели

Модели OpenAI: ChatGPT, GPT-4o, GPT-4o-mini...

Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.

Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Вам запрещён доступ

Настройках

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
OpenAI: GPT-5 Chat ? `openai/gpt-5-chat` Базовый+GPT-4 топ tools structured-outputs	0.175	1.40	400000	7 авг	да
OpenAI: GPT-5 Mini ? `openai/gpt-5-mini` tools structured-outputs	0.037	0.30	400000	7 авг	да
OpenAI: GPT-5 Nano ? `openai/gpt-5-nano` дешевая и с большим контекстом tools structured-outputs	0.009	0.06	400000	7 авг	да
OpenAI: gpt-oss-120b ? `openai/gpt-oss-120b`	0.015	0.065	128000	7 авг	нет
OpenAI: gpt-oss-120b (fast) ? `openai/gpt-oss-120b-fast` tools	0.021	0.085	128000	7 авг	нет
OpenAI: gpt-oss-20b (fast) ? `openai/gpt-oss-20b` tools	0.014	0.06	128000	7 авг	нет
OpenAI: o3 ? `openai/o3` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика tools structured-outputs	0.6	2.4	200000	7 июн	да
OpenAI: GPT-4o (2024-11-20) Online HQ ? `openai/gpt-4o-2024-11-20-online-hq` Базовый+GPT-4 За вызов: 2.0 р. tools structured-outputs	0.3	1.2	128000	14 мая	да
OpenAI: GPT-4o Online HQ ? `openai/gpt-4o-online-hq` Базовый+GPT-4 За вызов: 2.0 р. топ от 13 мая tools	0.6	1.8	128000	14 мая	да
OpenAI: o4-mini-high (пресет для глубоких размышлений от o4-mini) ? `openai/o4-mini-high` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика tools structured-outputs	0.28	1.12	200000	16 апр	да
OpenAI: o4-mini (для размышлений, не рек. для обычных задач) ? `openai/o4-mini` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика tools structured-outputs	0.28	1.12	200000	16 апр	да
OpenAI: GPT-4.1 ? `openai/gpt-4.1` Базовый+GPT-4 топ от 14 апреля tools structured-outputs	0.28	1.12	1000000	14 апр	да
OpenAI: GPT-4.1 Mini ? `openai/gpt-4.1-mini` tools structured-outputs	0.06	0.24	1000000	14 апр	да
OpenAI: GPT-4.1 Nano ? `openai/gpt-4.1-nano` дешевая и с большим контекстом tools structured-outputs	0.015	0.06	1000000	14 апр	да
OpenAI: GPT-4.5 (Preview) ? `openai/gpt-4.5-preview` Базовый+GPT-4 (не Тестовый)	20.00	40.00	128000	28 фев	да
OpenAI: o3-mini (с онлайн поиском) ? `openai/o3-mini-online` Базовый+GPT-4 (не Тестовый) За вызов: 3.45 р. биллинг с учетом размышлений (см. ?) онлайн размышления, математика structured-outputs	0.28	1.12	200000	14 фев	да
OpenAI: o3-mini-high (пресет для глубоких размышлений от o3-mini) ? `openai/o3-mini-high` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика structured-outputs	0.28	1.12	200000	14 фев	да
OpenAI: o3-mini (для размышлений, не рек. для обычных задач) ? `openai/o3-mini` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика structured-outputs	0.28	1.12	200000	1 фев	да
OpenAI: o1 (для размышлений, не рек. для обычных задач) ? `openai/o1` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика tools structured-outputs	3.5	14.0	128000	18 дек 24	да
OpenAI: GPT-4o (2024-11-20) ? `openai/gpt-4o-2024-11-20` Базовый+GPT-4 tools structured-outputs	0.3	1.2	128000	26 ноя 24	да
OpenAI: o1-mini (не рек. для обычных задач) ? `openai/o1-mini` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика	0.6	2.7	128000	13 сен 24	нет
OpenAI: GPT-4o (последняя, экспериментальная) ? `openai/gpt-4o-latest` Базовый+GPT-4 ТОП!	0.6	1.8	128000	14 авг 24	да
OpenAI: GPT-4o (до 64 000 выходных токенов) (альфа-версия) ? `openai/gpt-4o-64k-output` Базовый+GPT-4 (не Тестовый)	0.72	2.16	128000	14 авг 24	да
OpenAI: GPT-4o (2024-08-06) ? `openai/gpt-4o-2024-08-06` Базовый+GPT-4 топ от 6 августа tools structured-outputs	0.3	1.2	128000	6 авг 24	да
OpenAI: GPT-4o (2024-05-13) `openai/gpt-4o-2024-05-13` Базовый+GPT-4 tools	0.6	1.8	128000	13 мая 24	да
OpenAI: GPT-4o mini ? `openai/gpt-4o-mini` tools structured-outputs	0.02	0.08	128000	18 июл 24	да
OpenAI: GPT-4o ? `openai/gpt-4o` Базовый+GPT-4 топ от 13 мая tools	0.6	1.8	128000	25 мая 24	да
OpenAI: GPT-4 Turbo (gpt-4-turbo-2024-04-09) ? `openai/gpt-4-turbo` Базовый+GPT-4 топ!	1.5	4.5	128000	10 апр 24	да
OpenAI: GPT-4 Turbo (0125-preview) ? `openai/gpt-4-turbo-preview` Базовый+GPT-4 tools	1.5	4.5	128000	6 июн 24	да
OpenAI: GPT-4 Turbo (1106-preview) ? `openai/gpt-4-1106-preview` Базовый+GPT-4	1.5	4.5	128000	1 фев 24	да
OpenAI: GPT-4 32k `openai/gpt-4-32k` Базовый+GPT-4	9	18	32767	11 сен 23	да
OpenAI: GPT-4 ? `openai/gpt-4` Базовый+GPT-4	4.5	9	8191	14 дек 23	да
OpenAI: GPT-3.5 Turbo 16k `openai/gpt-3.5-turbo-16k`	0.45	0.6	16383	30 сен 23	да
OpenAI: GPT-3.5 Turbo ? `openai/gpt-3.5-turbo`	0.15	0.3	4095	7 ноя 23	да

Модели Anthropic: Claude Sonnet, Opus, Haiku

Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Рекомендуем их нейросети Claude 3 – Haiku для дешевой и быстрой обработки большого контекста, Opus – для максимально качественной работы.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Anthropic: Claude Opus 4.1 Thinking ? `anthropic/claude-opus-4.1-thinking` Базовый+GPT-4 ТОП! tools	2.0	10.0	200000	7 авг	да
Anthropic: Claude Opus 4.1 ? `anthropic/claude-opus-4.1` Базовый+GPT-4 ТОП! tools	2.0	10.0	200000	7 авг	да
Anthropic: Claude Opus 4 Deep Research 1.0 ? `anthropic/claude-opus-4-deep-research-1.0` Базовый+GPT-4 (не Тестовый) За вызов: 60.0 р. топ от 28 мая online, research примерная стоимость запроса 500-600 р.	2.0	10.0	200000	28 мая	да
Anthropic: Claude Opus 4 Online HQ ? `anthropic/claude-opus-4-online-hq` Базовый+GPT-4 (не Тестовый) За вызов: 4.0 р. топ от 28 мая онлайн	2.0	10.0	200000	28 мая	да
Anthropic: Claude Sonnet 4 Deep Research 1.0 ? `anthropic/claude-sonnet-4-deep-research-1.0` Базовый+GPT-4 (не Тестовый) За вызов: 30.0 р. топ от 28 мая online, research примерная стоимость запроса 100-150 р.	0.4	2.0	200000	28 мая	да
Anthropic: Claude Sonnet 4 Deep Online ? `anthropic/claude-sonnet-4-deep-online` Базовый+GPT-4 (не Тестовый) За вызов: 12.0 р. топ от 28 мая онлайн примерная стоимость запроса 30-50 р.	0.4	2.0	200000	28 мая	да
Anthropic: Claude Sonnet 4 Research ? `anthropic/claude-sonnet-4-online-research` Базовый+GPT-4 (не Тестовый) За вызов: 20.0 р. топ от 28 мая online, research примерная стоимость запроса 80-120 р.	0.4	2.0	200000	28 мая	да
Anthropic: Claude Sonnet 4 Online HQ ? `anthropic/claude-sonnet-4-online-hq` Базовый+GPT-4 (не Тестовый) За вызов: 2.0 р. топ от 28 мая онлайн	0.4	2.0	200000	28 мая	да
Anthropic: Claude Opus 4 (Thinking High) ? `anthropic/claude-opus-4-thinking-high` Базовый+GPT-4 (не Тестовый) размышления tools	2.0	10.0	200000	22 мая	да
Anthropic: Claude Sonnet 4 (Thinking High) ? `anthropic/claude-sonnet-4-thinking-high` Базовый+GPT-4 (не Тестовый) топ от 22 мая размышления tools	0.4	2.0	200000	22 мая	да
Anthropic: Claude Opus 4 (Thinking) ? `anthropic/claude-opus-4-thinking` Базовый+GPT-4 (не Тестовый) ТОП! размышления tools	2.0	10.0	200000	22 мая	да
Anthropic: Claude Sonnet 4 (Thinking) ? `anthropic/claude-sonnet-4-thinking` Базовый+GPT-4 (не Тестовый) топ от 22 мая размышления tools	0.4	2.0	200000	22 мая	да
Anthropic: Claude Opus 4 ? `anthropic/claude-opus-4` Базовый+GPT-4 ТОП! tools	2.0	10.0	200000	22 мая	да
Anthropic: Claude Sonnet 4 ? `anthropic/claude-sonnet-4` Базовый+GPT-4 топ от 22 мая tools	0.4	2.0	200000	22 мая	да
Anthropic: Claude 3.7 Sonnet Deep Research 1.0 ? `anthropic/claude-3.7-sonnet-deep-research-1.0` Базовый+GPT-4 (не Тестовый) За вызов: 30.0 р. топ от 10 марта online, research примерная стоимость запроса 100-150 р.	0.4	2.0	200000	10 мар	да
Anthropic: Claude 3.7 Sonnet Deep Online ? `anthropic/claude-3.7-sonnet-deep-online` Базовый+GPT-4 (не Тестовый) За вызов: 12.0 р. топ от 9 марта онлайн примерная стоимость запроса 30-50 р.	0.4	2.0	200000	9 мар	да
Anthropic: Claude 3.7 Sonnet Research ? `anthropic/claude-3.7-sonnet-online-research` Базовый+GPT-4 (не Тестовый) За вызов: 20.0 р. топ от 9 марта online, research примерная стоимость запроса 80-120 р.	0.4	2.0	200000	9 мар	да
Anthropic: Claude 3.7 Sonnet (online высокого качества) ? `anthropic/claude-3.7-sonnet-online-hq` Базовый+GPT-4 (не Тестовый) За вызов: 2.0 р. топ от 9 марта онлайн	0.4	2.0	200000	9 мар	да
Anthropic: Claude 3.7 Sonnet Thinking High (новая от 24 февраля) ? `anthropic/claude-3.7-sonnet-thinking-high` Базовый+GPT-4 (не Тестовый) топ от 24 февраля размышления	0.4	2.0	200000	26 фев	да
Anthropic: Claude 3.7 Sonnet Thinking Low (новая от 24 февраля) ? `anthropic/claude-3.7-sonnet-thinking-low` Базовый+GPT-4 (не Тестовый) размышления	0.4	2.0	200000	26 фев	да
Anthropic: Claude 3.7 Sonnet Thinking (новая от 24 февраля) ? `anthropic/claude-3.7-sonnet-thinking` Базовый+GPT-4 (не Тестовый) размышления	0.4	2.0	200000	26 фев	да
Anthropic: Claude 3.7 Sonnet (новая от 24 февраля) ? `anthropic/claude-3.7-sonnet` Базовый+GPT-4 топ от 24 февраля tools	0.4	2.0	200000	24 фев	да
Anthropic: Claude 3.5 Haiku (online) ? `anthropic/claude-3-5-haiku-online` За вызов: 3.45 р. топ от 5 ноября tools	0.14	0.70	200000	25 янв	да
Anthropic: Claude 3.5 Sonnet (новая от 22 октября) (online) ? `anthropic/claude-3.5-sonnet-online` Базовый+GPT-4 За вызов: 3.45 р. топ от 22 октября tools	0.4	2.0	200000	25 янв	да
Anthropic: Claude 3.5 Haiku ? `anthropic/claude-3-5-haiku` топ от 5 ноября tools	0.14	0.70	200000	5 ноя 24	да
Anthropic: Claude 3.5 Sonnet (новая от 22 октября) ? `anthropic/claude-3.5-sonnet` Базовый+GPT-4 топ от 22 октября tools	0.4	2.0	200000	22 окт 24	да
Anthropic: Claude 3 Haiku ? `anthropic/claude-3-haiku` дешевая и с большим контекстом tools	0.0375	0.1875	200000	14 мар 24	да
Anthropic: Claude 3 Opus ? `anthropic/claude-3-opus` Базовый+GPT-4 ТОП! tools	2.0	10.0	200000	6 мар 24	да
Anthropic: Claude 3 Sonnet (выключен 7 августа, перенаправляется в Sonnet 3.5) ? `anthropic/claude-3-sonnet` Базовый+GPT-4 tools	0.4	2.0	200000	6 мар 24	да
Anthropic: Claude v2.0 ? `anthropic/claude-2.0` Базовый+GPT-4	1.2	3.6	100000	23 ноя 23	да
Anthropic: Claude v2.1 ? `anthropic/claude-2` Базовый+GPT-4	1.2	3.6	200000	23 ноя 23	да

Модели Perplexity: онлайн, с доступом к Интернету и фактической информации

Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.

Наша новость на Хабре о моделях Perplexity

Внимание: онлайн-модель дополнительно тарифицируется по каждому запросу (т.к. идет вызов онлайн-поиска). Модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.

Рекомендация: поскольку Perplexity постоянно выпускает новые модели и удаляет обработку старых, рекомендуется установить в ваших приложениях ID псевдонима для малой или большой модели – тогда сервис сам перенаправит ваш запрос в самую последнюю версию (по ней и будет происходить тарификация)

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Perplexity: Sonar Reasoning Pro ? `perplexity/sonar-reasoning-pro-online` Базовый+GPT-4 (не Тестовый) За вызов: 8.0 р. онлайн	0.30	1.20	128000	28 мая	нет
Perplexity: Sonar Pro ? `perplexity/sonar-pro-online` Базовый+GPT-4 (не Тестовый) За вызов: 8.0 р. онлайн	0.45	2.20	128000	28 мая	нет
Perplexity: Sonar ? `perplexity/sonar-online` За вызов: 0.85 р. рекомендуется онлайн	0.15	0.15	128000	31 янв	нет
Perplexity: Sonar Reasoning (на базе DeepSeek R1) ? `perplexity/sonar-r1-online` Базовый+GPT-4 За вызов: 0.85 р. онлайн размышления	0.13	0.70	127000	29 янв	нет
Perplexity: Llama 3.1 Sonar 70B Online ? `perplexity/llama-3.1-sonar-large-128k-online` За вызов: 0.85 р. рекомендуется онлайн	0.15	0.15	128000	8 авг 24	нет
Perplexity: Llama 3.1 Sonar 8B Online ? `perplexity/llama-3.1-sonar-small-128k-online` За вызов: 0.85 р. онлайн	0.04	0.04	128000	8 авг 24	нет
Perplexity, последняя большая онлайн модель (перенаправляет в нужный ID) `perplexity/latest-large-online` рекомендуется онлайн	0	0	32000	8 авг 24	нет
Perplexity, последняя малая онлайн модель (перенаправляет в нужный ID) `perplexity/latest-small-online` онлайн	0	0	32000	8 авг 24	нет

Модели Google: Gemini Pro, Flash

Нейросети от Google. Достаточно дешевые.
Рекомендуются последние версии Gemini, однако пользователи жалуются, что даже при не очень большом контексте (5К+ символов) Google относительно часто возвращает ошибки и очень маленькие ответы (июнь 2024).
В случае, если нужна точность, рекомендуем модели Claude 3 с большим контекстом.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Google: Gemini 2.5 Flash Lite ? `google/gemini-2.5-flash-lite` дешевая и с большим контекстом tools structured-outputs	0.015	0.06	1000000	23 июл	нет
Google: Gemini 2.5 Flash (Thinking) ? `google/gemini-2.5-flash-thinking` tools structured-outputs	0.09	0.75	1000000	17 июн	нет
Google: Gemini 2.5 Flash ? `google/gemini-2.5-flash` tools structured-outputs	0.09	0.75	1000000	17 июн	нет
Google: Gemini 2.5 Flash Lite Preview 06-17 ? `google/gemini-2.5-flash-lite-pre-06-17` дешевая и с большим контекстом tools structured-outputs	0.015	0.06	1000000	17 июн	нет
Google: Gemini 2.5 Pro ? `google/gemini-2.5-pro` Базовый+GPT-4 tools structured-outputs	0.37	3.0	1000000	17 июн	нет
Google: Gemini 2.5 Pro Preview (обновлена 5 июня) ? `google/gemini-2.5-pro-preview` Базовый+GPT-4 tools structured-outputs	0.37	3.0	1000000	5 июн	нет
Google: Gemini 2.5 Flash Preview 05 20 (c 16 июля отключена, перенаправляется в 2.5 Flash) ? `google/gemini-2.5-flash-pre-05-20` дешевая и с большим контекстом tools structured-outputs	0.018	0.07	1000000	20 мая	нет
Google: Gemini 2.5 Flash Preview (c 16 июля отключена, перенаправляется в 2.5 Flash) ? `google/gemini-2.5-flash-pre` дешевая и с большим контекстом structured-outputs	0.018	0.07	1000000	18 апр	нет
Google: Gemini 2.5 Pro Preview (03-25) ? `google/gemini-2.5-pro-preview-03-25` Базовый+GPT-4 tools structured-outputs	0.18	1.90	1000000	6 мая	нет
Gemma 3 27B (опенсорс) ? `google/gemma-3-27b-it`	0.05	0.08	128000	13 мар	нет
Google: Gemini Flash 2.0 Lite ? `google/gemini-2.0-flash-lite-001` Базовый+GPT-4 дешевая и с большим контекстом	0.015	0.045	1000000	26 фев	нет
Google: Gemini Flash 2.0 ? `google/gemini-2.0-flash-001` Базовый+GPT-4 дешевая и с большим контекстом	0.022	0.09	1000000	5 фев	нет
Google: Gemini Pro 1.5 (версия 002 от 25 сентября) (online) ? `google/gemini-pro-1.5-online` Базовый+GPT-4 За вызов: 3.45 р.	0.5	1.5	1000000	25 янв	нет
Gemini 1.5 Flash-8B ? `google/gemini-flash-1.5-8b` дешевая и с большим контекстом tools	0.015	0.04	1000000	7 окт 24	нет
Gemma 2 27B (опенсорс) ? `google/gemma-2-27b-it`	0.10	0.10	8192	17 июл 24	нет
Google: Gemma 2 9B (опенсорс) ? `google/gemma-2-9b-it`	0.03	0.03	8192	28 июн 24	нет
Google: Gemini Flash 1.5 (версия 002 от 25 сентября) ? `google/gemini-flash-1.5` Базовый+GPT-4 дешевая и с большим контекстом	0.017	0.05	1000000	25 сен 24	нет
Google: Gemini Pro 1.5 (версия 002 от 25 сентября) ? `google/gemini-pro-1.5` Базовый+GPT-4	0.5	1.5	1000000	25 сен 24	нет

Модели DeepSeek: V3, R1

Нашумевшие нейросети от DeepSeek. Достаточно дешевые.
Они крайне дешевые в своем классе – но только при использовании самого провайдера DeepSeek, который логирует запросы (и в конце января DeepSeek не смог переварить интерес к своим моделям и лег)
Поэтому мы также поддерживаем альтернативных провайдеров для DeepSeek (постфикс alt) – они дороже, но не декларируют логирование данных и в целом часто устойчивее.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
DeepSeek R1 (05-28, конкурент o1, для размышлений, альтернативный провайдер) ? `deepseek/deepseek-r1-alt-0528` Базовый+GPT-4 общие вопросы	0.075	0.30	128000	29 мая	нет
DeepSeek V3 0324 600B (альт провайдер, быстрая) ? `deepseek/deepseek-chat-0324-alt-fast` общие вопросы и программирование	0.16	0.22	128000	31 мар	нет
DeepSeek V3 0324 600B (альтернативный провайдер, поддержка structured outputs) ? `deepseek/deepseek-chat-0324-alt-structured` общие вопросы и программирование tools structured-outputs	0.20	0.20	128000	31 мар	нет
DeepSeek V3 0324 600B (альтернативные провайдеры) ? `deepseek/deepseek-chat-0324-alt` общие вопросы и программирование	0.16	0.16	128000	25 мар	нет
DeepSeek R1 дистиллят на базе LLama 3.3 70B (быстрая, более 200 токенов в секунду) ? `deepseek/deepseek-r1-distill-llama-70b-fast` Базовый+GPT-4 общие вопросы	0.45	0.45	32000	14 фев	нет
DeepSeek R1 (конкурент o1, альтернативный провайдер, быстрее, но дороже) ? `deepseek/deepseek-r1-alt-fast` Базовый+GPT-4 размышления	0.36	0.99	163840	3 фев	нет
DeepSeek R1 (конкурент o1, альтернативный провайдер, онлайн) ? `deepseek/deepseek-r1-alt-online` Базовый+GPT-4 За вызов: 3.45 р. онлайн размышления	0.12	0.36	128000	29 янв	нет
DeepSeek R1 дистиллят на базе LLama 3.3 70B (для размышлений) ? `deepseek/deepseek-r1-distill-llama-70b` Базовый+GPT-4 общие вопросы	0.04	0.15	128000	28 янв	нет
DeepSeek R1 (конкурент o1, для размышлений, альтернативный провайдер) ? `deepseek/deepseek-r1-alt` Базовый+GPT-4 общие вопросы	0.12	0.36	128000	3 фев	нет
DeepSeek R1 (конкурент o1, для размышлений, не рекомендуется для обычного пользования) ? `deepseek/deepseek-r1` Базовый+GPT-4 провайдер логирует данные общие вопросы	0.20	0.80	65536	20 янв	нет
DeepSeek V3 600B (альтернативные провайдеры) ? `deepseek/deepseek-chat-alt` устарела, переходите на deepseek/deepseek-chat-0324-alt общие вопросы и программирование	0.16	0.16	128000	14 янв	нет
DeepSeek V3 0324 600B ? `deepseek/deepseek-chat` провайдер логирует данные общие вопросы tools	0.05	0.16	65536	24 мар	нет
DeepSeek-Coder-V2 236B MoE (v2.5) (теперь универсальная модель, перенаправляется в DeepSeek Chat) ? `deepseek/deepseek-coder` топ программирование провайдер логирует данные	0.04	0.05	128000	11 сен 24	нет

Модели xAI: Grok 2, 3

Модели Grok от компании Элона Maска xAI.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Grok 4 (Thinking) ? `x-ai/grok-4` Базовый+GPT-4 (не Тестовый) топ размышления tools structured-outputs	0.90	4.5	256000	10 июл	да
Grok 3 Beta ? `x-ai/grok-3-beta` Базовый+GPT-4 (не Тестовый) провайдер логирует данные	0.45	2.25	128000	10 апр	да
Grok 3 Mini Beta (Thinking, Low effort) ? `x-ai/grok-3-mini-beta-thinking-low` провайдер логирует данные размышления	0.05	0.075	128000	10 апр	да
Grok 3 Mini Beta (Thinking High) ? `x-ai/grok-3-mini-beta-thinking-high` провайдер логирует данные размышления	0.05	0.075	128000	10 апр	да
Grok 3 Mini Beta (Thinking) ? `x-ai/grok-3-mini-beta-thinking` провайдер логирует данные размышления	0.05	0.075	128000	10 апр	да
xAI: Grok 2 1212 ? `x-ai/grok-2-1212` Базовый+GPT-4 tools	0.3	1.5	128000	16 дек 24	да

Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium

Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Mistral: Devstral Medium ? `mistralai/devstral-medium` программирование tools structured-outputs	0.06	0.30	128000	11 июл	нет
Mistral: Mistral Small 3.2 24B ? `mistralai/mistral-small-3.2-24b-instruct` tools structured-outputs	0.015	0.045	128000	25 июн	нет
Mistral: Devstral Small (25-07) ? `mistralai/devstral-small` программирование tools structured-outputs	0.015	0.045	128000	11 июл	нет
Mistral Medium 3 ? `mistralai/mistral-medium-3` tools structured-outputs	0.06	0.30	131000	8 мая	нет
Mistral: Codestral 2501 ? `mistralai/codestral-2501` программирование	0.05	0.14	256000	17 янв	нет
Mistral: Mistral Large 2 (версия 2411) ? `mistralai/mistral-large-2411` Базовый+GPT-4 tools	0.45	1.35	128000	19 ноя 24	нет
Ministral 8B ? `mistralai/ministral-8b` tools	0.02	0.02	128000	21 окт 24	нет
Mistral: Mistral NeMo 12B ? `mistralai/mistral-nemo` поддерживает русский общие вопросы tools	0.05	0.05	128000	19 июл 24	нет
Mistral: Mixtral 8x22B Instruct ? `mistralai/mixtral-8x22b-instruct`	0.15	0.15	65536	18 апр 24	нет
Mistral: Mistral Large 2 ? `mistralai/mistral-large` Базовый+GPT-4	0.45	1.35	128000	24 июл 24	нет
Mistral Medium ? `mistralai/mistral-medium` Базовый+GPT-4	0.42	1.25	32000	15 янв 24	нет
Mistral Small ? `mistralai/mistral-small`	0.30	0.90	32000	27 фев 24	нет
Mistral Tiny ? `mistralai/mistral-tiny`	0.04	0.04	32000	27 фев 24	нет
Mistral: Mixtral 8x7B Instruct ? `mistralai/mixtral-8x7b-instruct` дешевая 8x7B с большим контекстом	0.045	0.045	32768	18 мар 24	нет
Mistral: Mistral Small 3.1 24B ? `mistralai/mistral-small-3.1-24b-instruct`	0.02	0.05	128000	19 мар	нет
Mistral: Mistral Small 3 ? `mistralai/mistral-small-24b-instruct-2501`	0.02	0.05	32000	31 янв	нет
Mistral 7B Instruct v0.3 ? `mistralai/mistral-7b-instruct`	0.035	0.035	8192	29 мая 24	нет

Модели Cohere: с фокусом на RAG, function calling, tools

Модели от Cohere с фокусом на RAG, function calling, tools.
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Cohere: Command R+ (август 2024) ? `cohere/command-r-plus-08-2024` Базовый+GPT-4 общие вопросы и ролеплей	0.38	1.5	128000	31 авг 24	нет
Cohere: Command R (август 2024) ? `cohere/command-r-08-2024` общие вопросы и ролеплей	0.025	0.09	128000	31 авг 24	нет
Cohere: Command R+ ? `cohere/command-r-plus` tools	0.45	2.25	128000	6 апр 24	нет
Cohere: Command R ? `cohere/command-r`	0.075	0.225	128000	6 апр 24	нет
Cohere: Command R7B (12-2024) ? `cohere/command-r7b-12-2024` За вызов: 0.005 р.	0.01	0.025	128000	16 дек 24	нет

Модели Qwen – опенсорс модели от Tongyi Qianwen (Alibaba)

Серия языковых моделей от Tongyi Qianwen (Alibaba group, Китай).
Старшие модели показывают неплохое знание русского языка – но рекомендуется ставить температуру пониже (около 0.2) и явно прописывать «отвечать на русском языке».

Блог-запись о запуске моделей

Используя эти модели, вы соглашаетесь с

Tongyi Qianwen LICENSE AGREEMENT
Для модели 110B также доступна translate-версия.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Qwen: Qwen3 30B A3B Instruct 2507 ? `qwen/qwen3-30b-a3b-instruct-2507`	0.03	0.12	128000	31 июл	нет
Qwen: Qwen3 235B A22B Thinking 2507 ? `qwen/qwen3-235b-a22b-07-25-thinking` Базовый+GPT-4 tools	0.045	0.45	128000	25 июл	нет
Qwen3 Coder 480B A35B (с поддержкой tools) ? `qwen/qwen3-coder-tools` программирование и общие задачи tools	0.30	0.47	256000	23 июл	нет
Qwen3 Coder 480B A35B ? `qwen/qwen3-coder` программирование и общие задачи	0.30	0.30	256000	23 июл	нет
Qwen: Qwen3 235B A22B 2507 ? `qwen/qwen3-235b-a22b-07-25` Базовый+GPT-4	0.035	0.12	256000	22 июл	нет
Qwen: Qwen3 30B A3B ? `qwen/qwen3-30b` опциональные размышления	0.015	0.055	41000	29 апр	нет
Qwen: Qwen3 14B ? `qwen/qwen3-14b` За вызов: 0.003 р. опциональные размышления	0.012	0.033	41000	29 апр	нет
Qwen: Qwen3 32B ? `qwen/qwen3-32b` опциональные размышления	0.015	0.055	41000	29 апр	нет
Qwen: Qwen3 235B A22B ? `qwen/qwen3-235b` Базовый+GPT-4 опциональные размышления	0.035	0.12	41000	29 апр	нет
Qwen: QwQ 32B ? `qwen/qwq-32b` размышления	0.05	0.07	128000	6 мар	нет
Qwen2.5 72B Instruct (с поддержкой structured outputs) ? `qwen/qwen-2.5-72b-structured` Базовый+GPT-4 structured-outputs	0.22	0.22	32000	19 дек 24	нет
Qwen: QwQ 32B Preview ? `qwen/qwq-32b-preview` Базовый+GPT-4 конкурент o1 по рассуждениям рассуждения	0.03	0.10	32768	28 ноя 24	нет
Qwen2.5 Coder 32B Instruct ? `qwen/qwen-2.5-coder-32b-instruct` недорогая для программирования программирование и общие вопросы	0.05	0.05	128000	12 ноя 24	нет
Qwen2.5 7B Instruct ? `qwen/qwen-2.5-7b-instruct`	0.04	0.04	128000	16 окт 24	нет
Qwen2.5 72B Instruct ? `qwen/qwen-2.5-72b-instruct` ролеплей и общие вопросы	0.60	0.60	128000	21 сен 24	нет
Qwen 2 72B Instruct ? `qwen/qwen-2-72b-instruct`	0.14	0.14	32768	7 июн 24	нет
Qwen: Qwen-Max ? `qwen/qwen-max` Базовый+GPT-4 tools	0.24	0.96	33000	1 фев	нет
Qwen: Qwen-Plus ? `qwen/qwen-plus` tools	0.06	0.18	128000	1 фев	нет
Qwen: Qwen-Turbo ? `qwen/qwen-turbo-2024-11-01` tools	0.016	0.035	1000000	1 фев	нет

Модели Amazon

Серия языковых моделей от Amazon (начиная с декабря 2024).

Модели отличаются большим контекстом (до 300 000 токенов)

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Amazon: Nova Pro 1.0 ? `amazon/nova-pro-v1` Базовый+GPT-4	0.15	0.50	300000	6 дек 24	да
Amazon: Nova Lite 1.0 ? `amazon/nova-lite-v1` tools	0.02	0.04	300000	6 дек 24	да
Amazon: Nova Micro 1.0 ? `amazon/nova-micro-v1` tools	0.012	0.03	128000	6 дек 24	да

Российские модели Сайга и Вихрь – альтернатива YaGPT и GigaChat

Сайга – третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре:

https://habr.com/ru/articles/767588/

Также здесь представлены модели от команды VikhrModels, которая также с 2024 года начала дотренировывать опенсорсные модели на русских данных. Они также рекомендуются к знакомству – по метрикам они не хуже gpt-3.5 и могут приближаться к gpt-4o-mini.

Серия моделей OMF включает в себя «холодный старт» – т.е. загрузку по мере запроса. Если на первый запрос вы не получили ответ по таймауту, просто подождите 1–2 минуты и попробуйте снова – весьма вероятно, что модель загрузится.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Saiga Gemma 3 12B (российский разработчик) ? `OMF-R-IlyaGusev/saiga_gemma3_12b` Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face	0.10	0.10	16000	30 апр	нет
SAINEMO-reMIX (микс русскоязычных моделей) ? `OMF-R-Moraliane/SAINEMO-reMIX` Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face	0.10	0.10	16000	16 дек 24	нет
Сайга MistralNemo 12B v1 (российский разработчик) ? `OMF-R-IlyaGusev/saiga_nemo_12b` Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face	0.10	0.10	8192	3 ноя 24	нет
Vikhr-Nemo-12B-Instruct-R-21-09-24 (российский разработчик) ? `OMF-R-Vikhr-Nemo-12B-Instruct-R-21-09-24` Open Models Fan За вызов: 0.15 р. Hugging Face	0.10	0.10	16000	22 сен 24	нет
Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (российский разработчик) ? `OMF-R-Vikhr-Llama3.1-8B-Instruct-R-21-09-24` Open Models Fan За вызов: 0.10 р. Hugging Face	0.10	0.10	16000	22 сен 24	нет
Saiga/Llama3 8B (российский разработчик) ? `OMF-R-IlyaGusev/saiga_llama3_8b` Open Models Fan За вызов: 0.10 р. Hugging Face	0.10	0.10	8192	19 июл 24	нет

Опенсорс модели

Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку “?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.

В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.

Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Z.AI: GLM 4.5 (MoE 355B всего, 23B активных) ? `z-ai/glm-4.5` Базовый+GPT-4 возможный топ по цена/качество tools	0.09	0.32	128000	29 июл	нет
Z.AI: GLM 4.5 Air (MoE 106B всего, 12B активных) ? `z-ai/glm-4.5-air` tools	0.03	0.16	128000	29 июл	нет
Llama 4 Maverick (FAST + большой контекст в 1 миллионов токенов) ? `meta-llama/llama-4-maverick-1m-ctx` контекст в 1М токенов tools structured-outputs	0.033	0.15	1000000	15 июл	нет
Llama 4 Scout (FAST + гигантский контекст в 10 миллионов токенов) ? `meta-llama/llama-4-scout-10m-ctx` топ контекст в 10М токенов tools structured-outputs	0.024	0.10	10000000	15 июл	нет
MoonshotAI: Kimi K2 1T Fast (быстрая, до 200 ток/секунду) ? `moonshotai/kimi-k2-fast` возможный топ по цена/качество программирование и общие задачи tools structured-outputs	0.14	0.45	128000	15 июл	нет
MoonshotAI: Kimi K2 (1T параметров) ? `moonshotai/kimi-k2` программирование и общие задачи tools structured-outputs	0.075	0.35	128000	12 июл	нет
MiniMax: MiniMax M1 (Thinking) ? `minimax/minimax-m1` Базовый+GPT-4 размышления	0.08	0.33	1000000	18 июн	нет
Llama 3.3 70B Instruct (SuperFast, порядка 1000-2000 токенов в секунду) ? `meta-llama/llama-3.3-70b-instruct-superfast` Базовый и выше (не Тестовый) superfast tools structured-outputs	0.14	0.18	32000	8 мая	нет
Llama 4 Scout (SuperFast, порядка 1000-2000 токенов в секунду!) ? `meta-llama/llama-4-scout-superfast` superfast structured-outputs	0.10	0.14	32000	8 мая	нет
Llama 4 Maverick (быстрая, до 400 токенов в секунду) ? `meta-llama/llama-4-maverick-fast` Базовый+GPT-4	0.09	0.22	1000000	6 апр	нет
Llama 4 Maverick Online HQ ? `meta-llama/llama-4-maverick-online-hq` Базовый+GPT-4 За вызов: 2.0 р. онлайн tools structured-outputs	0.03	0.12	1000000	7 апр	нет
Llama 4 Maverick ? `meta-llama/llama-4-maverick` Базовый+GPT-4 tools structured-outputs	0.03	0.12	1000000	6 апр	нет
Llama 4 Scout (быстрая) ? `meta-llama/llama-4-scout` fast tools	0.022	0.08	328000	6 апр	нет
Llama 3.3 70B Instruct (быстрая, более 200 токенов в секунду) ? `meta-llama/llama-3.3-70b-instruct-fast`	0.10	0.15	128000	14 фев	нет
EVA Qwen2.5 72B v0.2 (online) ? `eva-unit-01/eva-qwen-2.5-72b-online` За вызов: 3.45 р. ролеплей	0.60	0.80	16384	25 янв	нет
Llama 3.3 70B Instruct (online) ? `meta-llama/llama-3.3-70b-instruct-online` За вызов: 3.45 р.	0.08	0.08	128000	25 янв	нет
MiniMax: MiniMax-01 ? `minimax/minimax-01` Базовый+GPT-4 большой контекст	0.03	0.20	1000000	17 янв	нет
Sao10K: Llama 3.3 Euryale 70B ? `sao10k/l3.3-euryale-70b` ролеплей	0.25	0.25	8000	19 дек 24	нет
EVA Llama 3.33 70b ? `eva-unit-01/eva-llama-3.33-70b` ролеплей	0.60	0.80	16000	19 дек 24	нет
Llama 3.3 70B Instruct (с поддержкой structured outputs) ? `meta-llama/llama-3.3-70b-structured` Базовый+GPT-4 structured-outputs	0.22	0.22	128000	19 дек 24	нет
Llama 3.3 70B Instruct ? `meta-llama/llama-3.3-70b-instruct`	0.08	0.08	128000	8 дек 24	нет
EVA Qwen2.5 72B v0.2 ? `eva-unit-01/eva-qwen-2.5-72b` ролеплей	0.60	0.80	16384	6 дек 24	нет
NVIDIA: Llama 3.1 Nemotron 70B Instruct ? `nvidia/llama-3.1-nemotron-70b-instruct`	0.15	0.15	128000	21 окт 24	нет
Rocinante 12B ? `thedrummer/rocinante-12b` ролеплей	0.04	0.075	32768	16 окт 24	нет
Llama 3.2 90B Instruct ? `meta-llama/llama-3.2-90b-instruct`	0.15	0.15	128000	26 сен 24	нет
Llama 3.2 3B Instruct ? `meta-llama/llama-3.2-3b-instruct`	0.015	0.015	128000	26 сен 24	нет
Mistral Nemo 12B Starcannon ? `aetherwiing/mn-starcannon-12b` ролеплей	0.30	0.30	12000	28 авг 24	нет
Llama 3.1 Euryale 70B v2.2 ? `sao10k/l3.1-euryale-70b` квантизация fp8 ролеплей Hugging Face	0.25	0.25	8192	28 авг 24	нет
Hermes 3 405B Instruct ? `nousresearch/hermes-3-llama-3.1-405b` ролеплей и общие вопросы	0.70	0.70	128000	17 авг 24	нет
Mistral Nemo 12B Celeste ? `nothingiisreal/mn-celeste-12b` поддерживает русский ролеплей	0.23	0.23	32000	8 авг 24	нет
Llama 3.1 70B Instruct `meta-llama/llama-3.1-70b-instruct` tools	0.12	0.12	128000	24 июл 24	нет
Llama 3.1 8B Instruct `meta-llama/llama-3.1-8b-instruct`	0.027	0.06	128000	24 июл 24	нет
Llama 3.1 405B Instruct ? `meta-llama/llama-3.1-405b-instruct` Базовый+GPT-4 самая большая опенсорс модель от 23 июля fp8 квантизация tools	0.50	0.50	128000	23 июл 24	нет
Magnum 72B ? `alpindale/magnum-72b` квантизация int4 ролеплей	0.50	0.60	16384	12 июл 24	нет
NVIDIA Nemotron 4 340B Instruct ? `nvidia/nemotron-4-340b-instruct` выключена провайдером топ опенсорс переводчик от 25 июня общие вопросы	0.63	0.63	4096	25 июн 24	нет
Euryale-v2.1-70B ? `sao10k/euryale-70b` ролеплей	0.22	0.22	16000	30 июн 24	нет
Llama 3 Lumimaid 70B ? `neversleep/llama-3-lumimaid-70b` int4 квантизация ролеплей	0.67	0.90	8192	29 мая 24	нет
Phi-3 Mini Instruct 3.8B ? `microsoft/phi-3-mini-128k-instruct`	0.015	0.015	128000	27 мая 24	нет
Phi-3 Medium Instruct 14B ? `microsoft/phi-3-medium-128k-instruct`	0.15	0.15	128000	27 мая 24	нет
Llama 3 Lumimaid 8B (large-context) ? `neversleep/llama-3-lumimaid-8b-large` ролеплей	0.04	0.34	24576	6 мая 24	нет
LLaMA v3 70B Instruct ? `meta-llama/llama-3-70b-instruct`	0.135	0.135	8192	19 апр 24	нет
LLaMA v3 8B Instruct ? `meta-llama/llama-3-8b-instruct`	0.035	0.035	8192	19 апр 24	нет
WizardLM-2 8x22B ? `microsoft/wizardlm-2-8x22b` топ ролеплей от 17 апреля ролеплей и общие вопросы	0.15	0.15	65536	18 апр 24	нет
Midnight Rose 70B ? `sophosympatheia/midnight-rose-70b` топ ролеплей от 24 марта	0.15	0.15	4095	24 мар 24	нет
Nous: Hermes 2 Mixtral 8x7B DPO ? `nousresearch/nous-hermes-2-mixtral-8x7b-dpo` дешевая 8x7B с большим контекстом ролеплей и общие вопросы	0.045	0.045	32000	1 мар 24	нет
Mythalion 13B ? `pygmalionai/mythalion-13b` ролеплей	0.16875	0.16875	8192	16 янв 24	нет
Gryphe: MythoMax L2 13B ? `gryphe/mythomax-L2-13b` дешевая 13B	0.04	0.04	4096	8 мар 24	нет

Translate-версии опенсорс моделей

Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.

Magnum 72B (translate-версия) `translate-alpindale/magnum-72b` ролеплей	0.50	0.60	16384	12 июл 24	нет
Euryale-v2.1-70B (translate-версия) `translate-sao10k/euryale-70b` ролеплей	0.22	0.22	16000	30 июн 24	нет
Llama 3 Lumimaid 70B (translate-версия) `translate-neversleep/llama-3-lumimaid-70b` ролеплей	0.67	0.90	8192	27 мая 24	нет
Phi-3 Mini Instruct 3.8B (translate-версия) `translate-microsoft/phi-3-mini-128k-instruct`	0.025	0.025	128000	27 мая 24	нет
Llama 3 Lumimaid 8B (large-context) (translate-версия) `translate-neversleep/llama-3-lumimaid-8b-large` ролеплей	0.04	0.34	24576	6 мая 24	нет
Mistral: Mixtral 8x22B Instruct (translate-версия) `translate-mistralai/mixtral-8x22b-instruct`	0.17	0.17	65536	18 апр 24	нет
WizardLM-2 8x22B (translate-версия) `translate-microsoft/wizardlm-2-8x22b` топ ролеплей от 17 апреля	0.17	0.17	65536	18 апр 24	нет
Midnight Rose 70B (Translate-версия) `translate-sophosympatheia/midnight-rose-70b` топ ролеплей от 24 марта	0.15	0.15	4095	24 мар 24	нет
Translate-версия Nous: Hermes 2 Mixtral 8x7B DPO `translate-nousresearch/nous-hermes-2-mixtral-8x7b-dpo` дешевая 8x7B с большим контекстом	0.065	0.065	32000	1 мар 24	нет
Mythalion 13B with Ru-En translation (beta) ? `translate-pygmalionai/mythalion-13b`	0.17875	0.17875	8192	17 ноя 23	нет
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ? `translate-mistralai/mistral-7b-instruct`	0.06	0.06	8192	24 окт 23	нет
Translate-версия Gryphe: MythoMax L2 13B `translate-gryphe/mythomax-L2-13b`	0.06	0.06	4096	12 янв 24	нет

Самые свежие опенсорс модели Open Models Fan (OMF) (бета-тест)

Самые свежие опенсорс модели серии Open Models Fan (могут быть недоступны на Тестовом тарифе).

Особенности:
– Модели доступны для экспериментирования, а не для реальной автоматизации (но они также доступны через API). Поэтому, пожалуйста, используйте их вручную или на малом объеме автоматических запросов (до 500). Если вам нужно интенсивно работать с ними, рекомендуем развернуть их на собственном сервере. Если мы увидим большое число автоматических запросов от вас к этим моделям, мы оставляем за собой право временно заблокировать ваш аккаунт
– Следствие – мы берем плату за вызов и небольшую плату за входные и выходные символы. Таким образом, эти модели более выгодно использовать для долгого ролеплея с большим контекстом (если они это поддерживают)
– Скорость вывода – 10–40 токенов в секунду, в зависимости от размера модели.
– Модели 70B и выше поставляются в квантизации FP8 – создавая баланс между загрузкой серверов и качеством. В целом, падение качества по сравнению с FP16 и FP32 (оригинал) довольно небольшое.
– Размер контекста не гарантирован (в процессе выяснения у провайдера)
– Обычно опенсорсные файнтюны моделей в первую очередь предназначены для ролеплея и написания историй (часто – на английском, если не указано обратное). Для общих кейсов мы рекомендуем обычные модели.
– Серия моделей OMF включает в себя «холодный старт» – т.е. загрузку по мере запроса. Если на первый запрос вы не получили ответ по таймауту, просто подождите 1–2 минуты и попробуйте снова – весьма вероятно, что модель загрузится.

Пожалуйста, поддержите опенсорсную альтернативу проприетарным моделям!

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Saiga Gemma 3 12B (российский разработчик) ? `OMF-R-IlyaGusev/saiga_gemma3_12b` Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face	0.10	0.10	16000	30 апр	нет
Gemma 3 27B (abliterated) ? `OMF-Gemma3-27B-abliterated` Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face	0.15	0.15	16384	12 апр	нет
Pantheon RP 1.8 24b ? `OMF-Pantheon-RP-1.8-24b-Small-3.1` Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face	0.15	0.15	16384	31 мар	нет
Forgotten Abomination 24B V2.2 ? `OMF-Forgotten-Abomination-24B-V2.2` Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face	0.15	0.15	16384	19 мар	нет
Hamanasu QwQ 32B V2 RP ? `OMF-Hamanasu-QwQ-32B-V2-RP` Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face	0.18	0.18	16384	19 мар	нет
QwQ 32B (abliterated) ? `OMF-QwQ-32B-abliterated` Open Models Fan За вызов: 0.25 р. ролеплей	0.18	0.18	16384	19 мар	нет
SAINEMO-reMIX (микс русскоязычных моделей) ? `OMF-R-Moraliane/SAINEMO-reMIX` Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face	0.10	0.10	16000	16 дек 24	нет
EVA Qwen2.5-72B v0.1 ? `OMF-EVA-Qwen2.5-72B-v0.1` Open Models Fan За вызов: 0.50 р. ролеплей	0.25	0.25	8192	8 ноя 24	нет
Сайга MistralNemo 12B v1 (российский разработчик) ? `OMF-R-IlyaGusev/saiga_nemo_12b` Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face	0.10	0.10	8192	3 ноя 24	нет
EVA Qwen2.5-72B v0.0 ? `OMF-EVA-Qwen2.5-72B-v0.0` Open Models Fan За вызов: 0.50 р. ролеплей	0.25	0.25	8192	3 ноя 24	нет
Qwen2.5-72B-Instruct-abliterated ? `OMF-Qwen2.5-72B-Instruct-abliterated` Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face	0.25	0.25	16000	16 окт 24	нет
MN-12B-Starcannon-v3 ? `OMF-nothingiisreal/MN-12B-Starcannon-v3` Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face	0.10	0.10	16000	25 сен 24	нет
Qwen2.5-Math-72B-Instruct ? `OMF-Qwen/Qwen2.5-Math-72B-Instruct` Open Models Fan За вызов: 0.50 р. математика Hugging Face	0.25	0.25	16000	25 сен 24	нет
Vikhr-Nemo-12B-Instruct-R-21-09-24 (российский разработчик) ? `OMF-R-Vikhr-Nemo-12B-Instruct-R-21-09-24` Open Models Fan За вызов: 0.15 р. Hugging Face	0.10	0.10	16000	22 сен 24	нет
Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (российский разработчик) ? `OMF-R-Vikhr-Llama3.1-8B-Instruct-R-21-09-24` Open Models Fan За вызов: 0.10 р. Hugging Face	0.10	0.10	16000	22 сен 24	нет
Qwen2 Math 72B Instruct ? `OMF-Qwen/Qwen2-Math-72B-Instruct` Open Models Fan За вызов: 0.50 р. математика Hugging Face	0.25	0.25	16000	10 авг 24	нет
Vicuna 13B v1.5 (ретро) ? `OMF-lmsys/vicuna-13b-v1.5` Open Models Fan За вызов: 0.25 р. ретро ролеплей Hugging Face	0.10	0.10	4096	30 мар 23	нет
Smaug Qwen2 72B Instruct ? `OMF-abacusai/Smaug-Qwen2-72B-Instruct` Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face	0.25	0.25	16000	22 июл 24	нет
Tess v2.5.2 Qwen2 72B ? `OMF-Tess-v2.5.2-Qwen2-72B` Open Models Fan За вызов: 0.50 р. Hugging Face	0.25	0.25	16000	19 июл 24	нет
MG-FinalMix-72B (Magnum-72B based) ? `OMF-Undi95/MG-FinalMix-72B` Open Models Fan За вызов: 0.50 р. ролеплей Hugging Face	0.25	0.25	16000	19 июл 24	нет
Sao10K: L3 8B Lunaris v1 ? `OMF-sao10k/l3-8b-lunaris-v1` Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face	0.10	0.10	8192	19 июл 24	нет
New Dawn Llama-3-70B 32K v1.0 ? `OMF-New-Dawn-Llama-3-70B-32K-v1.0` Open Models Fan За вызов: 0.50 р. ролеплей Hugging Face	0.25	0.25	8192	19 июл 24	нет
TenyxChat-DaybreakStorywriter-70B ? `OMF-DaybreakStorywriterXTenyxChat-70B` Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face	0.25	0.25	8192	19 июн 24	нет
Kunoichi DPO v2 7B ? `OMF-SanjiWatsuki/Kunoichi-DPO-v2-7B` Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face	0.10	0.10	8192	19 июн 24	нет
Smaug-Llama-3-70B-Instruct ? `OMF-abacusai/Smaug-Llama-3-70B-Instruct` Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face	0.25	0.25	8192	19 июл 24	нет
Suzume 8B ? `OMF-lightblue/suzume-llama-3-8B-multilingual` Open Models Fan За вызов: 0.25 р. Hugging Face	0.10	0.10	8192	19 июл 24	нет
Saiga/Llama3 8B (российский разработчик) ? `OMF-R-IlyaGusev/saiga_llama3_8b` Open Models Fan За вызов: 0.10 р. Hugging Face	0.10	0.10	8192	19 июл 24	нет

Text-to-image (генерация изображений по тексту)

OpenAI Dall-E

Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке “?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.

Отчет: сравнение моделей генерации изображений

Для ознакомления с возможностями Dalle-3 рекомендуем статью от OpenAI

Что нового в Dalle-3

OpenAI: Dall-E 3 ? `openai/dall-e-3` Базовый+GPT-4 (не Тестовый) генерация изображений	10.0	0.0	4096	13 мар 24	нет

Другие модели (FLUX, Stable Diffusion, Playground)

Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Подробнее о стоимости генерации при разном разрешении и качестве по кнопке “?", там же описание дополнительных параметров, доступных при вызове модели.
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.

Отчет: сравнение моделей генерации изображений

Juggernaut Lightning Flux (крайне быстрая генерация изображений FLUX) ? `img-flux/juggernaut-lightning` Базовый и выше (не Тестовый) генерация изображений 1.80 р. за 1 изображение	10.0	0.0	2000	17 июл	нет
Stable Diffusion XL Lightning (быстрая генерация SDXL) ? `img-stable/stable-diffusion-xl-lightning` Базовый и выше (не Тестовый) генерация изображений 0.30 р. за 1 изображение	10.0	0.0	2000	17 июл	нет
Google Imagen 4 Ultra (preview) ? `img-google/imagen4-preview-ultra` Базовый+GPT-4 (не Тестовый) генерация изображений 20 р. за изображение	20.0	0.0	2000	2 июл	нет
Google Imagen 4 Fast (preview) ? `img-google/imagen4-preview-fast` Базовый+GPT-4 (не Тестовый) генерация изображений 5.9 р. за изображение	5.9	0.0	2000	2 июл	нет
FLUX.1 Kontext [max] ? `img-flux/kontext-max` Базовый+GPT-4 (не Тестовый) генерация изображений 15.0 р. за изображение	15.0	0.0	2000	2 июн	нет
FLUX.1 Kontext [pro] ? `img-flux/kontext-pro` Базовый+GPT-4 (не Тестовый) генерация изображений 7.5 р. за изображение	7.5	0.0	2000	2 июн	нет
Google Imagen 4 (preview) ? `img-google/imagen4-preview` Базовый+GPT-4 (не Тестовый) генерация изображений 11.9 р. за изображение	11.9	0.0	2000	21 мая	нет
Recraft V3 (более 30 стилей для изображений!) ? `img-recraft/v3` Базовый+GPT-4 (не Тестовый) генерация изображений 9.9 р. за изображение	9.9	0.0	2000	2 мая	нет
Ideogram V3 ? `img-ideogram/v3` Базовый+GPT-4 (не Тестовый) генерация изображений 7.9 р. за изображение	10.0	0.0	2000	2 мая	нет
FLUX.1.1 [pro] ? `img-flux/pro1.1` Базовый+GPT-4 (не Тестовый) генерация изображений 14.9 р. за изображение	10.0	0.0	2000	4 окт 24	нет
FLUX.1 [pro] ? `img-flux/pro` Базовый+GPT-4 (не Тестовый) генерация изображений 14.9 р. за изображение	10.0	0.0	2000	28 авг 24	нет
FLUX.1 [dev] ? `img-flux/dev` Базовый+GPT-4 (не Тестовый) генерация изображений 7.5 р. за изображение	10.0	0.0	2000	28 авг 24	нет
FLUX.1 [schnell] ? `img-flux/schnell` Базовый+GPT-4 (не Тестовый) генерация изображений 1.8 р. за изображение	10.0	0.0	2048	28 авг 24	нет
Playground v2.5 ? `img-playground-v2-5-1024px` Базовый+GPT-4 (не Тестовый) генерация изображений 1.45 р. за 1 изображение	10.0	0.0	2000	12 июл 24	да
Stable Diffusion XL v1.0 ? `img-stable/stable-diffusion-xl-1024` Базовый+GPT-4 (не Тестовый) генерация изображений 0.95 р. за 1 изображение	10.0	0.0	2000	30 июн 24	нет
Dummy Image ? `img-dummy/image` За вызов: 0.005 р.	0.00	0.00	4096	13 мар 24	нет

Image-to-image (редактирование изображений)

Общие модели (Google Flash Edit, FLUX Edit...)

Модели для редактирования изображений с самыми разными запросами
Можно использовать через меню Сервисы > Текстовый фоторедактор (для зарегистрированных пользователей) или по API.

FLUX.1 Kontext [max] Image Edit Multi ? `img2img-flux/kontext-max-edit-multi` Базовый+GPT-4 (не Тестовый) редактирование изображений 15 р. за изображение	15.0	2000	2 июн	нет
FLUX.1 Kontext [pro] Image Edit Multi ? `img2img-flux/kontext-pro-edit-multi` Базовый+GPT-4 (не Тестовый) редактирование изображений 7.5 р. за изображение	7.5	2000	2 июн	нет
FLUX.1 Kontext [max] Image Edit ? `img2img-flux/kontext-max-edit` Базовый+GPT-4 (не Тестовый) редактирование изображений 15.0 р. за изображение	15.0	2000	2 июн	нет
FLUX.1 Kontext [pro] Image Edit ? `img2img-flux/kontext-pro-edit` Базовый+GPT-4 (не Тестовый) редактирование изображений 7.5 р. за изображение	7.5	2000	2 июн	нет
Ideogram V3 (редактирование частей изображения) ? `img2img-ideogram/v3-multi-edit-mask` Базовый+GPT-4 (не Тестовый) генерация изображений 7.9 р. за изображение	10.0	2000	16 мая	нет
Ideogram V3 (замена фона) ? `img2img-ideogram/v3-multi-replace-background` Базовый+GPT-4 (не Тестовый) генерация изображений 7.9 р. за изображение	10.0	2000	16 мая	нет
DD Colorization (раскрашивание черно-белых изображений) ? `img2img-dd/colorization` генерация изображений 0.8 р. за изображение	0.8	2000	16 мая	нет
Recraft V3 Image Edit ? `img2img-recraft/v3-edit` Базовый+GPT-4 (не Тестовый) генерация изображений 9.9 р. за изображение	9.9	2000	16 мая	нет
Recraft V3 Upscaler (улучшение разрешения изображения) ? `img2img-recraft/v3-upscale-crisp` генерация изображений 0.8 р. за изображение	0.8	2000	16 мая	нет
Google Flash Edit Multi References ? `img2img-google/flash-edit-multi` Базовый+GPT-4 За вызов: 9.9 р. редактирование изображений 9.9 р за изображение	0.0	2000	8 мая	нет
Google Flash Edit ? `img2img-google/flash-edit` Базовый+GPT-4 За вызов: 9.9 р. редактирование изображений 9.9 р за изображение	0.0	2000	7 апр	нет

AI Transform – трансформация изображений

Модели для частных задач трансформации изображений.
Можно использовать через меню Сервисы > Текстовый фоторедактор (для зарегистрированных пользователей) или по API.

AI Transform - удаление текста ? `img2img-aitransform/text-removal` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - смена стиля изображения ? `img2img-aitransform/style-transfer` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - профессиональное фото ? `img2img-aitransform/professional-photo` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - смена соотношения сторон ? `img2img-aitransform/reframe` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - плюшевый стиль ? `img2img-aitransform/plushie-style` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - восстановление фото ? `img2img-aitransform/photo-restoration` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - удаление объектов ? `img2img-aitransform/object-removal` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - смена прически ? `img2img-aitransform/hair-change` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - ретушь лица ? `img2img-aitransform/face-enhancement` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - смена выражения лица ? `img2img-aitransform/expression-change` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - автоматическая цветокоррекция ? `img2img-aitransform/auto-color` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - трансформация в мультфильм ? `img2img-aitransform/cartoonify` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - смена фона ? `img2img-aitransform/background-change` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет
AI Transform - смена сцены ? `img2img-aitransform/scene-composition` Базовый+GPT-4 (не Тестовый) редактирование изображений 9.9 р. за изображение	9.9	2000	10 июл	нет

Embeddings

Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).

Пример реализации RAG с использованием наших эмбеддингов доступен

у нас на Github

Старые (v2)

Text Embedding Ada v2 ? `text-embedding-ada-002`	0.03	0.00	1024	13 мар 24	нет

Новые (v3)

OpenAI: text-embedding-3-large (тест) `emb-openai/text-embedding-3-large`	0.035	0.0	32000	13 мар 24	нет
OpenAI: text-embedding-3-small (тест) `emb-openai/text-embedding-3-small`	0.006	0.0	32000	13 мар 24	нет

Vision-модели (вопросы по изображению, OCR)

Предназначены для совместной обработки текста и изображений.

Временные особенности:

Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Google: Gemini 2.5 Pro (vision-версия) ? `vis-google/gemini-2.5-pro` Базовый+GPT-4 tools structured-outputs	0.37	3.0	1000000	17 июн	нет
Google: Gemini 2.5 Flash (vision-версия) ? `vis-google/gemini-2.5-flash` tools structured-outputs	0.09	0.75	1000000	17 июн	нет
Google: Gemini 2.5 Pro Preview (5 июня, vision-версия) ? `vis-google/gemini-2.5-pro-preview` Базовый+GPT-4 (не Тестовый) около 0.6 р за изображение tools structured-outputs	0.37	3.0	1000000	10 июн	нет
Google: Gemini 2.5 Flash Preview 05 20 (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? `vis-google/gemini-2.5-flash-pre-05-20` дешевая и с большим контекстом около 0.05 р. за изображение tools structured-outputs	0.045	0.15	1000000	20 мая	нет
OpenAI: o4-mini (vision-версия) ? `vis-openai/o4-mini` Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) около 0.80 р. за изображение размышления, математика tools structured-outputs	0.28	1.12	200000	16 апр	да
Google: Gemini 2.5 Flash Preview (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? `vis-google/gemini-2.5-flash-pre` дешевая и с большим контекстом около 0.05 р. за изображение structured-outputs	0.045	0.15	1000000	18 апр	нет
Anthropic: Claude 3.7 Sonnet (thinking, vision) ? `vis-anthropic/claude-3.7-sonnet-thinking` Базовый+GPT-4 (не Тестовый) около 1.0 р за изображение tools	0.8	4.0	200000	10 апр	да
Llama 4 Scout (быстрая, Vision-версия) ? `vis-meta-llama/llama-4-scout` fast около 0.09-0.20 р за изображение tools	0.05	0.16	328000	10 апр	нет
Llama 4 Maverick (Vision-версия) ? `vis-meta-llama/llama-4-maverick` Базовый+GPT-4 около 0.14-0.35 р. за изображение tools structured-outputs	0.06	0.24	1000000	10 апр	нет
Llama 3.2 90B Vision Instruct (structured outputs) (бета-тестирование) ? `vis-meta-llama/llama-3.2-90b-vision-structured` Базовый и выше (не Тестовый) За вызов: 0.03 р. около 1.8 р. за изображение structured-outputs	0.30	0.30	128000	26 сен 24	нет
Gemma 3 27B (опенсорс, vision-версия) ? `vis-google/gemma-3-27b-it` 0.04 р. за изображение	0.10	0.16	128000	19 мар	нет
Mistral: Mistral Small 3.1 24B (vision-версия) ? `vis-mistralai/mistral-small-3.1-24b-instruct` 0.05 р. за изображение	0.05	0.10	128000	19 мар	нет
Anthropic: Claude 3.7 Sonnet (vision) ? `vis-anthropic/claude-3.7-sonnet` Базовый+GPT-4 около 1.0 р. за изображение tools	0.8	4.0	200000	19 мар	да
Google: Gemini Flash 2.0 (vision-версия) ? `vis-google/gemini-2.0-flash-001` Базовый+GPT-4 очень дешевая 0.06 р. за изображение	0.05	0.12	1000000	19 мар	нет
Qwen2.5 VL 72B Instruct ? `vis-qwen/qwen2.5-vl-72b-instruct` Базовый+GPT-4 За вызов: 0.07 р. топ! около 0.30 р. за изображение	0.30	0.30	32768	19 мар	нет
Llama 3.2 90B Vision Instruct ? `vis-meta-llama/llama-3.2-90b-vision-instruct` Базовый и выше (не Тестовый) За вызов: 0.03 р. около 0.04 р. за изображение	0.22	0.22	128000	26 сен 24	нет
Llama 3.2 11B Vision Instruct ? `vis-meta-llama/llama-3.2-11b-vision-instruct` Базовый и выше (не Тестовый) За вызов: 0.02 р. около 0.03 р. за изображение	0.055	0.055	128000	26 сен 24	нет
Mistral: Pixtral 12B ? `vis-mistralai/pixtral-12b` За вызов: 0.05 р. около 0.2 р. за изображение	0.08	0.08	4096	21 сен 24	нет
Qwen2-VL 72B Instruct ? `vis-qwen/qwen-2-vl-72b-instruct` Базовый+GPT-4 За вызов: 0.07 р. топ! около 0.05 р. за изображение	0.60	0.60	32768	21 сен 24	нет
OpenAI: GPT-4o (2024-08-06) (vision-версия) ? `vis-openai/gpt-4o-2024-08-06` Базовый+GPT-4 топ! около 0.15 р. за изображение tools structured-outputs	0.55	2.20	128000	6 авг 24	да
OpenAI: gpt-4o-mini (vision-версия) `vis-openai/gpt-4o-mini` Базовый+GPT-4 (не Тестовый) около 0.80 р. за изображение	0.037	0.15	128000	27 июл 24	да
Anthropic: Claude 3.5 Sonnet (vision) (новая от 22 октября) ? `vis-anthropic/claude-3.5-sonnet` Базовый+GPT-4 около 0.7 р. за изображение tools	0.6	3.0	200000	22 окт 24	да
Google: Gemini Flash 1.5 (vision-версия) ? `vis-google/gemini-flash-1.5` Базовый+GPT-4 очень дешевая 0.03 р. за изображение	0.045	0.10	1000000	14 авг 24	нет
OpenAI: GPT-4o (vision) ? `vis-openai/gpt-4o` Базовый+GPT-4 топ!	1.10	3.30	128000	31 мая 24	да
Google: Gemini Pro 1.5 (vision-вариант) ? `vis-google/gemini-pro-1.5` Базовый+GPT-4 0.60 р. за 1 изображение	0.75	2.0	1000000	10 апр 24	нет
OpenAI: GPT-4 Vision Turbo ? `vis-openai/gpt-4-turbo` Базовый+GPT-4 топ! около 1.7 р. за 1 изображение	2.00	6.00	128000	27 апр 24	да
Anthropic: Claude 3 Haiku (vision) ? `vis-anthropic/claude-3-haiku` Базовый+GPT-4 около 0.1 р за 1 изображение tools	0.066	0.3	200000	14 мар 24	да
Anthropic: Claude 3 Opus (vision) ? `vis-anthropic/claude-3-opus` Базовый+GPT-4 около 3.3 р. за изображение	3.0	15.0	200000	5 мар 24	да
Anthropic: Claude 3 Sonnet (vision) ? `vis-anthropic/claude-3-sonnet` Базовый+GPT-4 около 0.7 р. за изображение	0.6	3.0	200000	5 мар 24	да
Qwen: Qwen-VL-Max ? `vis-qwen/qwen-vl-max` Базовый+GPT-4 0.40 р. за изображение	0.28	1.20	128000	19 мар	нет
Qwen: Qwen-VL-Plus ? `vis-qwen/qwen-vl-plus` 0.08 р. за изображение	0.07	0.20	128000	19 мар	нет

Speech-To-Text-модели (распознавание речи)

Предназначены для распознавания речи.

Временные особенности:

Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
Пример вызова по API есть в Документации API.
Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
OpenAI: gpt-4o-transcribe ? `stt-openai/gpt-4o-transcribe` Базовый+GPT-4 1.92 р за минуту	32.00	0.00	2000	26 мар	нет
OpenAI: gpt-4o-mini-transcribe ? `stt-openai/gpt-4o-mini-transcribe` 0.96 р за минуту	16.00	0.00	2000	22 мар	нет
OpenAI: Whisper (v3, сторонний провайдер, тест) ? `stt-openai/whisper-v3` 0.90 р за минуту	15.00	0.00	2000	28 июн 24	нет
OpenAI: Whisper v3 Turbo ? `stt-openai/whisper-v3-turbo` 0.72 р за минуту	12.00	0.00	2000	1 мар	нет
OpenAI: Whisper (v3, сторонний провайдер, тест) ? `stt-openai/whisper-1` 0.90 р за минуту	15.00	0.00	2000	28 июн 24	нет

Text-to-Speech-модели (генерация речи)

Предназначены для генерации речи по тексту.
Условия использования моделей OpenAI: вы обязаны явно декларировать, что используете голос ИИ.

Временные особенности:

Не поддерживают стриминг
Пример вызова по API есть в Документации API.
Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.
Примеры настроек для gpt-4o-mini для задания инструкций, в каком стиле генерировать озвучку

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Vosk TTS 0.7 (очень быстрый) ? `tts-vosk/ru-0.7`	1.5	0.0	1000	12 апр	нет
OpenAI: gpt-4o-mini-tts ? `tts-openai/gpt-4o-mini-tts` Базовый и выше (не Тестовый) рекомендуется настройка интонаций для чтения текста	7.5	0.0	4096	22 мар	да
OpenAI: TTS-1-HD ? `tts-openai/tts-1-hd` Базовый+GPT-4	6.4	0.0	4096	14 июн 24	да
OpenAI: TTS-1 ? `tts-openai/tts-1`	3.2	0.0	4096	14 июн 24	нет

Text-to-Audio-модели (генерация музыки)

Предназначены для генерации музыки по текстовому запросу.

Пример генерации для Cassete Music Generator
Пример генерации для Google Lyria 2 запрос 70 BPM, ambient piano relax music

Пример вызова по API есть в Документации API.
Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Google Lyria 2 (генерация музыки) ? `tta-google/lyria2` Базовый+GPT-4 За вызов: 20.0 р. генерация музыки 20 руб/генерация	0.0	0.0	2048	21 мая	нет
Cassete Music Generator (генерация музыки) ? `tta-cassette/music-generator` Базовый+GPT-4 генерация музыки 6 руб/минута	6000.0	0.0	2048	1 апр	нет
Stable Audio (генерация музыки) ? `tta-stable/stable-audio` Базовый+GPT-4 За вызов: 5.00 р. генерация музыки 5 руб/генерация	0.0	0.0	2048	28 авг 24	нет

Генерация видео

Text-to-Video-модели (генерация видео, бета-тест)

Предназначены для генерации видео по текстовому запросу.

Особенности:

При вызове генерации стоимость списывается сразу, но запрос ставится в очередь. К сожалению, он может не выполнится, а деньги будут списаны – пока это часть рисков использования модели. Мы будем отслеживать такие ситуации.
Среднее время генерации – около 6 минут на ролик в Kling, 1–2 минуты для LTX Video 0.9.5
Вам нужно будет проверять готовность ролика специальными запросами к API
Готовые файлы будут доступны в течение 2 часов (пока)

Примеры генерации видео:

Kling Pro V1.6 VseGPT в космосе, генерация по картинке 1:1
Kling Standart 1.6 Panda playing guitar on river 16:9, VseGPT в космосе, генерация по картинке 1:1
Kling Pro V1.5 Panda playing guitar on river 16:9, VseGPT в космосе, генерация по картинке 1:1
Kling Standart Panda playing guitar on river 16:9, Panda playing guitar in Paris 9:16, VseGPT в космосе, генерация по картинке 1:1
Haiper 2.0 Panda playing guitar on river 16:9, VseGPT в космосе, генерация по картинке 1:1
LTX Video 0.9.5 Panda playing guitar on river 16:9
LTX Video 0.9.7 Distilled Panda playing guitar on river 16:9 VseGPT в космосе, генерация по картинке 1:1

Пример вызова по API есть в Документации API.
Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
LTX 0.9.7 Text-to-Video (быстрая) ? `txt2vid-ltx/097-distilled` За вызов: 12.0 р.	0.0	0.0	2000	17 мая	нет
LTX 0.9.5 Text-to-Video ? `txt2vid-ltx/video-095` За вызов: 12.0 р.	0.0	0.0	2000	14 мар	нет
Kling Pro V1.6 Text-to-Video (ВРЕМЕННО НЕДОСТУПНА) ? `txt2vid-kling/pro16` Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.	0.0	0.0	2000	8 янв	нет
Kling Standart Text-to-Video v1.6 ? `txt2vid-kling/standart16` Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.	0.0	0.0	2000	8 янв	нет
Kling Pro V1.5 Text-to-Video ? `txt2vid-kling/pro15` Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.	0.0	0.0	2000	9 дек 24	нет
Kling Standart Text-to-Video ? `txt2vid-kling/standart` Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.	0.0	0.0	2000	8 дек 24	нет

Image-to-Video-модели (генерация видео, бета-тест)

Предназначены для генерации видео по текстовому запросу и изображения.

Условия аналогичны text-to-video

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
LTX 0.9.7 Image-To-Video (быстрая) ? `img2vid-ltx/097-distilled` За вызов: 12.0 р.	0.0	0.0	2000	17 мая	нет
LTX 0.9.5 Image-To-Video ? `img2vid-ltx/video-095` За вызов: 12.0 р.	0.0	0.0	2000	14 мар	нет
Kling Pro V1.6 (Image-To-Video) ? `img2vid-kling/pro16` Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.	0.0	0.0	2000	8 янв	нет
Kling Standart 1.6 (Image-To-Video) ? `img2vid-kling/standart16` Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.	0.0	0.0	2000	8 янв	нет
Kling Pro V1.5 (Image-To-Video) ? `img2vid-kling/pro15` Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.	0.0	0.0	2000	9 дек 24	нет
Kling Standart (Image-To-Video) ? `img2vid-kling/standart` Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.	0.0	0.0	2000	8 дек 24	нет

Text-to-Song-модели (генерация песен, бета-тест)

Предназначены для генерации песен по текстовому запросу и референсу.

Особенности:

При вызове генерации стоимость списывается сразу, но запрос ставится в очередь. К сожалению, он может не выполнится, а деньги будут списаны – пока это часть рисков использования модели. Мы будем отслеживать такие ситуации.
Среднее время генерации – около 1–2 минут на ролик в Minimax Music.
Вам нужно будет проверять готовность ролика специальными запросами к API
Готовые файлы будут доступны в течение 2 часов (пока)

Примеры генерации:

Пример 1

Есть клиент для тестирования генерации – доступен через меню Сервисы.

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
Minimax Music (генерация песни по тексту и аудиореференсу, временно отключена) ? `txt2sng-minimax/music` Базовый+GPT-4 (не Тестовый) За вызов: 10.0 р. генерация песен	0.0	0.0	2000	29 дек 24	нет

Utils, вспомогательные модели (конвертация документов PDF, DOCX в текст)

Предназначены для решения ряда дополнительных задач на сервисе..

utils/extract-text работает хорошо с текстовыми документами
utils/pdf-ocr работает со всеми PDF-документами, применяя к ним оптическое распознавание

Модель и ID	Руб за 1000 символов входных данных	Руб за 1000 символов генерации модели	Размер конте кста	Дата обнов ления	Авто моде ра ция
PDF OCR (распознавание PDF-файлов любого типа, до 1000 страниц, бета-тестирование) ? `utils/pdf-ocr-1.0` Базовый+GPT-4 (не Тестовый) За вызов: 0.10 р. конвертация документов 0.45 р за страницу	0.0	45.0	2000	30 мар	нет
Extract Text (конвертация файлов DOCX, PDF в текст) ? `utils/extract-text-1.0` За вызов: 0.50 р. конвертация документов	0.0	0.0	2000	16 фев	нет

Примечания

Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.

Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»