Модели (более 120)


Непонятно, что выбрать? Есть наш туториал >
туториал обновлен 5 марта 2025


Мировые новинки у нас


  • 19 марта, 7 новых vision-моделей – т.е. моделей для запросов по изображениям. Flash 2.0, Sonnet 3.7 в vision-вариантах, Mistral 24B, Gemma 27B, Qwen 2.5 72B, Qwen VL Plus, Qwen VL Max.
  • 10 марта – 4 research модели поверх Sonnet 3.7 – Online High Quality, Deep Online, Research, Deep Research для формирования полноценных исследований на 8–9 страниц A4! Подробнее о Research-моделях + примеры
  • 28 февраля, GPT-4.5 Preview от OpenAI уже доступна!
  • 26 февраля, Sonnet 3.7 c размышлениями доступна! Поддерживается 3 варианта модели, предлагающие разный бюджет на размышления: low, medium (по умолчанию), high. Модели полностью совместимы с обычным OpenAI API, доработок не требуется.
  • 25 февраля, новая Sonnet 3.7 – новая Sonnet 3.7 уже доступна на сервисе!
  • 14 февраля, версии модели OpenAI: o3-mini – o3-mini-high с предустановленным пресетом глубоких размышлений, и o3-mini-online с возможностью поиска в Интернете.
  • 5 февраля, Google Gemini Flash 2.0 – новая модель от Google!
  • 1 февраля, o3-mini от OpenAI уже доступна! (Также модель o1 возвращена на сервис после долгого отключения)
  • 1 февраля, Qwen Turbo, Plus, Max – доступны свежие модели от Alibaba group! Max по метрикам превосходят другие модели, включая западные (кроме рассуждающих)
  • 29 января, Deepseek R1 от Perplexity – R1 с онлайн-поиском информации!
  • 28 января, альтернативные провайдеры для Deepseek R1 и V3 – поскольку оригинальный DeepSeek сейчас находится под нагрузкой.
  • 25 января, серия online-моделей – теперь целый ряд моделей могут отвечать с учетом интернет-поиска, т.е. текущих данных. Доступны в онлайн-варианте: GPT-4o-mini, GPT-4o, Sonnet/Haiku 3.5, Google Pro 1.5, Llama 3.3, EVA Qwen 72B.
  • 20 января, подключена Deepseek R1 – топовая рассуждающая модель от Deepseek, по метрикам сравнимая с o1, но по цене дешевле, чем o1-mini; она также быстрее o1 и o1-mini.
  • 8 января, Kling Standart 1.6, Kling Pro V1.6 – топовые модели для генерации видео от Kling.
  • Более старые новости по подключенным моделям


Текстовые модели

Модели OpenAI: ChatGPT, GPT-4o, GPT-4o-mini...


Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.
 
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Вам запрещён доступНастройках

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: GPT-4.5 (Preview) ?
openai/gpt-4.5-preview
Базовый+GPT-4 (не Тестовый)
20.0040.0012800028 февда
OpenAI: o3-mini (с онлайн поиском) ?
openai/o3-mini-online
Базовый+GPT-4 (не Тестовый) За вызов: 3.45 р. биллинг с учетом размышлений (см. ?) онлайн размышления, математика structured-outputs
0.281.1220000014 февда
OpenAI: o3-mini-high (пресет для глубоких размышлений от o3-mini) ?
openai/o3-mini-high
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика structured-outputs
0.281.1220000014 февда
OpenAI: o3-mini (для размышлений, не рек. для обычных задач) ?
openai/o3-mini
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика structured-outputs
0.281.122000001 февда
OpenAI: GPT-4o (2024-11-20) (online) ?
openai/gpt-4o-2024-11-20-online
Базовый+GPT-4 За вызов: 3.45 р. tools structured-outputs
0.31.212800025 янвда
OpenAI: GPT-4o (online) ?
openai/gpt-4o-online
Базовый+GPT-4 За вызов: 3.45 р. топ от 13 мая tools
0.61.812800025 янвда
OpenAI: GPT-4o mini (online) ?
openai/gpt-4o-mini-online
За вызов: 3.45 р. tools structured-outputs
0.020.0812800025 янвда
OpenAI: o1 (для размышлений, не рек. для обычных задач) ?
openai/o1
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика tools structured-outputs
3.514.012800018 дек 24да
OpenAI: GPT-4o (2024-08-06) (версия с поддержкой function calls) ?
openai/gpt-4o-2024-08-06-function-call
Базовый+GPT-4 function calling tools
0.83.312800014 дек 24нет
OpenAI: GPT-4o (2024-11-20) ?
openai/gpt-4o-2024-11-20
Базовый+GPT-4 tools structured-outputs
0.31.212800026 ноя 24да
OpenAI: o1-preview (для размышлений, не рек. для обычных задач) ?
openai/o1-preview
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика
3.514.012800013 сен 24да
OpenAI: o1-mini (не рек. для обычных задач) ?
openai/o1-mini
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика
0.62.712800013 сен 24нет
OpenAI: GPT-4o (последняя, экспериментальная) ?
openai/gpt-4o-latest
Базовый+GPT-4 ТОП!
0.61.812800014 авг 24да
OpenAI: GPT-4o (до 64 000 выходных токенов) (альфа-версия) ?
openai/gpt-4o-64k-output
Базовый+GPT-4 (не Тестовый)
0.722.1612800014 авг 24да
OpenAI: GPT-4o (2024-08-06) ?
openai/gpt-4o-2024-08-06
Базовый+GPT-4 топ от 6 августа tools structured-outputs
0.31.21280006 авг 24да
OpenAI: GPT-4o (2024-05-13)
openai/gpt-4o-2024-05-13
Базовый+GPT-4 tools
0.61.812800013 мая 24да
OpenAI: GPT-4o mini ?
openai/gpt-4o-mini
tools structured-outputs
0.020.0812800018 июл 24да
OpenAI: GPT-4o ?
openai/gpt-4o
Базовый+GPT-4 топ от 13 мая tools
0.61.812800025 мая 24да
OpenAI: GPT-4 Turbo (gpt-4-turbo-2024-04-09) ?
openai/gpt-4-turbo
Базовый+GPT-4 топ!
1.54.512800010 апр 24да
OpenAI: GPT-4 Turbo (0125-preview) ?
openai/gpt-4-turbo-preview
Базовый+GPT-4 tools
1.54.51280006 июн 24да
OpenAI: GPT-4 Turbo (1106-preview) ?
openai/gpt-4-1106-preview
Базовый+GPT-4
1.54.51280001 фев 24да
OpenAI: GPT-4 32k
openai/gpt-4-32k
Базовый+GPT-4
9183276711 сен 23да
OpenAI: GPT-4 ?
openai/gpt-4
Базовый+GPT-4
4.59819114 дек 23да
OpenAI: GPT-3.5 Turbo 16k (01-25) ?
openai/gpt-3.5-turbo-0125
рекомендуется
0.0750.225163852 фев 24да
OpenAI: GPT-3.5 Turbo 16k
openai/gpt-3.5-turbo-16k
0.450.61638330 сен 23да
OpenAI: GPT-3.5 Turbo Instruct ?
openai/gpt-3.5-turbo-instruct
0.2250.340952 окт 23да
OpenAI: GPT-3.5 Turbo 16k (11-06) ?
openai/gpt-3.5-turbo-1106
рекомендуется
0.150.31638516 янв 24да
OpenAI: GPT-3.5 Turbo
openai/gpt-3.5-turbo
0.150.340957 ноя 23да

Модели Anthropic: Claude Sonnet, Opus, Haiku


Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Рекомендуем их нейросети Claude 3 – Haiku для дешевой и быстрой обработки большого контекста, Opus – для максимально качественной работы.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Anthropic: Claude 3.7 Sonnet Deep Research 1.0 ?
anthropic/claude-3.7-sonnet-deep-research-1.0
Базовый+GPT-4 (не Тестовый) За вызов: 30.0 р. топ от 10 марта online, research примерная стоимость запроса 100-150 р.
0.42.020000010 марда
Anthropic: Claude 3.7 Sonnet Deep Online ?
anthropic/claude-3.7-sonnet-deep-online
Базовый+GPT-4 (не Тестовый) За вызов: 12.0 р. топ от 9 марта онлайн примерная стоимость запроса 30-50 р.
0.42.02000009 марда
Anthropic: Claude 3.7 Sonnet Research ?
anthropic/claude-3.7-sonnet-online-research
Базовый+GPT-4 (не Тестовый) За вызов: 20.0 р. топ от 9 марта online, research примерная стоимость запроса 80-120 р.
0.42.02000009 марда
Anthropic: Claude 3.7 Sonnet (online высокого качества) ?
anthropic/claude-3.7-sonnet-online-hq
Базовый+GPT-4 (не Тестовый) За вызов: 2.0 р. топ от 9 марта онлайн
0.42.02000009 марда
Anthropic: Claude 3.7 Sonnet Thinking High (новая от 24 февраля) ?
anthropic/claude-3.7-sonnet-thinking-high
Базовый+GPT-4 (не Тестовый) топ от 24 февраля размышления
0.42.020000026 февда
Anthropic: Claude 3.7 Sonnet Thinking Low (новая от 24 февраля) ?
anthropic/claude-3.7-sonnet-thinking-low
Базовый+GPT-4 (не Тестовый) размышления
0.42.020000026 февда
Anthropic: Claude 3.7 Sonnet Thinking (новая от 24 февраля) ?
anthropic/claude-3.7-sonnet-thinking
Базовый+GPT-4 (не Тестовый) размышления
0.42.020000026 февда
Anthropic: Claude 3.7 Sonnet (новая от 24 февраля) ?
anthropic/claude-3.7-sonnet
Базовый+GPT-4 топ от 24 февраля tools
0.42.020000024 февда
Anthropic: Claude 3.5 Haiku (online) ?
anthropic/claude-3-5-haiku-online
За вызов: 3.45 р. топ от 5 ноября tools
0.140.7020000025 янвда
Anthropic: Claude 3.5 Sonnet (новая от 22 октября) (online) ?
anthropic/claude-3.5-sonnet-online
Базовый+GPT-4 За вызов: 3.45 р. топ от 22 октября tools
0.42.020000025 янвда
Anthropic: Claude 3.5 Haiku ?
anthropic/claude-3-5-haiku
топ от 5 ноября tools
0.140.702000005 ноя 24да
Anthropic: Claude 3.5 Sonnet (новая от 22 октября) ?
anthropic/claude-3.5-sonnet
Базовый+GPT-4 топ от 22 октября tools
0.42.020000022 окт 24да
Anthropic: Claude 3 Haiku ?
anthropic/claude-3-haiku
дешевая и с большим контекстом tools
0.03750.187520000014 мар 24да
Anthropic: Claude 3 Opus ?
anthropic/claude-3-opus
Базовый+GPT-4 ТОП! tools
2.010.02000006 мар 24да
Anthropic: Claude 3 Sonnet ?
anthropic/claude-3-sonnet
Базовый+GPT-4 tools
0.42.02000006 мар 24да
Anthropic: Claude v2.0 ?
anthropic/claude-2.0
Базовый+GPT-4
1.23.610000023 ноя 23да
Anthropic: Claude v2.1 ?
anthropic/claude-2
Базовый+GPT-4
1.23.620000023 ноя 23да

Модели Perplexity: онлайн, с доступом к Интернету и фактической информации


Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.
Наша новость на Хабре о моделях Perplexity

Внимание: онлайн-модель дополнительно тарифицируется по каждому запросу (т.к. идет вызов онлайн-поиска). Модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.

Рекомендация: поскольку Perplexity постоянно выпускает новые модели и удаляет обработку старых, рекомендуется установить в ваших приложениях ID псевдонима для малой или большой модели – тогда сервис сам перенаправит ваш запрос в самую последнюю версию (по ней и будет происходить тарификация)

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Perplexity: Sonar ?
perplexity/sonar-online
За вызов: 0.85 р. рекомендуется онлайн
0.150.1512800031 янвнет
Perplexity: Sonar Reasoning (на базе DeepSeek R1) ?
perplexity/sonar-r1-online
Базовый+GPT-4 За вызов: 0.85 р. онлайн размышления
0.130.7012700029 янвнет
Perplexity: Llama 3.1 Sonar 70B Online ?
perplexity/llama-3.1-sonar-large-128k-online
За вызов: 0.85 р. рекомендуется онлайн
0.150.151280008 авг 24нет
Perplexity: Llama 3.1 Sonar 8B Online ?
perplexity/llama-3.1-sonar-small-128k-online
За вызов: 0.85 р. онлайн
0.040.041280008 авг 24нет
Perplexity, последняя большая онлайн модель (перенаправляет в нужный ID)
perplexity/latest-large-online
рекомендуется онлайн
00320008 авг 24нет
Perplexity, последняя малая онлайн модель (перенаправляет в нужный ID)
perplexity/latest-small-online
онлайн
00320008 авг 24нет


Модели Google: Gemini Pro, Flash


Нейросети от Google. Достаточно дешевые.
Рекомендуются последние версии Gemini, однако пользователи жалуются, что даже при не очень большом контексте (5К+ символов) Google относительно часто возвращает ошибки и очень маленькие ответы (июнь 2024).
В случае, если нужна точность, рекомендуем модели Claude 3 с большим контекстом.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Gemma 3 27B (опенсорс) ?
google/gemma-3-27b-it
0.050.0812800013 марнет
Google: Gemini Flash 2.0 Lite ?
google/gemini-2.0-flash-lite-001
Базовый+GPT-4 дешевая и с большим контекстом
0.0150.045100000026 февнет
Google: Gemini Flash 2.0 ?
google/gemini-2.0-flash-001
Базовый+GPT-4 дешевая и с большим контекстом
0.0220.0910000005 февнет
Google: Gemini Pro 1.5 (версия 002 от 25 сентября) (online) ?
google/gemini-pro-1.5-online
Базовый+GPT-4 За вызов: 3.45 р.
0.51.5100000025 янвнет
Gemini 1.5 Flash-8B ?
google/gemini-flash-1.5-8b
дешевая и с большим контекстом tools
0.0150.0410000007 окт 24нет
Gemma 2 27B (опенсорс) ?
google/gemma-2-27b-it
0.100.10819217 июл 24нет
Google: Gemma 2 9B (опенсорс) ?
google/gemma-2-9b-it
0.030.03819228 июн 24нет
Google: Gemini Flash 1.5 (версия 002 от 25 сентября) ?
google/gemini-flash-1.5
Базовый+GPT-4 дешевая и с большим контекстом
0.0170.05100000025 сен 24нет
Google: Gemini Pro 1.5 (версия 002 от 25 сентября) ?
google/gemini-pro-1.5
Базовый+GPT-4
0.51.5100000025 сен 24нет
Google: PaLM 2 Chat 32k ?
google/palm-2-chat-bison-32k
0.0750.0753200011 ноя 23нет
Google: PaLM 2 Bison
google/palm-2-chat-bison
0.0750.075102411 ноя 23нет
Google: Gemini Pro 1.0 ?
google/gemini-pro
рекомендуется
0.0490.113276826 апр 24нет

Модели DeepSeek: V3, R1


Нашумевшие нейросети от DeepSeek. Достаточно дешевые.
Они крайне дешевые в своем классе – но только при использовании самого провайдера DeepSeek, который логирует запросы (и в конце января DeepSeek не смог переварить интерес к своим моделям и лег)
Поэтому мы также поддерживаем альтернативных провайдеров для DeepSeek (постфикс alt) – они дороже, но не декларируют логирование данных и в целом часто устойчивее.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
DeepSeek V3 0324 600B (альтернативные провайдеры) ?
deepseek/deepseek-chat-0324-alt
общие вопросы и программирование
0.160.1612800025 марнет
DeepSeek R1 дистиллят на базе LLama 3.3 70B (быстрая, более 200 токенов в секунду) ?
deepseek/deepseek-r1-distill-llama-70b-fast
Базовый+GPT-4 общие вопросы
0.450.453200014 февнет
DeepSeek R1 (конкурент o1, альтернативный провайдер, быстрее, но дороже) ?
deepseek/deepseek-r1-alt-fast
Базовый+GPT-4 размышления
0.360.991638403 февнет
DeepSeek R1 (конкурент o1, альтернативный провайдер, онлайн) ?
deepseek/deepseek-r1-alt-online
Базовый+GPT-4 За вызов: 3.45 р. онлайн размышления
0.120.3612800029 янвнет
DeepSeek R1 дистиллят на базе LLama 3.3 70B (для размышлений) ?
deepseek/deepseek-r1-distill-llama-70b
Базовый+GPT-4 общие вопросы
0.040.1512800028 янвнет
DeepSeek R1 (конкурент o1, для размышлений, альтернативный провайдер) ?
deepseek/deepseek-r1-alt
Базовый+GPT-4 общие вопросы
0.120.361280003 февнет
DeepSeek R1 (конкурент o1, для размышлений, не рекомендуется для обычного пользования) ?
deepseek/deepseek-r1
Базовый+GPT-4 провайдер логирует данные общие вопросы
0.200.806553620 янвнет
DeepSeek V3 600B (альтернативные провайдеры) ?
deepseek/deepseek-chat-alt
общие вопросы и программирование
0.160.1612800014 янвнет
DeepSeek V3 600B (обновлена 26 декабря) ?
deepseek/deepseek-chat
провайдер логирует данные общие вопросы
0.050.166553626 дек 24нет
DeepSeek-Coder-V2 236B MoE (v2.5) (теперь универсальная модель, перенаправляется в DeepSeek Chat) ?
deepseek/deepseek-coder
топ программирование провайдер логирует данные
0.040.0512800011 сен 24нет


Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium


Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Mistral: Codestral 2501 ?
mistralai/codestral-2501
программирование
0.050.1425600017 янвнет
Mistral: Mistral Large 2 (версия 2411) ?
mistralai/mistral-large-2411
Базовый+GPT-4 tools
0.451.3512800019 ноя 24нет
Ministral 8B ?
mistralai/ministral-8b
tools
0.020.0212800021 окт 24нет
Mistral: Mistral NeMo 12B ?
mistralai/mistral-nemo
поддерживает русский общие вопросы tools
0.050.0512800019 июл 24нет
Mistral: Mixtral 8x22B Instruct ?
mistralai/mixtral-8x22b-instruct
0.150.156553618 апр 24нет
Mistral: Mistral Large 2 ?
mistralai/mistral-large
Базовый+GPT-4
0.451.3512800024 июл 24нет
Mistral Medium ?
mistralai/mistral-medium
Базовый+GPT-4
0.421.253200015 янв 24нет
Mistral Small ?
mistralai/mistral-small
0.300.903200027 фев 24нет
Mistral Tiny ?
mistralai/mistral-tiny
0.040.043200027 фев 24нет
Mistral: Mixtral 8x7B Instruct ?
mistralai/mixtral-8x7b-instruct
дешевая 8x7B с большим контекстом
0.0450.0453276818 мар 24нет
Mistral: Mistral Small 3.1 24B ?
mistralai/mistral-small-3.1-24b-instruct
0.020.0512800019 марнет
Mistral: Mistral Small 3 ?
mistralai/mistral-small-24b-instruct-2501
0.020.053200031 янвнет
Mistral 7B Instruct v0.3 ?
mistralai/mistral-7b-instruct
0.0350.035819229 мая 24нет

Модели Cohere: с фокусом на RAG, function calling, tools


Модели от Cohere с фокусом на RAG, function calling, tools.
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Cohere: Command R+ (август 2024) ?
cohere/command-r-plus-08-2024
Базовый+GPT-4 общие вопросы и ролеплей
0.381.512800031 авг 24нет
Cohere: Command R (август 2024) ?
cohere/command-r-08-2024
общие вопросы и ролеплей
0.0250.0912800031 авг 24нет
Cohere: Command R+ ?
cohere/command-r-plus
tools
0.452.251280006 апр 24нет
Cohere: Command R ?
cohere/command-r
0.0750.2251280006 апр 24нет
Cohere: Command R7B (12-2024) ?
cohere/command-r7b-12-2024
За вызов: 0.005 р.
0.010.02512800016 дек 24нет

Модели Qwen – опенсорс модели от Tongyi Qianwen (Alibaba)


Серия языковых моделей от Tongyi Qianwen (Alibaba group, Китай).
Старшие модели показывают неплохое знание русского языка – но рекомендуется ставить температуру пониже (около 0.2) и явно прописывать «отвечать на русском языке».
 
Блог-запись о запуске моделей
 
Используя эти модели, вы соглашаетесь с Tongyi Qianwen LICENSE AGREEMENT
Для модели 110B также доступна translate-версия.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Qwen: QwQ 32B ?
qwen/qwq-32b
дешевая и быстрая, до 300 токенов в секунду размышления
0.050.071280006 марнет
Qwen2.5 72B Instruct (с поддержкой structured outputs) ?
qwen/qwen-2.5-72b-structured
Базовый+GPT-4 structured-outputs
0.220.223200019 дек 24нет
Qwen: QwQ 32B Preview ?
qwen/qwq-32b-preview
Базовый+GPT-4 конкурент o1 по рассуждениям рассуждения
0.030.103276828 ноя 24нет
Qwen2.5 Coder 32B Instruct ?
qwen/qwen-2.5-coder-32b-instruct
недорогая для программирования программирование и общие вопросы
0.050.0512800012 ноя 24нет
Qwen2.5 7B Instruct ?
qwen/qwen-2.5-7b-instruct
0.040.0412800016 окт 24нет
Qwen2.5 72B Instruct ?
qwen/qwen-2.5-72b-instruct
ролеплей и общие вопросы
0.600.6012800021 сен 24нет
Qwen 2 72B Instruct ?
qwen/qwen-2-72b-instruct
0.140.14327687 июн 24нет
Qwen: Qwen-Max ?
qwen/qwen-max
Базовый+GPT-4 tools
0.240.96330001 февнет
Qwen: Qwen-Plus ?
qwen/qwen-plus
tools
0.060.181280001 февнет
Qwen: Qwen-Turbo ?
qwen/qwen-turbo-2024-11-01
tools
0.0160.03510000001 февнет

Модели Amazon


Серия языковых моделей от Amazon (начиная с декабря 2024).
 
Модели отличаются большим контекстом (до 300 000 токенов)

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Amazon: Nova Pro 1.0 ?
amazon/nova-pro-v1
Базовый+GPT-4
0.150.503000006 дек 24да
Amazon: Nova Lite 1.0 ?
amazon/nova-lite-v1
tools
0.020.043000006 дек 24да
Amazon: Nova Micro 1.0 ?
amazon/nova-micro-v1
tools
0.0120.031280006 дек 24да


Российские модели Сайга и Вихрь – альтернатива YaGPT и GigaChat


Сайга – третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре: https://habr.com/ru/articles/767588/
 
Также здесь представлены модели от команды VikhrModels, которая также с 2024 года начала дотренировывать опенсорсные модели на русских данных. Они также рекомендуются к знакомству – по метрикам они не хуже gpt-3.5 и могут приближаться к gpt-4o-mini.
 
Серия моделей OMF включает в себя «холодный старт» – т.е. загрузку по мере запроса. Если на первый запрос вы не получили ответ по таймауту, просто подождите 1–2 минуты и попробуйте снова – весьма вероятно, что модель загрузится.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
SAINEMO-reMIX (микс русскоязычных моделей) ?
OMF-R-Moraliane/SAINEMO-reMIX
Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face
0.100.101600016 дек 24нет
Сайга MistralNemo 12B v1 (российский разработчик) ?
OMF-R-IlyaGusev/saiga_nemo_12b
Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face
0.100.1081923 ноя 24нет
Vikhr-Nemo-12B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Nemo-12B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.15 р. Hugging Face
0.100.101600022 сен 24нет
Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Llama3.1-8B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.101600022 сен 24нет
Saiga/Llama3 8B (российский разработчик) ?
OMF-R-IlyaGusev/saiga_llama3_8b
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.10819219 июл 24нет

Опенсорс модели


Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку “?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.
 
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
 
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Extract Text (конвертация файлов DOCX, PDF в текст) ?
utils/extract-text-1.0
За вызов: 0.50 р. конвертация документов
0.00.0200016 февнет
Llama 3.3 70B Instruct (быстрая, более 200 токенов в секунду) ?
meta-llama/llama-3.3-70b-instruct-fast
0.100.1512800014 февнет
EVA Qwen2.5 72B v0.2 (online) ?
eva-unit-01/eva-qwen-2.5-72b-online
За вызов: 3.45 р. ролеплей
0.600.801638425 янвнет
Llama 3.3 70B Instruct (online) ?
meta-llama/llama-3.3-70b-instruct-online
За вызов: 3.45 р.
0.080.0812800025 янвнет
MiniMax: MiniMax-01 ?
minimax/minimax-01
Базовый+GPT-4 большой контекст
0.030.20100000017 янвнет
Sao10K: Llama 3.3 Euryale 70B ?
sao10k/l3.3-euryale-70b
ролеплей
0.250.25800019 дек 24нет
EVA Llama 3.33 70b ?
eva-unit-01/eva-llama-3.33-70b
ролеплей
0.600.801600019 дек 24нет
Llama 3.3 70B Instruct (с поддержкой structured outputs) ?
meta-llama/llama-3.3-70b-structured
Базовый+GPT-4 structured-outputs
0.220.2212800019 дек 24нет
xAI: Grok 2 1212 ?
x-ai/grok-2-1212
Базовый+GPT-4 tools
0.31.512800016 дек 24да
Llama 3.3 70B Instruct ?
meta-llama/llama-3.3-70b-instruct
0.080.081280008 дек 24нет
EVA Qwen2.5 72B v0.2 ?
eva-unit-01/eva-qwen-2.5-72b
ролеплей
0.600.80163846 дек 24нет
NVIDIA: Llama 3.1 Nemotron 70B Instruct ?
nvidia/llama-3.1-nemotron-70b-instruct
0.150.1512800021 окт 24нет
Rocinante 12B ?
thedrummer/rocinante-12b
ролеплей
0.040.0753276816 окт 24нет
Grok Beta от xAI ?
x-ai/grok-beta
Базовый+GPT-4 tools
0.752.112800021 окт 24нет
Llama 3.2 90B Instruct ?
meta-llama/llama-3.2-90b-instruct
0.150.1512800026 сен 24нет
Llama 3.2 3B Instruct ?
meta-llama/llama-3.2-3b-instruct
0.0150.01512800026 сен 24нет
Mistral Nemo 12B Starcannon ?
aetherwiing/mn-starcannon-12b
ролеплей
0.300.301200028 авг 24нет
Llama 3.1 Euryale 70B v2.2 ?
sao10k/l3.1-euryale-70b
квантизация fp8 ролеплей Hugging Face
0.250.25819228 авг 24нет
Hermes 3 405B Instruct ?
nousresearch/hermes-3-llama-3.1-405b
ролеплей и общие вопросы
0.700.7012800017 авг 24нет
Mistral Nemo 12B Celeste ?
nothingiisreal/mn-celeste-12b
поддерживает русский ролеплей
0.230.23320008 авг 24нет
Llama 3.1 70B Instruct
meta-llama/llama-3.1-70b-instruct
tools
0.120.1212800024 июл 24нет
Llama 3.1 8B Instruct
meta-llama/llama-3.1-8b-instruct
0.0270.02712800024 июл 24нет
Llama 3.1 405B Instruct ?
meta-llama/llama-3.1-405b-instruct
Базовый+GPT-4 самая большая опенсорс модель от 23 июля fp8 квантизация tools
0.500.5012800023 июл 24нет
Magnum 72B ?
alpindale/magnum-72b
квантизация int4 ролеплей
0.500.601638412 июл 24нет
NVIDIA Nemotron 4 340B Instruct ?
nvidia/nemotron-4-340b-instruct
выключена провайдером топ опенсорс переводчик от 25 июня общие вопросы
0.630.63409625 июн 24нет
Euryale-v2.1-70B ?
sao10k/euryale-70b
ролеплей
0.220.221600030 июн 24нет
Llama 3 Lumimaid 70B ?
neversleep/llama-3-lumimaid-70b
int4 квантизация ролеплей
0.670.90819229 мая 24нет
Phi-3 Mini Instruct 3.8B ?
microsoft/phi-3-mini-128k-instruct
0.0150.01512800027 мая 24нет
Phi-3 Medium Instruct 14B ?
microsoft/phi-3-medium-128k-instruct
0.150.1512800027 мая 24нет
Llama 3 Lumimaid 8B (large-context) ?
neversleep/llama-3-lumimaid-8b-large
ролеплей
0.040.34245766 мая 24нет
LLaMA v3 70B Instruct ?
meta-llama/llama-3-70b-instruct
0.1350.135819219 апр 24нет
LLaMA v3 8B Instruct ?
meta-llama/llama-3-8b-instruct
0.0350.035819219 апр 24нет
WizardLM-2 7B ?
microsoft/wizardlm-2-7b
0.040.043200018 апр 24нет
WizardLM-2 8x22B ?
microsoft/wizardlm-2-8x22b
топ ролеплей от 17 апреля ролеплей и общие вопросы
0.150.156553618 апр 24нет
Databricks: DBRX 132B Instruct ?
databricks/dbrx-instruct
0.150.15300004 апр 24нет
Midnight Rose 70B ?
sophosympatheia/midnight-rose-70b
топ ролеплей от 24 марта
0.150.15409524 мар 24нет
Nous: Hermes 2 Mixtral 8x7B DPO ?
nousresearch/nous-hermes-2-mixtral-8x7b-dpo
дешевая 8x7B с большим контекстом ролеплей и общие вопросы
0.0450.045320001 мар 24нет
Dolphin 2.6 Mixtral 8x7B ?
cognitivecomputations/dolphin-mixtral-8x7b
дешевая 8x7B с большим контекстом ролеплей и общие вопросы
0.0450.0453200020 янв 24нет
OpenHermes 2.5 Mistral 7B ?
teknium/openhermes-2.5-mistral-7b
0.040.04409610 дек 23нет
Toppy M 7B ?
undi95/toppy-m-7b
ролеплей
0.040.043276816 янв 24нет
OpenChat 7B ?
openchat/openchat-7b
рекомендуется
0.0270.02781926 июн 24нет
Mythalion 13B ?
pygmalionai/mythalion-13b
ролеплей
0.168750.16875819216 янв 24нет
Gryphe: MythoMax L2 13B ?
gryphe/mythomax-L2-13b
дешевая 13B
0.040.0440968 мар 24нет

Translate-версии опенсорс моделей


Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.

Magnum 72B (translate-версия)
translate-alpindale/magnum-72b
ролеплей
0.500.601638412 июл 24нет
Euryale-v2.1-70B (translate-версия)
translate-sao10k/euryale-70b
ролеплей
0.220.221600030 июн 24нет
Llama 3 Lumimaid 70B (translate-версия)
translate-neversleep/llama-3-lumimaid-70b
ролеплей
0.670.90819227 мая 24нет
Phi-3 Mini Instruct 3.8B (translate-версия)
translate-microsoft/phi-3-mini-128k-instruct
0.0250.02512800027 мая 24нет
Llama 3 Lumimaid 8B (large-context) (translate-версия)
translate-neversleep/llama-3-lumimaid-8b-large
ролеплей
0.040.34245766 мая 24нет
WizardLM-2 7B (translate-версия)
translate-microsoft/wizardlm-2-7b
0.060.063200018 апр 24нет
Mistral: Mixtral 8x22B Instruct (translate-версия)
translate-mistralai/mixtral-8x22b-instruct
0.170.176553618 апр 24нет
WizardLM-2 8x22B (translate-версия)
translate-microsoft/wizardlm-2-8x22b
топ ролеплей от 17 апреля
0.170.176553618 апр 24нет
Databricks: DBRX 132B Instruct (Translate-версия)
translate-databricks/dbrx-instruct
0.170.17300004 апр 24нет
Midnight Rose 70B (Translate-версия)
translate-sophosympatheia/midnight-rose-70b
топ ролеплей от 24 марта
0.150.15409524 мар 24нет
Translate-версия Nous: Hermes 2 Mixtral 8x7B DPO
translate-nousresearch/nous-hermes-2-mixtral-8x7b-dpo
дешевая 8x7B с большим контекстом
0.0650.065320001 мар 24нет
Translate-версия Dolphin 2.6 Mixtral 8x7B
translate-cognitivecomputations/dolphin-mixtral-8x7b
дешевая 8x7B с большим контекстом
0.0650.065320001 мар 24нет
Translate-версия OpenHermes 2.5 Mistral 7B
translate-teknium/openhermes-2.5-mistral-7b
0.060.06409610 дек 23нет
Translate-версия Toppy M 7B
translate-undi95/toppy-m-7b
0.060.06409610 дек 23нет
Translate-версия OpenChat 7B ?
translate-openchat/openchat-7b
0.0370.03781926 июн 24нет
Mythalion 13B with Ru-En translation (beta) ?
translate-pygmalionai/mythalion-13b
0.178750.17875819217 ноя 23нет
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ?
translate-mistralai/mistral-7b-instruct
0.060.06819224 окт 23нет
Translate-версия Gryphe: MythoMax L2 13B
translate-gryphe/mythomax-L2-13b
0.060.06409612 янв 24нет

Самые свежие опенсорс модели Open Models Fan (OMF) (бета-тест)


Самые свежие опенсорс модели серии Open Models Fan (могут быть недоступны на Тестовом тарифе).
 
Особенности:
– Модели доступны для экспериментирования, а не для реальной автоматизации (но они также доступны через API). Поэтому, пожалуйста, используйте их вручную или на малом объеме автоматических запросов (до 500). Если вам нужно интенсивно работать с ними, рекомендуем развернуть их на собственном сервере. Если мы увидим большое число автоматических запросов от вас к этим моделям, мы оставляем за собой право временно заблокировать ваш аккаунт
– Следствие – мы берем плату за вызов и небольшую плату за входные и выходные символы. Таким образом, эти модели более выгодно использовать для долгого ролеплея с большим контекстом (если они это поддерживают)
– Скорость вывода – 10–40 токенов в секунду, в зависимости от размера модели.
– Модели 70B и выше поставляются в квантизации FP8 – создавая баланс между загрузкой серверов и качеством. В целом, падение качества по сравнению с FP16 и FP32 (оригинал) довольно небольшое.
– Размер контекста не гарантирован (в процессе выяснения у провайдера)
– Обычно опенсорсные файнтюны моделей в первую очередь предназначены для ролеплея и написания историй (часто – на английском, если не указано обратное). Для общих кейсов мы рекомендуем обычные модели.
Серия моделей OMF включает в себя «холодный старт» – т.е. загрузку по мере запроса. Если на первый запрос вы не получили ответ по таймауту, просто подождите 1–2 минуты и попробуйте снова – весьма вероятно, что модель загрузится.
 
Пожалуйста, поддержите опенсорсную альтернативу проприетарным моделям!

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Forgotten Abomination Mistral 3 24B V2.2 ?
OMF-Forgotten-Abomination-24B-V2.2
Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face
0.150.151638419 марнет
Hamanasu QwQ 32B V2 RP ?
OMF-Hamanasu-QwQ-32B-V2-RP
Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face
0.180.181638419 марнет
QwQ 32B (abliterated) ?
OMF-QwQ-32B-abliterated
Open Models Fan За вызов: 0.25 р. ролеплей
0.180.181638419 марнет
SAINEMO-reMIX (микс русскоязычных моделей) ?
OMF-R-Moraliane/SAINEMO-reMIX
Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face
0.100.101600016 дек 24нет
EVA Qwen2.5-72B v0.1 ?
OMF-EVA-Qwen2.5-72B-v0.1
Open Models Fan За вызов: 0.50 р. ролеплей
0.250.2581928 ноя 24нет
Сайга MistralNemo 12B v1 (российский разработчик) ?
OMF-R-IlyaGusev/saiga_nemo_12b
Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face
0.100.1081923 ноя 24нет
EVA Qwen2.5-72B v0.0 ?
OMF-EVA-Qwen2.5-72B-v0.0
Open Models Fan За вызов: 0.50 р. ролеплей
0.250.2581923 ноя 24нет
Qwen2.5-72B-Instruct-abliterated ?
OMF-Qwen2.5-72B-Instruct-abliterated
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.251600016 окт 24нет
MN-12B-Starcannon-v3 ?
OMF-nothingiisreal/MN-12B-Starcannon-v3
Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face
0.100.101600025 сен 24нет
Qwen2.5-Math-72B-Instruct ?
OMF-Qwen/Qwen2.5-Math-72B-Instruct
Open Models Fan За вызов: 0.50 р. математика Hugging Face
0.250.251600025 сен 24нет
Vikhr-Nemo-12B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Nemo-12B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.15 р. Hugging Face
0.100.101600022 сен 24нет
Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Llama3.1-8B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.101600022 сен 24нет
Qwen2 Math 72B Instruct ?
OMF-Qwen/Qwen2-Math-72B-Instruct
Open Models Fan За вызов: 0.50 р. математика Hugging Face
0.250.251600010 авг 24нет
Vicuna 13B v1.5 (ретро) ?
OMF-lmsys/vicuna-13b-v1.5
Open Models Fan За вызов: 0.25 р. ретро ролеплей Hugging Face
0.100.10409630 мар 23нет
Smaug Qwen2 72B Instruct ?
OMF-abacusai/Smaug-Qwen2-72B-Instruct
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.251600022 июл 24нет
Tess v2.5.2 Qwen2 72B ?
OMF-Tess-v2.5.2-Qwen2-72B
Open Models Fan За вызов: 0.50 р. Hugging Face
0.250.251600019 июл 24нет
MG-FinalMix-72B (Magnum-72B based) ?
OMF-Undi95/MG-FinalMix-72B
Open Models Fan За вызов: 0.50 р. ролеплей Hugging Face
0.250.251600019 июл 24нет
Sao10K: L3 8B Lunaris v1 ?
OMF-sao10k/l3-8b-lunaris-v1
Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face
0.100.10819219 июл 24нет
New Dawn Llama-3-70B 32K v1.0 ?
OMF-New-Dawn-Llama-3-70B-32K-v1.0
Open Models Fan За вызов: 0.50 р. ролеплей Hugging Face
0.250.25819219 июл 24нет
TenyxChat-DaybreakStorywriter-70B ?
OMF-DaybreakStorywriterXTenyxChat-70B
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.25819219 июн 24нет
Kunoichi DPO v2 7B ?
OMF-SanjiWatsuki/Kunoichi-DPO-v2-7B
Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face
0.100.10819219 июн 24нет
Smaug-Llama-3-70B-Instruct ?
OMF-abacusai/Smaug-Llama-3-70B-Instruct
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.25819219 июл 24нет
Suzume 8B ?
OMF-lightblue/suzume-llama-3-8B-multilingual
Open Models Fan За вызов: 0.25 р. Hugging Face
0.100.10819219 июл 24нет
Saiga/Llama3 8B (российский разработчик) ?
OMF-R-IlyaGusev/saiga_llama3_8b
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.10819219 июл 24нет

Text-to-image (генерация изображений по тексту)

OpenAI Dall-E


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке “?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
 
Отчет: сравнение моделей генерации изображений
 
Для ознакомления с возможностями Dalle-3 рекомендуем статью от OpenAI Что нового в Dalle-3

OpenAI: Dall-E 3 ?
openai/dall-e-3
Базовый+GPT-4 (не Тестовый) топ! генерация изображений
10.00.0409613 мар 24нет
OpenAI: Dall-E 2 ?
openai/dall-e-2
Базовый+GPT-4 (не Тестовый) генерация изображений
10.00.0409613 мар 24нет

Другие модели (FLUX, Stable Diffusion, Playground)


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Подробнее о стоимости генерации при разном разрешении и качестве по кнопке “?", там же описание дополнительных параметров, доступных при вызове модели.
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
 
Отчет: сравнение моделей генерации изображений

FLUX.1.1 [pro] ?
img-flux/pro1.1
Базовый+GPT-4 (не Тестовый) генерация изображений 14.9 р. за изображение
10.00.020004 окт 24нет
FLUX.1 [pro] ?
img-flux/pro
Базовый+GPT-4 (не Тестовый) генерация изображений 14.9 р. за изображение
10.00.0200028 авг 24нет
FLUX.1 [dev] ?
img-flux/dev
Базовый+GPT-4 (не Тестовый) генерация изображений 7.5 р. за изображение
10.00.0200028 авг 24нет
FLUX.1 [schnell] ?
img-flux/schnell
Базовый+GPT-4 (не Тестовый) генерация изображений 1.8 р. за изображение
10.00.0204828 авг 24нет
Playground v2.5 ?
img-playground-v2-5-1024px
Базовый+GPT-4 (не Тестовый) генерация изображений 1.45 р. за 1 изображение
10.00.0200012 июл 24да
Stable Diffusion XL v1.0 ?
img-stable/stable-diffusion-xl-1024
Базовый+GPT-4 (не Тестовый) генерация изображений 0.95 р. за 1 изображение
10.00.0200030 июн 24нет
Dummy Image ?
img-dummy/image
За вызов: 0.005 р.
0.000.00409613 мар 24нет


Embeddings


Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).
 
Пример реализации RAG с использованием наших эмбеддингов доступен у нас на Github

Старые (v2)


Text Embedding Ada v2 ?
text-embedding-ada-002
0.030.00102413 мар 24нет

Новые (v3)


OpenAI: text-embedding-3-large (тест)
emb-openai/text-embedding-3-large
0.0350.03200013 мар 24нет
OpenAI: text-embedding-3-small (тест)
emb-openai/text-embedding-3-small
0.0060.03200013 мар 24нет

Vision-модели (вопросы по изображению, OCR)


Предназначены для совместной обработки текста и изображений.
 
Временные особенности:
  • Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
  • Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
  • Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
  • Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Llama 3.2 90B Vision Instruct (structured outputs) (бета-тестирование) ?
vis-meta-llama/llama-3.2-90b-vision-structured
Базовый и выше (не Тестовый) За вызов: 0.03 р. около 1.8 р. за изображение structured-outputs
0.300.3012800026 сен 24нет
Gemma 3 27B (опенсорс, vision-версия) ?
vis-google/gemma-3-27b-it
0.04 р. за изображение
0.100.1612800019 марнет
Mistral: Mistral Small 3.1 24B (vision-версия) ?
vis-mistralai/mistral-small-3.1-24b-instruct
0.05 р. за изображение
0.050.1012800019 марнет
Anthropic: Claude 3.7 Sonnet (vision) ?
vis-anthropic/claude-3.7-sonnet
Базовый+GPT-4 около 1.0 р. за изображение tools
0.84.020000019 марда
Google: Gemini Flash 2.0 (vision-версия) ?
vis-google/gemini-2.0-flash-001
Базовый+GPT-4 очень дешевая 0.06 р. за изображение
0.050.12100000019 марнет
Qwen2.5 VL 72B Instruct ?
vis-qwen/qwen2.5-vl-72b-instruct
Базовый+GPT-4 За вызов: 0.07 р. топ! около 0.30 р. за изображение
0.300.303276819 марнет
Llama 3.2 90B Vision Instruct ?
vis-meta-llama/llama-3.2-90b-vision-instruct
Базовый и выше (не Тестовый) За вызов: 0.03 р. около 0.04 р. за изображение
0.220.2212800026 сен 24нет
Llama 3.2 11B Vision Instruct ?
vis-meta-llama/llama-3.2-11b-vision-instruct
Базовый и выше (не Тестовый) За вызов: 0.02 р. около 0.03 р. за изображение
0.0550.05512800026 сен 24нет
Mistral: Pixtral 12B ?
vis-mistralai/pixtral-12b
За вызов: 0.05 р. около 0.2 р. за изображение
0.080.08409621 сен 24нет
Qwen2-VL 72B Instruct ?
vis-qwen/qwen-2-vl-72b-instruct
Базовый+GPT-4 За вызов: 0.07 р. топ! около 0.05 р. за изображение
0.600.603276821 сен 24нет
OpenAI: GPT-4o (2024-08-06) (vision-версия) ?
vis-openai/gpt-4o-2024-08-06
Базовый+GPT-4 топ! около 0.15 р. за изображение tools structured-outputs
0.552.201280006 авг 24да
OpenAI: gpt-4o-mini (vision-версия)
vis-openai/gpt-4o-mini
Базовый+GPT-4 (не Тестовый) около 0.80 р. за изображение
0.0370.1512800027 июл 24да
Anthropic: Claude 3.5 Sonnet (vision) (новая от 22 октября) ?
vis-anthropic/claude-3.5-sonnet
Базовый+GPT-4 около 0.7 р. за изображение tools
0.63.020000022 окт 24да
Google: Gemini Flash 1.5 (vision-версия) ?
vis-google/gemini-flash-1.5
Базовый+GPT-4 очень дешевая 0.03 р. за изображение
0.0450.10100000014 авг 24нет
OpenAI: GPT-4o (vision) ?
vis-openai/gpt-4o
Базовый+GPT-4 топ!
1.103.3012800031 мая 24да
Google: Gemini Pro 1.5 (vision-вариант) ?
vis-google/gemini-pro-1.5
Базовый+GPT-4 0.60 р. за 1 изображение
0.752.0100000010 апр 24нет
OpenAI: GPT-4 Vision Turbo ?
vis-openai/gpt-4-turbo
Базовый+GPT-4 топ! около 1.7 р. за 1 изображение
2.006.0012800027 апр 24да
Anthropic: Claude 3 Haiku (vision) ?
vis-anthropic/claude-3-haiku
Базовый+GPT-4 около 0.1 р за 1 изображение tools
0.0660.320000014 мар 24да
Anthropic: Claude 3 Opus (vision) ?
vis-anthropic/claude-3-opus
Базовый+GPT-4 около 3.3 р. за изображение
3.015.02000005 мар 24да
Anthropic: Claude 3 Sonnet (vision) ?
vis-anthropic/claude-3-sonnet
Базовый+GPT-4 около 0.7 р. за изображение
0.63.02000005 мар 24да
Google: Gemini Pro Vision (preview) ?
vis-google/gemini-pro-vision
Базовый+GPT-4 скидка 90% на обработку изображения 0.04 р. за 1 изображение (со скидкой)
0.050.10655367 мая 24нет
Qwen: Qwen-VL-Max ?
vis-qwen/qwen-vl-max
Базовый+GPT-4 0.40 р. за изображение
0.281.2012800019 марнет
Qwen: Qwen-VL-Plus ?
vis-qwen/qwen-vl-plus
0.08 р. за изображение
0.070.2012800019 марнет

Speech-To-Text-модели (распознавание речи)


Предназначены для распознавания речи.
 
Временные особенности:
  • Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: gpt-4o-transcribe ?
stt-openai/gpt-4o-transcribe
Базовый+GPT-4 1.92 р за минуту
32.000.00200026 марнет
OpenAI: gpt-4o-mini-transcribe ?
stt-openai/gpt-4o-mini-transcribe
0.96 р за минуту
16.000.00200022 марнет
OpenAI: Whisper (v3, сторонний провайдер, тест) ?
stt-openai/whisper-v3
0.90 р за минуту
15.000.00200028 июн 24нет
OpenAI: Whisper v3 Turbo ?
stt-openai/whisper-v3-turbo
0.72 р за минуту
12.000.0020001 марнет
OpenAI: Whisper (v3, сторонний провайдер, тест) ?
stt-openai/whisper-1
0.90 р за минуту
15.000.00200028 июн 24нет

Text-to-Speech-модели (генерация речи)


Предназначены для генерации речи по тексту.
Условия использования моделей OpenAI: вы обязаны явно декларировать, что используете голос ИИ.
 
Временные особенности:

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: gpt-4o-mini-tts ?
tts-openai/gpt-4o-mini-tts
Базовый и выше (не Тестовый) рекомендуется настройка интонаций для чтения текста
7.50.0409622 марда
OpenAI: TTS-1-HD ?
tts-openai/tts-1-hd
Базовый+GPT-4
6.40.0409614 июн 24да
OpenAI: TTS-1 ?
tts-openai/tts-1
3.20.0409614 июн 24да

Text-to-Audio-модели (генерация музыки)


Предназначены для генерации музыки по текстовому запросу.
 
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Stable Audio (генерация музыки) ?
tta-stable/stable-audio
Базовый+GPT-4 За вызов: 5.00 р. генерация музыки 5 руб/генерация
0.00.0204828 авг 24нет

Генерация видео

Text-to-Video-модели (генерация видео, бета-тест)


Предназначены для генерации видео по текстовому запросу.
 
Особенности:
  • При вызове генерации стоимость списывается сразу, но запрос ставится в очередь. К сожалению, он может не выполнится, а деньги будут списаны – пока это часть рисков использования модели. Мы будем отслеживать такие ситуации.
  • Среднее время генерации – около 6 минут на ролик в Kling, 1–2 минуты для LTX Video 0.9.5
  • Вам нужно будет проверять готовность ролика специальными запросами к API
  • Готовые файлы будут доступны в течение 2 часов (пока)
 
Примеры генерации видео:

 
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
LTX 0.9.5 Text-to-Video ?
txt2vid-ltx/video-095
За вызов: 12.0 р.
0.00.0200014 марнет
Kling Pro V1.6 Text-to-Video (ВРЕМЕННО НЕДОСТУПНА) ?
txt2vid-kling/pro16
Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.
0.00.020008 янвнет
Kling Standart Text-to-Video v1.6 ?
txt2vid-kling/standart16
Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.
0.00.020008 янвнет
Haiper 2.0 Text-to-Video ?
txt2vid-haiper-video-v2
Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.
0.00.020009 дек 24нет
Kling Pro V1.5 Text-to-Video ?
txt2vid-kling/pro15
Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.
0.00.020009 дек 24нет
Kling Standart Text-to-Video ?
txt2vid-kling/standart
Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.
0.00.020008 дек 24нет

Image-to-Video-модели (генерация видео, бета-тест)


Предназначены для генерации видео по текстовому запросу и изображения.
 
Условия аналогичны text-to-video

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
LTX 0.9.5 Image-To-Video ?
img2vid-ltx/video-095
За вызов: 12.0 р.
0.00.0200014 марнет
Kling Pro V1.6 (Image-To-Video) ?
img2vid-kling/pro16
Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.
0.00.020008 янвнет
Kling Standart 1.6 (Image-To-Video) ?
img2vid-kling/standart16
Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.
0.00.020008 янвнет
Haiper 2.0 Image-to-Video ?
img2vid-haiper-video-v2
Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.
0.00.020009 дек 24нет
Kling Pro V1.5 (Image-To-Video) ?
img2vid-kling/pro15
Базовый+GPT-4 (не Тестовый) За вызов: 149.9 р.
0.00.020009 дек 24нет
Kling Standart (Image-To-Video) ?
img2vid-kling/standart
Базовый+GPT-4 (не Тестовый) За вызов: 49.9 р.
0.00.020008 дек 24нет

Text-to-Song-модели (генерация песен, бета-тест)


Предназначены для генерации песен по текстовому запросу и референсу.
 
Особенности:
  • При вызове генерации стоимость списывается сразу, но запрос ставится в очередь. К сожалению, он может не выполнится, а деньги будут списаны – пока это часть рисков использования модели. Мы будем отслеживать такие ситуации.
  • Среднее время генерации – около 1–2 минут на ролик в Minimax Music.
  • Вам нужно будет проверять готовность ролика специальными запросами к API
  • Готовые файлы будут доступны в течение 2 часов (пока)
 
Примеры генерации:
 
  • Есть клиент для тестирования генерации – доступен через меню Сервисы.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Minimax Music (генерация песни по тексту и аудиореференсу, временно отключена) ?
txt2sng-minimax/music
Базовый+GPT-4 (не Тестовый) За вызов: 10.0 р. генерация песен
0.00.0200029 дек 24нет

Utils, вспомогательные модели (конвертация документов в текст)


Предназначены для решения ряда дополнительных задач на сервисе..

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Extract Text (конвертация файлов DOCX, PDF в текст) ?
utils/extract-text-1.0
За вызов: 0.50 р. конвертация документов
0.00.0200016 февнет


Примечания


Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.

Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»