Мировые новинки у нас


  • 19 ноября, Mistral Large 2411 – подключили обновление модели Mistral Large.
  • 5 ноября, новая Haiku 3.5 – самая последняя модель от Anthropic, сравнима с версией Sonnet 3.5 от июня 2024.
  • 22 октября, новая Sonnet 3.5 – новая Sonnet 3.5 уже доступна на сервисе!
  • 13 октября, Grok Beta от xAI – модель от xAI, компании Илона Маска, который пытается конкурировать с OpenAI
  • 7 октября, Google Gemini Flash-8B – новые модели от Google.
  • 4 октября, FLUX pro 1.1 – лучшая мировая модель на текущий момент для генерации изображений уже у нас!
  • 26 сентября, серия LLama 3.2 подключена в течение суток после выхода!
  • 25 сентября, Google Gemini Pro 002 и Gemini Flash 002 – новые модели от Google.
  • 13 сентября, OpenAI o1-mini и o1-preview – новая модель от OpenAI подключена в течение суток!
  • 28 августа, FLUX schnell, dev и pro – топовые модели генерации изображений серии FLUX доступны у нас. FLUX pro даже обходит Midjourney на Арене генерирующих картинки моделей.
  • 28 августа, новые опенсорс модели – Hermes 405B (один из немногих файнтюнов Llama 3.1 405B), Mistral Nemo 12B Starcannon, Llama 3.1 Euryale 70B v2.2
  • 22 августа, Webapp AI Generator – выкатили ИИ-генератор веб-приложений по текстовому описанию с возможностью просмотра результата (аналог Artifacts). Доступно в «Интеграциях».
  • 14 августа, OpenAI: GPT-4o-latest – последняя сеть от OpenAI. Под ней OpenAI будет постоянно публиковать все новые и более совершенные релизы GPT-4o
  • 14 августа, OpenAI: GPT-4o-64k-output – версия GPT-4o, позволяющая генерировать расширенные результаты, вплоть до 64 000 токенов. Временно недоступна обычным подписчикам OpenAI, только специальным тестерам – а у нас доступна :)
  • 14 августа, Google Flash – значительно снижены цены вслед за Google
  • 7 августа, OpenAI: GPT-4o 2024–08–06 – последняя модель GPT-4o, с пониженной ценой и поддержкой структурированного выхода JSON (мы уже поддерживаем структурный выход по схеме)
  • 25 июля, Mistral Large 2 – последняя модель от Mistral (вышла 24 июля)
  • 23 июля, Llama 3.1 405B Instruct – доступна у нас, в течение 1.5 часов после официального релиза. (также доступны LLama 3.1 8B и 70B)
  • 19 июля, 10 новых опенсорс моделей – в серии Open Models Fan, предназначенной для поддержки доступа к опенсорс моделям (теперь на всех платных тарифных планах).
  • 18 июля, OpenAI: GPT-4o mini – в 22:00, спустя 2 часа после официального запуска, модель уже доступна!
  • 17 июля, Google Gemma 2 27B – новая опенсорс модель от Google. Очень неплохо общается на русском.
  • 12 июля, Playground 2.5 – опенсорс модель для генерации изображений уровня DALLE-3 (согласно рейтингу ЭЛО text-to-image моделей), но в пять раз дешевле DALLE-3.
  • 12 июля, Magnum 72B – топовая опенсорсная модель для ролевого взаимодействия
  • 30 июня, Stable Diffusion XL – подключили классическую опенсорс модель генерации изображений.
  • 28 июня, Google Gemma 2 9B – новая опенсорс модель от Google. Очень неплохо общается на русском.
  • 25 июня, NVIDIA Nemotron 4 340B Instruct – крупнейшая опенсорс модель на настоящий момент. Первая опенсорс модель, которая переводит по метрикам лучше Google Translate и DeepL.
  • 20 июня, Anthropic: Claude 3.5 Sonnet – новая топовая модель; по метрикам превосходит GPT-4o и предыдущий топовый Claude 3 Opus
  • 14 июня, OpenAI: TTS – добавили модели для генерации речи по тексту от OpenAI
  • 7 июня, Qwen2 72B Instruct – новая опенсорс модель из серии Qwen от Tongyi Qianwen (Alibaba group, Китай), сравнимая с LLama3 70B
  • 25 мая, Microsoft: Phi 3 Medium – самая старшая из серии Phi 3 моделей. Хорошая тренировка, 128 000 контекст.
  • 15 мая, Google: Gemini Flash 1.5 – с презентации Google IO от 14 мая. 1 миллион контекста и очень дешевая обработка.
  • 13 мая, OpenAI: GPT-4o – самая свежая и сильная модель от OpenAI уже на сервисе! (подключили в течение часа после выхода)
  • 11 мая, Qwen 1.5 14B/32B/72B/110B – опенсорс модели от Tongyi Qianwen (Alibaba group, Китай)
  • 6 мая, Lumimaid 8B – опенсорс модель для ролевого взаимодействия (файнтюн Llama3 8B)
  • 26 апреля, FireLLaVA 13B – опенсорс модель для вопросов по изображениям
  • 19 апреля, Llama3 8B/70B – новейшие опенсорс модели серии Llama.
  • 18 апреля, MicrosoftAI: WizardLM-2 7B – файнтюн 7B-модели от MicrosoftAI.
  • 18 апреля, Mistral: Mixtral 8x22B Instruct – официальная дотренировка от Mistral их модели на выполнение инструкций.
  • 16 апреля, MicrosoftAI: WizardLM-2 8x22B – мощный опенсорсный файнтюн для Mixtral 8x22B, по метрикам сопоставим с GPT-4.
  • 11 апреля, Mistral: Mixtral 8x22B – запустили самую последнюю опенсорс модель от Mistral.
  • 10 апреля, OpenAI: GPT-4-Turbo – последний вариант GPT-4-Turbo от 9 апреля
  • 10 апреля, Google: Gemini Pro 1.5 на 1 миллион контекста
  • Более старые новости по подключенным моделям


Текстовые модели

Модели OpenAI: ChatGPT, GPT-4o, GPT-4o-mini...


Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.
 
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Вам запрещён доступНастройках

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: GPT-3.5 Turbo
openai/gpt-3.5-turbo
0.150.340957 ноя 23да
OpenAI: GPT-3.5 Turbo 16k (11-06) ?
openai/gpt-3.5-turbo-1106
рекомендуется
0.150.31638516 янвда
OpenAI: GPT-3.5 Turbo Instruct ?
openai/gpt-3.5-turbo-instruct
0.2250.340952 окт 23да
OpenAI: GPT-3.5 Turbo 16k
openai/gpt-3.5-turbo-16k
0.450.61638330 сен 23да
OpenAI: GPT-3.5 Turbo 16k (01-25) ?
openai/gpt-3.5-turbo-0125
рекомендуется
0.0750.225163852 февда
OpenAI: GPT-4 ?
openai/gpt-4
Базовый+GPT-4
4.59819114 дек 23да
OpenAI: GPT-4 Turbo (1106-preview) ?
openai/gpt-4-1106-preview
Базовый+GPT-4
1.54.51280001 февда
OpenAI: GPT-4 Turbo (0125-preview) ?
openai/gpt-4-turbo-preview
Базовый+GPT-4
1.54.51280006 июнда
OpenAI: GPT-4 Turbo (gpt-4-turbo-2024-04-09) ?
openai/gpt-4-turbo
Базовый+GPT-4 топ!
1.54.512800010 апрда
OpenAI: GPT-4o ?
openai/gpt-4o
Базовый+GPT-4 топ от 13 мая
0.61.812800025 маяда
OpenAI: GPT-4o mini ?
openai/gpt-4o-mini
0.020.0812800018 июлда
OpenAI: GPT-4o (2024-05-13)
openai/gpt-4o-2024-05-13
Базовый+GPT-4
0.61.812800013 маяда
OpenAI: GPT-4o (2024-08-06) ?
openai/gpt-4o-2024-08-06
Базовый+GPT-4 топ от 6 августа
0.31.21280006 авгда
OpenAI: GPT-4o (до 64 000 выходных токенов) (альфа-версия) ?
openai/gpt-4o-64k-output
Базовый+GPT-4 (не Тестовый)
0.722.1612800014 авгда
OpenAI: GPT-4o (последняя, экспериментальная) ?
openai/gpt-4o-latest
Базовый+GPT-4 ТОП!
0.61.812800014 авгда
OpenAI: o1-mini (не рек. для обычных задач) ?
openai/o1-mini
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика
0.62.712800013 сеннет
OpenAI: o1-preview (для размышлений, не рек. для обычных задач) ?
openai/o1-preview
Базовый+GPT-4 (не Тестовый) биллинг с учетом размышлений (см. ?) размышления, математика
3.514.012800013 сенда
OpenAI: GPT-4 32k
openai/gpt-4-32k
Базовый+GPT-4
9183276711 сен 23да
OpenAI: Dall-E 2 ?
openai/dall-e-2
Базовый+GPT-4 (не Тестовый) генерация изображений
10.00.0409613 марнет
OpenAI: Dall-E 3 ?
openai/dall-e-3
Базовый+GPT-4 (не Тестовый) топ! генерация изображений
10.00.0409613 марнет

Модели Anthropic: Claude Sonnet, Opus, Haiku


Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Рекомендуем их нейросети Claude 3 – Haiku для дешевой и быстрой обработки большого контекста, Opus – для максимально качественной работы.

Anthropic: Claude v2.1 ?
anthropic/claude-2
Базовый+GPT-4
1.23.620000023 ноя 23да
Anthropic: Claude v2.0 ?
anthropic/claude-2.0
Базовый+GPT-4
1.23.610000023 ноя 23да
Anthropic: Claude 3 Sonnet ?
anthropic/claude-3-sonnet
Базовый+GPT-4
0.42.02000006 марда
Anthropic: Claude 3 Opus ?
anthropic/claude-3-opus
Базовый+GPT-4 ТОП!
2.010.02000006 марда
Anthropic: Claude 3 Haiku ?
anthropic/claude-3-haiku
дешевая и с большим контекстом
0.03750.187520000014 марда
Anthropic: Claude 3.5 Sonnet (новая от 22 октября) ?
anthropic/claude-3.5-sonnet
Базовый+GPT-4 топ от 22 октября
0.42.020000022 октда
Anthropic: Claude 3.5 Haiku ?
anthropic/claude-3-5-haiku
топ от 5 ноября
0.140.702000005 нояда

Модели Perplexity: онлайн, с доступом к Интернету и фактической информации


Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.
Наша новость на Хабре о моделях Perplexity

Внимание: онлайн-модель дополнительно тарифицируется по каждому запросу (т.к. идет вызов онлайн-поиска). Модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.

Рекомендация: поскольку Perplexity постоянно выпускает новые модели и удаляет обработку старых, рекомендуется установить в ваших приложениях ID псевдонима для малой или большой модели – тогда сервис сам перенаправит ваш запрос в самую последнюю версию (по ней и будет происходить тарификация)

Perplexity, последняя малая онлайн модель (перенаправляет в нужный ID)
perplexity/latest-small-online
онлайн
00320008 авгнет
Perplexity, последняя большая онлайн модель (перенаправляет в нужный ID)
perplexity/latest-large-online
рекомендуется онлайн
00320008 авгнет
Perplexity: Llama 3.1 Sonar 8B Online ?
perplexity/llama-3.1-sonar-small-128k-online
За вызов: 0.85 р. онлайн
0.040.041280008 авгнет
Perplexity: Llama 3.1 Sonar 70B Online ?
perplexity/llama-3.1-sonar-large-128k-online
За вызов: 0.85 р. рекомендуется онлайн
0.150.151280008 авгнет


Модели Google: Gemini Pro, Flash


Нейросети от Google. Достаточно дешевые.
Рекомендуются последние версии Gemini, однако пользователи жалуются, что даже при не очень большом контексте (5К+ символов) Google относительно часто возвращает ошибки и очень маленькие ответы (июнь 2024).
В случае, если нужна точность, рекомендуем модели Claude 3 с большим контекстом.

Google: Gemini Pro 1.0 ?
google/gemini-pro
рекомендуется
0.0490.113276826 апрнет
Google: PaLM 2 Bison
google/palm-2-chat-bison
0.0750.075102411 ноя 23нет
Google: PaLM 2 Chat 32k ?
google/palm-2-chat-bison-32k
0.0750.0753200011 ноя 23нет
Google: Gemini Pro 1.5 (версия 002 от 25 сентября) ?
google/gemini-pro-1.5
Базовый+GPT-4
0.51.5100000025 сеннет
Google: Gemini Flash 1.5 (версия 002 от 25 сентября) ?
google/gemini-flash-1.5
Базовый+GPT-4 дешевая и с большим контекстом
0.0170.05100000025 сеннет
Gemini 1.5 Flash-8B ?
google/gemini-flash-1.5-8b
дешевая и с большим контекстом
0.0150.0410000007 октнет
Google: Gemma 2 9B (опенсорс) ?
google/gemma-2-9b-it
0.030.03819228 июннет
Gemma 2 27B (опенсорс) ?
google/gemma-2-27b-it
0.100.10819217 июлнет

Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium


Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.

Mistral 7B Instruct v0.3 ?
mistralai/mistral-7b-instruct
0.0350.035819229 маянет
Mistral: Mixtral 8x7B Instruct ?
mistralai/mixtral-8x7b-instruct
дешевая 8x7B с большим контекстом
0.0450.0453276818 марнет
Mistral Tiny ?
mistralai/mistral-tiny
0.040.043200027 февнет
Mistral Small ?
mistralai/mistral-small
0.300.903200027 февнет
Mistral Medium ?
mistralai/mistral-medium
Базовый+GPT-4
0.421.253200015 янвнет
Mistral: Mistral Large 2 ?
mistralai/mistral-large
Базовый+GPT-4
0.451.3512800024 июлнет
Mistral: Mixtral 8x22B Instruct ?
mistralai/mixtral-8x22b-instruct
0.150.156553618 апрнет
Mistral: Mistral NeMo 12B ?
mistralai/mistral-nemo
поддерживает русский общие вопросы
0.050.0512800019 июлнет
Ministral 8B ?
mistralai/ministral-8b
0.020.0212800021 октнет
Mistral: Mistral Large 2 (версия 2411) ?
mistralai/mistral-large-2411
Базовый+GPT-4
0.451.3512800019 ноянет

Модели Cohere: с фокусом на RAG, function calling, tools


Модели от Cohere с фокусом на RAG, function calling, tools.
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere

Cohere: Command R ?
cohere/command-r
0.0750.2251280006 апрнет
Cohere: Command R+ ?
cohere/command-r-plus
0.452.251280006 апрнет
Cohere: Command R (август 2024) ?
cohere/command-r-08-2024
общие вопросы и ролеплей
0.0250.0912800031 авгнет
Cohere: Command R+ (август 2024) ?
cohere/command-r-plus-08-2024
Базовый+GPT-4 общие вопросы и ролеплей
0.381.512800031 авгнет

Модели Qwen – опенсорс модели от Tongyi Qianwen (Alibaba)


Серия языковых моделей от Tongyi Qianwen (Alibaba group, Китай).
Старшие модели показывают неплохое знание русского языка – но рекомендуется ставить температуру пониже (около 0.2) и явно прописывать «отвечать на русском языке».
 
Блог-запись о запуске моделей
 
Используя эти модели, вы соглашаетесь с Tongyi Qianwen LICENSE AGREEMENT
Для модели 110B также доступна translate-версия.

Qwen 2 72B Instruct ?
qwen/qwen-2-72b-instruct
0.140.14327687 июннет
Qwen 2 7B Instruct
qwen/qwen-2-7b-instruct
0.030.033276818 июлнет
Qwen2.5 72B Instruct ?
qwen/qwen-2.5-72b-instruct
ролеплей и общие вопросы
0.600.6012800021 сеннет
Qwen2.5 7B Instruct ?
qwen/qwen-2.5-7b-instruct
0.040.0412800016 октнет
Qwen2.5 Coder 32B Instruct ?
qwen/qwen-2.5-coder-32b-instruct
недорогая для программирования программирование и общие вопросы
0.050.0512800012 ноянет


Российские модели Сайга и Вихрь – альтернатива YaGPT и GigaChat


Сайга – третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре: https://habr.com/ru/articles/767588/
 
Также здесь представлены модели от команды VikhrModels, которая также с 2024 года начала дотренировывать опенсорсные модели на русских данных. Они также рекомендуются к знакомству – по метрикам они не хуже gpt-3.5 и могут приближаться к gpt-4o-mini.
 
Серия моделей OMF включает в себя «холодный старт» – т.е. загрузку по мере запроса. Если на первый запрос вы не получили ответ по таймауту, просто подождите 1–2 минуты и попробуйте снова – весьма вероятно, что модель загрузится.

Saiga/Llama3 8B (российский разработчик) ?
OMF-R-IlyaGusev/saiga_llama3_8b
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.10819219 июлнет
Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Llama3.1-8B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.101600022 сеннет
Vikhr-Nemo-12B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Nemo-12B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.15 р. Hugging Face
0.100.101600022 сеннет
Сайга MistralNemo 12B v1 (российский разработчик) ?
OMF-R-IlyaGusev/saiga_nemo_12b
Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face
0.100.1081923 ноянет

Опенсорс модели


Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку “?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.
 
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
 
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Gryphe: MythoMax L2 13B ?
gryphe/mythomax-L2-13b
дешевая 13B
0.040.0440968 марнет
Mythalion 13B ?
pygmalionai/mythalion-13b
ролеплей
0.168750.16875819216 янвнет
lzlv 70B (in test) ?
lizpreciatior/lzlv-70b-fp16-hf
ролеплей
0.1050.1425409616 янвнет
OpenChat 7B ?
openchat/openchat-7b
рекомендуется
0.0270.02781926 июннет
MythoMist 7B ?
gryphe/mythomist-7b
ролеплей
0.040.043276816 янвнет
Toppy M 7B ?
undi95/toppy-m-7b
ролеплей
0.040.043276816 янвнет
OpenHermes 2.5 Mistral 7B ?
teknium/openhermes-2.5-mistral-7b
0.040.04409610 дек 23нет
Dolphin 2.6 Mixtral 8x7B ?
cognitivecomputations/dolphin-mixtral-8x7b
дешевая 8x7B с большим контекстом ролеплей и общие вопросы
0.0450.0453200020 янвнет
Nous: Hermes 2 Mixtral 8x7B DPO ?
nousresearch/nous-hermes-2-mixtral-8x7b-dpo
дешевая 8x7B с большим контекстом ролеплей и общие вопросы
0.0450.045320001 марнет
Midnight Rose 70B ?
sophosympatheia/midnight-rose-70b
топ ролеплей от 24 марта
0.150.15409524 марнет
Databricks: DBRX 132B Instruct ?
databricks/dbrx-instruct
0.150.15300004 апрнет
WizardLM-2 8x22B ?
microsoft/wizardlm-2-8x22b
топ ролеплей от 17 апреля ролеплей и общие вопросы
0.150.156553618 апрнет
WizardLM-2 7B ?
microsoft/wizardlm-2-7b
0.040.043200018 апрнет
LLaMA v3 8B Instruct ?
meta-llama/llama-3-8b-instruct
0.0350.035819219 апрнет
LLaMA v3 70B Instruct ?
meta-llama/llama-3-70b-instruct
0.1350.135819219 апрнет
Llama 3 Lumimaid 8B (large-context) ?
neversleep/llama-3-lumimaid-8b-large
ролеплей
0.040.34245766 маянет
Phi-3 Medium Instruct 14B ?
microsoft/phi-3-medium-128k-instruct
0.150.1512800027 маянет
Phi-3 Mini Instruct 3.8B ?
microsoft/phi-3-mini-128k-instruct
0.0150.01512800027 маянет
Llama 3 Lumimaid 70B ?
neversleep/llama-3-lumimaid-70b
int4 квантизация ролеплей
0.670.90819229 маянет
Euryale-v2.1-70B ?
sao10k/euryale-70b
ролеплей
0.220.221600030 июннет
DeepSeek-Coder-V2 236B MoE (v2.5) ?
deepseek/deepseek-coder
топ программирование провайдер логирует данные
0.040.0512800011 сеннет
DeepSeek-V2-Chat 236B MoE (v2.5) ?
deepseek/deepseek-chat
провайдер логирует данные общие вопросы
0.040.0512800011 сеннет
NVIDIA Nemotron 4 340B Instruct ?
nvidia/nemotron-4-340b-instruct
выключена провайдером топ опенсорс переводчик от 25 июня общие вопросы
0.630.63409625 июннет
Magnum 72B ?
alpindale/magnum-72b
квантизация int4 ролеплей
0.500.601638412 июлнет
Llama 3.1 405B Instruct ?
meta-llama/llama-3.1-405b-instruct
Базовый+GPT-4 самая большая опенсорс модель от 23 июля fp8 квантизация
0.500.5012800023 июлнет
Llama 3.1 8B Instruct
meta-llama/llama-3.1-8b-instruct
0.0270.02712800024 июлнет
Llama 3.1 70B Instruct
meta-llama/llama-3.1-70b-instruct
0.120.1212800024 июлнет
Mistral Nemo 12B Celeste ?
nothingiisreal/mn-celeste-12b
поддерживает русский ролеплей
0.230.23320008 авгнет
Hermes 3 405B Instruct ?
nousresearch/hermes-3-llama-3.1-405b
ролеплей и общие вопросы
0.700.7012800017 авгнет
Llama 3.1 Euryale 70B v2.2 ?
sao10k/l3.1-euryale-70b
квантизация fp8 ролеплей Hugging Face
0.250.25819228 авгнет
Mistral Nemo 12B Starcannon ?
aetherwiing/mn-starcannon-12b
ролеплей
0.300.301200028 авгнет
Llama 3.2 3B Instruct ?
meta-llama/llama-3.2-3b-instruct
0.0150.01512800026 сеннет
Llama 3.2 90B Instruct ?
meta-llama/llama-3.2-90b-instruct
0.150.1512800026 сеннет
Grok Beta от xAI ?
x-ai/grok-beta
Базовый+GPT-4
0.752.112800021 октнет
Rocinante 12B ?
thedrummer/rocinante-12b
ролеплей
0.040.0753276816 октнет
NVIDIA: Llama 3.1 Nemotron 70B Instruct ?
nvidia/llama-3.1-nemotron-70b-instruct
0.150.1512800021 октнет

Translate-версии опенсорс моделей


Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.

Translate-версия Gryphe: MythoMax L2 13B
translate-gryphe/mythomax-L2-13b
0.060.06409612 янвнет
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ?
translate-mistralai/mistral-7b-instruct
0.060.06819224 окт 23нет
Mythalion 13B with Ru-En translation (beta) ?
translate-pygmalionai/mythalion-13b
0.178750.17875819217 ноя 23нет
lzlv 70B (in test) with Ru-En translation (beta) ?
translate-lizpreciatior/lzlv-70b-fp16-hf
0.1250.1625409617 ноя 23нет
Translate-версия OpenChat 7B ?
translate-openchat/openchat-7b
0.0370.03781926 июннет
Translate-версия MythoMist 7B
translate-gryphe/mythomist-7b
0.060.063276810 дек 23нет
Translate-версия Toppy M 7B
translate-undi95/toppy-m-7b
0.060.06409610 дек 23нет
Translate-версия OpenHermes 2.5 Mistral 7B
translate-teknium/openhermes-2.5-mistral-7b
0.060.06409610 дек 23нет
Translate-версия Dolphin 2.6 Mixtral 8x7B
translate-cognitivecomputations/dolphin-mixtral-8x7b
дешевая 8x7B с большим контекстом
0.0650.065320001 марнет
Translate-версия Nous: Hermes 2 Mixtral 8x7B DPO
translate-nousresearch/nous-hermes-2-mixtral-8x7b-dpo
дешевая 8x7B с большим контекстом
0.0650.065320001 марнет
Midnight Rose 70B (Translate-версия)
translate-sophosympatheia/midnight-rose-70b
топ ролеплей от 24 марта
0.150.15409524 марнет
Databricks: DBRX 132B Instruct (Translate-версия)
translate-databricks/dbrx-instruct
0.170.17300004 апрнет
WizardLM-2 8x22B (translate-версия)
translate-microsoft/wizardlm-2-8x22b
топ ролеплей от 17 апреля
0.170.176553618 апрнет
Mistral: Mixtral 8x22B Instruct (translate-версия)
translate-mistralai/mixtral-8x22b-instruct
0.170.176553618 апрнет
WizardLM-2 7B (translate-версия)
translate-microsoft/wizardlm-2-7b
0.060.063200018 апрнет
Llama 3 Lumimaid 8B (large-context) (translate-версия)
translate-neversleep/llama-3-lumimaid-8b-large
ролеплей
0.040.34245766 маянет
Phi-3 Mini Instruct 3.8B (translate-версия)
translate-microsoft/phi-3-mini-128k-instruct
0.0250.02512800027 маянет
Llama 3 Lumimaid 70B (translate-версия)
translate-neversleep/llama-3-lumimaid-70b
ролеплей
0.670.90819227 маянет
Euryale-v2.1-70B (translate-версия)
translate-sao10k/euryale-70b
ролеплей
0.220.221600030 июннет
Magnum 72B (translate-версия)
translate-alpindale/magnum-72b
ролеплей
0.500.601638412 июлнет

Самые свежие опенсорс модели Open Models Fan (бета-тест)


Самые свежие опенсорс модели серии Open Models Fan (могут быть недоступны на Тестовом тарифе).
 
Особенности:
– Модели доступны для экспериментирования, а не для реальной автоматизации (но они также доступны через API). Поэтому, пожалуйста, используйте их вручную или на малом объеме автоматических запросов (до 500). Если вам нужно интенсивно работать с ними, рекомендуем развернуть их на собственном сервере. Если мы увидим большое число автоматических запросов от вас к этим моделям, мы оставляем за собой право временно заблокировать ваш аккаунт
– Следствие – мы берем плату за вызов и небольшую плату за входные и выходные символы. Таким образом, эти модели более выгодно использовать для долгого ролеплея с большим контекстом (если они это поддерживают)
– Скорость вывода – 10–40 токенов в секунду, в зависимости от размера модели.
– Модели 70B и выше поставляются в квантизации FP8 – создавая баланс между загрузкой серверов и качеством. В целом, падение качества по сравнению с FP16 и FP32 (оригинал) довольно небольшое.
– Размер контекста не гарантирован (в процессе выяснения у провайдера)
– Обычно опенсорсные файнтюны моделей в первую очередь предназначены для ролеплея и написания историй (часто – на английском, если не указано обратное). Для общих кейсов мы рекомендуем обычные модели.
Серия моделей OMF включает в себя «холодный старт» – т.е. загрузку по мере запроса. Если на первый запрос вы не получили ответ по таймауту, просто подождите 1–2 минуты и попробуйте снова – весьма вероятно, что модель загрузится.
 
Пожалуйста, поддержите опенсорсную альтернативу проприетарным моделям!

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Saiga/Llama3 8B (российский разработчик) ?
OMF-R-IlyaGusev/saiga_llama3_8b
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.10819219 июлнет
Suzume 8B ?
OMF-lightblue/suzume-llama-3-8B-multilingual
Open Models Fan За вызов: 0.25 р. Hugging Face
0.100.10819219 июлнет
Smaug-Llama-3-70B-Instruct ?
OMF-abacusai/Smaug-Llama-3-70B-Instruct
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.25819219 июлнет
Kunoichi DPO v2 7B ?
OMF-SanjiWatsuki/Kunoichi-DPO-v2-7B
Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face
0.100.10819219 июннет
TenyxChat-DaybreakStorywriter-70B ?
OMF-DaybreakStorywriterXTenyxChat-70B
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.25819219 июннет
New Dawn Llama-3-70B 32K v1.0 ?
OMF-New-Dawn-Llama-3-70B-32K-v1.0
Open Models Fan За вызов: 0.50 р. ролеплей Hugging Face
0.250.25819219 июлнет
Sao10K: L3 8B Lunaris v1 ?
OMF-sao10k/l3-8b-lunaris-v1
Open Models Fan За вызов: 0.25 р. ролеплей Hugging Face
0.100.10819219 июлнет
MG-FinalMix-72B (Magnum-72B based) ?
OMF-Undi95/MG-FinalMix-72B
Open Models Fan За вызов: 0.50 р. ролеплей Hugging Face
0.250.251600019 июлнет
Tess v2.5.2 Qwen2 72B ?
OMF-Tess-v2.5.2-Qwen2-72B
Open Models Fan За вызов: 0.50 р. Hugging Face
0.250.251600019 июлнет
Smaug Qwen2 72B Instruct ?
OMF-abacusai/Smaug-Qwen2-72B-Instruct
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.251600022 июлнет
Vicuna 13B v1.5 (ретро) ?
OMF-lmsys/vicuna-13b-v1.5
Open Models Fan За вызов: 0.25 р. ретро ролеплей Hugging Face
0.100.10409630 мар 23нет
Qwen2 Math 72B Instruct ?
OMF-Qwen/Qwen2-Math-72B-Instruct
Open Models Fan За вызов: 0.50 р. математика Hugging Face
0.250.251600010 авгнет
Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Llama3.1-8B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.10 р. Hugging Face
0.100.101600022 сеннет
Vikhr-Nemo-12B-Instruct-R-21-09-24 (российский разработчик) ?
OMF-R-Vikhr-Nemo-12B-Instruct-R-21-09-24
Open Models Fan За вызов: 0.15 р. Hugging Face
0.100.101600022 сеннет
Qwen2.5-Math-72B-Instruct ?
OMF-Qwen/Qwen2.5-Math-72B-Instruct
Open Models Fan За вызов: 0.50 р. математика Hugging Face
0.250.251600025 сеннет
MN-12B-Starcannon-v3 ?
OMF-nothingiisreal/MN-12B-Starcannon-v3
Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face
0.100.101600025 сеннет
Qwen2.5-72B-Instruct-abliterated ?
OMF-Qwen2.5-72B-Instruct-abliterated
Open Models Fan За вызов: 0.50 р. ролеплей и общие вопросы Hugging Face
0.250.251600016 октнет
EVA Qwen2.5-72B v0.0 ?
OMF-EVA-Qwen2.5-72B-v0.0
Open Models Fan За вызов: 0.50 р. ролеплей
0.250.2581923 ноянет
Сайга MistralNemo 12B v1 (российский разработчик) ?
OMF-R-IlyaGusev/saiga_nemo_12b
Open Models Fan За вызов: 0.15 р. ролеплей Hugging Face
0.100.1081923 ноянет
EVA Qwen2.5-72B v0.1 ?
OMF-EVA-Qwen2.5-72B-v0.1
Open Models Fan За вызов: 0.50 р. ролеплей
0.250.2581928 ноянет

Text-to-image (генерация изображений по тексту)


Отчет: сравнение моделей генерации изображений

OpenAI Dall-E


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке “?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
 
Для ознакомления с возможностями Dalle-3 рекомендуем статью от OpenAI Что нового в Dalle-3

OpenAI: Dall-E 2 ?
openai/dall-e-2
Базовый+GPT-4 (не Тестовый) генерация изображений
10.00.0409613 марнет
OpenAI: Dall-E 3 ?
openai/dall-e-3
Базовый+GPT-4 (не Тестовый) топ! генерация изображений
10.00.0409613 марнет

Другие модели (FLUX, Stable Diffusion, Playground)


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Подробнее о стоимости генерации при разном разрешении и качестве по кнопке “?", там же описание дополнительных параметров, доступных при вызове модели.
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.

Dummy Image ?
img-dummy/image
За вызов: 0.005 р.
0.000.00409613 марнет
Stable Diffusion XL v1.0 ?
img-stable/stable-diffusion-xl-1024
Базовый+GPT-4 (не Тестовый) генерация изображений 0.95 р. за 1 изображение
10.00.0200030 июннет
Playground v2.5 ?
img-playground-v2-5-1024px
Базовый+GPT-4 (не Тестовый) генерация изображений 1.45 р. за 1 изображение
10.00.0200012 июлда
FLUX.1 [schnell] ?
img-flux/schnell
Базовый+GPT-4 (не Тестовый) генерация изображений 1.8 р. за изображение
10.00.0204828 авгнет
FLUX.1 [dev] ?
img-flux/dev
Базовый+GPT-4 (не Тестовый) генерация изображений 7.5 р. за изображение
10.00.0200028 авгнет
FLUX.1 [pro] ?
img-flux/pro
Базовый+GPT-4 (не Тестовый) генерация изображений 14.9 р. за изображение
10.00.0200028 авгнет
FLUX.1.1 [pro] ?
img-flux/pro1.1
Базовый+GPT-4 (не Тестовый) генерация изображений 14.9 р. за изображение
10.00.020004 октнет


Embeddings


Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).
 
Пример реализации RAG с использованием наших эмбеддингов доступен у нас на Github

Старые (v2)


Text Embedding Ada v2 ?
text-embedding-ada-002
0.030.00102413 марнет

Новые (v3)


OpenAI: text-embedding-3-small (тест)
emb-openai/text-embedding-3-small
0.0060.03200013 марнет
OpenAI: text-embedding-3-large (тест)
emb-openai/text-embedding-3-large
0.0350.03200013 марнет

Vision-модели (вопросы по изображению, OCR)


Предназначены для совместной обработки текста и изображений.
 
Временные особенности:
  • Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
  • Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
  • Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
  • Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Google: Gemini Pro Vision (preview) ?
vis-google/gemini-pro-vision
Базовый+GPT-4 скидка 90% на обработку изображения 0.04 р. за 1 изображение (со скидкой)
0.050.10655367 маянет
OpenAI: GPT-4 Vision (preview) ?
vis-openai/gpt-4-vision-preview
Базовый+GPT-4 около 1.7 р. за 1 изображение
2.006.001280001 марда
Anthropic: Claude 3 Sonnet (vision) ?
vis-anthropic/claude-3-sonnet
Базовый+GPT-4 около 0.7 р. за изображение
0.63.02000005 марда
Anthropic: Claude 3 Opus (vision) ?
vis-anthropic/claude-3-opus
Базовый+GPT-4 около 3.3 р. за изображение
3.015.02000005 марда
Anthropic: Claude 3 Haiku (vision) ?
vis-anthropic/claude-3-haiku
Базовый+GPT-4 около 0.1 р за 1 изображение
0.0660.320000014 марда
OpenAI: GPT-4 Vision Turbo ?
vis-openai/gpt-4-turbo
Базовый+GPT-4 топ! около 1.7 р. за 1 изображение
2.006.0012800027 апрда
Google: Gemini Pro 1.5 (vision-вариант) ?
vis-google/gemini-pro-1.5
Базовый+GPT-4 0.60 р. за 1 изображение
0.752.0100000010 апрнет
OpenAI: GPT-4o (vision) ?
vis-openai/gpt-4o
Базовый+GPT-4 топ!
1.103.3012800031 маяда
Google: Gemini Flash 1.5 (vision-версия) ?
vis-google/gemini-flash-1.5
Базовый+GPT-4 очень дешевая 0.03 р. за изображение
0.0280.08100000014 авгнет
Anthropic: Claude 3.5 Sonnet (vision) (новая от 22 октября) ?
vis-anthropic/claude-3.5-sonnet
Базовый+GPT-4 около 0.7 р. за изображение
0.63.020000022 октда
OpenAI: gpt-4o-mini (vision-версия)
vis-openai/gpt-4o-mini
Базовый+GPT-4 (не Тестовый) около 0.08 р. за изображение
0.0370.1512800027 июлда
OpenAI: GPT-4o (2024-08-06) (vision-версия) ?
vis-openai/gpt-4o-2024-08-06
Базовый+GPT-4 топ! около 0.15 р. за изображение
0.552.201280006 авгда
Qwen2-VL 72B Instruct ?
vis-qwen/qwen-2-vl-72b-instruct
Базовый+GPT-4 За вызов: 0.07 р. топ! около 0.05 р. за изображение
0.600.603276821 сеннет
Mistral: Pixtral 12B ?
vis-mistralai/pixtral-12b
За вызов: 0.05 р. около 0.2 р. за изображение
0.080.08409621 сеннет
Llama 3.2 11B Vision Instruct ?
vis-meta-llama/llama-3.2-11b-vision-instruct
Базовый и выше (не Тестовый) За вызов: 0.02 р. около 0.03 р. за изображение
0.0550.05512800026 сеннет
Llama 3.2 90B Vision Instruct ?
vis-meta-llama/llama-3.2-90b-vision-instruct
Базовый и выше (не Тестовый) За вызов: 0.03 р. около 0.04 р. за изображение
0.220.2212800026 сеннет

Speech-To-Text-модели (распознавание речи)


Предназначены для распознавания речи.
 
Временные особенности:
  • Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: Whisper (v3, сторонний провайдер, тест) ?
stt-openai/whisper-1
1.5 р за минуту
25.000.00200028 июннет

Text-to-Speech-модели (генерация речи)


Предназначены для генерации речи по тексту.
Условия использования моделей OpenAI: вы обязаны явно декларировать, что используете голос ИИ.
 
Временные особенности:
  • Не поддерживают стриминг
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: TTS-1 ?
tts-openai/tts-1
3.20.0409614 июнда
OpenAI: TTS-1-HD ?
tts-openai/tts-1-hd
Базовый+GPT-4
6.40.0409614 июнда

Text-to-Audio-модели (генерация музыки)


Предназначены для генерации музыки по текстовому запросу.
 
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Stable Audio (генерация музыки) ?
tta-stable/stable-audio
Базовый+GPT-4 За вызов: 5.00 р. генерация музыки 5 руб/генерация
0.00.0204828 авгнет


Примечания


Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.

Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»