Модели


Более 60 разных моделей, доступных на нашем сервисе, доступны через оглавление чуть ниже

Непонятно, что выбрать? Читайте туториал >

Теги: теги «ролеплей», «рекомендуется» расставлены администрацией из собственных предпочтений и экспериментов. Предназначены для ориентирования пользователей, только начинающих пользоваться моделями.

Мировые новинки у нас


  • 15 мая, Google: Gemini Flash 1.5 – с презентации Google IO от 14 мая. 1 миллион контекста и очень дешевая обработка.
  • 13 мая, OpenAI: GPT-4o – самая свежая и сильная модель от OpenAI уже на сервисе! (подключили в течение часа после выхода)
  • 11 мая, Qwen 1.5 14B/32B/72B/110B – опенсорс модели от Tongyi Qianwen (Alibaba group, Китай)
  • 6 мая, Lumimaid 8B – опенсорс модель для ролевого взаимодействия (файнтюн Llama3 8B)
  • 26 апреля, FireLLaVA 13B – опенсорс модель для вопросов по изображениям
  • 19 апреля, Llama3 8B/70B – новейшие опенсорс модели серии Llama.
  • 18 апреля, MicrosoftAI: WizardLM-2 7B – файнтюн 7B-модели от MicrosoftAI.
  • 18 апреля, Mistral: Mixtral 8x22B Instruct – официальная дотренировка от Mistral их модели на выполнение инструкций.
  • 16 апреля, MicrosoftAI: WizardLM-2 8x22B – мощный опенсорсный файнтюн для Mixtral 8x22B, по метрикам сопоставим с GPT-4.
  • 11 апреля, Mistral: Mixtral 8x22B – запустили самую последнюю опенсорс модель от Mistral.
  • 10 апреля, OpenAI: GPT-4-Turbo – последний вариант GPT-4-Turbo от 9 апреля
  • 10 апреля, Google: Gemini Pro 1.5 на 1 миллион контекста
  • 5 апреля, Cohere – Command R и Command R+ – общие сети с контекстом 128 000, фокусирующиеся на RAG и обработке вызова функций (function calling) и tools
  • 20 марта, OpenAI – подключили Whisper – сеть для распознавания аудио (Speech-To-Text)
  • 14 марта, Anthropic – добавили Claude 3 Haiku. Очень дешевая модель с возможностью общаться на русском и гигантским контекстом в 200К токенов!
  • 13 марта, OpenAI – подключили новые embeddings: text-embedding-3-small, text-embedding-3-large
  • 8 марта, Mistral – перенесли запуск Mixtral 8x7B Instruct на API от Groq с их уникальными ускоряющими процессорами. Скорость выросла где-то в 5 раз.
  • 4 марта, Anthropic – выпустила Claude 3. По оценкам разработчиков модель Sonnet быстрее, дешевле и лучше Claude 2, а Opus даже превосходит GPT-4.
  • Более старые новости по подключенным моделям



Текстовые модели

Модели OpenAI: ChatGPT, GPT-4-Turbo...


Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.
 
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Вам запрещён доступНастройках

МодельРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
ID моделиАвто
моде
ра
ция
OpenAI: GPT-3.5 Turbo0.150.34095openai/gpt-3.5-turboда
OpenAI: GPT-3.5 Turbo 16k (11-06) ? рекомендуется0.150.316385openai/gpt-3.5-turbo-1106да
OpenAI: GPT-3.5 Turbo Instruct ?0.2250.34095openai/gpt-3.5-turbo-instructда
OpenAI: GPT-3.5 Turbo 16k0.450.616383openai/gpt-3.5-turbo-16kда
OpenAI: GPT-3.5 Turbo 16k (01-25) ? рекомендуется0.0750.22516385openai/gpt-3.5-turbo-0125да
OpenAI: GPT-4 ? Базовый+GPT-44.598191openai/gpt-4да
OpenAI: GPT-4 Turbo (1106-preview) ? Базовый+GPT-41.54.5128000openai/gpt-4-1106-previewда
OpenAI: GPT-4 Turbo (0125-preview) ? Базовый+GPT-4 топ!1.54.5128000openai/gpt-4-turbo-previewда
OpenAI: GPT-4 Turbo (gpt-4-turbo-2024-04-09) ? Базовый+GPT-4 топ!1.54.5128000openai/gpt-4-turboда
OpenAI: GPT-4o ? Базовый+GPT-4 топ от 13 мая0.61.8128000openai/gpt-4oнет
OpenAI: GPT-4 32k Базовый+GPT-491832767openai/gpt-4-32kда
OpenAI: Dall-E 2 ? генерация изображений10.00.04096openai/dall-e-2нет
OpenAI: Dall-E 3 ? топ! генерация изображений10.00.04096openai/dall-e-3нет

Модели Anthropic: Claude


Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Рекомендуем их нейросети Claude 3 – Haiku для дешевой и быстрой обработки большого контекста, Opus – для максимально качественной работы.

Anthropic: Claude Instant v1 ?0.120.36100000anthropic/claude-instant-v1да
Anthropic: Claude v2.1 ? Базовый+GPT-41.23.6200000anthropic/claude-2да
Anthropic: Claude v2.0 ? Базовый+GPT-41.23.6100000anthropic/claude-2.0да
Anthropic: Claude 3 Sonnet ? Базовый+GPT-40.42.0200000anthropic/claude-3-sonnetда
Anthropic: Claude 3 Opus ? Базовый+GPT-4 ТОП!2.010.0200000anthropic/claude-3-opusда
Anthropic: Claude 3 Haiku ? дешевая и с большим контекстом0.03750.1875200000anthropic/claude-3-haikuда

Модели Perplexity: онлайн, с доступом к Интернету и фактической информации


Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.
Наша новость на Хабре о моделях Perplexity

Внимание: онлайн-модель тарифицируется не по входным данным, а по запросу. Выход тарифицируется как обычно. Также модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.

Perplexity: Llama3 Sonar 8B Online ? За вызов: 0.85 р. онлайн0.040.0428000perplexity/llama-3-sonar-small-32k-onlineнет
Perplexity: Llama3 Sonar 70B Online ? За вызов: 0.85 р. рекомендуется онлайн0.150.1528000perplexity/llama-3-sonar-large-32k-onlineнет


Модели Google


Нейросети от Google. Достаточно дешевые. Palm 2 по разным отзывам недостаточно эффективен и точен, но последняя Gemini Pro должна быть довольна удачной.

Google: Gemini Pro 1.0 ? рекомендуется0.0490.1132768google/gemini-proнет
Google: PaLM 2 Bison0.0750.0751024google/palm-2-chat-bisonнет
Google: PaLM 2 Chat 32k ?0.0750.07532000google/palm-2-chat-bison-32kнет
Google: Gemini Pro 1.5 ? Базовый+GPT-41.02.21000000google/gemini-pro-1.5нет
Google: Gemini Flash 1.5 ? Базовый+GPT-4 дешевая и с большим контекстом0.0350.101000000google/gemini-flash-1.5нет
Google: Gemma 7B (опенсорс) ?0.040.048000google/gemma-7b-itнет

Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium


Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.

Mistral 7B Instruct v0.1 ?0.040.048192mistralai/mistral-7b-instructнет
Mistral: Mixtral 8x7B Instruct ? дешевая 8x7B с большим контекстом0.0450.04532768mistralai/mixtral-8x7b-instructнет
Mistral Tiny ?0.040.0432000mistralai/mistral-tinyнет
Mistral Small ?0.300.9032000mistralai/mistral-smallнет
Mistral Medium ? Базовый+GPT-40.421.2532000mistralai/mistral-mediumнет
Mistral: Mistral Large ? Базовый+GPT-41.23.632000mistralai/mistral-largeнет
Mistral: Mixtral 8x22B (base) ?0.150.1564000mistralai/mixtral-8x22bнет
Mistral: Mixtral 8x22B Instruct ?0.150.1565536mistralai/mixtral-8x22b-instructнет

Модели Cohere: с фокусом на RAG, function calling, tools


Модели от Cohere с фокусом на RAG, function calling, tools.
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere

Cohere: Command R ?0.0750.225128000cohere/command-rнет
Cohere: Command R+ ?0.452.25128000cohere/command-r-plusнет

Модели Qwen – опенсорс модели от Tongyi Qianwen (Alibaba)


Серия языковых моделей от Tongyi Qianwen (Alibaba group, Китай).
Старшие модели показывают неплохое знание русского языка – но рекомендуется ставить температуру пониже (около 0.2) и явно прописывать «отвечать на русском языке».
 
Блог-запись о запуске моделей
 
Используя эти модели, вы соглашаетесь с Tongyi Qianwen LICENSE AGREEMENT
Для модели 110B также доступна translate-версия.

Qwen 1.5 14B Chat ?0.040.0432768qwen/qwen-14b-chatнет
Qwen 1.5 32B Chat ?0.1080.10832768qwen/qwen-32b-chatнет
Qwen 1.5 72B Chat ?0.130.1332768qwen/qwen-72b-chatнет
Qwen 1.5 110B Chat ?0.240.2432768qwen/qwen-110b-chatнет


Российская модель Мистраль-Сайга – альтернатива YaGPT и GigaChat


Третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре: https://habr.com/ru/articles/767588/ Обработка текстов для неё осуществляется на управляемом нами российском сервере.

Saiga/Mistral 7B ?0.040.042047gusev/saiga-mistral-7bнет

Опенсорс модели


Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку “?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.
 
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
 
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)

МодельРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
ID моделиАвто
моде
ра
ция
Gryphe: MythoMax L2 13B ? дешевая 13B0.040.044096gryphe/mythomax-L2-13bнет
Airoboros L2 70B ?0.1050.14254096jondurbin/airoboros-l2-70bнет
CodeLlama 34B Instruct (beta) ?0.120.128192meta-llama/codellama-34b-instructнет
Llama v2 70B Chat ?0.150.154096meta-llama/llama-2-70b-chatнет
Mythalion 13B ? ролеплей0.168750.168758192pygmalionai/mythalion-13bнет
lzlv 70B (in test) ? ролеплей0.1050.14254096lizpreciatior/lzlv-70b-fp16-hfнет
Intel Neural Chat 7B v3.1 ?0.040.0432768intel/neural-chat-7bнет
OpenChat 7B ? рекомендуется0.040.048192openchat/openchat-7bнет
Psyfighter v2 13B ? ролеплей0.150.154096koboldai/psyfighter-13b-2нет
Phind: CodeLlama 34B v2 ? программирование0.060.064096phind/phind-codellama-34bнет
MythoMist 7B ? ролеплей0.040.0432768gryphe/mythomist-7bнет
Toppy M 7B ? ролеплей0.040.0432768undi95/toppy-m-7bнет
OpenHermes 2.5 Mistral 7B ?0.040.044096teknium/openhermes-2.5-mistral-7bнет
Dolphin 2.6 Mixtral 8x7B ? дешевая 8x7B с большим контекстом ролеплей и общие вопросы0.0450.04532000cognitivecomputations/dolphin-mixtral-8x7bнет
Nous Hermes 2 - Yi 34B ?0.120.124096nousresearch/nous-hermes-yi-34bнет
Noromaid Mixtral 8x7B Instruct ?0.450.458000neversleep/noromaid-mixtral-8x7b-instructнет
RWKV v5: Eagle 7B ?0.040.0410000recursal/eagle-7bнет
CodeLlama 70B Instruct ? программирование0.12150.12152048codellama/codellama-70b-instructнет
Nous: Hermes 2 Mixtral 8x7B DPO ? дешевая 8x7B с большим контекстом ролеплей и общие вопросы0.0450.04532000nousresearch/nous-hermes-2-mixtral-8x7b-dpoнет
Midnight Rose 70B ? топ ролеплей от 24 марта1.101.104095sophosympatheia/midnight-rose-70bнет
Databricks: DBRX 132B Instruct ?0.150.1530000databricks/dbrx-instructнет
WizardLM-2 8x22B ? топ ролеплей от 17 апреля ролеплей и общие вопросы0.150.1565536microsoft/wizardlm-2-8x22bнет
WizardLM-2 7B ?0.040.0432000microsoft/wizardlm-2-7bнет
LLaMA v3 8B Instruct ?0.0350.0358192meta-llama/llama-3-8b-instructнет
LLaMA v3 70B Instruct ?0.1350.1358192meta-llama/llama-3-70b-instructнет
Llama 3 Lumimaid 8B (large-context) ? ролеплей0.040.3424576neversleep/llama-3-lumimaid-8b-largeнет

Translate-версии опенсорс моделей


Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.

Airoboros L2 70B with Ru-En translation (beta) ?0.1250.16254096translate-jondurbin/airoboros-l2-70bнет
Translate-версия Gryphe: MythoMax L2 13B 0.060.064096translate-gryphe/mythomax-L2-13bнет
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ?0.060.068192translate-mistralai/mistral-7b-instructнет
Mythalion 13B with Ru-En translation (beta) ?0.178750.178758192translate-pygmalionai/mythalion-13bнет
lzlv 70B (in test) with Ru-En translation (beta) ?0.1250.16254096translate-lizpreciatior/lzlv-70b-fp16-hfнет
Intel Neural Chat 7B v3.1 от Intel с En-Ru переводом ?0.060.0632768translate-intel/neural-chat-7bнет
Translate-версия OpenChat 7B ?0.060.068192translate-openchat/openchat-7bнет
Translate-версия Psyfighter v2 13B0.170.174096translate-koboldai/psyfighter-13b-2нет
Translate-версия MythoMist 7B0.060.0632768translate-gryphe/mythomist-7bнет
Translate-версия Toppy M 7B0.060.064096translate-undi95/toppy-m-7bнет
Translate-версия OpenHermes 2.5 Mistral 7B0.060.064096translate-teknium/openhermes-2.5-mistral-7bнет
Translate-версия Dolphin 2.6 Mixtral 8x7B дешевая 8x7B с большим контекстом0.0650.06532000translate-cognitivecomputations/dolphin-mixtral-8x7bнет
Translate-версия Nous Hermes 2 - Yi 34B0.140.144096translate-nousresearch/nous-hermes-yi-34bнет
Translate-версия Noromaid Mixtral 8x7B Instruct0.470.478000translate-neversleep/noromaid-mixtral-8x7b-instructнет
Translate-версия Nous: Hermes 2 Mixtral 8x7B DPO дешевая 8x7B с большим контекстом0.0650.06532000translate-nousresearch/nous-hermes-2-mixtral-8x7b-dpoнет
Midnight Rose 70B (Translate-версия) топ ролеплей от 24 марта1.121.124095translate-sophosympatheia/midnight-rose-70bнет
Databricks: DBRX 132B Instruct (Translate-версия)0.170.1730000translate-databricks/dbrx-instructнет
WizardLM-2 8x22B (translate-версия) топ ролеплей от 17 апреля0.170.1765536translate-microsoft/wizardlm-2-8x22bнет
Mistral: Mixtral 8x22B Instruct (translate-версия)0.170.1765536translate-mistralai/mixtral-8x22b-instructнет
WizardLM-2 7B (translate-версия)0.060.0632000translate-microsoft/wizardlm-2-7bнет
Llama 3 Lumimaid 8B (large-context) (translate-версия) ролеплей0.040.3424576translate-neversleep/llama-3-lumimaid-8b-largeнет
Qwen 1.5 110B Chat (translate-версия)0.250.2532768translate-qwen/qwen-110b-chatнет

Text-to-image (генерация изображений по тексту)

OpenAI Dall-E


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке “?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
 
Для ознакомления с возможностями Dalle-3 рекомендуем статью от OpenAI Что нового в Dalle-3

OpenAI: Dall-E 2 ? генерация изображений10.00.04096openai/dall-e-2нет
OpenAI: Dall-E 3 ? топ! генерация изображений10.00.04096openai/dall-e-3нет

Другие модели


Dummy Image ? За вызов: 0.005 р.0.000.004096img-dummy/imageнет


Также в планах добавить Stable Diffusion

Embeddings


Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).

Старые (v2)


Text Embedding Ada v2 ?0.030.001024text-embedding-ada-002нет

Новые (v3)


OpenAI: text-embedding-3-small (тест)0.0060.032000emb-openai/text-embedding-3-smallнет
OpenAI: text-embedding-3-large (тест)0.0350.032000emb-openai/text-embedding-3-largeнет
OpenSource: Multilingual-E5-large (тест) ?0.020.04096emb-intfloat/multilingual-e5-largeнет

Vision-модели (вопросы по изображению, OCR)


Предназначены для совместной обработки текста и изображений.
 
Временные особенности:
  • Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
  • Stream не поддерживается.
  • Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
  • Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
  • Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Google: Gemini Pro Vision (preview) ? Базовый+GPT-4 скидка 90% на обработку изображения 0.04 р. за 1 изображение (со скидкой)0.050.1065536vis-google/gemini-pro-visionнет
OpenAI: GPT-4 Vision (preview) ? Базовый+GPT-4 около 1.7 р. за 1 изображение2.006.00128000vis-openai/gpt-4-vision-previewда
Llava 13B ? Базовый+GPT-4 За вызов: 0.03 р. без спецплаты за изображения1.21.22048vis-haotian-liu/llava-13bнет
Anthropic: Claude 3 Sonnet (vision) ? Базовый+GPT-4 около 0.7 р. за изображение0.63.0200000vis-anthropic/claude-3-sonnetда
Anthropic: Claude 3 Opus (vision) ? Базовый+GPT-4 около 3.3 р. за изображение3.015.0200000vis-anthropic/claude-3-opusда
Anthropic: Claude 3 Haiku (vision) ? Базовый+GPT-4 около 0.1 р за 1 изображение0.060.3200000vis-anthropic/claude-3-haikuда
OpenAI: GPT-4 Vision Turbo ? Базовый+GPT-4 топ! около 1.7 р. за 1 изображение2.006.00128000vis-openai/gpt-4-turboда
Google: Gemini Pro 1.5 (vision-вариант) Базовый+GPT-4 скидка 90% на обработку изображения 0.10 р. за 1 изображение (со скидкой)0.81.81000000vis-google/gemini-pro-1.5нет
FireLLaVA 13B ? 0.03 р. за 1 изображение0.050.054096vis-fireworks/firellava-13bнет
OpenAI: GPT-4o (vision) ? Базовый+GPT-4 топ!1.103.30128000vis-openai/gpt-4oнет

Speech-To-Text-модели (распознавание речи)


Предназначены для распознавания речи.
 
Временные особенности:
  • Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.

МодельРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
ID моделиАвто
моде
ра
ция
OpenAI: Whisper (тест) ?40.000.002000stt-openai/whisper-1нет


Примечания


Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.

Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»