Модели


Более 40 разных моделей, доступных на нашем сервисе, доступны через оглавление чуть ниже

КАК ЭКОНОМИТЬ: чтобы нейросеть понимала контекст разговора, при запросе обрабатываются ВСЕ предыдущие сообщения чата как входные данные. Поэтому, когда вы начинаете НОВУЮ ТЕМУ разговора, начинайте НОВЫЙ чат без истории диалога – это сэкономит вам массу средств.

Теги: теги «ролеплей», «рекомендуется» расставлены администрацией из собственных предпочтений и экспериментов. Предназначены для ориентирования пользователей, только начинающих пользоваться моделями, и могут не отражать бенчмарки и ваши личные предпочтения.

Мировые новинки у нас


  • 27 февраля, Mistral, закрытые модели – добавили Mistral Large. По оценкам разработчиков она находится на уровне между Claude 2 и GPT-4. Модель в первую очередь предназначена для европейских языков, на русском работает, но похуже.
  • 27 февраля, Perplexity – Sonar Online Models, модели с доступом в интернет, которые умеют отвечать по актуальным фактам
  • 26 февраля, Translate-модели – значительно улучшили скорость и качество при долгих диалогах за счет внутреннего сервиса кэша и обратного кэша.
  • 25 февраля, Google – Gemini Pro и Gemini Pro Vision подешевели на 30%. У Gemini Pro Vision самая низкая цена на обработку изображений – около 4 копеек за 1 изображение!
  • 23 февраля, Google Gemma 7B – добавлена новая опенсорс модель от Google.
  • 21 февраля, Dall-E 2 и 3 – добавили text-to-image модели на сервис.
  • 17 февраля, Anthropic – Claude Instant подешевел на 50%.
  • 2 февраля, OpenAI – новая, более дешевая ChatGPT (цена на входные токены уменьшена на 50%, на выходные – на 25%)
  • 1 февраля, CodeLlama70B – новая опенсорс 70B модель для генерации кода
  • 26 января, OpenAI – новая GPT-4-Turbo
  • 19 января, Google: Gemini Pro Vision – мощная модель от Google, позволяющая обрабатывать изображения.
  • 15 января, Mistral, закрытые модели – подключили модели, доступные по API. Флагманская Mistral Medium конкурирует с Claude 2.
  • 13 декабря, Google: Gemini Pro – новая мощная модель от Google.
  • 11 декабря, Mistral – Mixtral 8x7B Instruct, Mixtral 8x7B Chat, опенсорс модели на новой архитектуре. Дешевые и сравнимые по качеству с ChatGPT (по оценкам авторов)
  • 29 ноября, Perplexity – Perplexity Online Models с доступом к интернету для более точного следования фактам
  • 21 ноября, Anthropic – Claude 2.1 с 200к контекста!
  • 6 ноября, OpenAI – GPT-3.5 Turbo 16k (11–06), GPT-4 Turbo на 128к контекста.



Текстовые модели

Модели OpenAI: ChatGPT, GPT-4-Turbo...


Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.
 
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Вам запрещён доступНастройках

МодельРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер контекстаID моделиАвто
моде
рация
OpenAI: GPT-3.5 Turbo0.150.34095openai/gpt-3.5-turboда
OpenAI: GPT-3.5 Turbo 16k (11-06) ? рекомендуется0.150.316385openai/gpt-3.5-turbo-1106да
OpenAI: GPT-3.5 Turbo Instruct ?0.2250.34095openai/gpt-3.5-turbo-instructда
OpenAI: GPT-3.5 Turbo 16k0.450.616383openai/gpt-3.5-turbo-16kда
OpenAI: GPT-3.5 Turbo 16k (01-25) ? рекомендуется0.0750.22516385openai/gpt-3.5-turbo-0125да
OpenAI: GPT-4 ? Базовый+GPT-44.598191openai/gpt-4да
OpenAI: GPT-4 Turbo (1106-preview) ? Базовый+GPT-41.54.5128000openai/gpt-4-1106-previewда
OpenAI: GPT-4 Turbo (0125-preview) ? Базовый+GPT-4 топ!1.54.5128000openai/gpt-4-turbo-previewда
OpenAI: GPT-4 32k Базовый+GPT-491832767openai/gpt-4-32kда
OpenAI: Dall-E 2 ? генерация изображений10.00.04096openai/dall-e-2нет
OpenAI: Dall-E 3 ? топ! генерация изображений10.00.04096openai/dall-e-3нет

Модели Anthropic: Claude


Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Claude-v1 – самая дешевая нейросеть с контекстом до 100 000 токенов; Claude-2.1 – сеть с самым большим контекстом – 200 000 токенов.

Anthropic: Claude Instant v1 ?0.120.36100000anthropic/claude-instant-v1да
Anthropic: Claude v2.1 ? Базовый+GPT-41.23.6200000anthropic/claude-2да
Anthropic: Claude v2.0 ? Базовый+GPT-41.23.6100000anthropic/claude-2.0да

Модели Perplexity: онлайн, с доступом к Интернету и фактической информации


Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.
Наша новость на Хабре о моделях Perplexity

Внимание: онлайн-модель тарифицируется не по входным данным, а по запросу. Выход тарифицируется как обычно. Также модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.

Perplexity: PPLX 7B Online ? За вызов: 0.85 р.0.00.0424096perplexity/pplx-7b-onlineнет
Perplexity: PPLX 70B Online ? За вызов: 0.85 р. устарела, скоро будет отключена Perplexity0.00.424096perplexity/pplx-70b-onlineнет
Perplexity: Sonar 7B Online ? За вызов: 0.85 р. онлайн0.00.04212000perplexity/sonar-small-onlineнет
Perplexity: Sonar 8x7B Online ? За вызов: 0.85 р. рекомендуется онлайн0.00.2712000perplexity/sonar-medium-onlineнет


Модели Google


Нейросети от Google. Достаточно дешевые. Palm 2 по разным отзывам недостаточно эффективен и точен, но последняя Gemini Pro должна быть довольна удачной.

Google: Gemini Pro ? рекомендуется0.0490.1132768google/gemini-proнет
Google: PaLM 2 Bison0.0750.0751024google/palm-2-chat-bisonнет
Google: PaLM 2 Chat 32k ?0.0750.07532000google/palm-2-chat-bison-32kнет
Google: Gemma 7B (опенсорс) ?0.040.048000google/gemma-7b-itнет

Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium


Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.

Mistral 7B Instruct v0.1 ?0.040.048192mistralai/mistral-7b-instructнет
Mistral: Mixtral 8x7B Instruct ? дешевая 8x7B с большим контекстом0.0450.04532768mistralai/mixtral-8x7b-instructнет
Mistral Tiny ?0.040.0432000mistralai/mistral-tinyнет
Mistral Small ?0.300.9032000mistralai/mistral-smallнет
Mistral Medium ? Базовый+GPT-40.421.2532000mistralai/mistral-mediumнет
Mistral: Mistral Large ? Базовый+GPT-41.23.632000mistralai/mistral-largeнет


Российская модель Мистраль-Сайга – альтернатива YaGPT и GigaChat


Третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре: https://habr.com/ru/articles/767588/ Обработка текстов для неё осуществляется на управляемом нами российском сервере.

Saiga/Mistral 7B ?0.040.042047gusev/saiga-mistral-7bнет

Опенсорс модели


Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку “?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.
 
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
 
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)

МодельРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер контекстаID моделиАвто
моде
рация
Gryphe: MythoMax L2 13B ? дешевая 13B0.040.044096gryphe/mythomax-L2-13bнет
Airoboros L2 70B ?0.1050.14254096jondurbin/airoboros-l2-70bнет
CodeLlama 34B Instruct (beta) ?0.120.128192meta-llama/codellama-34b-instructнет
Llama v2 70B Chat ?0.150.154096meta-llama/llama-2-70b-chatнет
Mythalion 13B ? ролеплей0.168750.168758192pygmalionai/mythalion-13bнет
lzlv 70B (in test) ? ролеплей0.1050.14254096lizpreciatior/lzlv-70b-fp16-hfнет
Intel Neural Chat 7B v3.1 ?0.040.0432768intel/neural-chat-7bнет
OpenChat 7B ? рекомендуется0.040.048192openchat/openchat-7bнет
Psyfighter 13B ? ролеплей0.150.154096jebcarter/psyfighter-13bнет
Psyfighter v2 13B ? ролеплей0.150.154096koboldai/psyfighter-13b-2нет
Phind: CodeLlama 34B v2 ? программирование0.060.064096phind/phind-codellama-34bнет
MythoMist 7B ? ролеплей0.040.0432768gryphe/mythomist-7bнет
Toppy M 7B ? ролеплей0.040.0432768undi95/toppy-m-7bнет
OpenHermes 2.5 Mistral 7B ?0.040.044096teknium/openhermes-2.5-mistral-7bнет
Dolphin 2.6 Mixtral 8x7B ? дешевая 8x7B с большим контекстом ролеплей и общие вопросы0.0450.04532000cognitivecomputations/dolphin-mixtral-8x7bнет
Nous Hermes 2 - Yi 34B ?0.120.124096nousresearch/nous-hermes-yi-34bнет
Noromaid Mixtral 8x7B Instruct ?0.450.458000neversleep/noromaid-mixtral-8x7b-instructнет
RWKV v5: Eagle 7B ?0.040.0410000recursal/eagle-7bнет
CodeLlama 70B Instruct ? программирование0.12150.12152048codellama/codellama-70b-instructнет

Translate-версии опенсорс моделей


Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.

Airoboros L2 70B with Ru-En translation (beta) ?0.1250.16254096translate-jondurbin/airoboros-l2-70bнет
Translate-версия Gryphe: MythoMax L2 13B 0.060.064096translate-gryphe/mythomax-L2-13bнет
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ?0.060.068192translate-mistralai/mistral-7b-instructнет
Mythalion 13B with Ru-En translation (beta) ?0.178750.178758192translate-pygmalionai/mythalion-13bнет
lzlv 70B (in test) with Ru-En translation (beta) ?0.1250.16254096translate-lizpreciatior/lzlv-70b-fp16-hfнет
Intel Neural Chat 7B v3.1 от Intel с En-Ru переводом ?0.060.0632768translate-intel/neural-chat-7bнет
Translate-версия OpenChat 7B ?0.060.068192translate-openchat/openchat-7bнет
Translate-версия Psyfighter 13B0.170.174096translate-jebcarter/psyfighter-13bнет
Translate-версия Psyfighter v2 13B0.170.174096translate-koboldai/psyfighter-13b-2нет
Translate-версия MythoMist 7B0.060.0632768translate-gryphe/mythomist-7bнет
Translate-версия Toppy M 7B0.060.064096translate-undi95/toppy-m-7bнет
Translate-версия OpenHermes 2.5 Mistral 7B0.060.064096translate-teknium/openhermes-2.5-mistral-7bнет
Translate-версия Dolphin 2.6 Mixtral 8x7B0.0650.06532000translate-cognitivecomputations/dolphin-mixtral-8x7bнет
Translate-версия Nous Hermes 2 - Yi 34B0.140.144096translate-nousresearch/nous-hermes-yi-34bнет
Translate-версия Noromaid Mixtral 8x7B Instruct0.470.478000translate-neversleep/noromaid-mixtral-8x7b-instructнет

Text-to-image (генерация изображений по тексту)

OpenAI Dall-E


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке “?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.

OpenAI: Dall-E 2 ? генерация изображений10.00.04096openai/dall-e-2нет
OpenAI: Dall-E 3 ? топ! генерация изображений10.00.04096openai/dall-e-3нет

Другие модели


Dummy Image ? За вызов: 0.005 р.0.000.004096img-dummy/imageнет


Также в планах добавить Stable Diffusion

Embeddings


Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).

Text Embedding Ada v2 (в тестовом режиме) ?0.030.001024text-embedding-ada-002нет

Vision-модели (вопросы по изображению, OCR)


Предназначены для совместной обработки текста и изображений.
 
Временные особенности:
  • Для запуска любого запроса вам нужно иметь минимум 100 р. на балансе.
  • Stream не поддерживается.
  • Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
  • Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
  • Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Google: Gemini Pro Vision (preview) ? Базовый+GPT-4 скидка 90% на обработку изображения 0.04 р. за 1 изображение (со скидкой)0.040.0965536vis-google/gemini-pro-visionнет
OpenAI: GPT-4 Vision (preview) ? Базовый+GPT-4 около 1.7 р. за 1 изображение2.006.00128000vis-openai/gpt-4-vision-previewда
Llava 13B ? Базовый+GPT-4 За вызов: 0.03 р. без спецплаты за изображения1.21.22048vis-haotian-liu/llava-13bнет

Примечания


Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.

Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»