Мировые новинки у нас


  • 19 июля, 10 новых опенсорс моделей – в новом тарифе Open Models Fan, предназначенном для поддержки доступа к опенсорс моделям.
  • 18 июля, OpenAI: GPT-4o mini – в 22:00, спустя 2 часа после официального запуска, модель уже доступна!
  • 18 июля, Llama 3 405B Instructпредварительный анонс. Модель выйдет 23 июля, ожидаем, что подключим 23–25 числа
  • 17 июля, Google Gemma 2 27B – новая опенсорс модель от Google. Очень неплохо общается на русском.
  • 12 июля, Playground 2.5 – опенсорс модель для генерации изображений уровня DALLE-3 (согласно рейтингу ЭЛО text-to-image моделей), но в пять раз дешевле DALLE-3.
  • 12 июля, Magnum 72B – топовая опенсорсная модель для ролевого взаимодействия
  • 30 июня, Stable Diffusion XL – подключили классическую опенсорс модель генерации изображений.
  • 28 июня, Google Gemma 2 9B – новая опенсорс модель от Google. Очень неплохо общается на русском.
  • 25 июня, NVIDIA Nemotron 4 340B Instruct – крупнейшая опенсорс модель на настоящий момент. Первая опенсорс модель, которая переводит по метрикам лучше Google Translate и DeepL.
  • 20 июня, Anthropic: Claude 3.5 Sonnet – новая топовая модель; по метрикам превосходит GPT-4o и предыдущий топовый Claude 3 Opus
  • 14 июня, OpenAI: TTS – добавили модели для генерации речи по тексту от OpenAI
  • 7 июня, Qwen2 72B Instruct – новая опенсорс модель из серии Qwen от Tongyi Qianwen (Alibaba group, Китай), сравнимая с LLama3 70B
  • 25 мая, Microsoft: Phi 3 Medium – самая старшая из серии Phi 3 моделей. Хорошая тренировка, 128 000 контекст.
  • 15 мая, Google: Gemini Flash 1.5 – с презентации Google IO от 14 мая. 1 миллион контекста и очень дешевая обработка.
  • 13 мая, OpenAI: GPT-4o – самая свежая и сильная модель от OpenAI уже на сервисе! (подключили в течение часа после выхода)
  • 11 мая, Qwen 1.5 14B/32B/72B/110B – опенсорс модели от Tongyi Qianwen (Alibaba group, Китай)
  • 6 мая, Lumimaid 8B – опенсорс модель для ролевого взаимодействия (файнтюн Llama3 8B)
  • 26 апреля, FireLLaVA 13B – опенсорс модель для вопросов по изображениям
  • 19 апреля, Llama3 8B/70B – новейшие опенсорс модели серии Llama.
  • 18 апреля, MicrosoftAI: WizardLM-2 7B – файнтюн 7B-модели от MicrosoftAI.
  • 18 апреля, Mistral: Mixtral 8x22B Instruct – официальная дотренировка от Mistral их модели на выполнение инструкций.
  • 16 апреля, MicrosoftAI: WizardLM-2 8x22B – мощный опенсорсный файнтюн для Mixtral 8x22B, по метрикам сопоставим с GPT-4.
  • 11 апреля, Mistral: Mixtral 8x22B – запустили самую последнюю опенсорс модель от Mistral.
  • 10 апреля, OpenAI: GPT-4-Turbo – последний вариант GPT-4-Turbo от 9 апреля
  • 10 апреля, Google: Gemini Pro 1.5 на 1 миллион контекста
  • Более старые новости по подключенным моделям


Текстовые модели

Модели OpenAI: ChatGPT, GPT-4-Turbo...


Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.
 
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Вам запрещён доступНастройках

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: GPT-3.5 Turbo
openai/gpt-3.5-turbo
0.150.340957 ноя 23да
OpenAI: GPT-3.5 Turbo 16k (11-06) ?
openai/gpt-3.5-turbo-1106
рекомендуется
0.150.31638516 янвда
OpenAI: GPT-3.5 Turbo Instruct ?
openai/gpt-3.5-turbo-instruct
0.2250.340952 окт 23да
OpenAI: GPT-3.5 Turbo 16k
openai/gpt-3.5-turbo-16k
0.450.61638330 сен 23да
OpenAI: GPT-3.5 Turbo 16k (01-25) ?
openai/gpt-3.5-turbo-0125
рекомендуется
0.0750.225163852 февда
OpenAI: GPT-4 ?
openai/gpt-4
Базовый+GPT-4
4.59819114 дек 23да
OpenAI: GPT-4 Turbo (1106-preview) ?
openai/gpt-4-1106-preview
Базовый+GPT-4
1.54.51280001 февда
OpenAI: GPT-4 Turbo (0125-preview) ?
openai/gpt-4-turbo-preview
Базовый+GPT-4
1.54.51280006 июнда
OpenAI: GPT-4 Turbo (gpt-4-turbo-2024-04-09) ?
openai/gpt-4-turbo
Базовый+GPT-4 топ!
1.54.512800010 апрда
OpenAI: GPT-4o ?
openai/gpt-4o
Базовый+GPT-4 топ от 13 мая
0.61.812800025 маяда
OpenAI: GPT-4o mini ?
openai/gpt-4o-mini
0.020.0812800018 июлда
OpenAI: GPT-4 32k
openai/gpt-4-32k
Базовый+GPT-4
9183276711 сен 23да
OpenAI: Dall-E 2 ?
openai/dall-e-2
Базовый+GPT-4 (не Тестовый) генерация изображений
10.00.0409613 марнет
OpenAI: Dall-E 3 ?
openai/dall-e-3
Базовый+GPT-4 (не Тестовый) топ! генерация изображений
10.00.0409613 марнет

Модели Anthropic: Claude


Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Рекомендуем их нейросети Claude 3 – Haiku для дешевой и быстрой обработки большого контекста, Opus – для максимально качественной работы.

Anthropic: Claude Instant v1 ?
anthropic/claude-instant-v1
0.120.3610000023 ноя 23да
Anthropic: Claude v2.1 ?
anthropic/claude-2
Базовый+GPT-4
1.23.620000023 ноя 23да
Anthropic: Claude v2.0 ?
anthropic/claude-2.0
Базовый+GPT-4
1.23.610000023 ноя 23да
Anthropic: Claude 3 Sonnet ?
anthropic/claude-3-sonnet
Базовый+GPT-4
0.42.02000006 марда
Anthropic: Claude 3 Opus ?
anthropic/claude-3-opus
Базовый+GPT-4 ТОП!
2.010.02000006 марда
Anthropic: Claude 3 Haiku ?
anthropic/claude-3-haiku
дешевая и с большим контекстом
0.03750.187520000014 марда
Anthropic: Claude 3.5 Sonnet ?
anthropic/claude-3.5-sonnet
Базовый+GPT-4 топ от 20 июня
0.42.020000020 июнда

Модели Perplexity: онлайн, с доступом к Интернету и фактической информации


Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.
Наша новость на Хабре о моделях Perplexity

Внимание: онлайн-модель дополнительно тарифицируется по каждому запросу (т.к. идет вызов онлайн-поиска). Модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.

Perplexity: Llama3 Sonar 8B Online ?
perplexity/llama-3-sonar-small-32k-online
За вызов: 0.85 р. онлайн
0.040.042800022 маянет
Perplexity: Llama3 Sonar 70B Online ?
perplexity/llama-3-sonar-large-32k-online
За вызов: 0.85 р. рекомендуется онлайн
0.150.152800022 маянет


Модели Google: Gemini Pro, Flash


Нейросети от Google. Достаточно дешевые.
Рекомендуются последние версии Gemini, однако пользователи жалуются, что даже при не очень большом контексте (5К+ символов) Google относительно часто возвращает ошибки и очень маленькие ответы (июнь 2024).
В случае, если нужна точность, рекомендуем модели Claude 3 с большим контекстом.

Google: Gemini Pro 1.0 ?
google/gemini-pro
рекомендуется
0.0490.113276826 апрнет
Google: PaLM 2 Bison
google/palm-2-chat-bison
0.0750.075102411 ноя 23нет
Google: PaLM 2 Chat 32k ?
google/palm-2-chat-bison-32k
0.0750.0753200011 ноя 23нет
Google: Gemini Pro 1.5 ?
google/gemini-pro-1.5
Базовый+GPT-4
1.02.2100000018 маянет
Google: Gemini Flash 1.5 ?
google/gemini-flash-1.5
Базовый+GPT-4 дешевая и с большим контекстом
0.0350.10100000015 маянет
Google: Gemma 7B (опенсорс) ?
google/gemma-7b-it
0.040.04800011 марнет
Google: Gemma 2 9B (опенсорс) ?
google/gemma-2-9b-it
0.030.03819228 июннет
Gemma 2 27B (опенсорс) ?
google/gemma-2-27b-it
0.100.10819217 июлнет

Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium


Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.

Mistral 7B Instruct v0.3 ?
mistralai/mistral-7b-instruct
0.0350.035819229 маянет
Mistral: Mixtral 8x7B Instruct ?
mistralai/mixtral-8x7b-instruct
дешевая 8x7B с большим контекстом
0.0450.0453276818 марнет
Mistral Tiny ?
mistralai/mistral-tiny
0.040.043200027 февнет
Mistral Small ?
mistralai/mistral-small
0.300.903200027 февнет
Mistral Medium ?
mistralai/mistral-medium
Базовый+GPT-4
0.421.253200015 янвнет
Mistral: Mistral Large ?
mistralai/mistral-large
Базовый+GPT-4
1.23.63200027 февнет
Mistral: Mixtral 8x22B (base) ?
mistralai/mixtral-8x22b
0.150.156400011 апрнет
Mistral: Mixtral 8x22B Instruct ?
mistralai/mixtral-8x22b-instruct
0.150.156553618 апрнет
Mistral: Mistral NeMo 12B ?
mistralai/mistral-nemo
поддерживает русский общие вопросы
0.050.0512800019 июлнет

Модели Cohere: с фокусом на RAG, function calling, tools


Модели от Cohere с фокусом на RAG, function calling, tools.
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere

Cohere: Command R ?
cohere/command-r
0.0750.2251280006 апрнет
Cohere: Command R+ ?
cohere/command-r-plus
0.452.251280006 апрнет

Модели Qwen – опенсорс модели от Tongyi Qianwen (Alibaba)


Серия языковых моделей от Tongyi Qianwen (Alibaba group, Китай).
Старшие модели показывают неплохое знание русского языка – но рекомендуется ставить температуру пониже (около 0.2) и явно прописывать «отвечать на русском языке».
 
Блог-запись о запуске моделей
 
Используя эти модели, вы соглашаетесь с Tongyi Qianwen LICENSE AGREEMENT
Для модели 110B также доступна translate-версия.

Qwen 2 72B Instruct ?
qwen/qwen-2-72b-instruct
0.140.14327687 июннет
Qwen 2 7B Instruct
qwen/qwen-2-7b-instruct
0.030.033276818 июлнет
Qwen 1.5 14B Chat ?
qwen/qwen-14b-chat
0.040.043276811 маянет
Qwen 1.5 32B Chat ?
qwen/qwen-32b-chat
0.1080.1083276811 маянет
Qwen 1.5 72B Chat ?
qwen/qwen-72b-chat
0.130.133276811 маянет
Qwen 1.5 110B Chat ?
qwen/qwen-110b-chat
0.240.243276811 маянет


Российская модель Мистраль-Сайга – альтернатива YaGPT и GigaChat


Третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре: https://habr.com/ru/articles/767588/ Обработка текстов для неё осуществляется на управляемом нами российском сервере.

Saiga/Mistral 7B ?
gusev/saiga-mistral-7b
0.040.04204713 марнет

Опенсорс модели


Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку “?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.
 
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
 
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Gryphe: MythoMax L2 13B ?
gryphe/mythomax-L2-13b
дешевая 13B
0.040.0440968 марнет
CodeLlama 34B Instruct (beta) ?
meta-llama/codellama-34b-instruct
0.120.12819224 окт 23нет
Llama v2 70B Chat ?
meta-llama/llama-2-70b-chat
0.150.1540961 дек 23нет
Mythalion 13B ?
pygmalionai/mythalion-13b
ролеплей
0.168750.16875819216 янвнет
lzlv 70B (in test) ?
lizpreciatior/lzlv-70b-fp16-hf
ролеплей
0.1050.1425409616 янвнет
OpenChat 7B ?
openchat/openchat-7b
рекомендуется
0.0270.02781926 июннет
Psyfighter v2 13B ?
koboldai/psyfighter-13b-2
ролеплей
0.150.15409616 янвнет
Phind: CodeLlama 34B v2 ?
phind/phind-codellama-34b
программирование
0.060.06409616 янвнет
MythoMist 7B ?
gryphe/mythomist-7b
ролеплей
0.040.043276816 янвнет
Toppy M 7B ?
undi95/toppy-m-7b
ролеплей
0.040.043276816 янвнет
OpenHermes 2.5 Mistral 7B ?
teknium/openhermes-2.5-mistral-7b
0.040.04409610 дек 23нет
Dolphin 2.6 Mixtral 8x7B ?
cognitivecomputations/dolphin-mixtral-8x7b
дешевая 8x7B с большим контекстом ролеплей и общие вопросы
0.0450.0453200020 янвнет
Nous Hermes 2 - Yi 34B ?
nousresearch/nous-hermes-yi-34b
0.120.1240965 янвнет
Noromaid Mixtral 8x7B Instruct ?
neversleep/noromaid-mixtral-8x7b-instruct
0.450.4580005 янвнет
RWKV v5: Eagle 7B ?
recursal/eagle-7b
0.040.041000029 янвнет
Nous: Hermes 2 Mixtral 8x7B DPO ?
nousresearch/nous-hermes-2-mixtral-8x7b-dpo
дешевая 8x7B с большим контекстом ролеплей и общие вопросы
0.0450.045320001 марнет
Midnight Rose 70B ?
sophosympatheia/midnight-rose-70b
топ ролеплей от 24 марта
0.150.15409524 марнет
Databricks: DBRX 132B Instruct ?
databricks/dbrx-instruct
0.150.15300004 апрнет
WizardLM-2 8x22B ?
microsoft/wizardlm-2-8x22b
топ ролеплей от 17 апреля ролеплей и общие вопросы
0.150.156553618 апрнет
WizardLM-2 7B ?
microsoft/wizardlm-2-7b
0.040.043200018 апрнет
LLaMA v3 8B Instruct ?
meta-llama/llama-3-8b-instruct
0.0350.035819219 апрнет
LLaMA v3 70B Instruct ?
meta-llama/llama-3-70b-instruct
0.1350.135819219 апрнет
Llama 3 Lumimaid 8B (large-context) ?
neversleep/llama-3-lumimaid-8b-large
ролеплей
0.040.34245766 маянет
Phi-3 Medium Instruct 14B ?
microsoft/phi-3-medium-128k-instruct
0.150.1512800027 маянет
Phi-3 Mini Instruct 3.8B ?
microsoft/phi-3-mini-128k-instruct
0.0150.01512800027 маянет
Llama 3 Lumimaid 70B ?
neversleep/llama-3-lumimaid-70b
int4 квантизация ролеплей
0.670.90819229 маянет
OpenChat 3.6 Llama 8B ?
openchat/openchat-8b
0.0270.02781926 июннет
Euryale-v2.1-70B ?
sao10k/euryale-70b
ролеплей
0.220.221600030 июннет
DeepSeek-Coder-V2 236B MoE ?
deepseek/deepseek-coder
топ программирование провайдер логирует данные
0.040.0512800019 июннет
DeepSeek-V2-Chat 236B MoE ?
deepseek/deepseek-chat
провайдер логирует данные общие вопросы
0.040.0512800019 июннет
NVIDIA Nemotron 4 340B Instruct ?
nvidia/nemotron-4-340b-instruct
топ опенсорс переводчик от 25 июня есть риск выключения из-за малого трафика общие вопросы
0.630.63409625 июннет
Yi Large ?
01-ai/yi-large
Базовый+GPT-4 поддерживает русский общие вопросы
0.450.453276826 июннет
Stheno 8B 3.3 ?
sao10k/l3-stheno-8b
ролеплей
0.040.223200030 июннет
Magnum 72B ?
alpindale/magnum-72b
квантизация int4 ролеплей
0.500.601638412 июлнет
Llama 3 405B Instruct ?
meta-llama/llama-3-405b-instruct
Базовый+GPT-4 будет доступна 23-25 июля предварительный анонс, цены приблизительные
1.21.2409618 июлнет

Translate-версии опенсорс моделей


Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.

Translate-версия Gryphe: MythoMax L2 13B
translate-gryphe/mythomax-L2-13b
0.060.06409612 янвнет
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ?
translate-mistralai/mistral-7b-instruct
0.060.06819224 окт 23нет
Mythalion 13B with Ru-En translation (beta) ?
translate-pygmalionai/mythalion-13b
0.178750.17875819217 ноя 23нет
lzlv 70B (in test) with Ru-En translation (beta) ?
translate-lizpreciatior/lzlv-70b-fp16-hf
0.1250.1625409617 ноя 23нет
Translate-версия OpenChat 7B ?
translate-openchat/openchat-7b
0.0370.03781926 июннет
Translate-версия Psyfighter v2 13B
translate-koboldai/psyfighter-13b-2
0.170.17409610 дек 23нет
Translate-версия MythoMist 7B
translate-gryphe/mythomist-7b
0.060.063276810 дек 23нет
Translate-версия Toppy M 7B
translate-undi95/toppy-m-7b
0.060.06409610 дек 23нет
Translate-версия OpenHermes 2.5 Mistral 7B
translate-teknium/openhermes-2.5-mistral-7b
0.060.06409610 дек 23нет
Translate-версия Dolphin 2.6 Mixtral 8x7B
translate-cognitivecomputations/dolphin-mixtral-8x7b
дешевая 8x7B с большим контекстом
0.0650.065320001 марнет
Translate-версия Nous Hermes 2 - Yi 34B
translate-nousresearch/nous-hermes-yi-34b
0.140.1440965 янвнет
Translate-версия Noromaid Mixtral 8x7B Instruct
translate-neversleep/noromaid-mixtral-8x7b-instruct
0.470.4780005 янвнет
Translate-версия Nous: Hermes 2 Mixtral 8x7B DPO
translate-nousresearch/nous-hermes-2-mixtral-8x7b-dpo
дешевая 8x7B с большим контекстом
0.0650.065320001 марнет
Midnight Rose 70B (Translate-версия)
translate-sophosympatheia/midnight-rose-70b
топ ролеплей от 24 марта
0.150.15409524 марнет
Databricks: DBRX 132B Instruct (Translate-версия)
translate-databricks/dbrx-instruct
0.170.17300004 апрнет
WizardLM-2 8x22B (translate-версия)
translate-microsoft/wizardlm-2-8x22b
топ ролеплей от 17 апреля
0.170.176553618 апрнет
Mistral: Mixtral 8x22B Instruct (translate-версия)
translate-mistralai/mixtral-8x22b-instruct
0.170.176553618 апрнет
WizardLM-2 7B (translate-версия)
translate-microsoft/wizardlm-2-7b
0.060.063200018 апрнет
Llama 3 Lumimaid 8B (large-context) (translate-версия)
translate-neversleep/llama-3-lumimaid-8b-large
ролеплей
0.040.34245766 маянет
Phi-3 Mini Instruct 3.8B (translate-версия)
translate-microsoft/phi-3-mini-128k-instruct
0.0250.02512800027 маянет
Llama 3 Lumimaid 70B (translate-версия)
translate-neversleep/llama-3-lumimaid-70b
ролеплей
0.670.90819227 маянет
Euryale-v2.1-70B (translate-версия)
translate-sao10k/euryale-70b
ролеплей
0.220.221600030 июннет
Magnum 72B (translate-версия)
translate-alpindale/magnum-72b
ролеплей
0.500.601638412 июлнет
Qwen 1.5 110B Chat (translate-версия)
translate-qwen/qwen-110b-chat
0.250.253276811 маянет

Самые свежие опенсорс модели тарифа Open Models Fan (бета-тест)


Самые свежие опенсорс модели, доступные только на тарифе Open Models Fan и выше.
 
Особенности:
– Модели доступны для экспериментирования, а не для реальной автоматизации. Поэтому, пожалуйста, используйте их только вручную или на очень малом объеме автоматических запросов. Если вам нужно интенсивно работать с ними, рекомендуем развернуть их на собственном сервере.
– Следствие – мы берем плату за вызов, но малую плату за входные и выходные символы. Таким образом, эти модели более выгодно использовать для долгого ролеплея с большим контекстом (если они это поддерживают)
– Скорость вывода – 10–40 токенов в секунду, в зависимости от размера модели. Нормально для тестирования.
– Модели поставляются в квантизации FP8 – создавая баланс между загрузкой серверов и качеством. В целом, падение качества по сравнению с FP16 и FP32 (оригинал) довольно небольшое.
– Обычно опенсорсные файнтюны моделей в первую очередь предназначены для ролеплея и написания историй (часто – на английском, если не указано обратное). Для общих кейсов мы рекомендуем обычные модели.
(19 июля) Тариф и модели находятся в стадии теста, т.к. это новый для нас провайдер. Если будут проблемы с работой, тариф и данные модели могут быть, увы, закрыты.
 
Пожалуйста, поддержите опенсорсную альтернативу проприетарным моделям!

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
Saiga/Llama3 8B ?
OMF-IlyaGusev/saiga_llama3_8b
Open Models Fan За вызов: 0.10 р. Hugging Face
0.020.02819219 июлнет
Suzume 8B ?
OMF-lightblue/suzume-llama-3-8B-multilingual
Open Models Fan За вызов: 0.10 р. Hugging Face
0.020.02819219 июлнет
Smaug-Llama-3-70B-Instruct ?
OMF-abacusai/Smaug-Llama-3-70B-Instruct
Open Models Fan За вызов: 0.20 р. ролеплей и общие вопросы Hugging Face
0.050.05819219 июлнет
Kunoichi DPO v2 7B ?
OMF-SanjiWatsuki/Kunoichi-DPO-v2-7B
Open Models Fan За вызов: 0.10 р. ролеплей Hugging Face
0.020.02819219 июннет
TenyxChat-DaybreakStorywriter-70B ?
OMF-DaybreakStorywriterXTenyxChat-70B
Open Models Fan За вызов: 0.20 р. ролеплей и общие вопросы Hugging Face
0.050.05819219 июннет
New Dawn Llama-3-70B 32K v1.0 ?
OMF-New-Dawn-Llama-3-70B-32K-v1.0
Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face
0.050.05819219 июлнет
Sao10K: L3 8B Lunaris v1 ?
OMF-sao10k/l3-8b-lunaris-v1
Open Models Fan За вызов: 0.10 р. ролеплей Hugging Face
0.020.02819219 июлнет
MG-FinalMix-72B (Magnun-72B based) ?
OMF-Undi95/MG-FinalMix-72B
Open Models Fan За вызов: 0.20 р. ролеплей Hugging Face
0.050.05819219 июлнет
Tess v2.5.2 Qwen2 72B ?
OMF-Tess-v2.5.2-Qwen2-72B
Open Models Fan За вызов: 0.20 р. Hugging Face
0.050.05819219 июлнет
L3 70B Daybreak Storywriter (v0.4 finetune) ?
OMF-L3-70B-daybreak-storywriter-v0.4
Open Models Fan За вызов: 0.20 р. Hugging Face
0.050.05819219 июлнет

Text-to-image (генерация изображений по тексту)

OpenAI Dall-E


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке “?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
 
Для ознакомления с возможностями Dalle-3 рекомендуем статью от OpenAI Что нового в Dalle-3

OpenAI: Dall-E 2 ?
openai/dall-e-2
Базовый+GPT-4 (не Тестовый) генерация изображений
10.00.0409613 марнет
OpenAI: Dall-E 3 ?
openai/dall-e-3
Базовый+GPT-4 (не Тестовый) топ! генерация изображений
10.00.0409613 марнет

Другие модели


Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Подробнее о стоимости генерации при разном разрешении и качестве по кнопке “?", там же описание дополнительных параметров, доступных при вызове модели.
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.

Dummy Image ?
img-dummy/image
За вызов: 0.005 р.
0.000.00409613 марнет
Stable Diffusion XL v1.0 ?
img-stable/stable-diffusion-xl-1024
Базовый+GPT-4 (не Тестовый) генерация изображений 0.95 р. за 1 изображение
10.00.0200030 июннет
Playground v2.5 ?
img-playground-v2-5-1024px
Базовый+GPT-4 (не Тестовый) генерация изображений 1.45 р. за 1 изображение
10.00.0200012 июлда


Также в планах добавить Stable Diffusion

Embeddings


Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).
 
Пример реализации RAG с использованием наших эмбеддингов доступен у нас на Github

Старые (v2)


Text Embedding Ada v2 ?
text-embedding-ada-002
0.030.00102413 марнет

Новые (v3)


OpenAI: text-embedding-3-small (тест)
emb-openai/text-embedding-3-small
0.0060.03200013 марнет
OpenAI: text-embedding-3-large (тест)
emb-openai/text-embedding-3-large
0.0350.03200013 марнет

Vision-модели (вопросы по изображению, OCR)


Предназначены для совместной обработки текста и изображений.
 
Временные особенности:
  • Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
  • Stream не поддерживается.
  • Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
  • Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
  • Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Google: Gemini Pro Vision (preview) ?
vis-google/gemini-pro-vision
Базовый+GPT-4 скидка 90% на обработку изображения 0.04 р. за 1 изображение (со скидкой)
0.050.10655367 маянет
OpenAI: GPT-4 Vision (preview) ?
vis-openai/gpt-4-vision-preview
Базовый+GPT-4 около 1.7 р. за 1 изображение
2.006.001280001 марда
Anthropic: Claude 3 Sonnet (vision) ?
vis-anthropic/claude-3-sonnet
Базовый+GPT-4 около 0.7 р. за изображение
0.63.02000005 марда
Anthropic: Claude 3 Opus (vision) ?
vis-anthropic/claude-3-opus
Базовый+GPT-4 около 3.3 р. за изображение
3.015.02000005 марда
Anthropic: Claude 3 Haiku (vision) ?
vis-anthropic/claude-3-haiku
Базовый+GPT-4 около 0.1 р за 1 изображение
0.0660.320000014 марда
OpenAI: GPT-4 Vision Turbo ?
vis-openai/gpt-4-turbo
Базовый+GPT-4 топ! около 1.7 р. за 1 изображение
2.006.0012800027 апрда
Google: Gemini Pro 1.5 (vision-вариант) ?
vis-google/gemini-pro-1.5
Базовый+GPT-4 0.60 р. за 1 изображение
0.81.8100000010 апрнет
FireLLaVA 13B ?
vis-fireworks/firellava-13b
0.03 р. за 1 изображение
0.050.05409626 апрнет
OpenAI: GPT-4o (vision) ?
vis-openai/gpt-4o
Базовый+GPT-4 топ!
1.103.3012800031 маяда
Google: Gemini Flash 1.5 (vision-версия) ?
vis-google/gemini-flash-1.5
Базовый+GPT-4 очень дешевая 0.03 р. за изображение
0.0550.165100000031 маянет
LLaVA Yi v1.6 34B ?
vis-liuhaotian/llava-yi-34b
0.5 р за изображение
0.200.20409631 маянет
Anthropic: Claude 3.5 Sonnet (vision) ?
vis-anthropic/claude-3.5-sonnet
Базовый+GPT-4 около 0.7 р. за изображение
0.63.020000026 июнда

Speech-To-Text-модели (распознавание речи)


Предназначены для распознавания речи.
 
Временные особенности:
  • Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: Whisper (v3, сторонний провайдер, тест) ?
stt-openai/whisper-1
1.5 р за минуту
25.000.00200028 июннет

Text-to-Speech-модели (генерация речи)


Предназначены для генерации речи по тексту.
Условия использования моделей OpenAI: вы обязаны явно декларировать, что используете голос ИИ.
 
Временные особенности:
  • Не поддерживают стриминг
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования генерации – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: TTS-1 ?
tts-openai/tts-1
3.20.0409614 июнда
OpenAI: TTS-1-HD ?
tts-openai/tts-1-hd
Базовый+GPT-4
6.40.0409614 июнда


Примечания


Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.

Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»