Модели
Более 60 разных моделей, доступных на нашем сервисе, доступны через оглавление чуть ниже
Непонятно, что выбрать? Читайте туториал >
Теги: теги «ролеплей», «рекомендуется» расставлены администрацией из собственных предпочтений и экспериментов. Предназначены для ориентирования пользователей, только начинающих пользоваться моделями.
Мировые новинки у нас
- 19 апреля, Llama3 8B/70B – новейшие опенсорс модели серии Llama.
- 18 апреля, MicrosoftAI: WizardLM-2 7B – файнтюн 7B-модели от MicrosoftAI.
- 18 апреля, Mistral: Mixtral 8x22B Instruct – официальная дотренировка от Mistral их модели на выполнение инструкций.
- 16 апреля, MicrosoftAI: WizardLM-2 8x22B – мощный опенсорсный файнтюн для Mixtral 8x22B, по метрикам сопоставим с GPT-4.
- 11 апреля, Mistral: Mixtral 8x22B – запустили самую последнюю опенсорс модель от Mistral.
- 10 апреля, OpenAI: GPT-4-Turbo – последний вариант GPT-4-Turbo от 9 апреля
- 10 апреля, Google: Gemini Pro 1.5 на 1 миллион контекста
- 5 апреля, Cohere – Command R и Command R+ – общие сети с контекстом 128 000, фокусирующиеся на RAG и обработке вызова функций (function calling) и tools
- 20 марта, OpenAI – подключили Whisper – сеть для распознавания аудио (Speech-To-Text)
- 14 марта, Anthropic – добавили Claude 3 Haiku. Очень дешевая модель с возможностью общаться на русском и гигантским контекстом в 200К токенов!
- 13 марта, OpenAI – подключили новые embeddings: text-embedding-3-small, text-embedding-3-large
- 8 марта, Mistral – перенесли запуск Mixtral 8x7B Instruct на API от Groq с их уникальными ускоряющими процессорами. Скорость выросла где-то в 5 раз.
- 4 марта, Anthropic – выпустила Claude 3. По оценкам разработчиков модель Sonnet быстрее, дешевле и лучше Claude 2, а Opus даже превосходит GPT-4.
- Более старые новости по подключенным моделям
Текстовые модели
Модели OpenAI: ChatGPT, GPT-4-Turbo...
Нейросети от мирового лидера, OpenAI. Если вы только погружаетесь в тему текстовых нейросетей – оптимально выбрать ChatGPT (gpt-3.5-turbo) в качестве основного варианта. Если вам нужна бОльшая точность в рассуждениях – выберите GPT-4. GPT-4-Turbo обладает контекстом в 128 000 символов и подходит в том числе для обработки больших файлов – но она в меру дорогая.
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Настройках
Внимание: для новых пользователей включена автоматическая оптимизация запросов при выборе сетeй OpenAI – выбирается самая эффективная и дешевая в своем классе. Если вы хотите точного соответствия модели вашему запросу, отключите оптимизацию в Настройках
Модель | Руб за 1000 символов входных данных | Руб за 1000 символов генерации модели | Размер конте кста | ID модели | Авто моде ра ция |
OpenAI: GPT-3.5 Turbo | 0.15 | 0.3 | 4095 | openai/gpt-3.5-turbo | да |
OpenAI: GPT-3.5 Turbo 16k (11-06) ? рекомендуется | 0.15 | 0.3 | 16385 | openai/gpt-3.5-turbo-1106 | да |
OpenAI: GPT-3.5 Turbo Instruct ? | 0.225 | 0.3 | 4095 | openai/gpt-3.5-turbo-instruct | да |
OpenAI: GPT-3.5 Turbo 16k | 0.45 | 0.6 | 16383 | openai/gpt-3.5-turbo-16k | да |
OpenAI: GPT-3.5 Turbo 16k (01-25) ? рекомендуется | 0.075 | 0.225 | 16385 | openai/gpt-3.5-turbo-0125 | да |
OpenAI: GPT-4 ? Базовый+GPT-4 | 4.5 | 9 | 8191 | openai/gpt-4 | да |
OpenAI: GPT-4 Turbo (1106-preview) ? Базовый+GPT-4 | 1.5 | 4.5 | 128000 | openai/gpt-4-1106-preview | да |
OpenAI: GPT-4 Turbo (0125-preview) ? Базовый+GPT-4 топ! | 1.5 | 4.5 | 128000 | openai/gpt-4-turbo-preview | да |
OpenAI: GPT-4 Turbo (gpt-4-turbo-2024-04-09) ? Базовый+GPT-4 топ! | 1.5 | 4.5 | 128000 | openai/gpt-4-turbo | да |
OpenAI: GPT-4 32k Базовый+GPT-4 | 9 | 18 | 32767 | openai/gpt-4-32k | да |
OpenAI: Dall-E 2 ? генерация изображений | 10.0 | 0.0 | 4096 | openai/dall-e-2 | нет |
OpenAI: Dall-E 3 ? топ! генерация изображений | 10.0 | 0.0 | 4096 | openai/dall-e-3 | нет |
Модели Anthropic: Claude
Нейросети от Anthropic – основного конкурента OpenAI. Мы рекомендуем их пробовать, если нужна обработка больших текстов (файлов и пр.). Рекомендуем их нейросети Claude 3 – Haiku для дешевой и быстрой обработки большого контекста, Opus – для максимально качественной работы.
Anthropic: Claude Instant v1 ? | 0.12 | 0.36 | 100000 | anthropic/claude-instant-v1 | да |
Anthropic: Claude v2.1 ? Базовый+GPT-4 | 1.2 | 3.6 | 200000 | anthropic/claude-2 | да |
Anthropic: Claude v2.0 ? Базовый+GPT-4 | 1.2 | 3.6 | 100000 | anthropic/claude-2.0 | да |
Anthropic: Claude 3 Sonnet ? Базовый+GPT-4 | 0.4 | 2.0 | 200000 | anthropic/claude-3-sonnet | да |
Anthropic: Claude 3 Opus ? Базовый+GPT-4 ТОП! | 2.0 | 10.0 | 200000 | anthropic/claude-3-opus | да |
Anthropic: Claude 3 Haiku ? дешевая и с большим контекстом | 0.0375 | 0.1875 | 200000 | anthropic/claude-3-haiku | да |
Модели Perplexity: онлайн, с доступом к Интернету и фактической информации
Нейросети от Perplexity, сфокусированные на более точным следованиям фактам. Онлайн-модели (online в конце) перед запросом предположительно запрашивают свежие данные в Интернете, после чего формируют ответ – и, например, могут отвечать о погоде сегодня, о курсе доллара и пр. Также модели можно передавать ссылку на конкретную страницу в Интернете и с высокой вероятностью получить релевантный ответ.
Наша новость на Хабре о моделях Perplexity
Внимание: онлайн-модель тарифицируется не по входным данным, а по запросу. Выход тарифицируется как обычно. Также модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.
Наша новость на Хабре о моделях Perplexity
Внимание: онлайн-модель тарифицируется не по входным данным, а по запросу. Выход тарифицируется как обычно. Также модель НЕ поддерживает чат – каждый запрос учитывает только последнее сообщение пользователя.
Perplexity: PPLX 7B Online ? За вызов: 0.85 р. | 0.0 | 0.042 | 4096 | perplexity/pplx-7b-online | нет |
Perplexity: PPLX 70B Online ? За вызов: 0.85 р. | 0.0 | 0.42 | 4096 | perplexity/pplx-70b-online | нет |
Perplexity: Sonar 7B Online ? За вызов: 0.85 р. онлайн | 0.0 | 0.042 | 12000 | perplexity/sonar-small-online | нет |
Perplexity: Sonar 8x7B Online ? За вызов: 0.85 р. рекомендуется онлайн | 0.0 | 0.27 | 12000 | perplexity/sonar-medium-online | нет |
Модели Google
Нейросети от Google. Достаточно дешевые. Palm 2 по разным отзывам недостаточно эффективен и точен, но последняя Gemini Pro должна быть довольна удачной.
Google: Gemini Pro 1.0 ? рекомендуется | 0.049 | 0.11 | 32768 | google/gemini-pro | нет |
Google: PaLM 2 Bison | 0.075 | 0.075 | 1024 | google/palm-2-chat-bison | нет |
Google: PaLM 2 Chat 32k ? | 0.075 | 0.075 | 32000 | google/palm-2-chat-bison-32k | нет |
Google: Gemini Pro 1.5 (preview) ? Базовый+GPT-4 | 1.0 | 2.2 | 1000000 | google/gemini-pro-1.5 | нет |
Google: Gemma 7B (опенсорс) ? | 0.04 | 0.04 | 8000 | google/gemma-7b-it | нет |
Модели MistralAI: опенсорс + закрытые Tiny, Small, Medium
Закрытые, предоставляемые по API нейросети от компании Mistral, известной своими опенсорс моделями. Mistral Medium по оценкам производителя в работе сравнима с Claude 2 и GPT 4. Также здесь присутствуют ссылки на её оригинальные опенсорс модели.
Mistral 7B Instruct v0.1 ? | 0.04 | 0.04 | 8192 | mistralai/mistral-7b-instruct | нет |
Mistral: Mixtral 8x7B Instruct ? дешевая 8x7B с большим контекстом | 0.045 | 0.045 | 32768 | mistralai/mixtral-8x7b-instruct | нет |
Mistral Tiny ? | 0.04 | 0.04 | 32000 | mistralai/mistral-tiny | нет |
Mistral Small ? | 0.30 | 0.90 | 32000 | mistralai/mistral-small | нет |
Mistral Medium ? Базовый+GPT-4 | 0.42 | 1.25 | 32000 | mistralai/mistral-medium | нет |
Mistral: Mistral Large ? Базовый+GPT-4 | 1.2 | 3.6 | 32000 | mistralai/mistral-large | нет |
Mistral: Mixtral 8x22B (base) ? | 0.15 | 0.15 | 64000 | mistralai/mixtral-8x22b | нет |
Mistral: Mixtral 8x22B Instruct ? | 0.15 | 0.15 | 65536 | mistralai/mixtral-8x22b-instruct | нет |
Модели Cohere: с фокусом на RAG, function calling, tools
Модели от Cohere с фокусом на RAG, function calling, tools.
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere
Доступны в виде OpenSource версий, но у нас предоставляются через API с модерацией.
Используя данные модели, вы соглашаетесь с ToS Cohere
Cohere: Command R ? | 0.075 | 0.225 | 128000 | cohere/command-r | нет |
Cohere: Command R+ ? | 0.45 | 2.25 | 128000 | cohere/command-r-plus | нет |
Российская модель Мистраль-Сайга – альтернатива YaGPT и GigaChat
Третья модель, сфокусированная на российском языке после моделей от Яндекса (YaGPT) и Сбера (GigaChat) – и сравнима с ними. Подробнее об истории возникновения – в нашей статье на Хабре: https://habr.com/ru/articles/767588/ Обработка текстов для неё осуществляется на управляемом нами российском сервере.
Saiga/Mistral 7B ? | 0.04 | 0.04 | 2047 | gusev/saiga-mistral-7b | нет |
Опенсорс модели
Различные опенсорс модели. Эти модели в первую очередь тренировались на английском языке (учтите это), но и на русском могут показывать неплохое качество. В отличие от коммерческих моделей они, как правило, не используют автомодерацию запросов по этическому признаку. Читайте описания к модели по знаку ?". Как правило, модели с большим числом параметров (70B против 7B) более точны и лучше рассуждают, но и более дороги в обработке.
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)
В тегах указано, на чем специализируется модель. Если тег не указан – модель многоцелевая, т.е. чаще всего обычное следование инструкциям, но лучше прочитать описание.
Если на русский запрос они выдают не очень хороший результат, попробуйте обращаться к ним на английском, или попробуйте наши translate-версии (ниже). Особенно рекомендуется translate-версии для ролеплейных моделей (если вы не пишете на английском)
Модель | Руб за 1000 символов входных данных | Руб за 1000 символов генерации модели | Размер конте кста | ID модели | Авто моде ра ция |
Gryphe: MythoMax L2 13B ? дешевая 13B | 0.04 | 0.04 | 4096 | gryphe/mythomax-L2-13b | нет |
Airoboros L2 70B ? | 0.105 | 0.1425 | 4096 | jondurbin/airoboros-l2-70b | нет |
CodeLlama 34B Instruct (beta) ? | 0.12 | 0.12 | 8192 | meta-llama/codellama-34b-instruct | нет |
Llama v2 70B Chat ? | 0.15 | 0.15 | 4096 | meta-llama/llama-2-70b-chat | нет |
Mythalion 13B ? ролеплей | 0.16875 | 0.16875 | 8192 | pygmalionai/mythalion-13b | нет |
lzlv 70B (in test) ? ролеплей | 0.105 | 0.1425 | 4096 | lizpreciatior/lzlv-70b-fp16-hf | нет |
Intel Neural Chat 7B v3.1 ? | 0.04 | 0.04 | 32768 | intel/neural-chat-7b | нет |
OpenChat 7B ? рекомендуется | 0.04 | 0.04 | 8192 | openchat/openchat-7b | нет |
Psyfighter 13B ? ролеплей | 0.15 | 0.15 | 4096 | jebcarter/psyfighter-13b | нет |
Psyfighter v2 13B ? ролеплей | 0.15 | 0.15 | 4096 | koboldai/psyfighter-13b-2 | нет |
Phind: CodeLlama 34B v2 ? программирование | 0.06 | 0.06 | 4096 | phind/phind-codellama-34b | нет |
MythoMist 7B ? ролеплей | 0.04 | 0.04 | 32768 | gryphe/mythomist-7b | нет |
Toppy M 7B ? ролеплей | 0.04 | 0.04 | 32768 | undi95/toppy-m-7b | нет |
OpenHermes 2.5 Mistral 7B ? | 0.04 | 0.04 | 4096 | teknium/openhermes-2.5-mistral-7b | нет |
Dolphin 2.6 Mixtral 8x7B ? дешевая 8x7B с большим контекстом ролеплей и общие вопросы | 0.045 | 0.045 | 32000 | cognitivecomputations/dolphin-mixtral-8x7b | нет |
Nous Hermes 2 - Yi 34B ? | 0.12 | 0.12 | 4096 | nousresearch/nous-hermes-yi-34b | нет |
Noromaid Mixtral 8x7B Instruct ? | 0.45 | 0.45 | 8000 | neversleep/noromaid-mixtral-8x7b-instruct | нет |
RWKV v5: Eagle 7B ? | 0.04 | 0.04 | 10000 | recursal/eagle-7b | нет |
CodeLlama 70B Instruct ? программирование | 0.1215 | 0.1215 | 2048 | codellama/codellama-70b-instruct | нет |
Nous: Hermes 2 Mixtral 8x7B DPO ? дешевая 8x7B с большим контекстом ролеплей и общие вопросы | 0.045 | 0.045 | 32000 | nousresearch/nous-hermes-2-mixtral-8x7b-dpo | нет |
Midnight Rose 70B ? топ ролеплей от 24 марта | 1.10 | 1.10 | 4095 | sophosympatheia/midnight-rose-70b | нет |
Databricks: DBRX 132B Instruct ? | 0.15 | 0.15 | 30000 | databricks/dbrx-instruct | нет |
WizardLM-2 8x22B ? топ ролеплей от 17 апреля ролеплей и общие вопросы | 0.15 | 0.15 | 65536 | microsoft/wizardlm-2-8x22b | нет |
WizardLM-2 7B ? | 0.04 | 0.04 | 32000 | microsoft/wizardlm-2-7b | нет |
LLaMA v3 8B Instruct ? | 0.035 | 0.035 | 8192 | meta-llama/llama-3-8b-instruct | нет |
LLaMA v3 70B Instruct ? | 0.135 | 0.135 | 8192 | meta-llama/llama-3-70b-instruct | нет |
Translate-версии опенсорс моделей
Translate-версии опенсорс моделей. Одна из фишек нашего сервиса. Вы можете отправить запрос на русском, он будет автоматически переведен на английский и отправлен нейросети. Результат обработки (на английском) будет автоматически переведён на русский. Крайне полезна с учетом того, что опенсорс нейросети как правило в основном тренировались на английском языке и выдают на нем значительно лучшие результаты.
Airoboros L2 70B with Ru-En translation (beta) ? | 0.125 | 0.1625 | 4096 | translate-jondurbin/airoboros-l2-70b | нет |
Translate-версия Gryphe: MythoMax L2 13B | 0.06 | 0.06 | 4096 | translate-gryphe/mythomax-L2-13b | нет |
Mistral 7B Instruct v0.1 with Ru-En translation (beta) ? | 0.06 | 0.06 | 8192 | translate-mistralai/mistral-7b-instruct | нет |
Mythalion 13B with Ru-En translation (beta) ? | 0.17875 | 0.17875 | 8192 | translate-pygmalionai/mythalion-13b | нет |
lzlv 70B (in test) with Ru-En translation (beta) ? | 0.125 | 0.1625 | 4096 | translate-lizpreciatior/lzlv-70b-fp16-hf | нет |
Intel Neural Chat 7B v3.1 от Intel с En-Ru переводом ? | 0.06 | 0.06 | 32768 | translate-intel/neural-chat-7b | нет |
Translate-версия OpenChat 7B ? | 0.06 | 0.06 | 8192 | translate-openchat/openchat-7b | нет |
Translate-версия Psyfighter 13B | 0.17 | 0.17 | 4096 | translate-jebcarter/psyfighter-13b | нет |
Translate-версия Psyfighter v2 13B | 0.17 | 0.17 | 4096 | translate-koboldai/psyfighter-13b-2 | нет |
Translate-версия MythoMist 7B | 0.06 | 0.06 | 32768 | translate-gryphe/mythomist-7b | нет |
Translate-версия Toppy M 7B | 0.06 | 0.06 | 4096 | translate-undi95/toppy-m-7b | нет |
Translate-версия OpenHermes 2.5 Mistral 7B | 0.06 | 0.06 | 4096 | translate-teknium/openhermes-2.5-mistral-7b | нет |
Translate-версия Dolphin 2.6 Mixtral 8x7B дешевая 8x7B с большим контекстом | 0.065 | 0.065 | 32000 | translate-cognitivecomputations/dolphin-mixtral-8x7b | нет |
Translate-версия Nous Hermes 2 - Yi 34B | 0.14 | 0.14 | 4096 | translate-nousresearch/nous-hermes-yi-34b | нет |
Translate-версия Noromaid Mixtral 8x7B Instruct | 0.47 | 0.47 | 8000 | translate-neversleep/noromaid-mixtral-8x7b-instruct | нет |
Translate-версия Nous: Hermes 2 Mixtral 8x7B DPO дешевая 8x7B с большим контекстом | 0.065 | 0.065 | 32000 | translate-nousresearch/nous-hermes-2-mixtral-8x7b-dpo | нет |
Midnight Rose 70B (Translate-версия) топ ролеплей от 24 марта | 1.12 | 1.12 | 4095 | translate-sophosympatheia/midnight-rose-70b | нет |
Databricks: DBRX 132B Instruct (Translate-версия) | 0.17 | 0.17 | 30000 | translate-databricks/dbrx-instruct | нет |
WizardLM-2 8x22B (translate-версия) топ ролеплей от 17 апреля | 0.17 | 0.17 | 65536 | translate-microsoft/wizardlm-2-8x22b | нет |
Mistral: Mixtral 8x22B Instruct (translate-версия) | 0.17 | 0.17 | 65536 | translate-mistralai/mixtral-8x22b-instruct | нет |
WizardLM-2 7B (translate-версия) | 0.06 | 0.06 | 32000 | translate-microsoft/wizardlm-2-7b | нет |
Text-to-image (генерация изображений по тексту)
OpenAI Dall-E
Модели для генерации изображений по тексту.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке ?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
Доступны только для платных пользователей тарифа Базовый+GPT4 – на тестовом тарифе не доступны!
Стоимость: Dall-E 2 от 3 р. 10 к., Dall-E 3 от 7 р. 76 к. – подробнее стоимости генерации при разном разрешении и качестве по кнопке ?"
Особенности показа: каждый символ стоит 1 копейку, в статистике генерируется число входных символов в соответствии с прайсом.
OpenAI: Dall-E 2 ? генерация изображений | 10.0 | 0.0 | 4096 | openai/dall-e-2 | нет |
OpenAI: Dall-E 3 ? топ! генерация изображений | 10.0 | 0.0 | 4096 | openai/dall-e-3 | нет |
Другие модели
Dummy Image ? За вызов: 0.005 р. | 0.00 | 0.00 | 4096 | img-dummy/image | нет |
Также в планах добавить Stable Diffusion
Embeddings
Embeddings-модели для вычисления семантической схожести текстов. Для эндпойнта v1/embeddings. (Если вы не знаете, что это такое, оно вам не нужно).
Старые (v2)
Text Embedding Ada v2 ? | 0.03 | 0.00 | 1024 | text-embedding-ada-002 | нет |
Новые (v3)
OpenAI: text-embedding-3-small (тест) | 0.006 | 0.0 | 32000 | emb-openai/text-embedding-3-small | нет |
OpenAI: text-embedding-3-large (тест) | 0.035 | 0.0 | 32000 | emb-openai/text-embedding-3-large | нет |
OpenSource: Multilingual-E5-large (тест) ? | 0.02 | 0.0 | 4096 | emb-intfloat/multilingual-e5-large | нет |
Vision-модели (вопросы по изображению, OCR)
Предназначены для совместной обработки текста и изображений.
Временные особенности:
Временные особенности:
- Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
- Stream не поддерживается.
- Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
- Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
- Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».
Google: Gemini Pro Vision (preview) ? Базовый+GPT-4 скидка 90% на обработку изображения 0.04 р. за 1 изображение (со скидкой) | 0.04 | 0.09 | 65536 | vis-google/gemini-pro-vision | нет |
OpenAI: GPT-4 Vision (preview) ? Базовый+GPT-4 около 1.7 р. за 1 изображение | 2.00 | 6.00 | 128000 | vis-openai/gpt-4-vision-preview | да |
Llava 13B ? Базовый+GPT-4 За вызов: 0.03 р. без спецплаты за изображения | 1.2 | 1.2 | 2048 | vis-haotian-liu/llava-13b | нет |
Anthropic: Claude 3 Sonnet (vision) ? Базовый+GPT-4 около 0.7 р. за изображение | 0.6 | 3.0 | 200000 | vis-anthropic/claude-3-sonnet | да |
Anthropic: Claude 3 Opus (vision) ? Базовый+GPT-4 около 3.3 р. за изображение | 3.0 | 15.0 | 200000 | vis-anthropic/claude-3-opus | да |
Anthropic: Claude 3 Haiku (vision) ? Базовый+GPT-4 около 0.1 р за 1 изображение | 0.06 | 0.3 | 200000 | vis-anthropic/claude-3-haiku | да |
OpenAI: GPT-4 Vision Turbo ? Базовый+GPT-4 топ! около 1.7 р. за 1 изображение | 2.00 | 6.00 | 128000 | vis-openai/gpt-4-turbo | да |
Google: Gemini Pro 1.5 (vision-вариант) Базовый+GPT-4 скидка 90% на обработку изображения 0.10 р. за 1 изображение (со скидкой) | 0.8 | 1.8 | 1000000 | vis-google/gemini-pro-1.5 | нет |
FireLLaVA 13B ? 0.03 р. за 1 изображение | 0.05 | 0.05 | 4096 | vis-fireworks/firellava-13b | нет |
Speech-To-Text-модели (распознавание речи)
Предназначены для распознавания речи.
Временные особенности:
Временные особенности:
- Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
- Пример вызова по API есть в Документации API.
- Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.
Модель | Руб за 1000 символов входных данных | Руб за 1000 символов генерации модели | Размер конте кста | ID модели | Авто моде ра ция |
OpenAI: Whisper (тест) ? | 40.00 | 0.00 | 2000 | stt-openai/whisper-1 | нет |
Примечания
Автомодерация – означает, что, в соответствии с требованиями поставщика модели автоматически проверяется вход на несоответствие этическим нормам (Terms Of Service конкретной модели). В случае, если запрос не проходит модерацию, возвращается ошибка и деньги не списываются.
Ответ на вопрос «Настоящая ли GPT-4 на сайте, если она не отвечает, что она GPT-4 в чате»