Предназначены для совместной обработки текста и изображений.
(Также модели, поддерживающие vision по API представлены в общем списке текстовых моделей с тегом vision
Временные особенности:
Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».
Anthropic: Claude Opus 4.6 (Vision-версия) ? vis-anthropic/claude-opus-4.6 Профессиональный (не Тестовый)toolsstructured-outputs
1.2
6.7
1000000
27 мар
да
Anthropic: Claude Sonnet 4.6 (Vision-версия) ? vis-anthropic/claude-sonnet-4.6 Профессиональный (не Тестовый)toolsstructured-outputs
0.8
4.0
1000000
27 мар
да
Google: Gemini 3 Flash Preview (Thinking) (Vision) ? vis-google/gemini-3-flash-pre-thinking Базовый и выше (не Тестовый)около 0.15 р. за изображениеtoolsstructured-outputs
0.15
0.90
1000000
11 янв
нет
Google: Gemini 3 Flash Preview (Vision-версия) ? vis-google/gemini-3-flash-pre Базовый и выше (не Тестовый)около 0.15 р. за изображениеtoolsstructured-outputs
0.15
0.90
1000000
11 янв
нет
Z.AI: GLM 4.5V (MoE 106B всего, 12B активных) ? vis-z-ai/glm-4.5v Профессиональный (не Тестовый)около 0.20 р. за изображениеtools
0.18
0.54
65000
29 авг 25
нет
Mistral: Mistral Medium 3.1 (Vision-версия) ? vis-mistralai/mistral-medium-3.1 Профессиональный (не Тестовый)около 0.12 р. за изображениеtoolsstructured-outputs
0.12
0.60
131000
29 авг 25
нет
Anthropic: Claude Opus 4.1 (Vision-версия) ? vis-anthropic/claude-opus-4.1 Профессиональный (не Тестовый)ТОП!около 5 р. за изображениеtools
4.5
21.0
200000
29 авг 25
да
Anthropic: Claude Sonnet 4 (Vision-версия) ? vis-anthropic/claude-sonnet-4 Профессиональный (не Тестовый)около 1.3 р. за изображениеtools
1.1
6.0
1000000
29 авг 25
да
OpenAI: GPT-5 (Thinking) (Vision-версия) ? vis-openai/gpt-5 Профессиональный (не Тестовый)топоколо 0.30 р. за изображениеtoolsstructured-outputs
0.37
3.00
400000
29 авг 25
да
OpenAI: GPT-5 Chat (Vision-версия) ? vis-openai/gpt-5-chat Профессиональный (не Тестовый)около 0.30 р. за изображение
0.37
3.00
400000
29 авг 25
да
OpenAI: GPT-5 Thinking Mini (Vision-версия) ? vis-openai/gpt-5-mini Профессиональный (не Тестовый)около 0.20 р. за изображениеtoolsstructured-outputs
0.075
0.60
400000
29 авг 25
да
OpenAI: GPT-5 Nano (Vision-версия) ? vis-openai/gpt-5-nano Профессиональный (не Тестовый)дешевая и с большим контекстомоколо 0.07 р. за изображениеtoolsstructured-outputs
0.015
0.12
400000
29 авг 25
да
Google: Gemini 2.5 Pro (vision-версия) ? vis-google/gemini-2.5-pro Профессиональныйtoolsstructured-outputs
Google: Gemini 2.5 Pro Preview (5 июня, vision-версия) ? vis-google/gemini-2.5-pro-preview Профессиональный (не Тестовый)около 0.6 р за изображениеtoolsstructured-outputs
0.37
3.0
1000000
10 июн 25
нет
Google: Gemini 2.5 Flash Preview 05 20 (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? vis-google/gemini-2.5-flash-pre-05-20 дешевая и с большим контекстомоколо 0.05 р. за изображениеtoolsstructured-outputs
0.045
0.15
1000000
20 мая 25
нет
OpenAI: o4-mini (vision-версия) ? vis-openai/o4-mini Профессиональный (не Тестовый)биллинг с учетом размышлений (см. ?)около 0.80 р. за изображениеразмышления, математикаtoolsstructured-outputs
0.28
1.12
200000
16 апр 25
да
Google: Gemini 2.5 Flash Preview (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? vis-google/gemini-2.5-flash-pre дешевая и с большим контекстомоколо 0.05 р. за изображениеstructured-outputs
0.045
0.15
1000000
18 апр 25
нет
Anthropic: Claude 3.7 Sonnet (thinking, vision) ? vis-anthropic/claude-3.7-sonnet-thinking Профессиональный (не Тестовый)около 1.0 р за изображениеtools
0.8
4.0
200000
10 апр 25
да
Llama 4 Scout (быстрая, Vision-версия) ? vis-meta-llama/llama-4-scout fastоколо 0.09-0.20 р за изображениеtools
0.05
0.16
328000
10 апр 25
нет
Llama 4 Maverick (Vision-версия) ? vis-meta-llama/llama-4-maverick Профессиональныйоколо 0.14-0.35 р. за изображениеtoolsstructured-outputs
0.06
0.24
1000000
10 апр 25
нет
Gemma 3 27B (опенсорс, vision-версия) ? vis-google/gemma-3-27b-it 0.04 р. за изображение
0.07
0.16
128000
19 мар 25
нет
Anthropic: Claude 3.7 Sonnet (vision) ? vis-anthropic/claude-3.7-sonnet Профессиональныйоколо 1.0 р. за изображениеtools
0.8
4.0
200000
19 мар 25
да
Google: Gemini Flash 2.0 (vision-версия) ? vis-google/gemini-2.0-flash-001 Профессиональныйочень дешевая0.06 р. за изображение
0.05
0.12
1000000
19 мар 25
нет
Qwen2.5 VL 72B Instruct ? vis-qwen/qwen2.5-vl-72b-instruct ПрофессиональныйЗа вызов: 0.07 р.топ!около 0.30 р. за изображение
0.30
0.30
32768
19 мар 25
нет
Llama 3.2 11B Vision Instruct ? vis-meta-llama/llama-3.2-11b-vision-instruct Базовый и выше (не Тестовый)За вызов: 0.02 р.около 0.03 р. за изображение
0.055
0.055
128000
26 сен 24
нет
Qwen2-VL 72B Instruct ? vis-qwen/qwen-2-vl-72b-instruct ПрофессиональныйЗа вызов: 0.07 р.топ!около 0.05 р. за изображение
0.60
0.60
32768
21 сен 24
нет
OpenAI: GPT-4o (2024-08-06) (vision-версия) ? vis-openai/gpt-4o-2024-08-06 Профессиональныйтоп!около 0.15 р. за изображениеtoolsstructured-outputs
0.55
2.20
128000
6 авг 24
да
OpenAI: gpt-4o-mini (vision-версия) vis-openai/gpt-4o-mini Профессиональный (не Тестовый)около 0.80 р. за изображение
0.037
0.15
128000
27 июл 24
да
Google: Gemini Flash 1.5 (vision-версия) (выключена, перенаправляется в vis-Flash 2.5) ? vis-google/gemini-flash-1.5 Профессиональныйочень дешевая0.03 р. за изображение
OpenAI: GPT-4 Vision Turbo ? vis-openai/gpt-4-turbo Профессиональныйтоп!около 1.7 р. за 1 изображение
2.00
6.00
128000
27 апр 24
да
Anthropic: Claude 3 Haiku (vision) ? vis-anthropic/claude-3-haiku Профессиональныйоколо 0.1 р за 1 изображениеtools
0.066
0.3
200000
14 мар 24
да
Qwen: Qwen-VL-Max ? vis-qwen/qwen-vl-max Профессиональный0.40 р. за изображение
0.28
1.20
128000
19 мар 25
нет
Qwen: Qwen-VL-Plus ? vis-qwen/qwen-vl-plus 0.08 р. за изображение
0.07
0.20
128000
19 мар 25
нет
Anthropic: Claude Opus 4.6 (Vision-версия)
Anthropic: Claude Opus 4.6 (Vision-версия)
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 200р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Anthropic: Claude Sonnet 4.6 (Vision-версия)
Anthropic: Claude Sonnet 4.6 (Vision-версия)
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 50р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Gemini 3 Flash Preview — это высокоскоростная модель, разработанная для агентных рабочих процессов, многоходовых чатов и помощи в программировании. Она обеспечивает рассуждения и производительность использования инструментов почти на уровне Pro при существенно более низкой задержке, чем у более крупных вариантов Gemini, что делает её хорошо подходящей для интерактивной разработки, длительных циклов работы агентов и совместных задач по программированию. По сравнению с Gemini 2.5 Flash она обеспечивает широкие улучшения качества в области рассуждений, мультимодального понимания и надёжности.
Размышляющая версия.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Google: Gemini 3 Flash Preview (Vision-версия)
Gemini 3 Flash Preview — это высокоскоростная модель, разработанная для агентных рабочих процессов, многоходовых чатов и помощи в программировании. Она обеспечивает рассуждения и производительность использования инструментов почти на уровне Pro при существенно более низкой задержке, чем у более крупных вариантов Gemini, что делает её хорошо подходящей для интерактивной разработки, длительных циклов работы агентов и совместных задач по программированию. По сравнению с Gemini 2.5 Flash она обеспечивает широкие улучшения качества в области рассуждений, мультимодального понимания и надёжности.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Z.AI: GLM 4.5V (MoE 106B всего, 12B активных)
GLM-4.5V — это мультимодальная фундаментальная модель для приложений с визуально-языковыми агентами. Построенная на архитектуре Mixture-of-Experts (MoE) со 106 млрд параметров и 12 млрд активированных параметров, она достигает передовых результатов в понимании видео, ответах на вопросы по изображениям, оптическом распознавании символов (OCR) и анализе документов, а также демонстрирует значительные улучшения в фронтенд-разработке, определении объектов и пространственном мышлении.
Для включения режима "без размышлений" добавьте в промт фразу /nothink
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 20р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
Mistral: Mistral Medium 3.1 (Vision-версия)
Mistral Medium 3.1 — это обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного уровня, разработанной для обеспечения передовых возможностей при значительно сниженных операционных затратах. Она сочетает в себе современные возможности рассуждения и мультимодальную производительность с в 8 раз более низкой стоимостью по сравнению с традиционными крупными моделями, что делает её подходящей для масштабируемых развертываний в профессиональных и промышленных сценариях использования.
Модель превосходно работает в таких областях, как программирование, STEM-рассуждения и корпоративная адаптация. Она поддерживает гибридные развертывания, развертывания на собственных серверах и в VPC, и оптимизирована для интеграции в пользовательские рабочие процессы. Mistral Medium 3.1 предлагает конкурентоспособную точность по сравнению с более крупными моделями, такими как Claude Sonnet 3.5/3.7, Llama 4 Maverick и Command R+, при этом сохраняя широкую совместимость в облачных средах.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 10р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Anthropic: Claude Opus 4.1 (Vision-версия)
Claude Opus 4.1 — это обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в программировании, рассуждениях и агентных задачах. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные улучшения в рефакторинге многофайлового кода, точности отладки и детально-ориентированных рассуждениях. Модель поддерживает расширенное мышление до 64К токенов и оптимизирована для задач, включающих исследования, анализ данных и рассуждения с использованием инструментов.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 150р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
Anthropic: Claude Sonnet 4 (Vision-версия)
Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя его как в задачах программирования, так и в задачах рассуждения с улучшенной точностью и управляемостью. Достигая передовых результатов на SWE-bench (72,7%), Sonnet 4 балансирует между производительностью и вычислительной эффективностью, что делает его подходящим для широкого спектра приложений: от рутинных задач кодирования до сложных проектов разработки программного обеспечения. Ключевые улучшения включают усовершенствованную автономную навигацию по кодовой базе, сниженное количество ошибок в рабочих процессах, управляемых агентами, и повышенную надежность в следовании сложным инструкциям. Sonnet 4 оптимизирован для практического повседневного использования, обеспечивая продвинутые возможности рассуждения при сохранении эффективности и отзывчивости в различных внутренних и внешних сценариях.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 50р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
OpenAI: GPT-5 (Thinking) (Vision-версия)
GPT-5 — это самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте.
Данная версия размышляющая. Как описывают разработчики, можно углубить размышления модели, добавив фразу "think hard about this".
Внимание: на некоторых запросах, которая GPT-5 считает простыми, она сама отключает размышления. К сожалению, это не регулируется.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
До выдачи результатов по API модель размышляет над ответом. Это стоит довольно много токенов, но не показывается в ответе.
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
В случае, если в процессе рассуждения достигнут лимит Макс токенов выхода, будет выдан пустой ответ - но он будет тарифицирован.
Также мы рекомендуем указывать повышенное время timeout, если вы используете API - модель может думать иногда 10 минут и более на сложных задачах.
Минимальный баланс для вызова модели: 30р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию. Максимальный размер выходной генерации для модели: 128000 токенов
OpenAI: GPT-5 Chat (Vision-версия)
GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-ориентированных диалогов для корпоративных приложений.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 20р. Максимальный размер выходной генерации для модели: 128000 токенов
OpenAI: GPT-5 Thinking Mini (Vision-версия)
GPT-5 Mini — это компактная версия GPT-5, разработанная для выполнения менее ресурсоемких задач рассуждения. Она обеспечивает те же преимущества в следовании инструкциям и настройке безопасности, что и GPT-5, но с уменьшенной задержкой и стоимостью. GPT-5 Mini является преемником модели o4-mini от OpenAI.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию. Максимальный размер выходной генерации для модели: 128000 токенов
OpenAI: GPT-5 Nano (Vision-версия)
GPT-5-Nano — это самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчиков, быстрых взаимодействий и сред с ультранизкой задержкой. Хотя он ограничен в глубине рассуждений по сравнению с более крупными аналогами, он сохраняет ключевые функции следования инструкциям и безопасности. Это преемник GPT-4.1-nano и предлагает легковесный вариант для чувствительных к стоимости или работающих в реальном времени приложений.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию. Максимальный размер выходной генерации для модели: 128000 токенов
Google: Gemini 2.5 Pro (vision-версия)
Gemini 2.5 Pro — это передовая ИИ-модель Google, разработанная для решения сложных задач в области рассуждений, программирования, математики и науки. Она использует возможности "мышления", что позволяет ей формулировать ответы с повышенной точностью и учетом нюансов контекста.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
До выдачи результатов по API модель размышляет над ответом. Это стоит довольно много токенов, но не показывается в ответе.
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
В случае, если в процессе рассуждения достигнут лимит Макс токенов выхода, будет выдан пустой ответ - но он будет тарифицирован.
Также мы рекомендуем указывать повышенное время timeout, если вы используете API - модель может думать иногда 10 минут и более на сложных задачах.
Минимальный баланс для вызова модели: 30р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Google: Gemini 2.5 Flash (vision-версия)
Gemini 2.5 Flash — передовая рабочая модель Google, специально разработанная для сложных задач рассуждения, программирования, математики и научных исследований. Она включает встроенные возможности "размышления", позволяющие предоставлять ответы с большей точностью и нюансированной обработкой контекста.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 20р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Google: Gemini 2.5 Pro Preview (5 июня, vision-версия)
Gemini 2.5 Pro — это передовая ИИ-модель Google, разработанная для решения сложных задач в области рассуждений, программирования, математики и науки. Она использует возможности "мышления", что позволяет ей формулировать ответы с повышенной точностью и учетом нюансов контекста.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
До выдачи результатов по API модель размышляет над ответом. Это стоит довольно много токенов, но не показывается в ответе.
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
В случае, если в процессе рассуждения достигнут лимит Макс токенов выхода, будет выдан пустой ответ - но он будет тарифицирован.
Также мы рекомендуем указывать повышенное время timeout, если вы используете API - модель может думать иногда 10 минут и более на сложных задачах.
Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Google: Gemini 2.5 Flash Preview 05 20 (vision-версия) (с 16 июля перенаправляется в 2.5 Flash)
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для сложных задач рассуждения, программирования, математики и научных исследований. Она включает встроенные возможности "мышления", позволяющие ей предоставлять ответы с большей точностью и учитывать нюансы контекста.
Примечание: Эта модель доступна в двух вариантах: с мышлением и без мышления. Стоимость выходных данных значительно варьируется в зависимости от того, активна ли функция мышления.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 4р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
OpenAI: o4-mini (vision-версия)
ОБЩЕЕ ОПИСАНИЕ:
OpenAI o4-mini — это компактная модель рассуждения в o-серии, оптимизированная для быстрой и экономичной производительности, сохраняющая при этом сильные мультимодальные и агентные возможности. Она поддерживает использование инструментов и демонстрирует конкурентоспособные показатели в рассуждениях и программировании по таким критериям, как AIME (99,5% с Python) и SWE-bench, превосходя своего предшественника o3-mini и даже приближаясь к o3 в некоторых областях.
Несмотря на свой меньший размер, o4-mini демонстрирует высокую точность в задачах STEM, решении визуальных проблем (например, MathVista, MMMU) и редактировании кода. Она особенно хорошо подходит для сценариев с высокой пропускной способностью, где критичны задержки или стоимость. Благодаря эффективной архитектуре и усовершенствованному обучению с подкреплением, o4-mini может связывать инструменты, генерировать структурированные выходные данные и решать многоэтапные задачи с минимальной задержкой — часто менее чем за минуту.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
До выдачи результатов по API модель размышляет над ответом. Это стоит довольно много токенов, но не показывается в ответе.
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
В случае, если в процессе рассуждения достигнут лимит Макс токенов выхода, будет выдан пустой ответ - но он будет тарифицирован.
Также мы рекомендуем указывать повышенное время timeout, если вы используете API - модель может думать иногда 10 минут и более на сложных задачах.
ВРЕМЕННО:
- не работает со стримингом. Т.е. недоступна через обычный чат, но можно воспользоваться специальным в Сервисах. Минимальный баланс для вызова модели: 20р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Google: Gemini 2.5 Flash Preview (vision-версия) (с 16 июля перенаправляется в 2.5 Flash)
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для сложных задач рассуждения, программирования, математики и научных исследований. Она включает встроенные возможности "мышления", позволяющие ей предоставлять ответы с большей точностью и учитывать нюансы контекста.
Примечание: Эта модель доступна в двух вариантах: с мышлением и без мышления. Стоимость выходных данных значительно варьируется в зависимости от того, активна ли функция мышления.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 4р. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Anthropic: Claude 3.7 Sonnet (thinking, vision)
Вариант Claude 3.7 Sonnet Thinking для обработки изображений
Обращаем внимание - чтобы модель раздумывала перед ответом, установите большой бюджет ответа в max_tokens!
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 50р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
Llama 4 Scout (быстрая, Vision-версия)
Llama 4 Scout 17B Instruct (16E) - vision-версия
Для запуска используется сет провайдеров:
- Быстрый инференс (до 400 токенов в секунду) предоставляется, если вход не превышает 128К токенов, а требуемый выход - 8К токенов
- В противном случае используются дополнительные провайдеры, которые могут обрабатывать вход и выход вплоть до 328К токенов
Поддержка tools не декларировалась официально, но присутствует.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 3р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
Llama 4 Maverick (Vision-версия)
Llama 4 Maverick 17B Instruct (128E) - версия для работы с изображениями.
Поддержка tools не декларировалась официально, но присутствует.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 10р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Gemma 3 27B (опенсорс, vision-версия)
Gemma 3 27B, vision-версия
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 1р.
Anthropic: Claude 3.7 Sonnet (vision)
Вариант Claude 3.7 Sonnet для обработки изображений
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 50р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
Google: Gemini Flash 2.0 (vision-версия)
Google: Gemini Flash 2.0
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 1р.
Qwen2.5 VL 72B Instruct
Qwen2.5 VL 72B - это мультимодальная LLM от команды Qwen.
Qwen2.5-VL искусно распознает обычные объекты, такие как цветы, птицы, рыбы и насекомые. Он также весьма способен анализировать тексты, диаграммы, значки, графику и макеты внутри изображений.
Использование этой модели регулируется ЛИЦЕНЗИОННЫМ СОГЛАШЕНИЕМ Tongyi Qianwen.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 30р.
Llama 3.2 11B Vision Instruct
Llama 3.2 11B Vision - это мультимодальная модель с 11 миллиардами параметров, разработанная для решения задач, сочетающих визуальные и текстовые данные. Она отлично справляется с такими задачами, как подписи к изображениям и визуальные вопросы и ответы, преодолевая разрыв между генерацией языка и визуальным рассуждением. Предварительно обученная на огромном наборе данных пар изображений и текста, она хорошо работает в сложном, высокоточном анализе изображений.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 10р.
Qwen2-VL 72B Instruct
Qwen2 VL 72B - это мультимодальная LLM от команды Qwen со следующими ключевыми улучшениями:
Передовое понимание изображений различного разрешения и соотношения сторон: Qwen2-VL достигает наилучших результатов в тестах на визуальное понимание, включая MathVista, DocVQA, RealWorldQA, MTVQA и др.
Агент, способный управлять вашими мобильными устройствами, роботами и т.д.: благодаря способностям к сложным рассуждениям и принятию решений, Qwen2-VL может быть интегрирован с такими устройствами, как мобильные телефоны, роботы и т.д., для автоматического управления на основе визуальной среды и текстовых инструкций.
Многоязычная поддержка: для обслуживания глобальных пользователей, помимо английского и китайского, Qwen2-VL теперь поддерживает понимание текстов на разных языках внутри изображений, включая большинство европейских языков, японский, корейский, арабский, вьетнамский и др.
Использование этой модели регулируется ЛИЦЕНЗИОННЫМ СОГЛАШЕНИЕМ Tongyi Qianwen.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 30р.
OpenAI: GPT-4o (2024-08-06) (vision-версия)
Multimodal-версия OpenAI: GPT-4o
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 10р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию. Поддерживает вызов structure outputs в стандартном OpenAI формате, см. Документацию.
Google: Gemini Flash 1.5 (vision-версия) (выключена, перенаправляется в vis-Flash 2.5)
Google: Gemini Flash 1.5
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 1р.
OpenAI: GPT-4o (vision)
Multimodal-версия OpenAI: GPT-4o
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 10р.
OpenAI: GPT-4 Vision Turbo
Новейшая модель GPT-4 Turbo с возможностями машинного зрения. Запросы Vision теперь могут использовать режим JSON и вызов функций. Данные обучения: до декабря 2023 г.
Эта модель обновлена OpenAI, чтобы указать на последнюю версию GPT-4 Turbo , в настоящее время gpt-4-turbo-2024-04-09 (по состоянию на апрель 2024 г.).
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 50р.
Anthropic: Claude 3 Haiku (vision)
Vision-вариант Haiku
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 10р. Поддерживает вызов tools в стандартном OpenAI формате, см. Документацию.
Qwen: Qwen-VL-Max
Усовершенствованная большая визуально-языковая модель Qwen.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.
Минимальный баланс для вызова модели: 5р.
Qwen: Qwen-VL-Plus
Усовершенствованная большая визуально-языковая модель Qwen. Значительно улучшена для возможностей детального распознавания и способностей распознавания текста, поддерживает сверхвысокие разрешения пикселей до миллионов пикселей и экстремальные соотношения сторон для ввода изображений. Обеспечивает значительную производительность в широком спектре визуальных задач.
ОСОБЕННОСТИ БИЛЛИНГА И ВЫЗОВА:
Биллинг осуществляется по данным провайдера - сколько токенов было затрачено на вход и выход, в соответствии с этим идет тарификация. Мы не комментируем и не принимаем претензии, связанные с вычислением токенов у провайдера.