VseGPT : Vision-модели (вопросы по изображению, OCR)

Модели По новизне Документация API Статистика

Vision-модели (вопросы по изображению, OCR)

Предназначены для совместной обработки текста и изображений.
(Также модели, поддерживающие vision по API представлены в общем списке текстовых моделей с тегом vision

Временные особенности:

Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Anthropic: Claude Opus 4.6 (Vision-версия) ? `vis-anthropic/claude-opus-4.6` Профессиональный (не Тестовый) tools structured-outputs	1.2	6.7	1000000	27 мар	да
Anthropic: Claude Sonnet 4.6 (Vision-версия) ? `vis-anthropic/claude-sonnet-4.6` Профессиональный (не Тестовый) tools structured-outputs	0.8	4.0	1000000	27 мар	да
Google: Gemini 3 Flash Preview (Thinking) (Vision) ? `vis-google/gemini-3-flash-pre-thinking` Базовый и выше (не Тестовый) около 0.15 р. за изображение tools structured-outputs	0.15	0.90	1000000	11 янв	нет
Google: Gemini 3 Flash Preview (Vision-версия) ? `vis-google/gemini-3-flash-pre` Базовый и выше (не Тестовый) около 0.15 р. за изображение tools structured-outputs	0.15	0.90	1000000	11 янв	нет
Z.AI: GLM 4.5V (MoE 106B всего, 12B активных) ? `vis-z-ai/glm-4.5v` Профессиональный (не Тестовый) около 0.20 р. за изображение tools	0.18	0.54	65000	29 авг 25	нет
Mistral: Mistral Medium 3.1 (Vision-версия) ? `vis-mistralai/mistral-medium-3.1` Профессиональный (не Тестовый) около 0.12 р. за изображение tools structured-outputs	0.12	0.60	131000	29 авг 25	нет
Anthropic: Claude Opus 4.1 (Vision-версия) ? `vis-anthropic/claude-opus-4.1` Профессиональный (не Тестовый) ТОП! около 5 р. за изображение tools	4.5	21.0	200000	29 авг 25	да
Anthropic: Claude Sonnet 4 (Vision-версия) ? `vis-anthropic/claude-sonnet-4` Профессиональный (не Тестовый) около 1.3 р. за изображение tools	1.1	6.0	1000000	29 авг 25	да
OpenAI: GPT-5 (Thinking) (Vision-версия) ? `vis-openai/gpt-5` Профессиональный (не Тестовый) топ около 0.30 р. за изображение tools structured-outputs	0.37	3.00	400000	29 авг 25	да
OpenAI: GPT-5 Chat (Vision-версия) ? `vis-openai/gpt-5-chat` Профессиональный (не Тестовый) около 0.30 р. за изображение	0.37	3.00	400000	29 авг 25	да
OpenAI: GPT-5 Thinking Mini (Vision-версия) ? `vis-openai/gpt-5-mini` Профессиональный (не Тестовый) около 0.20 р. за изображение tools structured-outputs	0.075	0.60	400000	29 авг 25	да
OpenAI: GPT-5 Nano (Vision-версия) ? `vis-openai/gpt-5-nano` Профессиональный (не Тестовый) дешевая и с большим контекстом около 0.07 р. за изображение tools structured-outputs	0.015	0.12	400000	29 авг 25	да
Google: Gemini 2.5 Pro (vision-версия) ? `vis-google/gemini-2.5-pro` Профессиональный tools structured-outputs	0.37	3.0	1000000	17 июн 25	нет
Google: Gemini 2.5 Flash (vision-версия) ? `vis-google/gemini-2.5-flash` tools structured-outputs	0.09	0.75	1000000	17 июн 25	нет
Google: Gemini 2.5 Pro Preview (5 июня, vision-версия) ? `vis-google/gemini-2.5-pro-preview` Профессиональный (не Тестовый) около 0.6 р за изображение tools structured-outputs	0.37	3.0	1000000	10 июн 25	нет
Google: Gemini 2.5 Flash Preview 05 20 (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? `vis-google/gemini-2.5-flash-pre-05-20` дешевая и с большим контекстом около 0.05 р. за изображение tools structured-outputs	0.045	0.15	1000000	20 мая 25	нет
OpenAI: o4-mini (vision-версия) ? `vis-openai/o4-mini` Профессиональный (не Тестовый) биллинг с учетом размышлений (см. ?) около 0.80 р. за изображение размышления, математика tools structured-outputs	0.28	1.12	200000	16 апр 25	да
Google: Gemini 2.5 Flash Preview (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? `vis-google/gemini-2.5-flash-pre` дешевая и с большим контекстом около 0.05 р. за изображение structured-outputs	0.045	0.15	1000000	18 апр 25	нет
Anthropic: Claude 3.7 Sonnet (thinking, vision) ? `vis-anthropic/claude-3.7-sonnet-thinking` Профессиональный (не Тестовый) около 1.0 р за изображение tools	0.8	4.0	200000	10 апр 25	да
Llama 4 Scout (быстрая, Vision-версия) ? `vis-meta-llama/llama-4-scout` fast около 0.09-0.20 р за изображение tools	0.05	0.16	328000	10 апр 25	нет
Llama 4 Maverick (Vision-версия) ? `vis-meta-llama/llama-4-maverick` Профессиональный около 0.14-0.35 р. за изображение tools structured-outputs	0.06	0.24	1000000	10 апр 25	нет
Gemma 3 27B (опенсорс, vision-версия) ? `vis-google/gemma-3-27b-it` 0.04 р. за изображение	0.07	0.16	128000	19 мар 25	нет
Qwen2.5 VL 72B Instruct ? `vis-qwen/qwen2.5-vl-72b-instruct` Профессиональный За вызов: 0.07 р. топ! около 0.30 р. за изображение	0.30	0.30	32768	19 мар 25	нет
Llama 3.2 11B Vision Instruct ? `vis-meta-llama/llama-3.2-11b-vision-instruct` Базовый и выше (не Тестовый) За вызов: 0.02 р. около 0.03 р. за изображение	0.055	0.055	128000	26 сен 24	нет
Qwen2-VL 72B Instruct ? `vis-qwen/qwen-2-vl-72b-instruct` Профессиональный За вызов: 0.07 р. топ! около 0.05 р. за изображение	0.60	0.60	32768	21 сен 24	нет
OpenAI: GPT-4o (2024-08-06) (vision-версия) ? `vis-openai/gpt-4o-2024-08-06` Профессиональный топ! около 0.15 р. за изображение tools structured-outputs	0.55	2.20	128000	6 авг 24	да
OpenAI: gpt-4o-mini (vision-версия) `vis-openai/gpt-4o-mini` Профессиональный (не Тестовый) около 0.80 р. за изображение	0.037	0.15	128000	27 июл 24	да
Google: Gemini Flash 1.5 (vision-версия) (выключена, перенаправляется в vis-Flash 2.5) ? `vis-google/gemini-flash-1.5` Профессиональный очень дешевая 0.03 р. за изображение	0.045	0.10	1000000	14 авг 24	нет
OpenAI: GPT-4o (vision) ? `vis-openai/gpt-4o` Профессиональный топ!	1.10	3.30	128000	31 мая 24	да
OpenAI: GPT-4 Vision Turbo ? `vis-openai/gpt-4-turbo` Профессиональный топ! около 1.7 р. за 1 изображение	2.00	6.00	128000	27 апр 24	да
Anthropic: Claude 3 Haiku (vision) ? `vis-anthropic/claude-3-haiku` Профессиональный около 0.1 р за 1 изображение tools	0.066	0.3	200000	14 мар 24	да
Qwen: Qwen-VL-Max ? `vis-qwen/qwen-vl-max` Профессиональный 0.40 р. за изображение	0.28	1.20	128000	19 мар 25	нет
Qwen: Qwen-VL-Plus ? `vis-qwen/qwen-vl-plus` 0.08 р. за изображение	0.07	0.20	128000	19 мар 25	нет