Vision-модели (вопросы по изображению, OCR)


Предназначены для совместной обработки текста и изображений.
 
Временные особенности:
  • Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
  • Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
  • Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
  • Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».

Google: Gemini 3 Flash Preview (Thinking) (Vision) ?
vis-google/gemini-3-flash-pre-thinking
Базовый и выше (не Тестовый) около 0.15 р. за изображение tools structured-outputs
0.150.90100000011 янвнет
Google: Gemini 3 Flash Preview (Vision-версия) ?
vis-google/gemini-3-flash-pre
Базовый и выше (не Тестовый) около 0.15 р. за изображение tools structured-outputs
0.150.90100000011 янвнет
Z.AI: GLM 4.5V (MoE 106B всего, 12B активных) ?
vis-z-ai/glm-4.5v
Профессиональный (не Тестовый) около 0.20 р. за изображение tools
0.180.546500029 авг 25нет
Mistral: Mistral Medium 3.1 (Vision-версия) ?
vis-mistralai/mistral-medium-3.1
Профессиональный (не Тестовый) около 0.12 р. за изображение tools structured-outputs
0.120.6013100029 авг 25нет
Anthropic: Claude Opus 4.1 (Vision-версия) ?
vis-anthropic/claude-opus-4.1
Профессиональный (не Тестовый) ТОП! около 5 р. за изображение tools
4.521.020000029 авг 25да
Anthropic: Claude Sonnet 4 (Vision-версия) ?
vis-anthropic/claude-sonnet-4
Профессиональный (не Тестовый) около 1.3 р. за изображение tools
1.16.0100000029 авг 25да
OpenAI: GPT-5 (Thinking) (Vision-версия) ?
vis-openai/gpt-5
Профессиональный (не Тестовый) топ около 0.30 р. за изображение tools structured-outputs
0.373.0040000029 авг 25да
OpenAI: GPT-5 Chat (Vision-версия) ?
vis-openai/gpt-5-chat
Профессиональный (не Тестовый) около 0.30 р. за изображение
0.373.0040000029 авг 25да
OpenAI: GPT-5 Thinking Mini (Vision-версия) ?
vis-openai/gpt-5-mini
Профессиональный (не Тестовый) около 0.20 р. за изображение tools structured-outputs
0.0750.6040000029 авг 25да
OpenAI: GPT-5 Nano (Vision-версия) ?
vis-openai/gpt-5-nano
Профессиональный (не Тестовый) дешевая и с большим контекстом около 0.07 р. за изображение tools structured-outputs
0.0150.1240000029 авг 25да
Google: Gemini 2.5 Pro (vision-версия) ?
vis-google/gemini-2.5-pro
Профессиональный tools structured-outputs
0.373.0100000017 июн 25нет
Google: Gemini 2.5 Flash (vision-версия) ?
vis-google/gemini-2.5-flash
tools structured-outputs
0.090.75100000017 июн 25нет
Google: Gemini 2.5 Pro Preview (5 июня, vision-версия) ?
vis-google/gemini-2.5-pro-preview
Профессиональный (не Тестовый) около 0.6 р за изображение tools structured-outputs
0.373.0100000010 июн 25нет
Google: Gemini 2.5 Flash Preview 05 20 (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ?
vis-google/gemini-2.5-flash-pre-05-20
дешевая и с большим контекстом около 0.05 р. за изображение tools structured-outputs
0.0450.15100000020 мая 25нет
OpenAI: o4-mini (vision-версия) ?
vis-openai/o4-mini
Профессиональный (не Тестовый) биллинг с учетом размышлений (см. ?) около 0.80 р. за изображение размышления, математика tools structured-outputs
0.281.1220000016 апр 25да
Google: Gemini 2.5 Flash Preview (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ?
vis-google/gemini-2.5-flash-pre
дешевая и с большим контекстом около 0.05 р. за изображение structured-outputs
0.0450.15100000018 апр 25нет
Anthropic: Claude 3.7 Sonnet (thinking, vision) ?
vis-anthropic/claude-3.7-sonnet-thinking
Профессиональный (не Тестовый) около 1.0 р за изображение tools
0.84.020000010 апр 25да
Llama 4 Scout (быстрая, Vision-версия) ?
vis-meta-llama/llama-4-scout
fast около 0.09-0.20 р за изображение tools
0.050.1632800010 апр 25нет
Llama 4 Maverick (Vision-версия) ?
vis-meta-llama/llama-4-maverick
Профессиональный около 0.14-0.35 р. за изображение tools structured-outputs
0.060.24100000010 апр 25нет
Llama 3.2 90B Vision Instruct (structured outputs) (бета-тестирование) ?
vis-meta-llama/llama-3.2-90b-vision-structured
Базовый и выше (не Тестовый) За вызов: 0.03 р. около 1.8 р. за изображение structured-outputs
0.300.3012800026 сен 24нет
Gemma 3 27B (опенсорс, vision-версия) ?
vis-google/gemma-3-27b-it
0.04 р. за изображение
0.070.1612800019 мар 25нет
Mistral: Mistral Small 3.1 24B (vision-версия) ?
vis-mistralai/mistral-small-3.1-24b-instruct
0.05 р. за изображение
0.050.1012800019 мар 25нет
Anthropic: Claude 3.7 Sonnet (vision) ?
vis-anthropic/claude-3.7-sonnet
Профессиональный около 1.0 р. за изображение tools
0.84.020000019 мар 25да
Google: Gemini Flash 2.0 (vision-версия) ?
vis-google/gemini-2.0-flash-001
Профессиональный очень дешевая 0.06 р. за изображение
0.050.12100000019 мар 25нет
Qwen2.5 VL 72B Instruct ?
vis-qwen/qwen2.5-vl-72b-instruct
Профессиональный За вызов: 0.07 р. топ! около 0.30 р. за изображение
0.300.303276819 мар 25нет
Llama 3.2 90B Vision Instruct ?
vis-meta-llama/llama-3.2-90b-vision-instruct
Базовый и выше (не Тестовый) За вызов: 0.03 р. около 0.04 р. за изображение
0.220.2212800026 сен 24нет
Llama 3.2 11B Vision Instruct ?
vis-meta-llama/llama-3.2-11b-vision-instruct
Базовый и выше (не Тестовый) За вызов: 0.02 р. около 0.03 р. за изображение
0.0550.05512800026 сен 24нет
Mistral: Pixtral 12B ?
vis-mistralai/pixtral-12b
За вызов: 0.05 р. около 0.2 р. за изображение
0.080.08409621 сен 24нет
Qwen2-VL 72B Instruct ?
vis-qwen/qwen-2-vl-72b-instruct
Профессиональный За вызов: 0.07 р. топ! около 0.05 р. за изображение
0.600.603276821 сен 24нет
OpenAI: GPT-4o (2024-08-06) (vision-версия) ?
vis-openai/gpt-4o-2024-08-06
Профессиональный топ! около 0.15 р. за изображение tools structured-outputs
0.552.201280006 авг 24да
OpenAI: gpt-4o-mini (vision-версия)
vis-openai/gpt-4o-mini
Профессиональный (не Тестовый) около 0.80 р. за изображение
0.0370.1512800027 июл 24да
Anthropic: Claude 3.5 Sonnet (vision) (новая от 22 октября) ?
vis-anthropic/claude-3.5-sonnet
Профессиональный около 0.7 р. за изображение tools
0.63.020000022 окт 24да
Google: Gemini Flash 1.5 (vision-версия) (выключена, перенаправляется в vis-Flash 2.5) ?
vis-google/gemini-flash-1.5
Профессиональный очень дешевая 0.03 р. за изображение
0.0450.10100000014 авг 24нет
OpenAI: GPT-4o (vision) ?
vis-openai/gpt-4o
Профессиональный топ!
1.103.3012800031 мая 24да
OpenAI: GPT-4 Vision Turbo ?
vis-openai/gpt-4-turbo
Профессиональный топ! около 1.7 р. за 1 изображение
2.006.0012800027 апр 24да
Anthropic: Claude 3 Haiku (vision) ?
vis-anthropic/claude-3-haiku
Профессиональный около 0.1 р за 1 изображение tools
0.0660.320000014 мар 24да
Anthropic: Claude 3 Opus (vision) ?
vis-anthropic/claude-3-opus
Профессиональный около 3.3 р. за изображение
3.015.02000005 мар 24да
Qwen: Qwen-VL-Max ?
vis-qwen/qwen-vl-max
Профессиональный 0.40 р. за изображение
0.281.2012800019 мар 25нет
Qwen: Qwen-VL-Plus ?
vis-qwen/qwen-vl-plus
0.08 р. за изображение
0.070.2012800019 мар 25нет