Vision-модели (вопросы по изображению, OCR)
Предназначены для совместной обработки текста и изображений.
Временные особенности:
Временные особенности:
- Для запуска любого запроса вам нужно иметь определенный минимум на балансе (нажмите ? чтобы узнать, какой именно минимум, от 5 р. для LLava до 50 р. для GPT-4-Vision)
- Стоимость приведена «за токен», а не «за символ». По результатам запроса провайдером будут переведены ваши изображения в стоимость входных токенов, и за них будет взята плата.
- Токены вычисляются провайдером; мы не комментируем их вычисления и не принимаем по этому поводу претензии.
- Пример вызова по API есть в Документации API; веб-интерфейс доступен через меню «Сервисы».
| Google: Gemini 3 Flash Preview (Thinking) (Vision) ? vis-google/gemini-3-flash-pre-thinking Базовый и выше (не Тестовый) около 0.15 р. за изображение tools structured-outputs | 0.15 | 0.90 | 1000000 | 11 янв | нет |
| Google: Gemini 3 Flash Preview (Vision-версия) ? vis-google/gemini-3-flash-pre Базовый и выше (не Тестовый) около 0.15 р. за изображение tools structured-outputs | 0.15 | 0.90 | 1000000 | 11 янв | нет |
| Z.AI: GLM 4.5V (MoE 106B всего, 12B активных) ? vis-z-ai/glm-4.5v Профессиональный (не Тестовый) около 0.20 р. за изображение tools | 0.18 | 0.54 | 65000 | 29 авг 25 | нет |
| Mistral: Mistral Medium 3.1 (Vision-версия) ? vis-mistralai/mistral-medium-3.1 Профессиональный (не Тестовый) около 0.12 р. за изображение tools structured-outputs | 0.12 | 0.60 | 131000 | 29 авг 25 | нет |
| Anthropic: Claude Opus 4.1 (Vision-версия) ? vis-anthropic/claude-opus-4.1 Профессиональный (не Тестовый) ТОП! около 5 р. за изображение tools | 4.5 | 21.0 | 200000 | 29 авг 25 | да |
| Anthropic: Claude Sonnet 4 (Vision-версия) ? vis-anthropic/claude-sonnet-4 Профессиональный (не Тестовый) около 1.3 р. за изображение tools | 1.1 | 6.0 | 1000000 | 29 авг 25 | да |
| OpenAI: GPT-5 (Thinking) (Vision-версия) ? vis-openai/gpt-5 Профессиональный (не Тестовый) топ около 0.30 р. за изображение tools structured-outputs | 0.37 | 3.00 | 400000 | 29 авг 25 | да |
| OpenAI: GPT-5 Chat (Vision-версия) ? vis-openai/gpt-5-chat Профессиональный (не Тестовый) около 0.30 р. за изображение | 0.37 | 3.00 | 400000 | 29 авг 25 | да |
| OpenAI: GPT-5 Thinking Mini (Vision-версия) ? vis-openai/gpt-5-mini Профессиональный (не Тестовый) около 0.20 р. за изображение tools structured-outputs | 0.075 | 0.60 | 400000 | 29 авг 25 | да |
| OpenAI: GPT-5 Nano (Vision-версия) ? vis-openai/gpt-5-nano Профессиональный (не Тестовый) дешевая и с большим контекстом около 0.07 р. за изображение tools structured-outputs | 0.015 | 0.12 | 400000 | 29 авг 25 | да |
| Google: Gemini 2.5 Pro (vision-версия) ? vis-google/gemini-2.5-pro Профессиональный tools structured-outputs | 0.37 | 3.0 | 1000000 | 17 июн 25 | нет |
| Google: Gemini 2.5 Flash (vision-версия) ? vis-google/gemini-2.5-flash tools structured-outputs | 0.09 | 0.75 | 1000000 | 17 июн 25 | нет |
| Google: Gemini 2.5 Pro Preview (5 июня, vision-версия) ? vis-google/gemini-2.5-pro-preview Профессиональный (не Тестовый) около 0.6 р за изображение tools structured-outputs | 0.37 | 3.0 | 1000000 | 10 июн 25 | нет |
| Google: Gemini 2.5 Flash Preview 05 20 (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? vis-google/gemini-2.5-flash-pre-05-20 дешевая и с большим контекстом около 0.05 р. за изображение tools structured-outputs | 0.045 | 0.15 | 1000000 | 20 мая 25 | нет |
| OpenAI: o4-mini (vision-версия) ? vis-openai/o4-mini Профессиональный (не Тестовый) биллинг с учетом размышлений (см. ?) около 0.80 р. за изображение размышления, математика tools structured-outputs | 0.28 | 1.12 | 200000 | 16 апр 25 | да |
| Google: Gemini 2.5 Flash Preview (vision-версия) (с 16 июля перенаправляется в 2.5 Flash) ? vis-google/gemini-2.5-flash-pre дешевая и с большим контекстом около 0.05 р. за изображение structured-outputs | 0.045 | 0.15 | 1000000 | 18 апр 25 | нет |
| Anthropic: Claude 3.7 Sonnet (thinking, vision) ? vis-anthropic/claude-3.7-sonnet-thinking Профессиональный (не Тестовый) около 1.0 р за изображение tools | 0.8 | 4.0 | 200000 | 10 апр 25 | да |
| Llama 4 Scout (быстрая, Vision-версия) ? vis-meta-llama/llama-4-scout fast около 0.09-0.20 р за изображение tools | 0.05 | 0.16 | 328000 | 10 апр 25 | нет |
| Llama 4 Maverick (Vision-версия) ? vis-meta-llama/llama-4-maverick Профессиональный около 0.14-0.35 р. за изображение tools structured-outputs | 0.06 | 0.24 | 1000000 | 10 апр 25 | нет |
| Llama 3.2 90B Vision Instruct (structured outputs) (бета-тестирование) ? vis-meta-llama/llama-3.2-90b-vision-structured Базовый и выше (не Тестовый) За вызов: 0.03 р. около 1.8 р. за изображение structured-outputs | 0.30 | 0.30 | 128000 | 26 сен 24 | нет |
| Gemma 3 27B (опенсорс, vision-версия) ? vis-google/gemma-3-27b-it 0.04 р. за изображение | 0.07 | 0.16 | 128000 | 19 мар 25 | нет |
| Mistral: Mistral Small 3.1 24B (vision-версия) ? vis-mistralai/mistral-small-3.1-24b-instruct 0.05 р. за изображение | 0.05 | 0.10 | 128000 | 19 мар 25 | нет |
| Anthropic: Claude 3.7 Sonnet (vision) ? vis-anthropic/claude-3.7-sonnet Профессиональный около 1.0 р. за изображение tools | 0.8 | 4.0 | 200000 | 19 мар 25 | да |
| Google: Gemini Flash 2.0 (vision-версия) ? vis-google/gemini-2.0-flash-001 Профессиональный очень дешевая 0.06 р. за изображение | 0.05 | 0.12 | 1000000 | 19 мар 25 | нет |
| Qwen2.5 VL 72B Instruct ? vis-qwen/qwen2.5-vl-72b-instruct Профессиональный За вызов: 0.07 р. топ! около 0.30 р. за изображение | 0.30 | 0.30 | 32768 | 19 мар 25 | нет |
| Llama 3.2 90B Vision Instruct ? vis-meta-llama/llama-3.2-90b-vision-instruct Базовый и выше (не Тестовый) За вызов: 0.03 р. около 0.04 р. за изображение | 0.22 | 0.22 | 128000 | 26 сен 24 | нет |
| Llama 3.2 11B Vision Instruct ? vis-meta-llama/llama-3.2-11b-vision-instruct Базовый и выше (не Тестовый) За вызов: 0.02 р. около 0.03 р. за изображение | 0.055 | 0.055 | 128000 | 26 сен 24 | нет |
| Mistral: Pixtral 12B ? vis-mistralai/pixtral-12b За вызов: 0.05 р. около 0.2 р. за изображение | 0.08 | 0.08 | 4096 | 21 сен 24 | нет |
| Qwen2-VL 72B Instruct ? vis-qwen/qwen-2-vl-72b-instruct Профессиональный За вызов: 0.07 р. топ! около 0.05 р. за изображение | 0.60 | 0.60 | 32768 | 21 сен 24 | нет |
| OpenAI: GPT-4o (2024-08-06) (vision-версия) ? vis-openai/gpt-4o-2024-08-06 Профессиональный топ! около 0.15 р. за изображение tools structured-outputs | 0.55 | 2.20 | 128000 | 6 авг 24 | да |
| OpenAI: gpt-4o-mini (vision-версия) vis-openai/gpt-4o-mini Профессиональный (не Тестовый) около 0.80 р. за изображение | 0.037 | 0.15 | 128000 | 27 июл 24 | да |
| Anthropic: Claude 3.5 Sonnet (vision) (новая от 22 октября) ? vis-anthropic/claude-3.5-sonnet Профессиональный около 0.7 р. за изображение tools | 0.6 | 3.0 | 200000 | 22 окт 24 | да |
| Google: Gemini Flash 1.5 (vision-версия) (выключена, перенаправляется в vis-Flash 2.5) ? vis-google/gemini-flash-1.5 Профессиональный очень дешевая 0.03 р. за изображение | 0.045 | 0.10 | 1000000 | 14 авг 24 | нет |
| OpenAI: GPT-4o (vision) ? vis-openai/gpt-4o Профессиональный топ! | 1.10 | 3.30 | 128000 | 31 мая 24 | да |
| OpenAI: GPT-4 Vision Turbo ? vis-openai/gpt-4-turbo Профессиональный топ! около 1.7 р. за 1 изображение | 2.00 | 6.00 | 128000 | 27 апр 24 | да |
| Anthropic: Claude 3 Haiku (vision) ? vis-anthropic/claude-3-haiku Профессиональный около 0.1 р за 1 изображение tools | 0.066 | 0.3 | 200000 | 14 мар 24 | да |
| Anthropic: Claude 3 Opus (vision) ? vis-anthropic/claude-3-opus Профессиональный около 3.3 р. за изображение | 3.0 | 15.0 | 200000 | 5 мар 24 | да |
| Qwen: Qwen-VL-Max ? vis-qwen/qwen-vl-max Профессиональный 0.40 р. за изображение | 0.28 | 1.20 | 128000 | 19 мар 25 | нет |
| Qwen: Qwen-VL-Plus ? vis-qwen/qwen-vl-plus 0.08 р. за изображение | 0.07 | 0.20 | 128000 | 19 мар 25 | нет |