Speech-To-Text-модели (распознавание речи)


Предназначены для распознавания речи.
 
Временные особенности:
  • Токен = 1 секунде; приведена цена за 1000 токенов. Округление секунд идет в большую сторону.
  • Пример вызова по API есть в Документации API.
  • Также есть клиент для тестирования распознавания – доступен на странице Инструменты либо через меню.

Модель и IDРуб за 1000 символов
входных данных
Руб за 1000 символов
генерации модели
Размер конте
кста
Дата обнов
ления
Авто
моде
ра
ция
OpenAI: gpt-4o-transcribe ?
stt-openai/gpt-4o-transcribe
Профессиональный 1.92 р за минуту
32.000.00200026 мар 25нет
OpenAI: gpt-4o-mini-transcribe ?
stt-openai/gpt-4o-mini-transcribe
0.96 р за минуту
16.000.00200022 мар 25нет
OpenAI: Whisper (v3, сторонний провайдер, тест) ?
stt-openai/whisper-v3
0.90 р за минуту
15.000.00200028 июн 24нет
OpenAI: Whisper v3 Turbo ?
stt-openai/whisper-v3-turbo
0.72 р за минуту
12.000.0020001 мар 25нет
OpenAI: Whisper (v3, сторонний провайдер, тест) ?
stt-openai/whisper-1
0.90 р за минуту
15.000.00200028 июн 24нет