Старые новости по подключенным моделям



2025 г


  • 18 ноября, Gemini 3.0 Pro Preview от Google, в течение 3 часов после публикации.
  • 14 ноября, GPT-5.1 от OpenAI.
  • 6 ноября, Kimi K2 Thinking – в течение 2 часов после публикации. Опенсорс модель уровня GPT-5, согласно метрикам.
  • 4 ноября, Kling 2.5. Топовая модель генерации видео.
  • 4 ноября, Sora 2 от OpenAI. Топовая модель генерации видео.
  • 31 октября, Veo 3.1 Fast от Google. Топовая модель генерации видео.
  • 31 октября, Minimax M2 от Minimax. Топовая опенсорс модель.
  • 22 октября, Grok 4 Fast от xAI. Модель уровня GPT-5, но значительно быстрее и дешевле.
  • 22 октября, GPT 5 Pro от OpenAI. Самая дорогая и топовая модель.
  • 16 октября, Haiku 4.5 – обновленная модель от Anthropic. По метрикам сопоставима с более старой Sonnet 4, но дешевле её практически в 5 раз!
  • 29 сентября, Sonnet 4.5 – обновленная модель от Anthropic
  • 29 сентября, DeepSeek Chat 3.2 Exp – обновленная модель от DeepSeek со значительным понижением стоимости генерации
  • 22 сентября, DeepSeek Chat 3.1 Terminus – обновленная модель от DeepSeek
  • 11 сентября, Seedream 4.0 + Seedream 4.0 Edit Multi References – топовые модели генерации и редактирования изображений от Bytedance. Seedream 4.0 Edit Multi References хорошо справляется с примеркой одежды на модель.
  • 28 августа, Grok Code Fast 1 от xAI – топовая дешевая модель работы с кодом
  • 26 августа, Flash Image 2.5 + Flash Image 2.5 Edit – топовые модели генерации и редактирования изображений от Google.
  • 22 августа, DeepSeek Chat 3.1 и DeepSeek Chat 3.1 Thinking – обновленные модели от DeepSeek
  • 13 августа, Claude Sonnet 4 на 1 миллион контекста – подключили специальную точку, на которой доступен расширенный контекст до 1 миллиона токенов.
  • 7 августа, OpenAI GPT-5 Nano, Mini и Chat – новые модели стали доступны в течение 3 часов после запуска!
  • 7 августа, OpenAI GPT OSS 120B и 20B – модели доступны, в том числе в быстром варианте (скорость генерации 500–600 токенов в секунду!)
  • 7 августа, Claude Opus 4.1 – улучшенный вариант Opus 4.1. Доступен в режиме «с размышлениями» и «без размышлений».
  • 16 июля, Google отключила preview-версии Gemini 2.5 Flash. Мы сделали перенаправление в релизную версию 2.5 Fllash, но а) не везде, б) она дороже. Если вы пользовались этими моделями – поправьте свои настройки!
  • 15 июля, Llama 4 Scout на 10М контекста – уже вышедшая Scout, но с поставщиком, поддерживающим крупнейший в мире контекст этой модели – 10М токенов! Обычно книгу можно уложить в 1М токенов, так что тут модель может обработать целых 10 книг!
  • 12 июля, Kimi K2 – топовая китайская опенсорс модель размером в 1Т, которая соперничает с лучшими сетями типа Sonnet 4, OpenAI o3 по значительно более низкой цене
  • 10 июля, AI Transform – 14(!) нейросетей для разнообразных операций с изображениями: восстановление, смена стиля, смена фона, трансформация в профессиональное фото...
  • 10 июля, Grok 4 – самая свежая модель от xAI Илона Маска. Согласно бенчмаркам, обгоняет o3, Opus 4, Gemini 2.5 Pro.
  • 2 июля, Imagen 4 Fast, Imagen 4 Ultra – топовые модели генерации изображений от Google
  • 17 июня, Gemini Pro 2.5, Flash 2.5 – официальный выход 2.5 моделей от Google
  • 10 июня, OpenAI o3 – цены снижены на 80% вслед за OpenAI!
  • 5 июня, Gemini Pro 2.5 Preview – обновление топовой модели от Google
  • 2 июня, FLUX.1 Kontext Pro/Max – топовая нейросеть для генерации и редактирования изображений. Поддерживает: генерацию по тексту, редактирование изображения, генерацию по нескольким изображениям/референсам
  • 22 мая, Claude Sonnet 4 и Opus 4 от Anthropic – модели стали доступны в течение 2 часов после запуска!
  • 20 мая, Gemini Flash 2.5 Preview 05 20. Вышла на презентации Google IO, мы подключили в течение пары часов :)
  • 17 мая, LTX 0.9.7, генерация Image-To-Video и Text-to-Video, быстрая и дешевая
  • 16 мая, ряд нейросетей для редактирования изображений – Recraft Edit, Recraft Upscale, Colorization, Ideogram V3 Replace Background, Ideogram V3 Edit
  • 8 мая, Mistral Medium 3
  • 2 мая, модели генерации изображений Ideogram V3 и Recraft V3 (У Recraft V3 более 30 стилей генерации!)
  • 29 апреля, модели Qwen 3 от Alibaba
  • 18 апреля, Gemini Flash 2.5 от Google
  • 16 апреля, o4-mini от OpenAI – модели стали доступны в течение 1.5 часов после запуска!
  • 14 апреля, GPT 4.1 от OpenAI – модели стали доступны в течение 1.5 часов после запуска!
  • 7 апреля, Google Flash Edit – модель, позволяющая редактировать изображения по простому текстовому запросу.
  • 6 апреля, Gemini Pro 2.5 Preview – топ 1 модель по оценкам пользователей! Поддержка 1 млн токенов контекста!
  • 6 апреля, LLama 4 Scout и Maverick
  • 30 марта, PDF OCR 1.0 – модель для распознавания PDF в текст, включая графические PDF. Поддерживает PDF до 1000 страниц.
  • 26 марта, gpt-4o-mini-transcribe и gpt-4o-transcribe от OpenAI – новые модели распознавания речи-в-текст.
  • 22 марта, gpt-4o-mini-tts от OpenAI – новая качественная модель озвучки с возможностью задавать характер.
  • 19 марта, 7 новых vision-моделей – т.е. моделей для запросов по изображениям. Flash 2.0, Sonnet 3.7 в vision-вариантах, Mistral 24B, Gemma 27B, Qwen 2.5 72B, Qwen VL Plus, Qwen VL Max.
  • 10 марта – 4 research модели поверх Sonnet 3.7 – Online High Quality, Deep Online, Research, Deep Research для формирования полноценных исследований на 8–9 страниц A4! Подробнее о Research-моделях + примеры
  • 28 февраля, GPT-4.5 Preview от OpenAI уже доступна!
  • 26 февраля, Sonnet 3.7 c размышлениями доступна! Поддерживается 3 варианта модели, предлагающие разный бюджет на размышления: low, medium (по умолчанию), high. Модели полностью совместимы с обычным OpenAI API, доработок не требуется.
  • 25 февраля, новая Sonnet 3.7 – новая Sonnet 3.7 уже доступна на сервисе!
  • 14 февраля, версии модели OpenAI: o3-mini – o3-mini-high с предустановленным пресетом глубоких размышлений, и o3-mini-online с возможностью поиска в Интернете.
  • 5 февраля, Google Gemini Flash 2.0 – новая модель от Google!
  • 1 февраля, o3-mini от OpenAI уже доступна! (Также модель o1 возвращена на сервис после долгого отключения)
  • 1 февраля, Qwen Turbo, Plus, Max – доступны свежие модели от Alibaba group! Max по метрикам превосходят другие модели, включая западные (кроме рассуждающих)
  • 29 января, Deepseek R1 от Perplexity – R1 с онлайн-поиском информации!
  • 28 января, альтернативные провайдеры для Deepseek R1 и V3 – поскольку оригинальный DeepSeek сейчас находится под нагрузкой.
  • 25 января, серия online-моделей – теперь целый ряд моделей могут отвечать с учетом интернет-поиска, т.е. текущих данных. Доступны в онлайн-варианте: GPT-4o-mini, GPT-4o, Sonnet/Haiku 3.5, Google Pro 1.5, Llama 3.3, EVA Qwen 72B.
  • 20 января, подключена Deepseek R1 – топовая рассуждающая модель от Deepseek, по метрикам сравнимая с o1, но по цене дешевле, чем o1-mini; она также быстрее o1 и o1-mini.
  • 8 января, Kling Standart 1.6, Kling Pro V1.6 – топовые модели для генерации видео от Kling.

2024 г


  • 29 декабря, подключена Minimax Music – модель генерации песен по тексту и аудио референсу
  • 26 декабря, подключена Deepseek V3 – топовая модель от Deepseek, около 600B параметров, сравнима по метрикам с GPT-4o и Sonnet 3.5... и еще у неё крайне низкая цена!
  • 18 декабря, модель o1 от OpenAI подключена в течение суток после выхода!
  • 9 декабря, Kling Standart, Kling Pro V1.5, Haiper 2.0 – подключили модели для генерации видео по тексту и изображению, включая одного из мировых лидеров Kling Pro 1.5
  • 8 декабря, LLama 3.3 70B подключена в течение двух суток после выхода!
  • 6 декабря, серия новых моделей от Amazon с большим контекстным окном до 300 000
  • 26 ноября, новая модель OpenAI: GPT-4o (2024–11–20)
  • 19 ноября, Mistral Large 2411 – подключили обновление модели Mistral Large.
  • 5 ноября, новая Haiku 3.5 – самая последняя модель от Anthropic, сравнима с версией Sonnet 3.5 от июня 2024.
  • 22 октября, новая Sonnet 3.5 – новая Sonnet 3.5 уже доступна на сервисе!
  • 13 октября, Grok Beta от xAI – модель от xAI, компании Илона Маска, который пытается конкурировать с OpenAI
  • 7 октября, Google Gemini Flash-8B – новые модели от Google.
  • 4 октября, FLUX pro 1.1 – лучшая мировая модель на текущий момент для генерации изображений уже у нас!
  • 26 сентября, серия LLama 3.2 подключена в течение суток после выхода!
  • 25 сентября, Google Gemini Pro 002 и Gemini Flash 002 – новые модели от Google.
  • 13 сентября, OpenAI o1-mini и o1-preview – новая модель от OpenAI подключена в течение суток!
  • 28 августа, FLUX schnell, dev и pro – топовые модели генерации изображений серии FLUX доступны у нас. FLUX pro даже обходит Midjourney на Арене генерирующих картинки моделей.
  • 28 августа, новые опенсорс модели – Hermes 405B (один из немногих файнтюнов Llama 3.1 405B), Mistral Nemo 12B Starcannon, Llama 3.1 Euryale 70B v2.2
  • 22 августа, Webapp AI Generator – выкатили ИИ-генератор веб-приложений по текстовому описанию с возможностью просмотра результата (аналог Artifacts). Доступно в «Интеграциях».
  • 14 августа, OpenAI: GPT-4o-latest – последняя сеть от OpenAI. Под ней OpenAI будет постоянно публиковать все новые и более совершенные релизы GPT-4o
  • 14 августа, OpenAI: GPT-4o-64k-output – версия GPT-4o, позволяющая генерировать расширенные результаты, вплоть до 64 000 токенов. Временно недоступна обычным подписчикам OpenAI, только специальным тестерам – а у нас доступна :)
  • 14 августа, Google Flash – значительно снижены цены вслед за Google
  • 7 августа, OpenAI: GPT-4o 2024–08–06 – последняя модель GPT-4o, с пониженной ценой и поддержкой структурированного выхода JSON (мы уже поддерживаем структурный выход по схеме)
  • 25 июля, Mistral Large 2 – последняя модель от Mistral (вышла 24 июля)
  • 23 июля, Llama 3.1 405B Instruct – доступна у нас, в течение 1.5 часов после официального релиза. (также доступны LLama 3.1 8B и 70B)
  • 19 июля, 10 новых опенсорс моделей – в серии Open Models Fan, предназначенной для поддержки доступа к опенсорс моделям (теперь на всех платных тарифных планах).
  • 18 июля, OpenAI: GPT-4o mini – в 22:00, спустя 2 часа после официального запуска, модель уже доступна!
  • 17 июля, Google Gemma 2 27B – новая опенсорс модель от Google. Очень неплохо общается на русском.
  • 12 июля, Playground 2.5 – опенсорс модель для генерации изображений уровня DALLE-3 (согласно рейтингу ЭЛО text-to-image моделей), но в пять раз дешевле DALLE-3.
  • 12 июля, Magnum 72B – топовая опенсорсная модель для ролевого взаимодействия
  • 30 июня, Stable Diffusion XL – подключили классическую опенсорс модель генерации изображений.
  • 28 июня, Google Gemma 2 9B – новая опенсорс модель от Google. Очень неплохо общается на русском.
  • 25 июня, NVIDIA Nemotron 4 340B Instruct – крупнейшая опенсорс модель на настоящий момент. Первая опенсорс модель, которая переводит по метрикам лучше Google Translate и DeepL.
  • 20 июня, Anthropic: Claude 3.5 Sonnet – новая топовая модель; по метрикам превосходит GPT-4o и предыдущий топовый Claude 3 Opus
  • 14 июня, OpenAI: TTS – добавили модели для генерации речи по тексту от OpenAI
  • 7 июня, Qwen2 72B Instruct – новая опенсорс модель из серии Qwen от Tongyi Qianwen (Alibaba group, Китай), сравнимая с LLama3 70B
  • 25 мая, Microsoft: Phi 3 Medium – самая старшая из серии Phi 3 моделей. Хорошая тренировка, 128 000 контекст.
  • 15 мая, Google: Gemini Flash 1.5 – с презентации Google IO от 14 мая. 1 миллион контекста и очень дешевая обработка.
  • 13 мая, OpenAI: GPT-4o – самая свежая и сильная модель от OpenAI уже на сервисе! (подключили в течение часа после выхода)
  • 11 мая, Qwen 1.5 14B/32B/72B/110B – опенсорс модели от Tongyi Qianwen (Alibaba group, Китай)
  • 6 мая, Lumimaid 8B – опенсорс модель для ролевого взаимодействия (файнтюн Llama3 8B)
  • 26 апреля, FireLLaVA 13B – опенсорс модель для вопросов по изображениям
  • 19 апреля, Llama3 8B/70B – новейшие опенсорс модели серии Llama.
  • 18 апреля, MicrosoftAI: WizardLM-2 7B – файнтюн 7B-модели от MicrosoftAI.
  • 18 апреля, Mistral: Mixtral 8x22B Instruct – официальная дотренировка от Mistral их модели на выполнение инструкций.
  • 16 апреля, MicrosoftAI: WizardLM-2 8x22B – мощный опенсорсный файнтюн для Mixtral 8x22B, по метрикам сопоставим с GPT-4.
  • 11 апреля, Mistral: Mixtral 8x22B – запустили самую последнюю опенсорс модель от Mistral.
  • 10 апреля, OpenAI: GPT-4-Turbo – последний вариант GPT-4-Turbo от 9 апреля
  • 10 апреля, Google: Gemini Pro 1.5 на 1 миллион контекста
  • 5 апреля, Cohere – Command R и Command R+ – общие сети с контекстом 128 000, фокусирующиеся на RAG и обработке вызова функций (function calling) и tools
  • 20 марта, OpenAI – подключили Whisper – сеть для распознавания аудио (Speech-To-Text)
  • 14 марта, Anthropic – добавили Claude 3 Haiku. Очень дешевая модель с возможностью общаться на русском и гигантским контекстом в 200К токенов!
  • 13 марта, OpenAI – подключили новые embeddings: text-embedding-3-small, text-embedding-3-large
  • 8 марта, Mistral – перенесли запуск Mixtral 8x7B Instruct на API от Groq с их уникальными ускоряющими процессорами. Скорость выросла где-то в 5 раз.
  • 4 марта, Anthropic – выпустила Claude 3. По оценкам разработчиков модель Sonnet быстрее, дешевле и лучше Claude 2, а Opus даже превосходит GPT-4.
  • 27 февраля, Mistral, закрытые модели – добавили Mistral Large. По оценкам разработчиков она находится на уровне между Claude 2 и GPT-4. Модель в первую очередь предназначена для европейских языков, на русском работает, но похуже.
  • 27 февраля, Perplexity – Sonar Online Models, модели с доступом в интернет, которые умеют отвечать по актуальным фактам
  • 26 февраля, Translate-модели – значительно улучшили скорость и качество при долгих диалогах за счет внутреннего сервиса кэша и обратного кэша.
  • 25 февраля, Google – Gemini Pro и Gemini Pro Vision подешевели на 30%. У Gemini Pro Vision самая низкая цена на обработку изображений – около 4 копеек за 1 изображение!
  • 23 февраля, Google Gemma 7B – добавлена новая опенсорс модель от Google.
  • 21 февраля, Dall-E 2 и 3 – добавили text-to-image модели на сервис.
  • 17 февраля, Anthropic – Claude Instant подешевел на 50%.
  • 2 февраля, OpenAI – новая, более дешевая ChatGPT (цена на входные токены уменьшена на 50%, на выходные – на 25%)
  • 1 февраля, CodeLlama70B – новая опенсорс 70B модель для генерации кода
  • 26 января, OpenAI – новая GPT-4-Turbo
  • 19 января, Google: Gemini Pro Vision – мощная модель от Google, позволяющая обрабатывать изображения.
  • 15 января, Mistral, закрытые модели – подключили модели, доступные по API. Флагманская Mistral Medium конкурирует с Claude 2.

2023 г


  • 13 декабря, Google: Gemini Pro – новая мощная модель от Google.
  • 11 декабря, Mistral – Mixtral 8x7B Instruct, Mixtral 8x7B Chat, опенсорс модели на новой архитектуре. Дешевые и сравнимые по качеству с ChatGPT (по оценкам авторов)
  • 29 ноября, Perplexity – Perplexity Online Models с доступом к интернету для более точного следования фактам
  • 21 ноября, Anthropic – Claude 2.1 с 200к контекста!
  • 6 ноября, OpenAI – GPT-3.5 Turbo 16k (11–06), GPT-4 Turbo на 128к контекста.