Первая мультимодальная модель NVIDIA с одной унифицированной архитектурой для экранов, документов, аудио, видео и текста.
Карта релизов фронтирных моделей
Живая лента запусков. Фронтирные закрытые лаборатории, открытые веса второго ряда, российский сегмент. Каждая запись — с источником и ссылкой на наш разбор, если он есть. Обновляется ручным редакционным отбором.
- NVIDIA · NemotronNemotron 3 Nano Omni
Первая мультимодальная модель NVIDIA с одной унифицированной архитектурой для экранов, документов, аудио, видео и текста.
Наш разбор → - Other · IneffableIneffable Research (pre)
Лаборатория Дэвида Силвера, основанная в 2026-м с раундом $1.1 млрд при оценке $5.1 млрд. Публичных моделей пока нет; ставка на post-data парадигму через self-play.
Наш разбор → - DeepSeek · DeepSeek-V4DeepSeek-V4 Pro / V4 Flash
Двойной запуск V4 — тяжёлая Pro и быстрая Flash. Текущий референс китайского открытого фронтира.
- OpenAI · Privacy FilterPrivacy Filter
Локальная on-device модель с открытыми весами для удаления PII перед отправкой в облачный ИИ. Открыла рынок защитного слоя.
Наш разбор → - OpenAI · GPT-5GPT-5.5
Текущий флагман OpenAI на момент IPO; system card получил расширенную секцию ограничений по двойному назначению.
- Anthropic · Claude OpusClaude Opus 4.7
Текущий флагман Anthropic, расширенный system card с явной декларацией ограничений по двойному назначению.
- Google · Gemini FlashGemini 3.1 Flash TTS
Специализированная модель для генерации речи на базе Flash 3.1.
- OpenAI · GPT-RosalindGPT-Rosalind
Внутренняя сильная модель OpenAI с ограниченным доступом из-за рисков двойного назначения в биологии и кибербезопасности.
Наш разбор → - Yandex · YandexGPTYandexGPT 5 Pro
Pro-вариант YandexGPT 5 для корпоративного API с расширенным контекстом и tool-use.
- Anthropic · Claude MythosClaude Mythos
Кибер-фронтирная модель Anthropic в рамках Project Glasswing. Находит тысячи zero-day-уязвимостей; общедоступного релиза нет, доступ ограничен Белым домом.
Наш разбор → - Qwen / Alibaba · Qwen3Qwen3.6-Plus
Текущая флагманская Qwen с расширенным reasoning и агентскими навыками.
- Google · Gemini Live / Computer UseGemini 3.1 Flash Live Preview
Live-вариант Flash 3.1 для real-time голосовых и видео-сценариев.
- Sber · GigaChatGigaChat 2 Pro
Второе поколение GigaChat с расширенным reasoning и агентскими сценариями. Ставит планку для российского корпоративного рынка.
- Meta · LlamaLlama 4.2
Текущий референс открытого фронтира США; конкурирует с Qwen и DeepSeek в open-weights сегменте.
- OpenAI · GPT-5GPT-5.4
Расширение мультимодальности и vision-понимания, новые API для агентских сценариев.
- Google · Gemini FlashGemini 3.1 Flash-Lite Preview
Удешевлённый вариант Flash для high-volume сценариев.
- Other · GLMGLM-5
Z.ai (Zhipu) — пятое поколение GLM, спин-офф из Tsinghua. Сильна в китайско-английском кодинге.
- MTS · CoTypeCoType Pro
Открытая модель MTS AI с фокусом на корпоративные сценарии и российский регуляторный контур.
- Google · Gemini ProGemini 3.1 Pro Preview
Preview-версия Gemini 3.1 Pro с расширенным reasoning и tool-use.
- Anthropic · Claude SonnetClaude Sonnet 4.6
Текущий рабочий конь Anthropic для корпоративного API; основной кандидат для масштабных агентских внедрений.
- Baidu · ERNIEERNIE 5.0
Стабильный релиз ERNIE 5.0 — основная Baidu-флагман на китайском рынке.
- Anthropic · Claude OpusClaude Opus 4.6
Зимняя итерация Opus с акцентом на стабильность agentic-loop и обновлённой RSP.
- OpenAI · GPT-CodexGPT-5.3-Codex
Зимняя итерация Codex-линейки, улучшения в репозиторном reasoning и tool-use.
- OpenAI · GPT-CodexGPT-5.3-Codex-Spark
Лёгкий быстрый вариант Codex-линии для интерактивных сценариев.
- Mistral · Mistral MediumMistral Medium 3
Средний баланс цена/качество для европейских корпоративных клиентов.
- Other · StepStep-3
Stepfun (Шанхай) — китайский фронтирный новичок с открытыми весами и фокусом на reasoning.
- Microsoft · PhiPhi-4 Multimodal
Мультимодальная Phi-4 для on-device и edge-сценариев.
- Google · Gemini FlashGemini 3 Flash
Третья итерация Flash, баланс между качеством и стоимостью.
- Sber · GigaChatGigaChat MAX
Тяжёлая флагманская версия GigaChat для корпоративного рынка России. Используется в банках, госуслугах, индустриальных сценариях.
- OpenAI · GPT-5GPT-5.2
Зимний релиз с фокусом на стабильность tools и reasoning-tokens.
- DeepSeek · DeepSeek-V3DeepSeek-V3.2
Стабильная V3.2 с улучшенным MoE и дешевле на inference.
- Anthropic · Claude OpusClaude Opus 4.5
Перезапуск тяжёлой Opus-линии с расширенным reasoning и улучшенной агентской дисциплиной.
- xAI · Grok FastGrok 4.1 Fast
Обновление Fast-линии под агентские tool-call сценарии.
- Google · Gemini ProGemini 3 Pro
Третье поколение основной Pro-линейки Gemini.
- xAI · GrokGrok 4.1
Минорное обновление Grok 4 с улучшениями в инструмент-call и reasoning.
- Baidu · ERNIEERNIE 5.0 Preview
Preview пятого поколения ERNIE с расширенной мультимодальностью.
- OpenAI · GPT-5GPT-5.1
Минорное обновление с улучшениями в long-context и инструмент-call routing.
- Moonshot · Kimi K2Kimi K2 Think
Reasoning-вариант K2 с явной trace-генерацией.
- Yandex · YandexGPTYandexGPT 5
Пятое поколение основной модели Яндекса. Работает в Алисе, Поиске, корпоративном API.
- Meta · LlamaLlama 4.1
Минорное обновление Llama 4 с улучшениями в multilingual и кодинге.
- Anthropic · Claude HaikuClaude Haiku 4.5
Быстрая лёгкая модель для high-volume задач и классификации.
- Cohere · Command RCommand R+ 2
Корпоративная RAG-ориентированная модель Cohere; Канадский фронтир со ставкой на enterprise data sovereignty.
- Google · Gemini Live / Computer UseGemini 2.5 Computer Use
Специализированная агентская модель для управления компьютером через скриншоты.
- Anthropic · Claude SonnetClaude Sonnet 4.5
Осенний апдейт Sonnet с улучшениями в tool-use и инструкционному следованию.
- DeepSeek · DeepSeek-V3DeepSeek-V3.2-Exp
Экспериментальный билд V3.2 для обкатки новой архитектуры.
- Qwen / Alibaba · Qwen3Qwen3-Max
Тяжёлая флагманская версия Qwen3 для облачного API Alibaba Cloud.
- DeepSeek · DeepSeek-V3DeepSeek-V3.1-Terminus
Финальная стабильная версия V3.1 перед переходом на V3.2.
- xAI · Grok FastGrok 4 Fast
Быстрая лёгкая версия Grok 4 для агентских задач с низкой задержкой.
- OpenAI · GPT-CodexGPT-5-Codex
Кодинг-вариант GPT-5, оптимизированный под SWE-bench и многошаговые правки кода.
- Other · MiniMaxMiniMax abab-7
MiniMax — китайская мультимодальная модель с фокусом на голос и аудио.
- Moonshot · Kimi K2Kimi K2 Preview
Preview-версия следующего шага K2 с обновлённым тренировочным датасетом.
- Other · YiYi-Large 2
01.ai — лаборатория Кай-Фу Ли. Yi-Large 2 — основной Yi-флагман с открытыми весами.
- DeepSeek · DeepSeek-V3DeepSeek-V3.1
Основная Mainline-версия с открытыми весами, конкурирует с GPT-5 на ряде бенчмарков.
- Mistral · Mistral LargeMistral Large 2.1
Европейский фронтирный конкурент с открытыми весами; популярен в EU-юрисдикциях из-за data sovereignty.
- OpenAI · GPT-5GPT-5
Запуск пятой генерации фронтирной модели OpenAI с расширенным reasoning-режимом и мультимодальным вводом.
- Anthropic · Claude OpusClaude Opus 4.1
Минорное обновление с улучшениями в SWE-bench и инструмент-call.
- Moonshot · Kimi K2Kimi K2 Turbo
Ускоренный вариант K2 для production-нагрузок.
- Qwen / Alibaba · Qwen CoderQwen3-Coder
Кодинг-вариант Qwen3 с открытыми весами; популярен в китайских и индийских dev-командах.
- Moonshot · Kimi K2Kimi K2
Стартовый K2 Moonshot с открытыми весами; примечателен размером и качеством на длинном контексте.
- Microsoft · PhiPhi-4
Малая Microsoft-модель с открытыми весами для локальных и edge-сценариев.
- xAI · GrokGrok 4
Четвёртое поколение Grok, основной фронтирный конкурент GPT и Claude.
- Baidu · ERNIEERNIE 4.5 OSS family
Открытое семейство ERNIE 4.5 — несколько размеров под разные нагрузки китайского рынка.
- Google · Gemini FlashGemini 2.5 Flash stable
Быстрая лёгкая Flash-линия с минимальной задержкой.
- Google · Gemini ProGemini 2.5 Pro stable
Стабильный релиз Gemini 2.5 Pro с длинным окном контекста и multimodal-входом.
- DeepSeek · DeepSeek-R1DeepSeek-R1-0528
Reasoning-вариант DeepSeek с открытыми весами; задал стандарт для открытых reasoning-моделей.
- Anthropic · Claude OpusClaude Opus 4
Стартовый Opus четвёртого поколения, фокус на длинных задачах и reasoning.
- Anthropic · Claude SonnetClaude Sonnet 4
Сбалансированная средняя модель с хорошим cost/perf для корпоративных задач.
- Qwen / Alibaba · Qwen3Qwen3
Третье поколение Qwen с открытыми весами; задало планку для китайских открытых моделей в 2025-м.
- Meta · LlamaLlama 4
Четвёртое поколение Llama с открытыми весами; задало планку для открытых фронтирных моделей.
Лаборатория Дэвида Силвера, основанная в 2026-м с раундом $1.1 млрд при оценке $5.1 млрд. Публичных моделей пока нет; ставка на post-data парадигму через self-play.
Двойной запуск V4 — тяжёлая Pro и быстрая Flash. Текущий референс китайского открытого фронтира.
Локальная on-device модель с открытыми весами для удаления PII перед отправкой в облачный ИИ. Открыла рынок защитного слоя.
Текущий флагман OpenAI на момент IPO; system card получил расширенную секцию ограничений по двойному назначению.
Текущий флагман Anthropic, расширенный system card с явной декларацией ограничений по двойному назначению.
Специализированная модель для генерации речи на базе Flash 3.1.
Внутренняя сильная модель OpenAI с ограниченным доступом из-за рисков двойного назначения в биологии и кибербезопасности.
Pro-вариант YandexGPT 5 для корпоративного API с расширенным контекстом и tool-use.
Кибер-фронтирная модель Anthropic в рамках Project Glasswing. Находит тысячи zero-day-уязвимостей; общедоступного релиза нет, доступ ограничен Белым домом.
Текущая флагманская Qwen с расширенным reasoning и агентскими навыками.
Live-вариант Flash 3.1 для real-time голосовых и видео-сценариев.
Второе поколение GigaChat с расширенным reasoning и агентскими сценариями. Ставит планку для российского корпоративного рынка.
Текущий референс открытого фронтира США; конкурирует с Qwen и DeepSeek в open-weights сегменте.
Расширение мультимодальности и vision-понимания, новые API для агентских сценариев.
Удешевлённый вариант Flash для high-volume сценариев.
Z.ai (Zhipu) — пятое поколение GLM, спин-офф из Tsinghua. Сильна в китайско-английском кодинге.
Открытая модель MTS AI с фокусом на корпоративные сценарии и российский регуляторный контур.
Preview-версия Gemini 3.1 Pro с расширенным reasoning и tool-use.
Текущий рабочий конь Anthropic для корпоративного API; основной кандидат для масштабных агентских внедрений.
Стабильный релиз ERNIE 5.0 — основная Baidu-флагман на китайском рынке.
Зимняя итерация Opus с акцентом на стабильность agentic-loop и обновлённой RSP.
Зимняя итерация Codex-линейки, улучшения в репозиторном reasoning и tool-use.
Лёгкий быстрый вариант Codex-линии для интерактивных сценариев.
Средний баланс цена/качество для европейских корпоративных клиентов.
Stepfun (Шанхай) — китайский фронтирный новичок с открытыми весами и фокусом на reasoning.
Мультимодальная Phi-4 для on-device и edge-сценариев.
Третья итерация Flash, баланс между качеством и стоимостью.
Тяжёлая флагманская версия GigaChat для корпоративного рынка России. Используется в банках, госуслугах, индустриальных сценариях.
Зимний релиз с фокусом на стабильность tools и reasoning-tokens.
Стабильная V3.2 с улучшенным MoE и дешевле на inference.
Перезапуск тяжёлой Opus-линии с расширенным reasoning и улучшенной агентской дисциплиной.
Обновление Fast-линии под агентские tool-call сценарии.
Третье поколение основной Pro-линейки Gemini.
Минорное обновление Grok 4 с улучшениями в инструмент-call и reasoning.
Preview пятого поколения ERNIE с расширенной мультимодальностью.
Минорное обновление с улучшениями в long-context и инструмент-call routing.
Reasoning-вариант K2 с явной trace-генерацией.
Пятое поколение основной модели Яндекса. Работает в Алисе, Поиске, корпоративном API.
Минорное обновление Llama 4 с улучшениями в multilingual и кодинге.
Быстрая лёгкая модель для high-volume задач и классификации.
Корпоративная RAG-ориентированная модель Cohere; Канадский фронтир со ставкой на enterprise data sovereignty.
Специализированная агентская модель для управления компьютером через скриншоты.
Осенний апдейт Sonnet с улучшениями в tool-use и инструкционному следованию.
Экспериментальный билд V3.2 для обкатки новой архитектуры.
Тяжёлая флагманская версия Qwen3 для облачного API Alibaba Cloud.
Финальная стабильная версия V3.1 перед переходом на V3.2.
Быстрая лёгкая версия Grok 4 для агентских задач с низкой задержкой.
Кодинг-вариант GPT-5, оптимизированный под SWE-bench и многошаговые правки кода.
MiniMax — китайская мультимодальная модель с фокусом на голос и аудио.
Preview-версия следующего шага K2 с обновлённым тренировочным датасетом.
01.ai — лаборатория Кай-Фу Ли. Yi-Large 2 — основной Yi-флагман с открытыми весами.
Основная Mainline-версия с открытыми весами, конкурирует с GPT-5 на ряде бенчмарков.
Европейский фронтирный конкурент с открытыми весами; популярен в EU-юрисдикциях из-за data sovereignty.
Запуск пятой генерации фронтирной модели OpenAI с расширенным reasoning-режимом и мультимодальным вводом.
Минорное обновление с улучшениями в SWE-bench и инструмент-call.
Ускоренный вариант K2 для production-нагрузок.
Кодинг-вариант Qwen3 с открытыми весами; популярен в китайских и индийских dev-командах.
Стартовый K2 Moonshot с открытыми весами; примечателен размером и качеством на длинном контексте.
Малая Microsoft-модель с открытыми весами для локальных и edge-сценариев.
Четвёртое поколение Grok, основной фронтирный конкурент GPT и Claude.
Открытое семейство ERNIE 4.5 — несколько размеров под разные нагрузки китайского рынка.
Быстрая лёгкая Flash-линия с минимальной задержкой.
Стабильный релиз Gemini 2.5 Pro с длинным окном контекста и multimodal-входом.
Reasoning-вариант DeepSeek с открытыми весами; задал стандарт для открытых reasoning-моделей.
Стартовый Opus четвёртого поколения, фокус на длинных задачах и reasoning.
Сбалансированная средняя модель с хорошим cost/perf для корпоративных задач.
Третье поколение Qwen с открытыми весами; задало планку для китайских открытых моделей в 2025-м.
Четвёртое поколение Llama с открытыми весами; задало планку для открытых фронтирных моделей.