Регуляторика колонка 3 мин 1 мая 2026 г.

Рынок начал продавать ограничения. «Слишком опасно для релиза» стало нормой фронтира

GPT-Rosalind, Claude Mythos и другие сильнейшие модели уходят за дверь — лаборатории ограничивают доступ из-за рисков двойного назначения в биологии и кибербезопасности. Институциональный язык safety, о котором мы писали в марте, превращается в обязательную часть продукта. Происходит то же, что в 1962-м с фармацевтикой: реклама силы препарата уступает место раскрытию противопоказаний.

Редакционная обложка SCQR: на витрине лаборатории слева — список того, что модель умеет, справа — отдельный детализированный список того, что она не делает; правая витрина больше.

CSET Georgetown через TIME выпустила обзор: GPT-Rosalind, Claude Mythos и ряд других самых способных моделей сейчас не отдаются публике. Лаборатории всё чаще держат сильнейшие веса за дверью из-за рисков двойного назначения — в биологии, химии, кибербезопасности. Параллельно OpenAI публикует пятичастный план «Кибербезопасность в эпоху интеллекта»: пять линий обороны вокруг моделей, которые умеют сами проводить разведку и эксплуатацию уязвимостей. И тогда же выходят разборы system card к GPT-5.5 — Zvi Mowshowitz и Скотт Александер показывают, что ограничений в карточке модели стало в разы больше, чем заявленных способностей.

За год образ «у нас есть самая сильная модель, но мы её не отдаём» из редкости превратился в норму. И это не реакция на испуг — это структурный сдвиг продуктовой риторики. Раньше release-event фронтирной модели звучал как «вот что она умеет, скоро будет в API, цена X». Теперь он звучит так: «вот что она умеет, вот что она НЕ делает, вот ограничения по запросам, вот сертификат внешнего red team, вот условия отзыва доступа». Список ограничений — больше списка возможностей. Это уже не скрытая оговорка в FAQ; это центральная часть карточки.

Похожее уже было. Поправки Кефовера-Харриса в США, 1962 год. До этого фармацевтика рекламировала свою силу: «препарат лечит N болезней», «эффект сильнее, чем у конкурента», «универсальный обезболивающий». После талидомидовой катастрофы FDA получила полномочия требовать раскрытия противопоказаний и побочных эффектов в каждом релизе. Маркетинговая риторика перестала продавать силу препарата — она начала продавать профиль безопасности. Через десять лет ни одна крупная фарма не выпускала продукт без раздела «противопоказания», и потребитель научился читать этот раздел раньше списка показаний. Конкуренция перешла от «у нас сильнее» к «у нас профиль безопасности точнее описан». Сильные препараты всё равно появлялись, но релизы стали другими по структуре.

Сейчас рынок ИИ повторяет эту траекторию. Анализ CSET показывает фактически тот же узор: тяжёлые модели уходят в ограниченный круг (исследовательские партнёры, государственные испытательные стенды, аудиторы), широкая публика получает облегчённую версию с явными границами, и весь маркетинг релиза смещается с «вот что мы умеем» на «вот за чем мы наблюдаем». Это происходит потому, что покупатель — корпоративный отдел безопасности, регулятор, аудитор — начал смотреть в первую очередь именно туда. И когда покупатель смотрит в эту сторону, продавец начинает в эту сторону писать.

Что меняется в покупательском поведении. До этой волны корпоративное ИИ-due-diligence было разделено: безопасники проверяли модель отдельно, продуктовая команда проверяла модель отдельно, и встретиться они должны были на этапе пилота. Сейчас обе функции читают один и тот же документ — system card — и читают его до подписания контракта. У моделей с детализированным system card (Anthropic, OpenAI, Google) контрактный цикл короче: одно чтение покрывает обе линии проверки. У моделей без детализированного system card цикл длиннее: безопасники требуют отдельного отчёта red team, и пока его нет — пилот не запускается. Это уже видно по динамике корпоративных контрактов первого квартала.

Российский фронтир пока в этом разговоре только обозначается. Сбер, Яндекс, MTS AI публикуют в основном технические отчёты и продуктовую документацию; полноценного аналога system card в формате «что мы наблюдаем за нашей моделью» нет. Это не означает, что внутренние мониторинги отсутствуют — у крупных лабораторий они есть. Но без публичного документа корпоративный покупатель в России проходит через долгий вопрос-ответ-цикл с поставщиком, который у американских и европейских вендоров уже сжат до чтения PDF. Ближайшие двенадцать месяцев — окно, в которое российские лаборатории могут перевести внутреннюю практику в стандартный формат и начать собирать ту же выгоду, что собирают международные.

P.S. Параллель с фармацевтикой даёт ещё одно наблюдение, которое стоит держать в уме. После 1962 года появилась отдельная индустрия — независимые лаборатории клинических испытаний, аудиторы, отраслевые издания, читающие FDA-документы. Они не делают препараты, они делают доверие к препаратам. В ИИ эта индустрия появляется прямо сейчас: METR, Apollo Research, Redwood Research, академические red team и независимые ассоциации аудиторов. Через пять лет это будет отдельный сегмент рынка с собственной выручкой, и он начнёт диктовать стандарт релиза тем самым лабораториям, которые сегодня его создают. CSET-обзор — один из ранних знаков, что эта индустрия становится взрослой.

Дальше по теме Бенчмарк перестал быть одним числом. Эпоха насыщения reasoning-метрик закрылась за апрель 2026-го

Грег Бёрнем (Epoch AI) призывает «отказаться хотя бы от одного из четырёх свойств классического бенчмарка»: text-only, short time horizon, easy to grade, expert human superiority. Eric Bezzam с командой HuggingFace вводит private hold-out от Appen и DataoceanAI как защиту от benchmaxxing. ARC Research поднимает уровень дискуссии до mechanistic-evaluation. Zvi Mowshowitz фиксирует, что system card к GPT-5.5 продаёт ограничения, не достижения. Это четыре независимых сигнала одного и того же сдвига — рынок измерения AI-моделей перестраивается на multi-endpoint.