NVIDIA
Материалы SCQR, упоминающие тему «NVIDIA» — короткие сигналы, разборы и колонки в одной подборке.
Inference расколется на три. Бен Томпсон фиксирует следующую развилку compute-инфраструктуры
WSE-3 у Cerebras: 44 ГБ SRAM при 21 ПБ/с — против 80 ГБ HBM у H100 при 3,35 ТБ/с. Шестикратная разница в пропускной способности при половине памяти. После IPO акция Cerebras улетела с диапазона $115–125 до $150–160. Nvidia запускает Dynamo-фреймворк, который сам разделяет компоненты inference. Старое железо возвращается в orbit — Томпсон конкретно описывает, почему space data centers становятся пригодными именно сейчас. Это не «GPU больше не нужен» — это «GPU становится одним из трёх компонентов в трёх разных режимах».
Amazon выигрывает не там, где все смотрели. Эра inference переписывает рейтинг облаков
Amazon купил Annapurna Labs в 2015-м, выпустил первый собственный AI-чип в 2019-м, и десять лет это выглядело как боковой проект на фоне NVIDIA. В 2026-м Trainium 3 пошёл в продукт, у Anthropic по-прежнему AWS как опорный облачный партнёр, на той же неделе Bedrock получил OpenAI с дня-ноль. Структурное преимущество, в которое долго инвестировали, начинает работать — ровно как однажды это сделал сам AWS.
NVIDIA Nemotron 3 Nano Omni сжимает агентный стек в одну модель
Nemotron 3 Nano Omni доступна с дня релиза на двух главных каталогах — Hugging Face и SageMaker JumpStart. Зрение, аудио, документы, видео и экраны идут через одну архитектуру, не через цепочку моделей с маршалингом контекста между ними. Раньше агентов собирали из vision-language-action стека; теперь — из одного компонента.
На Hannover Messe залили фундамент. До новой паровой машины ещё лет тридцать
NVIDIA с партнёрами привезли в Ганновер архитектуру промышленного физического AI: CUDA-X, Omniverse, Nemotron, Industrial AI Cloud. На стендах — гуманоиды и автономные ячейки. Связка готова раньше, чем продукты на ней — а до новой индустриализации, сравнимой с паровой машиной, отрасли ещё лет тридцать.
Где встречаются память и логика
Рынок давно знает, что большие модели упираются в движение данных, а не в арифметику. Но победит здесь не тот, кто первым красиво сольёт память с логикой, а тот, кто сделает это дешевле сложившегося стека.
AI-фабрики входят в энергосистему как новый тип промышленной нагрузки
Сюжет NVIDIA и Emerald AI важен тем, что окончательно связывает ИИ со старой промышленной реальностью: электросеть теперь становится не фоном, а частью продуктовой архитектуры.
GTC закрепляет главную формулу года: ИИ — это инфраструктура
Мартовский анонс GTC важен не как приглашение на конференцию, а как идеологический манифест отрасли. Jensen Huang окончательно перевёл разговор об ИИ с уровня приложения на уровень промышленной системы.