← Все релизы
NVIDIA Фронтир · открытая

Nemotron 3 Nano Omni

Nemotron
Modality Текст · Изображения · Аудио · Видео · Код · Агент

Что важно

Первая мультимодальная модель NVIDIA с одной унифицированной архитектурой для экранов, документов, аудио, видео и текста.

Наш разбор

NVIDIA Nemotron 3 Nano Omni сжимает агентный стек в одну модель

Nemotron 3 Nano Omni доступна с дня релиза на двух главных каталогах — Hugging Face и SageMaker JumpStart. Зрение, аудио, документы, видео и экраны идут через одну архитектуру, не через цепочку моделей с маршалингом контекста между ними. Раньше агентов собирали из vision-language-action стека; теперь — из одного компонента.

Читать →

Первоисточник

https://developer.nvidia.com/blog/nvidia-nemotron-3-nano-omni-powers-multimodal-agent-reasoning-in-a-single-efficient-open-model/