NVIDIA Nemotron 3 Ultra: 550B MoE для довгоживучих AI-агентів
NVIDIA викотила Nemotron 3 Ultra.
550B MoE-модель із відкритими вагами, заточена під довгоживучих агентів.
За заявами NVIDIA:
• інференс до 5 разів швидший
• до 30% дешевше на складних агентних задачах
• сильніша в програмуванні, deep research і довгостроковому плануванні
Головний фокус не на чатах, а на агентних сценаріях, де модель годинами планує дії, викликає інструменти, обробляє помилки й ухвалює рішення щодо наступних кроків.
Використовує гібридну архітектуру Mamba + Transformer MoE, яка дає змогу виконувати більше циклів міркувань за той самий час.
Із цікавого:
• може працювати з великими кодовими базами
• тримає довгі ланцюжки tool calls
• уміє збирати й синтезувати дані із сотень джерел
• донавчалася під OpenClaw, Hermes Agent і LangChain
NVIDIA також відкрила не тільки ваги моделі, а й синтетичні датасети разом із рецептами післянавчання.
І одразу приємний бонус.
Nous Research приєдналася до коаліції Nemotron і разом із NVIDIA та Nebius відкрила безплатний доступ до Nemotron 3 Ultra через Nous Portal на два тижні.
Для тих, хто хоче запускати модель локально, уже з’явилися GGUF-квантизації від Unsloth
GGUF:
Guide: тут