NVIDIA Nemotron 3 Ultra: 550B MoE для довгоживучих AI-агентів

NVIDIA викотила Nemotron 3 Ultra.

550B MoE-модель із відкритими вагами, заточена під довгоживучих агентів.

За заявами NVIDIA:

• інференс до 5 разів швидший
• до 30% дешевше на складних агентних задачах
• сильніша в програмуванні, deep research і довгостроковому плануванні

Головний фокус не на чатах, а на агентних сценаріях, де модель годинами планує дії, викликає інструменти, обробляє помилки й ухвалює рішення щодо наступних кроків.

Використовує гібридну архітектуру Mamba + Transformer MoE, яка дає змогу виконувати більше циклів міркувань за той самий час.

Із цікавого:

• може працювати з великими кодовими базами
• тримає довгі ланцюжки tool calls
• уміє збирати й синтезувати дані із сотень джерел
• донавчалася під OpenClaw, Hermes Agent і LangChain

NVIDIA також відкрила не тільки ваги моделі, а й синтетичні датасети разом із рецептами післянавчання.

І одразу приємний бонус.

Nous Research приєдналася до коаліції Nemotron і разом із NVIDIA та Nebius відкрила безплатний доступ до Nemotron 3 Ultra через Nous Portal на два тижні.

Для тих, хто хоче запускати модель локально, уже з’явилися GGUF-квантизації від Unsloth

GGUF: unsloth/NVIDIA-Nemotron-3-Ultra-550B-A55B-GGUFhuggingface.co/unsloth/NVIDIA-Nemotron-3-Ultra-550B-A55B-GGUF
Guide: тут

NVIDIA Nemotron 3 Ultra: 550B MoE для довгоживучих AI-агентів

Коментарі

Схожі статті

5 open-source no-code платформ для LLM, RAG та AI-агентів

NVIDIA SkillSpector: open-source інструмент для пошуку вразливостей

NVIDIA TwoTower: швидша генерація LLM без втрати якості