cpaua
·1 хв138

Alibaba випустила Qwen3.6-35B-A3B: MoE, мультимодальність і GGUF

Alibaba випустила Qwen3.6-35B-A3B: MoE, мультимодальність і GGUF

Alibaba випустила Qwen3.6-35B-A3B сьогодні.

Це розріджена MoE: 35 млрд параметрів, активні лише 3 млрд.

Вона перевершує щільну модель Qwen3.5-27B (27 млрд параметрів) на низці ключових кодингових бенчмарків і значно випереджає свого прямого попередника Qwen3.5-35B-A3B, особливо в завданнях агентного кодування та міркування.

Qwen3.6 від початку мультимодальна, і Qwen3.6-35B-A3B демонструє можливості сприйняття та мультимодального міркування, що значно перевищують очікування від її розміру, за наявності лише ~3 млрд активних параметрів.

На більшості vision-language бенчмарків її результати зіставні з Claude Sonnet 4.5 і навіть перевершують його на низці завдань. Особливо помітні сильні сторони в просторовому інтелекті: 92.0 на RefCOCO і 50.8 на ODInW13.

Unsloth додали GGUF, тож модель можна запускати локально на 23 ГБ ОЗУ / Mac у 4-бітному режимі. (гайд)

Поділитися:
Автор
cpaua

Адміністратор блогу VibeCode. Пишу про vibe coding, AI та open source.

Коментарі

Щоб залишити коментар, увійдіть або зареєструйтеся
Завантаження...