cpaua
·1 хв8

Harness-1: пошуковий агент 20B із зовнішнім harness-станом

Harness-1: пошуковий агент 20B із зовнішнім harness-станом

Вийшов Harness-1 — пошуковий агент на 20B параметрів із доволі незвичною ідеєю.

Замість того щоб змушувати модель зберігати всю історію пошуку в контексті, автори вирішили винести стан назовні й навчити модель працювати через спеціальний harness.

Вийшов агент на 20B параметрів, який на довгих пошукових задачах конкурує зі значно більшими моделями.

Зазвичай пошукові агенти працюють за схемою:
пошук → читання → пошук → читання → усе підряд додається в контекст.

У підсумку модель одночасно виконує роль пошуковика, пам’яті, нотатника, верифікатора та бібліотекаря.

Harness-1 розділяє ці завдання.

Модель, як і раніше, вирішує, що шукати, що читати, які факти зберігати й що перевіряти. Але весь стан пошуку зберігається у зовнішньому harness-шарі.

Він веде робочу пам’ять агента:

• знайдені документи
• відібрані докази
• історію пошуку
• зв’язки між джерелами
• результати перевірок
• дедуплікацію та стиснення даних
• контроль контекстного бюджету

Цікаво й те, що модель навчали на порівняно невеликому обсязі даних: усього 899 SFT-траєкторій і RL на 3453 запитах. Автори вважають, що значну частину потрібної поведінки можна винести в сам harness, а не зашивати у ваги моделі

Найцікавіший результат — переносність. На нових бенчмарках, яких модель не бачила під час навчання, приріст виявився ще вищим, ніж на вихідних задачах.

Paper : arxiv.org/abs/2606.02373
Code : pat-jj/harness-1github.com/pat-jj/harness-1
Model : Hugging Facepat-jj/harness-1huggingface.co/pat-jj/harness-1
HF Paper: https://huggingface.co/papers/2606.02373

Поділитися:
Автор
cpaua

Адміністратор блогу VibeCode. Пишу про vibe coding, AI та open source.

Коментарі

Щоб залишити коментар, увійдіть або зареєструйтеся
Завантаження...

Схожі статті