Harness-1: пошуковий агент 20B із зовнішнім harness-станом
Вийшов Harness-1 — пошуковий агент на 20B параметрів із доволі незвичною ідеєю.
Замість того щоб змушувати модель зберігати всю історію пошуку в контексті, автори вирішили винести стан назовні й навчити модель працювати через спеціальний harness.
Вийшов агент на 20B параметрів, який на довгих пошукових задачах конкурує зі значно більшими моделями.
Зазвичай пошукові агенти працюють за схемою:
пошук → читання → пошук → читання → усе підряд додається в контекст.
У підсумку модель одночасно виконує роль пошуковика, пам’яті, нотатника, верифікатора та бібліотекаря.
Harness-1 розділяє ці завдання.
Модель, як і раніше, вирішує, що шукати, що читати, які факти зберігати й що перевіряти. Але весь стан пошуку зберігається у зовнішньому harness-шарі.
Він веде робочу пам’ять агента:
• знайдені документи
• відібрані докази
• історію пошуку
• зв’язки між джерелами
• результати перевірок
• дедуплікацію та стиснення даних
• контроль контекстного бюджету
Цікаво й те, що модель навчали на порівняно невеликому обсязі даних: усього 899 SFT-траєкторій і RL на 3453 запитах. Автори вважають, що значну частину потрібної поведінки можна винести в сам harness, а не зашивати у ваги моделі
Найцікавіший результат — переносність. На нових бенчмарках, яких модель не бачила під час навчання, приріст виявився ще вищим, ніж на вихідних задачах.
Paper : arxiv.org/abs/2606.02373
Code :
Model :
HF Paper: https://huggingface.co/papers/2606.02373