cpaua·7 червня 2026 р. о 07:301 хв134

Harness-1: пошуковий агент 20B із зовнішнім harness-станом

AI-агенти Пошук інформації Дослідження LLM Навчання з підкріпленням Open Source

Read in English

Harness-1: пошуковий агент 20B із зовнішнім harness-станом

Вийшов Harness-1 — пошуковий агент на 20B параметрів із доволі незвичною ідеєю.

Замість того щоб змушувати модель зберігати всю історію пошуку в контексті, автори вирішили винести стан назовні й навчити модель працювати через спеціальний harness.

Вийшов агент на 20B параметрів, який на довгих пошукових задачах конкурує зі значно більшими моделями.

Зазвичай пошукові агенти працюють за схемою:
пошук → читання → пошук → читання → усе підряд додається в контекст.

У підсумку модель одночасно виконує роль пошуковика, пам’яті, нотатника, верифікатора та бібліотекаря.

Harness-1 розділяє ці завдання.

Модель, як і раніше, вирішує, що шукати, що читати, які факти зберігати й що перевіряти. Але весь стан пошуку зберігається у зовнішньому harness-шарі.

Він веде робочу пам’ять агента:

• знайдені документи
• відібрані докази
• історію пошуку
• зв’язки між джерелами
• результати перевірок
• дедуплікацію та стиснення даних
• контроль контекстного бюджету

Цікаво й те, що модель навчали на порівняно невеликому обсязі даних: усього 899 SFT-траєкторій і RL на 3453 запитах. Автори вважають, що значну частину потрібної поведінки можна винести в сам harness, а не зашивати у ваги моделі

Найцікавіший результат — переносність. На нових бенчмарках, яких модель не бачила під час навчання, приріст виявився ще вищим, ніж на вихідних задачах.

Paper : arxiv.org/abs/2606.02373
Code : pat-jj/harness-1github.com/pat-jj/harness-1
Model : pat-jj/harness-1huggingface.co/pat-jj/harness-1
HF Paper: https://huggingface.co/papers/2606.02373

Поділитися:

Автор

Адміністратор блогу VibeCode. Пишу про vibe coding, AI та open source.

Коментарі

Щоб залишити коментар, увійдіть або зареєструйтеся

Завантаження...

Схожі статті

Microsoft випустила клієнт OpenClaw з MXC для безпечних AI-агентів

Офіційний клієнт OpenClaw від Microsoft: дозволи, керування з трея та запуск у контейнерах на базі Execution Containers (MXC). Open source.

5 open-source no-code платформ для LLM, RAG та AI-агентів

Огляд 5 open-source no-code платформ для створення LLM, RAG і AI-агентів: AutoAgent, AnythingLLM, Open Agent Platform, Sim та Dify.

NVIDIA SkillSpector: open-source інструмент для пошуку вразливостей

NVIDIA випустила SkillSpector — open-source інструмент для пошуку вразливостей в Agent Skills: prompt injection, витоки даних, залежності та код.