Больше чем переобучение: как «Memento-Skills» позволяет ИИ-агентам обучаться на лету

по

09.04.2026

Главное препятствие при внедрении автономных ИИ-агентов — их склонность оставаться «застывшими». Как только большая языковая модель (LLM) обучена и развернута, её знания фиксируются. Если мир меняется или бизнес-процессы эволюционируют, модель не может адаптироваться без дорогостоящего и трудоемкого процесса переобучения или тонкой настройки (fine-tuning).

Новая концепция под названием Memento-Skills призвана устранить это «узкое место». Разработанная группой исследователей из нескольких университетов, эта платформа позволяет ИИ-агентам разрабатывать, совершенствовать и переписывать собственные навыки, не затрагивая при этом базовую модель.

Проблема: ограничения «застывшего» интеллекта

Современные ИИ-агенты обычно сталкиваются с тремя основными проблемами при попытке адаптироваться к новым задачам:

Статичные знания: После развертывания возможности LLM ограничены её обучающими данными и текущим «контекстным окном». Она не может естественным образом становиться умнее благодаря полученному опыту.
Ручные трудозатраты: Чтобы улучшить агента в конкретной задаче, разработчикам приходится вручную писать новые промпты или настраивать веса модели — процесс, который медленный и операционно дорогой для предприятий.
«Ловушка сходства»: Большинство современных систем используют генерацию с дополненной выборкой (RAG) для поиска информации. Однако RAG часто опирается на семантическое сходство — то есть ищет слова, которые звучат похоже. Это рискованно: агент может извлечь скрипт «сброса пароля» для решения запроса о «возврате средств» просто потому, что оба понятия относятся к корпоративной терминологии. В критически важных средах семантическое сходство не означает функциональную полезность.

Как работает Memento-Skills: развивающаяся внешняя память

Вместо того чтобы рассматривать память как пассивный лог прошлых чатов, Memento-Skills превращает её в развивающуюся библиотеку исполняемых инструментов.

Фреймворк функционирует как «агент, проектирующий агентов». Он создает и поддерживает коллекцию артефактов навыков, хранящихся в виде структурированных файлов Markdown. Каждый навык состоит из трех жизненно важных компонентов:
* Декларативные спецификации: Описание того, что делает навык и когда его следует использовать.
* Инструкции по рассуждению: Специализированные промпты, направляющие логику LLM.
* Исполняемый код: Непосредственно скрипты или инструменты, которые агент запускает для выполнения задачи.

Цикл «Чтение — Запись — Рефлексия»

Система не просто хранит данные; она активно обучается через процесс, называемый рефлексивным обучением с чтением и записью (Read-Write Reflective Learning) :
1. Извлечение: Специальный маршрутизатор выбирает наиболее поведенчески релевантный навык (а не просто самый похожий по смыслу).
2. Исполнение: Агент пытается выполнить задачу, используя выбранный навык.
3. Рефлексия и мутация: Если задача провалена, «оркестратор» анализирует ошибку. Вместо того чтобы просто зафиксировать промах, он переписывает навык. Он исправляет код, корректирует промпты или создает совершенно новый навык, чтобы предотвратить повторение ошибки.

Чтобы гарантировать, что эти самостоятельно написанные обновления не сломают систему, Memento-Skills использует автоматический шлюз модульного тестирования. Каждый новый или измененный навык должен пройти синтетический тест, прежде чем будет официально добавлен в глобальную библиотеку.

Доказанные результаты: рост с 5 до 235 навыков

В ходе строгих испытаний с использованием бенчмарков GAIA (сложные рассуждения) и HLE (академический уровень эксперта), Memento-Skills значительно превзошла статические модели:

В тестах GAIA: Точность выросла с 52,3% до 66,0% по сравнению со статичными базовыми моделями.
В тестах HLE: Эффективность увеличилась более чем вдвое — с 17,9% до 38,7%.
Эффективность: Система продемонстрировала поразительный органический рост. Начав всего с пяти базовых «затравочных» навыков (таких как поиск в интернете), агент автономно расширил свою библиотеку до 41 навыка для общих задач и до 235 навыков для сложных академических дисциплин.

Перспективы для бизнеса: где внедрять

Для компаний ценность Memento-Skills заключается в автоматизации рабочих процессов. Исследователи отмечают, что фреймворк наиболее эффективен в средах со структурированными, повторяющимися паттернами, где навыки можно использовать повторно и совершенствовать.

Тем не менее, существуют нюансы для немедленного внедрения:
* Изолированные задачи: Если задачи полностью случайны и не связаны друг с другом, агент не сможет «переносить» знания из одной задачи в другую, что ограничит пользу от обучения.
* Физические задачи / задачи с долгосрочным планированием: Управление физическими роботами или крайне длинными цепочками многошаговых решений все еще требует более сложной координации, чем та, которую предоставляет данный фреймворк.
* Управление (Governance): Поскольку агенты начинают переписывать собственный код, компаниям потребуются надежные «системы контроля», чтобы гарантировать, что это самосовершенствование остается безопасным и соответствует бизнес-целям.

Заключение
Memento-Skills представляет собой переход от ИИ, который просто извлекает информацию, к ИИ, который создает возможности. Позволяя агентам автономно обновлять свои наборы инструментов, этот фреймворк предлагает масштабируемый и малозатратный путь к истинному адаптивному обучению на протяжении всей «жизни» системы в реальных рабочих условиях.