Додому Ultime notizie e articoli Oltre la riqualificazione: come le “abilità del ricordo” consentono agli agenti IA...

Ultime notizie e articoli

Oltre la riqualificazione: come le “abilità del ricordo” consentono agli agenti IA di apprendere al volo

по

09.04.2026

L’ostacolo più grande nell’implementazione di agenti IA autonomi è la loro tendenza a rimanere “congelati”. Una volta addestrato e implementato un Large Language Model (LLM), la sua conoscenza è fissa. Se il mondo cambia o un processo aziendale si evolve, il modello non può adattarsi senza un processo di riqualificazione o messa a punto costoso e dispendioso in termini di tempo.

Un nuovo framework chiamato Memento-Skills mira a superare questo collo di bottiglia. Sviluppato da un gruppo di ricerca multiuniversitario, il framework consente agli agenti di intelligenza artificiale di sviluppare, affinare e riscrivere le proprie competenze senza mai toccare il modello sottostante.

Il problema: i limiti dell’intelligenza “congelata”.

Gli attuali agenti IA soffrono in genere di tre principali punti deboli quando cercano di adattarsi a nuovi compiti:

Conoscenza statica: una volta distribuito, un LLM è limitato ai suoi dati di addestramento e alla sua “finestra di contesto” immediata. Non può naturalmente diventare più intelligente attraverso l’esperienza.
Overhead manuale: per migliorare un agente in un’attività specifica, gli sviluppatori attualmente devono scrivere manualmente nuovi prompt o ottimizzare i pesi del modello, un processo lento e costoso dal punto di vista operativo per le aziende.
La “trappola della somiglianza”: La maggior parte dei sistemi attuali utilizza la Retrieval-Augmented Generation (RAG) per trovare informazioni. Tuttavia, RAG si basa spesso sulla somiglianza semantica, nel senso che cerca parole che sembrano correlate. Questo è rischioso; un agente potrebbe recuperare uno script di “reimpostazione della password” per risolvere una richiesta di “rimborso” semplicemente perché entrambi coinvolgono la terminologia aziendale. Negli ambienti ad alto rischio, la somiglianza semantica non equivale all’utilità funzionale.

Come funziona Memento-Skills: una memoria esterna in evoluzione

Invece di trattare la memoria come un registro passivo delle chat passate, Memento-Skills la tratta come una libreria in evoluzione di strumenti eseguibili.

Il framework funziona come un “agente di progettazione dell’agente”. Crea e mantiene una raccolta di artefatti di abilità archiviati come file Markdown strutturati. Ogni abilità è composta da tre componenti vitali:
* Specifiche dichiarative: Una descrizione di cosa fa l’abilità e quando usarla.
* Istruzioni di ragionamento: Suggerimenti specializzati che guidano la logica del LLM.
* Codice eseguibile: gli script o gli strumenti effettivi eseguiti dall’agente per completare l’attività.

Il ciclo “riflessivo di lettura-scrittura”.

Il sistema non si limita a memorizzare i dati; apprende attivamente attraverso un processo chiamato Apprendimento riflessivo lettura-scrittura :
1. Recupera: un router specializzato seleziona l’abilità più comportamentalmente rilevante (non solo quella più simile).
2. Esegui: l’agente tenta l’attività utilizzando la competenza scelta.
3. Riflessione e modifica: se l’attività fallisce, un “orchestratore” analizza l’errore. Invece di limitarsi a registrare l’errore, riscrive l’abilità. Corregge il codice, regola le istruzioni o crea una competenza completamente nuova per evitare che lo stesso errore si ripeta.

Per garantire che questi aggiornamenti scritti autonomamente non rompano il sistema, Memento-Skills utilizza un cancello automatico di test delle unità. Ogni abilità nuova o modificata deve superare un test sintetico prima di essere aggiunta ufficialmente alla libreria globale.

Risultati comprovati: scalabilità da 5 a 235 abilità

In test rigorosi utilizzando i benchmark GAIA (ragionamento complesso) e HLE (accademico di livello esperto), Memento-Skills ha sovraperformato significativamente i modelli statici:

Su GAIA: la precisione è balzata dal 52,3% al 66,0% rispetto ai valori di riferimento statici.
Su HLE: Performance più che raddoppiata, passando dal 17,9% al 38,7%.
Efficienza: Il sistema ha dimostrato una notevole crescita organica. Partendo da sole cinque competenze di base (come la ricerca sul Web), l’agente ha ampliato autonomamente la propria libreria a 41 competenze per compiti generali e fino a 235 competenze per materie accademiche complesse.

Prospettive aziendali: dove implementare

Per le aziende, il valore di Memento-Skills risiede nell’automazione del flusso di lavoro. I ricercatori notano che il quadro è più efficace in ambienti con modelli strutturati e ricorrenti in cui le competenze possono essere riutilizzate e perfezionate.

Tuttavia, ci sono alcune avvertenze per l’adozione immediata:
* Compiti isolati: Se i compiti sono completamente casuali e non correlati, l’agente non può “trasferire” la conoscenza dall’uno all’altro, limitando i benefici dell’apprendimento.
* Attività fisiche/a lungo orizzonte: La gestione di robot fisici o catene decisionali a più fasi estremamente lunghe richiede ancora un coordinamento più avanzato di quello attualmente fornito da questo quadro.
* Governance: man mano che gli agenti iniziano a riscrivere il proprio codice, le aziende avranno bisogno di robusti “sistemi di giudizio” per garantire che questo auto-miglioramento rimanga sicuro e allineato con gli obiettivi aziendali.

Conclusione
Memento-Skills rappresenta un passaggio dall’IA che semplicemente recupera informazioni all’IA che crea capacità. Consentendo agli agenti di aggiornare autonomamente i propri toolkit eseguibili, il framework fornisce un percorso scalabile e a basso costo verso un apprendimento permanente veramente adattivo negli ambienti di produzione.

Oltre la riqualificazione: come le “abilità del ricordo” consentono agli agenti IA di apprendere al volo

Il problema: i limiti dell’intelligenza “congelata”.

Come funziona Memento-Skills: una memoria esterna in evoluzione

Il ciclo “riflessivo di lettura-scrittura”.

Risultati comprovati: scalabilità da 5 a 235 abilità

Prospettive aziendali: dove implementare

Це цікаво!

Найкращий рюкзак ноутбука в 2025 році (Великобританія)

Шотландія – Греція: пряма трансляція відбіркового матчу ЧС-2026 з будь-якої точки...

Agenti IA: colmare il divario tra demo e implementazione

Футбол Прем’єр -Ліга: Челсі Потік проти Фулхема, живе з будь -якого...

Grandi saldi primaverili di Amazon: le migliori offerte sugli altoparlanti Bluetooth...

ВИБІР РЕДАКТОРА

L’intelligenza artificiale come ultima risorsa: i pazienti si rivolgono ai chatbot...

Il senatore Murphy sulla corruzione di Trump: una resa dei conti...

AI e corsa allo spazio: le dinamiche del mercato privato cambiano...

ПОПУЛЯРНІ ПОВІДОМЛЕННЯ

Aumenta la tua produttività: ottieni Microsoft Office Professional Plus 2019 a...

Consulente politico italiano afferma di essere stato spiato utilizzando lo spyware...

La causa sostiene che OpenAI ha indebolito le misure di sicurezza...

ПОПУЛЯРНА КАТЕГОРІЯ

Сьогоднішні поради, відповіді та довідка NYT Wordle за 29 травня, #1440