Selain Pelatihan Ulang: Bagaimana “Keterampilan Memento” Memungkinkan Agen AI untuk Belajar dengan Cepat

по

maxwelhelp

09.04.2026

Hambatan terbesar dalam menerapkan agen AI otonom adalah kecenderungan mereka untuk tetap “dibekukan.” Setelah Model Bahasa Besar (LLM) dilatih dan diterapkan, pengetahuannya ditetapkan. Jika dunia berubah atau proses bisnis berkembang, model tersebut tidak dapat beradaptasi tanpa proses pelatihan ulang atau penyesuaian yang memakan waktu dan mahal.

Kerangka kerja baru yang disebut Memento-Skills bertujuan untuk memecahkan hambatan ini. Dikembangkan oleh tim peneliti multi-universitas, kerangka kerja ini memungkinkan agen AI untuk mengembangkan, menyempurnakan, dan menulis ulang keterampilan mereka sendiri tanpa pernah menyentuh model yang mendasarinya.

Masalah: Keterbatasan Kecerdasan “Beku”.

Agen AI saat ini biasanya mengalami tiga kelemahan utama ketika mencoba beradaptasi dengan tugas baru:

Pengetahuan Statis: Setelah diterapkan, LLM dibatasi pada data pelatihan dan “jendela konteks” langsungnya. Ia tidak bisa tumbuh lebih pintar secara alami melalui pengalaman.
Manual Overhead: Untuk menjadikan agen lebih baik dalam tugas tertentu, pengembang saat ini harus menulis perintah baru secara manual atau menyempurnakan bobot model—sebuah proses yang lambat dan mahal secara operasional bagi perusahaan.
The “Similarity Trap”: Sebagian besar sistem saat ini menggunakan Retrieval-Augmented Generation (RAG) untuk mencari informasi. Namun, RAG sering kali mengandalkan kesamaan semantik —artinya RAG mencari kata-kata yang terdengar terkait. Ini berisiko; agen mungkin mengambil skrip “reset kata sandi” untuk menyelesaikan permintaan “pengembalian dana” hanya karena keduanya melibatkan terminologi perusahaan. Dalam lingkungan berisiko tinggi, kesamaan semantik tidak sama dengan kegunaan fungsional.

Cara Kerja Memento-Skills: Memori Eksternal yang Berkembang

Daripada memperlakukan memori sebagai log pasif dari obrolan sebelumnya, Memento-Skills memperlakukannya sebagai perpustakaan alat yang dapat dijalankan yang terus berkembang.

Kerangka kerja ini berfungsi sebagai “agen perancang agen”. Itu membangun dan memelihara koleksi artefak keterampilan yang disimpan sebagai file penurunan harga terstruktur. Setiap keterampilan terdiri dari tiga komponen penting:
* Spesifikasi Deklaratif: Deskripsi tentang fungsi keterampilan dan kapan menggunakannya.
* Instruksi Penalaran: Perintah khusus yang memandu logika LLM.
* Kode yang Dapat Dieksekusi: Skrip atau alat sebenarnya yang dijalankan agen untuk menyelesaikan tugas.

Lingkaran “Baca-Tulis Reflektif”.

Sistem tidak hanya menyimpan data; ia belajar secara aktif melalui proses yang disebut Pembelajaran Reflektif Baca-Tulis :
1. Ambil: Router khusus memilih keterampilan yang paling relevan secara perilaku (bukan hanya keterampilan yang paling mirip).
2. Eksekusi: Agen mencoba tugas menggunakan keterampilan yang dipilih.
3. Refleksikan & Mutasi: Jika tugas gagal, “orchestrator” akan menganalisis kesalahan tersebut. Alih-alih hanya mencatat kesalahannya, ia menulis ulang keterampilannya. Ini menambal kode, menyesuaikan petunjuknya, atau menciptakan keterampilan yang benar-benar baru untuk mencegah kesalahan yang sama terjadi lagi.

Untuk memastikan pembaruan yang ditulis sendiri ini tidak merusak sistem, Memento-Skills menggunakan gerbang pengujian unit otomatis. Setiap keterampilan baru atau yang dimodifikasi harus lulus tes sintetik sebelum secara resmi ditambahkan ke perpustakaan global.

Hasil Terbukti: Meningkatkan Keterampilan dari 5 menjadi 235

Dalam pengujian ketat menggunakan tolok ukur GAIA (penalaran kompleks) dan HLE (akademik tingkat pakar), Memento-Skills secara signifikan mengungguli model statis:

Pada GAIA: Akurasi melonjak dari 52,3% menjadi 66,0% dibandingkan dengan garis dasar statis.
Di HLE: Performa meningkat lebih dari dua kali lipat, naik dari 17,9% menjadi 38,7%.
Efisiensi: Sistem ini menunjukkan pertumbuhan organik yang luar biasa. Dimulai dengan hanya lima keterampilan “unggulan” dasar (seperti penelusuran web), agen secara mandiri memperluas perpustakaannya menjadi 41 keterampilan untuk tugas umum dan hingga 235 keterampilan untuk mata pelajaran akademis yang kompleks.

Enterprise Outlook: Tempat Penerapan

Untuk bisnis, nilai Memento-Skills terletak pada otomatisasi alur kerja. Para peneliti mencatat bahwa kerangka kerja ini paling efektif dalam lingkungan dengan pola yang terstruktur dan berulang di mana keterampilan dapat digunakan kembali dan disempurnakan.

Namun, ada peringatan untuk segera diadopsi:
* Tugas Terisolasi: Jika tugas benar-benar acak dan tidak berhubungan, agen tidak dapat “mentransfer” pengetahuan dari satu tugas ke tugas lain, sehingga membatasi manfaat pembelajaran.
* Tugas Fisik/Jarak Panjang: Mengelola robot fisik atau rantai keputusan multi-langkah yang sangat panjang masih memerlukan koordinasi yang lebih canggih dibandingkan yang disediakan oleh kerangka kerja ini.
* Tata Kelola: Saat agen mulai menulis ulang kode mereka sendiri, perusahaan akan memerlukan “sistem penilaian” yang kuat untuk memastikan pengembangan diri ini tetap aman dan selaras dengan tujuan bisnis.

Kesimpulan
Memento-Skills mewakili peralihan dari AI yang hanya mengambil informasi ke AI yang membangun kemampuan. Dengan memungkinkan agen memperbarui perangkat mereka yang dapat dieksekusi secara mandiri, kerangka kerja ini memberikan jalur yang dapat diskalakan dan biaya overhead yang rendah menuju pembelajaran yang benar-benar adaptif dan berkelanjutan dalam lingkungan produksi.