Додому Без рубрики Fara-7B від Microsoft: AI Automation Running on Your PC

Fara-7B від Microsoft: AI Automation Running on Your PC

Fara-7B від Microsoft: AI Automation Running on Your PC

Microsoft представила Fara-7B, компактний, але потужний агент штучного інтелекту, призначений для автоматизації завдань безпосередньо на комп’ютері користувача. Ця модель із 7 мільярдів параметрів представляє значну зміну доступності ШІ, пропонуючи продуктивність, порівнянну з більшими хмарними системами, такими як GPT-4o, але без таких же вимог до конфіденційності та ресурсів.

Перехід на AI на пристрої

Протягом багатьох років передовий штучний інтелект вимагав масивної серверної інфраструктури. Fara-7B змінює це, доводячи, що складну автоматизацію можна виконати локально на звичайному обладнанні. Це має значні наслідки для компаній, які мають справу з конфіденційними даними, оскільки усуває ризик витоку інформації із захищеної мережі. Такі галузі, як охорона здоров’я (HIPAA) і фінанси (GLBA), часто потребують суворого контролю даних; Fara-7B робить це керування легким.

Як Fara-7B «бачить» Інтернет

На відміну від традиційних агентів ШІ, які покладаються на приховані структури коду, Fara-7B інтерпретує веб-сторінки так само, як і люди: аналізуючи знімки екрана. Він визначає, де клацати, вводити чи прокручувати, використовуючи візуальні дані на рівні пікселів. Такий підхід дозволяє йому працювати навіть на веб-сайтах із навмисно заплутаним кодом, забезпечуючи ширшу сумісність.

Цей «піксельний суверенітет», як описує провідний старший менеджер із продуктів Microsoft Research Яш Лара, означає, що вся обробка залишається на пристрої користувача, підвищуючи конфіденційність і безпеку.

Продуктивність і ефективність

Fara-7B вже продемонструвала високу продуктивність у тестових тестах. На платформі WebVoyager показник успішності виконання завдань склав 73,5%, перевершивши GPT-4o (65,1%) і UI-TARS-1.5-7B (66,4%). Більше вражає те, що він виконує завдання приблизно вдвічі менше кроків порівняно з моделлю UI-TARS-1.5-7B (16 кроків проти 41).

Захист і контроль користувачів

Незважаючи на свої можливості, Фара-7Б не позбавлений обмежень. Як і будь-який інший штучний інтелект, він іноді може давати неточні результати або мати труднощі зі складними інструкціями. Щоб вирішити цю проблему, Microsoft інтегрувала «переломні моменти» — моменти, коли штучний інтелект призупиняється та запитує схвалення користувача перед виконанням незворотних дій (наприклад, надсилання електронного листа).

Головне – збалансувати безпеку та зручність використання. Магнітний користувальницький інтерфейс Microsoft призначений для полегшення взаємодії між людиною та ШІ, запобігаючи втомі від тверджень і забезпечуючи контроль.

Сила дистиляції

Розробка Fara-7B спирається на техніку, що називається дистиляцією знань, де можливості великих систем штучного інтелекту конденсуються в менших, ефективніших моделях. Замість дорогих анотацій вручну Microsoft використала синтетичний конвеєр даних, де один агент AI («Оркестратор») планував завдання та спрямовував іншого («WebSurfer») сканувати веб-сторінки. Це створило 145 000 прикладів успішних завдань, які потім використовувалися для навчання Fara-7B.

Сама модель побудована на Qwen2.5-VL-7B, обраному через його здатність пов’язувати текстові інструкції з візуальними елементами. Це показує, як розширену поведінку можна вивчити в невеликому пакеті без складного середовища виконання.

Подальший розвиток

Microsoft планує зосередитися на створенні розумніших агентів, а не просто більших. Подальші дослідження вивчатимуть навчання з підкріпленням в ізольованих середовищах, що дозволить моделі навчатися методом проб і помилок у реальному часі.

Модель Fara-7B тепер доступна в Hugging Face і Microsoft Foundry за ліцензією Массачусетського технологічного інституту, але Microsoft застерігає, що вона найкраще підходить для створення прототипів і тестування, а не для критично важливих розгортань.

Хоча ліцензія дозволяє комерційне використання, модель ще не готова до використання у виробництві. Експериментування та розробка концепції заохочуються, але до розгортання в реальному світі слід підходити обережно.

Exit mobile version