Technology

Удосконалення алгоритмів ІІ призведе до революції в протезуванні

Навчання штучного інтелекту звикористанням методу проб і помилок, коли комп'ютера «скармливаются» записи величезної кількості вже відіграних партій, на основі яких він відточує свою майстерність, довело, що машина здатна здолати людину в таких класичних настільних іграх, як шахи і логічна гра го. З найбільш свіжих прикладів можна вважати недавню нищівну перемогу комп'ютера над людиною в стратегічній комп'ютерній грі StarCraft II, де машину навчали за тим же принципом. Однак інша група фахівців в області ІІ показала, що даний метод навчання можна використовувати і для більш практичних завдань, наприклад, для тренування роботизованих протезів.

Метод машинного навчання з підкріпленням(Reinforcement learning), при якому випробувана система навчається, взаємодіючи з деякою середовищем, показав багатообіцяючі результати в ході невеликого експерименту за участю пари добровольців - одним повністю здоровою людиною і одним з ампутованою вище коліна ногою.

При використанні традиційних методів технікамзвичайно потрібно кілька годин для того, щоб правильно налаштувати роботизований протез, вручну відрегулювати кожне штучне зчленування і подстроив його під певний стиль ходьби до якого звик людина. Експеримент фахівців з Університету штату Північна Кароліна показав, що метод машинного навчання з підкріпленням дозволяє робити це набагато швидше - вже через 10 хвилин після повністю автоматичної настройки людина може плавно ходити.

«До реального застосування цієї технології щедуже і дуже далеко. Ми лише показали, що це можливо. Результат нас захопив », - коментує Хелен Хуанг, професор біоінженерії з Університету штату Північна Кароліна.

Хуанг з колегами опублікували свої висновки вжурналі IEEE Transactions on Cybernetics. Результати їх роботи можуть стати важливим першим кроком у напрямку автоматизації типових процесів ручної настройки роботизованих кінцівок, яка як правило займає досить багато часу і вимагає від пацієнтів відвідування фахівців щоразу, коли протези вимагають регулювання. У перспективі всі ці настройки люди зможуть виконувати вдома самостійно, не вдаючись до допомоги техніків.

Сама настройка роботизованого протезаявляє собою комплексний процес підгонки різних параметрів, що визначають рівні взаємодії між кінцівку і протезом необхідних при виконанні тих чи інших завдань. Наприклад, деякі параметри визначають рівень жорсткості роботизованого колінного зчленування або діапазон відхилень, припустимих при коченні ноги вперед і назад. В обговорюваному випадку коліно роботизованого протеза вимагало настройки 12 різних параметрів. При стандартному підході кінцевий результат як правило виходив далекий від ідеального, але тим не менше був цілком придатний для того, щоб людина могла вставати на протез і зробити прості рухи.

Тренування роботизованою кінцівки - цедуже складний процес коадаптаціі. Протез в буквальному сенсі повинен навчитися працювати в парі з людським мозком, керуючим взаємним пристосуванням органів в цілому організмі. При цьому, вчити ходити потрібно не тільки сам протез, але і людини. Як правило перші результати виглядають досить незграбно - недалеко від прикладів з лижами або ковзанами, на які людина вперше встав.

«Наше тіло може досить дивно реагувати насторонні об'єкти, що імітують його продовження. У певному сенсі наш комп'ютерний алгоритм машинного навчання з підкріпленням вчиться взаємодії з тілом людини », - говорить співавтор опублікованого дослідження Дженні Сі, професор електронної, комп'ютерної інженерії та енергетики з Державного університету Аризона.

Завдання з навчання роботизованих протезівускладнюється ще й вельми обмеженим набором доступних для навчання алгоритму даних. Наприклад, для навчання своїх алгоритмів AlphaZero і AlphaStar для гри в шахи, го і StarCraft II компанія DeepMind використовувала записи мільйонів уже зіграних партій цих ігор. У свою чергу людина з ампутованою кінцівкою для збору потрібних даних для навчання алгоритму не зможе ходити дуже тривалий кількість часу. Наприклад, ті, хто відвідав лабораторію Хуанг могли ходити без зупинки тільки 15-20 хвилин, після чого їм був потрібний невеликий відпочинок.

Але це далеко не всі складнощі і обмеження, що нещо дозволяють охопити весь спектр навчальної інформації, відзначають дослідники. Наприклад, навіть між Сі і Хуанг перед початком свого проекту виник певний спір на тему того, чи можна дозволяти добровольцям, які беруть участь в експерименті, падати, щоб алгоритм зміг навчитися і цієї інформації. У підсумку від цієї ідеї вирішили відмовитися, списавши на безпеку добровольців.

І все-таки, навіть не дивлячись на всі ці складностіперші результати вразили. Дослідники навчили алгоритм визначати конкретні закономірності в даних, зібраних сенсорами, встановленими в роботизованому коліні. Це в свою чергу дозволило встановити поріг функціональності роботизованого протеза, що дозволило уникнути небажаних ситуацій, які могли б привести до падіння. В кінцевому підсумку алгоритм навчився спиратися на певний шаблон дій, що дозволило добитися стабільності, плавності і більшої природності в русі роботизованою кінцівки.

Автоматизований підхід навчанняроботизованих кінцівок поки ще дуже далекий від масового застосування. Зараз вчені хочуть навчити алгоритм плавного управління протезом при вставанні, підйомі (наприклад, зі стільця) і спуску (наприклад, по сходах). Крім того, стоїть завдання зробити систему більш автономною, що дозволить проводити тренування і настройку протезів не тільки в лабораторних умовах.

Однією з найскладніших і в той же час найважливішихзадач, на думку дослідників, є розробка методу «спілкування» алгоритму і людини, щоб останній міг говорити йому, яка з обраних налаштувань протеза найбільш зручна. Ранні спроби вирішити цю задачу через звичайні кнопки та інші прості методи введення інформації виявилися малоефективними. Можливо, частково тому, що такий варіант інтерфейсу «комп'ютер-машина» не дозволяє передати всю повноту картини сприйняття координації людиною.

«Цей метод не спрацював тому, що ми не докінця розуміємо всі особливості людського організму. Перш за все потрібно заповнити деякі прогалини в фундаментальних знаннях про психологію і фізіології », - підсумовує Хуанг.

Перспективи розвитку роботизованих протезів на базі штучного інтелекту можна обговорити в нашому Telegram-чаті.