Research

Творець віртуальних асистентів вважає, що вони приречені без нового підходу в області ІІ

Борис Кац побудував кар'єру, допомагаючи машинамоволодіти мовою. Він вважає, що нинішніх технологій ІІ недостатньо, щоб зробити Siri або Alexa по-справжньому розумними. Siri, Alexa, Google Home - технології, які аналізують мову, все частіше знаходять своє застосування в повсякденному житті. Але Бориса Каца, головного наукового співробітника MIT, це не вражає. За останні 40 років він вніс ключовий внесок в лінгвістичні здібності машин.

У 1980-х він розробив систему START, здатнувідповідати на сформульовані природною мовою запити. Ідеї, використані в START, допомогли Watson перемогти в Jeopardy! і заклали основу для сьогоднішніх чатбот.

Але зараз Кац стурбований тим, що ця областьспирається на ідеї, яким багато років, а ці ідеї ніяк не наближають машинний інтелект до реального. MIT Technolody Review взяв інтерв'ю у Бориса Каца. Давайте дізнаємося, куди потрібно направляти дослідження, щоб машини стали розумнішими.

Як зробити штучний інтелект по-справжньому розумним

З чого почалася ваша історія навчання комп'ютерів використанню мови?

Вперше я зіткнувся з комп'ютерами в 1960-хроках, будучи студентом Московського університету. Машина, якою я користувався, називалася БЕСМ-4. Для зв'язку з нею можна було використовувати тільки восьмеричний код. Мій перший комп'ютерний проект включав навчання комп'ютера читання, розуміння і вирішення математичних задач.

Потім я розробив комп'ютерну програму,друкарську вірші. Я до сих пір пам'ятаю, як стояв у машинної кімнаті в очікуванні чергового вірша, створеного машиною. Я був приголомшений красою віршів; здавалося, що вони створені розумною істотою. І тоді і там я зрозумів, що хочу все життя працювати над створенням інтелектуальних машин і пошуком способів спілкування з ними.

Що ви думаєте про Siri, Alexa та інших особистих помічників?

Забавно говорити про це, тому що, з одного боку, ми дуже пишаємося цим неймовірним прогресом - у кожного в кишені є щось, що ми допомогли створити багато-багато років тому, і це чудово.

Але з іншого боку, ці програми неймовірно дурні. Так що почуття гордості перемежовується почуттям сорому. Ви запускаєте щось, що люди вважають за доцільне, але воно навіть і близько не таке.

Завдяки машинного навчання, в штучному інтелекті відбувся значний прогрес. Хіба це не робить машини краще в розумінні мови?

З одного боку, є цей драматичнийпрогрес, але з іншого - частина цього прогресу роздута. Якщо ви подивіться на досягнення машинного навчання, всі ідеї з'явилися 20-25 років тому. Просто інженери в підсумку виконали велику роботу і втілили ці ідеї в життя. Який би ця технологія великої не була, вона не вирішить проблему справжнього розуміння - справжнього інтелекту.

На дуже високому рівні сучасні методи -статистичні методи, такі як машинне навчання і глибоке навчання, дуже гарні для знаходження закономірностей. І оскільки люди зазвичай виробляють одні й ті ж пропозиції більшу частину часу, їх дуже легко знайти в мові.

Подивіться на інтелектуальне введення тексту. Машина краще вас знає, що ви збираєтеся сказати. Ви можете назвати це розумною, але насправді вона просто вважає слова і цифри. Оскільки ми постійно говоримо одне й те саме, дуже легко створювати системи, які ловлять закономірності і поводяться так, ніби вони розумні. Це фіктивний характер більшої частини сучасного прогресу.

Як щодо «небезпечного» інструменту генерації мови, представленого недавно OpenAI?

Ці приклади дійсно вражають, але я незовсім розумію, чим вони нас вчать. Мовна модель OpenAI була навчена на 8 мільйона веб-сторінок, щоб передбачати наступне слово, з огляду на всі попередні слова в певному тексті (на таку ж тему). Цей величезний обсяг навчання, безумовно, забезпечує локальну узгодженість (синтаксичну і навіть семантичну) тексту.

Як ви думаєте, чому штучний інтелект рухається в невірному напрямі?

В обробці мови, як і в інших областях, бувдосягнутий прогрес в навчанні моделей на величезних обсягах даних - мільйонах пропозицій. Але людський мозок не може вивчити мову, використовуючи таку парадигму. Ми не залишаємо наших дітей з енциклопедією в ліжечку, чекаючи, що вони освоять мову.

Коли ми бачимо щось, ми описуємо це мовою;коли ми чуємо, як хтось говорить щось, ми представляємо, як описані об'єкти і події виглядають в світі. Люди живуть у фізичному середовищі, наповненою візуальними, тактильними і лінгвістичними сенсорними даними, і надлишковий і взаємодоповнюючий характер цих вводів дозволяє дітям осмислювати світ і одночасно вивчати мову. Можливо, вивчаючи ці методи в окремо, ми зробили проблему складніше, а чи не простіше?

Чому здоровий глузд важливий?

Скажімо, ваш робот допомагає вам збирати речі, іви говорите йому: «Ця книга не поміститься в червону коробку, тому що вона занадто маленька». Звичайно, ви хочете, щоб робот зрозумів, що червона коробка занадто маленька і ви могли продовжити змістовну розмову. Але якщо ви скажете роботу: «Ця книга не поміститься в червону коробку, тому що вона занадто велика», робот повинен здогадатися, що це книга дуже велика, а не коробка.

Розуміння, до якої сутності розмови йдевідсилання, дуже важливо, і люди виконують цю задачу кожен день. Проте, як ви могли бачити з цих та інших прикладів, воно часто спирається на глибоке розуміння світу, який в даний час недоступний для наших машин: розуміння здорового глузду і інтуїтивної фізики, розуміння переконань і намірів інших, здатність візуалізувати і міркувати про причини і слідстві, і багато іншого.

Ви намагаєтеся навчити машини мови, використовуючи симулювати фізичні світи. Чому?

Я ще не бачив дитини, батьки якої кладутьенциклопедію в ліжечко і кажуть: «Іди вчися». Але так роблять наші комп'ютери сьогодні. Я не думаю, що ці системи будуть вчитися так, як ми хочемо, або розуміти світ так, як ми хочемо.

У випадку з дітьми, вони відразу ж отримуютьтактильні відчуття від світу. Потім немовлята починають бачити світ і вбирати події і властивості об'єктів. Потім дитина чує мовної введення. І тільки так твориться магія розуміння.

Який підхід найкращий?

Одним із способів просування вперед будеотримання більш глибокого розуміння людського інтелекту, а потім використання цього розуміння для створення інтелектуальних машин. Дослідження ІІ повинні ґрунтуватися на ідеях психології розвитку, когнітивної науки і нейробіології, а моделі ІІ повинні відображати те, що вже відомо про те, як люди вивчають і розуміють світ.

Реальний прогрес почнеться тільки тоді, коливчені вийдуть зі своїх офісів і почнуть спілкуватися з людьми в інших областях. Разом ми наблизимося до розуміння інтелекту і з'ясування того, як відтворити його в інтелектуальних машинах, які можуть говорити, бачити і діяти в нашому фізичному світі.

Чи згодні з Борисом? Розкажіть в нашому чаті в Телеграма.