Recherche

Le créateur d'assistants virtuels estime qu'ils sont condamnés sans une nouvelle approche dans le domaine de l'IA

Boris Katz construit une carrière en aidant les machinesmaîtriser la langue. Il pense que les technologies d’intelligence artificielle actuelles ne suffisent pas à rendre Siri ou Alexa vraiment intelligentes. Siri, Alexa, Google Home - les technologies d’analyse de la langue trouvent de plus en plus leur application dans la vie quotidienne. Mais Boris Katz, directeur de la recherche au MIT, n’est pas impressionnant. Au cours des 40 dernières années, il a apporté une contribution essentielle aux capacités linguistiques des machines.

Dans les années 1980, il développa le système START, capable derépondre aux requêtes en langage naturel. Les idées utilisées dans START ont aidé Watson à gagner à Jeopardy! et jeté les bases du chatbot d'aujourd'hui.

Mais maintenant, Katz craint que cette zoneIl est basé sur des idées qui ont été pendant de nombreuses années, et ces idées ne rapprochent pas l’intelligence artificielle de la réalité. MIT Technolody Review a interviewé Boris Katz. Voyons où vous devez diriger vos recherches pour rendre les voitures plus intelligentes.

Comment rendre l'intelligence artificielle vraiment intelligente

Comment votre histoire d'apprentissage informatique a-t-elle commencé?

J'ai rencontré des ordinateurs pour la première fois dans les années 1960ans, en tant qu'étudiant à l'Université de Moscou. La voiture que j'ai utilisée s'appelait BESM-4. Seul le code octal pourrait être utilisé pour communiquer avec lui. Mon premier projet informatique consistait à enseigner à l'ordinateur à lire, à comprendre et à résoudre des problèmes mathématiques.

Puis j'ai développé un programme informatiqueécrire des poèmes. Je me souviens encore de ma position dans la salle des machines, dans l'attente du prochain poème créé par la machine. J'ai été abasourdi par la beauté des poèmes; il semblait qu'ils aient été créés par un être intelligent. À ce moment-là et là-bas, j'ai réalisé que je voulais travailler toute ma vie à la création de machines intelligentes et à la recherche de moyens de communiquer avec elles.

Que pensez-vous de Siri, Alexa et d'autres assistants personnels?

C'est drôle d'en parler, parce que, d'une part, nous sommes très fiers de ces progrès incroyables - chacun dans sa poche a quelque chose que nous avons aidé à créer il y a de très nombreuses années, et c'est merveilleux.

Mais d'un autre côté, ces programmes sont incroyablement stupides. Donc, un sentiment de fierté est entrecoupé d'un sentiment de honte. Vous dirigez quelque chose que les gens considèrent comme raisonnable, mais ce n’est même pas proche.

Grâce à l'apprentissage automatique, l'intelligence artificielle a considérablement progressé. Cela ne rend-il pas les voitures plus compréhensibles pour les langues?

D'une part, il y a cette dramatiqueprogrès, mais en revanche, une partie de ces progrès est gonflée. Si vous regardez les acquis de l’apprentissage automatique, toutes les idées sont apparues il ya 20-25 ans. En conséquence, les ingénieurs ont fait un excellent travail et ont concrétisé ces idées. Quelle que soit la qualité de cette technologie, elle ne résoudra pas le problème de la compréhension réelle - de la véritable intelligence.

À un très haut niveau, les méthodes modernes -Les méthodes statistiques, telles que l'apprentissage automatique et l'apprentissage en profondeur, sont très efficaces pour trouver des modèles. Et puisque les gens produisent généralement les mêmes phrases la plupart du temps, il est très facile de les trouver dans la langue.

Regardez le texte prédictif. La machine sait mieux ce que vous allez dire. Vous pouvez appeler cela raisonnable, mais en fait, elle compte simplement des mots et des chiffres. Puisque nous disons constamment la même chose, il est très facile de créer des systèmes qui capturent les modèles et se comportent comme s’ils étaient raisonnables. C'est la nature fictive de la plupart des progrès modernes.

Que diriez-vous d'un outil «dangereux» pour générer un langage récemment introduit par OpenAI?

Ces exemples sont vraiment impressionnants, mais je neJe comprends tout à fait ce qu'ils nous apprennent. Le modèle de langage OpenAI a été formé sur 8 millions de pages Web pour prédire le mot suivant, en tenant compte de tous les mots précédents d'un texte donné (sur le même sujet). Cet énorme apprentissage assure assurément la cohérence locale (syntaxique et même sémantique) du texte.

Pourquoi pensez-vous que l'intelligence artificielle va dans la mauvaise direction?

Dans le traitement de la langue, comme dans d’autres domaines,Des progrès ont été réalisés dans les modèles de formation sur d’énormes quantités de données - des millions de phrases. Mais le cerveau humain ne peut pas apprendre une langue en utilisant un tel paradigme. Nous ne laissons pas nos enfants avec une encyclopédie dans le berceau, en espérant qu’ils apprennent la langue.

Quand on voit quelque chose, on le décrit en langage;Lorsque nous entendons quelqu'un dire quelque chose, nous imaginons comment les objets et les événements décrits se présentent dans le monde. Les gens vivent dans un environnement physique rempli de données sensorielles visuelles, tactiles et linguistiques, et la nature excessive et complémentaire de ces entrées permet aux enfants de comprendre le monde tout en apprenant une langue. Peut-être qu'en étudiant ces méthodes séparément, nous avons rendu le problème plus difficile et non plus facile?

Pourquoi le sens commun est-il important?

Supposons que votre robot vous aide à collecter des objets etvous lui dites: "Ce livre ne rentrera pas dans la case rouge, car il est trop petit." Bien sûr, vous voulez que le robot comprenne que la case rouge est trop petite et vous pouvez poursuivre la conversation. Mais si vous dites au robot: «Ce livre ne rentrera pas dans la boîte rouge, car il est trop gros», le robot doit deviner que ce livre est très gros, et non une boîte.

Comprendre le contenu de la conversationl'envoi est très important et les gens le font tous les jours. Cependant, comme vous avez pu le constater à partir de ces exemples et d’autres, il s’appuie souvent sur une compréhension profonde du monde qui n’est actuellement pas disponible pour nos machines: compréhension du sens commun et de la physique intuitive, compréhension des croyances et des intentions des autres, capacité de visualisation et de et conséquence, et bien plus encore.

Vous essayez d'enseigner le langage à des machines à l'aide de mondes physiques simulés. Pourquoi

Je n'ai pas vu d'enfant dont les parents ont misEncyclopédie dans la crèche et dites: "Va apprendre." Mais nos ordinateurs font de même aujourd'hui. Je ne pense pas que ces systèmes vont apprendre ce que nous voulons ou comprendre le monde comme nous le voulons.

Dans le cas des enfants, ils reçoivent immédiatementsensations tactiles du monde. Ensuite, les bébés commencent à voir le monde et absorbent les événements et les propriétés des objets. Ensuite, l'enfant entend la langue saisie. Et c'est le seul moyen de créer la magie de la compréhension.

Quelle est la meilleure approche?

Une façon d'avancer est deacquérir une compréhension plus profonde de l'intelligence humaine, puis utiliser cette compréhension pour créer des machines intelligentes. La recherche sur l'IA devrait reposer sur les idées de la psychologie du développement, des sciences cognitives et des neurosciences, et les modèles d'IA devraient refléter ce que l'on sait déjà sur la façon dont les gens étudient et comprennent le monde.

Les vrais progrès ne commenceront que lorsqueles scientifiques sortiront de leurs bureaux et commenceront à communiquer avec des personnes d'autres domaines. Ensemble, nous nous approcherons de la compréhension de l'intellect et de la façon de le reproduire dans des machines intelligentes capables de parler, de voir et d'agir dans notre monde physique.

Êtes-vous d'accord avec Boris? Dites-nous dans notre conversation dans Telegram.