テクノロジー

DeepMindのAIが学校の数学テストに対応していませんでした

メディアで最近非常に頻繁に人工知能技術の急速な発展のフラッシュがあります。さらに、いくつかの分野では、AIはすでに目覚しい成功を、そしてある程度は人間に対する優位性さえも示すことができます。実例を探す必要はありません。サイトHi-News.ruは、AIがロジック、チェス、そして最近ではStarCraftのコンピュータ戦略ゲームで優れた進歩を遂げたことで、男をどのように倒すかについて2回以上書いた。実際、そのような例は他にもたくさんあり、それらは必ずしもエンターテインメント分野に関連しているわけではありません。

路上で簡単な人(に接続されていない人IT分野)本当の「大きな」人工知能が現れようとしているように見えるかもしれません。それについてフィクション作家を書いて映画を作ります。しかし実際には、それほどバラ色ではありません。科学論文のオンラインリポジトリarXivには、「ニューラルモデルの数学的推論能力の分析」という記事があります。これは、DeepMindの人工知能が英国の高校生が通常通る標準的な数学的テストにどう対応できなかったかを示します

失敗の理由は簡単に説明できます。したがって、数学的問題を解く人は以下の能力と能力を含みます。

  • 数字、算術演算子、変数(これらは一緒に関数を形成する)、単語(問題の定義、問題の意味)などの本質的に文字を変更します。
  • 計画を実行します(たとえば、数学的問題を解決するために必要な順序で関数をランク付けする)。
  • 関数(加算、乗算)を合成するための補助アルゴリズムを使用
  • 短期間のメモリを使用して中間値を格納します(たとえば、h(f(x)))。
  • 規則、変換、プロセス、および公理に関する以前に取得した知識の実践に適用されます。

DeepMindはあなたのAIをトレーニングしテストしましたさまざまな種類の数学的問題と問題の選択。開発者はクラウドソーシングを使用せずに、代わりにデータセットを合成して多数のテスト問題を生成し、複雑さのレベルを制御するなどしました。開発チームは「自由形式」のテキストデータフォーマットを使用しました。

データは、16歳未満のイギリス人小学生のための一連の課題からの課題に基づいています。タスクは、算術、代数、確率論などの分野から取られました。

解決するニューラルネットワークアーキテクチャを選択するとき数学の問題では、DeepMindチームはLSTM(長期短期記憶)とTransformer(シーケンスを扱うためのニューラルネットワークアーキテクチャ)に焦点を当てました。専門家は、数学的問題を扱うために2つのLSTMモデルをテストしました:単純なLSTMと注意のLSTM。彼の仕事の概要は下図の通りです。

注目のLSTMアーキテクチャ

変圧器アーキテクチャモデル

この結果を説明している記事で調査結果によると、これらの結果はあまり良くありませんでした。人工知能は(提出された40のタスクのうち)35パーセントのタスクにしか対処できず、正しい答えを与えました。どの学校の基準でも - 満足できない。

あなたは私たちの電信チャットでニュースについて議論することができます。

EU向けのFacebook通知! FBコメントを表示および投稿するには、ログインする必要があります。