Teknologi

DeepMind's AI klarte ikke at holde sig til matematikprøven

I medierne sidstmeget ofte er der blink af den hurtige udvikling af kunstig intelligens teknologi. Desuden kan AI på nogle områder allerede demonstrere enestående succes og til en vis grad endog overlegenhed over mennesket. Der er ingen grund til at gå langt for eksempler. Hjemmesiden Hi-News.ru skrev mere end en gang om, hvordan AI besejrer en mand i go-board-spillet af logik, skak og for nylig viste fremragende fremskridt i StarCraft computers strategispil. Faktisk er der mange flere sådanne eksempler, og de er ikke nødvendigvis relateret til underholdningsdisciplinerne.

En simpel mand på gaden (en person, der ikke er forbundet medIT-sfære) kan det virke som om en ægte "stor" kunstig intelligens er ved at blive vist, om hvilken jeg skriver skribenter og laver film. Men faktisk, ikke så rosenrødt. Online-arkiveret af videnskabelige artikler ArXiv har en artikel med titlen "Analyse af Matematiske Reasoning Abilities of Neural Models", der fortæller, hvordan DeepMinds kunstige intelligens ikke klare den standard matematiske test, som britiske gymnasieelever normalt passerer, rapporterer Medium.com.

Årsagerne til fejlen kan forklares let. Således involverer en person i løsning af matematiske problemer følgende evner og evner:

  • Ændrer i sig selv tegn i det væsentlige, såsom tal, aritmetiske operatører, variabler (som sammen danner funktioner) og ord (definerer spørgsmålet, meningen med problemet);
  • Udfører planlægning (for eksempel rangordningsfunktioner i den rækkefølge, der kræves for at løse et matematisk problem);
  • Bruger hjælpalgoritmer til at komponere funktioner (tilføjelse, multiplikation);
  • Bruger kortvarig hukommelse til at gemme mellemværdier (fx h (f (x)));
  • Gælder for praksis af tidligere opnået viden om regler, transformationer, processer og aksiomer.

DeepMind uddannet og testet din AI påudvælgelse af forskellige typer af matematiske problemer og problemer. Udviklerne brugte ikke crowdsourcing, men i stedet syntetiserede de et datasæt for at generere et stort antal testproblemer, kontrollere deres niveau af kompleksitet osv. Udviklingsholdet benyttede "free form" tekstdataformatet.

Dataene var baseret på opgaver fra opgaver til britiske skolebørn under 16 år. Opgaver blev taget fra områder som aritmetik, algebra, sandsynlighedsteori og andre.

Når du vælger et neuralt netværk arkitektur at løsematematikproblemer fokuserede DeepMind-teamet på LSTM (lang korttidshukommelse) og Transformer (neuralt netværkarkitektur til at arbejde med sekvenser). Specialisterne testede to LSTM modeller til at arbejde med matematiske problemer: simple LSTM og Attentional LSTM. Hans arbejdsplan er vist i nedenstående figur.

Attentional LSTM Architecture

Transformer Arkitektur Model

I artiklen beskrives resultaterne af detteForskning bemærker, at disse resultater ikke var meget gode. Kunstig intelligens var i stand til at klare kun 35 procent af opgaverne (ud af 40 opgaver indsendt), hvilket gav dem de rigtige svar. Ved alle skolers standarder - utilfredsstillende.

Du kan diskutere nyhederne i vores telegram-chat.