Τεχνολογία

Το AI του DeepMind δεν αντιμετώπισε το τεστ μαθηματικών μαθημάτων

Στα μέσα ενημέρωσης πρόσφαταπολύ συχνά υπάρχουν στιγμιαίες εξελίξεις στην ταχεία ανάπτυξη της τεχνολογίας τεχνητής νοημοσύνης. Επιπλέον, σε ορισμένους τομείς, η ΑΠ είναι ήδη σε θέση να επιδείξει εξαιρετική επιτυχία και σε κάποιο βαθμό ακόμη υπεροχή έναντι του ανθρώπου. Δεν υπάρχει λόγος να πάτε μακριά για παραδείγματα. Ο ιστότοπος Hi-News.ru έγραψε περισσότερες από μία φορές σχετικά με τον τρόπο με τον οποίο η AI νικήσει έναν άνθρωπο στο παιχνίδι επιτραπέζιου παιχνιδιού λογικής, σκάκι και πιο πρόσφατα έδειξε εξαιρετική πρόοδο στο παιχνίδι στρατηγικής StarCraft για υπολογιστή. Στην πραγματικότητα, υπάρχουν πολλά άλλα τέτοια παραδείγματα και δεν συνδέονται απαραίτητα με τους κλάδους ψυχαγωγίας.

Ένας απλός άνθρωπος στο δρόμο (ένα άτομο που δεν έχει συνδεθεί μεIT-σφαίρα) μπορεί να φαίνεται ότι πρόκειται να εμφανιστεί μια πραγματική "μεγάλη" τεχνητή νοημοσύνη, για την οποία γράφω συγγραφείς μυθοπλασίας και κάνω ταινίες. Αλλά στην πραγματικότητα, δεν είναι τόσο ροζ. Ο ηλεκτρονικός χώρος αποθήκευσης επιστημονικών άρθρων arXiv έχει ένα άρθρο με τίτλο «Αναλύοντας τις Μαθηματικές Λογοτεχνικές Ικανότητες των Νευρωνικών Μοντέλων», το οποίο αναφέρει πώς η τεχνητή νοημοσύνη του DeepMind απέτυχε να αντιμετωπίσει την τυποποιημένη μαθηματική δοκιμασία που συνήθως περάσουν οι μαθητές των γυμνασίων.

Οι λόγοι για την αποτυχία μπορούν να εξηγηθούν εύκολα. Έτσι, ένα πρόσωπο στην επίλυση των μαθηματικών προβλημάτων περιλαμβάνει τις ακόλουθες ικανότητες και δυνατότητες:

  • Τροποποιεί κατ 'ουσίαν τους χαρακτήρες, όπως αριθμούς, αριθμητικούς χειριστές, μεταβλητές (οι οποίοι μαζί αποτελούν λειτουργίες) και λέξεις (ορίζοντας το ερώτημα, την έννοια του προβλήματος).
  • Διεξάγει σχεδιασμό (για παράδειγμα, ταξινομώντας τις λειτουργίες με τη σειρά που απαιτείται για την επίλυση ενός μαθηματικού προβλήματος).
  • Χρησιμοποιεί βοηθητικούς αλγορίθμους για συνθέσεις σύνθεσης (προσθήκη, πολλαπλασιασμός).
  • Χρησιμοποιεί βραχυπρόθεσμη μνήμη για την αποθήκευση ενδιάμεσων τιμών (για παράδειγμα, h (f (x))).
  • Ισχύει στην πρακτική της προηγούμενης γνώσης των κανόνων, μετασχηματισμών, διαδικασιών και αξιωμάτων.

Το DeepMind εκπαιδεύτηκε και εξέτασε το AI σαςεπιλογή διαφόρων τύπων μαθηματικών προβλημάτων και προβλημάτων. Οι προγραμματιστές δεν χρησιμοποίησαν το crowdsourcing, αλλά συνένωσαν ένα σύνολο δεδομένων για να δημιουργήσουν ένα μεγάλο αριθμό δοκιμαστικών προβλημάτων, να ελέγξουν το επίπεδο πολυπλοκότητάς τους κλπ. Η ομάδα ανάπτυξης χρησιμοποίησε τη μορφή δεδομένων "ελεύθερης μορφής".

Τα δεδομένα βασίστηκαν σε καθήκοντα από σύνολα καθηκόντων για βρετανούς μαθητές ηλικίας κάτω των 16 ετών. Τα καθήκοντα ελήφθησαν από τομείς όπως η αριθμητική, η άλγεβρα, η θεωρία πιθανοτήτων και άλλοι.

Όταν επιλέγετε μια αρχιτεκτονική νευρωνικού δικτύου για να λύσετεμαθηματικά προβλήματα, η ομάδα DeepMind επικεντρώθηκε σε LSTM (μακρά βραχυπρόθεσμη μνήμη) και Transformer (αρχιτεκτονική νευρωνικών δικτύων για εργασία με αλληλουχίες). Οι ειδικοί εξέτασαν δύο μοντέλα LSTM για εργασία με μαθηματικά προβλήματα: απλά LSTM και Attentional LSTM. Το σχήμα εργασίας του φαίνεται στο παρακάτω σχήμα.

Προσεκτική Αρχιτεκτονική LSTM

Μοντέλο αρχιτεκτονικής μετασχηματιστή

Στο άρθρο που περιγράφει τα αποτελέσματα αυτού του γεγονότοςοι ερευνητές σημειώνουν ότι αυτά τα αποτελέσματα δεν ήταν πολύ καλά. Η τεχνητή νοημοσύνη ήταν σε θέση να αντιμετωπίσει μόνο το 35% των καθηκόντων (από 40 υποβαλλόμενα καθήκοντα), δίνοντάς τους τις σωστές απαντήσεις. Με τα πρότυπα οποιουδήποτε σχολείου - μη ικανοποιητική.

Μπορείτε να συζητήσετε τα νέα στην Τηλεδιάσκεψη μας.