Γενικά

Μια άλλη νίκη του Deep Mind: Μετά το σκάκι και το Go, η Τεχνητή Νοημοσύνη κατέκτησε το StarCraft

Τον Νοέμβριο του 2017, δηλαδή λίγο περισσότερο από ένα χρόνοπριν, γράψαμε ότι η τεχνητή νοημοσύνη δεν είναι ακόμα σε θέση να νικήσει επαγγελματίες παίκτες στο StarCraft. Αλλά λιγότερο από ένα χρόνο, καθώς το εμπόδιο αυτό είχε ληφθεί. Τον περασμένο μήνα, στο Λονδίνο, μια ομάδα από την αγγλική διαίρεση έρευνας τεχνητής νοημοσύνης DeepMind έβαλε ήσυχα έναν νέο ακρογωνιαίο λίθο στην αντιπαράθεση ανθρώπων και υπολογιστών. Την Πέμπτη, αποκάλυψε αυτό το επίτευγμα σε μια ροή τριών ωρών στο YouTube, κατά τη διάρκεια της οποίας οι άνθρωποι και τα ρομπότ πολέμησαν για ζωή και θάνατο.

Το DeepMind νίκησε τους ανθρώπους στο StarCraft

Η εκπομπή DeepMind έδειξε ότι το ρομπότ τηςΤεχνητή νοημοσύνη Το AlphaStar χτυπά έναν επαγγελματία παίκτη σε μια πολύπλοκη στρατηγική StarCraft II σε πραγματικό χρόνο (RTS). Ο πρωταθλητής της ανθρωπότητας, ο 25χρονος Grzegorz Komints από την Πολωνία, πέταξε με 5: 0. Φαίνεται ότι το λογισμικό μηχανικής μάθησης έχει ανακαλύψει στρατηγικές άγνωστες στους επαγγελματίες που ανταγωνίζονται για εκατομμύρια χρηματικά έπαθλα που δίδονται ετησίως σε ένα από τα πιο κερδοφόρα παιχνίδια για τον κόσμο των eSports.

</ p>

"Δεν ήταν σαν να έπαιξα κανένα StarCraft", δήλωσε ο Comince, ένας γνωστός επαγγελματίας με το ψευδώνυμο MaNa.

Το DeepMind είναι το σκληρότερο για πολύη αλυσίδα των διαγωνισμών που οι υπολογιστές επέβαλαν στον καλύτερο κόσμο των ανθρώπων στα παιχνίδια και στην οποία κέρδισαν. Τα πούλια έπεσαν το 1994, το σκάκι το 1997, το 2016 το AlphaGo κατέκτησε το παιχνίδι του πάει. Το ρομπότ StarCraft είναι ο πιο ισχυρός παίκτης στον κόσμο της τεχνητής νοημοσύνης. και η άφιξή του περίμενε.

Το AlphaStar εμφανίστηκε πριν από έξι χρόνια περίπουιστορικό εκμάθησης μηχανών. Αν και η νίκη του AlphaGo το 2016 ήταν συντριπτική - πηγαίνουν οι ειδικοί πιστεύουν ότι αυτή η στιγμή θα έρθει τουλάχιστον δέκα χρόνια αργότερα - η νίκη του AlphaStar φαίνεται να είναι περισσότερο ή λιγότερο έφτασε στο χρονοδιάγραμμα. Μέχρι τώρα, είναι σαφές ότι με αρκετά δεδομένα και υπολογιστική ισχύ, η μηχανική μάθηση μπορεί να αντιμετωπίσει σύνθετα αλλά συγκεκριμένα προβλήματα.

Mark Riedl, Αναπληρωτής Καθηγητής, Ινστιτούτο ΤεχνολογίαςΓεωργία, βρήκαν τα νέα της Πέμπτης συναρπαστικά, αλλά όχι καταπληκτικά. "Έχουμε ήδη φτάσει σε αυτό το σημείο, οπότε ήταν μόνο θέμα χρόνου. Κατά μία έννοια, ήταν βαρετό να κερδίζεις ανθρώπους σε παιχνίδια. "

Τα βιντεοπαιχνίδια όπως το StarCraft είναι μαθηματικά σκληρότερα,από το σκάκι ή να πάει. Ο αριθμός των πραγματικών θέσεων στο σκάφος είναι ένας με 170 μηδενικά και το αντίστοιχο StarCraft βαθμολογείται ως 1 με 270 μηδενικά, όχι λιγότερο. Η δημιουργία και διαχείριση στρατιωτικών μονάδων στο StarCraft απαιτεί από τους παίκτες να επιλέγουν και να εκτελούν πολλές άλλες ενέργειες, καθώς και να λαμβάνουν αποφάσεις χωρίς να είναι σε θέση να βλέπουν κάθε βήμα του αντιπάλου.

Το DeepMind έχει ξεπεράσει αυτά τα απότομα εμπόδιαισχυρά τσιπ TPU που εφευρέθηκε από την Google για να αυξήσει τη δύναμη της μηχανικής μάθησης. Η εταιρεία έχει προσαρμόσει τους αλγορίθμους που έχουν σχεδιαστεί για την επεξεργασία λέξεων στο έργο του καθορισμού ενεργειών στο πεδίο της μάχης που οδηγούν στη νίκη. Το AlphaStar μελέτησε στο StarCraft τα αρχεία μισού εκατομμυρίου παιχνιδιών μεταξύ των ανθρώπων και στη συνέχεια έπαιζε με συνεχώς βελτιούμενους κλώνους του εαυτού του σε ένα εικονικό πρωτάθλημα, το οποίο αντιπροσωπεύει ένα είδος ψηφιακής εξέλιξης. Τα καλύτερα bots που εμφανίστηκαν σε αυτό το πρωτάθλημα συγκέντρωσαν εμπειρία ισοδύναμη με 200 χρόνια παιχνιδιού.

Το AlphaStar, το οποίο νίκησε τη MaNa, απέχει πολύ απόπαντοδύναμος. Προς το παρόν, το ρομπότ μπορεί να παίξει μόνο μία από τις τρεις φυλές που διατίθενται στο StarCraft. Εκτός από την απάνθρωπη μακρά εμπειρία παιχνιδιού, το DeepMind αντιλαμβάνεται επίσης αυτό το παιχνίδι με διαφορετικό τρόπο. Βλέπει όλα όσα συμβαίνουν στο παιχνίδι ταυτόχρονα, ενώ η MaNa χρειάζεται να κινηθεί γύρω από το χάρτη για να δει τι συμβαίνει. Το AlphaStar έχει επίσης μεγαλύτερη ακρίβεια στις μονάδες ελέγχου και στόχευσης από ό, τι ένα άτομο που κατέχει ποντίκι υπολογιστή, αν και ο χρόνος αντίδρασης ενός υπολογιστή είναι μικρότερος από αυτόν ενός επαγγελματία gamer.

Παρά αυτές τις αδυναμίες, ο Riedl και άλλοι ειδικοίχαιρέτισε πλήρως το έργο του DeepMind. "Ήταν πολύ εντυπωσιακό," λέει ο Jie Tan, ένα ανεξάρτητο ερευνητικό ινστιτούτο AI στο OpenAI, το οποίο εργάζεται σε bots που παίζουν το Dota 2, το πιο κερδοφόρο παιχνίδι στον κόσμο για eSports. Τέτοια ακροβατικά βιντεοπαιχνίδια μπορεί να έχουν δυνητικά ωφέλιμες παρενέργειες. Οι αλγόριθμοι και ο κώδικας που χρησιμοποιούσε η OpenAI για την κυριαρχία της Dota πέρυσι έχουν προσαρμοστεί με διαφορετική επιτυχία, ώστε τα χέρια των ρομπότ να είναι πιο ευέλικτα.

Ωστόσο, το AlphaStar απεικονίζει τον περιορισμόσύγχρονα και εξαιρετικά εξειδικευμένα συστήματα μηχανικής μάθησης, λέει ο Julian Togelius, καθηγητής στο Πανεπιστήμιο της Νέας Υόρκης και συγγραφέας πρόσφατου βιβλίου για παιχνίδια και τεχνητή νοημοσύνη. Σε αντίθεση με τον ανθρώπινο αντίπαλό του, ο νέος πρωτοπόρος DeepMind δεν μπορεί να παίξει με μεγάλη δύναμη σε διαφορετικές κάρτες παιχνιδιών ή σε διαφορετικές εξωγήινες κούρσες σε ένα παιχνίδι χωρίς εκτεταμένη πρόσθετη εκπαίδευση. Επίσης, δεν μπορεί να παίξει πούλια, σκάκι ή προηγούμενες εκδόσεις StarCraft.

Αυτή η αδυναμία να αντιμετωπίσει ακόμη και με τα μικράοι εκπλήξεις είναι ένα πρόβλημα για πολλές από τις αναμενόμενες εφαρμογές AI, όπως τα αυτόνομα αυτοκίνητα ή τα προσαρμόσιμα bots, τα οποία οι ερευνητές ονομάζουν γενική τεχνητή νοημοσύνη (AGI, OII). Μια πιο σημαντική μάχη μεταξύ του ανθρώπου και της μηχανής μπορεί να είναι ένα είδος δεκάθαλου, με επιτραπέζια παιχνίδια, βιντεοπαιχνίδια και τον τελικό στα Dungeons and Dragons.

Περιορισμοί πολύ εξειδικευμένωνΗ τεχνητή νοημοσύνη φαινόταν να εκδηλώνεται όταν η MaNa έπαιξε ένα υποδειγματικό παιχνίδι εναντίον του AlphaStar, το οποίο περιοριζόταν στην προβολή της κάρτας ανά τύπο ατόμου, ένα τετράγωνο κάθε φορά. Τα δεδομένα DeepMind έδειξαν ότι είναι σχεδόν εξίσου καλός με αυτόν που κέρδισε το MaNa σε πέντε παιχνίδια.

Ένα νέο bot εγκατέστησε γρήγορα έναν στρατό, αρκετά ισχυρό,για να συντρίψει τον ανθρώπινο αντίπαλο του, αλλά η MaNa χρησιμοποίησε έξυπνους ελιγμούς και νίκησε τις εμπειρίες για να συγκρατήσει τις δυνάμεις του AI. Η καθυστέρηση του έδωσε χρόνο να συγκεντρώσει τα δικά του στρατεύματα και να κερδίσει.

Για να βρείτε πιο ενδιαφέροντα νέα, διαβάστε μας στο Zen.