Keinotekoinen älykkyys voittaa pokerin miehen, mitä seuraavaksi?

Keinotekoinen äly loisti jälleen miehen. Tällä kertaa AI voitti pokeripelin. Ja tämä näyttää siltä, että ei ole yllättävää, koska tässä pelissä keinotekoinen äly oli ensimmäinen. Mutta nyt kaikki on erilainen: auto voitti välittömästi viisi pelaajaa Texas Hold'emissa, ja samalla sen tavoitteena oli mahdollisimman suuri voitto.

Mikä on Texas Hold'em?

Jos et mene pelisääntöjen yksityiskohtiin, sittenTämä on yksi yleisimmistä pokerityypeistä. Niissä hyvin kohtauksissa, joissa olet nähnyt paljon elokuvia, kun pelaajat istuvat pöydän ympärillä ja ottavat vuorotellen vedon, se on hold'em. Pöydässä on 6 pelaajaa ja he tekevät vähitellen panoksia. Voit milloin tahansa poistua pelistä, mutta sitten et saa takaisin sijoitettua rahaa. Tämä jatkuu kunnes jännittynyt "taistelu" yhdellä, jossa voittaja vie kaiken.

Tuoreessa kokeilussa kehitysprofessoritFacebookin AI ja Carnegie Mellon University tekivät taiteilijalle keinotekoisen älykkyyden, jolla oli yksi tehtävä: voittaa mahdollisimman paljon rahaa.

Miksi tekoäly voisi voittaa miehen

Kannattavan pokerialgoritmin kehittäminensamanaikaisesti useiden pelaajien kanssa (ja teoriassa ja useissa pöydissä samanaikaisesti) - tehtävä on paljon vaikeampaa kuin opettaa AI: ta pelaamaan shakkia tai mennä. Periaatteessa tämä johtuu siitä, että pokerissa annetaan vain hyvin vähän tietoa siitä, mitä pokeripöydässä tapahtuu. Toisin sanoen, jos samassa shakissa tietokone "näkee" koko kuvan, mukaan lukien vastustajan kappaleen sijoittelu, AI: ssa pokeri tietää vain mitä kortit ovat hänen käsissään ja jotka on asetettu pöydälle. On myös mahdollista, kuten sanotaan, "laskea kortit", kun oletetaan, kumpi niistä on jo "mennyt", mikä mahdollistaa mahdollisten yhdistelmien ennustamisen. Mutta se on vielä vaikeampaa kuin analysoida "avointa" shakkialaa.

Uusien oppimisalgoritmien ansiosta järjestelmä onPluribus-nimi 12 päivän ajan ja 10 000 kättä taisteli 12 ammattilaispelaajan kanssa. Tämän seurauksena Pluribus voitti keskimäärin 5 dollaria per käsi ja noin 1000 dollaria tunnissa.

Katso myös: Miten keinotekoinen älykkyys voittaa parhaat pokerin pelaajat.

Miten AI oppi pelaamaan pokeria

Aloittelijoille kehittäjät pakottivat AI: n pelaamaanitsellesi ja koettelemuksellesi ja virheellesi valita sopivimmat taktiikat. Tämä on yleensä tavanomainen tapa oppia. Toinen asia on mielenkiintoinen: Pluribus luotiin vain kahdeksan päivän aikana käyttäen 64-ydinpalvelinta, joka on varustettu vain 512 Gt: n RAM-muistilla. Tämä koulutus maksoi yritykselle vain noin 150 dollaria.

Mutta AI-koulutus ei päättynyt. Ohjelmoijat tekivät keinon työskennellä tekoälyllä, mikä antoi hänelle mahdollisuuden pelata erittäin tehokkaasti. Sen sijaan, että yritettäisiin ennustaa, miten hänen vastustajansa käyttäytyvät pelin loppuun saakka, Pluribus oli suunniteltu näyttämään vain kaksi tai kolme siirtymistä eteenpäin. Tämä mahdollisti järjestelmän resurssien käytön hyödyllisempiin toimiin. Esimerkiksi bluffien mahdollisuuksien kehittämisestä.

"Kykyä tahallisesti bluffata pidetäänkansalaisten yksinoikeus, "- julkaisun The Verge kirjoittajat. ”Samalla Pluribus, jolla ei ollut pitkän aikavälin strategista ajattelua, kuten lähes kaikki kokeilun osallistujat totesivat, bluffasi hyvin. Algoritmille tämä oli vain yksi tapa voittaa jakelun, mutta kaukana kaikkein perusasioista. "

Tutkijat ovat ilmoittaneet, että he eivät sijoita niitäalgoritmi ja kaikki sen kehitykseen liittyvät asiat ovat vapaasti saatavilla. Samaan aikaan viimeaikaisen kokeilun aikana saavutettu kehitys on erittäin tärkeää: ne mahdollistavat esimerkiksi arvopaperimarkkinoiden taloudellisten petosten tunnistamisen, auttavat automaattisia liikenteenohjausjärjestelmiä ja ovat hyödyllisiä jopa tehokkaampien autopilottien kehittämisessä.

Voit lukea lisää mielenkiintoisia materiaaleja Telegram-uutiskanavassamme.

Aiheeseen liittyvät artikkelit