Изкуствен интелект победи покер човек, какво следва?

Изкуственият интелект отново побеждава човека. Този път AI спечели покер играта. И това, изглежда, не е изненадващо, защото в тази игра изкуственият интелект беше първият преди. Но сега всичко е различно: колата веднага спечели петима играчи в Texas Hold'em и в същото време беше насочена към възможно най-висока печалба.

Какво представлява Texas Hold'em?

Ако не влезете в подробностите на правилата на играта, тогаваТова е един от най-често срещаните видове покер. В онези сцени, които сте видели в много филми, когато играчите седят около масата и се редуват залози, се появява hold'em. На масата има 6 играчи, които постепенно правят залози. По всяко време можете да излезете от играта, но тогава няма да получите обратно вложените пари. Това продължава до напрегната "битка" едно по едно, в която победителят взема всичко.

В неотдавнашен експеримент специалистите по разработванетоAI от Facebook и университета Carnegie Mellon поставиха на масата изкуствения интелект на играчите, които имаха една задача: да спечелят колкото се може повече пари.

Защо изкуствен интелект може да победи човек

Разработване на печеливш покер алгоритъмедновременно с няколко играчи (и на теория и на няколко маси по едно и също време) - задачата е много по-трудна от преподаването на ИИ да играе шах или да върви. По принцип това е така, защото в покера се дава само много ограничена информация за това какво се случва на покер масата. Това означава, че ако в същия шахмат компютърът "вижда" цялата картина, включително разположението на парчетата на противника, в AI покерът знае само какви карти са в ръцете му и които са изложени на масата. Също така е възможно, както се казва, да "преброят картите", като се предвиди кои от тях вече са "изчезнали", което ще позволи да се предвидят възможни комбинации. Но все още е по-трудно, отколкото да се анализира „отворената” шахматна област.

Благодарение на новите алгоритми на обучение, системата еИмето Pluribus за 12 дни и 10 000 ръце се бори с 12 професионални покер играчи. В резултат на това Pluribus спечели средно $ 5 на ръка и около $ 1000 на час.

Вижте също: Как изкуственият интелект победи най-добрите покер играчи.

Как AI се научи да играе покер

За начало разработчиците принудиха AI да играесрещу себе си и чрез проба и грешка да избере най-подходящата тактика. По принцип това е стандартният начин на учене. Друго нещо, което е интересно тук: Pluribus е създаден само за осем дни, използвайки 64-ядрена сървърна станция, оборудвана само с 512 GB RAM. Това обучение струваше на компанията само около 150 долара.

Обучението по ИИ обаче не свършва дотук. Програмистите измислиха начин да работят с изкуствен интелект, което му позволи да играе изключително ефективно. Вместо да се опитва да предскаже как ще се държат опонентите му до края на мача, Плурибъс е проектиран да „погледне” само два или три хода напред. Това позволи ресурсите на системата да се използват за по-полезни действия. Например за развитието на възможности за блъф.

"Разглежда се възможността за преднамерено блъфизключителната прерогатива на хората, ”- авторите на публикацията The Verge. „В същото време Плурибус, лишен от дългосрочно стратегическо мислене, както отбелязват почти всички участници в експеримента, много успешно блъфира. За алгоритъма това беше само един от начините да се спечели дистрибуцията, но далеч от най-основните. "

Изследователите обявиха, че няма да изложаталгоритъмът и всичко свързано с неговото развитие е свободно достъпно. В същото време развитието, придобито по време на неотдавнашния експеримент, е много важно: те ще позволят например да се идентифицират финансовите измами на пазара на ценни книжа, да се подпомогнат автоматичните системи за контрол на трафика и ще бъдат полезни дори при разработването на по-ефективни автопилоти.

Можете да прочетете още по-интересни материали в нашия телеграма новини канал.

Свързани статии