technológia

Mesterséges intelligencia verte a póker embert, mi a következő?

A mesterséges intelligencia ismét legyőzte az embert. Ezúttal az AI megnyerte a póker játékot. És ez úgy tűnik, nem meglepő, mert ebben a játékban a mesterséges intelligencia volt az első. De most minden más: az autó azonnal megnyerte az öt játékosot a Texas Hold'em-ben, és ezzel egyidejűleg a lehető legnagyobb nyereségre törekedett.

Mi a Texas Hold'em?

Ha nem megy be a játék szabályainak részletébe, akkorEz az egyik leggyakoribb póker típus. Azokban a jelenetekben, amelyeket sok filmben láttál, amikor a játékosok az asztal körül ülnek, és felváltva fogadnak, a hold'em jelenik meg. 6 játékos van az asztalnál, és fokozatosan fogadásokat készítenek. Bármikor kiléphet a játékból, de akkor nem kapja vissza a befektetett pénzt. Ez addig folytatódik, amíg egy feszült "csatát" nem kap az egyik, amelyben a győztes mindent megtesz.

Egy nemrégiben végzett kísérletben a fejlesztési szakemberekA Facebookból származó AI és a Carnegie Mellon Egyetem mesterséges intelligenciát helyezett az asztalra az egyik feladatot ellátó játékosok számára: annyi pénzt nyerni, amennyit csak lehet.

Miért lehetett a mesterséges intelligencia megverni az embert

Egy nyereséges póker algoritmus fejlesztéseegyidejűleg több játékossal (és elméletileg és több asztalnál egyidejűleg) - a feladat sokkal nehezebb, mint a tanítás az AI-nak sakkozni vagy menni. Alapvetően ez azért van, mert a pókerben csak nagyon kevés információ áll rendelkezésre arról, hogy mi történik a pókerasztalnál. Azaz, ha ugyanabban a sakkban a számítógép „látja” az egész képet, beleértve az ellenfél darabjainak elhelyezését, az AI-ban a póker csak tudja, milyen kártyák vannak a kezében, és amelyeket az asztalon helyeznek el. Azt is mondhatjuk, hogy „számolják a kártyákat”, miután előre jelezték, hogy melyikük már „eltűnt”, ami lehetővé teszi a lehetséges kombinációk előrejelzését. De még nehezebb, mint a „nyitott” sakktér elemzése.

Az új tanulási algoritmusoknak köszönhetően a rendszerA Pluribus nevet 12 napig és 10 000 kéznek 12 profi pókerjátékosával harcolták. Ennek eredményeként a Pluribus átlagosan 5 dollárt nyert, és 1000 dollár / óra.

Lásd még: Hogyan mesterséges intelligencia verte a legjobb póker játékosokat.

Hogyan tanulta meg az AI a pókert

Kezdőknek a fejlesztők kényszerítették az AI-tönmagad ellen és próbálkozással és hibával a legmegfelelőbb taktika kiválasztására. Ez általában a tanulás szokásos módja. Érdekes egy másik dolog: a Pluribus-t mindössze nyolc nap alatt hozta létre egy 64-magos szerver állomással, amely csak 512 GB RAM-mal rendelkezik. Ez a képzés csak 150 dollárba került a vállalat számára.

De az AI képzés nem érte véget. A programozók úgy dolgoztak, hogy mesterséges intelligenciát dolgozzanak ki, ami lehetővé tette, hogy rendkívül hatékonyan játsszon. Ahelyett, hogy megpróbálná megjósolni, hogy az ellenfelei hogyan fognak viselkedni a játék végéig, a Pluribust úgy tervezték, hogy csak két-három mozog előre. Ez lehetővé tette, hogy a rendszer erőforrásai hasznosabbak legyenek. Például a blöffölés lehetőségeinek fejlesztéséről.

"Figyelembe veszik a szándékosan blöffölésta nép kizárólagos előjoga "- a The Verge kiadvány szerzői. „Ugyanakkor a hosszú távú stratégiai gondolkodástól mentes Pluribus, amint azt szinte az összes kísérlet résztvevője megjegyezte, nagyon sikeresen blöffölte. Az algoritmus számára ez volt az egyik módja az elosztás megnyerésének, de messze a legalapvetőbbtől.

A kutatók bejelentették, hogy nem fognak elhelyezniaz algoritmus és mindent, ami a fejlesztésével kapcsolatos, szabadon hozzáférhető. Ugyanakkor a legutóbbi kísérlet során szerzett fejlesztések nagyon fontosak: lehetővé teszik például az értékpapírpiacon a pénzügyi csalások azonosítását, az automatikus forgalomirányítási rendszerek támogatását, és még hatékonyabb autopiloták kifejlesztésében is hasznosak lesznek.

Még több érdekes anyagot olvashat a Telegram hírcsatornánkban.