Teknologi

Kunstig intelligens beat poker mand, hvad er der næste?

Kunstig intelligens besejrede igen mand. Denne gang vandt AI pokerspil. Og det forekommer ikke overraskende, for i dette spil var kunstig intelligens den første før. Men nu er alting anderledes: bilen vandt straks fem spillere i Texas Hold'em og var samtidig rettet mod den højest mulige gevinst.

Hvad er Texas Hold'em?

Hvis du ikke går ind i detaljerne i reglerne i spillet, såDette er en af ​​de mest almindelige typer af poker. I de meget scener, du så i mange film, når spillerne sidder rundt om bordet og skiftes væddemål, er det hold'em der vises. Der er 6 spillere ved bordet, og de laver gradvist indsatser. Du kan når som helst afslutte spillet, men så vil du ikke få de investerede penge tilbage. Dette fortsætter indtil en spændt "kamp" en på en, hvor vinderen tager alt.

I et nyligt eksperiment, udviklingsspecialisterAI fra Facebook og Carnegie Mellon University satte kunstig intelligens ved bordet til spillerne, der havde en opgave: at vinde så mange penge som muligt.

Hvorfor kunstig intelligens kunne slå en mand

Udvikling af en rentabel pokeralgoritmesamtidig med flere spillere (og i teorien og ved flere tabeller på samme tid) - opgaven er meget vanskeligere end at lære AI at spille skak eller gå. Dybest set skyldes det, at der kun er meget begrænset information i poker om hvad der sker ved pokerbordet. Det vil sige, hvis i samme skak computeren "ser" hele billedet, herunder dispositionen af ​​modstanderens stykker, i poker kender kun poker hvilke kort der er i hans hænder, og som er lagt ud på bordet. Det er også muligt, som de siger, at "tælle kortene", idet de har forudset, hvilke af dem der allerede er "gået", hvilket gør det muligt at forudsige mulige kombinationer. Men det er stadig sværere end at analysere det "åbne" skakfelt.

Takket være de nye læringsalgoritmer er systemetNavnet Pluribus i 12 dage og 10.000 hænder kæmpede med 12 professionelle pokerspillere. Som et resultat vandt Pluribus i gennemsnit $ 5 per hånd og omkring $ 1000 pr. Time.

Se også: Hvordan kunstig intelligens slår de bedste pokerspillere.

Hvordan jeg lærte at spille poker

Til at begynde med tvang udviklerne AI til at spillemod dig selv og ved forsøg og fejl at vælge den mest passende taktik. Dette er generelt den almindelige måde at lære. En anden ting er interessant her: Pluribus blev skabt på bare otte dage ved hjælp af en 64-kernes serverstation, der var udstyret med kun 512 GB RAM. Denne uddannelse kostede virksomheden kun omkring 150 dollar.

Men AI-træningen sluttede ikke der. Programmører kom med en måde at arbejde kunstig intelligens på, hvilket gjorde det muligt for ham at spille ekstremt effektivt. I stedet for at forsøge at forudsige, hvordan hans modstandere vil opføre sig indtil slutningen af ​​spillet, blev Pluribus designet til at "se" kun to eller tre bevæger sig fremad. Dette gjorde det muligt for systemressourcerne at blive brugt til mere nyttige handlinger. For eksempel om udviklingen af ​​muligheder for at bluffe.

"Evnen til bevidst at bluffe er overvejetfolks eksklusive prærogativitet "- forfatterne af publikationen The Verge. "Samtidig har Pluribus blottet for langsigtet strategisk tænkning, som det fremgår af næsten alle deltagere i eksperimentet, meget succesfuldt bluffet. For algoritmen var det kun en af ​​måderne at vinde fordelingen på, men langt fra de mest grundlæggende. "

Forskere har meddelt, at de ikke vil lægge sig udalgoritmen og alt relateret til dens udvikling er frit tilgængelig. Samtidig er udviklingen i det nylige eksperiment meget vigtigt: de vil tillade, at man f.eks. Kan identificere finansielle svig på værdipapirmarkedet, hjælpe automatiske trafikstyringssystemer, og det vil være nyttigt, selv når man udvikler mere effektive autopiloter.

Du kan læse endnu mere interessante materialer i vores telegram nyhedskanal.