Wissen, wann man abwirft: KI schlägt weltbesten Pokerspieler

Wer gerade dabei ist, eine Runde Online-Poker zu spielen, denke besser noch einmal darüber nach. Die Menschheit wurde nämlich schon wieder bei einem Spiel geschlagen, dieses Mal beim Heads-Up No-Limit Texas Hold’em Poker. Dieser Sieg stellt einen Meilenstein für die Künstliche Intelligenz dar.

Das erste Spiel, bei dem Menschen gegen die Maschinen verloren haben, war Backgammon. Im Jahr 1979 wurde der Backgammon-Weltmeister von BKG 9.8, einer Erfindung von Hans Berliner, geschlagen. Im Jahr 1997 verlor Garri Kasparow, der amtierende Schachweltmeister, gegen Deep Blue von IBM. Kasparow merkte an, dass er eine neue Form der Intelligenz vom Tisch gegenüber „riechen“ konnte.

Auch andere Spiele wurden seitdem von Maschinen gewonnen: Checkers (eine Variante von Dame), Othello, Scrabble, das Wissensquiz Jeopardy! und sogar Pong, die Mutter aller Arcade-Spiele. Der letzte Sieg der Maschinen wurde beim antiken chinesischen Brettspiel Go errungen. Im März letzten Jahres wurde Lee Sedol, einer der weltweit führendend Go-Spieler, von Googles AlphaGo Programm mit 4:1 geschlagen. Und um es uns weiter unter die Nase zu reiben, trat AlphaGo während der Weihnachtsferien anonym gegen Dutzende der weltbesten Go-Spieler im Netz an – und gewann überzeugend.

Warum gerade Poker?

Go wurde als der Mount Everest der Brettspiele bezeichnet. Es ist viel komplexer als Schach oder viele andere Spiele. Dennoch ist es nicht so herausfordernd wie Poker. Genau wie im echten Leben ist Poker ein unsicheres Spiel. Die Spieler wissen nicht, welches Blatt der Gegner hat oder welche Karten in Zukunft aufgedeckt werden. Im Vergleich dazu können alle Spieler beim Schach oder Go das Spielfeld sehen und verfügen über alle Informationen. Dieser Umstand macht Schach oder Go einfacher zu programmieren als Poker.

Poker setzt auch voraus, die Spielweise der anderen Spieler zu verstehen. Bluffen sie? Sollte man das Handtuch werfen? Oder selbst bluffen? Letztlich geht man beim Poker auch ab und zu eine Wette ein. Wann sollte man wetten? Unf worauf? Auch diese Fragen kommen zur Herausforderung hinzu, ein Poker Programm zu schreiben, das genauso gut oder besser als Menschen spielt.

Drei Wochen lang waren vier der besten Poker-Spieler im Rivers Casino in Pittsburgh in ein kräftezehrendes Spiel eingebunden, das insgesamt 120.000 Teilnehmer hatte. Ihr Gegner war das Programm Libratus der Carnegie Mellon-Universität, das von meinem Kollegen Professor Tuomas Sandholm und seinem Doktoranten Noam Brown geschrieben wurde. Libratus sollte das Turnier später gewinnen und das Preisausschreiben von mehr als einer Million US-Dollar gewinnen. Die Profis hingegen könnten sich zusammentun und den Preis von 200.000 US-Dollar pro Person untereinander teilen.

Um den Einfluss des reinen Zufalls zu minimieren, wurde bei dem Turnier ein doppeltes Blatt eingesetzt. Dies bedeutet, dass mit zwei identisch gemischten Decks an zwei separaten Tischen gespielt wurde. An einem Tisch wird dem menschlichen Spieler ein Blatt gegeben (Blatt A), der KI wurde Blatt B ausgeteilt. An dem anderen Tisch (in einem anderen Raum), spielt die KI mit Blatt A und der menschliche Spieler mit Blatt B.

Dies bedeutet, dass, selbst wenn ein Spieler eine ungewöhnliche Reihe guter Karten ausgeteilt bekommt, dies für den anderen Spieler im duplizierten Spiel gespiegelt wird. Dies erklärt auch, warum so viele Runden gespielt worden sind. Das Endergebnis ist, dass wir behaupten können, dass Libratus mit statistischem Vertrauen besser als menschliche Spieler ist.

Wie man Poker gewinnt

Die Details darüber, wie Libratus spielt, sind noch geheim. Dennoch können wir wohl Vermutungen anstellen, die auf vorherige Arbeiten der Carnegie Mellon Universität basieren. Der vielleicht bemerkenswerteste Fakt ist, dass der Sieg mehr von der altmodischen Künstlichen Intelligenz abhängt als von den neuerdings erforschten Prozessen des Deep-Learnings.

Genauso wie Deep Blue beim Schach nutzt nun Libratus viele Brute-Force-Berechnungen, die anzeigen, wie man am besten spielt. Wir wissen, dass es sich auf das Supercomputing Center in Pittsburgh beruft, um jedes Spiel zu absolvieren. Abend für Abend nutzte Libratus diesen Supercomputer, um seine Strategie zu verfeinern. Falls jemand der Meinung sein sollte, dass diese Praxis den Menschen gegenüber unfair ist – die Profis setzen sich ebenso nach jedem Spiel zusammen, vergleichen Ihre Leistungen und stellen Strategien für den nächsten Tag auf.

Libratus zieht auch Vorteile aus der Spieltheorie – ein mathematisches Denkmodell, das durch den Film „A Beautiful Mind“ berühmt wurde. Libratus setzt darauf, strategische Züge zu spielen, die nicht geschlagen werden könnenn – ganz gleich was sein Gegner tut.

Was kommt danach?

Das Poker-Beispiel ist noch nicht das Ende der Fahnenstange. Libratus spielt nur die Version mit zwei Spielern von Heads-Up No-Limit Texas Hold’em Poker. Fügt man mehr Spieler hinzu, vergrößert sich die Komplexität weitgehend. Daher wird es noch einige Jahre dauern, bis Computer gut genug sind, um gegen vier oder mehr Spieler antreten zu können.

Dennoch ist dies ein weiteres Beispiel dafür, wie bekannte Themenfelder der KI langsam aber sicher beginnen, den Menschen einzuholen. Mittlerweile können sie beispielsweise Mammogramme lesen, Chinesisch transkribieren, menschliche Piloten in Hundekämpfe schlagen… und die Liste verlängert sich fast wöchentlich.

So mancher fragt sich nun, wo dies alles endet. Werden Computer möglicherweise all unsere Jobs übernehmen? Eine Studie der Oxford Universität aus dem Jahr 2013 hat geschätzt, dass innerhalb der nächsten zwei Jahrzente etwa 47 Prozent aller Arbeitsplätze in den USA durch die Automatisierung gefährdet sind.

Es gab jedoch einige Einschränkungen bei der erwähnten Studie. Ironischerweise ergab die Studie, dass der Job, vorauszusagen welche Arbeitsplätze gefährdet sind, mit zu den bedrohten Jobs gehört. In der Studie wurde Machine-Learning und kleinere Trainingseinheiten von 70 handwerklichen Berufen genutzt, um vorauszusagen, welche der 700 eingetragenen Berufe gefährdet sind.

Und genau hier kommen Sie ins Spiel. Ich berufe mich auf die Schwarmintelligenz, um zu sehen, ob wir eine bessere Vorhersage machen können. Bitte nehmen Sie sich ein paar Minuten Zeit, um an der Umfrage teilzunehmen. Am Ende können Sie eine Hilfsorganisation auswählen, die als Anerkennung Ihrer aufgebrachten Mühen und Zeit eine Spende erhält.

Noch bevor das Resultat unserer Umfrage feststeht, ist klar, dass einige Jobs, so wie Taxifahrer, LKW-Fahrer, Röntgenassistenten und nun wohl auch professionelle Poker-Spieler bedroht sind. Natürlich erschafft die Technologie andere, neue Berufe. Dennoch bleibt die Frage offen, wie viel geschaffen und wie viel zerstört werden wird.

Um den Maschinen einen Schritt voraus zu bleiben, müssen Menschen ihre Stärken einsetzen, wie beispielsweise Kreativität und emotionale Intelligenz. Wir müssen auch darauf bauen, die Menschen zu stärken und nicht, sie zu ersetzen. Zusammen können Menschen und Maschinen den einzelnen Menschen oder die einzelne Maschine übertreffen. Heutzutage ist der beste Schachspieler ein Mensch, der mit einer Maschine arbeitet. Und zusammen können wir super-menschlich sein.

Dieser Artikel erschien zuerst auf „The Conversation“ unter CC BY-ND 4.0. Übersetzung mit freundlicher Genehmigung der Redaktion.


Image (adapted) „Poker“ by Images Money (CC BY 2.0)


Schlagwörter: , , , , , , , ,
Toby Walsh

Toby Walsh

ist Professor für Künstlichen Intelligenz an der Universität New South Wales in Sydney. Er ist leitender Forscher eines Projektes zur „Algorithmischen Entscheidungstheorie“ und Redakteur eines der führenden Magazine für Computerwissenschaften.

More Posts - Twitter