Das asiatische Brettspiel Go gilt als besonders anspruchsvoll. Lange Zeit galt es als sehr unwahrscheinlich, dass eine künstliche Intelligenz in dem schwierigen Spiel viele Chancen gegen einen menschlichen Spieler hätte. Bis Googles Algorithmus AlphaGo das Gegenteil bewies. Die Software musste sich zwar dem Weltmeister Lee Sedol geschlagen geben, aber die Leistung des Programms war dennoch beeindruckend. Nun gingen die Entwickler von AlphaGo noch einen Schritt weiter: AlphaGo Zero ist in der Lage, das komplexe Brettspiel innerhalb weniger Tage ohne menschlichen Lehrer zu lernen.


Bild: Another game of Go, Chad Miller, Flickr, CC BY-SA 2.0

Neue KI muss nicht von Menschen lernen

Im Bereich künstliche Intelligenz konnten in den letzten Jahren erstaunliche Fortschritte verzeichnet werden. Neuronale Netze und maschinelles Lernen sorgen dafür, dass KI unsere Sprache erkennen, Medizinern bei der Diagnose helfen, Urteile fällen oder als Chatbot menschlichen Nutzern einen Gesprächspartner vorgaukeln kann.

Als 2016 AlphaGo gegen den Europameister Fan Hui gewann und anschließend gegen den Weltmeister verlor, musste das Programm vor dem Einsatz in monatelanger Arbeit mit menschlichen Experten und Spielern für das Brettspiel trainiert werden. Erst dann war das Programm in der Lage, einem menschlichen Profi-Spieler die virtuelle Stirn zu bieten.


Die neue Version von Alpha Go, AlphaGo Zero, kann das Go-Spielen komplett ohne Interaktion mit menschlichen Spielpartnern lernen. Nachdem AlphaGo Zero die Spielregeln des Spiels vorgegeben werden, kann die KI sich dieses selbstständig beibringen. Dabei simuliert sie mehrere Millionen Spiele gegen sich selbst. So wird das Programm praktisch zu seinem eigenen Lehrer. Ermöglicht haben die Forscher dies, indem sie einen Algorithmus schufen, der das neuronale Netzwerk nach jedem erfolgreichen Spiel optimiert. Nach und nach kann das Spiel den einzelnen Spielzügen so eine Erfolgschance zuordnen.

AlphaGo Zero besiegt seinen Vorgänger

AlphaGo Zero war so in der Lage, das Spiel in nur wenigen Tagen zu erlernen. „Zu unserer Überraschung war AlphaGo Zero schon nach 36 Stunden besser als sein Vorgänger AlphaGo Lee,“ so David Silver vom Google-Forschungszentrum DeepMind. Nach 72 Stunden ließen die Forscher beide Programme dann gegeneinander antreten. Das Ergebnis war beeindruckend: AlphaGo Zero besiegte seinen Vorgänger mit 100:0 Spielen.

Die neue Version ist nicht nur besser, sondern auch sparsamer als der Vorgänger. Sie begnügt sich mit einem Rechner und vier Spezialchips. AlphaGo Lee benötigte noch mehrere Rechner und insgesamt 48 Spezialchips.

Durch die selbstlernenden Prozesse der KI werden auch besonders innovative und machtvolle Spielzüge entwickelt. „Er erwarb nicht nur fundamentale Elemente der menschlichen Go-Kenntnisse, sondern auch Strategien, die weit über die Spannbreite des traditionellen Go-Wissens hinausgehen“, so die Forscher.

Eine KI, die nach vorgegebenen Regeln eigene Lernprozesse startet, hat den großen Vorteil, dass Fehler und Schwächen von menschlichen Lehrern sich nicht auf die Software übertragen können. Die Forscher gehen auch davon aus, dass sie AlphaGo Zero vom Spiel Go in jede andere Domäne übertragen können. „Der Algorithmus ist so allgemein, dass er überall eingesetzt werden kann“, erklärt Silva.

Nicht ohne Grund sehen Forscher in selbstlernenden Systemen die Zukunft der KI. Angesichts der schnellen Entwicklung in der KI-Forschung dürften die nächsten Jahre in diesem Bereich durchaus spannen werden.

"

Teile den Artikel oder unterstütze uns mit einer Spende.
PayPal SpendeAmazon Spendenshopping

1 Kommentar

  1. Jens Stolpmann

    22. Oktober 2017 at 18:23

    Wenn man schon einen Artikel über ein komplexes Thema schreibt, sollte man schon einmal ein wenig recherchieren.

    1. Das Match zwischen Alphago und dem damaligen Europameister Fan Hui fand bereits 2015 statt.
    2. Im Go gibt es keinen Weltmeister.
    3. Lee Sedol war der stärkste Spieler der Welt in den 2000er Jahren. Er war zum Zeitpunkt des Matches 3. der Weltrangliste. 1. war Ke Jie.
    4. Alphago hat Lee Sedol mit 4:1 besiegt, nicht verloren.
    5. 2017 hat eine neue Version von Alphago die besten Spieler der Welt in Online-Matches 60:0 geschlagen (Alphago Master).
    6. Eine nochmals verbesserte Version hat dann im Frühjahr 2017 den derzeitigen Weltranglistenersten Ke Jie (nicht Weltmeister) 3:0 geschlagen.
    7. Die neue Version, Alphago Zero, hat dann die Version, die gegen Ke Jie gewonnen hatte, mit 100:0 geschlagen.

    Viele Grüsse,

    Jens Stolpmann

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.