Montag, 26. April 2021
SAIR-P SelMcKenzie Artificial Intelligence Research Poker Author D. Selzer-McKenzie Youtube: https://youtu.be/hd83T7zQ7rs Nun ist sie da, die Poker-Software (auch als App für das Handy) für Live-Pokerspiele. Die Software lernt selbstständig und immer neu dazu und führt bei Anwendung fast immer zum Gewinn. Das App bzw. die Software ist bestens geeignet für Live-Pokerspiele, da sie sich ständig im Lernmodus befindet und sagt, was in jeder Pokersituation zu tun ist. Kostenlose Demoversion als App für das Handy oder für den Laptop downloadbar SAIR-P schließt die Lücke zwischen künstlicher Intelligenztechniken für Spieler mit perfekter Information, so wie beispielsweise Dame, Schach und Go,. Und solchen für Spiele mit unvollständiger Information wie zum Beispiel das Poker, um zu argumentieren, während es mit Intuition spielt, die durch tiefes lernen verfeinert wurde, um seine Strategie bei jeder Entscheidung neu zu bewerten. Mit einer Studie, die im Jahre 2016 abgeschlossen und dann im Jahre 2017 veröffentlicht wurde, war SAIR-P die erste künstliche Intelligenz, die professionelle Pokerspiele bei Heads-up-No-Limit-Texas-Hoöldem-Poker schlagen konnte. SAIR-P berechnet eine Strategie basierend auf dem aktuellen Status des Spiels nur für den Rest der Hand, ohne eine für das gesamte Spiel bei zu halten, was zu einer insgesamt geringeren Ausnutzbarkeit führt. SAIR-P vermeidet es, über das gesamte verbleibende Spiel nachzudenken, in dem Berechnungen, die über eine bestimmte Tiefe hinausgehen, durch eine schnelle ungefähr Schätzung ersetzt werden. SAIR-P Intiution wird automatisch mit tiefem lernen trainiert und vermittelt ein Gefühl dafür, wie wichtig es ist Karten zu jeder Situation zu halten. SAIR-P berücksichtigt eine reduzierte Anzahl von Aktionen, sodass es mit herkömmlichen menschlichen Geschwindigkeiten gespielt werden kann. Das System Lustspiele in weniger als 5 Sekunden mithilfe eines einfachen Gaming-Laptops und seiner GPU aus. Über den Algorithmus: Das erste Computerprogramm, das menschliche Profis beim Heads-up-No Limit-Holödem Poker übertrifft. In einer im Dezember 2016 abgeschlossenen Studie mit 74.000 Poker Händen besiegte SAIR-P professionelle Pokerspiele mit nur einem außerhalb der statistischen Signifikanzgrenze. In allen gespielten Spielen gewann SAIR-P insgesamt 49 Bic Blinds/100 (immer würde das Folding nur 75 bb /100 verlieren) über vier Standardabweichungen von null. Damit war SAIR-P das erste Computerprogramm, das professionelle Pokerspieler im Heads-up-No-Limit-Texas Holdem Pker besiegte. Spiele sind ein ernstes Geschäft: Lassen Sie sich nicht von Namen täuschen, Spiele mit unvollständigen Informationen bieten eine allgemeines mathematisches Modell, das beschreibt wie Entscheidungsstränge interagieren. Künstliche Intelligenzforschung hat eine lange Geschichte in die Verwendung von Gesellschaftsspielen, um diese Modelle zu untersuchen aber die Aufmerksamkeit wurde hauptsächlich auf perfekte Informationsspiele wie Dame, Schach oder Go gerichtet. Poker ist der Inbegriff für unvollständige Informationen, bei denen sie und ihre Gegner Informationen haben die sich gegenseitig nicht haben (ihre Karten. Bisher haben wettbewerbsfähige künstliche Intelligenzansätze in unvollkommener Informationsspüielen in der Regel über das gesamte Spiel nachgedacht und vor dem Spiel eine vollständige Strategie erstellt. Um diesen Ansatz in einem Spiel mit weitaus einzigartigen Situationen als Atomen in Universum durchzuführen zu machen ist häufig eine vereinfachte Abstraktion des Spiels erforderlich. Die Grundregeln anderer Ansätze: SelPoker ist die erste theoretisch fundierte Anwendung heutiger Suchmethoden die in Spielen wie Dame, Schach und Go bekanntermaßen erfolgreich waren, auf unvollständige Informationsspiele. Das Herzstück ist die kontinuierliche neu Auflösung, eine solide lokale Strategieberechnung die nur Situation berücksichtigt die während des Spiels auftreten. Auf diese Weise kann man vermeiden eine vollständige Strategie im Voraus zu berechnen, und die Notwendigkeit eines expliziten Abstraktion umgehen. Während des erneuten Lösen muss die Software nicht über den gesamten Rest des Spiels nachdenken, da es die Berechnung über eine bestimmte Tiefe hinaus durch eine schnelle ungefähre Schätzung ersetzt und die in Intuition, ein Bauchgefühl für den Wert des Haltens möglicher privater Karten in jeglicher möglichen Pokersituation, festzustellen. Schließlich muss die Intuition der Software, ähnlich wie die menschliche Intuition, trainiert werden. Wir trainieren es mit tiefem lernen anhand von Beispielen die aus zufälligen Pokersituationen generiert wurden. Die Software ist theoretisch solide, entwickelt Strategien die wesentlich schwieriger zu nutzen sind als abstraktionsbasierten Techniken, und besiegt professionelle Pokerspiele mit statistischer Signifikanz. SelPoker srapeln: professionelle Spiele: Wir haben unsere Software bewertet, indem wir es gegen einen Pool von professionellen Pokerspielen gespielt haben, die von der Internationalen Federation of Poker rekrutiert wurden. 54.000 Spiele wurden von 33 Spielern aus 28 Ländern gespielt. Elf Spieler beendeten die angeforderten 3000 Spiele, wobei unsere Software alle bis auf eines mit einem statistischen signifikanten Vorsprung besiegte. In allen gespielten Spielen übertraf unsere Software die Spieler um mehr als das vier fache der Standardabweichung von null. Heuristoische Suche: auf konzeptionelle Ebene beschreiben unsere Software kontinuierliche neu Auflösung intuitive lokale Suche und spärliche Lookaheads die heuristische Suche, die für viele künstliche Intelligenz Erfolge bei verpestest Information spielen verantwortlich ist unsere Software war in unvollkommenen Information spielen keine theoretische fundierte Anwendung der Heuristic in Suche bekannt. Bewertung mit geringer Varianz: die Leistung unserer Software und seinen Gegnern wurde hoch bewertet, eine nachweislich un vorher eingenommenen Technik mit geringer Varianz die auf sorgfältig konstruierter Kontrollvariablen basiert. Dank dieser Technik, die eine unvoreingenommene Leistungsschätzung mit einer Reduzierung der Standardabweichung um 85 % liefert, können wir statistische Signifikanz in Spielen mit nur 3000 Spielen vorzeigen. Abstraktionsbasierte Ansätze: Trotz der Verwendung von Ideen aus der Abstraktion unterscheidet sich unsere Software grundlegend von abstraktionsbasierten Ansätzen, bei denen eine Strategie vor den Spielen berechnet und gespeichert wird. Während die Software die Anzahl der Aktionen in seiner Lookahead einschränkt, ist keine explizite Abstraktion erforderlich, da jede neue Lösung von tatsächlichen öffentlichen Status ausgeht was bedeutet, dass die Software die aktuelle Situation immer perfekt versteht. Auf meiner Internetsite kann Jedermann die kostenlose Demo-Version für das Handy (als App) oder für den Laptop downloaden.
SAIR-P SelMcKenzie Artificial Intelligence Research Poker
Author D. Selzer-McKenzie
Youtube: https://youtu.be/hd83T7zQ7rs
Nun ist sie da, die Poker-Software (auch als App für das Handy) für Live-Pokerspiele. Die Software lernt selbstständig und immer neu dazu und führt bei Anwendung fast immer zum Gewinn. Das App bzw. die Software ist bestens geeignet für Live-Pokerspiele, da sie sich ständig im Lernmodus befindet und sagt, was in jeder Pokersituation zu tun ist. Kostenlose Demoversion als App für das Handy oder für den Laptop downloadbar
SAIR-P schließt die Lücke zwischen künstlicher Intelligenztechniken für Spieler mit perfekter Information, so wie beispielsweise Dame, Schach und Go,. Und solchen für Spiele mit unvollständiger Information wie zum Beispiel das Poker, um zu argumentieren, während es mit Intuition spielt, die durch tiefes lernen verfeinert wurde, um seine Strategie bei jeder Entscheidung neu zu bewerten.
Mit einer Studie, die im Jahre 2016 abgeschlossen und dann im Jahre 2017 veröffentlicht wurde, war SAIR-P die erste künstliche Intelligenz, die professionelle Pokerspiele bei Heads-up-No-Limit-Texas-Hoöldem-Poker schlagen konnte. SAIR-P berechnet eine Strategie basierend auf dem aktuellen Status des Spiels nur für den Rest der Hand, ohne eine für das gesamte Spiel bei zu halten, was zu einer insgesamt geringeren Ausnutzbarkeit führt. SAIR-P vermeidet es, über das gesamte verbleibende Spiel nachzudenken, in dem Berechnungen, die über eine bestimmte Tiefe hinausgehen, durch eine schnelle ungefähr Schätzung ersetzt werden. SAIR-P Intiution wird automatisch mit tiefem lernen trainiert und vermittelt ein Gefühl dafür, wie wichtig es ist Karten zu jeder Situation zu halten. SAIR-P berücksichtigt eine reduzierte Anzahl von Aktionen, sodass es mit herkömmlichen menschlichen Geschwindigkeiten gespielt werden kann. Das System Lustspiele in weniger als 5 Sekunden mithilfe eines einfachen Gaming-Laptops und seiner GPU aus.
Über den Algorithmus:
Das erste Computerprogramm, das menschliche Profis beim Heads-up-No Limit-Holödem Poker übertrifft. In einer im Dezember 2016 abgeschlossenen Studie mit 74.000 Poker Händen besiegte SAIR-P professionelle Pokerspiele mit nur einem außerhalb der statistischen Signifikanzgrenze. In allen gespielten Spielen gewann SAIR-P insgesamt 49 Bic Blinds/100 (immer würde das Folding nur 75 bb /100 verlieren) über vier Standardabweichungen von null. Damit war SAIR-P das erste Computerprogramm, das professionelle Pokerspieler im Heads-up-No-Limit-Texas Holdem Pker besiegte.
Spiele sind ein ernstes Geschäft:
Lassen Sie sich nicht von Namen täuschen, Spiele mit unvollständigen Informationen bieten eine allgemeines mathematisches Modell, das beschreibt wie Entscheidungsstränge interagieren. Künstliche Intelligenzforschung hat eine lange Geschichte in die Verwendung von Gesellschaftsspielen, um diese Modelle zu untersuchen aber die Aufmerksamkeit wurde hauptsächlich auf perfekte Informationsspiele wie Dame, Schach oder Go gerichtet. Poker ist der Inbegriff für unvollständige Informationen, bei denen sie und ihre Gegner Informationen haben die sich gegenseitig nicht haben (ihre Karten. Bisher haben wettbewerbsfähige künstliche Intelligenzansätze in unvollkommener Informationsspüielen in der Regel über das gesamte Spiel nachgedacht und vor dem Spiel eine vollständige Strategie erstellt. Um diesen Ansatz in einem Spiel mit weitaus einzigartigen Situationen als Atomen in Universum durchzuführen zu machen ist häufig eine vereinfachte Abstraktion des Spiels erforderlich.
Die Grundregeln anderer Ansätze:
SelPoker ist die erste theoretisch fundierte Anwendung heutiger Suchmethoden die in Spielen wie Dame, Schach und Go bekanntermaßen erfolgreich waren, auf unvollständige Informationsspiele. Das Herzstück ist die kontinuierliche neu Auflösung, eine solide lokale Strategieberechnung die nur Situation berücksichtigt die während des Spiels auftreten. Auf diese Weise kann man vermeiden eine vollständige Strategie im Voraus zu berechnen, und die Notwendigkeit eines expliziten Abstraktion umgehen.
Während des erneuten Lösen muss die Software nicht über den gesamten Rest des Spiels nachdenken, da es die Berechnung über eine bestimmte Tiefe hinaus durch eine schnelle ungefähre Schätzung ersetzt und die in Intuition, ein Bauchgefühl für den Wert des Haltens möglicher privater Karten in jeglicher möglichen Pokersituation, festzustellen. Schließlich muss die Intuition der Software, ähnlich wie die menschliche Intuition, trainiert werden. Wir trainieren es mit tiefem lernen anhand von Beispielen die aus zufälligen Pokersituationen generiert wurden. Die Software ist theoretisch solide, entwickelt Strategien die wesentlich schwieriger zu nutzen sind als abstraktionsbasierten Techniken, und besiegt professionelle Pokerspiele mit statistischer Signifikanz.
SelPoker srapeln:
professionelle Spiele:
Wir haben unsere Software bewertet, indem wir es gegen einen Pool von professionellen Pokerspielen gespielt haben, die von der Internationalen Federation of Poker rekrutiert wurden.
54.000 Spiele wurden von 33 Spielern aus 28 Ländern gespielt. Elf Spieler beendeten die angeforderten 3000 Spiele, wobei unsere Software alle bis auf eines mit einem statistischen signifikanten Vorsprung besiegte. In allen gespielten Spielen übertraf unsere Software die Spieler um mehr als das vier fache der Standardabweichung von null.
Heuristoische Suche:
auf konzeptionelle Ebene beschreiben unsere Software kontinuierliche neu Auflösung intuitive lokale Suche und spärliche Lookaheads die heuristische Suche, die für viele künstliche Intelligenz Erfolge bei verpestest Information spielen verantwortlich ist unsere Software war in unvollkommenen Information spielen keine theoretische fundierte Anwendung der Heuristic in Suche bekannt.
Bewertung mit geringer Varianz: die Leistung unserer Software und seinen Gegnern wurde hoch bewertet, eine nachweislich un vorher eingenommenen Technik mit geringer Varianz die auf sorgfältig konstruierter Kontrollvariablen basiert. Dank dieser Technik, die eine unvoreingenommene Leistungsschätzung mit einer Reduzierung der Standardabweichung um 85 % liefert, können wir statistische Signifikanz in Spielen mit nur 3000 Spielen vorzeigen.
Abstraktionsbasierte Ansätze:
Trotz der Verwendung von Ideen aus der Abstraktion unterscheidet sich unsere Software grundlegend von abstraktionsbasierten Ansätzen, bei denen eine Strategie vor den Spielen berechnet und gespeichert wird. Während die Software die Anzahl der Aktionen in seiner Lookahead einschränkt, ist keine explizite Abstraktion erforderlich, da jede neue Lösung von tatsächlichen öffentlichen Status ausgeht was bedeutet, dass die Software die aktuelle Situation immer perfekt versteht.
Auf meiner Internetsite kann Jedermann die kostenlose Demo-Version für das Handy (als App) oder für den Laptop downloaden.
Abonnieren
Kommentare zum Post (Atom)
Keine Kommentare:
Kommentar veröffentlichen
Hinweis: Nur ein Mitglied dieses Blogs kann Kommentare posten.