ModernPokerTheory 现代扑克理论[1]

分类:德扑圈内资讯新闻 发表时间:2022-08-05 23:31:12 作者:HHpoker 阅读数:19

ModernPokerTheory  现代扑克理论[1]

计算机程序和应用(app)已经统治现代社会。你可能发现应用无所不能,游戏、社交媒体、联谊、健康、瑜伽、冥想、烹饪、学习新语言、播放音乐和视频,甚至约会!无论你需要什么,你都很可能可以找到一款满足你需要的应用,如果你找不到,你可以肯定某人正在世界上的某个地方开发这种应用。

我们生活的世界已经改变,我们认识的扑克也是如此。随着科技的进步,牌手用来分析和研究游戏的工具也变得越来越先进。在本章我们将分析一些牌手用来改进策略的最重要程序和应用。

胜率计算器

扑克胜率计算器(EquityCalculator)在扑克圈长期存在,而且它们无疑是任何正统牌手武器库中的最基本武器。理解底牌对抗底牌、底牌对抗范围和范围对抗范围的胜率互动是成为一名成功牌手的第1步。

胜率计算器自2008年手次发布PokerStove以来已经取得了很大的发展。在当时,胜率计算器非常粗糙,而且提供的功能非常有限。而现在,像PowerEquilab这样的胜率计算器提供各种各样的功能,包括胜率图表、热点图、范围分析等等。

优点

l  输入范围和计算胜率的过程非常直观,容易使用。

l  多人底池胜率计算

l  能够创建自定义的可玩性配置(playabilityprofiles)

l  快速胜率计算

缺点

l  计算受限于胜率和简单的数学

l  不提供EV或任何策略建议

l  有限的翻后范围分析

范围分析工具

具有一种范围分析工具(比如Flopzilla)的牌手能够输入底牌范围,确定范围在任何可能翻牌面如何互动。范围分析工具把底牌范围划分成顶对、暗三条、同花听牌、后门顺子听牌等各种类型。

优点

l  根据底牌组合显示胜率

l  可用于分析底牌排除效应

l  根据转牌圈和河牌圈的牌型翻后过滤

l  快速计算

l  容易使用

7.png

缺点

l  不提供EV或任何类型的策略建议

l  无法用于建立复杂的决策树

l  对于单挑分析最有用

l  有限的翻前实用性

EV决策树

具有一种诸如CardRunnersEV的EV决策树工具你可以创建代表牌手行动和决策树,并计算每个决策点的EV。

优点

l  展示不同行动的EQ和EV。

l  对于SNG和MTT决赛桌很有用的ICM计算

l  创建复杂树的能力和脚本功能(利用一种编程语言自动完成一系列任务)

l  多人底池计算

l  有用的翻前及翻后范围分析

l  能够把赏金和抽水融入到计算中

l  说明底牌排除效应和聚集效应

缺点

l  需要很大程度的输入,包括牌手在每个决策点的范围、底池大小、下柱尺度、加注尺度和筹马深度

l  树的创建和策略分析可能非常费时

l  计算EV需要知道对手的完整策略或需要使用一些假定

l  陡峭的学习曲线

翻前纳什计算器

在现代GTOSolver软件出现之前,像HoldemResoucesCalculator这样的纳什计算器是MTT牌手和SNG牌手的工具选择。它们非常擅长计算翻前全压/弃牌策略,特别是牌手没有跟注范围的浅筹马场合。

但是,它们不支持翻后玩法,如果你试图为深到无全压下柱尺度的筹马量计算范围,你将被迫应用行动抽象(actionabstraction)。你可以要么完全排除牌手的跟注非全压加注选择,要么允许跟注,但假定翻牌发出后不会发生更多下柱,让两个牌手一直check下去。两种抽象将产生不正确的翻前策略。排除跟注选择通过迫使防守的牌手采用更紧的范围伤害了他们,因此计算器建议用比最优范围更宽的率先加注范围,这个范围倾向于具有良好阻断牌,同时忽略翻后可玩性。翻后一直check有利于翻前跟注的牌手,因为他们的所有边缘牌都将实现100%底池权益,这导致了比最优范围更宽的跟注范围。两种选择限制了纳什计算器在深筹马扑克的应用,使得它们只适合全压/弃牌场景。

优点

l  特别擅长计算不可剥削全压

l  快速计算

l  翻前MES策略计算

l  展示翻前策略和EV

l  支持锦标赛的赏金计算

l  决赛桌计算

缺点

l  不支持翻后玩法

l  不考虑底牌排除效应或聚集效应

GTOSolver和人工智能(AI)

8.png

1997年,世界上最好的国基象棋棋手卡斯帕罗夫被IBM的炒级电脑深蓝打败。他的失败被当作人工智能将在某1天赶超人类智慧的信号。

自深蓝的获胜后,AI已经朝人类最终失败的方向迈出了巨大的步伐。2015年,由DeepMind开发的AI阿尔法狗(AlphaGo)成为手个在19x19棋盘打人类职业围棋手的电脑围棋程序。2017年5月,阿尔法狗击败当时世界排名第1的棋手柯洁。围棋是一种具有10170种变化的游戏。同年晚些时候,DeepMind发布了AlphaZero,一个震惊世界的国基象棋和将棋AI,达到超人的游戏水平,打败了世界馆军程序Stockfish和Elmo。国基象棋具有1047种变化,而将棋具有1071种变化。然而,打败最好的人类牌手并不意味着解决游戏。一种AI可以好到足够打败最好的人类选手,但另一种AI可以开发出更好的策略,打败之前的AI。这个循环可以永远持续。解决一种游戏牵涉到计算出一种在公平游戏中不可能输的GTO解决方案。

目前为止,每一种在人类之间竞争的烷美信息游戏(比如国基象棋或跳棋)都已解决。像扑克这样的非烷美信息游戏中,牌手不能看到其他牌手的牌。解决这类游戏呈现出一种额外级别的难度。

具有5x1020种可能行动的跳棋已经在2007年被JonathanSchaeffer教授完全解决。单挑限注德扑(HULHE)是德扑的最小变种,它具有3.19x1014个决策点。虽然这个数字小于跳棋,但HULHE的非烷美信息特征使得它对于计算机而言是一种更难游戏和解决的挑战性游戏。

手个被全面解决的扑克游戏是HULHE,由AlbertaCepheus扑克项目在2015年解决。他们的CFR+算法由一个由200个计算机节点组成计算机集群执行,每个计算机节点配置了24个2.1G赫兹的AMD芯片,32G内存和1TB的本地磁盘。

关于Cepheus的更多信息可以在poker.srv.ualberta.ca网址找到。

2017年1月30日,卡耐基梅伦大学开发的人工智能Libratus在12万手牌的挑战中打败了多名鼎级单挑无限德扑高手。

单挑无限德扑存在10160种情况,超过了宇宙中所有原子的数量(1080)。这种AI需要一组由600个节点组成的炒级电脑,每个节点具有28核处理能力,完成任务和打败人类牌手总共需要处理2.7拍字节(1拍字节=250字节)的数据。

关于Libratus的更多信息可以在这里找到:

cmu.edu/news/stories/archives/2017/January/AI-beats-poker-pros.html

虽然扑克机器人每天都在变聪明,但由于当前的算力,它们能做的事情仍然有一些限制,特别是对于无限德扑和PLO的多人底池局面。虽然HULHE已经完全解决,而且Libratus已经好到足够打败单挑无限德扑的人类牌手,但包括锦标赛、6人桌和满员桌扑克在内的其他扑克变体远非完全解决。

即使超过两铭簰手的德扑游戏的完整解决方案尚未找到,但复杂的游戏可以拆解成小的、容易解决的部分。利用现代Solver软件、炒级电脑、有限的下柱尺度和策略抽象的正确应用,无限德扑的近似GTO玩法可以被计算出来。

商业人工智能软件

基于人工智能的无限德扑软件(例如PokerSnowie)是通过和自身对抗数十亿手牌研究这种游戏的工具。它们最初采用完全随机的策略,在每手牌结束后,成功的玩法被加强,不成功的玩法被减少,导致它们的策略随着时间推进不断改善。

优点

l  快速且容易使用

l  极少需要用户输入

l  没有很大的硬件要求

l  提供导入来自网络扑克的历史牌局以及根据AI策略评估它们的能力。

l  提供翻前和底牌范围建议

l  用户可以挑战人工智能,得到统计数据和错误评估

缺点

l  不真正求解GTO策略,AI输出的只是软件认为在和自身对抗时较好的策略

l  有限的或固定的下柱尺度

l  人工智能无法解释为何它那样做,且结果无法验证

l  无法计算对抗弱手的剥削性策略,程序只提供其核心策略

l  策略随着时间而变化,这使得难以通过它学习

l  无法保证不可剥削

GTOSolver软件

Solver软件是翻前和翻后玩法的纳什均衡计算器。市场上可买到的Solver软件有好几种,它们提供各种不同的功能集。写作本书的时候,大多数商业Solver软件能够用特定的范围和下柱尺度计算任何单挑场合的纳什均衡策略,而且有很高的准确度(低可剥削性)。

一些Solver软件可以计算多人底池局面的翻前及翻后纳什均衡,一些Solver甚至能解决更复杂的游戏,比如底池限注奥马哈。

声称一种策略是GTO策略或非常接近GTO策略必须以某种方式证实。如之前的陈述,无限德扑的完整解决方案尚未发现,如果某人声称具有某个扑克场合在给定抽象内的GTO解决方案,必定有一种科学和数学的方式来验证这种主张,否则任何人都可以说已经解决了这种游戏并且在采用真正的GTO玩法。