Play Poker Online and Win Real Money.

WPT Global

GTO与纳什均衡 GTO与纳什均衡 一、 什么是GTO? GTO(Game Theoretical Optimum),首先要了解这个词汇,中文直译是博弈理论最优(策略),直白点说也就是博弈

GTO与纳什均衡

一、 什么是GTO?

GTO(Game Theoretical Optimum),首先要了解这个词汇,中文直译是博弈理论最优(策略),直白点说也就是博弈论中的最优策略。那么我们如果要了解GTO,那就必须了解博弈理论。

博弈论(Game Theory)本身是一门学科,而且是比较前沿的那种,那么我这里就一笔带过,讲一些最基本的原理。用一个比较简单的定义:博弈论是二人(或者更多人)在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略(以上没看懂的话问题也不大)。

1658280496716940.

二、 纳什均衡

说到博弈论,就必须得提到纳什均衡。纳什均衡是这样一种状态:博弈中的每一方都不能通过单方面改变自己的策略来增加收益。现在一些扑克pro热衷于讨论的GTO,其实就是纳什均衡的一部分。那么除了装逼以外,纳什均衡在扑克中有什么其他意义吗?我们可以从两个角度来看这个问题:

1、 对手不能通过调整打法来剥削我们的EV;

2、 面对对手的策略,我们做出了最优对策。

由此看来,纳什均衡可以在扑克中帮助我们实现“绝对的防御”。而其实所谓的GTO,就是求解扑克中的纳什均衡解。关于如何求解纳什均衡,我不在这篇文章中过多讨论。目前大部分的扑克pro会借助各类软件来直接计算纳什均衡范围,帮助他们复盘学习。我这里想谈一下纳什均衡意味着什么。

从之前的描述其实已经可以看出,纳什均衡是不能通过一个人来实现的:你可以做出纳什均衡解中的你的部分的行动(通俗来讲就是你是GTO的),但如果对手不按照纳什均衡解来行动(通俗来讲就是对手部GTO),就不能实现纳什均衡。

而扑克中的纳什均衡,几乎都是混合策略纳什均衡。这里我们不深入讲纯策略和混合策略,大概意思就是:你拿着同一手牌,纯策略是你必须100%bet或者100%check,而混合策略可以让你bet一部分,check一部分。总之,从定义上看,混合策略纳什均衡解意味着你让对手陷入了这样一个状态:对手无论选择哪一种纯策略,他的EV都是相同的——当然这也意味着他无论采取什么样的混合策略来应对,他的EV也是相同的。

1596446805157211

三、 有关GTO的一些错误观点

从上一节末的结论出发,再结合德州扑克是一个零和博弈(不考虑抽水),于是很多人会得出这样一个结论:

在德州扑克中,如果我是GTO的,那么不管对手是不是GTO,我都会长期保持不输不赢的状态。

他们还会列举一个剪刀石头布的游戏来加以佐证:剪刀石头布中,如果我分别以1/3的概率出剪刀、石头和布,那么无论你怎么应对,我们长期的EV都是0(在这个例子中确实是完全正确的)。

而在扑克中,也有一些例子可以“证明”一个类似的结论:在河牌我们用2/3的nuts和1/3的bluff做一个底池的下注,此时对手的中等牌无论怎么call,他的EV都是0,而我们的EV恒为一个底池(这也是一个完全正确的例子)

1587436568141108

我的观点是:在德州扑克中,这都是一些过于草率的错误结论,只有在非常严格的限定条件下才可能成立。

我们追根溯源,谈一谈纳什均衡的求解:在求解纳什均衡的过程中,我们必须首先剔除严格下策。

什么叫严格下策?在扑克中,fold掉nuts,用完全空气跟注就是明显的严格下策。在剪刀石头布当中,出剪刀、石头、布都不是严格下策,因为他们总是有可能赢的。而在经典的类扑克博弈模型AKQ游戏中,跟注Q就是严格下策。在扑克中,大部分情况下我们的范围内都会存在一些严格下策决定。换句话说,对手的范围完全由中等牌力构成,而你的范围完全两极化的范围这个假设太过于理想化了。既然你不能保证你的对手不会做出严格下策的决定(类似27o call 3bet,hit or fold这样),那么你就不能应用所谓的EV相同法则。而显然,采取了严格下策的对手会使得你的整体GTO策略自动获利。

总之,以上结论只有在对手的策略集完全剔除了严格下策以后才是正确的。

FAQ

WePoker注册时的国旗要怎么选择?

WePoker注册时的国旗要怎么选择?

此部份默认即可,显示的国旗并不影响您的游戏进行。

WPK-微扑克 虚拟币充值双重送 FAQ

WPK-微扑克 虚拟币充值双重送 FAQ

1. 什么是 WPK-微扑克 虚拟币充值双重送活动?

WPK-微扑克 虚拟币充值双重送活动是针对使用USDT充值的玩家,提供丰厚的返还优惠。

2. WPK-微扑克 活动的具体内容是什么?

通过使用USDT进行充值,玩家可以享受高达上万元的优惠。

3. 在 WPK-微扑克 中,如何获得首充返还?

活动中,USDT首充或再存即享100%返还,最高可获得¥8888的返还。

4. WPK-微扑克 充值双重送活动的时间限制是多久?

具体的活动时间请关注俱乐部的公告或咨询客服。

5. 我需要满足什么条件才能参与 WPK-微扑克 的充值活动?

参与活动的玩家需使用USDT进行充值,且需遵循相关的活动规则。

6. WPK-微扑克 充值活动是否适用于所有玩家?

活动适用于所有符合条件的玩家,具体详情请咨询weipuke.org微扑克客服

日本ゲーム大賞 どこ?

日本ゲーム大賞2024「フューチャー部門」 発表授賞式概要 ・フューチャー部門について: 2024年9月26日~29日に開催される「東京ゲームショウ2024」において、リアル出展およびオンライン出展で発表・展示される未発売作品(ビデオ出展作品、ハードを含む)に対するインターネット投票を実施。Jul 4, 2024

日本が作ったゲームは?

日本ゲーム大賞2024「フューチャー部門」 発表授賞式概要 ・フューチャー部門について: 2024年9月26日~29日に開催される「東京ゲームショウ2024」において、リアル出展およびオンライン出展で発表・展示される未発売作品(ビデオ出展作品、ハードを含む)に対するインターネット投票を実施。Jul 4, 2024

WePoker App下载超级签是什么?

WePoker App下载超级签是什么?

什么是企业签?企业签可在iPhone、iPad下载,与普通版相比,可以有效减少软件频繁授权签名次数,服务由第三方提供。

🎡 最新文章 🎡🎀 熱門文章 🎧
🎪 推薦文章 😚

德州扑克SNG锦标赛技巧 德州扑克SNG锦标赛技巧 德州扑克SNG锦标赛最近变得非常流行。运用正确的知识能提高你赢得SNG锦标赛的的机率。 1.根据你的位置而行动。你应该

制胜扑克锦标赛的三大要素 制胜扑克锦标赛的三大要素 扑克锦标赛比常规局更动态,它迫使你进入许多从未遇到过的局面。因此,为了成功赢得锦标赛,你的策略需要更有弹性。 不可否认

惊悚牌是什么意思 惊悚牌是什么意思 Tony在CO位加注,你在按钮位低头看到口袋4。 你跟注,盲注位弃牌。你们单挑进入翻牌。 Tony是很稳健的玩家。如果有牌他就会

没有德州扑克理论知识也能赢得底池 没有德州扑克理论知识也能赢得底池 当我们刚开始学习打牌时,我们最反感的可能是理论和专业术语,范围两极化、筹码底池比、高频率诈唬……完全听不懂。

范围平衡/扑克组合 范围平衡/扑克组合 扑克组合是数学的一个分支,通过量化扑克中各种情况下的手牌组合,它可以帮助我们来确定对手的范围。举一个明显的例子吧,假设你知

为什么应该在德州扑克决赛桌泡沫期激进 为什么应该在德州扑克决赛桌泡沫期激进 你在一场锦标赛辛苦了大几个小时后,终于就要来到决赛桌了。现在场上还有10名选手,只要再淘汰一名选手就能进

德扑锦标赛泡沫期策略打法 德扑锦标赛泡沫期策略打法 作者:Andrew Brokos 为什么有知识的玩家在锦标赛中如此有利可图?这是因为奖池总是比保证金高出许多。比如,在一场180-

check-raise是什么意思?德州过牌加注的打法 check-raise是什么意思?德州过牌加注的打法 有些德扑玩家在牌桌上不时会遭到对手的猛烈攻击,不禁会怀疑自己是不是表现得太弱了,才使得对

【深度好文】一个德州扑克高手眼中的交易风险(part1) 我是一个曾经的职业牌手,一年365天我起码打300天牌,一天起码打10个小时,一个小时我们一般可以玩20手牌。所以我一年至少要打60000手

《艷遊記》如何充值? 亲爱的玩家您好: 充值教学如下,按照步骤即可获取您想要的宝物一、游戏内充值1.举例,游戏内选择充值鑽石2.选择使用平台币充值,如平台币余额为0

德州扑克资金管理是什么意思?资金管理BRM怎么做? 德州扑克资金管理是什么意思?资金管理BRM怎么做? 资金管理是你成功路上的重中之重下面所介绍的原则是你成为一个成功玩家的关键。如果没有正确的资

用加注来验牌?这打法你用过吗? Q提问如何看待加注验牌?为什么会流行这种奇怪的打法? 发现国内有很多人提出这个打法,搞不懂这个打法从哪来的。 A回复精选liurenpei 如果搞