德州撲克,如何抓住對手的漏洞

德州撲克中,高手玩家之間總會提到一個詞—-GTO

所謂的GTO就相當於玩石頭剪刀布的兩個玩家都是絕頂高手,為了不讓對手找到漏洞,採取理想的無漏洞打發,也就是33.3%石頭、33.3%剪刀、33.3%布。

同理,撲克中的GTO打法,和石頭剪刀布遊戲里各1/3的策略一樣,都是無漏洞策略,雖然無法被對手找到弱點,但是也無法贏對手,屬於最佳防守策略。

截止到2017年,全球的人工智能在德州撲克領域也一直按照撲克GTO策略製作機器人,2017年來自卡內基美隆大學的目前世界第一德州撲克人工智能Libratus,已經在少量手牌交戰中戰勝了4位人類高手。之所以能贏人類高手,也是因為短期波動較大,人工智能剛好短期走運而已,當然Libratus的GTO策略也只能保證不輸,類似於石頭剪刀布的1/3的GTO策略。

石頭剪刀布中要想贏對手,就必須看到對手策略中的漏洞! 我們採取偏離GTO策略的克制對手策略來盈利。

我們討論為什麼GTO是無獲利的。下注量為100,對手策略為33.3%石頭、33.3%剪刀、33.3%布,我們改變策略,36%出石頭、32%出剪刀、32%出布,下注量為100,對手策略不變,情況如下:

1、我們36%的概率出石頭的時候,對手有1/3的概率出石頭,平局;1/3的概率出剪刀,我們贏100;1/3的概率出布,我們輸100;

2、我們32%的概率出剪刀的時候,對手有1/3的概率出石頭,我們輸100;1/3的概率出剪刀,平局;1/3的概率出布,我們贏100。

3、我們32%的概率出布的時候,對手有1/3的概率出石頭,我們贏100;1/3的概率出剪刀,我們輸100;1/3的概率出布,平局。 可以發現,我們和對手都沒有盈利。

所以無論我們怎麼調整策略,“石頭:剪刀:布=32:36:32”也好,“石頭:剪刀:布=32:32:36”也好,甚至“石頭:剪刀:布=100:0:0”,我們最終的盈利都為0,也就是說當對手採取GTO策略的時候,我們是無法獲利的,當然對手也無法獲利。

如果對手不採取GTO策略,也就是說對手有漏洞,比如“石頭:剪刀:布=35:33:32”,我們就可以採取更多布的策略,完整克制對手的多石頭策略。此時,如果我們的策略是“石頭:剪刀:布=0:0:100”,也就是最大化地利用對手的漏洞,此時我們100%出布,對手35%出石頭,我們最終得到200(兩人各下注100,彩池為200),對手33%出剪刀我們得到0,對手32%出布我們平局,拿回100。

那麼: EV(100%出布)=200*0.35+0*0.33+0.32*100-100=+2 EV值為正,說明我們的做法是盈利的。

EV公式介紹:我們最終拿回的102(200*0.35+0*0.33+0.32*100)減去我們之前下注的100,就是我們最終的盈利EV。

另外在現實中需要說明的是,當我們採取最大化利用對手漏洞時,對手很容易發現我們的策略,而採取反制策略,所以一般我們不會採取最大化利用策略,而是採取平衡混合利用策略,100%出布的策略雖然是+EV,但是容易被對手察覺,然後對手調整石頭剪刀布的比例,我們的策略就會失效。

如: 我們應用混合策略“石頭:剪刀:布=32:33:35”,因為對手剪刀沒有偏向,33%差不多1/3,我們剪刀也33%,對手的石頭有2%偏多的傾向,我們布也對應2%偏多,對手的布有1%偏少傾向,我們的石頭也應該有1%的偏少傾向。這種混合策略不容易讓對手發現而改變其最初的比例。

所以我們在德州撲克遊戲中,要時刻觀察自己的對手,分析對手下注、3-bet、4bet、allin、嚇唬和河牌圈攤牌等現象的頻率,找到漏洞,然後做出相應策略,通過對手的漏洞獲取盈利也是德州撲克遊戲中的必要課程。