德州撲克基礎教程1:EV——所有決策理論的基石
君子之交如水
2017年GPL全球撲克聯賽三亞站冠軍成員
EV是英文單詞Expected Value的縮寫,中文翻譯叫做期望值,或數學期望。在今天的文章中,我們將主要和大家聊聊什麼是EV,如何使用EV,以及為什麼EV如此至關重要。
EV是一個數學概念。當我們談到某項舉動的EV時,我們所表達的含義就是説在長期遊戲過程中,這項舉動平均每次將為我們帶來多少收益。也許你經常聽人討論,這是一個 EV的決策或這是一個-EV的決策,此處所表達的含義就是説,在長期來講,該決策是一個能使玩家盈利的決策,還是一個會使玩家遭受損失的決策。所以在利博娛樂城德州撲克的遊戲中,我們的目標就是竭盡所能地持續做 EV的決策,並避免做-EV的決策。
既然EV是一個數學值,那麼EV值得求解就是有計算公式的。但不用擔心,公式十分簡單:
這就是我們在撲克遊戲中經常會使用到的EV值的計算公式。在公示中,我們使用win的首字母W代表獲勝,用單詞lost的首字母L表示失敗。在公式中,各部分的含義分別為:%W代表我們獲勝的概率,$W代表我們獲勝後的收益,%L代表我們失敗的概率,$L代表我們失敗時面臨的損失。那麼,這個公式該如何使用呢?
我們來玩一個拋硬幣的遊戲。每當拋出人頭面的時候,我將付給你$3,而每當拋出字面的時候,你將付給我$1。你一定知道這是一個對你十分有利的遊戲。但是如果運用EV的計算公式,你就能夠得出,平均每次拋硬幣時,你將贏得多少錢。我們只需要拿出EV的計算公式,再將遊戲中的變量填寫進去,然後再求解。當你贏時,你將獲得$3,所以$W的部分就是3,而當你輸時,你將損失$1,所以$L等於1。由於我們知道,拋硬幣中出現人頭或字的概率是相等的,那麼你獲勝和失敗的概率將各為二分之一,所以%W和%L都是50%。填寫完畢的公式是這樣的:EV=(0.5×3)-(0.5×1)。
這裏還有一個小竅門兒,獲勝和失敗的概率相加,答案總應該等於百分之百。所以,在遇到了相對複雜的遊戲時,你只要知道了其中一項的概率,就可以用這個原則,推導出另外一項的概率。計算過後可以得出,我們的EV值為1。也就是説,我們在接受了這個遊戲後,在長期的遊戲裏,我們平均每次將贏得$1。要注意的是,如果這個遊戲只玩兩次,我們只會獲得這三種結果:兩次都贏,贏得$6;一勝一負,獲得$2;輸掉兩次,失去$2。所以你看到的遊戲結果與我們剛剛計算出的EV值相去甚遠,但如果我們拋一百次,一千次,上萬次,再計算結果時,我們會發現,平均每次,我們贏得了$1。
所以,在撲克的遊戲中,我們着眼的一定是長期的收益,而不是某一局的輸贏。當我們只看短期,遊戲結果的數據看上去十分變幻莫測,但我們知道,只要着眼長期,那麼數學的威力將會把結果帶回我們的平均期望。
這就給了我們兩點至關重要的啓示:一是我們需要持續尋找這樣能夠讓我們有機會做 EV決策的遊戲和場景;二是我們一定要避免做出期望值為負的決策。
接下來我們就來看看這一切在德州撲克的遊戲中是如何體現的。在小盲為0.5,大盲為1的遊戲中,所有玩家棄牌至小盲注位置,小盲注位置的玩家選擇全下12,我們在大盲注位置拿到了A、Q,考慮該如何行動。現在,我們擁有了EV的相關知識,我們就能從數學上證明,我們接下來的行動正確與否。現在拿出我們的公式開始填寫,首先,最一目了然的就是$W和$L的部分,如果我們跟注並勝利,我們將獲得小盲注玩家的12和我們投入的大盲注1,這裏要注意一點,即使是被強制投入的盲注,籌碼一旦被投入底池,就已經不再屬於我們。這也就是説,在當前情況下,我們的$W應該是1 12,一共$13。那麼當我們跟注並失敗時,我們面臨的損失該如何計算呢?因為盲注1已經不再屬於我們,這裏我們的損失將僅僅為我們所需要跟注的11,所以$L等於11。最後,我們還需要的就是%W和%L了,也就是説我們獲勝和失敗的概率。
在拋硬幣時,我們輸贏的概率各為50%,那麼在德州撲克的遊戲中,如何知道我們的手牌獲勝的概率呢?大部分學員在學習並掌握範圍和勝率的知識前,可以使用一個小工具來計算勝率。也就是説,自己的手牌在面對對手特定持牌範圍時的勝率。這樣的小軟件在應用商店裏就可以免費下載到。我們假設我們的玩家此處會選擇用77以上的對子、大於AJ的高張、以及KQ全下,其實通常我們會判定,小盲注位置的玩家會用更加寬泛的範圍全下,但此處,為了更清晰簡要地説明EV知識的應用,我們就先不把簡單的問題複雜化了。我們可以把自己的手牌和玩家的範圍放進市面上任何一種計算勝率的軟件裏,就會得到這樣一個結果。
所以我們預計當我們跟注對手的全下時,長期來看,A、Q將在大約47%的情況下獲勝,相應地,也將在53%的情況中失敗。現在公式已經填寫完畢,只需要推演計算,我們便證明了,在這裏,跟注將獲得 0.28的EV。如果我們在這裏對比一下棄牌和跟注兩個選項,棄牌時,我們獲得的EV為0,因為公式中$W和$L的部分為0,而跟注我們已經計算過了,EV為 0.28,那麼對比棄牌,跟註明顯是一個個更好的選擇。這説明在此處,跟注不僅僅是一個 EV的決策,並且是我們所有可做選擇中的最優解。
最優解就是説所有可做的決策中最好的決策,價值最大化的決策。 0.28的EV也許看上去十分不起眼,但如果能不斷地持續做出這樣正確的決策,那麼EV將在長期為我們帶來可觀的回報。況且,當小盲注玩家確實用更寬泛的手牌範圍在這裏全下時,也就意味着事實上,我們的勝率將會提高,失敗的概率也就會降低,那麼EV的結果又將變大,小盲位玩家越松,我們獲得的EV就越大。所以,練習使用EV的原理來分析遊戲中面臨的各種情況,對比自己所有的可選項,哪些更優,越練就會越簡單,直到隨時判斷EV的能力已經成為了你的第二本能,這一本領能幫助你在遊戲中迅速找到好的EV點和躲開差的EV點。
但是,一定要記住,EV價值的體現一定要着眼長期,在實際遊戲中,你可能連續做出了三個 EV的決策,而結果卻是連續輸掉三次,但只要持續遊戲,超過幾十次、上百次,以至更多次的遊戲,結果就會逐漸按照期望分佈體現出來。這就是我們在德州撲克遊戲中盈利的原理,持續地做 EV的決策,在長期的遊戲中,獲得我們期望的獎勵,在短期或少量的遊戲中,你將深切地體會到數學中的隨機性對你遊戲成果所帶來的衝擊,在撲克遊戲中,我們稱它為波動。
在實際遊戲中,你不可能每作一次決策都拿出紙筆用EV公式來計算一遍,但其實你只需要對一些常見情況進行分析,再配合一些簡便算法的使用,你就能夠迅速大致判定自己EV值的範圍,有空時多分析和計算一些常見情況,在遊戲中不斷地訓練自己捕捉和計算的能力,記住,在撲克中,簡單的決策之所以簡單,是因為它們總是明顯的 EV或-EV,而複雜的決策之所以複雜,是因為它們總是很接近0EV。在一些複雜的決策環境下,一些細微的變化,比如對手的手牌範圍中增加或減少一種可能性,都會給EV值帶來巨大的偏離。所以只有練習,才能讓我們在遊戲中迅速分辨出當前的決策環境下,我們的決策是簡單還是複雜,並通過對比,選擇我們價值最大化的決策。
發佈於 2019-11-24 17:04
德州撲克
贊同 41 條評論分享喜歡收藏申請轉載