各位同學們大家好!我是李永樂老師。
之前我做了兩個系列節(jié)目:《漫談相對論》和《從亞里士多德到牛頓的宇宙》,我想,第三個系列節(jié)目就換換口味,講講數(shù)學的一個小分支,在經(jīng)濟學上又很有用的學問——博弈論吧。
我在北大讀書時,學過一點經(jīng)濟學,但是沒有系統(tǒng)學習過博弈論這門課。今天所講的都是我個人對博弈論的理解,如果有不準確的地方,歡迎大家批評指正。在這個系列中,我把之前零零散散講過的博弈論內(nèi)容進行了總結(jié),希望大家喜歡我的講述。
(資料圖片僅供參考)
“弈”這個字,原本意思是下棋。請問各位同學,你會下棋嗎?你下棋輸過嗎?如果我說,圍棋也好,象棋也好,其實都是有必勝法的,你們相信嗎?
我們假設(shè)有一個非常簡單的游戲,先手A和后手B各做一次決策(選擇上路或者下路),根據(jù)二人決策的結(jié)果,游戲的勝負如下。通過這個表格,你能知道游戲的結(jié)果是誰獲勝嗎?
也許有同學認為:A的贏面大一些,因為A有2種可能會贏,而B只有一種可能會贏。事實并非如此。這盤棋的結(jié)果一定是和棋(除非有一方實在腦子不太好用,才會輸?shù)簦?/p>
我們可以畫一個游戲樹來解釋:
我們看:如果先手A選擇上方,游戲進入到一個由進行B進行決策的分支,這叫做一個子游戲。在這個子游戲中,B選上方就A獲勝,B選下方就B獲勝,B要選擇對自己有利的,所以他一定選擇下方。這個子游戲的結(jié)局是固定的,就是B獲勝。
如果先手A選擇下方,游戲進入到另一個由B做決策的子游戲中,這時B選上方就A獲勝,B選下方就和棋,B要選擇對自己有利的,所以這個子游戲的結(jié)局一定是和棋。
我們再來考慮A:若A走上方,進入子游戲1,一定B獲勝;A走下方,進入子游戲2,一定和棋。A也要選擇對自己有利的,所以A選擇下方。最終的游戲就是和棋。
如果游戲復雜一些,也不過是分支變多,長度變長,但是只要我們從最后端的子游戲開始,一層層倒推,就一定能推算出在最優(yōu)策略下,游戲到底是先手勝,還是后手勝,還是和棋,這種勝負是不可避免的。
其實,象棋也好,圍棋也好,它們與我剛才舉的例子沒有本質(zhì)不同,只是復雜度高得多。而且,由于制定了一些勝負以及和棋規(guī)則,下棋的步驟也是有限的。
理論上講,我們是可以畫出圍棋的游戲樹的,如果我們遍歷了所有情況,就能知道圍棋結(jié)局到底是先手必勝,還是后手必勝,或者一定是和棋了。只是,這個過程過于復雜。
以圍棋為例。圍棋在19x19=361個格子上輪流放棋子,所以每個格子有黑白空三種可能,整個圍棋棋盤上的狀態(tài)數(shù)上限是3361=1.7×10172,去掉一些重復和對稱,圍棋的狀態(tài)復雜度大約是10172量級。
要知道:宇宙中的原子個數(shù)只有大約1072個,就算用宇宙中的一個原子代表一個圍棋局面,窮盡宇宙中所有的原子,也不能表示出圍棋所有的棋局局面。
圍棋的游戲樹就更難畫了。因為圍棋可以提子,有了空白的地方可以繼續(xù)下,所以并不一定是填滿了棋盤就結(jié)束。不過,我們可以估計游戲樹的總層數(shù)和每一層的平均分支。根據(jù)統(tǒng)計和計算:一盤圍棋的平均手數(shù)是150手,每一手的平均分支數(shù)是250種,所以整個圍棋的游戲樹復雜度大約是250150≈10360。
理論上講,如果我們遍歷了所有10360種情況,就能知道圍棋結(jié)局到底是先手必勝,還是后手必勝,或者一定是和棋了。但是,這個計算量實在太大了。之前世界上最快的計算機富岳每秒最高可以計算100億億次浮點運算,假如1次浮點運算就能算出一條路徑,那么算完所有圍棋游戲的可能情況,需要10342秒,而宇宙的年齡只有138億年,大約只等于1017秒。
雖然我們無法計算出這個最優(yōu)策略,但是顯然,這個最優(yōu)策略一定是存在的。
不僅僅是圍棋,所有的明棋都是這樣,只不過復雜度不同而已。
1913年,數(shù)學家策梅洛證明:對于一個兩人的完全信息游戲,一定存在一個策略,要么先手一定獲勝,要么后手一定獲勝,要么雙方一定平局,這就是澤梅洛定理。
策梅洛
策梅洛定理告訴我們:假設(shè)雙方都是棋類大師,對游戲樹了如指掌,這時候他們一定會采用統(tǒng)一的策略,讓游戲向固定的方向發(fā)展,最終的結(jié)局也是固定的。
因為,任何一個人單方面的改變決策,都會對自己不利。正如我們剛才舉例的那個小游戲,如果A改變決策,將會讓B獲勝;如果B改變決策,將會讓A獲勝,雙方都為了自己的利益考慮,一定會出現(xiàn)A選擇下路,B也選擇下路的情況,最后游戲就一定是和棋。
實際上,在許多的博弈過程,都和下棋很像,參與博弈的幾方能采取的策略都是有限的。在1950年,著名的數(shù)學家約翰納什證明了一個更加普遍的結(jié)論:
只要參與博弈的幾方策略都是有限的,那么就一定存在一種平衡狀態(tài),大家都會采用這種平衡策略,而沒有單方面改變策略的動力。這種平衡狀態(tài)就叫做納什均衡。這個規(guī)律就叫做納什定理。
剛才舉的下棋的例子,最優(yōu)策略就是納什均衡,策梅洛定理其實是納什定理的一個例子。在我們所處的世界中,無論是政治還是經(jīng)濟,都充滿了博弈論和納什均衡的例子。你想了解更多嗎?關(guān)注我,下一回繼續(xù)帶大家漫談博弈論。