博弈論心得體會(精選7篇)

博弈論心得體會 篇1

在社會中,人與人之間的對抗和較量是一個不容迴避的話題,只有直面這些問題,個人才更有可能獲得成功的機會。在所有的對抗和較量中,其勝負成敗常常取決於3個基本的因素:機會或者説運氣、體能和智能。通過拋硬幣來賭輸贏是純粹依賴於個人運氣的遊戲;百米賽跑的勝負基本上取決於個人的全身技能;而籃球賽、戰爭等對抗,雖然也會受到運氣的影響,體能也很重要,但決定勝負的更重要的因素是頭腦技能的較量。

博弈論心得體會(精選7篇)

頭腦技能是一種策略技巧,或者説是在謀略方面的造詣。既然世間大多數對抗都與頭腦技能有關,因此人們試圖獲得成功,就有必要研究在對抗局勢中如何策略性地選擇自己的行動。而今,博弈論就是一門專門研究互動局勢下人們的策略行為的學問。事實上,每個人每天都在與他人打交道,或競爭或合作。身處這樣高度互動的環境之中,無論一個人是否知道博弈論,實際上他都不斷地在與他人進行博弈,無論是他的父母、親人、兄弟、老師還是商場對手、政治敵人……一個可能不知道博弈論為何物,但是他的確常常在與他人進行着對抗和較量,在進行着一場又一場博弈;而生存本能,也讓人們在不知不覺中學會了不少博弈技巧。

然而,通過本能所學習的博弈技巧,是既不繫統也相當費勁的。因此,人們有必要以一種最為節省的方式來學習策略技巧。而最節省的方式,莫過於直接學習博弈論的知識了。難怪經濟學家薩繆爾森這樣説着:“要在現代社會做一個有文化的人,你必須對博弈論有一個大致的瞭解。”事實上,不單一般人應該瞭解博弈論,各個領域的專家更應該瞭解博弈論——20世紀後半葉的歷史表明,博弈論在軍事、政治、商業、法律、經濟學、生物學、心理學、社會學、歷史學等諸多領域都已有非常成功的運用。其中,在經濟學、生物學、政治和軍事中的運用取得了相當大的成就。1994年和20xx年,諾貝爾經濟學獎兩度眷顧博弈論,不是沒有原因的。

不過,對於大多數人來説,學習博弈論並不是一件輕鬆的事情。因為正式的博弈理論往往是用數學語言表達出來的,而社會中的大多數人都有數學恐懼症,雖然對於少數人來説數學的形式是那麼優美,但大多數人把博弈論的學習看做是一件艱難的而痛苦的事情。其實,博弈論是如此有趣的學問,把博弈論的學習當成一件痛苦之事,實在是不應該的。

我們應該快樂地學習,快樂地學習博弈論。這一點,我們事實上是可以做到的,因為博弈比較基礎的東西是不需要高深的數學功底的。然而,如果我們能熟練地掌握這一部分博弈論知識,對我們的學習和工作都大有裨益。

深感短短一個學期的時間,對於博弈論這一門獨具魅力的課程,只是從皮毛上略有了解。儘管如此,我還是學會了一種以博弈的觀點來思考、分析、判斷、解決問題的方法。就好比囚徒博弈的現象,我以前可能能夠猜到結果,但這只是知其然而不知其所以然罷了。然而現在可就不同了,相似的問題我都能夠用所學的博弈論知識去解釋,能夠了解其本質了。

博弈論心得體會 篇2

我學過一段時間博弈論,一些思維過程中也可能自覺不自覺地使用一些博弈論思想,有兩點比較突出的體會。

第一,制訂政策或遊戲規則,要保證所有人有參與積極性。這來源於“納什均衡”概念,説起來當然簡單。但我自己覺得,以前所知道的這條道理——制訂遊戲規則要保證所有人有參與積極性——是簡單接受,沒有邏輯,或者,在直覺層次覺得這是對的,但沒有認識到它為什麼對。

有本書上説,以後的經濟學家必須知道一個“納什均衡”概念,否則不算經濟學家,或者説,玩明白了“納什均衡”,就像玩明白了“價格”一樣,是經濟學家的基本功。我贊同。協議必須是能夠自動執行的。

第二,千萬不能把別人當傻瓜。這來自子博弈精煉納什均衡。合理的行為序列必然在每一步上都合理(當然,這裏不去探討“歷史理性”),即使存在一點缺陷,也要從“顫抖手均衡”的思路來考慮問題,使自己不要隨意使用“觸發策略”,保證你好我好(也可以説是“我好,他也好”)。如果把別人當傻瓜,吃虧的是自己,就像那個賣貓的故事。

把博弈論這種技術體系當作世界觀,似乎有些危險,但其中的道理我必須重視。以上是一點體會,希望能拋磚引玉。

博弈論心得體會 篇3

學習博弈論的目的,不僅是為了贏得更好的結局,也在於享受博弈分析的過程。先給大家猜一個腦筋急轉彎,問:在什麼情況下零大於二,二大於五,五又大於零。答案是:在玩“石頭.剪刀.布”遊戲的時候。

博弈,就是用這種遊戲思維來突破看似無法改變的局面,解決現實的嚴肅問題的策略。在博弈中,每個參與者都在特定條件下爭取其最大利益,強者未必勝券在握,弱者也未必永無出頭之日。因為在博弈中,特別是多個參與者的博弈中,結果不僅取決於參與者的實力與策略,而且還取決於其他參與者的制約和策略。也就是説在現實生活中屌絲若要逆襲,學習並掌握必要的博弈論的知識是很有幫助和必要的。

事實上,博弈過程本來就不過是一種日常現象。我們在日常生活中經常需要先分析他人的意願從而做出合理的行為選擇,而所謂博弈就是行為者在一定環境條件和規則下,選擇一定的行為或策略,實施並取得相應結果的過程。比如你身為博士,當面臨老闆任務的壓力和可愛妹紙的召喚的選擇時,必要的博弈論知識的應用,也許會助你平安過關。當然,夾在這樣一個三節點的博弈關係中,處於極其弱勢地位的你,往往只能自求多福了。

博弈論用途很廣。博弈論原是數學運籌中的一個支系,其研究運用了許多的數學工具,這彷彿形成了一道阻礙我們初學者與博弈論的鴻溝。但是偉大的馬克思説過:“一種科學只有在成功地運用了數學時,才算是達到了真正完善的地步。”面對這條鴻溝,我們不僅要學習數學公式和理論,也不可以忽略一個很淺顯的道理:一個不會編程的人照樣可以成為電腦應用高手,沒有高深的數學知識,我們同樣可通過博弈論的學習成為生活中的策略高手。就像孫臏沒有學過高等數學,但是這並不影響他通過運用策略來幫助田忌贏得賽馬。所以我一直很淡定的看待本課的許多數學公式和算法,因為我相信只要我掌握了博弈論的本質,老師您是不會讓我掛掉的。

博弈論首先是我們思索現實世界的一套邏輯,其次才是把這套邏輯嚴密化的數學形式。博弈論的目的在巧妙的策略,而不是解法。我們學習博弈論的目的.不僅是為了贏得更好的結局,也在於享受博弈分析的過程。説到底,博弈論畢竟只是一個分析問題的工具,用這個工具來簡化問題,使問題的分析清晰明瞭,也就夠了。

英勇的博士們,為了碉堡的逆襲,為了老闆的任務,為了妹紙的歡心,大家不僅要好好學習掌握這門課,順利通過考試,更要將博弈的思想應用在日常生活中,成為一名博弈高手。

博弈論心得體會 篇4

在所有的對抗和較量中,其勝負成敗常常取決於3個基本的因素:機會或者説運氣、體能和智能。通過拋硬幣來賭輸贏是純粹依賴於個人運氣的遊戲;百米賽跑的勝負基本上取決於個人的全身技能;而籃球賽、戰爭等對抗,雖然也會受到運氣的影響,體能也很重要,但決定勝負的更重要的因素是頭腦技能的較量。

頭腦技能是一種策略技巧,或者説是在謀略方面的造詣。既然世間大多數對抗都與頭腦技能有關,因此人們試圖獲得成功,就有必要研究在對抗局勢中如何策略性地選擇自己的行動。而今,博弈論就是一門專門研究互動局勢下人們的策略行為的學問。事實上,每個人每天都在與他人打交道,或競爭或合作。身處這樣高度互動的環境之中,無論一個人是否知道博弈論,實際上他都不斷地在與他人進行博弈,無論是他的父母、親人、兄弟、老師還是商場對手、政治敵人……一個可能不知道博弈論為何物,但是他的確常常在與他人進行着對抗和較量,在進行着一場又一場博弈;而生存本能,也讓人們在不知不覺中學會了不少博弈技巧。

然而,通過本能所學習的博弈技巧,是既不繫統也相當費勁的。因此,人們有必要以一種最為節省的方式來學習策略技巧。而最節省的方式,莫過於直接學習博弈論的知識了。難怪經濟學家薩繆爾森這樣説着:“要在現代社會做一個有文化的人,你必須對博弈論有一個大致的瞭解。”事實上,不單一般人應該瞭解博弈論,各個領域的專家更應該瞭解博弈論——20世紀後半葉的歷史表明,博弈論在軍事、政治、商業、法律、經濟學、生物學、心理學、社會學、歷史學等諸多領域都已有非常成功的運用。其中,在經濟學、生物學、政治和軍事中的運用取得了相當大的成就。1994年和20xx年,諾貝爾經濟學獎兩度眷顧博弈論,不是沒有原因的。

不過,對於大多數人來説,學習博弈論並不是一件輕鬆的事情。因為正式的博弈理論往往是用數學語言表達出來的,而社會中的大多數人都有數學恐懼症,雖然對於少數人來説數學的形式是那麼優美,但大多數人把博弈論的學習看做是一件艱難的而痛苦的事情。其實,博弈論是如此有趣的學問,把博弈論的學習當成一件痛苦之事,實在是不應該的。

我們應該快樂地學習,快樂地學習博弈論。這一點,我們事實上是可以做到的,因為博弈比較基礎的東西是不需要高深的數學功底的。然而,如果我們能熟練地掌握這一部分博弈論知識,對我們的學習和工作都大有裨益。

深感短短一個學期的時間,對於博弈論這一門獨具魅力的課程,只是從皮毛上略有了解。儘管如此,我還是學會了一種以博弈的觀點來思考、分析、判斷、解決問題的方法。就好比囚徒博弈的現象,我以前可能能夠猜到結果,但這只是知其然而不知其所以然罷了。然而現在可就不同了,相似的問題我都能夠用所學的博弈論知識去解釋,能夠了解其本質了。

博弈論心得體會 篇5

近日整理書櫥時,我偶然看到了在東北財經大學學習研究生課程時所學的《博弈論》這本書。當時我們很幸運,學院特意選了東北財經大學優秀教師 史永東 教授來講授這門課。 史 教授是當時東北財經大學最年輕的教授(時年 35 歲, 32 歲時就破格晉升為教授),他把 一門很深的學問給我們講得惟妙惟肖,非常生動。直至今日隨手翻閲時,仍能清楚地記起他講課時激情洋溢的風采,但如今重新閲讀這本書卻有了不同的感受,當時是為了掌握其中的理論,現在則可以比較從容地去體會其中的道理了。

博弈論是一門很深的學問,主要研究個體如何在錯綜複雜的相互影響中得出最合理的策略,其應用的領域也非常廣,最通常的應用該是經濟學吧。這本書中的理論很深奧,其數學模型的推導更是複雜,然而書中的案例卻既淺顯又生動,很值得一看。現在拿出一個例子來,和大家一起分析其中的道理、分享其中的趣味。

這個例子是“智豬博弈”的故事,講的是:豬圈裏有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一隻豬去踩踏板,另一隻豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。

那麼,兩隻豬各會採取什麼策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。

原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。

“小豬躺着大豬跑”的現象是由於故事中的遊戲規則所導致的。規則的核心指標是:每次落下的食物數量和踏板與投食口之間的距離。 如果改變一下核心指標,豬圈裏還會出現同樣的“小豬躺着大豬跑”的景象嗎?試試看。

改變方案一:減量方案。投食僅原來的一半分量。結果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味着為對方貢獻食物,所以誰也不會有踩踏板的動力了。

改變方案二:增量方案。投食為原來的一倍分量。結果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當於生活在物質相對豐富的“共產主義”社會,所以競爭意識卻不會很強。

改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶着踩踏板。等待者不得食,而多勞者多得。每次的收穫剛好消費完。

這個故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發。但是對於社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的並不是最佳狀態。為使資源最有效配置,規則的設計者是不願看見有人搭便車的,政府如此,公司的老闆也是如此。而能否完全杜絕“搭便車”現象,就要看遊戲規則的核心指標設置是否合適了。

書中還有很多例子,並進行了分析,我們都能悟出些道理。所以讀的時候會有一個感覺,那就是先有事實,後由理論。也就是我們常説的理論來源於實踐。感覺就像是先有這個社會現象,然後才有這個理論去分析,這個理論套在這個社會現象上恰好合適。

博弈論心得體會 篇6

上次講了幾種同時行動博弈,其中的一種就是協調博弈。這一次專門講協調博弈中的一種非常值得關注的情況:大規模協調博弈。在協調博弈中,局中人必須同時採取行動才能實現效用的最大化。而在大規模的協調博弈中存在一種網絡的外部性,也就是是指擁有產品的人越多,這種產品的價值就越高。

當一種產品被賦予某種交流與流通的功能的時候,它常常就會具有這種外部性。比如説電話。如果只有你自己有電話,而你認識的人都沒有,那電話對於你就只是一個擺設,什麼用處都沒有。而你周圍使用電話的人越多,這部電話所起的作用就越大。我早先使用QQ的時候也是如此。那時候我是周圍最早申請QQ號的,可是申請了之後卻不知道和誰聊天,只好見到一個在線的就加上。到後來同學都開始用QQ了,QQ才開始成為我一個重要的聯絡工具。現在做科研的估計都會説微軟的東西很難用,不管是操作系統還是office軟件,我也很想學Linux,學TeX,但是一想到工作中別人用的都是windows和word,很多軟件只有windows版本的,我用個TeX寫的東西別人還打開不了,於是只好作罷。網絡的外部性使得一個新的用户在選擇產品的時候不光要考慮這個產品本身的好壞,還得考慮這個產品被使用的廣泛性。

這種網絡外部性的存在使得市場的先進入者具有後進入者不可比擬的優勢。當一個具有交流功能的產品真正流通起來以後想打倒它是一件很困難的事情,比如你很難想象百度hi會取代騰訊QQ的領先地位。網絡的外部性會長期的保護領先者的地位,因此,這類產品,進入市場的時候就應該不惜代價擴大用户羣,以獲取領先地位。有一種説法説盜版幫助了微軟,沒有盜版就沒有微軟如今在中國市場上的壟斷地位,而微軟一定程度上默許了盜版的泛濫,因為這對建立微軟的市場地位是有利的,網絡的外部性也終將會彌補微軟因為盜版受到的損失。到如今微軟在中國已經豎立起了壟斷地位,對盜版的打擊力度便開始加大,頻頻對政府施壓,要求政府採取措施。

面對網絡外部性,市場的後進者也並非是全無辦法,但通常的辦法都是比較消極的,以求避開外部性壁壘。這其中最常見的一種辦法是使自己的產品與先進入者的產品兼容,這樣就能夠共享網絡的外部性。例如AMD所製造的CPU在功能上就幾乎和Intel的沒什麼兩樣,從而得以搶到Intel的一小塊市場。這種方法有很大的侷限性,因為後進者並不能完全獲得先進入者產品全部的技術參數,這種兼容肯定不是完全的。還有一種辦法是瞄準剩餘市場。在先入者勢力不及的地方開闢敵後根據地,以求將來能夠農村包圍城市。例如蘋果在小學生使用的個人電腦上佔有相當大的市場份額。

相比之下,中國移動採取了一種相對主動的辦法。它開發出了與手機號碼綁定的TM產品Fetion,希望能夠利用自身在移動通信上的網絡外部性來挑戰QQ在傳統的TM上的網絡外部性。至於效果如何,目前我還不知道,:(

網絡的外部性也不是堅不可摧的,至少在計算機領域,計算機產品的快速淘汰會限制網絡外部性的好處。如果你的公司開發了一種新的計算機,而且不想使用現有的軟件,但是你能夠讓軟件公司相信你的計算機能夠一炮走紅,他們就會願意編寫新的軟件讓你的計算機使用。另外,技術的快速進步帶來的向後兼容性問題也會對目前的領先者造成挑戰。兼容性的要求使得微軟和因特爾的產品非常的臃腫,而新的進入者反而沒有這些的束縛,因而可以提供更小巧靈活的產品。看起來向後兼容性像是一個幸福的煩惱。

博弈論心得體會 篇7

博弈小術語: 收益矩陣、均衡、納什均衡、零和

博弈論,也稱互動的決策論。它的基本假設之一是人是理性的。但現實並非如此,人不可能具有完備的知識也不可能時時理性。儘管如此,人們仍然樂意用博弈論的方法來解釋和分析現實社會現象。

每一次的人際交往都可以簡化成兩個基本選擇:合作或背叛。比如在前面的日誌裏提到的囚徒困境,在人際交往中普遍存在囚徒困境:雙方明知合作能帶來雙贏,卻因為理性的自私和信任的缺乏而導致合作難以形成。當一次性博弈出現時,人們往往會選擇背叛。這在現實生活中也有很多例子,比如飛機場,為什麼食品價格敢定那麼高呢?因為它知道候機的乘客不會是它的長期客户。而當博弈的終點不可知時,就又是另一回事了。

在多次博弈中,背叛仍不可避免,但合作的機率會相比一次博弈有提高。至於如何更加有效地減少背叛,一種辦法是引入懲罰機制,可以是帶劍的法律或温和些的道德約束。現實中的集體活動等候上車問題就是個例子,讓那些遲到的人自己負責任就是一種懲罰措施。

當然,如果在開頭就有一些“善意”的人出來表明合作態度對提高合作機會也是有幫助的,不管這些“善意”的人是出於何種目的。一旦合作開始,人們就能體驗到合作的好處,並樂於堅持一段時間。至於時間的長短,關鍵是看博弈的終點是否明確。這在上面也提到了,如果終點明確,人們就會傾向於在最後一次背叛。而當大家都知道對方會這樣想時,倒數第二次就會成為新的終點,新的背叛。如此反覆推演,合作從一開始就很難形成。注意上面的論述是基於沒有懲罰機制的基礎。

有一個很有意思的實驗,是由愛克斯羅德完成的。這是一個計算機模擬競賽,參賽的62位科學家遞交了自己寫的關於博弈策略的代碼,同時加上愛克斯羅德本人寫的一個隨即策略代碼,共63個。結果表明,“前15名中只有第8名是非善意的程序,最後15名只有一個善意的,奪魁的是“一報還一報策略”。

這個實力不凡的“一報還一報策略”就是對方選擇什麼我就回應什麼,你合作我就合作,你背叛我也背叛。這種策略體現的是“善良、可激怒、寬容、簡單”等好品質。雖然該策略在每次對局中分數都不能超過對手,但它的總分卻是最高的。它賴以生存的基礎很牢固。而那個非善意程序的成功是建立在別人的失敗之上。可以想像,如果賦予這些程序以進化的基因,久而久之,非善意程序的存活率將下降。