博弈論心得體會(通用5篇)
博弈論心得體會 篇1
在社會中,人與人之間的對抗和較量是一個不容回避的話題,只有直面這些問題,個人才更有可能獲得成功的機會。在所有的對抗和較量中,其勝負成敗常常取決于3個基本的因素:機會或者說運氣、體能和智能。通過拋硬幣來賭輸贏是純粹依賴于個人運氣的游戲;百米賽跑的勝負基本上取決于個人的全身技能;而籃球賽、戰爭等對抗,雖然也會受到運氣的影響,體能也很重要,但決定勝負的更重要的因素是頭腦技能的較量。
頭腦技能是一種策略技巧,或者說是在謀略方面的造詣。既然世間大多數對抗都與頭腦技能有關,因此人們試圖獲得成功,就有必要研究在對抗局勢中如何策略性地選擇自己的行動。而今,博弈論就是一門專門研究互動局勢下人們的策略行為的學問。事實上,每個人每天都在與他人打交道,或競爭或合作。身處這樣高度互動的環境之中,無論一個人是否知道博弈論,實際上他都不斷地在與他人進行博弈,無論是他的父母、親人、兄弟、老師還是商場對手、政治敵人……一個可能不知道博弈論為何物,但是他的確常常在與他人進行著對抗和較量,在進行著一場又一場博弈;而生存本能,也讓人們在不知不覺中學會了不少博弈技巧。
然而,通過本能所學習的博弈技巧,是既不系統也相當費勁的。因此,人們有必要以一種最為節省的方式來學習策略技巧。而最節省的方式,莫過于直接學習博弈論的知識了。難怪經濟學家薩繆爾森這樣說著:“要在現代社會做一個有文化的人,你必須對博弈論有一個大致的了解。”事實上,不單一般人應該了解博弈論,各個領域的專家更應該了解博弈論——20世紀后半葉的歷史表明,博弈論在軍事、政治、商業、法律、經濟學、生物學、心理學、社會學、歷史學等諸多領域都已有非常成功的運用。其中,在經濟學、生物學、政治和軍事中的運用取得了相當大的成就。1994年和20xx年,諾貝爾經濟學獎兩度眷顧博弈論,不是沒有原因的。
不過,對于大多數人來說,學習博弈論并不是一件輕松的事情。因為正式的博弈理論往往是用數學語言表達出來的,而社會中的大多數人都有數學恐懼癥,雖然對于少數人來說數學的形式是那么優美,但大多數人把博弈論的學習看做是一件艱難的而痛苦的事情。其實,博弈論是如此有趣的學問,把博弈論的學習當成一件痛苦之事,實在是不應該的。
我們應該快樂地學習,快樂地學習博弈論。這一點,我們事實上是可以做到的,因為博弈比較基礎的東西是不需要高深的數學功底的。然而,如果我們能熟練地掌握這一部分博弈論知識,對我們的學習和工作都大有裨益。
深感短短一個學期的時間,對于博弈論這一門獨具魅力的課程,只是從皮毛上略有了解。盡管如此,我還是學會了一種以博弈的觀點來思考、分析、判斷、解決問題的方法。就好比囚徒博弈的現象,我以前可能能夠猜到結果,但這只是知其然而不知其所以然罷了。然而現在可就不同了,相似的問題我都能夠用所學的博弈論知識去解釋,能夠了解其本質了。
博弈論心得體會 篇2
學習博弈論的目的,不僅是為了贏得更好的結局,也在于享受博弈分析的過程。先給大家猜一個腦筋急轉彎,問:在什么情況下零大于二,二大于五,五又大于零。答案是:在玩“石頭.剪刀.布”游戲的時候。
博弈,就是用這種游戲思維來突破看似無法改變的局面,解決現實的嚴肅問題的策略。在博弈中,每個參與者都在特定條件下爭取其最大利益,強者未必勝券在握,弱者也未必永無出頭之日。因為在博弈中,特別是多個參與者的博弈中,結果不僅取決于參與者的實力與策略,而且還取決于其他參與者的制約和策略。也就是說在現實生活中屌絲若要逆襲,學習并掌握必要的博弈論的知識是很有幫助和必要的。
事實上,博弈過程本來就不過是一種日常現象。我們在日常生活中經常需要先分析他人的意愿從而做出合理的行為選擇,而所謂博弈就是行為者在一定環境條件和規則下,選擇一定的行為或策略,實施并取得相應結果的過程。比如你身為博士,當面臨老板任務的壓力和可愛妹紙的召喚的選擇時,必要的博弈論知識的應用,也許會助你平安過關。當然,夾在這樣一個三節點的博弈關系中,處于極其弱勢地位的你,往往只能自求多福了。
博弈論用途很廣。博弈論原是數學運籌中的一個支系,其研究運用了許多的數學工具,這仿佛形成了一道阻礙我們初學者與博弈論的鴻溝。但是偉大的馬克思說過:“一種科學只有在成功地運用了數學時,才算是達到了真正完善的地步。”面對這條鴻溝,我們不僅要學習數學公式和理論,也不可以忽略一個很淺顯的道理:一個不會編程的人照樣可以成為電腦應用高手,沒有高深的數學知識,我們同樣可通過博弈論的學習成為生活中的策略高手。就像孫臏沒有學過高等數學,但是這并不影響他通過運用策略來幫助田忌贏得賽馬。所以我一直很淡定的看待本課的許多數學公式和算法,因為我相信只要我掌握了博弈論的本質,老師您是不會讓我掛掉的。
博弈論首先是我們思索現實世界的一套邏輯,其次才是把這套邏輯嚴密化的數學形式。博弈論的目的在巧妙的策略,而不是解法。我們學習博弈論的目的.不僅是為了贏得更好的結局,也在于享受博弈分析的過程。說到底,博弈論畢竟只是一個分析問題的工具,用這個工具來簡化問題,使問題的分析清晰明了,也就夠了。
英勇的博士們,為了碉堡的逆襲,為了老板的任務,為了妹紙的歡心,大家不僅要好好學習掌握這門課,順利通過考試,更要將博弈的思想應用在日常生活中,成為一名博弈高手。
博弈論心得體會 篇3
我學過一段時間博弈論,一些思維過程中也可能自覺不自覺地使用一些博弈論思想,有兩點比較突出的體會。
第一,制訂政策或游戲規則,要保證所有人有參與積極性。這來源于“納什均衡”概念,說起來當然簡單。但我自己覺得,以前所知道的這條道理——制訂游戲規則要保證所有人有參與積極性——是簡單接受,沒有邏輯,或者,在直覺層次覺得這是對的,但沒有認識到它為什么對。
有本書上說,以后的經濟學家必須知道一個“納什均衡”概念,否則不算經濟學家,或者說,玩明白了“納什均衡”,就像玩明白了“價格”一樣,是經濟學家的基本功。我贊同。協議必須是能夠自動執行的。
第二,千萬不能把別人當傻瓜。這來自子博弈精煉納什均衡。合理的行為序列必然在每一步上都合理(當然,這里不去探討“歷史理性”),即使存在一點缺陷,也要從“顫抖手均衡”的思路來考慮問題,使自己不要隨意使用“觸發策略”,保證你好我好(也可以說是“我好,他也好”)。如果把別人當傻瓜,吃虧的是自己,就像那個賣貓的故事。
把博弈論這種技術體系當作世界觀,似乎有些危險,但其中的道理我必須重視。以上是一點體會,希望能拋磚引玉。
博弈論心得體會 篇4
在所有的對抗和較量中,其勝負成敗常常取決于3個基本的因素:機會或者說運氣、體能和智能。通過拋硬幣來賭輸贏是純粹依賴于個人運氣的游戲;百米賽跑的勝負基本上取決于個人的全身技能;而籃球賽、戰爭等對抗,雖然也會受到運氣的影響,體能也很重要,但決定勝負的更重要的因素是頭腦技能的較量。
頭腦技能是一種策略技巧,或者說是在謀略方面的造詣。既然世間大多數對抗都與頭腦技能有關,因此人們試圖獲得成功,就有必要研究在對抗局勢中如何策略性地選擇自己的行動。而今,博弈論就是一門專門研究互動局勢下人們的策略行為的學問。事實上,每個人每天都在與他人打交道,或競爭或合作。身處這樣高度互動的環境之中,無論一個人是否知道博弈論,實際上他都不斷地在與他人進行博弈,無論是他的父母、親人、兄弟、老師還是商場對手、政治敵人……一個可能不知道博弈論為何物,但是他的確常常在與他人進行著對抗和較量,在進行著一場又一場博弈;而生存本能,也讓人們在不知不覺中學會了不少博弈技巧。
然而,通過本能所學習的博弈技巧,是既不系統也相當費勁的。因此,人們有必要以一種最為節省的方式來學習策略技巧。而最節省的方式,莫過于直接學習博弈論的知識了。難怪經濟學家薩繆爾森這樣說著:“要在現代社會做一個有文化的人,你必須對博弈論有一個大致的了解。”事實上,不單一般人應該了解博弈論,各個領域的專家更應該了解博弈論——20世紀后半葉的歷史表明,博弈論在軍事、政治、商業、法律、經濟學、生物學、心理學、社會學、歷史學等諸多領域都已有非常成功的運用。其中,在經濟學、生物學、政治和軍事中的運用取得了相當大的成就。1994年和20xx年,諾貝爾經濟學獎兩度眷顧博弈論,不是沒有原因的。
不過,對于大多數人來說,學習博弈論并不是一件輕松的事情。因為正式的博弈理論往往是用數學語言表達出來的,而社會中的大多數人都有數學恐懼癥,雖然對于少數人來說數學的形式是那么優美,但大多數人把博弈論的學習看做是一件艱難的而痛苦的事情。其實,博弈論是如此有趣的學問,把博弈論的學習當成一件痛苦之事,實在是不應該的。
我們應該快樂地學習,快樂地學習博弈論。這一點,我們事實上是可以做到的,因為博弈比較基礎的東西是不需要高深的數學功底的。然而,如果我們能熟練地掌握這一部分博弈論知識,對我們的學習和工作都大有裨益。
深感短短一個學期的時間,對于博弈論這一門獨具魅力的課程,只是從皮毛上略有了解。盡管如此,我還是學會了一種以博弈的觀點來思考、分析、判斷、解決問題的方法。就好比囚徒博弈的現象,我以前可能能夠猜到結果,但這只是知其然而不知其所以然罷了。然而現在可就不同了,相似的問題我都能夠用所學的博弈論知識去解釋,能夠了解其本質了。
博弈論心得體會 篇5
博弈小術語: 收益矩陣、均衡、納什均衡、零和
博弈論,也稱互動的決策論。它的基本假設之一是人是理性的。但現實并非如此,人不可能具有完備的知識也不可能時時理性。盡管如此,人們仍然樂意用博弈論的方法來解釋和分析現實社會現象。
每一次的人際交往都可以簡化成兩個基本選擇:合作或背叛。比如在前面的日志里提到的囚徒困境,在人際交往中普遍存在囚徒困境:雙方明知合作能帶來雙贏,卻因為理性的自私和信任的缺乏而導致合作難以形成。當一次性博弈出現時,人們往往會選擇背叛。這在現實生活中也有很多例子,比如飛機場,為什么食品價格敢定那么高呢?因為它知道候機的乘客不會是它的長期客戶。而當博弈的終點不可知時,就又是另一回事了。
在多次博弈中,背叛仍不可避免,但合作的幾率會相比一次博弈有提高。至于如何更加有效地減少背叛,一種辦法是引入懲罰機制,可以是帶劍的法律或溫和些的道德約束。現實中的集體活動等候上車問題就是個例子,讓那些遲到的人自己負責任就是一種懲罰措施。
當然,如果在開頭就有一些“善意”的人出來表明合作態度對提高合作機會也是有幫助的,不管這些“善意”的人是出于何種目的。一旦合作開始,人們就能體驗到合作的好處,并樂于堅持一段時間。至于時間的長短,關鍵是看博弈的終點是否明確。這在上面也提到了,如果終點明確,人們就會傾向于在最后一次背叛。而當大家都知道對方會這樣想時,倒數第二次就會成為新的終點,新的背叛。如此反復推演,合作從一開始就很難形成。注意上面的論述是基于沒有懲罰機制的基礎。
有一個很有意思的實驗,是由愛克斯羅德完成的。這是一個計算機模擬競賽,參賽的62位科學家遞交了自己寫的關于博弈策略的代碼,同時加上愛克斯羅德本人寫的一個隨即策略代碼,共63個。結果表明,“前15名中只有第8名是非善意的程序,最后15名只有一個善意的,奪魁的是“一報還一報策略”。
這個實力不凡的“一報還一報策略”就是對方選擇什么我就回應什么,你合作我就合作,你背叛我也背叛。這種策略體現的是“善良、可激怒、寬容、簡單”等好品質。雖然該策略在每次對局中分數都不能超過對手,但它的總分卻是最高的。它賴以生存的基礎很牢固。而那個非善意程序的成功是建立在別人的失敗之上。可以想像,如果賦予這些程序以進化的基因,久而久之,非善意程序的存活率將下降。