今天看啥  ›  专栏  ›  浴火氓

从“囚徒困境”谈谈博弈论【浴火日更09】

浴火氓  · 简书  ·  · 2019-04-08 23:56

博弈论是一个非常深奥而且宽泛的命题,浴火对此十分感兴趣,但也仅仅是感兴趣而已,没有很深的研究。

因为博弈论实际上是一个系统化的理论,如果没有经过系统化的培训,很难谈出个子丑寅卯来。但在简书,好就好在高手如云,卧虎藏龙,似浴火这等虾兵蟹将,侃侃而谈,即使说错了也不打紧,毕竟腿长在读者身上,觉得说的有道理就多停留一会儿,觉得没意思拔腿就走,也没人拦着。

闲话休说,书归正传。

囚徒困境(prisoner's dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。

看这个解释,是不是有点儿拗口?能不能说得简单明白点儿?

再看下面这个说明:

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

这个例子相对要具体一些,模型基本搭建起来了。中间还有几个关键词“非零和博弈”、“纳什均衡”,“信任”,专业的名词下回再说,毕竟一次只能说明白一件事儿。

搜索资料的时候,一不小心,还搜索到了简书上的一篇历史文章:分享:如何击败“囚徒困境”? - 简书

原来早就有人写过,不过浴火仔细看了一下,写得十分枯燥,未必能完全读懂。


其实,“囚徒困境”的关键一句话十分简单:

由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

为什么会出现这种情况,罪魁祸首就是“相互不信任”。看懂了吧?这不是什么新鲜事儿,还是“忠诚”与“背叛”那一套,不过给二者所加的砝码不同。

比如,最好的结果,就是二人(囚徒)皆忠诚于彼此;最坏的结果,就是二人皆背叛。中间的结果,当然就是其中一人忠贞,另一人背叛。

再没有第三种结果了。


当然,这其中还有些前提条件,比如“证据不确定”。这其中所提到的“证据”,实际上只能是二人互相指证的“人证”,与物证无关。而在现代法律体系中,实际上,物证的法律效应应该远远大于人证(或者说言证),毕竟,当今目下,撒谎的人太多了。

只要双方互相信任,那么就会得到最好的结果。

这也是浴火觉得“囚徒困境”这个博弈论模型最大的亮点,不然,都懒得拿出来当例子讲。

所有的模型都是死的,而万物的灵长,只有人类是最活泛的,最聪明的,能从无数的现实实践中提炼出经验式的总结,比如公式、模型之类的。

“囚徒”所对应的是“警方”,实际上这个模型有一个天然潜在的不平等,“囚徒”当然是处于不平等地位的弱势,而“警方”则理所当然地占据了权力的至高点。但无论权力有多大,还是要依照规定来行事。

然而,现实生活中,“20年目睹之怪现状”,可能会出现令人大跌眼镜的情况。

比如,可能会出现严刑拷打,可能会出现诱供、逼供……种种匪夷所思的情节可能连番上演,咋办?“囚徒”直接投降?


答案是:绝不能投降!

为何这么说?这就要重新回到“博弈论”上来。因为先前已经提到,这是一个“非零和博弈”,投降的话,相当于是弃权,收益为零。

不投降的话,胜率也许很低,但不管其有多低,总得有个数字吧?哪怕是千分之一,万分之一,也是一个概率和比例啊,总有赢的希望。

而一旦赢了,这个收益可是100%,还不够诱人吗?

(未完待续…………)




原文地址:访问原文地址
快照地址: 访问文章快照