从“囚徒困境”谈谈博弈论【浴火日更09】

浴火氓 · 简书 · · 2019-04-08 23:56

博弈论是一个非常深奥而且宽泛的命题，浴火对此十分感兴趣，但也仅仅是感兴趣而已，没有很深的研究。

因为博弈论实际上是一个系统化的理论，如果没有经过系统化的培训，很难谈出个子丑寅卯来。但在简书，好就好在高手如云，卧虎藏龙，似浴火这等虾兵蟹将，侃侃而谈，即使说错了也不打紧，毕竟腿长在读者身上，觉得说的有道理就多停留一会儿，觉得没意思拔腿就走，也没人拦着。

闲话休说，书归正传。

囚徒困境（prisoner's dilemma）是指两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护、人际关系等方面，也会频繁出现类似情况。

看这个解释，是不是有点儿拗口？能不能说得简单明白点儿？

再看下面这个说明：

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德（MerrillFlood）和梅尔文·德雷希尔（MelvinDresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（AlbertTucker）以囚徒方式阐述，并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年；若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

这个例子相对要具体一些，模型基本搭建起来了。中间还有几个关键词“非零和博弈”、“纳什均衡”，“信任”，专业的名词下回再说，毕竟一次只能说明白一件事儿。

搜索资料的时候，一不小心，还搜索到了简书上的一篇历史文章：分享：如何击败“囚徒困境”？ - 简书

原来早就有人写过，不过浴火仔细看了一下，写得十分枯燥，未必能完全读懂。

其实，“囚徒困境”的关键一句话十分简单：

由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

为什么会出现这种情况，罪魁祸首就是“相互不信任”。看懂了吧?这不是什么新鲜事儿，还是“忠诚”与“背叛”那一套，不过给二者所加的砝码不同。

比如，最好的结果，就是二人（囚徒）皆忠诚于彼此；最坏的结果，就是二人皆背叛。中间的结果，当然就是其中一人忠贞，另一人背叛。

再没有第三种结果了。

当然，这其中还有些前提条件，比如“证据不确定”。这其中所提到的“证据”，实际上只能是二人互相指证的“人证”，与物证无关。而在现代法律体系中，实际上，物证的法律效应应该远远大于人证（或者说言证），毕竟，当今目下，撒谎的人太多了。

只要双方互相信任，那么就会得到最好的结果。

这也是浴火觉得“囚徒困境”这个博弈论模型最大的亮点，不然，都懒得拿出来当例子讲。

所有的模型都是死的，而万物的灵长，只有人类是最活泛的，最聪明的，能从无数的现实实践中提炼出经验式的总结，比如公式、模型之类的。

“囚徒”所对应的是“警方”，实际上这个模型有一个天然潜在的不平等，“囚徒”当然是处于不平等地位的弱势，而“警方”则理所当然地占据了权力的至高点。但无论权力有多大，还是要依照规定来行事。

然而，现实生活中，“20年目睹之怪现状”，可能会出现令人大跌眼镜的情况。

比如，可能会出现严刑拷打，可能会出现诱供、逼供……种种匪夷所思的情节可能连番上演，咋办？“囚徒”直接投降？

答案是：绝不能投降！

为何这么说？这就要重新回到“博弈论”上来。因为先前已经提到，这是一个“非零和博弈”，投降的话，相当于是弃权，收益为零。

不投降的话，胜率也许很低，但不管其有多低，总得有个数字吧？哪怕是千分之一，万分之一，也是一个概率和比例啊，总有赢的希望。

而一旦赢了，这个收益可是100%，还不够诱人吗？

（未完待续…………）

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博