经典的犯罪嫌疑人困境内容如下:警方逮捕A、B两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人坦白认罪,并作证检控对,而对方保持抵赖,坦白者将即时获释,抵赖者将判监10年;若二人都抵赖,则二人同样判监半年;若二人都坦白,即互相坦白立功(互相“背叛”),则二人同样判监2年。其博弈战略示意图如表2.6。
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 表2.6:囚徒困境策略图 ┃
┣━━━━━━━━━━━┳━━━━━━━━━┳━━━━━━━━━┫
┃ ┃ 囚徒A ┃ ┃
┃ 囚徒困境博弈 ┃ ┃ ┃
┃ ┣━━━━━━━━━╋━━━━━━━━━┫
┃ ┃ 立功 ┃ 不立功 ┃
┣━━━━━┳━━━━━╋━━━━━━━━━╋━━━━━━━━━┫
┃ 囚徒B ┃ 立功 ┃-10,-10 ┃-10,0 ┃
┣━━━━━╋━━━━━╋━━━━━━━━━╋━━━━━━━━━┫
┃ ┃ 不立功 ┃ 0,-10 ┃-0.5,-0.5 ┃
┗━━━━━┻━━━━━┻━━━━━━━━━┻━━━━━━━━━┛
囚徒困境转换成法律术语应该是犯罪嫌疑人困境。囚徒困境中的坦白在法律上既包括坦白自己的罪刑、也包括揭发他人的罪刑(立功),因此,此后合称坦白立功。其适用范围为共同犯罪的场合。犯罪嫌疑人困境实质是,为侦破共同犯罪而通过宽严相济的刑事政策为犯罪嫌疑人设置的非合作博弈。
(二)不同的选择、不同的博弈
基本假设:警察发现了某共同犯罪;警察所能使用的司法总资源是既定的;A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人;A和B被分别审查不能够进行沟通;在证据不足的情况下,只要有一方坦白,都可以使证据达到确凿的程度;警察的目的是实现惩罚的最大化;A和B的目的是实现惩罚的最小化。问题:警察如何实现惩罚的最大化?
警察有两个选择:第一,对坦白立功不采取从宽的政策,即使坦白立功对方,也不会得到任何减刑,即不选择宽严相济的刑事政策。第二,囚徒困境场合,即选择宽严相济的刑事政策。第一种选择:对坦白立功不采取从宽的政策,即不坚持宽严相济的刑事政策。在这种情况下对犯罪嫌疑人刑罚的影响见图2.7。
图(略)
可见,在第一种选择的情况下:第一,如果证据确凿,犯罪嫌疑人是否坦白立功对自己的刑罚不产生影响;第二,如果证据不足,坦白立功则面临10年监禁,证据不足则是0.5年监禁。
在第一种选择的情况下,假设B抵赖,则犯罪嫌疑人A坦白立功对犯罪嫌疑人B刑罚的影响同图2.7,即A的策略对B刑罚的影响与对自己的影响相同:在证据确凿的情况下,犯罪嫌疑人A是否坦白立功对B的刑罚不产生影响;在证据不足的情况下,A的坦白立功致使B面临10年监禁,不坦白立功则对B的刑罚没有影响,B的惩罚仍为0.5年监禁。
在第一种选择的情况下,警察所可能实现的刑罚如图2.8所示。
图(略)
可见,在第一种选择的情况下,如果证据确凿,警察实现的惩罚值都是20,立功与否对实现的惩罚值无影响。如果证据不足,警察可能实现的惩罚值有20和1三种可能。在证据不足的情况下,如果一方坦白立功,则另一方的态度不会对其刑罚构成影响。因此,警察是否能实现刑罚最大化取决于犯罪嫌疑人是否会坦白立功。从实际情况来看,在证据确凿的情况下,犯罪嫌疑人坦白立功与否对自己的刑罚不构成影响;在证据不足的情况下,犯罪嫌疑人的坦白立功会加重自己和共同犯罪人的刑罚;且由于信息不对称,犯罪嫌疑人不知道警察的证据是否确凿。因此,出于自己刑罚最小化的考虑,犯罪嫌疑人会选择不坦白立功。由于犯罪嫌疑人策略相同,因此,双方选择不坦白立功,则在证据不足的情况下,警察实现的惩罚值只有1年。当然,现实中不排除犯罪嫌疑人基于良心的谴责在翻然悔悟后坦白立功,亦不排除某个犯罪嫌疑人基于对共同犯罪人的憎恨和报复而鱼死网破的坦白和立功,但一般情况下,犯罪嫌疑人是没有坦白立功的动力的。