一般形式囚徒困境的支付矩阵合作背叛
合作3,30,5
背叛5,01,1
以“T、R、P、S”符号表示合作背叛
合作R,RS,T
背叛T,SP,P
以“胜-负”术语表示合作背叛
合作胜-胜大负-大胜
背叛大胜-大负负-负
简单博弈获得的点数可以得出一些一般化的结论。
T、R、P、S符号表
符号分数英文中文(非术语)解释
T5Temptation背叛诱惑单独背叛成功所得。
R3Reward合作报酬共同合作所得
P1Punishment背叛惩罚共同背叛所得
S0Suckers受骗支付被单独背叛所获
若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S
(解:从5>3>1>0获得以上不等式)
若以整体获分而言,将得出以下不等式。
2R>T+S或2R>2P
(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)
而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。以上理论是道格拉斯·霍夫施塔特创建的。