囚人のジレンマ

囚人のジレンマとは、協力しない者が利益を得るケースでは、協力した方が協力しないよりもよい結果になる場合においても、お互いに協力しなくなるというゲーム理論のひとつです。

ゲーム理論は利害関係において、自分と相手の利益を考えた最適解を求める思考法です。

囚人のジレンマは、1950年に数学者のアルバート・タッカーが考案しました。

メリル・フラッドとメルビン・ドレシャーが行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や裏切りにたとえたことでこの名称になりました。

囚人のジレンマゲーム

囚人のジレンマというゲーム理論では以下のゲームが基本となります。

なお、実際にゲームをするわけではなく思考法としてのゲーム理論となります。

    1. 共同で犯罪を行ったとされる囚人AとBに対して、検事が司法取引を持ちかける
    2. 取引の条件は以下の3つ
        (ア) 本来ならABは懲役5年、2人とも黙秘したら証拠不十分として減刑し2人とも懲役2年
        (イ) AまたはBだけが自白したら、自白者はその場で釈放、黙秘した方は懲役10年
        (ウ) AとBが自白したらどちらも懲役5年

ABは相談できない状況で、黙秘すべきか自白すべきかというのがゲームの基本となります。

わかりやすいように「黙秘を協力」、「自白を裏切り」と言い換えた上で、このゲームの結果は以下のパターンとなります。

    • ABともに協力(ともに懲役2年)
    • AまたはBだけが裏切り(裏切った方が懲役0年、もう1人は10年)
    • ABともに裏切り(ともに5年)

どう考えてもどちらも協力をした方が減刑されるので、協力が合理的な考え方ですが、実際にはどちらも裏切りを選択する結果となります。

囚人のジレンマが発生する理由

囚人のジレンマでは最も合理的な協力を選ばずに、裏切りを選択することで刑期を延長する結果となります。

そのためジレンマという名称になりますが、なぜ裏切りを選ぶ結果になるのでしょうか。

それは、人は相手が何を選ぶのかは関係なく、最も自分が得をする選択肢を選んでしまうからです。

Aの立場になって考えるとBの選択と自分の選択の結果は以下になります。

    • Bが裏切りを選んだ場合、自分は懲役5年(裏切り)または10年(協力)
    • Bが協力を選んだ場合、自分は懲役2年(協力)または0年(裏切り)

つまりAが裏切りを選んだ場合、Bがどちらを選んでもAの懲役年数は少なくなります。

Bも自分を中心に考えると同じ結果になるので、どちらも裏切りを選ぶ結果となります。

相手も自分と同じように裏切りを選ぶ可能性が高いと考えるので、協力を選んで10年の懲役だけは避けたいと思う気持ちは強いはずです。

その結果、協力の選択率は限りなく低くなります。

しかし、こうした結果はゲームを1度しか行わない場合であって、繰り返しゲームを行う場合には違う結果があります。

繰り返す回数をABに知らせない場合(有限繰り返しゲーム)は、1回だけのゲームと同じ結果になることが証明されています。

しかし繰り返しの回数を知らせない場合(無期限繰り返しゲーム)では証明ができず、お互いに協力する可能性が残されると言われています。