囚人のジレンマ:最適な行動は最適な結果に繋がらない?(知的な小話4)

ここでは、日常会話で使える知的な小話と、実際の使用例を紹介します。

囚人のジレンマとは

囚人のジレンマは、1950年にプリンストン大学の数学者、ジョン・ナッシュが提案したゲーム理論の一部で、個人としての最適な行動が、全体としての最適な行動とは限らないことを示します

この理論は、戦略的意思決定を研究し、個人や組織の最適な行動を予測することを目的としています。

囚人のジレンマは、その中でも特に有名な問題であり、現代経済学や政治学、心理学などの分野で広く応用されています。

囚人のジレンマの具体例

2人組で犯罪を行った囚人を自白させるために検事は次のような司法取引を持ちかけます。

①2人ともが黙秘をすれば2人とも懲役2年
②1人が自白をし、1人が黙秘をしたら、自白した方は無罪、黙秘した方は懲役10年
③2人とも自白をすれば2人とも懲役5年
④2人の囚人は相談することはできない

この時、各囚人の行動と結果は、以下の表の通りとなります。

囚人のジレンマの表

囚人Aの立場で考えると、囚人Bが黙秘をした場合に、囚人Aは黙秘をすると懲役2年となり、自白をすると懲役0年となります。

また、囚人Bが自白をした場合に、囚人Aは黙秘をすると懲役10年となり、自白をすると懲役5年となります。

囚人Bの立場で考えた場合も同様です。

よって、どちらの囚人にとっても、もう一方の囚人が「黙秘」と「自白」のどちらの選択をしたとしても、「自白」を選択しておいた方が得をすることになります。

そのため、個人としての最適な戦略は「自白」ということになります。

その結果、2人ともが「黙秘」をし、懲役2年を受けるという選択肢があるにも関わらず、2人ともが「自白」をして、懲役5年の刑を受けることになるのです。

ナッシュ均衡と囚人のジレンマ

ナッシュ均衡は、各プレイヤーが自分の戦略を変更することで利得を向上させることができない状況を指します。

囚人のジレンマの場合、ナッシュ均衡は両者が自白する状況です。なぜなら、この状況で自分が戦略を変更して黙秘すると、自分はさらに大きな不利益を被ることになるからです。

具体的には、囚人Aが自白を選択している状況で、囚人Bが黙秘から自白に変更した場合、囚人Bの懲役は10年から5年に短くなります。同様に、囚人Bが自白を選択している状況で、囚人Aが黙秘から自白に変更した場合、囚人Aの懲役は10年から5年に短くなります。

したがって、ナッシュ均衡は両者が自白する状況であり、この状況では両者が懲役5年を受けることになります。しかし、両者が黙秘すると、懲役2年というより望ましい結果が得られます。

このように、囚人のジレンマは、個人が自己利益を追求することで、全体としては望ましくない結果が生じることを示しています。

合成の誤謬とは

囚人のジレンマは、各個人が最適な行動としても、全体にとっては望ましい結果につながらないことを示しています。

上記の例では、囚人Aも囚人Bも、自分にとって最も合理的な行動をしていますが、全体としては、望ましくない結果に繋がっています。

これを経済学の用語で「合成の誤謬(ごびゅう)」と呼んでいます

合成の誤謬は、日常生活の様々な場面で起こっています。

以下はその例の一部です。

国民全員が貯金をすることで、国全体の経済が停滞する
→ 景気が悪い時には、個人としては将来のためにお金を貯めるべきですが、国としては、どんどんお金を使って景気を回復させることが最適です。

災害時に皆が食料を買占め、必要な食料が枯渇する
→ 災害時には、個人としてはいつ無くなるかわからない食料を、できるだけ多く確保することが大事ですが、全体としては、必要な人に必要な分だけ食料を配分することが最適です。

麻雀にて、親リーチに全員がベタオリしてツモで和了られる
→ (麻雀をする人にしかわかりませんが) 個人としては、親のリーチに振り込むのを避けるためにベタオリすべきですが、結果として、ツモで和了されてしまい、皆で高い点数を払うことになりやすいです。

囚人のジレンマを解決する方法

囚人のジレンマを解決するためには、個人の利益と全体の利益が一致するようなインセンティブを設定することが必要です。

繰り返しゲーム

例えば、繰り返しゲームを行うことで、相手との協力関係を築くことが可能になり、 全体の利益が最大化される結果が得られることがあります。

何度も繰り返しゲームを行うことで、相手を裏切って一時的な利益を得ることよりも、協力して長期的な恩恵を受けることのメリットが大きくなるためです。

そのため、繰り返しゲームでは、相手との長期的な関係を考慮することで、単発のゲームとは異なる戦略が選択されることが期待されます。

例えば、相手が協力的な行動を取った場合には自分も協力する「互恵的な戦略」が採用されることがあります。

制度や規制の導入

また、制度や規制を導入することで、個人の利益追求が全体の利益につながるように設計することも解決策の一つです。

例えば、環境問題は、各国が自国の経済的な利益を優先して、環境への悪影響を考えずに二酸化炭素の排出を行うことで起こっています。

炭素排出量を制限する国際協定や、排出権取引制度を導入することで、環境破壊を抑制しながら経済活動を行うことが可能になります。

情報共有や相互監視の仕組み

さらに、情報の共有や相互監視の仕組みを整えることで、信頼関係を構築し、協力的な行動を促すことができます。

例えば、企業の競争においては、労働者の権利や労働条件に関する情報を公開することで、消費者が企業を選択する際に、労働者に対する取り組みを評価することができるようになります。

まとめ

囚人のジレンマは、個人が最適な行動を取った場合に、全体としては望ましくない結果が生じることを示すゲーム理論の問題です。

現実世界の様々な問題に応用されており、その解決策としては、繰り返しゲーム、制度や規制の導入、情報の共有や相互監視の仕組みの整備などが考えられます。

囚人のジレンマを理解することで、個人の利益追求が全体の利益につながるような社会を設計するヒントを得ることができます。

本サイトで紹介している用語一覧は以下です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です