ナッシュ均衡1:「誰も逸脱しない」
今日から3回にわたって勉強する言葉は「ナッシュ均衡 (Nash equilibrium)」です。名前の由来は、ゲーム理論の先駆者であり、1994年にノーベル経済学賞を受賞した数学者ジョン・ナッシュです。
ナッシュ均衡の定義のしかたには2通りあるので、今日は1つめを説明します。
ナッシュ均衡の定義 (バージョン1)
ナッシュ均衡とは「戦略プロファイルで、誰ひとりとして逸脱するインセンティブを持たないもの」である。
初心者は、ナッシュ均衡がそもそも何なのかを忘れないようにしましょう。カラスは鳥で、モンブランはケーキで、ナッシュ均衡は戦略プロファイルです。戦略プロファイルのうち、特別な条件を満たすものをナッシュ均衡と言うのです。
ではどんな戦略プロファイルかというと、「誰も逸脱するインセンティブを持たないもの」です。いったんその戦略プロファイルが選ばれたら、仮に時間が巻き戻せたとしても、誰も自分だけ戦略を変えたいと思いません。複数の人が同時に戦略を変えれば、その人たちの利得が上がることはあり得ますが、1人で逸脱しても利得は上げられない。そういう戦略プロファイルがナッシュ均衡です。
ナッシュ均衡の定義が理解できたかどうか、以下の正誤問題をやってみましょう。
問1 以下の文は正か誤か。
“囚人のジレンマでは、(協調的,協調的)という戦略プロファイルが、両者にとって良い結果をもたらすから、ナッシュ均衡である”
問2 以下の文は正か誤か。
“以下のコーディネーション・ゲームの(しない,しない)においては、両プレーヤーは(協調する,協調する)の方がベターだと思うので、ともに逸脱のインセンティブを持つ”
それでは解答です。
問1の正解は「誤」です。両者にとって良い結果であるかどうかは、ナッシュ均衡の定義には全く関係ありません。どちらのプレーヤーも、自分だけがぬけがけに転じた場合には利得が上がるので、逸脱のインセンティブがあります。
問2の正解は「誤」です。逸脱のインセンティブがあるとは、「他のプレーヤーが戦略を変えないと仮定したときに、自分だけ戦略を変えれば利得が上がる」というものでした。「一緒に戦略を変えれば」というのでは逸脱のインセンティブがあるとは言えません。
どうでしたか。次回は、「基本4ゲーム」のナッシュ均衡をまとめたいと思います。
>>最適反応とナッシュ均衡(8)ナッシュ均衡2:練習問題