最適反応とナッシュ均衡（７） | 午後はカフェで経済学

ナッシュ均衡１：「誰も逸脱しない」

今日から３回にわたって勉強する言葉は「ナッシュ均衡 (Nash equilibrium)」です。名前の由来は、ゲーム理論の先駆者であり、1994年にノーベル経済学賞を受賞した数学者ジョン・ナッシュです。

ナッシュ均衡の定義のしかたには２通りあるので、今日は１つめを説明します。

ナッシュ均衡の定義 （バージョン１）
ナッシュ均衡とは「戦略プロファイルで、誰ひとりとして逸脱するインセンティブを持たないもの」である。

初心者は、ナッシュ均衡がそもそも何なのかを忘れないようにしましょう。カラスは鳥で、モンブランはケーキで、ナッシュ均衡は戦略プロファイルです。戦略プロファイルのうち、特別な条件を満たすものをナッシュ均衡と言うのです。

ではどんな戦略プロファイルかというと、「誰も逸脱するインセンティブを持たないもの」です。いったんその戦略プロファイルが選ばれたら、仮に時間が巻き戻せたとしても、誰も自分だけ戦略を変えたいと思いません。複数の人が同時に戦略を変えれば、その人たちの利得が上がることはあり得ますが、1人で逸脱しても利得は上げられない。そういう戦略プロファイルがナッシュ均衡です。

ナッシュ均衡の定義が理解できたかどうか、以下の正誤問題をやってみましょう。

問１　以下の文は正か誤か。
“囚人のジレンマでは、（協調的，協調的）という戦略プロファイルが、両者にとって良い結果をもたらすから、ナッシュ均衡である”

問２　以下の文は正か誤か。
“以下のコーディネーション・ゲームの（しない，しない）においては、両プレーヤーは（協調する，協調する）の方がベターだと思うので、ともに逸脱のインセンティブを持つ”

それでは解答です。

問１の正解は「誤」です。両者にとって良い結果であるかどうかは、ナッシュ均衡の定義には全く関係ありません。どちらのプレーヤーも、自分だけがぬけがけに転じた場合には利得が上がるので、逸脱のインセンティブがあります。

問２の正解は「誤」です。逸脱のインセンティブがあるとは、「他のプレーヤーが戦略を変えないと仮定したときに、自分だけ戦略を変えれば利得が上がる」というものでした。「一緒に戦略を変えれば」というのでは逸脱のインセンティブがあるとは言えません。

どうでしたか。次回は、「基本４ゲーム」のナッシュ均衡をまとめたいと思います。

>>最適反応とナッシュ均衡（８）ナッシュ均衡２：練習問題