ゲーム理論:概要| ミクロ経済学

ここでは、oligo占市場における経済行動を研究するためにゲーム理論をどのように使用できるかについて簡単に説明します。

ゲームのペイオフマトリックス:

戦略的相互作用には、多くのプレイヤーと多くの戦略が関与する可能性がありますが、ここでは、有限数の戦略を持つ2人のゲームのみを検討します。 これにより、ペイオフマトリックスでゲームを簡単に提示できます。

私たちは、主題を理解するために特定の例の助けを借りることができます。 2人が単純なゲームをプレイしていると仮定しましょう。 人Aには2つの戦略しかなく、人Bにも2つの戦略があります。 したがって、可能な結果の総数は2 x 2 = 4です。

可能な結果ごとに、各プレーヤーに対応するペイオフがあります。 表14.1は、ゲームのペイオフマトリックスです。 この表では、2人のプレーヤーへのペイオフが組み合わせて与えられています。

各組み合わせの最初のエントリはプレイヤーAへのペイオフを表し、2番目のエントリーはプレイヤーBへのペイオフを与えます。たとえば、両方のプレイヤーがそれぞれの最初の戦略を採用する場合、ペイオフの組み合わせは(1、2)になります。 同様に、Aが戦略1を採用し、Bが戦略2を採用する場合、ペイオフの組み合わせは(0、1)になります。

この種のゲームの結果がどうなるか見てみましょう。 もちろん、このゲームには非常にシンプルなソリューションがあります。 Aの観点からは、その選択(2または1)からのペイオフは常に戦略1からの対応するペイオフ(1または0)よりも大きいため、戦略2を採用する方が常に優れています。

同様に、Bが戦略1を採用することは、その選択(2または1)からのペイオフが戦略2からの対応するペイオフ(1または0)よりも常に大きいため、常に優れています。 Aの戦略は彼の戦略2であり、Bの戦略は彼の戦略1であるため、ここでの均衡ペイオフの組み合わせは(2、1)になります。

私たちには支配的な戦略があります。つまり、他のプレイヤーが何をするかに関係なく、各プレイヤーに最適な戦略を1つ選択します。 表14.1のペイオフマトリックスでは、戦略Bのどちらを選択しても、Aは戦略2をプレイするとより高いペイオフが得られるため、Aが戦略2を採用するのが理にかなっています。

一方、Aがどのような選択をしたとしても、Bは戦略1を採用すると、より高い見返りを得ることになります。したがって、ここでは、Aの戦略2とBの戦略1の選択肢が他の選択肢を支配し、支配的な戦略の均衡。

したがって、この例では、Aが2の均衡ペイオフを受け取る戦略2をプレイし、Bが1の均衡ペイオフを受け取る戦略1をプレイする均衡結果が予想されます。

ナッシュ均衡

各プレイヤーに支配的な戦略がある場合、ゲームの扱いはかなり簡単ですが、常にそうであるとは限りません。 たとえば、表14.2に示したゲームには支配的な戦略はありません。 ここで、Bが戦略1を採用すると、Aは2(戦略1から)または0(戦略2から)のペイオフを受け取り、Bが戦略2を選択すると、Aへのペイオフは0(戦略1から)または1(から戦略2)。

したがって、ここでBが戦略1を採用すると、Aも彼の戦略1をプレイします。 一方、Bが戦略2をプレイすると、Aは戦略を1から2に変更します。したがって、Aの最適な選択は、Bが何をするかによって異なります。 つまり、この場合、Aに対する支配的な戦略はありません。 ここでもBは支配的な戦略を持っていません。

ペイオフマトリックスで見るように、Aが戦略1を選択すると、Bは戦略1を選択し、Aが戦略2を選択すると、Bは戦略1から戦略2に変更されます。 。 彼の最適な選択は、Aが何をすると思うかによって異なります。

したがって、その支配的な戦略の均衡は、到達は容易ですが、常に起こるとは限りません。 あまりにも多くを要求するからです。 A(またはB)の特定の戦略が、Bの戦略(またはAの戦略)のすべての選択に対して最適であることを要求します。

ただし、それほど多くを要求するのではなく、Aの選択がBの(最適な)選択に対して最適であることを要求する場合があります。もちろん、Bにとって最適なものは、Aの選択に依存します。 そして、ナッシュ均衡と呼ばれるものの概念に到達します。

Aの選択肢が最適で、Bの選択肢が与えられ、Aの選択肢が与えられたBの選択肢が最適である場合、一対の戦略がナッシュ均衡を形成すると言います(アメリカのプレイヤーA(またはB )自分で戦略を選択しなければならないときに、プレイヤーB(またはA)が何をするかを知りません。 しかし、各人は、他の人の選択がどうなるかについてある程度の期待を持っているかもしれません。 そのため、ナッシュ均衡は各人の選択についての一対の期待として期待できるため、どちらの人も他の人の選択が明らかになったときに彼の行動を変えたくない。]

表14.2の場合、Aの戦略1とBの戦略1の組み合わせは、ナッシュ均衡です。 これを証明するために、Aが戦略1を選択した場合、Bにとって最善の方法は戦略1も選択することです。なぜなら、戦略2からはペイオフが0になるのに対し、ペイオフは1になるからです。

繰り返しますが、Bが戦略1を選択した場合、Aにとって最適なのは戦略1を選択することです。そのため、戦略2からはペイオフが2になるのに対して、ペイオフは2になります。

つまり、ここでAが戦略1を選択した場合、Bの最適な選択は戦略1を選択し、Bが戦略1を選択した場合、Aの最適な選択は戦略1を選択することです。ここでは、ナッシュ均衡があります。 各人は、他の人の選択を考慮して最適な選択をしています。

ナッシュ均衡の定義から、oligo占下のクールノ均衡はナッシュ均衡の特定のケースであることは明らかです。 クールノ均衡では、選択は2つの複占企業の出力レベルから選択されます。

各企業は、他の企業の選択を固定として、その出力レベルを選択します。 ここで、各企業のアウトプットレベルの選択はその戦略の選択であり、各企業によって得られる利益の額はその見返りです。 クールノットモデルでは、各企業は、他の企業が引き続き出力レベルを生み出し続ける、つまり、自ら選択した戦略を実行し続けると仮定して、最善を尽くすことになっています。

各企業が他の企業の行動を考慮して利益を最大化するときに、クールノ均衡が得られます。 これはまさにナッシュ均衡の定義です。

しかし、ナッシュ均衡にも問題があります。 まず、ゲームには複数のナッシュ均衡がある場合があります。 たとえば、表14.2では、プレーヤーAの戦略2とプレーヤーBの戦略2の組み合わせにより、ナッシュ均衡も得られます。 上記の種類の引数でこれを検証するか、ゲームの構造が対称的であることに注意することができます。

ナッシュ均衡の概念に関する2番目の問題は、これまで説明してきたすべての種類でナッシュ均衡を持たないゲームがあることです。 たとえば、表14.3に示すゲームを考えてみましょう。 ここでは、ナッシュ均衡は存在しません。

ここで、プレイヤーAが戦略1をプレイする場合、プレイヤーBも戦略1をプレイします。しかし、プレイヤーBが戦略1をプレイする場合、プレイヤーAは戦略2(戦略1ではない)をプレイします。 再び、プレイヤーAが戦略2をプレイする場合、プレイヤーBは戦略2(戦略1ではない)をプレイしたいと思うでしょう。 ただし、プレイヤーBが戦略2をプレイする場合、プレイヤーAは戦略1(戦略2ではない)をプレイすることにします。 したがって、ここではナッシュ均衡は起こりません。

混合戦略:

これまでのところ、各プレイヤーは戦略を1回だけ選択するものと想定してきました。 つまり、各プレイヤーは一度作られた戦略の選択に固執します。 これは純粋な戦略と呼ばれます。

ただし、代わりに、割り当てられたいくつかの確率に応じて、プレイヤーが選択をランダムにプレイできるようにすることもできます。 たとえば、プレーヤーAが戦略1を50パーセント、戦略2を50パーセント、Bが戦略1を50パーセント、戦略2を50でプレイすると仮定します。時間のパーセント。 この種の戦略は、混合戦略と呼ばれます。

AとBがそれぞれの選択肢を半分の時間でプレイする上記の混合戦略に従う場合、次のようになります。

囚人のジレンマ

ゲームのナッシュ均衡の問題の1つは、必ずしもパレート効率の良い結果につながらないことです。 たとえば、表14.4に示すゲームを考えてみましょう。 このゲームは、囚人のジレンマとして知られています。

このゲームでは、犯罪のパートナーである2人の囚人が別々に質問されている状況を考慮します。 各囚人には2つの選択肢がありました。犯罪を自白し、それによって他者を暗示するか、犯罪に自分が何らかの役割を果たしたことを否定するかです。

ゲームのペイオフの側面は次のとおりです。1人の囚人だけが告白した場合、彼は自由になり、他の囚人は予約され、6か月間刑務所に送られます。 両方の囚人が犯罪での役割を否定した場合、両方が技術的根拠で1か月間拘束され、両方の囚人が自白した場合、両方とも3か月間拘束されます。

簡単にするために、ペイオフは上記のさまざまな刑務所条件の前に負の記号を置くことで定量化されます。したがって、ペイオフマトリックスを表14.4に示します。

このマトリックスを調べると、囚人Bが戦略2(拒否)を使用している場合、囚人Aは戦略1(自白)を使用している場合、解放されます。

同様に、囚人Bが戦略1(自白)を使用する場合、囚人Aも戦略1(自白)を使用する方が良いでしょう。そうしないと、つまり、戦略2(拒否)を使用する場合、 6か月の刑。 したがって、囚人Bが何をしようとも、囚人Aは戦略1(自白)を使用する方がよい。

囚人Bについても同じことが得られます。つまり、囚人Aが何をするにしても、戦略1(自白)を使用したほうがよいということです。 したがって、このゲームでは、囚人Aが戦略1を選択した場合、Bが戦略1を選択して最適化するため、両方の囚人が戦略1を使用することを決定した場合、つまり両方が告白することを決定した場合、一意のナッシュ均衡が発生します囚人Bは彼の戦略1を選択し、Aは彼の戦略1を使用して最適化します。

また、表14.4の均衡はナッシュ均衡だけでなく、支配的な戦略均衡でもあることに気付くかもしれません。 なぜなら、ここでは、各囚人にとって、彼の戦略1(告白)が支配的な戦略です。

ただし、このセクションの冒頭で、ナッシュ均衡解が必ずしもパレート効率であるとは限らないことに注意しました。 たとえば、表14.4のゲームでは、2人の囚人のナッシュ均衡の組み合わせ(告白、告白)は、それぞれの2番目の戦略を採用する場合、つまり組み合わせ(拒否、拒否)を選択する場合、パレート非効率です。 、その後、どちらも大きな見返りが得られます。 ナッシュ均衡のペイオフの組み合わせは(-3、-3)でしたが、ペイオフの組み合わせは(-1、-1)になります。

囚人のジレンマとカルテルの不安定性

囚人のジレンマは、広範な経済現象を説明するために使用される場合があります。 そのような分野の1つは、カルテルの不安定性です。 カルテルのメンバーがそれぞれの割り当てに固執する場合、カルテルの安定性に危険はありません。 しかし、それらの一方または両方が割り当てられた出力クォータを超える場合、カルテルは深刻な不安定性に直面し、故障します。

囚人のジレンマのゲームで、 「自白」「拒否」の戦略をそれぞれ「クォータを超えて生産する」「元のクォータに固執する」ことで置き換え、それぞれのペイオフを想定する場合、カルテルの不安定性を示すことができます組み合わせは、表4.5に示されているものです。

表14.4に示されている囚人のジレンマと同様に、表14.5はカルテルの2つのメンバー企業のジレンマを示しています。 ここで、各デュオポリストには2つの戦略があります。つまり、割り当てられたクォータを超える量を生成し、割り当てられたクォータを守ります。

異なる戦略の組み合わせの見返りは次のとおりです。両方のデュオポリストが元のクォータに固執する場合、つまり合意に準拠する場合、それぞれのペイオフは15 [2行2列のペイオフの組み合わせ]になります。一方、両方がより多く生産する場合、それぞれのペイオフは小さくなります(ここでは10)。

たとえば、カルテル均衡からクールノ均衡に移行する場合、両者は等しいが、より小さなペイオフ[行1、列1のペイオフの組み合わせ]を持ちます。

一方、デュオポリストの1人が割り当て量に固執し、他のデュオポリストがより多く生産する場合、後者は見返りが大きいが、前者は不利になります[行1、列2または行2、列1のペイオフの組み合わせ]。

つまり、ここでカルテルの不安定性は、カルテルのメンバーが他のメンバーが自分のクォータに固執すると考えると、彼自身のクォータよりも多くを生成するために彼に支払うというジレンマから生じます。 しかし、もし彼が他の会社が過剰生産するだろうと思ったら、彼もそれをするかもしれません。

囚人のジレンマでゲームをプレイする正しい方法を見てみましょう。 ゲームが繰り返しゲームではない場合、ワンショットゲームである場合、カルテルから告白または敗北する戦略は合理的であるように見えます。特に、彼が他の人の行動に影響を与える方法がない場合。

 

コメントを残します