الاقتصاد

توازن ناش. نظرية اللعبة للاقتصاديين (جون ناش)

جدول المحتويات:

توازن ناش. نظرية اللعبة للاقتصاديين (جون ناش)
توازن ناش. نظرية اللعبة للاقتصاديين (جون ناش)

فيديو: Game Theory: Pure Strategy NE in ARABIC (#1) نظرية اللعبة: توازن ناش 2024, يوليو

فيديو: Game Theory: Pure Strategy NE in ARABIC (#1) نظرية اللعبة: توازن ناش 2024, يوليو
Anonim

في ثلاثينيات القرن العشرين ، أصبح جون فون نيومان وأوسكار مورجينسترن مؤسسي منطقة جديدة مثيرة للاهتمام من الرياضيات ، والتي كانت تسمى "نظرية الألعاب". في الخمسينيات ، أصبح عالم الرياضيات الشاب جون ناش مهتمًا بهذا المجال. أصبحت نظرية التوازن موضوع أطروحته التي كتبها عندما كان عمره 21 عامًا. وهكذا ولدت إستراتيجية جديدة للألعاب تسمى ناش إكويليبريوم ، والتي نالت جائزة نوبل بعد ذلك بسنوات عديدة ، في عام 1994.

Image

كانت الفجوة الطويلة بين كتابة الأطروحة والقبول العالمي اختبارًا لرياضيات. أدت العبقرية دون التعرف إلى انتهاكات عقلية خطيرة ، لكن جون ناش كان قادرًا على حل هذه المشكلة بفضل عقله المنطقي الممتاز. تم منح نظريته حول "توازن ناش" جائزة نوبل ، وتعديل فيلمه في فيلم "العقل الجميل" ("ألعاب العقل").

لعبة نظرية باختصار

بما أن نظرية توازن ناش تشرح سلوك الناس من حيث التفاعل ، فمن الجدير النظر في المفاهيم الأساسية لنظرية اللعبة.

تدرس نظرية اللعبة سلوك المشاركين (الوكلاء) في ظل ظروف التفاعل مع بعضهم البعض وفقًا لنوع اللعبة ، عندما تعتمد النتيجة على قرار وسلوك العديد من الأشخاص. يقوم المشارك باتخاذ قرارات مسترشدة بتنبؤاته فيما يتعلق بسلوك الآخرين ، والتي تسمى استراتيجية اللعبة.

هناك أيضًا استراتيجية مهيمنة يحصل فيها المشارك على النتيجة المثلى لأي سلوك من المشاركين الآخرين. هذه هي أفضل استراتيجية يكسبها اللاعب.

معضلة السجين واختراق علمي

معضلة السجين هي حالة لعبة حيث يضطر المشاركون إلى اتخاذ قرارات عقلانية ، والوصول إلى هدف مشترك في سياق تضارب البدائل. والسؤال هو أي من هذه الخيارات سيختار ، مع الاعتراف بمصلحته الشخصية والمشتركة ، وكذلك عدم القدرة على الحصول على كليهما. يبدو أن اللاعبين محاصرون في ظروف ألعاب قاسية ، مما يجعلهم يفكرون في بعض الأحيان بشكل منتج للغاية.

Image

تم استكشاف هذه المعضلة من قبل عالم الرياضيات الأمريكي جون ناش. أصبح التوازن الذي أخرجه ثوريًا من نوعه. بشكل خاص ، أثرت هذه الفكرة الجديدة على رأي الاقتصاديين حول كيفية قيام اللاعبين في السوق بالاختيارات ، مع مراعاة مصالح الآخرين ، مع التفاعل الوثيق وتقاطع المصالح.

من الأفضل دراسة نظرية اللعبة مع أمثلة محددة ، لأن هذا الانضباط الرياضي نفسه ليس نظريًا جافًا.

مثال معضلة السجين

على سبيل المثال ، سرق شخصان وسقطا في أيدي الشرطة ويتم استجوابهما في زنزانات منفصلة. وفي الوقت نفسه ، يوفر ضباط الشرطة لكل مشارك ظروفًا مواتية يتم الإفراج عنه بموجبها إذا شهد ضد شريكه. كل من المجرمين لديه مجموعة الاستراتيجيات التالية التي سينظر فيها:

  1. كلاهما يشهدان في نفس الوقت ويحكم عليهما بالسجن 2.5 سنة.

  2. كلاهما صامت في نفس الوقت ويحصلان على سنة واحدة لكل منهما ، لأنه في هذه الحالة ستكون قاعدة الأدلة على ذنبهم صغيرة.

  3. واحد يعطي دليلا ويحصل على الحرية ، والآخر صامت ويحكم عليه بالسجن 5 سنوات.

من الواضح أن نتيجة القضية تعتمد على قرار كل من المشاركين ، لكن لا يمكنهم التوصل إلى اتفاق لأنهم يجلسون في خلايا مختلفة. إن تضارب مصالحهم الشخصية في النضال من أجل المصلحة المشتركة واضح أيضًا. لكل سجين خياران للعمل و 4 خيارات للنتائج.

سلسلة الاستدلال

إذن ، المجرم (أ) يدرس الخيارات التالية:

  1. أنا صامت وشريكي صامت - كلانا سيحكم عليه بالسجن لمدة عام.

  2. أعطي شريكي وهو يعطيني - كلانا 2.5 سنة في السجن.

  3. أنا صامت ، وشريكي يسلمني - سأحصل على 5 سنوات في السجن ، وسيكون حرا.

  4. أستأجر شريكي وهو صامت - أحصل على الحرية وهو في السجن 5 سنوات.

نعطي مصفوفة من الحلول والنتائج الممكنة للوضوح.

جدول النتائج المحتملة لمعضلة السجين.

Image

السؤال هو ماذا سيختار كل مشارك؟

"صمت ، لا يمكنك التكلم" أو "صمت لا يمكنك التكلم"

لفهم اختيار المشارك ، عليك أن تذهب من خلال سلسلة أفكاره. بعد تفسير المجرم ج: إذا التزمت الصمت والتزمت الصمت ، فسوف نحصل على حد أدنى لمدة (عام واحد) ، ولكن لا يمكنني معرفة كيف سيتصرف. إذا كان يشهد ضدي ، فمن الأفضل لي أيضًا أن أشهد ، وإلا يمكنني الجلوس لمدة 5 سنوات. أفضل الجلوس 2.5 سنة بدلاً من 5 سنوات. إذا لم يقل أي شيء ، فأنا بحاجة أكثر للشهادة ، لأنني بهذه الطريقة سأحصل على الحرية. كما يجادل العضو ب بنفس الطريقة.

Image

من السهل أن نفهم أن الاستراتيجية المهيمنة لكل من المجرمين هي الشهادة. تحدث النقطة المثلى لهذه اللعبة عندما يقدم كل من المجرمين أدلة ويحصلون على "جائزتهم" - 2.5 سنة في السجن. تطلق عليه نظرية لعبة ناش التوازن.

ناش الأمثل الحل الأمثل

ثورة وجهة نظر ناشف هي أن هذا التوازن ليس مثالياً إذا أخذنا بعين الاعتبار المشترك الفردي ومصلحته الشخصية. بعد كل شيء ، فإن أفضل خيار هو التزام الصمت والذهاب بحرية.

توازن ناش هو نقطة اتصال ، حيث يختار كل مشارك خيارًا مثاليًا له فقط إذا اختار المشاركون الآخرون استراتيجية محددة.

بالنظر إلى الخيار عندما يكون كلا المجرمين صامتين ويتلقيا كل عام واحد فقط ، يمكننا تسميته بخيار باريتو الأمثل. ومع ذلك ، فمن الممكن فقط إذا كان المجرمون قد وافقوا مسبقا. ولكن حتى هذا لن يضمن هذه النتيجة ، حيث أن إغراء التراجع عن الإقناع وتجنب العقاب عظيم. إن عدم الثقة الكاملة ببعضها البعض وخطر أن تكون بعمر 5 سنوات يجبر المرء على اختيار الخيار مع الاعتراف. إن التأمل في حقيقة أن المشاركين سيلتزمون بالخيار بالصمت ، والعمل بشكل متضافر ، هو ببساطة غير منطقي. يمكن استنتاج مثل هذا الاستنتاج إذا درسنا توازن ناش. الأمثلة تثبت ذلك فقط.

أناني أو عقلاني

لقد أسفرت نظرية توازن ناش عن استنتاجات مذهلة ، دحضت المبادئ التي كانت موجودة من قبل. على سبيل المثال ، اعتبر آدم سميث سلوك كل من المشاركين أنانيًا تمامًا ، مما أدى إلى توازن النظام. كانت تسمى هذه النظرية "اليد الخفية للسوق".

Image

رأى جون ناش أنه إذا تصرف جميع المشاركين من أجل تحقيق مصالحهم الخاصة ، فإن هذا لن يؤدي أبدًا إلى نتيجة جماعية مثالية. بالنظر إلى أن التفكير العقلاني متأصل في كل مشارك ، فإن الخيار الذي تقدمه استراتيجية توازن ناش أكثر احتمالًا.

تجربة الذكور بحتة

مثال حي هو لعبة "مفارقة شقراء" ، والتي ، على الرغم من أنها تبدو غير مناسبة ، هي مثال حي يوضح كيف تعمل نظرية لعبة ناش.

في هذه اللعبة ، عليك أن تتخيل أن شركة الرجال الأحرار جاءت إلى الحانة. التالي هو شركة من الفتيات ، واحدة منها أفضل من غيرها ، تقول شقراء. كيف يتصرف الرجال للحصول على أفضل صديقة لأنفسهم؟

Image

لذا ، منطق الرجال: إذا بدأ الجميع في التعرف على شقراء ، فمن المرجح أنها لن تصل إلى أي شخص ، فلن يرغب أصدقاؤها في الاجتماع. لا أحد يريد أن يكون البديل الثاني. ولكن إذا اختار الرجال تجنب الأشقر ، فإن احتمال العثور على صديقة جيدة بين الفتيات مرتفع.

إن وضع توازن ناش ليس مثاليًا للرجال ، لأنه من خلال متابعة مصالحهم الأنانية فقط ، سيختار الجميع شقراء. من الواضح أن السعي وراء المصالح الأنانية فقط سيكون بمثابة انهيار مصالح المجموعة. إن توازن ناش سيعني أن كل شخص يتصرف في مصلحته الشخصية ، والتي تكون على اتصال مع مصالح المجموعة بأكملها. هذا ليس خيارًا مثاليًا للجميع شخصيًا ، ولكنه مثالي للجميع ، استنادًا إلى استراتيجية النجاح الشاملة.

حياتنا كلها لعبة

إن اتخاذ القرارات في ظروف حقيقية مشابه جدًا للعبة عندما تتوقع سلوكًا عقلانيًا معينًا من المشاركين الآخرين. في العمل ، في العمل ، في الفريق ، في الشركة ، وحتى في العلاقات مع الجنس الآخر. من المعاملات الكبيرة إلى مواقف الحياة العادية ، كل شيء يخضع لقانون أو آخر.

Image

بطبيعة الحال ، فإن مواقف اللعبة التي يتم دراستها مع المجرمين والبار هي مجرد رسوم توضيحية ممتازة توضح توازن ناش. غالبًا ما تظهر أمثلة على هذه المعضلات في السوق الحقيقية ، وينجح ذلك بشكل خاص في الحالات التي يمتلك فيها محتكران يسيطران على السوق.

استراتيجيات مختلطة

في كثير من الأحيان لا نشارك في لعبة واحدة ولكن في عدة مباريات في وقت واحد. اختيار أحد الخيارات للعبة واحدة ، مسترشداً باستراتيجية عقلانية ، لكنك تدخل لعبة أخرى. بعد عدة قرارات عقلانية ، قد تجد أن نتيجتك لا تناسبك. ماذا تفعل؟

ضع في اعتبارك نوعين من الإستراتيجيات:

  • الاستراتيجية الخالصة هي سلوك المشارك الذي يأتي من التفكير في السلوك المحتمل للمشاركين الآخرين.

  • الإستراتيجية المختلطة أو الإستراتيجية العشوائية هي تناوب الإستراتيجيات البحتة عشوائيًا أو اختيار إستراتيجية خالصة باحتمالية معينة. وتسمى هذه الاستراتيجية أيضًا عشوائيًا.

Image

بالنظر إلى هذا السلوك ، نحصل على نظرة جديدة على توازن ناش. إذا قيل في وقت سابق أن اللاعب يختار استراتيجية مرة واحدة ، عندها يمكن تخيل سلوك آخر. يمكننا أن نعترف بخيار أن يختار اللاعبون استراتيجية بشكل عشوائي مع احتمال معين. الألعاب التي لا يمكن العثور على توازن ناش فيها في الإستراتيجيات البحتة تحتوي عليها دائمًا في ألعاب مختلطة.

يسمى توازن ناش في الاستراتيجيات المختلطة التوازن المختلط. هذا هو التوازن ، حيث يختار كل مشارك التردد الأمثل لاختيار استراتيجياتهم ، شريطة أن يختار المشاركون الآخرون استراتيجياتهم بتردد معين.