بازی های ماتریسی: نمونه هایی از حل مسئله. بازی های آنتاگونیستی با استراتژی های مداوم ب) نه همیشه

معرفی

موقعیت های درگیری واقعی منجر به انواع مختلفی از بازی ها می شود. بازی‌ها از طرق مختلفی متفاوت هستند: بر اساس تعداد بازیکنان شرکت‌کننده در آنها، تعداد بازیکنان ممکن، تعداد استراتژی‌های ممکن، ماهیت روابط بین بازیکنان، ماهیت بردها، بر اساس نوع بازی‌ها. توابع برنده، با تعداد حرکات، ماهیت ارائه اطلاعات بازیکنان و غیره. d. بیایید انواع بازی ها را بسته به تقسیم بندی آنها در نظر بگیریم:

· با توجه به تعداد استراتژی ها، بازی ها به دو دسته تقسیم می شوند نهایی(هر بازیکن دارای تعداد محدودی از استراتژی های ممکن است) و بی پایان(جایی که حداقل یکی از بازیکنان تعداد نامحدودی استراتژی ممکن دارد).

· با توجه به ماهیت برد، بازی با مجموع صفر(کل سرمایه بازیکنان تغییر نمی کند، اما بسته به نتایج حاصله بین بازیکنان توزیع می شود) و بازی با مجموع غیر صفر.

· با توجه به نوع توابع، بردهای بازی به دو دسته تقسیم می شوند ماتریس (یک بازی محدود دو نفره با مجموع صفر است که در آن پاداش بازیکن داده می شود آبه شکل ماتریس (یک ردیف از ماتریس با تعداد استراتژی استفاده شده بازیکن مطابقت دارد. که در، ستون - تعداد استراتژی استفاده شده توسط بازیکن که در; در تقاطع سطر و ستون ماتریس، سود بازیکن است آ، مطابق با استراتژی های اعمال شده است.

برای بازی های ماتریسی ثابت شده است که هر کدام از آنها راه حلی دارند و با کاهش بازی به یک مسئله برنامه نویسی خطی به راحتی می توان آن را پیدا کرد. دوماتریسبازی (این یک بازی متناهی از دو بازیکن با مجموع غیر صفر است که در آن سود هر بازیکن با ماتریس جداگانه برای بازیکن مربوطه داده می شود (در هر ماتریس یک ردیف با استراتژی بازیکن مطابقت دارد. آ، ستون – استراتژی های بازیکن که در، در محل تلاقی سطر و ستون در ماتریس اول، سود بازیکن است آ، در ماتریس دوم - بردهای بازیکن که در.

تئوری رفتار بهینه بازیکن نیز برای بازی‌های دوماتریکسی ایجاد شده است، اما حل چنین بازی‌هایی از بازی‌های ماتریسی معمولی دشوارتر است. مداومبازی ها ( مداوماین بازی در نظر گرفته می شود که در آن عملکرد بازده هر بازیکن بسته به استراتژی ها مستمر است. ثابت شده است که بازی های این کلاس دارای راه حل هستند، اما هیچ روش عملا قابل قبولی برای یافتن آنها ایجاد نشده است) و غیره.

روش های دیگری برای تقسیم بازی ها نیز امکان پذیر است. حال مستقیماً به موضوع تحقیق یعنی نظریه بازی ها برمی گردیم. ابتدا اجازه دهید این مفهوم را تعریف کنیم.

نظریه بازی - شاخه ای از ریاضیات که به مطالعه مدل های رسمی تصمیم گیری بهینه در شرایط تعارض می پردازد. در این حالت، تعارض به عنوان پدیده‌ای در نظر گرفته می‌شود که در آن طرف‌های مختلف با منافع و فرصت‌های مختلفی درگیر هستند تا اقداماتی را که در اختیار دارند، مطابق با این منافع انتخاب کنند افزایش به عدم قطعیت برعکس، عدم قطعیت در هنگام تصمیم گیری (به عنوان مثال، بر اساس داده های ناکافی) می تواند به عنوان تضاد بین موضوع تصمیم گیرنده و ماهیت تفسیر شود. بنابراین نظریه بازی ها نیز به عنوان نظریه تصمیم گیری بهینه در شرایط عدم قطعیت در نظر گرفته می شود. این به شما امکان می دهد تا برخی از جنبه های مهم تصمیم گیری در فناوری، کشاورزی، پزشکی و جامعه شناسی و سایر علوم را نظام مند کنید. احزاب درگیر در یک درگیری، ائتلاف عمل نامیده می شوند. اقدامات در دسترس آنها - با استراتژی های آنها. نتایج احتمالی درگیری - موقعیت ها.

هدف نظریه این است که:

1) رفتار بهینه در بازی.

2) مطالعه خواص رفتار بهینه

3) تعیین شرایطی که در آن استفاده از آن معنادار است (مسائل وجود، منحصر به فرد بودن، و برای بازی های پویا، سؤالات ثبات اسمی).

4) ساخت روش های عددی برای یافتن رفتار بهینه.

نظریه بازی که برای حل ریاضی مسائل با منشأ اقتصادی و اجتماعی ایجاد شده است، نمی تواند به طور کلی به نظریه های ریاضی کلاسیک ایجاد شده برای حل مسائل فیزیکی و فنی تقلیل یابد. با این حال، طیف گسترده ای از روش های ریاضی کلاسیک به طور گسترده در سؤالات خاص مختلف نظریه بازی ها استفاده می شود.

علاوه بر این، تئوری بازی ها به صورت درونی با تعدادی از رشته های ریاضی مرتبط است. در تئوری بازی ها، مفاهیم نظریه احتمال به طور سیستماتیک و ماهوی مورد استفاده قرار می گیرد. در زبان تئوری بازی‌ها، اکثر مسائل آمار ریاضی قابل فرمول‌بندی است و از آنجایی که نظریه بازی‌ها با نظریه تصمیم‌گیری مرتبط است، جزء ضروری دستگاه ریاضی تحقیق در عملیات محسوب می‌شود.

مفهوم ریاضی یک بازی به طور غیرعادی گسترده است. این شامل به اصطلاح بازی های سالن (شامل شطرنج، چکرز، GO، بازی با ورق، دومینو) است، اما همچنین می تواند برای توصیف مدل های یک سیستم اقتصادی با خریداران و فروشندگان متعدد در رقابت با یکدیگر استفاده شود. بدون پرداختن به جزئیات، یک بازی را می توان به طور کلی به عنوان وضعیتی تعریف کرد که در آن یک یا چند نفر ("بازیکن") به طور مشترک تعدادی از متغیرها را کنترل می کنند و هر بازیکن باید هنگام تصمیم گیری، اقدامات کل گروه را در نظر بگیرد. "پرداخت" که به هر بازیکن می رسد نه تنها توسط اقدامات خود او، بلکه توسط اقدامات سایر اعضای گروه نیز تعیین می شود. برخی از "حرکات" (اقدامات فردی) در طول بازی ممکن است تصادفی باشند. یک مثال واضح، بازی معروف پوکر است: معامله اولیه کارت ها یک حرکت تصادفی است. توالی شرط‌ها و ضد شرط‌ها قبل از مقایسه نهایی ترفندها با حرکات باقی‌مانده در بازی شکل می‌گیرد.

نظریه بازی های ریاضی با تجزیه و تحلیل ورزش، کارت و بازی های دیگر آغاز شد. آنها می گویند که کاشف نظریه بازی ها، ریاضیدان برجسته آمریکایی قرن بیستم است. جان فون نویمان هنگام تماشای یک بازی پوکر ایده های نظریه خود را مطرح کرد. نام "نظریه بازی" از اینجا می آید.

بیایید شروع به بررسی این موضوع کنیم تحلیل گذشته نگر توسعه نظریه بازی ها.اجازه دهید تاریخچه و توسعه موضوع نظریه بازی ها را در نظر بگیریم. به طور معمول، "درخت خانواده" به عنوان یک درخت در مفهوم نظریه گراف نشان داده می شود که در آن انشعاب از یک "ریشه" منفرد رخ می دهد. شجره نظریه بازی ها کتابی است از جی. فون نویمان و او. مورگنسترن. بنابراین، سیر تاریخی توسعه نظریه بازی ها به عنوان یک رشته ریاضی به طور طبیعی به سه مرحله تقسیم می شود:

مرحله اول- قبل از انتشار مونوگراف J. von Neumann و O. Morgenstern. می توان آن را "پیش تک نگاری" نامید. در این مرحله، بازی همچنان به عنوان یک رقابت خاص عمل می کند که با قوانین آن به صورت معنادار توصیف شده است. فقط در پایان آن، J. von Neumann ایده ای از بازی را به عنوان یک مدل کلی از تعارض انتزاعی توسعه می دهد. نتیجه این مرحله انباشت تعدادی از نتایج ریاضی خاص و حتی اصول فردی تئوری بازی های آینده بود.

فاز دومخود تک نگاری J. von Neumann و

O. Morgenstern "نظریه بازی و رفتار اقتصادی" (1944)، که ترکیبی از اکثر نتایج به دست آمده قبلی (اما، با استانداردهای ریاضی مدرن، بسیار کمی) است. او اولین کسی بود که یک رویکرد ریاضی به بازی ها (هم به معنای عینی و هم انتزاعی کلمه) را در قالب یک نظریه سیستماتیک ارائه کرد.

در نهایت، در مرحله سومنظریه بازی ها در رویکرد خود به اشیاء مورد مطالعه تفاوت کمی با سایر شاخه های ریاضیات دارد و تا حد زیادی بر اساس قوانین مشترک آنها توسعه می یابد. البته در عین حال، ویژگی های کاربردی عملی آن، اعم از بالفعل و ممکن، تأثیر بسزایی در شکل گیری جهت ها در نظریه بازی ها دارد.

با این حال، حتی نظریه بازی های ریاضی نیز قادر به پیش بینی کامل نتیجه برخی از درگیری ها نیست. شناسایی سه دلیل اصلی برای عدم قطعیت نتیجه بازی (تعارض) به نظر می رسد.

اولاً، اینها بازی هایی هستند که در آنها فرصت واقعی برای مطالعه همه یا حداقل بیشتر انواع رفتار بازی وجود دارد که یکی از آنها صحیح ترین است و منجر به برنده شدن می شود. عدم قطعیت توسط تعداد قابل توجهی از گزینه ها ایجاد می شود، بنابراین همیشه نمی توان کاملاً همه گزینه ها را بررسی کرد (به عنوان مثال، بازی ژاپنی GO، چکرز روسی و بین المللی، برگردان انگلیسی).

ثانیاً تأثیر تصادفی عوامل در بازی توسط بازیکنان غیرقابل پیش بینی است. این عوامل تاثیر تعیین کننده ای در نتیجه بازی دارند و فقط تا حدودی می توانند توسط بازیکنان کنترل و تعیین شوند. نتیجه نهایی بازی فقط تا حدی کوچک و بسیار ناچیز توسط اقدامات خود بازیکنان تعیین می شود. بازی هایی که نتیجه آنها به دلایل تصادفی نامشخص است، قمار نامیده می شود. نتیجه بازی همیشه احتمالی یا حدسی است (رولت، تاس، پرتاب).

ثالثاً، عدم اطمینان ناشی از عدم اطلاع از استراتژی حریف بازی کننده است. ناآگاهی بازیکنان از رفتار حریف اساسی است و بر اساس قوانین بازی تعیین می شود. به این گونه بازی ها، بازی های استراتژیک می گویند.

تئوری بازی یکی از بخش‌های مهم «تحقیق در عملیات» است و مبانی نظری مدل‌های ریاضی را برای تصمیم‌گیری بهینه در موقعیت‌های تضاد روابط بازار که ماهیت رقابتی دارند، نشان می‌دهد که در آن یک طرف مقابل بر دیگری پیروز می‌شود. هزینه زیان دیگری در کنار این وضعیت، در چارچوب علم تحقیق در عملیات که توصیفی ریاضی از فرمول بندی مسائل مختلف تصمیم گیری ارائه می کند، موقعیت های ریسک و عدم قطعیت در نظر گرفته می شود. در شرایط عدم قطعیت، احتمالات شرایط نامعلوم است و راهی برای به دست آوردن اطلاعات آماری اضافی در مورد آنها وجود ندارد. محیط پیرامون حل یک مسئله، که در شرایط خاصی خود را نشان می دهد، «طبیعت» و مدل های ریاضی مربوطه را «بازی با طبیعت» یا «نظریه بازی های آماری» می نامند. هدف اصلی تئوری بازی ها ایجاد توصیه هایی برای رفتار رضایت بخش بازیکنان در یک درگیری است، یعنی شناسایی یک "استراتژی بهینه" برای هر یک از آنها.

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

معرفی

1. بخش نظری

1.3 سفارش بازی 2x2

1.4 روش جبری

1.5 روش گرافیکی

1.6 بازی 2xn یا mx2

1.7 حل بازی ها با استفاده از روش ماتریس

2. بخش عملی

2.2 بازی 2xn و mx2

2.3 روش ماتریسی

2.4 روش قهوه ای

تجزیه و تحلیل نتایج

معرفی

یک بازی حاصل جمع صفر یک بازی با مجموع صفر است. یک بازی حاصل جمع صفر یک بازی غیرهمکاری است که شامل دو بازیکن است که بازده آنها مخالف است.

به طور رسمی، یک بازی متضاد را می توان توسط یک ترویکا نشان داد ، که در آن X و Y به ترتیب مجموعه استراتژی های بازیکن اول و دوم هستند، F تابع بازده بازیکن اول است که هر جفت استراتژی (x,y) را به هم مرتبط می کند، جایی که یک عدد واقعی مربوط به ابزار است. اولین بازیکن در اجرای یک موقعیت معین.

از آنجایی که منافع بازیکنان مخالف است، تابع F به طور همزمان نشان دهنده از دست دادن بازیکن دوم است.

از نظر تاریخی، بازی‌های حاصل جمع صفر اولین کلاس از مدل‌های نظریه بازی‌های ریاضی هستند که قمار با آن توصیف شد. اعتقاد بر این است که این موضوع مورد مطالعه جایی است که نظریه بازی ها نام خود را پیدا کرده است. امروزه بازی‌های متضاد بخشی از کلاس وسیع‌تر بازی‌های غیرهمکاری محسوب می‌شوند.

1. بخش نظری

1.1 تعاریف و مقررات اساسی بازی

این بازی با سیستمی از قوانین مشخص می شود که تعداد شرکت کنندگان در بازی، اقدامات احتمالی آنها و توزیع بردها را بسته به رفتار و نتایج آنها تعیین می کند. بازیکن به عنوان یک شرکت کننده یا گروهی از شرکت کنندگان در بازی در نظر گرفته می شود که دارای علایق مشترکی هستند که با علایق گروه های دیگر همخوانی ندارد. بنابراین، هر شرکت کننده یک بازیکن محسوب نمی شود.

قوانین یا شرایط بازی، رفتارها، انتخاب ها و حرکات ممکن را برای بازیکنان در هر مرحله از توسعه بازی تعیین می کند. انتخاب برای یک بازیکن یعنی انتخاب یکی از گزینه های رفتاری او. سپس بازیکن با استفاده از حرکات این انتخاب ها را انجام می دهد. انجام حرکت به این معنی است که در مرحله خاصی از بازی، بسته به امکاناتی که توسط قوانین بازی پیش بینی شده است، تمام یا بخشی از انتخاب را به یکباره انجام دهید. هر بازیکن در مرحله خاصی از بازی با توجه به انتخاب انجام شده حرکتی انجام می دهد. بازیکن دیگر با دانستن یا عدم اطلاع از انتخاب بازیکن اول نیز حرکتی انجام می دهد. هر بازیکن سعی می کند اطلاعات مربوط به توسعه گذشته بازی را در نظر بگیرد، اگر چنین امکانی توسط قوانین بازی مجاز باشد.

مجموعه ای از قوانین که به وضوح به بازیکن نشان می دهد که در هر حرکت، بسته به موقعیتی که در نتیجه بازی ایجاد می شود، چه انتخابی باید داشته باشد، استراتژی بازیکن نامیده می شود. استراتژی در تئوری بازی به معنای یک برنامه عمل کامل مشخص برای بازیکن است که نشان می دهد او در تمام موارد ممکن توسعه بازی چگونه باید عمل کند. استراتژی به معنای مجموع تمام دستورالعمل ها برای هر وضعیت اطلاعاتی است که در هر مرحله از توسعه بازی در دسترس بازیکن است. از اینجا مشخص است که استراتژی ها می توانند خوب و بد، موفق و ناموفق و غیره باشند.

یک بازی با مجموع صفر زمانی خواهد بود که مجموع بردهای همه بازیکنان در هر بازی صفر باشد، یعنی در یک بازی با مجموع صفر، کل سرمایه همه بازیکنان تغییر نمی کند، اما بسته به نتیجه بین بازیکنان دوباره توزیع می شود. عواقب. بنابراین، بسیاری از موقعیت های اقتصادی و نظامی را می توان به عنوان بازی های حاصل جمع صفر در نظر گرفت.

به طور خاص، یک بازی مجموع صفر بین دو بازیکن متضاد نامیده می شود، زیرا اهداف بازیکنان در آن دقیقاً مخالف است: سود یک بازیکن فقط به قیمت از دست دادن بازیکن دیگر اتفاق می افتد.

1.1.1 تعریف، مثال ها و راه حل های بازی های ماتریسی در استراتژی های محض

یک بازی ماتریس مجموع صفر دو نفره را می توان به عنوان بازی انتزاعی دو نفره زیر در نظر گرفت.

بازیکن اول دارای t استراتژی i = 1, 2,…, t است، بازیکن دوم دارای n استراتژی j = 1, 2,…, p هر جفت استراتژی (i, j) با یک عدد a ij همراه است در صورتی که بازیکن اول از استراتژی i-ام خود استفاده کند و بازیکن دوم از استراتژی j-ام خود استفاده کند.

هر بازیکن یک حرکت انجام می دهد: بازیکن اول استراتژی i-ام خود را انتخاب می کند (i = 1، 2،...، m)، بازیکن دوم استراتژی j-امین خود را انتخاب می کند (j = 1، 2،...، n) ، پس از آن بازیکن اول یک برنده ij به قیمت بازیکن دوم دریافت می کند (اگر ij باشد< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

هر استراتژی بازیکن i = 1، 2،…، t; j = 1، 2،…، n اغلب یک استراتژی خالص نامیده می شود.

یک بازی ماتریسی دو نفره با جمع صفر از این پس به سادگی یک بازی ماتریسی نامیده می شود. بدیهی است که بازی ماتریکس متعلق به بازی های آنتاگونیستی است. از تعریف آن چنین استنباط می شود که برای تعریف یک بازی ماتریسی کافی است یک ماتریس A = (a ij) از ترتیب پرداخت های بازیکن اول مشخص شود.

اگر ماتریس بازده را در نظر بگیریم

سپس انجام هر بازی از یک بازی ماتریس با ماتریس A به انتخاب بازیکن اول ردیف i و بازیکن دوم ستون j و بازیکن اول دریافت کننده (به هزینه نفر دوم) کاهش می یابد. ) بردهای واقع در ماتریس A در تقاطع ردیف i و ستون j.

برای رسمی کردن یک موقعیت درگیری واقعی در قالب یک بازی ماتریس، لازم است استراتژی های ناب هر بازیکن شناسایی و شماره گذاری مجدد شود و یک ماتریس بازده ایجاد شود.

مرحله بعدی تعیین استراتژی ها و بردهای بهینه بازیکنان است.

نکته اصلی در مطالعه بازی ها مفهوم استراتژی های بهینه بازیکنان است. این مفهوم به طور شهودی به معنای زیر است: استراتژی بازیکن در صورتی بهینه است که استفاده از این استراتژی بزرگترین برد تضمین شده را برای تمام استراتژی های ممکن بازیکن دیگر برای او فراهم کند. بر اساس این موقعیت ها، بازیکن اول ماتریس A را با استفاده از فرمول (1.1) به شرح زیر بررسی می کند: برای هر مقدار i (i = 1, 2,..., t) حداقل مقدار بازده بسته به مقدار تعیین می شود. استراتژی های مورد استفاده توسط بازیکن دوم

(i = 1، 2،...، m) (1.2)

یعنی حداقل بازده برای بازیکن اول مشخص می شود، مشروط بر اینکه او یکمین استراتژی خالص خود را اعمال کند، سپس از این حداقل سود، یک استراتژی i = i 0 پیدا می شود که این حداقل بازده برای آن حداکثر خواهد بود، یعنی پیدا می شود.

تعریف. عدد b که با فرمول (1.3) تعیین می‌شود، قیمت خالص پایین‌تر بازی نامیده می‌شود و نشان می‌دهد که بازیکن اول می‌تواند با اعمال استراتژی‌های خالص خود برای تمام اقدامات ممکن بازیکن دوم، چه حداقل بردهایی را برای خود تضمین کند.

بازیکن دوم با رفتار بهینه خود باید در صورت امکان با راهبردهای خود تلاش کند تا بردهای بازیکن اول را به حداقل برساند. بنابراین، برای بازیکن دوم پیدا می کنیم

یعنی حداکثر بازده بازیکن اول مشخص می شود، مشروط بر اینکه بازیکن دوم استراتژی خالص j خود را اعمال کند، سپس بازیکن دوم استراتژی j = j 1 خود را پیدا می کند که بر اساس آن بازیکن اول حداقل بازده را دریافت می کند، یعنی می یابد.

تعریف. عدد b که با فرمول (1.5) تعیین می‌شود، قیمت خالص بالای بازی نامیده می‌شود و نشان می‌دهد که بازیکن اول می‌تواند از طریق استراتژی‌های خود حداکثر چه بردهایی را برای خود تضمین کند. به عبارت دیگر، بازیکن اول با اعمال استراتژی‌های خالص خود می‌تواند بازدهی کمتر از b را تضمین کند و بازیکن دوم با اعمال استراتژی‌های خالص خود می‌تواند از برنده شدن بازیکن اول بیشتر از b جلوگیری کند.

تعریف. اگر در یک بازی با ماتریس A، قیمت خالص پایین و بالای بازی با هم منطبق باشد، یعنی b = c، آنگاه می گویند این بازی دارای یک نقطه زینتی در استراتژی های خالص و قیمت خالص بازی است:

n = b = v (1.6)

نقطه زینی یک جفت استراتژی خالص () از بازیکنان اول و دوم است که در آن برابری به دست می آید.

مفهوم نقطه زینی به این معناست: اگر یکی از بازیکنان به استراتژی مربوط به یک نقطه زین پایبند باشد، بازیکن دیگر نمی تواند بهتر از این باشد که به استراتژی مربوط به یک نقطه زین پایبند باشد. با توجه به اینکه بهترین رفتار یک بازیکن نباید منجر به کاهش برد او شود و بدترین رفتار ممکن است منجر به کاهش برد او شود، این شرایط را می توان به صورت ریاضی در قالب روابط زیر نوشت:

که در آن i، j هر استراتژی خالص بازیکن اول و دوم است. (i 0 , j 0) استراتژی هایی هستند که یک نقطه زینتی را تشکیل می دهند. در زیر نشان خواهیم داد که تعریف نقطه زین معادل شرایط (1.8) است.

بنابراین، بر اساس (1.8)، عنصر saddle در ردیف i 0 حداقل و حداکثر در ستون j 0 در ماتریس A است. یافتن نقطه زین ماتریس A آسان است: در ماتریس A، حداقل عنصر به ترتیب در یافت می شود. هر سطر را بررسی کنید و بررسی کنید که آیا این عنصر حداکثر در ستون خود است یا خیر. اگر چنین باشد، پس یک عنصر زین است و جفت استراتژی مربوط به آن یک نقطه زینی را تشکیل می دهد. یک جفت استراتژی خالص (i 0 , j 0) از بازیکنان اول و دوم که یک نقطه زین و یک عنصر زین را تشکیل می دهند راه حل بازی نامیده می شود.

استراتژی های خالص i 0 و j 0 که یک نقطه زین را تشکیل می دهند، به ترتیب استراتژی های خالص بهینه بازیکنان اول و دوم نامیده می شوند.

قضیه 1. فرض کنید f (x, y) تابعی واقعی از دو متغیر x A و y B باشد و وجود داشته باشد.

سپس b = c.

اثبات از تعریف حداقل و حداکثر چنین بر می آید که

از آنجایی که در سمت چپ (1.11) x دلخواه است، پس

بنابراین در سمت راست نابرابری (1.12) y دلخواه است

Q.E.D.

به طور خاص، ماتریس () یک مورد خاص از تابع f (x, y) است، یعنی اگر x = i، y = j، = f (x، y) را قرار دهیم، آنگاه از قضیه 1 به دست می آوریم که خالص پایین تر قیمت از قیمت خالص بالای بازی در بازی ماتریس تجاوز نمی کند.

تعریف. فرض کنید f (x, y) تابعی واقعی از دو متغیر x A و y B باشد. نقطه (x 0, y 0) برای تابع f (x, y) نقطه زینی نامیده می شود که نابرابری های زیر برآورده شوند.

f (x, y 0) f (x 0, y 0)f (x 0, y) (1.14)

برای هر x A و y B.

1.2 استراتژی های ترکیبی بهینه و ویژگی های آنها

مطالعه یک بازی ماتریسی با یافتن نقطه زین آن در استراتژی های خالص آغاز می شود. اگر یک بازی ماتریسی در استراتژی های خالص دارای یک نقطه زینتی باشد، مطالعه بازی با یافتن این نقطه به پایان می رسد. اگر در یک بازی ماتریسی در استراتژی های خالص نقطه زین وجود نداشته باشد، می توان قیمت خالص پایین و بالای این بازی را پیدا کرد که نشان می دهد بازیکن اول نباید بیش از قیمت بالای بازی به برنده شدن امیدوار باشد و می تواند مطمئن باشید که یک برد نه کمتر از قیمت بازی دریافت می کنید. چنین توصیه هایی در مورد رفتار بازیکنان در یک بازی ماتریسی بدون نقطه زین در استراتژی های خالص نمی تواند محققین و تمرین کنندگان را راضی کند. بهبود راه حل های بازی های ماتریسی را باید در استفاده از محرمانه بودن استفاده از استراتژی های ناب و امکان تکرار چندباره بازی ها در قالب بازی جستجو کرد. به عنوان مثال، یک سری بازی شطرنج، چکر و فوتبال انجام می شود و بازیکنان هر بار استراتژی های خود را به گونه ای به کار می گیرند که حریفان هیچ اطلاعی از محتوای آنها نداشته باشند و در این مسیر به طور متوسط با انجام کل سری بازی ها به بردهای خاصی دست پیدا کنید. این بردها به طور متوسط ​​بیشتر از قیمت پایین بازی و کمتر از قیمت بالای بازی است. هرچه این مقدار میانگین بالاتر باشد، بازیکن استراتژی بهتری استفاده می کند. بنابراین، این ایده به وجود آمد که استراتژی‌های خالص را به‌طور تصادفی و با احتمال مشخصی اعمال کنیم. این کاملا محرمانه بودن استفاده از آنها را تضمین می کند. هر بازیکن می تواند احتمال استفاده از استراتژی های خالص خود را به گونه ای تغییر دهد که میانگین سود خود را به حداکثر برساند و در طول مسیر به استراتژی های بهینه دست یابد. این ایده به مفهوم استراتژی مختلط منجر شد.

تعریف. استراتژی ترکیبی یک بازیکن مجموعه کاملی از احتمالات استفاده از استراتژی های خالص او است.

بنابراین، اگر اولین بازیکن دارای m استراتژی خالص 1، 2، ... i، ... m باشد، استراتژی مختلط x او مجموعه ای از اعداد x = (x 1، x 2، ...، x i،…، x m) است که رضایت بخش است. روابط

x i 0 (i = 1، 2، ...، t)، = 1. (1.15)

به طور مشابه، برای بازیکن دوم که n استراتژی خالص دارد، یک استراتژی مختلط y مجموعه ای از اعداد y = (y 1، ...، y j، ... y n) است که روابط را برآورده می کند.

y j 0 (j = 1، 2، ...، n)، = 1. (1.16)

از آنجایی که هر بار که یک بازیکن از یک استراتژی خالص استفاده می کند، استفاده از استراتژی دیگر را حذف می کند، استراتژی های خالص رویدادهای ناسازگاری هستند. علاوه بر این، آنها تنها رویدادهای ممکن هستند.

بدیهی است که یک استراتژی خالص یک مورد خاص از یک استراتژی ترکیبی است. در واقع، اگر در یک استراتژی مختلط هر یکمین استراتژی خالص با احتمال یک به کار گرفته شود، آنگاه همه استراتژی های خالص دیگر اعمال نمی شوند. و این استراتژی خالص یکم یک مورد خاص از یک استراتژی ترکیبی است. برای حفظ رازداری، هر بازیکن بدون توجه به انتخاب های بازیکن دیگر، استراتژی های خود را اعمال می کند.

تعریف. میانگین بازده اولین بازیکن در یک بازی ماتریس با ماتریس A به عنوان انتظار ریاضی از بازده او بیان می شود.

E (A، x، y) = (1.20)

بدیهی است که میانگین بازده بازیکن اول تابعی از دو مجموعه متغیر x و y است. بازیکن اول با تغییر استراتژی های مختلط x خود قصد دارد میانگین بازده E (A, x, y) خود را به حداکثر برساند و بازیکن دوم از طریق استراتژی های ترکیبی خود تلاش می کند تا E (A, x, y) را به حداقل برساند. برای حل بازی باید x، y را پیدا کرد که در آن قیمت بالاتر بازی به دست می‌آید.

1.3 بازی سفارشی 22

یک بازی ماتریسی به ترتیب 22 توسط ماتریس سود زیر برای بازیکن اول ارائه می شود:

راه حل این بازی باید با یافتن نقطه زینتی در استراتژی های ناب آغاز شود. برای انجام این کار، حداقل عنصر را در ردیف اول پیدا کنید و بررسی کنید که آیا در ستون آن حداکثر است یا خیر. اگر چنین عنصری یافت نشد، خط دوم نیز به همین ترتیب بررسی می شود. اگر چنین عنصری در خط دوم یافت شود، آنگاه یک زین است.

یافتن عنصر زین، در صورت وجود، فرآیند یافتن راه‌حل آن را به پایان می‌رساند، زیرا در این مورد قیمت بازی پیدا شده است - عنصر زین و نقطه زین، یعنی یک جفت استراتژی ناب برای اولین و بازیکن دوم، استراتژی های خالص بهینه را تشکیل می دهد. اگر در استراتژی های محض نقطه زین وجود نداشته باشد، در استراتژی های مختلط باید نقطه زینی پیدا کنیم که الزاماً طبق قضیه اصلی بازی های ماتریسی وجود دارد.

اجازه دهید به ترتیب با x = (x 1، x 2)، y = (y 1، y 2) استراتژی های ترکیبی بازیکنان اول و دوم را نشان دهیم. به یاد بیاورید که x 1 به معنای احتمال استفاده بازیکن اول از استراتژی اول است و x 2 = 1 - x 1 احتمال استفاده او از استراتژی دوم است. به طور مشابه برای بازیکن دوم: 1 احتمال استفاده او از استراتژی اول است، 2 = 1 - 1 احتمال استفاده او از استراتژی دوم است.

با توجه به نتیجه قضیه، برای بهینه بودن راهبردهای مختلط x و y، لازم و کافی است که برای غیرمنفی x 1، x 2، y 1، y 2 روابط زیر برقرار باشد:

اکنون اجازه دهید نشان دهیم که اگر یک بازی ماتریسی در استراتژی های خالص نقطه زینتی نداشته باشد، این نابرابری ها باید به برابری تبدیل شوند:

در واقع. اجازه دهید بازی در استراتژی های خالص نقطه زینتی نداشته باشد، سپس مقادیر بهینه استراتژی های ترکیبی نابرابری ها را برآورده می کند.

0<<1, 0<< 1,

0< <1, 01. (1.25)

اجازه دهید فرض کنیم که هر دو نابرابری از (1.22) دقیق هستند

سپس، طبق قضیه، y 1 = y 2 = 0، که با شرایط (1.25) در تضاد است.

به طور مشابه ثابت شده است که هر دو نابرابری از (1.23) نمی توانند نابرابری های دقیق باشند.

اکنون فرض می کنیم که یکی از نابرابری های (1.22) می تواند سخت باشد، برای مثال اولی

این بدان معنی است که طبق قضیه، y 1 = 0، y 2 = 1. در نتیجه از (1.23) بدست می آوریم

اگر هر دو نابرابری (1.24) سخت باشند، طبق قضیه، x 1 = x 2 = 0، که با (1.25) تناقض دارد. اگر 12 a 22 باشد، یکی از نابرابری ها (1.27) سخت است و دیگری برابری است. علاوه بر این، تساوی برای عنصر بزرگتر 12 و 22 برقرار است، یعنی یک نابرابری از (1.27) باید دقیق باشد. به عنوان مثال یک 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

بنابراین، نشان داده می شود که اگر یک بازی ماتریسی در استراتژی های خالص نقطه زینی نداشته باشد، برای استراتژی های بهینه بازیکن اول، نابرابری های (1.22) به برابری تبدیل می شوند. استدلال مشابه در مورد نابرابری ها (1.23) منجر به این واقعیت می شود که در این مورد نابرابری های (1.23) باید برابر باشند.

بنابراین، اگر یک بازی ماتریسی درجه 22 نقطه زینی نداشته باشد، استراتژی های ترکیبی بهینه بازیکنان و قیمت بازی را می توان با حل سیستم معادلات (1.24) تعیین کرد. همچنین مشخص شده است که اگر در یک بازی ماتریسی به ترتیب 2x2 یکی از بازیکنان یک استراتژی خالص بهینه داشته باشد، بازیکن دیگر نیز یک استراتژی خالص بهینه دارد.

در نتیجه، اگر یک بازی ماتریسی در استراتژی های خالص نقطه زینی نداشته باشد، باید در استراتژی های ترکیبی که از معادلات (1.24) تعیین می شود، راه حل داشته باشد. حل سیستم (1.25)

1.4 روش جبری

دو حالت ممکن برای حل مسائل با استفاده از روش جبری وجود دارد:

1. ماتریس یک نقطه زین دارد.

2. ماتریس نقطه زین ندارد.

در حالت اول، راه حل یک جفت استراتژی است که نقطه زین بازی را تشکیل می دهد. بیایید مورد دوم را در نظر بگیریم. راه حل ها را در اینجا باید در استراتژی های ترکیبی جستجو کرد:

بیایید راهبردها را پیدا کنیم و ... هنگامی که بازیکن اول از استراتژی بهینه خود استفاده می کند، بازیکن دوم می تواند برای مثال دو استراتژی ناب را اعمال کند

علاوه بر این، با توجه به ویژگی، اگر یکی از بازیکنان از یک استراتژی ترکیبی بهینه استفاده کند و دیگری از هر استراتژی خالصی که در استراتژی ترکیبی بهینه خود گنجانده شده است با احتمال صفر استفاده کند، انتظار ریاضی برنده شدن همیشه بدون تغییر و برابر باقی می‌ماند. به قیمت بازی، یعنی.

برد در هر یک از این موارد باید برابر با قیمت بازی V باشد. در این صورت روابط زیر معتبر است:

سیستمی از معادلات مشابه (2.5)، (2.6) را می توان برای استراتژی بهینه بازیکن دوم ساخت:

با در نظر گرفتن شرایط عادی سازی:

بیایید معادله (1.37) - (1.41) را با توجه به مجهولات حل کنیم، شما می توانید نه همه را در یک زمان، بلکه سه را در یک زمان حل کنید: جداگانه (1.36)، (1.38)، (1.40) و (1.37)، ( 1.39)، (1.41). در نتیجه راه حل به دست می آوریم:

1.5 روش گرافیکی

یک راه حل تقریبی برای بازی 22 را می توان به سادگی با استفاده از روش گرافیکی به دست آورد. ماهیت آن به شرح زیر است:

شکل 1.1 - یافتن مقطعی از طول واحد

بخشی از طول واحد را در محور x انتخاب کنید. انتهای سمت چپ آن اولین استراتژی بازیکن اول را به تصویر می کشد و انتهای سمت راست نشان دهنده دومین است. تمام نقاط میانی مربوط به استراتژی های ترکیبی بازیکن اول است و طول قسمت سمت راست نقطه برابر با احتمال استفاده از استراتژی اول است و طول بخش سمت چپ احتمال استفاده از آن است. استراتژی دوم توسط بازیکن اول.

دو محور I-I و II-II ترسیم شده است. زمانی که بازیکن اول از استراتژی اول استفاده می کند، برنده ها را روی I-I قرار می دهیم، زمانی که از استراتژی دوم استفاده می کند روی II-II. به عنوان مثال، اجازه دهید بازیکن دوم اولین استراتژی خود را اعمال کند، سپس مقدار باید روی محور I-I رسم شود و مقدار باید روی محور II-II ترسیم شود.

برای هر استراتژی ترکیبی بازیکن اول، بازده او بر اساس ارزش بخش تعیین می شود. خط I-I مربوط به استفاده از استراتژی اول توسط بازیکن دوم است. به طور مشابه، می توانید استراتژی دوم بازیکن دوم را بسازید. سپس به طور کلی نمایش گرافیکی ماتریس بازی به شکل زیر خواهد بود:

شکل 1.2 - یافتن قیمت بازی

البته لازم به ذکر است که این ساخت و ساز برای بازیکن اول انجام شده است. در اینجا طول بخش برابر با قیمت بازی V است.

خط 1N2 حد برنده پایینی نامیده می شود. در اینجا به وضوح می توانید ببینید که نقطه N مربوط به حداکثر مقدار برد تضمین شده بازیکن اول است.

به طور کلی، استراتژی بازیکن دوم را نیز می توان از این شکل مشخص کرد، برای مثال به روش های زیر. در محور I-I:

یا در محور II-II

با این حال، استراتژی بازیکن دوم را می توان به طور مشابه با نحوه انجام آن برای بازیکن اول تعیین کرد، یعنی. چنین نموداری بسازید

شکل 1.3 - تعیین استراتژی بازیکن دوم

در اینجا خط 1N2 حد بالایی ضرر است. نقطه N مربوط به حداقل باخت احتمالی بازیکن دوم است و استراتژی را تعیین می کند.

بسته به مقادیر خاص ضرایب ماتریس، نمودارها ممکن است شکل متفاوتی داشته باشند، به عنوان مثال:

شکل 1.4 - استراتژی بهینه بازیکن اول را تعیین می کند

در چنین شرایطی، استراتژی بهینه بازیکن اول خالص است:

1.6 بازی 2n یا m2

در بازی های مرتبه 2n، بازیکن اول 2 استراتژی خالص دارد و بازیکن دوم n استراتژی خالص دارد، یعنی. ماتریس پرداخت بازیکن اول به شکل زیر است:

اگر چنین بازی نقطه زینی داشته باشد، پیدا کردن آن و به دست آوردن راه حل آسان است.

بیایید فرض کنیم که بازی دارای نقاط زینتی است. سپس باید چنین استراتژی های ترکیبی و بر این اساس، بازیکن اول و دوم و قیمت بازی v را پیدا کرد که روابط را برآورده می کند:

از آنجایی که بازی نقطه زینی ندارد، نابرابری (1.54) با نابرابری ها جایگزین می شود.

برای حل سیستم های (1.56)، (1.55)، (1.53)، توصیه می شود از روش گرافیکی استفاده کنید. برای این منظور، نماد سمت چپ نابرابری (1.53) را معرفی می کنیم.

مدل ریاضی بازی ماتریسی

یا با قرار دادن از (1.55) و انجام تبدیل های ساده، به دست می آوریم

میانگین بازده بازیکن اول کجاست، مشروط بر اینکه از استراتژی ترکیبی خود استفاده کند، و دومی از استراتژی خالص j ام استفاده کند.

با توجه به عبارت، هر مقدار j=1، 2، …، n مربوط به یک خط مستقیم در یک سیستم مختصات مستطیلی است.

هدف بازیکن دوم این است که با انتخاب استراتژی های بازیکن اول، بردهای بازیکن اول را به حداقل برساند. بنابراین ما محاسبه می کنیم

حد پایین مجموعه محدودیت ها کجاست. در شکل 1.6 نمودار تابع با یک خط ضخیم نشان داده شده است.

ارسال شده در http://www.allbest.ru/

شکل 1.6 - نمودار تابع

هدف بازیکن اول این است که برد خود را از طریق انتخاب به حداکثر برساند، یعنی. محاسبه

در شکل 1.6، نقطه به معنای حداکثر مقداری است که در آن به دست می آید. قیمت بازی به این دلیل است که:

به این ترتیب استراتژی ترکیبی بهینه بازیکن اول و یک جفت استراتژی خالص بازیکن دوم به صورت گرافیکی تعیین می شود که در شکل 1.6 استراتژی های 2 و 3 بازیکن دوم را نشان می دهد. برای چنین استراتژی هایی، نابرابری (1.53) به برابری تبدیل می شود. در شکل 1.6 اینها استراتژی های j=2، j=3 هستند.

اکنون می توانیم سیستم معادلات را حل کنیم

و مقادیر و را دقیقاً تعیین کنید (از نظر گرافیکی تقریباً تعیین می شوند). سپس، با قرار دادن تمام مقادیر برای آن j هایی که برای آنها نقطه تشکیل نمی دهند، سیستم معادلات (1.56) حل می شود. برای مثال نشان داده شده در شکل 1.6، این سیستم زیر است:

و بقیه این سیستم را می توان با شیب حل کرد اگر برای برخی j=j 0 استراتژی های بازیکن دوم یک نقطه M 0 را تشکیل دهند و سپس حداکثر مقدار مرز پایینی مجموعه محدودیت ها توسط یک قطعه موازی به تصویر کشیده شود. axis در این حالت، بازیکن اول دارای مقادیر بهینه بی نهایت زیادی است و قیمت بازی این مورد در شکل 1.7 نشان داده شده است، جایی که بخش MN محدوده های بالایی را نشان می دهد، مقادیر بهینه در محدوده بازیکنان دوم هستند. یک استراتژی بهینه خالص دارد j=j 0 .

بازی های ماتریسی به ترتیب m2 نیز با استفاده از روش گرافیکی قابل حل هستند. ماتریس پرداخت اولین بازیکن در این مورد دارای فرم است

استراتژی های ترکیبی بازیکنان اول و دوم به ترتیب مشابه بازی های درجه 2n تعریف شده است. اجازه دهید مقدار 0 تا 1 در امتداد محور افقی ترسیم شود، و مقدار میانگین برد) بازیکن اول در امتداد محور عمودی، در شرایطی که بازیکن اول استراتژی i-ام خالص خود را اعمال کند (i=1، 2، ...، m)، دوم - استراتژی مختلط او (y 1، 1- y 1) =y. به عنوان مثال، زمانی که m=4 به صورت گرافیکی) می تواند همانطور که در شکل 1.7 نشان داده شده است، ارائه شود.

شکل 1.7 - نمودار تابع)

بازیکن اول سعی می کند میانگین سود خود را به حداکثر برساند، بنابراین تلاش می کند تا پیدا کند

این تابع با یک خط ضخیم نشان داده می شود و کران بالایی مجموعه ای از محدودیت ها را نشان می دهد. بازیکن دوم سعی می کند با انتخاب استراتژی خود را به حداقل برساند. مقدار مطابقت دارد

در شکل، مقدار با یک نقطه نشان داده شده است. به عبارت دیگر، دو استراتژی بازیکن اول و احتمال بازیکن دوم تعیین می شود که در آن برابری حاصل شود.

از شکل می بینیم که قیمت بازی ترتیب نقطه است، احتمال آبسیسا نقطه است. برای استراتژی های خالص باقی مانده از اولین بازیکن در استراتژی ترکیبی بهینه باید ().

بنابراین با حل سیستم (1.69) استراتژی بهینه بازیکن دوم و قیمت بازی را بدست می آوریم. با حل سیستم معادلات زیر، استراتژی ترکیبی بهینه را برای اولین بازیکن پیدا می کنیم:

1.7 روش ماتریسی برای حل بازی

نام گذاری ها:

هر زیرماتریس مربعی از ماتریس سفارش

ماتریس (1);

ماتریس منتقل شده به;

ماتریس مجاور B;

- (1) ماتریسی به دست آمده از X با حذف عناصری که مربوط به ردیف های حذف شده از هنگام دریافت است.

- (1) ماتریسی که با حذف عناصری که مربوط به ردیف های حذف شده از هنگام دریافت است، به دست می آید.

الگوریتم:

1. یک زیرماتریس مربعی از ماتریس مرتبه () انتخاب کنید و محاسبه کنید

2. اگر مقداری یا، ماتریس پیدا شده را دور بیندازید و ماتریس دیگری را امتحان کنید.

3. اگر ()، ()، X و از و با جمع صفر در جاهای مناسب محاسبه و می سازیم.

بررسی اینکه آیا نابرابری ها برآورده شده اند یا خیر

برای همه (1.75)

و نابرابری ها

برای همه (1.76)

اگر یکی از رابطه ها راضی نشد، دیگری را امتحان می کنیم. اگر همه روابط معتبر هستند، X و راه حل های مورد نیاز.

1.8 روش تقریب متوالی قیمت بازی

هنگام مطالعه موقعیت های بازی، اغلب ممکن است اتفاق بیفتد که نیازی به دستیابی به یک راه حل دقیق برای بازی نباشد یا به دلایلی، یافتن ارزش دقیق قیمت بازی و استراتژی های ترکیبی بهینه غیرممکن یا بسیار دشوار باشد. سپس می توانید از روش های تقریبی برای حل یک بازی ماتریسی استفاده کنید.

اجازه دهید یکی از این روش ها را شرح دهیم - روش تقریبی متوالی قیمت یک بازی. تعداد محاسبات هنگام استفاده از روش تقریباً متناسب با تعداد سطرها و ستون‌های ماتریس پرداخت افزایش می‌یابد.

ماهیت روش به شرح زیر است: بازی بارها به صورت ذهنی انجام می شود، یعنی. به طور متوالی، در هر بازی، بازیکن استراتژی را انتخاب می کند که بیشترین برد کلی (کل) را به او می دهد.

پس از اجرای چنین بازی هایی، میانگین مقدار برد بازیکن اول و باخت بازیکن دوم محاسبه می شود و میانگین حسابی آنها به عنوان مقدار تقریبی هزینه بازی در نظر گرفته می شود. این روش امکان یافتن مقدار تقریبی استراتژی های ترکیبی بهینه هر دو بازیکن را فراهم می کند: لازم است فرکانس اعمال هر استراتژی خالص را محاسبه کرده و آن را به عنوان یک مقدار تقریبی در استراتژی ترکیبی بهینه بازیکن مربوطه در نظر بگیریم.

می توان ثابت کرد که با افزایش نامحدود تعداد بازی های برنامه ای، میانگین سود بازیکن اول و میانگین ضرر بازیکن دوم به طور نامحدود به قیمت بازی نزدیک می شود و مقادیر تقریبی استراتژی های ترکیبی در در صورتی که بازی دارای یک راه حل منحصر به فرد باشد، به استراتژی های ترکیبی بهینه هر بازیکن تمایل دارد. به طور کلی، تمایل مقادیر تقریبی بالاتر از مقادیر مشخص شده برای نزدیک شدن به مقادیر واقعی کند است. با این حال، این فرآیند به راحتی مکانیزه می شود و در نتیجه به دستیابی به راه حلی برای بازی با درجه دقت مورد نیاز حتی با ماتریس های سود نسبتاً بزرگ کمک می کند.

2. بخش عملی

این زوج تصمیم می گیرند که کجا برای پیاده روی بروند و زمان مفیدی را برای هر دو سپری کنند.

دختر تصمیم می گیرد برای گرفتن هوای تازه در پارک قدم بزند و عصر برای تماشای فیلم در نزدیکترین سینما.

آن مرد پیشنهاد می کند که به پارک فناوری بروید و سپس مسابقه بازیکنان فوتبال محلی باشگاه را در استادیوم مرکزی تماشا کنید.

مطابق با این، شما باید دریابید که چقدر طول می کشد تا به هدف یکی از بازیکنان برسید. ماتریس برنده به شکل زیر خواهد بود:

جدول 1. ماتریس سود

استراتژی ها

از 1 2 بدیهی است که این بازی در استراتژی های خالص نقطه زینتی ندارد. بنابراین از فرمول های زیر استفاده می کنیم و بدست می آوریم:

ارسال شده در http://www.allbest.ru/

2.2 بازی 2xn و mx2

مسئله 1 (2xn)

دو محصول غلات برای آب و هوای خشک و مرطوب کشت می شود.

و حالت طبیعت را می توان به صورت: خشک، مرطوب، معتدل در نظر گرفت.

ارسال شده در http://www.allbest.ru/

حداکثر مقدار M() در نقطه M حاصل می شود که از تقاطع خطوط مربوط به j=1، j"=2 تشکیل می شود. بر این اساس، فرض می کنیم:

مسئله 2 (mx2)

یک پسر و یک دختر در حال بررسی گزینه هایی هستند که برای آخر هفته کجا بروند.

انتخاب یک مکان تعطیلات را می توان اینگونه در نظر گرفت: پارک، سینما، رستوران.

ارسال شده در http://www.allbest.ru/

حداکثر مقدار M() در نقطه E به دست می آید که از تقاطع خطوط مربوط به j=1، j"=2 تشکیل شده است. بر این اساس، فرض می کنیم:

برای تعیین مقدار v باید معادلات زیر حل شوند:

2.5 روش ماتریسی

دو رستوران (مؤسسه پذیرایی) که با یکدیگر رقابت می کنند، مجموعه خدمات زیر را ارائه می دهند. اولین رستوران در مرکز و دیگری در حومه شهر واقع شده است.

رستوران مرکزی شامل خدمات زیر می باشد:

1) خدمات مشتری گران تر و با کیفیت تر؛

2) غذاها روی غذاهای فرانسوی متمرکز شده اند.

رستوران دوم ارائه می دهد:

1) خدمات ارزان و با کیفیت بالا؛

2) منو ترکیبی از غذاهای مختلف معروف جهان است.

3) همچنین تبلیغات و تخفیف های ثابت؛

4) تحویل و پذیرش سفارشات برای تحویل درب منزل.

بر اساس تکلیف، سود یک روزه بین دو رستوران به شرح زیر تقسیم می شود:

جدول 2. ماتریس سود

استراتژی ها

حل یک بازی از فرم با استفاده از روش ماتریس:

شش زیر ماتریس وجود دارد و:

ماتریس را در نظر بگیرید:

x 1 = 0، x 2 = ? 0

از آنجایی که x 2 =< 0, то мы отбрасываем.

حال بیایید ماتریس را در نظر بگیریم:

x 1 = 0، x 2 = ? 0

قیمت بازی.

این نسبت مغایر با الزام است و بنابراین مناسب نیست.

حال بیایید ماتریس را در نظر بگیریم:

x 1 = , x 2 = ? 0،

y 1 =< 0, y 2 = ? 0.

از آنجایی که y 1 =< 0, то мы отбрасываем и.

حال بیایید ماتریس را در نظر بگیریم:

x 1 =، x 2 = 0، از آنجایی که x 2 = 0، سپس ما و.

حال بیایید ماتریس را در نظر بگیریم:

x 1 = , x 2 = ? 0. از آنجایی که x 1 = 0، ما و.

حال بیایید ماتریس را در نظر بگیریم:

x 1 =، x 2 =، y 1 =، y 2 =، سپس ادامه می دهیم:

x 1 = , x 2 = , y 1 = , y 2 = یا

قیمت بازی.

اکنون روابط اصلی بررسی می شوند:

ارسال شده در http://www.allbest.ru/

پاسخ: x 1 = ، x 2 = ، y 1 = ، y 2 = ، y 3 = 0 ، y 4 = 0 ،.

روش قهوه ای

به درخواست کارگران یک شرکت خاص، اتحادیه با مدیریت خود در مورد برگزاری ناهار گرم با هزینه شرکت مذاکره می کند. اتحادیه ای که نماینده کارگران است می خواهد اطمینان حاصل کند که ناهار تا حد امکان با کیفیت و در نتیجه گران تر است. مدیریت شرکت دارای منافع متضادی است. در پایان طرفین در موارد زیر به توافق رسیدند. اتحادیه کارگری (بازیکن 1) یکی از سه شرکت (A 1، A 2، A 3) را انتخاب می کند که غذای گرم عرضه می کنند، و مدیریت شرکت (بازیکن 2) مجموعه ای از ظروف را از بین سه گزینه ممکن (B 1، B 2) انتخاب می کند. ، ب 3). پس از امضای قرارداد، اتحادیه ماتریس پرداخت زیر را ایجاد می کند که عناصر آن هزینه مجموعه ای از ظروف را نشان می دهد:

اجازه دهید بازی با ماتریس سود زیر تعریف شود:

فرض کنید بازیکن دوم استراتژی دوم خود را انتخاب کرده است، سپس بازیکن اول دریافت خواهد کرد:

2، اگر از استراتژی اول خود استفاده کند،

3 اگر از استراتژی سوم خود استفاده کند.

مقادیر به دست آمده در جدول 1 خلاصه شده است.

جدول 3. استراتژی بازیکن دوم

شماره دسته

استراتژی بازیکن 2

برد بازیکن اول

از جدول 3 می توان دریافت که با استراتژی دوم بازیکن دوم، نفر اول با استفاده از استراتژی دوم یا سوم خود، بیشترین بازده 3 را دریافت می کند. از آنجایی که بازیکن اول می خواهد حداکثر برد را به دست آورد، به استراتژی دوم بازیکن دوم با استراتژی دوم خود پاسخ می دهد. با استراتژی دوم بازیکن اول، نفر دوم بازنده خواهد شد:

1 اگر از استراتژی اول خود استفاده کند،

3، اگر از استراتژی دوم خود استفاده کند،

4 اگر از استراتژی سوم خود استفاده کند.

جدول 4. استراتژی بازیکن اول

شماره دسته

استراتژی بازیکن اول

بازیکن دوم باخت

از جدول 2 می توان دریافت که با استراتژی 2 بازیکن اول، بازیکن دوم در صورت اعمال استراتژی 1 خود، کمترین باخت 1 را خواهد داشت. از آنجایی که بازیکن دوم می خواهد کمتر ببازد، در پاسخ به استراتژی دوم بازیکن اول، از استراتژی اول خود استفاده می کند. نتایج به دست آمده در جدول 5 خلاصه شده است.

جدول 5. استراتژی های بازیکنان اول و دوم به ترتیب

شماره دسته

استراتژی بازیکن 2

مجموع بردهای بازیکن اول

استراتژی بازیکن اول

روی میز 5 در ستون استراتژی بازیکن دوم در خط دوم عدد 1 وجود دارد که نشان می دهد در بازی دوم برای بازیکن دوم سودمند است که از استراتژی اول خود استفاده کند. در ستون بزرگترین میانگین برد 3 بازیکن اول است که توسط او در بازی اول دریافت شده است. ستون w حاوی کمترین میانگین ضرر 1 است که توسط بازیکن دوم در بازی اول دریافت شده است. ستون v حاوی میانگین حسابی v = (u + w) است - یعنی مقدار تقریبی قیمت بازی که در نتیجه باخت یک بازی از بازی به دست می آید. اگر بازیکن دوم استراتژی اول خود را اعمال کند، نفر اول به ترتیب 3، 1، 2 با استراتژی های 1، 2، 3 خود دریافت می کند و مجموع بردهای بازیکن اول برای هر دو بازی خواهد بود:

2 + 3=5 با اولین استراتژی خود،

3 + 1=4 با استراتژی دوم خود،

3 + 2=5 با استراتژی سوم خود.

این کل بردها در ردیف دوم جدول ثبت می شود. 3 و در ستون های مربوط به استراتژی های بازیکن اول: 1، 2، 3.

از مجموع کل بردها، بزرگترین آنها 5 است. با استراتژی های 1 و 3 بازیکن اول به دست می آید، سپس او می تواند هر یک از آنها را انتخاب کند. فرض کنید، در چنین مواردی، زمانی که دو (یا چند) برد کل یکسان وجود دارد، استراتژی را با کمترین تعداد انتخاب کنید (در مورد ما، ما باید استراتژی اول را انتخاب کنیم).

با استراتژی اول بازیکن اول، نفر دوم به ترتیب 3، 2، 3 به استراتژی های 1، 2، 3 خود می بازد و مجموع باخت بازیکن دوم برای هر دو بازی خواهد بود:

1 + 3 = 4 با اولین استراتژی خود،

3 + 2 = 5 با استراتژی دوم خود،

4 + 3=7 با استراتژی سوم خود.

مجموع این ضررها در ردیف دوم جدول ثبت شده است. 5 و در ستون های مربوط به استراتژی های 1، 2، 3 بازیکن دوم.

از مجموع باخت های بازیکن دوم، کوچکترین آن 4 است. با استراتژی اول او به دست می آید، بنابراین، در بازی سوم، بازیکن دوم باید استراتژی اول خود را اعمال کند. بزرگترین کل بردهای بازیکن اول در دو بازی تقسیم بر تعداد بازی ها در ستون قرار می گیرد، یعنی؛ ستون w شامل کوچکترین باخت بازیکن دوم در دو بازی است که بر تعداد بازی ها تقسیم می شود. در ستون V میانگین حسابی این مقادیر قرار داده شده است، یعنی = این عدد به عنوان مقدار تقریبی قیمت بازی با دو بازی "بازی شده" در نظر گرفته می شود.

بدین ترتیب جدول 4 زیر برای دو بازی بدست می آید.

جدول 6. مجموع برد و باخت بازیکنان پس از دو بازی انجام شده

استراتژی بازیکن 2

مجموع بردهای بازیکن اول

استراتژی بازیکن اول

باخت کل بازیکن دوم

در ردیف سوم جدول 6 در ستون استراتژی بازیکن دوم عدد 1 وجود دارد که نشان می دهد در بازی سوم بازیکن دوم باید اولین استراتژی خود را اعمال کند. در این صورت، بازیکن اول با استفاده از استراتژی های اول، دوم و سوم خود به ترتیب 3، 1، 2 برنده می شود و مجموع بردهای او در سه بازی عبارتند از:

3 + 5 = 8 با اولین استراتژی خود،

1 + 4 = 5 با استراتژی دوم خود،

2 + 5 = 7 با استراتژی سوم خود.

این مجموع بردهای بازیکن اول در ردیف سوم جدول 6 و ستون های مربوط به استراتژی های او 1، 2، 3 ثبت می شود. از آنجایی که بیشترین تعداد برد 8 بازیکن اول با استراتژی اول به دست می آید، نفر اول انتخاب می شود. بر این اساس.

با استراتژی اول بازیکن اول، نفر دوم به ترتیب 3، 1، 2 به استراتژی های 1، 2، 3 خود می بازد و مجموع باخت بازیکن دوم برای هر دو بازی خواهد بود:

3 + 4 = 7 با اولین استراتژی خود،

2 + 5 = 7 با استراتژی دوم خود،

3 + 7 = 10 با استراتژی سوم او.

مجموع این ضررها در سطر سوم جدول ثبت شده است. 6 و در ستون های مربوط به استراتژی های 1، 2، 3 بازیکن دوم. از مجموع باخت های او، 7 کوچکترین است و با استراتژی های 1 و 2 به دست می آید، سپس بازیکن دوم باید استراتژی 1 خود را اعمال کند.

روی میز 6 در خط سوم در ستون و بزرگترین کل بردهای بازیکن اول را در سه بازی ثبت می کند، تقسیم بر تعداد بازی، یعنی؛ در ستون w کوچکترین باخت کل بازیکن دوم در طول سه بازی، تقسیم بر تعداد بازی، قرار می گیرد، یعنی؛ ستون v حاوی میانگین حسابی آنهاست

بنابراین ما جدول را دریافت می کنیم. 7 برای سه بازی.

جدول 7. مجموع برد و باخت بازیکنان پس از سه بازی انجام شده

شماره دسته

استراتژی بازیکن 2

مجموع بردهای بازیکن اول

استراتژی بازیکن اول

باخت کل بازیکن دوم

جدول 8. جدول نهایی پس از بیست بازی انجام شده

شماره دسته

استراتژی بازیکن 2

مجموع بردهای بازیکن اول

استراتژی بازیکن اول

باخت کل بازیکن دوم

از روی میز 7 و 8 مشاهده می شود که در 20 بازی شکست خورده، استراتژی های 1، 2، 3 برای بازیکن اول به ترتیب 12، 3، 5 بار اتفاق می افتد، بنابراین، فرکانس نسبی آنها به ترتیب برابر است. استراتژی های 1، 2، 3 برای بازیکن دوم به ترتیب 7، 11،2 بار اتفاق می افتد، بنابراین فرکانس های نسبی آنها به ترتیب برابر است. قیمت تقریبی بازی این تقریب بسیار خوب است.

در نهایت، توجه داشته باشید که اگر یک بازی بیش از یک راه حل داشته باشد، آنگاه تقریب های هزینه بازی همچنان به طور نامحدود به هزینه واقعی بازی تقریب می زند و فرکانس های نسبی استراتژی های بازیکنان دیگر لزوماً بهینه ترکیبی واقعی بازیکنان را تقریب نمی کند. استراتژی ها.

تجزیه و تحلیل نتایج

در این دوره، مطالب یافتن راه حل بازی های حاصل جمع صفر را با استفاده از روش گرافیکی، ماتریسی و روش تقریب متوالی قیمت بازی مطالعه کردیم. استراتژی های بهینه بازیکنان اول و دوم و همچنین هزینه بازی در بازی های 2x2، 2xn و mx2 و همچنین در بازی های به روش ماتریس و روش براون یافت شد.

با استفاده از مثال یک زوج، یک بازی 2*2 شبیه سازی شد که با استفاده از روش های جبری و گرافیکی حل شد. با حل جبری بازی، راه حل نشان می دهد که با استفاده از استراتژی های ترکیبی بهینه خود، بازیکنان اول و دوم 4.6 ساعت را با هم سپری می کنند. حل گرافیکی مشکل با یک خطای کوچک به دست آمد و به 4.5 ساعت رسید.

و همچنین دو مشکل 2xn و mx2 شبیه سازی شد. در مسئله 2xn یک محصول کشاورزی در نظر گرفته شد و استراتژی نشان می دهد که بهتر است یک مزرعه 50 تا 50 کاشته شود و قیمت بازی 3.75 میلیون روبل بود. و در مسئله mx2 زوجی در نظر گرفته شد که استراتژی آنها نشان می داد که رفتن به پارک و سینما ارزان تر است و هزینه آن 4.3 روبل خواهد بود.

یک مسئله برای روش ماتریسی مدل شد که در آن دو رستوران در نظر گرفته شد، حل مسئله نشان داد که هنگام استفاده از استراتژی ترکیبی بهینه آن، سود اولین رستوران 15.6 میلیون روبل خواهد بود و هنگام استفاده از استراتژی ترکیبی بهینه آن توسط رستوران دوم، اجازه نمی دهد که اولی بیش از 15.6 میلیون روبل کسب کند. راه حل گرافیکی منجر به خطا شد و قیمت بازی 14.9 میلیون روبل بود.

برای روش براون، وظیفه ای تنظیم شد که در آن اتحادیه کارگری و مدیریت شرکت در نظر گرفته می شود، وظیفه آنها تامین غذا برای کارگران است. اگر هر دو بازیکن از استراتژی های بهینه خود استفاده کنند، غذا برای هر نفر 2.45 هزار روبل خواهد بود.

فهرست منابع استفاده شده

1) Vilisov V.Ya. یادداشت های سخنرانی "تئوری بازی ها و تصمیمات آماری"، - شعبه - "وسخود" MAI. 1979. 146 ص.

2) Krushevsky A.V. نظریه بازی، - کیف: مدرسه ویشچا، 1977. - 216 ص.

3) Churchmen U., Akof R., Arnof L., Introduction to Operation Research. - م.: علم. 1967. - 488 ص.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0 %B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

ارسال شده در Allbest.ru

اسناد مشابه

    تصمیم گیری به عنوان نوع خاصی از فعالیت های انسانی. نمایش منطقی ماتریس بازی. نمونه هایی از بازی های ماتریسی در استراتژی های خالص و ترکیبی. تحقیق در عملیات: رابطه بین مسائل برنامه ریزی خطی و مدل نظری بازی.

    کار دوره، اضافه شده 05/05/2010

    بازی هایی که بارها تکرار می شوند، ویژگی ها و مراحل متمایز آنها. استراتژی های ترکیبی، شرایط و امکانات استفاده از آنها در عمل. روش تحلیلی برای حل یک بازی از نوع 2 x 2. قضایای اساسی برای بازی های مستطیلی. راه حل های جبری

    ارائه، اضافه شده در 10/23/2013

    تعاریف اساسی تئوری بازی های دوماتریسی. نمونه ای از بازی دوماتریسی "دانش آموز-معلم". استراتژی های ترکیبی در بازی های دو ماتریکس «وضعیت تعادل» را جستجو کنید. بازی‌ها و فرمول‌های دو ماتریکس ۲×۲ برای مواردی که هر بازیکن دو استراتژی دارد.

    چکیده، اضافه شده در 1390/02/13

    اطلاعات کلی در مورد بازی های ماتریسی و مجموع صفر بیاموزید. مفهوم بازی موضعی، درخت، مجموعه اطلاعات. در نظر گرفتن اصل ماکسیمین و اصل تعادل. بهینه پارتو بازی موقعیتی غیر متضاد، ویژگی های آن.

    کار دوره، اضافه شده در 10/17/2014

    نظریه بازی ها شاخه ای از ریاضیات است که موضوع آن مطالعه مدل های ریاضی برای تصمیم گیری بهینه در شرایط تعارض است. روش تکراری براون-رابینسون. یک الگوریتم تکراری یکنواخت برای حل بازی های ماتریسی.

    پایان نامه، اضافه شده 08/08/2007

    ترسیم ماتریس پرداخت، جست و جوی قیمت خالص پایین و بالای بازی، استراتژی های حداکثر و حداقل بازیکنان. ساده سازی ماتریس پرداخت حل یک بازی ماتریسی با استفاده از کاهش به یک مسئله برنامه نویسی خطی و افزونه "جستجوی راه حل".

    تست، اضافه شده در 11/10/2014

    نظریه بازی ها یک نظریه ریاضی از موقعیت های تعارض است. توسعه مدل ریاضی بازی دو نفره با جمع صفر، اجرای آن در قالب کدهای برنامه. روشی برای حل مسئله. داده های ورودی و خروجی برنامه، راهنمای کاربر.

    کار دوره، اضافه شده در 2013/08/17

    اطلاعات اولیه در مورد روش سیمپلکس، ارزیابی نقش و اهمیت آن در برنامه ریزی خطی. تفسیر هندسی و معنای جبری. یافتن حداکثر و حداقل یک تابع خطی، موارد خاص. حل مسئله با استفاده از روش ماتریس سیمپلکس.

    پایان نامه، اضافه شده در 2015/06/01

    تکنیک هایی برای ساخت مدل های ریاضی سیستم های کامپیوتری که ساختار و فرآیندهای عملکرد آنها را منعکس می کند. تعداد دسترسی به فایل در فرآیند حل یک مشکل متوسط. تعیین امکان قرار دادن فایل ها در درایوهای حافظه خارجی.

    کار آزمایشگاهی، اضافه شده در 2013/06/21

    طراحی یک مدل ریاضی. توضیحات بازی تیک تاک پا. مدل یک بازی منطقی بر اساس جبر بولی. دستگاه های الکترونیکی دیجیتال و توسعه مدل ریاضی آنها. کنسول بازی، کنترلر بازی، خط زمین بازی.

یک بازی جفت مجموع صفر محدود را در نظر بگیرید. اجازه دهید با نشان دادن آبردهای بازیکن آ، و از طریق ب- بردهای بازیکن ب. زیرا آ = –ب، پس هنگام تجزیه و تحلیل چنین بازی نیازی به در نظر گرفتن هر دوی این اعداد نیست - کافی است بردهای یکی از بازیکنان را در نظر بگیرید. بگذارید مثلاً آ. در ادامه برای سهولت ارائه، آما به طور متعارف تماس خواهیم گرفت " ما"و طرف ب – "دشمن".

بگذارید داشته باشیم متراستراتژی های ممکن آ 1 , آ 2 , …, صبح، و دشمن nاستراتژی های ممکن ب 1 , ب 2 , …, Bn(چنین بازی را بازی می نامند m×n). بیایید فرض کنیم که هر طرف استراتژی خاصی را انتخاب کرده است: ما انتخاب کرده ایم یک آی، حریف B j. اگر بازی فقط از حرکات شخصی تشکیل شده باشد، پس انتخاب استراتژی یک آیو B jبه طور منحصر به فرد نتیجه بازی - بردهای ما (مثبت یا منفی) را تعیین می کند. اجازه دهید این سود را با علامت گذاری کنیم یک ij(منفعت زمانی که ما یک استراتژی را انتخاب می کنیم یک آیو دشمن - استراتژی ها B j).

اگر بازی علاوه بر حرکات شخصی، تصادفی باشد، با یک جفت استراتژی، برنده شوید. یک آی, B jیک مقدار تصادفی بسته به نتایج تمام حرکات تصادفی است. در این مورد، یک برآورد طبیعی از بازده مورد انتظار است انتظارات ریاضی یک برد تصادفی. برای راحتی، ما با نشان دادن یک ijهم خود برد (در یک بازی بدون حرکات تصادفی) و هم انتظار ریاضی آن (در یک بازی با حرکات تصادفی).

بیایید فرض کنیم که ارزش ها را می دانیم یک ijبرای هر جفت استراتژی این مقادیر را می توان به صورت یک ماتریس نوشت که ردیف های آن با استراتژی های ما مطابقت دارد ( یک آیو ستون ها - استراتژی های دشمن ( B j):

B j A i ب 1 ب 2 Bn
آ 1 آ 11 آ 12 آ 1n
آ 2 آ 21 آ 22 آ 2n
صبح صبح 1 صبح 2 یک دقیقه

چنین ماتریسی نامیده می شود ماتریس پرداخت بازییا به سادگی ماتریس بازی.

توجه داشته باشید که ساخت ماتریس بازده برای بازی هایی با تعداد زیادی استراتژی می تواند کار دشواری باشد. به عنوان مثال، برای یک بازی شطرنج، تعداد استراتژی های ممکن آنقدر زیاد است که ساخت ماتریس بازده عملا غیرممکن است. با این حال، در اصل، هر بازی متناهی را می توان به شکل ماتریسی تقلیل داد.

در نظر بگیریم مثال 1بازی متضاد 4x5. ما چهار راهبرد در اختیار داریم، دشمن پنج راهبرد دارد. ماتریس بازی به شرح زیر است:

B j A i ب 1 ب 2 ب 3 ب 4 ب 5
آ 1
آ 2
آ 3
آ 4

چه استراتژی باید (یعنی بازیکن آ) استفاده کنید؟ هر استراتژی که انتخاب کنیم، یک حریف باهوش با استراتژی پاسخ می‌دهد که بازده ما حداقل خواهد بود. مثلا اگر استراتژی را انتخاب کنیم آ 3 (وسوسه شده با بردن 10)، حریف با انتخاب یک استراتژی پاسخ خواهد داد ب 1، و سود ما فقط 1 خواهد بود. بدیهی است که بر اساس اصل احتیاط (و این اصل اساسی تئوری بازی است) باید استراتژی را انتخاب کنیم که در آن حداقل برد ما حداکثر است.

اجازه دهید با نشان دادن α iحداقل ارزش برنده برای استراتژی یک آی:

و یک ستون حاوی این مقادیر را به ماتریس بازی اضافه کنید:

B j A i ب 1 ب 2 ب 3 ب 4 ب 5 حداقل در خطوط α i
آ 1
آ 2
آ 3
آ 4 حداکثر

هنگام انتخاب یک استراتژی، باید استراتژی را ترجیح دهیم که برای آن ارزش دارد α iبیشترین. اجازه دهید این مقدار حداکثر را با نشان دهیم α :

اندازه α تماس گرفت قیمت پایین بازییا حداکثر(حداکثر حداقل برد). استراتژی بازیکن آ، مربوط به ماکسیمین α ، تماس گرفت استراتژی حداکثر.

در این مثال، maximin α برابر با 3 است (سلول مربوطه در جدول به رنگ خاکستری مشخص شده است) و استراتژی حداکثر آ 4 . با انتخاب این استراتژی، می‌توانیم مطمئن باشیم که برای هر رفتاری از دشمن، کمتر از 3 برنده نمی‌شویم (و شاید بیشتر اگر رفتار دشمن «غیر معقول» باشد، این مقدار حداقل تضمین شده ماست که می‌توانیم آن را برای خودمان تضمین کنیم با پیروی از محتاطانه ترین استراتژی ("بیمه اتکایی").

حال بیایید استدلال مشابهی را برای دشمن انجام دهیم ب ب آ ب 2- به او پاسخ می دهیم آ .

اجازه دهید با نشان دادن β j آ ب) برای استراتژی یک آی:



β j β :

7. آنچه به آن بازی با ارزش برتر می گویند حالا بیایید استدلال مشابهی را برای حریف انجام دهیم ب. او علاقه دارد بردهای ما را به حداقل برساند، یعنی کمتر به ما بدهد، اما باید روی بدترین رفتار ما برای او حساب باز کند. مثلاً اگر استراتژی را انتخاب کند ب 1، سپس با یک استراتژی به او پاسخ خواهیم داد آ 3 و او به ما 10 می دهد. اگر او انتخاب کند ب 2- به او پاسخ می دهیم آ 2، و او 8 می دهد و غیره. بدیهی است که یک حریف محتاط باید استراتژی را انتخاب کند که در آن حداکثر برد ما حداقل خواهد بود.

اجازه دهید با نشان دادن β jحداکثر مقادیر در ستون های ماتریس پرداخت (حداکثر برد بازیکن آ، یا، که همان چیزی است، حداکثر باخت بازیکن است ب) برای استراتژی یک آی:

و یک ردیف حاوی این مقادیر را به ماتریس بازی اضافه کنید:

هنگام انتخاب یک استراتژی، دشمن استراتژی را ترجیح می دهد که برای آن ارزش دارد β jحداقل بیایید آن را با علامت گذاری کنیم β :

اندازه β تماس گرفت قیمت بالای بازییا حداقل(حداقل حداکثر برد). استراتژی دشمن (بازیکن) مربوط به مینیمکس ب) نامیده شد استراتژی حداقل.

Minimax مقدار برد است، بیش از آن که یک حریف منطقی مطمئناً به ما نخواهد داد (به عبارت دیگر، یک حریف منطقی بیش از β ). در این مثال، minimax β برابر با 5 است (سلول مربوطه در جدول به رنگ خاکستری مشخص شده است) و با استفاده از استراتژی دشمن به دست می آید. ب 3 .

بنابراین، بر اساس اصل احتیاط («همیشه بدترین را فرض کن!»)، باید استراتژی را انتخاب کنیم. آ 4، و دشمن - استراتژی ب 3. اصل احتیاط در تئوری بازی ها اساسی است و نامیده می شود اصل حداقل.

در نظر بگیریم مثال 2. اجازه دهید بازیکنان آو که دربه طور همزمان و مستقل از یکدیگر، یکی از سه عدد را بنویسید: "1" یا "2" یا "3". اگر مجموع اعداد نوشته شده زوج باشد، بازیکن ببه بازیکن پرداخت می کند آاین مقدار. اگر مبلغ فرد باشد، بازیکن این مبلغ را پرداخت می کند آبه بازیکن که در.

بیایید ماتریس پرداخت بازی را یادداشت کنیم و قیمت های پایین تر و بالاتر بازی را پیدا کنیم (عدد استراتژی مطابق با عدد نوشته شده است):

بازیکن آباید به استراتژی حداکثر پایبند باشد آ 1 برای بردن کمتر از -3 (یعنی بیشتر از 3 باخت). استراتژی بازیکن Minimax ب- هر یک از استراتژی ها ب 1 و ب 2، تضمین می کند که او بیش از 4 نخواهد داد.

اگر ماتریس پرداخت را از دید بازیکن بنویسیم، همین نتیجه را می گیریم که در. در واقع این ماتریس با جابجایی ماتریس ساخته شده از دید بازیکن به دست می آید. آ، و تغییر علائم عناصر به عکس (از زمان برنده شدن بازیکن آ- این باخت بازیکن است که در):

بر اساس این ماتریس نتیجه می شود که بازیکن بباید هر یک از استراتژی ها را دنبال کند ب 1 و ب 2 (و سپس او بیش از 4 را از دست نخواهد داد)، و بازیکن آ- استراتژی ها آ 1 (و سپس او بیش از 3 را از دست نخواهد داد). همانطور که می بینید، نتیجه دقیقاً با آنچه در بالا به دست آمده مطابقت دارد، بنابراین هنگام تجزیه و تحلیل، از نقطه نظر اینکه کدام بازیکن آن را هدایت می کنیم، مهم نیست.

8 آنچه که بازی ارزش نامیده می شود.

9. اصل MINIMAX چیست. 2. قیمت پایین و بالاتر از بازی. اصل Minimax

یک بازی ماتریسی از نوع با ماتریس بازده را در نظر بگیرید

اگر بازیکن آاستراتژی را انتخاب خواهد کرد یک آی، سپس تمام بازده های احتمالی آن عناصر خواهد بود منسطر هفتم ماتریس با. بدترین برای بازیکن آمورد زمانی که بازیکن که دراستراتژی مناسب را اعمال می کند کمترینعنصر این خط، برد بازیکن است آبرابر عدد خواهد بود.

بنابراین، برای به دست آوردن بزرگترین برد، بازیکن آشما نیاز به انتخاب استراتژی که برای آن تعداد بیشترین.

تست های کنترل نهایی

1. بازی آنتاگونیستی را می توان تنظیم کرد:

الف) مجموعه ای از استراتژی ها برای هر دو بازیکن و یک نقطه زین.

ب) مجموعه ای از استراتژی ها برای هر دو بازیکن و عملکرد بازده بازیکن اول.

2. قیمت بازی همیشه برای بازی های ماتریسی در استراتژی های ترکیبی وجود دارد.

الف) بله.

3. اگر همه ستون‌ها در ماتریس پرداخت یکسان باشند و شکل (4 5 0 1) داشته باشند، پس چه استراتژی برای بازیکن اول بهینه است؟

اولین.

ب) دوم

ج) هر یک از چهار.

4. اجازه دهید در یک بازی ماتریسی یکی از استراتژی های ترکیبی بازیکن اول فرم (0.3، 0.7) و یکی از استراتژی های ترکیبی بازیکن دوم به شکل (0.4، 0، 0.6) باشد. ابعاد این ماتریس چقدر است؟

الف) 2*3.

ج) بعد دیگر

5. اصل تسلط به شما امکان می دهد در یک مرحله از ماتریس حذف کنید:

الف) خطوط کامل

ب) اعداد فردی

6. در روش گرافیکی برای حل بازی های 2*m مستقیماً از نمودار پیدا می شود:

الف) استراتژی های بهینه هر دو بازیکن.

ب) قیمت بازی و استراتژی های بهینه بازیکن دوم.

ج) قیمت بازی و استراتژی های بهینه بازیکن اول.

7. نمودار پاکت پایین برای روش گرافیکی حل بازی های 2*m در حالت کلی است:

الف) شکسته

ب) مستقیم

ج) سهمی.

8. در یک بازی ماتریسی 2*2 دو جزء از استراتژی ترکیبی بازیکن وجود دارد:

الف) ارزش های یکدیگر را تعیین کنید.

ب) مستقل

9. در یک بازی ماتریسی، عنصر aij عبارت است از:

الف) بردهای بازیکن اول زمانی که از استراتژی i-ام استفاده می کند و نفر دوم - استراتژی j-ام.

ب) استراتژی بهینه بازیکن اول زمانی که حریف از استراتژی i یا j استفاده می کند.


ج) از دست دادن بازیکن اول هنگام استفاده از استراتژی j و دومین بازیکن از استراتژی i.

10. عنصر ماتریس aij مربوط به نقطه زین است. شرایط زیر ممکن است:

الف) این عنصر به شدت کوچکترین عنصر در خط است.

ب) این عنصر دومین عنصر در خط است.

11. در روش براون-رابینسون، هر بازیکن هنگام انتخاب یک استراتژی در مرحله بعد، توسط:

الف) راهبردهای دشمن در مراحل قبلی.

ب) استراتژی های شما در مراحل قبل.

ج) چیز دیگری

12. با توجه به معیار انتظار ریاضی، هر بازیکن از این واقعیت است که:

الف) بدترین وضعیت برای او اتفاق خواهد افتاد.

ج) همه یا برخی موقعیت ها با برخی احتمالات ممکن است.

13. اجازه دهید یک بازی ماتریسی توسط ماتریسی داده شود که در آن همه عناصر منفی هستند. قیمت بازی مثبت است:

ب) خیر

ج) پاسخ روشنی وجود ندارد.

14. قیمت بازی:

یک عدد.

ب) بردار.

ج) ماتریس

15. حداکثر تعداد نقاط زین که می تواند در یک بازی با ابعاد 5*5 باشد چقدر است (ماتریس می تواند شامل هر عددی باشد):

16. اجازه دهید در یک بازی ماتریسی با ابعاد 2*3 یکی از استراتژی های ترکیبی بازیکن اول شکل (0.3، 0.7) و یکی از استراتژی های ترکیبی بازیکن دوم به شکل (0.3، x، 0.5) باشد. . عدد x چیست؟

ج) عدد دیگری

17. معیار والد برای کدام بعد از ماتریس بازی به معیار لاپلاس تبدیل می شود؟

ج) فقط در موارد دیگر.

18. قیمت بالای بازی همیشه کمتر از قیمت پایین بازی است.

ب) خیر

ب) سوال نادرست است.

19. چه استراتژی هایی در یک بازی ماتریسی وجود دارد:

تمیز.

ب) مخلوط

ج) هر دو

20. آیا در برخی از بازی های آنتاگونیستی، مقادیر تابع بازده هر دو بازیکن برای برخی از مقادیر متغیرها می تواند برابر با 1 باشد؟

الف) همیشه

ب) گاهی اوقات

ج) هرگز

21. در یک بازی ماتریسی، اجازه دهید یکی از استراتژی های ترکیبی بازیکن اول به شکل (0.3، 0.7) و یکی از استراتژی های ترکیبی بازیکن دوم به شکل (0.4، 0.1،0.1،0.4) باشد. . ابعاد این ماتریس چقدر است؟

ج) بعد دیگر

22. اصل تسلط به شما امکان می دهد در یک مرحله از ماتریس حذف کنید:

الف) کل ستون ها،

ب) اعداد فردی

ج) زیرماتریس با اندازه های کوچکتر.

23. در یک بازی ماتریسی 3*3 دو جزء استراتژی ترکیبی بازیکن وجود دارد:

الف) سوم را تعیین کنید.

ب) تعریف نکنید.

24. در یک بازی ماتریسی، عنصر aij عبارت است از:

الف) از دست دادن بازیکن دوم زمانی که از استراتژی j استفاده می کند و دومی - استراتژی i-ام..

ب) استراتژی بهینه بازیکن دوم زمانی که حریف از استراتژی i یا j ام استفاده می کند.

ج) بردهای بازیکن اول زمانی که از استراتژی j استفاده می کند و نفر دوم از استراتژی i-ام استفاده می کند.

25. عنصر ماتریس aij مربوط به نقطه زین است. شرایط زیر ممکن است:

الف) این عنصر بزرگترین در ستون است.

ب) این عنصر به طور دقیق بزرگترین به ترتیب در خط است.

ج) رشته حاوی عناصر بزرگتر و کوچکتر از این عنصر است.

26. با توجه به معیار والد، هر بازیکن فرض می کند که:

الف) بدترین وضعیت برای او اتفاق خواهد افتاد.

ب) همه موقعیت ها به یک اندازه ممکن است.

ج) همه موقعیت ها با احتمالات معینی ممکن است.

27. قیمت پایین تر از قیمت بالای بازی کمتر است:

ب) نه همیشه

ج) هرگز

28. مجموع اجزای یک استراتژی ترکیبی برای یک بازی ماتریسی همیشه:

الف) برابر 1 است.

ب) غیر منفی.

ج) مثبت

د) نه همیشه

29. اجازه دهید در یک بازی ماتریس 2*3 یکی از استراتژی های ترکیبی بازیکن اول به شکل (0.3، 0.7) و یکی از استراتژی های ترکیبی بازیکن دوم به شکل (0.2، x، x) باشد. . عدد x چیست؟

موسسه انرژی مسکو

(دانشگاه فنی)

گزارش آزمایشگاه

در تئوری بازی ها

"برنامه ای برای یافتن استراتژی های بهینه برای یک بازی زوجی با جمع صفر که به صورت ماتریسی ارائه شده است"

توسط دانش آموزان تکمیل شد

گروه A5-01

اشراپوف دلر

آشراپووا اولگا

مفاهیم اساسی نظریه بازی ها

تئوری بازی برای حل و فصل طراحی شده است موقعیت های درگیری ، یعنی شرایطی که در آن منافع دو یا چند طرف که اهداف متفاوتی را دنبال می کنند، با هم برخورد می کنند.

اگر اهداف احزاب مستقیماً متضاد باشد، آنها صحبت می کنند درگیری متضاد .

بازی یک مدل رسمی ساده شده از یک موقعیت درگیری نامیده می شود.

به یک بازی از ابتدا تا انتها می گویند مهمانی - جشن . نتیجه بازی است پرداخت (یا برنده ها ).

حزب متشکل از حرکت می کند ، یعنی انتخاب بازیکنان از مجموعه معینی از گزینه های ممکن.

حرکات ممکن است باشد شخصیو تصادفی.حرکت شخصی ، بر خلاف تصادفی ، شامل انتخاب آگاهانه بازیکن از یک گزینه است.

بازی هایی که در آنها حداقل یک حرکت شخصی وجود دارد نامیده می شود راهبردی .

بازی هایی که در آنها همه حرکات تصادفی هستند نامیده می شوند قمار .

هنگام انجام یک حرکت شخصی در مورد آن نیز صحبت می کنند استراتژی ها بازیکن، یعنی در مورد یک قانون یا مجموعه قوانینی که انتخاب بازیکن را تعیین می کند. در عین حال، استراتژی باید جامع باشد، یعنی. انتخاب باید برای هر موقعیت احتمالی در طول بازی مشخص شود.

مشکل تئوری بازی ها- یافتن استراتژی های بهینه برای بازیکنان، به عنوان مثال. استراتژی هایی که حداکثر سود یا حداقل ضرر را برای آنها فراهم می کند.

طبقه بندی مدل های نظری بازی

بازی nافراد معمولاً به عنوان کجا مشخص می شوند
- مجموعه ای از استراتژی های بازیکن i-ام،
- پرداخت برای بازی

مطابق با این نامگذاری، طبقه بندی زیر از مدل های نظری بازی می تواند پیشنهاد شود:

گسسته (راهبردهای چندگانه گسسته)

نهایی

بی پایان

پیوسته (راهبردهای چندگانه مداوم)

بی پایان

nافراد (
)

ائتلاف (تعاونی)

غیر ائتلافی (غیر تعاونی)

2 نفر (جفت)

آنتاگونیست (بازی های حاصل جمع صفر)

(منافع طرفین متضاد است، یعنی از دست دادن یک بازیکن برابر با سود بازیکن دیگر است)

غیر آنتاگونیستی

با اطلاعات کامل (اگر بازیکنی که حرکت شخصی انجام می دهد، کل پس زمینه بازی یعنی تمام حرکات حریف را بداند)

با اطلاعات ناقص

با مبلغ صفر (کل پرداختی برابر با صفر است)

مجموع غیر صفر

تک حرکتی (قرعه کشی)

چند پاس

نمایش ماتریسی از یک بازی زوج صفر

در این آموزش به بررسی خواهیم پرداخت بازی های متضاد دو نفره ، به صورت ماتریسی ارائه شده است. این بدان معنی است که ما بسیاری از استراتژی های بازیکن اول (بازیکن آ){ آ من }, من = 1,…, مترو انواع استراتژی برای بازیکن دوم (بازیکن ب){ ب j }, j = 1,..., n، و همچنین با توجه به ماتریس آ = || آ ij || بردهای بازیکن اول از آنجایی که ما در مورد یک بازی آنتاگونیستی صحبت می کنیم، فرض بر این است که سود بازیکن اول برابر با از دست دادن بازیکن دوم است. فرض می کنیم که عنصر ماتریس آ ij- بردهای اولین بازیکن زمانی که استراتژی را انتخاب می کند آ منو پاسخ بازیکن دوم به او با یک استراتژی ب j. ما چنین بازی را به عنوان نشان خواهیم داد
، جایی که متر - تعداد استراتژی های بازیکن آ،n - تعداد استراتژی های بازیکن که در.به طور کلی می توان آن را با جدول زیر نشان داد:

ب 1

ب j

ب n

آ 1

آ من

آ متر

مثال 1

به عنوان یک مثال ساده، بازی را در نظر بگیرید که در آن یک بازی از دو حرکت تشکیل شده است.

حرکت 1: بازیکن آیکی از اعداد (1 یا 2) را بدون اطلاع حریف از انتخاب خود انتخاب می کند.

حرکت 2: بازیکن که دریکی از اعداد (3 یا 4) را انتخاب می کند.

خط پایین: انتخاب بازیکنان آو که درتا کردن اگر مجموع زوج باشد، پس که درارزش خود را به بازیکن می پردازد آ، اگر فرد است - برعکس، آمبلغ را به بازیکن پرداخت می کند که در.

این بازی را می توان در قالب ارائه کرد
به روش زیر:

(گزینه 3)

(گزینه 4)

(گزینه 1)

(گزینه 2)

به راحتی می توان دید که این بازی متضاد است، علاوه بر این، یک بازی با اطلاعات ناقص است به بازیکن که در،با انجام یک حرکت شخصی، معلوم نیست بازیکن چه انتخابی کرده است آ.

همانطور که در بالا ذکر شد، وظیفه تئوری بازی ها یافتن استراتژی های بهینه بازیکنان است، یعنی. استراتژی هایی که حداکثر سود یا حداقل ضرر را برای آنها فراهم می کند. این فرآیند نامیده می شود راه حل بازی .

هنگام حل یک بازی به صورت ماتریسی، باید بازی را برای حضور بررسی کنید نقطه زینی . برای این کار دو مقدار وارد می شود:

– برآورد کمتر از قیمت بازی و

- تخمین بالایی از قیمت بازی.

بازیکن اول به احتمال زیاد استراتژی را انتخاب می کند که در آن حداکثر برد را از بین تمام پاسخ های ممکن بازیکن دوم دریافت می کند، و بازیکن دوم، برعکس، استراتژی را انتخاب می کند که ضرر خود را به حداقل می رساند، یعنی. برنده شدن احتمالی اولین

می توان ثابت کرد که α ≤ V ≤ β ، جایی که Vقیمت بازی ، یعنی برد احتمالی بازیکن اول.

اگر رابطه برقرار باشد α = β = V، سپس آنها می گویند بازی یک نقطه زین دارد
، و را می توان در استراتژی های خالص حل کرد . به عبارت دیگر، چند استراتژی وجود دارد
، دادن بازیکن آV.

مثال 2

بیایید به بازی ای که در مثال 1 در نظر گرفتیم برگردیم و آن را برای وجود نقطه زین بررسی کنیم.

(گزینه 3)

(گزینه 4)

(گزینه 1)

(گزینه 2)

برای این بازی
= -5,
= 4,
بنابراین نقطه زینی ندارد.

یک بار دیگر یادآور می شویم که این بازی یک بازی با اطلاعات ناقص است. در این صورت فقط می توانیم به بازیکن مشاوره بدهیم آیک استراتژی انتخاب کنید ، زیرا در این صورت، او می تواند بزرگترین برد را به دست آورد، البته به انتخاب بازیکن که دراستراتژی ها .

مثال 3

بیایید از مثال 1 تغییراتی در قوانین بازی ایجاد کنیم. ما بازیکن را ارائه خواهیم کرد که دراطلاعات انتخاب بازیکن آ.سپس داشته باشید که دردو استراتژی اضافی ظاهر می شود:

- یک استراتژی مفید برای آ.اگر انتخاب الف - 1،که که دردر صورت انتخاب 3 را انتخاب می کند الف - 2،که که در 4 را انتخاب می کند؛

- استراتژی که برای آن سودمند نیست آ.اگر انتخاب الف - 1،که که دردر صورت انتخاب 4 را انتخاب می کند الف - 2،که که در 3 را انتخاب می کند.

(گزینه 3)

(گزینه 4)

(گزینه 1)

(گزینه 2)

این بازی با اطلاعات کامل است.

در این مورد
= -5,
= -5,
بنابراین، بازی دارای یک نقطه زینتی است
. این نقطه زینی با دو جفت استراتژی بهینه مطابقت دارد:
و
. قیمت بازی V= -5. بدیهی است که برای آچنین بازی بی سود است.

مثال های 2 و 3 به خوبی بیانگر قضیه زیر هستند که در تئوری بازی ها ثابت شده است:

قضیه 1

هر بازی آنتاگونیستی زوجی با اطلاعات کامل را می توان در استراتژی های خالص حل کرد.

که قضیه 1 می گوید که هر بازی دو نفره با اطلاعات کامل یک نقطه زینتی دارد و یک جفت استراتژی خالص وجود دارد.
، دادن بازیکن آبردهای پایدار برابر با قیمت بازی V.

در صورت عدم وجود نقطه زینی، به اصطلاح استراتژی های ترکیبی :، جایی که پ من وq j- احتمال انتخاب استراتژی ها آ من و ب jبه ترتیب بازیکن اول و دوم راه حل بازی در این مورد یک جفت استراتژی ترکیبی است
، به حداکثر رساندن انتظار ریاضی از قیمت بازی.

قضیه زیر قضیه 1 را به یک بازی با اطلاعات ناقص تعمیم می دهد:

قضیه 2

هر بازی متضاد جفتی حداقل یک راه حل بهینه دارد، یعنی یک جفت استراتژی مختلط در حالت کلی.
، دادن بازیکن آبردهای پایدار برابر با قیمت بازی V، و α ≤ V ≤ β .

در حالت خاص، برای یک بازی با نقطه زین، راه حل در استراتژی های مختلط مانند یک جفت بردار به نظر می رسد که در آن یک عنصر برابر با یک و بقیه برابر با صفر است.