بازی های متضاد با استراتژی های مداوم. حل بازی های متضاد ماتریس حل بازی های آنتاگونیستی آنلاین

یک بازی دو نفره مجموع صفر نامیده می شود که در آن هر کدام از آنها مجموعه ای محدود از استراتژی ها را دارند. قوانین بازی ماتریس توسط ماتریس پرداخت تعیین می شود که عناصر آن پرداخت های بازیکن اول است که ضررهای بازیکن دوم نیز می باشد.

بازی ماتریکس یک بازی متضاد است بازیکن اول حداکثر بازده تضمین شده (بدون بستگی به رفتار بازیکن دوم) برابر با قیمت بازی را دریافت می کند، به طور مشابه، بازیکن دوم به حداقل ضرر تضمین شده دست می یابد.

زیر استراتژی به عنوان مجموعه ای از قوانین (اصول) درک می شود که بسته به وضعیت فعلی، انتخاب یک نوع از اقدامات را برای هر حرکت شخصی یک بازیکن تعیین می کند.

اکنون در مورد همه چیز به ترتیب و با جزئیات.

ماتریس سود، استراتژی های خالص، قیمت بازی

AT بازی ماتریسی قوانین آن مشخص می شود ماتریس بازده .

یک بازی را در نظر بگیرید که در آن دو شرکت کننده وجود دارد: بازیکن اول و بازیکن دوم. اجازه دهید بازیکن اول داشته باشد متراستراتژی های ناب، و در اختیار بازیکن دوم - nاستراتژی های ناب از آنجایی که یک بازی مد نظر است، طبیعی است که در این بازی برد و باخت وجود داشته باشد.

AT ماتریس پرداخت عناصر اعدادی هستند که سود و زیان بازیکنان را بیان می کنند. برد و باخت را می توان به صورت امتیاز، پول یا واحدهای دیگر بیان کرد.

بیایید یک ماتریس بازده ایجاد کنیم:

اگر بازیکن اول انتخاب کند من-ام استراتژی خالص و بازیکن دوم j-ام استراتژی خالص، سپس بازده بازیکن اول است آijواحدها و از دست دادن بازیکن دوم نیز می باشد آijواحدها

زیرا آij + (- آ ij ) = 0، سپس بازی توصیف شده یک بازی ماتریسی با جمع صفر است.

ساده ترین مثال بازی ماتریسی پرتاب سکه است. قوانین بازی به شرح زیر است. بازیکن اول و دوم یک سکه پرتاب می کنند و نتیجه سر یا دم است. اگر سرها و سرها یا دم ها یا دم ها به طور همزمان رول شوند، بازیکن اول یک واحد برنده می شود و در موارد دیگر یک واحد را از دست می دهد (بازیکن دوم یک واحد برنده می شود). همین دو استراتژی در اختیار بازیکن دوم است. ماتریس بازده مربوطه به صورت زیر خواهد بود:

وظیفه تئوری بازی تعیین انتخاب استراتژی بازیکن اول است که حداکثر سود متوسط ​​را برای او تضمین می کند و همچنین انتخاب استراتژی بازیکن دوم را تعیین می کند که حداکثر میانگین ضرر را برای او تضمین می کند.

استراتژی در یک بازی ماتریس چگونه انتخاب می شود؟

بیایید دوباره به ماتریس بازده نگاه کنیم:

ابتدا، ما سود اولین بازیکن را در صورت استفاده مشخص می کنیم مناستراتژی ناب اگر اولین بازیکن استفاده کند من-ام استراتژی خالص، پس منطقی است که فرض کنیم بازیکن دوم از چنین استراتژی خالصی استفاده خواهد کرد، به همین دلیل بازده بازیکن اول حداقل خواهد بود. به نوبه خود، بازیکن اول از چنین استراتژی خالصی استفاده می کند که حداکثر بازده را برای او فراهم می کند. بر اساس این شرایط، پرداخت اولین بازیکن، که ما به عنوان v1 ، نامیده میشود حداکثر برد یا قیمت بازی پایین تر .

در برای این مقادیر، بازیکن اول باید به صورت زیر عمل کند. از هر خط، مقدار حداقل عنصر را بنویسید و حداکثر را از بین آنها انتخاب کنید. بنابراین، بازده بازیکن اول حداکثر حداقل خواهد بود. از این رو نام - maximin win. شماره خط این عنصر، تعداد استراتژی خالص انتخاب شده توسط بازیکن اول خواهد بود.

حالا بیایید باخت بازیکن دوم را در صورت استفاده مشخص کنیم j-ام استراتژی در این حالت، بازیکن اول از استراتژی خالص خود استفاده می کند که در آن ضرر بازیکن دوم حداکثر خواهد بود. بازیکن دوم باید چنین استراتژی خالصی را انتخاب کند که در آن ضرر او حداقل باشد. از دست دادن بازیکن دوم که به آن اشاره می کنیم v2 ، نامیده میشود حداقل ضرر یا قیمت بالای بازی .

در حل مشکلات قیمت بازی و تعیین استراتژی برای تعیین این مقادیر برای بازیکن دوم، به صورت زیر عمل کنید. از هر ستون، مقدار حداکثر عنصر را بنویسید و حداقل را از بین آنها انتخاب کنید. بنابراین، از دست دادن بازیکن دوم حداقل از حداکثر خواهد بود. از این رو نام - حداقل افزایش. شماره ستون این عنصر، تعداد استراتژی خالص انتخاب شده توسط بازیکن دوم خواهد بود. اگر بازیکن دوم از "مینیمکس" استفاده کند، بدون توجه به انتخاب استراتژی توسط بازیکن اول، حداکثر بازنده خواهد بود. v2 واحدها

مثال 1

.

بزرگترین عنصر از کوچکترین ردیف ها 2 است، این قیمت پایین تر بازی است، ردیف اول با آن مطابقت دارد، بنابراین، استراتژی حداکثری بازیکن اول اولین است. کوچکترین عنصر از بزرگترین ستون ها 5 است، این قیمت بالای بازی است، ستون دوم با آن مطابقت دارد، بنابراین، استراتژی حداقلی بازیکن دوم دوم است.

اکنون که ما یاد گرفتیم که چگونه قیمت پایین‌تر و بالاتر بازی، استراتژی‌های حداکثر و مینی‌مکس را پیدا کنیم، وقت آن رسیده است که یاد بگیریم چگونه این مفاهیم را به طور رسمی تعیین کنیم.

بنابراین، سود تضمین شده بازیکن اول عبارت است از:

بازیکن اول باید یک استراتژی خالص را انتخاب کند که حداکثر حداقل سود را برای او فراهم کند. این سود (حداکثر) به صورت زیر نشان داده می شود:

.

بازیکن اول از استراتژی خالص خود استفاده می کند تا ضرر بازیکن دوم حداکثر باشد. این ضرر به صورت زیر تعریف می شود:

بازیکن دوم باید استراتژی خالص خود را طوری انتخاب کند که ضررش حداقل باشد. این ضرر (حداقل) به صورت زیر نشان داده می شود:

.

نمونه ای دیگر از همین سریال.

مثال 2با توجه به یک بازی ماتریسی با ماتریس بازده

.

استراتژی maximin بازیکن اول، استراتژی minimax بازیکن دوم، قیمت پایین و بالای بازی را تعیین کنید.

تصمیم. در سمت راست ماتریس پرداخت، ما کوچکترین عناصر را در ردیف های آن می نویسیم و حداکثر آنها را علامت گذاری می کنیم و از پایین ماتریس - بزرگترین عناصر در ستون ها را انتخاب می کنیم و حداقل آنها را انتخاب می کنیم:

بزرگترین عنصر از کوچکترین ردیف ها 3 است، این قیمت پایین تر بازی است، ردیف دوم با آن مطابقت دارد، بنابراین، استراتژی حداکثری بازیکن اول دوم است. کوچکترین عنصر از بزرگترین ستون ها 5 است، این قیمت بالای بازی است، ستون اول با آن مطابقت دارد، بنابراین، استراتژی حداقلی بازیکن دوم اولین است.

نقطه زین در بازی های ماتریسی

اگر قیمت بالا و پایین بازی یکسان باشد، بازی ماتریسی دارای نقطه زینی در نظر گرفته می شود. عکس این قضیه نیز صادق است: اگر یک بازی ماتریسی دارای نقطه زینی باشد، قیمت های بالا و پایین بازی ماتریس یکسان است. عنصر مربوطه هم کوچکترین در ردیف و هم بزرگترین عنصر در ستون است و برابر با قیمت بازی است.

بنابراین، اگر، پس استراتژی خالص بهینه بازیکن اول است و استراتژی خالص بهینه بازیکن دوم است. یعنی قیمت‌های پایین‌تر و بالاتر بازی در یک جفت استراتژی به دست می‌آیند.

در این مورد بازی ماتریس راه حلی در استراتژی های خالص دارد .

مثال 3با توجه به یک بازی ماتریسی با ماتریس بازده

.

تصمیم. در سمت راست ماتریس پرداخت، ما کوچکترین عناصر را در ردیف های آن می نویسیم و حداکثر آنها را علامت گذاری می کنیم و از پایین ماتریس - بزرگترین عناصر در ستون ها را انتخاب می کنیم و حداقل آنها را انتخاب می کنیم:

قیمت پایین بازی همان قیمت بالای بازی است. بنابراین، قیمت بازی 5 است. قیمت بازی برابر با ارزش نقطه زین است. استراتژی حداکثری بازیکن اول دومین استراتژی خالص و استراتژی حداقلی بازیکن دوم استراتژی خالص سوم است. این بازی ماتریسی راه حلی در استراتژی های ناب دارد.

مشکل بازی ماتریس را خودتان حل کنید و سپس راه حل را ببینید

مثال 4با توجه به یک بازی ماتریسی با ماتریس بازده

.

قیمت پایین و بالای بازی را پیدا کنید. آیا این بازی ماتریسی نقطه زینی دارد؟

بازی های ماتریسی با استراتژی ترکیبی بهینه

در بیشتر موارد، بازی ماتریس نقطه زینی ندارد، بنابراین بازی ماتریسی مربوطه هیچ راه حل استراتژی خالصی ندارد.

اما در استراتژی های ترکیبی بهینه راه حل دارد. برای یافتن آنها باید فرض کرد که بازی به اندازه کافی تکرار شده است که بر اساس تجربه می توان حدس زد که کدام استراتژی ارجحیت دارد. بنابراین تصمیم با مفهوم احتمال و میانگین (انتظار) همراه است. در راه حل نهایی، هم یک آنالوگ از نقطه زین (یعنی برابری قیمت های پایین و بالاتر بازی) و هم یک آنالوگ از استراتژی های مربوط به آنها وجود دارد.

بنابراین برای اینکه بازیکن اول حداکثر میانگین سود را به دست آورد و بازیکن دوم کمترین میانگین باخت را داشته باشد، باید از استراتژی های خالص با احتمال مشخص استفاده کرد.

اگر بازیکن اول از استراتژی های خالص با احتمالات استفاده کند ، سپس بردار استراتژی ترکیبی بازیکن اول نامیده می شود. به عبارت دیگر، «آمیخته ای» از استراتژی های ناب است. مجموع این احتمالات برابر با یک است:

.

اگر بازیکن دوم از استراتژی های خالص با احتمالات استفاده کند ، سپس بردار استراتژی ترکیبی بازیکن دوم نامیده می شود. مجموع این احتمالات برابر با یک است:

.

اگر بازیکن اول از استراتژی ترکیبی استفاده کند پو بازیکن دوم - یک استراتژی ترکیبی q، پس منطقی است ارزش مورد انتظار بازیکن اول برنده می شود (بازیکن دوم بازنده). برای پیدا کردن آن، باید بردار استراتژی ترکیبی بازیکن اول (که یک ماتریس یک ردیفی خواهد بود)، ماتریس بازده، و بردار استراتژی ترکیبی بازیکن دوم (که یک ماتریس یک ستونی خواهد بود) را ضرب کنید:

.

مثال 5با توجه به یک بازی ماتریسی با ماتریس بازده

.

در صورتی که استراتژی ترکیبی بازیکن اول و استراتژی مختلط بازیکن دوم باشد، انتظار ریاضی سود بازیکن اول (باخت بازیکن دوم) را تعیین کنید.

تصمیم. با توجه به فرمول انتظار ریاضی سود بازیکن اول (از دست دادن بازیکن دوم) برابر است با حاصل ضرب بردار استراتژی ترکیبی بازیکن اول، ماتریس پرداخت و بردار استراتژی مختلط بازیکن دوم:

به بازیکن اول آنچنان استراتژی ترکیبی گفته می شود که در صورت تکرار بازی به تعداد کافی، حداکثر بازده متوسط ​​را برای او فراهم می کند.

استراتژی ترکیبی بهینه بازیکن دوم را چنان استراتژی ترکیبی می نامند که اگر بازی به تعداد کافی تکرار شود، حداقل میانگین باخت را برای او فراهم می کند.

با قیاس با نماد حداکثر و حداقل در موارد استراتژی های خالص، استراتژی های ترکیبی بهینه به صورت زیر نشان داده می شوند (و با انتظارات ریاضی، یعنی میانگین سود بازیکن اول و ضرر بازیکن دوم مرتبط هستند):

,

.

در این مورد، برای تابع E یک نقطه زین وجود دارد ، که به معنای برابری است.

به منظور یافتن استراتژی های ترکیبی بهینه و نقطه زینی، یعنی. بازی ماتریس را با استراتژی های ترکیبی حل کنید ، باید بازی ماتریس را به یک مسئله برنامه نویسی خطی یعنی به یک مسئله بهینه سازی تقلیل دهید و مسئله برنامه نویسی خطی مربوطه را حل کنید.

کاهش یک بازی ماتریسی به یک مسئله برنامه ریزی خطی

برای حل یک بازی ماتریسی در استراتژی های ترکیبی، باید یک خط مستقیم بنویسید مشکل برنامه نویسی خطیو وظیفه دوگانه آن. در مسئله دوگانه، ماتریس تقویت شده که ضرایب متغیرها را در سیستم محدودیت، عبارات ثابت و ضرایب متغیرها در تابع هدف ذخیره می‌کند، جابه‌جا می‌شود. در این حالت، حداقل تابع هدف مسئله اصلی با حداکثر در مسئله دوگانه همراه است.

تابع هدف در مسئله برنامه ریزی خطی مستقیم:

.

سیستم محدودیت ها در مسئله مستقیم برنامه ریزی خطی:

تابع هدف در مسئله دوگانه:

.

سیستم محدودیت ها در مسئله دوگانه:

طرح بهینه مسئله برنامه ریزی خطی مستقیم را مشخص کنید

,

و طرح بهینه مسئله دوگانه با نشان داده می شود

فرم های خطی برای طرح های بهینه مربوطه با و نشان داده می شوند،

و باید آنها را به عنوان مجموع مختصات متناظر طرح های بهینه پیدا کنید.

با توجه به تعاریف بخش قبل و مختصات برنامه های بهینه، استراتژی های ترکیبی زیر بازیکنان اول و دوم معتبر است:

.

ریاضیدانان این را ثابت کرده اند قیمت بازی بر حسب اشکال خطی نقشه های بهینه به صورت زیر بیان می شود:

,

یعنی متقابل مجموع مختصات طرح های بهینه است.

ما، تمرین‌کنندگان، فقط می‌توانیم از این فرمول برای حل بازی‌های ماتریسی در استراتژی‌های ترکیبی استفاده کنیم. پسندیدن فرمول هایی برای یافتن استراتژی های ترکیبی بهینه به ترتیب بازیکنان اول و دوم:

که در آن عوامل دوم بردار هستند. همانطور که قبلاً در پاراگراف قبلی تعریف کردیم، استراتژی های ترکیبی بهینه نیز بردار هستند. بنابراین با ضرب عدد (قیمت بازی) در بردار (با مختصات پلان های بهینه) یک بردار نیز بدست می آوریم.

مثال 6با توجه به یک بازی ماتریسی با ماتریس بازده

.

قیمت یک بازی را پیدا کنید Vو استراتژی های ترکیبی بهینه و .

تصمیم. ما مسئله برنامه ریزی خطی مربوط به این بازی ماتریسی را می سازیم:

ما راه حل مشکل مستقیم را دریافت می کنیم:

.

شکل خطی پلان های بهینه را به عنوان مجموع مختصات یافت شده پیدا می کنیم.

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

معرفی

1. بخش نظری

1.3 سفارش بازی 2v2

1.4 روش جبری

1.5 روش گرافیکی

1.6 بازی 2xn یا mx2

1.7 حل بازی ها به روش ماتریس

2. بخش عملی

2.2 بازی 2xn و mx2

2.3 روش ماتریسی

2.4 روش قهوه ای

تجزیه و تحلیل نتایج

معرفی

بازی متضاد یک بازی با مجموع صفر است. یک بازی متضاد یک بازی غیرهمکاری است که در آن دو بازیکن شرکت می کنند که بازده آنها برعکس است.

به طور رسمی، یک بازی متضاد را می توان با یک سه گانه نشان داد ، که در آن X و Y به ترتیب مجموعه استراتژی های بازیکن اول و دوم هستند، F تابع بازده بازیکن اول است که هر جفت استراتژی را به هم مرتبط می کند (x، y)، جایی که یک عدد واقعی مربوط به ابزار است. اولین بازیکنی که به این وضعیت پی برد.

از آنجایی که منافع بازیکنان مخالف است، تابع F به طور همزمان نشان دهنده از دست دادن بازیکن دوم است.

از نظر تاریخی، بازی های متضاد اولین کلاس از مدل های ریاضی نظریه بازی ها هستند که برای توصیف استفاده می شوند. قمار. اعتقاد بر این است که به لطف این موضوع تحقیق، نظریه بازی ها نام خود را به دست آورد. در حال حاضر، بازی های آنتاگونیستی به عنوان بخشی از کلاس وسیع تری از بازی های غیرهمکاری در نظر گرفته می شوند.

1. بخش نظری

1.1 تعاریف و مقررات اساسی بازی

این بازی با سیستمی از قوانین مشخص می شود که تعداد شرکت کنندگان در بازی را تعیین می کند اقدامات ممکنو توزیع برنده ها بسته به رفتار و نتایج آنها. بازیکن به عنوان یک شرکت کننده یا گروهی از شرکت کنندگان در بازی در نظر گرفته می شود که علایق مشترکی برای خود دارند که با علایق گروه های دیگر منطبق نیست. بنابراین، هر شرکت کننده یک بازیکن محسوب نمی شود.

قوانین یا شرایط بازی، رفتارها، انتخاب ها و حرکات ممکن را برای بازیکنان در هر مرحله از توسعه بازی تعیین می کند. انتخاب برای بازیکن به معنای توقف در یکی از احتمالات رفتاری اوست. سپس بازیکن این انتخاب را با حرکات انجام می دهد. انجام حرکت به این معنی است که در مرحله خاصی از بازی، بسته به امکاناتی که توسط قوانین بازی پیش بینی شده است، یکباره یا بخشی از انتخاب را انجام دهید. هر بازیکن در مرحله خاصی از بازی با توجه به انتخاب انجام شده حرکتی انجام می دهد. بازیکن دیگر با دانستن یا عدم اطلاع از انتخاب بازیکن اول نیز حرکتی انجام می دهد. هر یک از بازیکنان سعی می کند اطلاعات مربوط به توسعه گذشته بازی را در نظر بگیرد، اگر چنین امکانی توسط قوانین بازی مجاز باشد.

مجموعه قوانینی که به طور واضح به بازیکن می گوید که در هر حرکت، بسته به موقعیتی که در نتیجه بازی ایجاد شده است، چه انتخابی باید انجام دهد، استراتژی بازیکن نامیده می شود. استراتژی در تئوری بازی به معنای یک برنامه عمل کامل مشخص برای بازیکن است که نشان می دهد او در همه موارد ممکن در توسعه بازی چگونه باید عمل کند. استراتژی به معنای مجموع همه نشانه ها برای هر وضعیت اطلاعاتی است که در هر مرحله از توسعه بازی در دسترس بازیکن است. این نشان می دهد که استراتژی ها می توانند خوب و بد، موفق و ناموفق و غیره باشند.

زمانی که مجموع بازدهی همه بازیکنان در هر بازی آن صفر باشد، یک بازی با مجموع صفر وجود خواهد داشت، یعنی در یک بازی مجموع صفر، کل سرمایه همه بازیکنان تغییر نمی کند، بلکه بین بازیکنان دوباره توزیع می شود. بسته به نتایج حاصله بنابراین، بسیاری از موقعیت های اقتصادی و نظامی را می توان به عنوان بازی های حاصل جمع صفر در نظر گرفت.

به طور خاص، یک بازی مجموع صفر دو بازیکن متضاد نامیده می شود، زیرا اهداف بازیکنان در آن دقیقاً مخالف است: سود یک بازیکن فقط به قیمت از دست دادن بازیکن دیگر رخ می دهد.

1.1.1 تعریف، مثال ها و راه حل های بازی های ماتریسی در استراتژی های محض

بازی ماتریس مجموع صفر دو نفره را می توان به عنوان بازی انتزاعی دو نفره زیر مشاهده کرد.

بازیکن اول دارای m استراتژی i = 1, 2,…, m, بازیکن دوم دارای n استراتژی j = 1, 2,…, n. به هر جفت استراتژی (i, j) یک عدد a ij اختصاص داده شده است که بیانگر پرداخت بازیکن اول به دلیل بازیکن دوم در صورتی که بازیکن اول از او استفاده کند استراتژی i-امو دوم - استراتژی j-ام آن.

هر یک از بازیکنان یک حرکت انجام می دهد: بازیکن اول استراتژی i-ام خود را انتخاب می کند (i = 1, 2, ..., m) و دومی -- j-ام شمااستراتژی (j = 1، 2،…، n)، پس از آن، بازیکن اول یک ij به قیمت بازیکن دوم دریافت می کند (اگر ij باشد.< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

هر استراتژی بازیکن i = 1, 2,…, t; j = 1، 2،…، n اغلب یک استراتژی خالص نامیده می شود.

یک بازی ماتریسی حاصل جمع صفر از دو بازیکن به سادگی یک بازی ماتریسی نامیده می شود. بدیهی است که بازی ماتریکس متعلق به بازی های آنتاگونیستی است. از تعریف آن برمی‌آید که برای تعریف یک بازی ماتریسی، تعیین یک ماتریس A = (a ij) از مرتبه m از پرداخت‌های بازیکن اول کافی است.

با در نظر گرفتن ماتریس بازده

سپس اجرای هر بازی از بازی ماتریس با ماتریس A به انتخاب بازیکن اول کاهش می یابد. خط i-ام، و توسط بازیکن دوم در ستون j و بازیکن اول (به هزینه دوم) سود واقع در ماتریس A در تقاطع ردیف i و ستون j را دریافت می کند.

برای رسمی کردن یک موقعیت درگیری واقعی در قالب یک بازی ماتریسی، لازم است استراتژی‌های ناب هر بازیکن شناسایی و شماره‌گذاری مجدد شود و یک ماتریس بازده تدوین شود.

مرحله بعدی تعیین استراتژی ها و بازده بهینه بازیکنان است.

نکته اصلی در مطالعه بازی ها مفهوم استراتژی های بهینه برای بازیکنان است. این مفهوم بطور شهودی به معنای زیر است: استراتژی بازیکن در صورتی بهینه است که بکارگیری این استراتژی بیشترین بازده تضمین شده را برای تمام استراتژی های ممکن بازیکن دیگر برای او فراهم کند. بر اساس این موقعیت ها، بازیکن اول ماتریس A از بازده های خود را با توجه به فرمول (1.1) به شرح زیر بررسی می کند: برای هر مقدار i (i = 1, 2, ..., m) حداقل مقدار بازده بسته به آن تعیین می شود. در مورد استراتژی های مورد استفاده توسط بازیکن دوم

(i = 1، 2،...، m) (1.2)

یعنی حداقل بازده برای بازیکن اول تعیین می شود، مشروط بر اینکه او یکمین استراتژی خالص خود را اعمال کند، سپس از این حداقل بازده ها، چنین استراتژی i=i 0 پیدا می شود که این حداقل بازده برای آن حداکثر خواهد بود، یعنی پیدا می شود.

تعریف. عدد b که با فرمول (1.3) تعیین می‌شود، هزینه خالص کمتر بازی نامیده می‌شود و نشان می‌دهد که بازیکن اول می‌تواند با بکارگیری استراتژی‌های خالص خود برای تمام اقدامات ممکن بازیکن دوم، چه حداقل سودی را برای خود تضمین کند.

بازیکن دوم با رفتار بهینه خود باید در صورت امکان تلاش کند تا بازده بازیکن اول را به قیمت استراتژی های خود به حداقل برساند. بنابراین، برای بازیکن دوم، ما پیدا می کنیم

یعنی حداکثر بازده بازیکن اول مشخص می‌شود، مشروط بر اینکه بازیکن دوم او را اعمال کند j-امین پاکاستراتژی، سپس بازیکن دوم استراتژی j = j 1 خود را پیدا می کند که بازیکن اول حداقل بازده را دریافت می کند، یعنی می یابد.

تعریف. عدد β که با فرمول (1.5) تعیین می‌شود، هزینه خالص بالای بازی نامیده می‌شود و نشان می‌دهد که بازیکن اول با توجه به استراتژی‌هایش، حداکثر سود را برای خود تضمین می‌کند. به عبارت دیگر، بازیکن اول با اعمال استراتژی‌های خالص خود می‌تواند بازدهی حداقل b را تضمین کند و بازیکن دوم با اعمال استراتژی‌های خالص خود می‌تواند از پیروزی بیش از c بازیکن اول جلوگیری کند.

تعریف. اگر در یک بازی با ماتریس A، قیمت خالص پایین و بالای بازی با هم منطبق باشد، یعنی b = c، در این صورت گفته می شود که این بازی دارای یک نقطه زینتی در استراتژی های خالص و یک قیمت خالص بازی است:

n = b = c (1.6)

نقطه زینی یک جفت استراتژی خالص () از بازیکنان اول و دوم است که تحت آن برابری به دست می آید.

مفهوم نقطه زینی به این معنی است: اگر یکی از بازیکنان به استراتژی مربوط به نقطه زین پایبند باشد، بازیکن دیگر نمی تواند بهتر از این باشد که به استراتژی مربوط به نقطه زین پایبند باشد. با توجه به اینکه بهترین رفتار بازیکن نباید منجر به کاهش بازده او شود و بدترین رفتار ممکن است منجر به کاهش بازده او شود، این شرایط را می توان به صورت ریاضی در قالب روابط زیر نوشت:

که در آن i، j هر استراتژی خالص بازیکن اول و دوم است. (i 0 , j 0) -- استراتژی هایی که یک نقطه زین را تشکیل می دهند. در زیر نشان خواهیم داد که تعریف نقطه زین معادل شرایط (1.8) است.

بنابراین، بر اساس (1.8)، عنصر زین در ردیف i 0 -مین حداقل و حداکثر در ستون j 0 در ماتریس A است. یافتن نقطه زینی ماتریس A آسان است: در ماتریس A، به طور متوالی در هر ردیف، حداقل عنصر را پیدا کنید و بررسی کنید که آیا این عنصر حداکثر در ستون خود است یا خیر. اگر چنین است، پس یک عنصر زین است و جفت استراتژی مربوط به آن یک نقطه زینی را تشکیل می دهد. یک جفت استراتژی خالص (i 0 , j 0) از بازیکنان اول و دوم که یک نقطه زین و یک عنصر زین را تشکیل می دهند، راه حل بازی نامیده می شود.

استراتژی های خالص i 0 و j 0 که یک نقطه زین را تشکیل می دهند، به ترتیب استراتژی های خالص بهینه بازیکنان اول و دوم نامیده می شوند.

قضیه 1. فرض کنید f (x, y) تابعی واقعی از دو متغیر x A و y B باشد و وجود داشته باشد.

سپس b = c.

اثبات از تعریف حداقل و حداکثر چنین بر می آید که

از آنجایی که x در سمت چپ (1.11) دلخواه است، پس

در سمت راست نابرابری (1.12)، y دلخواه است، بنابراین

Q.E.D.

به طور خاص، ماتریس () یک مورد خاص از تابع f (x, y) است، یعنی اگر x = i، y = j، = f (x، y) را قرار دهیم، سپس از قضیه 1 دریافت می کنیم که پایین تر قیمت خالص از ارزش خالص بالای بازی در بازی ماتریس تجاوز نمی کند.

تعریف. فرض کنید f (x, y) تابعی واقعی از دو متغیر x A و y B باشد. یک نقطه (x 0, y 0) برای تابع f (x, y) نقطه زینی نامیده می‌شود که نابرابری‌های زیر برقرار باشند:

f (x, y 0) f (x 0, y 0) f (x 0, y) (1.14)

برای هر x A و y B.

1.2 استراتژی های ترکیبی بهینه و ویژگی های آنها

مطالعه یک بازی ماتریسی با یافتن نقطه زین آن در استراتژی های خالص آغاز می شود. اگر یک بازی ماتریسی دارای یک نقطه زینتی در استراتژی های خالص باشد، پس یافتن این نقطه به مطالعه بازی پایان می دهد. اگر در بازی ماتریکس در استراتژی های خالص نقطه زین وجود نداشته باشد، می توانیم قیمت خالص پایین و بالایی این بازی را پیدا کنیم که نشان می دهد بازیکن اول نباید به بازدهی بیشتر از قیمت بالای بازی امیدوار باشد. می توانید مطمئن باشید که بازدهی کمتر از قیمت پایین تر بازی دریافت خواهید کرد. چنین توصیه هایی در مورد رفتار بازیکنان در یک بازی ماتریسی بدون نقطه زین در استراتژی های خالص نمی تواند محققین و تمرین کنندگان را راضی کند. بهبود در حل بازی های ماتریسی را باید در استفاده از محرمانه بودن اعمال استراتژی های ناب و امکان تکرار مکرر بازی ها در قالب مهمانی جستجو کرد. به عنوان مثال، یک سری بازی شطرنج، چکرز، فوتبال انجام می شود و هر بار بازیکنان استراتژی های خود را به گونه ای به کار می گیرند که حریفان از محتوای آنها آگاه نباشند و در طول مسیر به طور متوسط ​​به نتایج خاصی دست پیدا می کنند. انجام کل سری بازی ها این بازده ها به طور متوسط ​​بیشتر از قیمت پایین بازی و کمتر از قیمت بالای بازی است. هر چه این مقدار متوسط ​​بزرگتر باشد، استراتژی بهترتوسط بازیکن اعمال می شود. بنابراین، این ایده به وجود آمد که استراتژی‌های خالص را به‌طور تصادفی و با احتمال مشخصی اعمال کنیم. این کاملاً محرمانه بودن استفاده از آنها را تضمین می کند. هر بازیکن می‌تواند احتمال به‌کارگیری استراتژی‌های خالص خود را به گونه‌ای تغییر دهد که میانگین بازدهی خود را به حداکثر برساند و در طول مسیر به استراتژی‌های بهینه دست یابد. این ایده به مفهوم استراتژی مختلط منجر شد.

تعریف. استراتژی مختلط یک بازیکن مجموعه کاملی از احتمالات به کارگیری استراتژی های خالص او است.

بنابراین، اگر اولین بازیکن دارای m استراتژی خالص 1، 2، … i، … m باشد، استراتژی مختلط x او مجموعه ای از اعداد x = (x 1 , x 2 , ..., x i ,…, x t ) است که رضایت بخش است. روابط

x i 0 (i = 1، 2، ...، m)، = 1. (1.15)

به طور مشابه، برای بازیکن دوم که n استراتژی خالص دارد، استراتژی مختلط y مجموعه اعداد y = (y 1،…، y j، … y n) است که روابط را برآورده می کند.

y j 0 (j = 1، 2، ...، n)، = 1. (1.16)

از آنجایی که هر بار یک بازیکن از یک استراتژی خالص استفاده می کند، استفاده از استراتژی دیگر را منتفی می کند، استراتژی های خالص رویدادهای ناسازگاری هستند. علاوه بر این، آنها تنها رویدادهای ممکن هستند.

بدیهی است که یک استراتژی خالص یک مورد خاص از یک استراتژی ترکیبی است. در واقع، اگر در یک استراتژی ترکیبی وجود داشته باشد شبکه i-اماستراتژی با احتمال یک اعمال می شود، سپس همه استراتژی های خالص دیگر اعمال نمی شوند. و این استراتژی خالص یکم یک مورد خاص از یک استراتژی ترکیبی است. برای حفظ رازداری، هر بازیکن بدون توجه به انتخاب بازیکن دیگر، استراتژی های خود را اعمال می کند.

تعریف. میانگین بازده اولین بازیکن در بازی ماتریس با ماتریس A به عنوان انتظار ریاضی از بازده او بیان می شود.

E (A، x، y) = (1.20)

بدیهی است که میانگین بازده بازیکن اول تابعی از دو مجموعه متغیر x و y است. بازیکن اول قصد دارد با تغییر استراتژی های مختلط x خود میانگین سود E (A, x, y) را به حداکثر برساند و بازیکن دوم به دنبال آن است که E (A, x, y) را از طریق استراتژی های ترکیبی خود حداقل کند. برای حل بازی، باید x، y را پیدا کرد که قیمت بالای بازی به آن می رسد.

1.3 سفارش بازی 22

یک بازی ماتریسی به ترتیب 22 توسط ماتریس سود زیر برای بازیکن اول ارائه می شود:

راه حل این بازی باید با یافتن نقطه زینتی در استراتژی های ناب آغاز شود. برای این منظور، حداقل عنصر را در ردیف اول پیدا کنید و بررسی کنید که آیا در ستون آن حداکثر است یا خیر. اگر چنین عنصری یافت نشد، خط دوم نیز به همین ترتیب بررسی می شود. اگر چنین عنصری در خط دوم یافت شود، آنگاه عنصر زین است.

با یافتن یک عنصر زین، در صورت وجود، فرآیند یافتن راه حل آن به پایان می رسد، زیرا در این صورت قیمت بازی پیدا می شود - یک عنصر زین و یک نقطه زین، یعنی یک جفت استراتژی ناب برای اول و دوم. بازیکنان، استراتژی های خالص بهینه را تشکیل می دهند. اگر در استراتژی های محض نقطه زین وجود نداشته باشد، در استراتژی های مختلط باید نقطه زینی پیدا کرد که الزاماً طبق قضیه اصلی بازی های ماتریسی وجود دارد.

استراتژی های ترکیبی بازیکن اول و دوم را به ترتیب با x=(x 1 , x 2)، y=(y 1 ,y 2) نشان دهید. به یاد بیاورید که x 1 به معنای احتمال استفاده بازیکن اول از استراتژی اول خود است و x 2 \u003d 1 - x 1 احتمال استفاده از استراتژی دوم او است. به طور مشابه برای بازیکن دوم: 1 - احتمال استفاده از استراتژی اول، y 2 = 1 - 1 - احتمال استفاده از استراتژی دوم.

با توجه به نتیجه قضیه، برای بهینه بودن راهبردهای مختلط x و y لازم و کافی است که برای غیر منفی x 1 , x 2 , y 1 , y 2 روابط زیر برقرار باشد:

اکنون نشان می‌دهیم که اگر بازی ماتریسی در استراتژی‌های خالص نقطه زینتی نداشته باشد، این نابرابری‌ها باید به برابری تبدیل شوند:

در واقع. اجازه دهید بازی در استراتژی های خالص نقطه زینتی نداشته باشد، سپس مقادیر بهینه استراتژی های ترکیبی نابرابری ها را برآورده می کند.

0<<1, 0<< 1,

0< <1, 01. (1.25)

فرض کنید که هر دو نابرابری از (1.22) سخت هستند

سپس، طبق قضیه، y 1 = y 2 = 0، که با شرایط (1.25) در تضاد است.

می توان به طور مشابه ثابت کرد که هر دو نابرابری در (1.23) نمی توانند نابرابری های دقیق باشند.

حال فرض کنید یکی از نابرابری های (1.22) می تواند سخت باشد، مثلاً اولی

این بدان معنی است که با توجه به قضیه y 1 = 0، y 2 = 1. بنابراین از (1.23) بدست می آوریم

اگر هر دو نابرابری (1.24) دقیق باشند، با قضیه x1 = x2 = 0، که با (1.25) تناقض دارد. اما اگر 12 a 22 باشد، یکی از نابرابری ها (1.27) سخت و دیگری برابری است. علاوه بر این، برابری برای عنصر بزرگتر از 12 و 22 برقرار است، یعنی یک نابرابری از (1.27) باید دقیق باشد. به عنوان مثال یک 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

بنابراین، نشان داده می شود که اگر بازی ماتریسی در استراتژی های خالص نقطه زینی نداشته باشد، نابرابری های (1.22) برای استراتژی های بهینه بازیکن اول به برابری تبدیل می شوند. استدلال های مشابه در مورد نابرابری ها (1.23) منجر به این واقعیت می شود که در این مورد نابرابری های (1.23) باید برابر باشند.

بنابراین، اگر یک بازی ماتریسی درجه 22 فاقد نقطه زین باشد، می توان استراتژی های ترکیبی بهینه بازیکنان و قیمت بازی را با حل سیستم معادلات (1.24) تعیین کرد. همچنین مشخص شده است که اگر در یک بازی ماتریس 2x2 یکی از بازیکنان یک استراتژی خالص بهینه داشته باشد، بازیکن دیگر نیز یک استراتژی خالص بهینه دارد.

بنابراین، اگر یک بازی ماتریسی در استراتژی های محض نقطه زینی نداشته باشد، باید در استراتژی های ترکیبی که از معادلات (1.24) تعیین می شود، راه حل داشته باشد. راه حل سیستم (1.25)

1.4 روش جبری

برای حل مسائل به روش جبری دو حالت وجود دارد:

1. ماتریس یک نقطه زین دارد.

2. ماتریس نقطه زین ندارد.

در حالت اول، راه حل یک جفت استراتژی است که نقطه زین بازی را تشکیل می دهد. بیایید مورد دوم را در نظر بگیریم. راه حل ها را در اینجا باید در استراتژی های ترکیبی جستجو کرد:

یافتن استراتژی ها و وقتی بازیکن اول از استراتژی بهینه خود استفاده می کند، بازیکن دوم می تواند به عنوان مثال، دو استراتژی ناب را به کار گیرد

در عین حال، به موجب ویژگی، اگر یکی از بازیکنان از استراتژی ترکیبی بهینه استفاده کند، و دیگری - هر خالصی که در استراتژی ترکیبی بهینه خود با احتمال غیر صفر گنجانده شده باشد، انتظار ریاضی سود همیشه وجود دارد. بدون تغییر باقی می ماند و برابر با قیمت بازی، یعنی.

پرداخت باید در هر یک از این موارد برابر با ارزش بازی V باشد. در این حالت روابط زیر معتبر است:

سیستمی از معادلات مشابه (2.5)، (2.6) نیز می تواند برای استراتژی بهینه بازیکن دوم ایجاد شود:

با در نظر گرفتن شرایط عادی سازی:

بیایید معادله (1.37) - (1.41) را با توجه به مجهولات حل کنیم، و نه همه در یک زمان، بلکه سه در یک زمان: جداگانه (1.36)، (1.38)، (1.40) و (1.37)، (1.39) ، (1.41). در نتیجه راه حل، به دست می آوریم:

1.5 روش گرافیکی

راه حل تقریبی بازی 22 را می توان به راحتی با استفاده از روش گرافیکی به دست آورد. ماهیت آن به شرح زیر است:

شکل 1.1 - یافتن مقطعی از طول واحد

قسمتی از طول واحد را روی محور آبسیسا انتخاب کنید. انتهای سمت چپ آن اولین استراتژی بازیکن اول و انتهای سمت راست بازیکن دوم را به تصویر می کشد. تمام نقاط میانی با استراتژی های ترکیبی بازیکن اول مطابقت دارد و طول قسمت سمت راست نقطه برابر با احتمال استفاده از استراتژی اول است و طول قسمت سمت چپ احتمال استفاده است. استراتژی دوم توسط بازیکن اول.

دو محور I-I و II-II انجام می شود. در I-I زمانی که بازیکن اول از استراتژی اول استفاده می کند، پرداخت را به تعویق می اندازیم، در II-II زمانی که از استراتژی دوم استفاده می کند. به عنوان مثال، اجازه دهید بازیکن دوم اولین استراتژی خود را اعمال کند، سپس مقدار باید در محور I-I ترسیم شود و مقدار در محور II-II ترسیم شود.

برای هر استراتژی ترکیبی بازیکن اول، بازده او بر اساس اندازه بخش تعیین می شود. خط I-I مربوط به اعمال استراتژی اول توسط بازیکن دوم است، ما آن را اولین استراتژی بازیکن دوم می نامیم. استراتژی دوم بازیکن دوم را می توان به طور مشابه ساخت. سپس به طور کلی نمایش گرافیکی ماتریس بازی به شکل زیر خواهد بود:

شکل 1.2 - یافتن قیمت بازی

البته لازم به ذکر است که این ساخت و ساز برای بازیکن اول انجام شده است. در اینجا طول قطعه برابر با مقدار بازی V است.

خط 1N2 خط بازده پایین تر نامیده می شود. در اینجا به وضوح مشاهده می شود که نقطه N مربوط به حداکثر مقدار سود تضمین شده بازیکن اول است.

به طور کلی، استراتژی بازیکن دوم را نیز می توان از این رقم تعیین کرد، به عنوان مثال در چنین راه هایی. در محور I-I:

یا در محور II-II

با این حال، استراتژی بازیکن دوم نیز می تواند به همان شکلی که برای بازیکن اول انجام می شود، تعریف شود. چنین نموداری بسازید

شکل 1.3 - تعریف استراتژی بازیکن دوم

در اینجا خط 1N2 حد بالایی ضرر است. نقطه N مربوط به حداقل باخت احتمالی بازیکن دوم است و استراتژی را تعیین می کند.

بسته به مقادیر خاص ضرایب، ماتریس های نمودار نیز ممکن است شکل متفاوتی داشته باشند، به عنوان مثال، به شرح زیر:

شکل 1.4 - استراتژی بهینه بازیکن اول را تعیین می کند

در چنین شرایطی، استراتژی بهینه بازیکن اول خالص است:

1.6 بازی 2n یا m2

در بازی های مرتبه 2n، بازیکن اول 2 استراتژی خالص دارد و بازیکن دوم n استراتژی خالص دارد، یعنی. ماتریس بازده برای بازیکن اول:

اگر چنین بازی نقطه زینی داشته باشد، پیدا کردن آن و به دست آوردن راه حل آسان است.

فرض کنید بازی دارای نقاط زین است. سپس باید چنین استراتژی های ترکیبی و به ترتیب بازیکن اول و دوم و قیمت بازی v یافت که روابط را برآورده می کند:

از آنجایی که بازی نقطه زینی ندارد، نابرابری (1.54) با نابرابری ها جایگزین می شود.

برای حل سیستم های (1.56)، (1.55)، (1.53) استفاده از روش گرافیکی به مصلحت است. برای این منظور، نماد سمت چپ نابرابری (1.53) را معرفی می کنیم.

مدل ریاضی بازی ماتریسی

یا با تنظیم از (1.55) و انجام تبدیل های ساده، به دست می آوریم

میانگین بازده بازیکن اول کجاست، مشروط بر اینکه از استراتژی ترکیبی خود استفاده کند، و دومی - j-امین استراتژی خالص خود.

با توجه به عبارت، هر مقدار j=1، 2، …، n مربوط به یک خط مستقیم در یک سیستم مختصات مستطیلی است.

هدف بازیکن دوم این است که با انتخاب استراتژی های بازیکن اول، سود بازیکن اول را به حداقل برساند. بنابراین محاسبه می کنیم

کران پایین مجموعه محدودیت کجاست. در شکل 1.6 نمودار تابع با یک خط ضخیم نشان داده شده است.

میزبانی شده در http://www.allbest.ru/

شکل 1.6 - نمودار تابع

هدف بازیکن اول این است که سود خود را از طریق انتخاب به حداکثر برساند. محاسبه

در شکل 1.6، نقطه به معنای حداکثر مقداری است که در آن به دست می آید. قیمت بازی چون:

بنابراین، استراتژی ترکیبی بهینه بازیکن اول و یک جفت استراتژی خالص بازیکن دوم به صورت گرافیکی تعیین می شوند که یک نقطه در تقاطع را تشکیل می دهند.شکل 1.6 استراتژی های 2 و 3 بازیکن دوم را نشان می دهد. برای چنین استراتژی هایی، نابرابری (1.53) به برابری تبدیل می شود. در شکل 1.6، اینها استراتژی های j=2، j=3 هستند.

حالا می توانیم سیستم معادلات را حل کنیم

و مقادیر و را دقیقاً تعیین کنید (از نظر گرافیکی تقریباً تعیین می شوند). سپس با قرار دادن تمام مقادیر در آن j هایی که برای آنها نقطه تشکیل نمی دهند، سیستم معادلات (1.56) حل می شود. برای مثال نشان داده شده در شکل 1.6، این سیستم زیر است:

و بقیه این سیستم را می توان با شیب حل کرد اگر برای برخی j=j 0، استراتژی های بازیکن دوم یک نقطه M 0 را تشکیل دهند و سپس حداکثر مقدار کران پایینی مجموعه های محدودیت با یک قطعه موازی نشان داده شود. محور در این حالت، بازیکن اول دارای بی نهایت مقادیر بهینه و قیمت بازی است. بازیکن دوم یک استراتژی بهینه خالص j=j 0 دارد.

بازی های ماتریسی سفارش m2 نیز با روش گرافیکی حل می شوند. ماتریس پرداخت اولین بازیکن در این مورد دارای فرم است

استراتژی های ترکیبی بازیکنان اول و دوم به ترتیب مانند بازی های درجه 2n تعریف می شوند. اجازه دهید مقدار از 0 تا 1 در امتداد محور افقی ترسیم شود، مقدار میانگین بازدهی بازیکن اول در محور عمودی، در شرایطی که بازیکن اول استراتژی i-ام خالص خود را اعمال کند (i=1، 2، ...، m)، دوم - استراتژی مختلط او (y 1، 1- y 1) =y. به عنوان مثال، زمانی که m=4 به صورت گرافیکی) را می توان همانطور که در شکل 1.7 نشان داده شده است نشان داد.

شکل 1.7 - نمودار تابع)

بازیکن اول سعی می کند میانگین سود خود را به حداکثر برساند، بنابراین سعی می کند پیدا کند

تابع به صورت یک خط ضخیم نشان داده می شود و کران بالایی مجموعه محدودیت را نشان می دهد. بازیکن دوم سعی می کند با انتخاب استراتژی خود را به حداقل برساند. مقدار مطابقت دارد

در شکل، مقدار با یک نقطه نشان داده شده است. به عبارت دیگر، چنین دو استراتژی بازیکن اول و احتمال برای بازیکن دوم تعریف می شود که برای آنها برابری حاصل می شود.

از شکل می بینیم که قیمت بازی ترتیب نقطه است، احتمال آبسیسا نقطه است. برای بقیه استراتژی های خالص بازیکن اول در استراتژی ترکیبی بهینه باید ().

بنابراین با حل سیستم (1.69) استراتژی بهینه بازیکن دوم و ارزش بازی را بدست می آوریم. با حل سیستم معادلات زیر، استراتژی ترکیبی بهینه را برای اولین بازیکن پیدا می کنیم:

1.7 روش ماتریسی برای حل بازی

نام گذاری ها:

هر زیرماتریس مربعی از ماتریس سفارش

ماتریس (1)؛

ماتریس منتقل شده به;

ماتریس متصل به B؛

- (1) ماتریسی به دست آمده از X با حذف عناصری که مربوط به ردیف های حذف شده از هنگام دریافت است.

- (1) ماتریسی به دست آمده از حذف عناصری که مربوط به ردیف های حذف شده از هنگام دریافت است.

الگوریتم:

1. یک زیرماتریس مربعی از ماتریس ترتیب () را انتخاب کرده و محاسبه کنید

2. اگر مقداری یا، ماتریس پیدا شده را دور بیندازید و ماتریس دیگری را امتحان کنید.

3. اگر ()، ()، X و از و با جمع صفر در جاهای مناسب محاسبه و می سازیم.

بررسی اینکه آیا نابرابری ها برآورده شده اند یا خیر

برای هر (1.75)

و نابرابری ها

برای هر (1.76)

اگر یکی از نسبت ها برآورده نشد، دیگری را امتحان می کنیم. اگر همه روابط معتبر هستند، X و راه حل های مورد نظر.

1.8 روش تقریب متوالی قیمت بازی

در بررسی موقعیت های بازی، اغلب ممکن است اتفاق بیفتد که نیازی به یک راه حل دقیق برای بازی نباشد یا به دلایلی، یافتن ارزش دقیق هزینه بازی و استراتژی های ترکیبی بهینه غیرممکن یا بسیار دشوار باشد. سپس می توانید از روش های تقریبی برای حل بازی ماتریس استفاده کنید.

اجازه دهید یکی از این روش ها را شرح دهیم - روش تقریب متوالی قیمت بازی. تعداد بازده های محاسبه شده با استفاده از روش تقریباً متناسب با تعداد ردیف ها و ستون های ماتریس پرداخت افزایش می یابد.

ماهیت روش به شرح زیر است: از نظر ذهنی بازی بارها انجام می شود، یعنی. به طور متوالی، در هر بازی، بازیکن استراتژی را انتخاب می کند که بیشترین بازده کلی (کل) را به او می دهد.

پس از چنین اجرای برخی از بازی ها، میانگین مقدار برد بازیکن اول و باخت بازیکن دوم را محاسبه می کند و میانگین حسابی آنها به عنوان مقدار تقریبی قیمت بازی در نظر گرفته می شود. این روش امکان یافتن یک مقدار تقریبی از استراتژی های ترکیبی بهینه هر دو بازیکن را فراهم می کند: لازم است فرکانس استفاده از هر استراتژی خالص را محاسبه کرده و آن را به عنوان یک مقدار تقریبی در استراتژی ترکیبی بهینه بازیکن مربوطه در نظر بگیریم.

می توان ثابت کرد که با افزایش نامحدود تعداد بازی های برنامه ای، میانگین سود بازیکن اول و میانگین ضرر بازیکن دوم به طور نامحدود به قیمت بازی نزدیک می شود و مقادیر تقریبی استراتژی های ترکیبی در در صورتی که راه حل بازی منحصر به فرد باشد، به استراتژی های ترکیبی بهینه هر بازیکن تمایل دارد. به طور کلی، تقریب مقادیر بالاتر از مقادیر مشخص شده به مقادیر واقعی کند است. با این حال، این فرآیند را می توان به راحتی مکانیزه کرد و در نتیجه به دستیابی به راه حلی برای بازی با درجه دقت مورد نیاز حتی با ماتریس های سود نسبتاً بزرگ کمک کرد.

2. بخش عملی

این زوج تصمیم می گیرند که کجا برای پیاده روی بروند و زمانی را به نفع دو نفر بگذرانند.

دختر تصمیم می گیرد برای گرفتن هوای تازه در پارک قدم بزند و عصر برای دیدن فیلم در نزدیکترین سینما.

این پسر پس از تماشای بازی بازیکنان فوتبال باشگاه محلی در استادیوم مرکزی پیشنهاد می کند به تکنوپارک برود.

مطابق با این، باید دریابید که هدف یکی از بازیکنان تا چه زمانی محقق می شود. ماتریس پرداخت به این صورت خواهد بود:

جدول 1. ماتریس سود

استراتژی ها

از 1 2، بدیهی است که هیچ نقطه زینتی در این بازی در استراتژی های خالص وجود ندارد. بنابراین، از فرمول های زیر استفاده می کنیم و به دست می آوریم:

میزبانی شده در http://www.allbest.ru/

2.2 پخش 2xn و mx2

مسئله 1 (2xn)

دو محصول برای آب و هوای خشک و مرطوب کشت می شود.

و حالت طبیعت را می توان به صورت: خشک، مرطوب، معتدل در نظر گرفت.

میزبانی شده در http://www.allbest.ru/

حداکثر مقدار M() در نقطه M حاصل می شود که از تقاطع خطوط مربوط به j=1، j"=2 تشکیل شده است. بنابراین، فرض می کنیم:

مسئله 2 (mx2)

پسر و دختر در حال بررسی گزینه هایی هستند که برای آخر هفته کجا بروند.

انتخاب مکان استراحت را می توان به صورت: پارک، سینما، رستوران نشان داد.

میزبانی شده در http://www.allbest.ru/

حداکثر مقدار M() در نقطه E حاصل می شود که از تقاطع خطوط مربوط به j=1، j"=2 تشکیل شده است. بنابراین، فرض می کنیم:

برای تعیین مقدار v، باید معادلات زیر را حل کنید:

2.5 روش ماتریسی

دو رستوران رقیب (موسسات پذیرایی) مجموعه خدمات زیر را ارائه می دهند. اولین رستوران در مرکز و دیگری در حومه شهر واقع شده است.

رستوران مرکزی شامل خدمات زیر می باشد:

1) خدمات مشتری گران تر و بهتر؛

2) غذاها بر غذاهای فرانسوی متمرکز شده اند.

رستوران دوم ارائه می دهد:

1) خدمات گران قیمت و با کیفیت بالا نیست.

2) منو ترکیبی از غذاهای مختلف معروف جهان است.

3) همچنین تبلیغات و تخفیف های منظم؛

4) تحویل را انجام می دهد و سفارشات تحویل درب منزل را می پذیرد.

بر اساس تکلیف، سود یک روزه بین دو رستوران به شرح زیر تقسیم می شود:

جدول 2. ماتریس سود

استراتژی ها

حل یک بازی از فرم به روش ماتریسی:

شش زیر ماتریس وجود دارد و:

ماتریس را در نظر بگیرید:

x 1 =؟ 0،x2=؟ 0

از آنجایی که x 2 =< 0, то мы отбрасываем.

اکنون ماتریس را در نظر بگیرید:

x 1 =؟ 0،x2=؟ 0

قیمت بازی.

این نسبت مغایر با الزام است، بنابراین مناسب نیست.

اکنون ماتریس را در نظر بگیرید:

x 1 = , x 2 = ? 0،

y 1 =< 0, y 2 = ? 0.

از آنجایی که y 1 =< 0, то мы отбрасываем и.

اکنون ماتریس را در نظر بگیرید:

x 1 \u003d، x 2 \u003d 0، از آنجایی که x 2 \u003d 0 است، سپس ما و.

اکنون ماتریس را در نظر بگیرید:

x 1 = , x 2 = ? 0. از آنجایی که x 1 \u003d 0، سپس ما و.

اکنون ماتریس را در نظر بگیرید:

x 1 =، x 2 =، y 1 =، y 2 =، سپس ادامه می دهیم:

x 1 = ، x 2 = ، y 1 = ، y 2 = یا

قیمت بازی.

اکنون روابط اصلی بررسی می شود:

میزبانی شده در http://www.allbest.ru/

پاسخ: x 1 =، x 2 =، y 1 =، y 2 =، y 3 = 0، y 4 =0،.

روش قهوه ای

به درخواست کارگران یک شرکت خاص، اتحادیه کارگری با مدیریت خود در مورد سازماندهی غذای گرم با هزینه شرکت مذاکره می کند. اتحادیه کارگری که منافع کارگران را نمایندگی می کند تضمین می کند که وعده غذایی با بالاترین کیفیت ممکن و در نتیجه گران تر باشد. مدیریت شرکت دارای منافع متضادی است. در پایان طرفین در موارد زیر به توافق رسیدند. اتحادیه کارگری (بازیکن 1) یکی از سه شرکت (A 1 , A 2 , A 3) عرضه کننده غذاهای گرم را انتخاب می کند و مدیریت شرکت (بازیکن 2) مجموعه ای از ظروف را از بین سه گزینه ممکن (B 1 , B 2 ) انتخاب می کند. ب 3) . پس از امضای قرارداد، اتحادیه کارگری ماتریس پرداخت زیر را تشکیل می دهد که عناصر آن هزینه مجموعه ای از ظروف را نشان می دهد:

اجازه دهید بازی با ماتریس سود زیر ارائه شود:

فرض کنید بازیکن دوم استراتژی دوم خود را انتخاب کرده باشد، سپس نفر اول دریافت خواهد کرد:

2 اگر از استراتژی اول خود استفاده کند،

3 اگر از استراتژی سوم خود استفاده کند.

مقادیر به دست آمده در جدول 1 خلاصه شده است.

جدول 3. استراتژی بازیکن دوم

شماره دسته

استراتژی بازیکن دوم

برد بازیکن اول

جدول 3 نشان می دهد که با استراتژی دوم بازیکن دوم، بازیکن اول بیشترین بازده 3 را با استفاده از استراتژی دوم یا سوم خود دریافت می کند. از آنجایی که بازیکن اول می خواهد حداکثر بازده را دریافت کند، به استراتژی دوم بازیکن دوم با استراتژی دوم خود پاسخ می دهد. با استراتژی دوم بازیکن اول، نفر دوم بازنده خواهد شد:

1 اگر او اولین استراتژی خود را اعمال کند،

3 اگر از استراتژی دوم خود استفاده کند،

4 اگر از استراتژی سوم خود استفاده کند.

جدول 4. استراتژی بازیکن اول

شماره دسته

1 استراتژی بازیکن

از دست دادن بازیکن دوم

جدول 2 نشان می دهد که با استراتژی 2 بازیکن اول، بازیکن دوم در صورت اعمال استراتژی 1 کمترین باخت 1 را خواهد داشت. از آنجایی که بازیکن دوم می خواهد کمتر ببازد، پس در پاسخ به استراتژی دوم بازیکن اول، استراتژی اول خود را اعمال خواهد کرد. نتایج به دست آمده در جدول 5 خلاصه شده است.

جدول 5. استراتژی های بازیکنان اول و دوم به ترتیب

شماره دسته

استراتژی بازیکن دوم

مجموع بردهای بازیکن اول

1 استراتژی بازیکن

روی میز. 5 در ستون استراتژی بازیکن دوم در خط دوم عدد 1 است که نشان می دهد در بازی دوم برای بازیکن دوم سودمند است که از استراتژی اول خود استفاده کند. در ستون و بزرگترین میانگین پرداخت 3 بازیکن اول است که توسط او در بازی اول دریافت شده است. ستون w حاوی کمترین میانگین ضرر 1 است که توسط بازیکن دوم در بازی اول دریافت شده است. ستون v حاوی میانگین حسابی v = (u + w) است -- یعنی مقدار تقریبی قیمت بازی که در نتیجه انجام یک بازی از بازی به دست می آید. اگر بازیکن دوم از استراتژی 1 خود استفاده کند، بازیکن اول با استراتژی های 1، 2، 3 به ترتیب 3، 1، 2 می گیرد و مجموع بازده بازیکن اول برای هر دو بازی خواهد بود:

2 + 3=5 با اولین استراتژی خود،

3 + 1=4 با استراتژی دوم خود،

3 + 2=5 با استراتژی سوم خود.

این کل بردها در خط دوم جدول ثبت شده است. 3 و در ستون های مربوط به استراتژی های بازیکن اول: 1، 2، 3.

از مجموع کل پرداخت ها، بزرگترین آن 5 است. با استراتژی های 1 و 3 بازیکن اول به دست می آید، سپس او می تواند هر یک از آنها را انتخاب کند. مثلاً، در چنین مواردی که دو (یا چند) بازده کل یکسان وجود دارد، استراتژی با کمترین تعداد انتخاب می‌شود (در مورد ما، باید استراتژی اول را انتخاب کنیم).

با استراتژی 1 بازیکن اول، بازیکن دوم به ترتیب 3، 2، 3 به استراتژی های 1، 2، 3 خود بازنده می شود و مجموع باخت بازیکن دوم برای هر دو بازی خواهد بود:

1 + 3 = 4 با اولین استراتژی خود،

3 + 2 = 5 با استراتژی دوم خود،

4 + 3=7 با استراتژی سوم خود.

مجموع این ضررها در ردیف دوم جدول ثبت شده است. 5 و در ستون های مربوط به استراتژی های 1، 2، 3 بازیکن دوم.

از مجموع باخت های بازیکن دوم، کوچکترین آن 4 است. با استراتژی اول او به دست می آید، بنابراین در بازی سوم، بازیکن دوم باید استراتژی اول خود را اعمال کند. در ستون قرار دهید و بیشترین سود کل بازیکن اول را در دو بازی تقسیم کنید، تقسیم بر تعداد بازی، یعنی؛ ستون w شامل کوچکترین ضرر کل بازیکن دوم در دو بازی است که بر تعداد بازی ها تقسیم می شود، یعنی ; میانگین حسابی این مقادیر در ستون v قرار می گیرد، یعنی = این عدد به عنوان مقدار تقریبی قیمت بازی با دو بازی "بازی شده" در نظر گرفته می شود.

بدین ترتیب جدول 4 زیر برای دو ست بازی بدست می آید.

جدول 6. کل سود و زیان بازیکنان در دو بازی انجام شده

استراتژی بازیکن دوم

مجموع بردهای بازیکن اول

1 استراتژی بازیکن

باخت کل بازیکن دوم

در ردیف سوم جدول 6 در ستون استراتژی بازیکن دوم عدد 1 وجود دارد که نشان می دهد در بازی سوم بازیکن دوم باید اولین استراتژی خود را اعمال کند. در این حالت، بازیکن اول با استفاده از استراتژی های اول، دوم و سوم خود به ترتیب 3، 1، 2 برنده می شود و مجموع سود او برای سه بازی به صورت زیر خواهد بود:

3 + 5 = 8 در اولین استراتژی او،

1 + 4 = 5 با استراتژی دوم خود،

2 + 5 = 7 برای استراتژی سوم او.

این مجموع بازده های بازیکن اول در ردیف سوم جدول 6 و ستون های مربوط به استراتژی های 1، 2، 3 او ثبت می شود. از آنجایی که بیشترین بازده کل 8 بازیکن اول با استراتژی اول به دست می آید، او بر این اساس نفر اول را انتخاب می کند. .

با استراتژی 1 بازیکن اول، بازیکن دوم به ترتیب 3، 1، 2 به استراتژی های 1، 2، 3 بازنده می شود و مجموع باخت بازیکن دوم برای هر دو بازی خواهد بود:

3 + 4 = 7 با اولین استراتژی خود،

2 + 5 = 7 با استراتژی دوم خود،

3 + 7=10 با استراتژی سوم خود.

مجموع این ضررها در سطر سوم جدول ثبت شده است. 6 و در ستون های مربوط به استراتژی های 1، 2، 3 بازیکن دوم. از مجموع باخت های او، 7 کوچکترین است و با استراتژی های 1 و 2 به دست می آید، سپس بازیکن دوم باید استراتژی 1 خود را اعمال کند.

روی میز. 6 در ردیف سوم در ستون و بزرگترین کل بردهای بازیکن اول در سه بازی تقسیم بر تعداد بازی، یعنی ; ستون w شامل کوچکترین باخت کل بازیکن دوم در سه بازی است که بر تعداد بازی ها تقسیم می شود. در ستون V میانگین حسابی آنها را قرار دهید

بنابراین ما جدول را دریافت می کنیم. 7 برای سه مهمانی.

جدول 7. مجموع سود و باخت بازیکنان در سه بازی انجام شده

شماره دسته

استراتژی بازیکن دوم

مجموع بردهای بازیکن اول

1 استراتژی بازیکن

باخت کل بازیکن دوم

جدول 8. جدول نهایی با بیست بازی انجام شده

شماره دسته

استراتژی بازیکن دوم

مجموع بردهای بازیکن اول

1 استراتژی بازیکن

باخت کل بازیکن دوم

از جدول. 7 و 8 مشاهده می شود که در 20 بازی از دست رفته، استراتژی های 1، 2، 3 برای بازیکن اول به ترتیب 12، 3، 5 بار اتفاق می افتد، بنابراین فراوانی نسبی آنها به ترتیب برابر است. استراتژی های 1، 2، 3 برای بازیکن دوم به ترتیب 7، 11.2 بار رخ می دهند، بنابراین فراوانی نسبی آنها به ترتیب برابر است. ارزش تقریبی قیمت بازی این تقریب به اندازه کافی خوب است.

در خاتمه، توجه می کنیم که اگر بازی بیش از یک راه حل داشته باشد، مقادیر تقریبی هزینه بازی همچنان به هزینه واقعی بازی به طور نامحدود نزدیک می شود و فرکانس های نسبی ظاهر استراتژی های بازی بازیکنان دیگر لزوماً به استراتژی های ترکیبی بهینه واقعی بازیکنان نزدیک نخواهند شد.

تجزیه و تحلیل نتایج

در این دوره، مطالبی برای یافتن راه حل برای بازی های متضاد با روش گرافیکی ماتریسی، روش تقریب متوالی قیمت بازی مورد مطالعه قرار می گیرد. استراتژی های بهینه بازیکنان اول و دوم و همچنین هزینه بازی در بازی های 2x2، 2xn و mx2 و همچنین در بازی های به روش ماتریس و روش براون یافت می شود.

به عنوان مثال از یک جفت، یک بازی 2x2 مدل سازی شد که با روش جبری و گرافیکی حل شد. حل بازی به روش جبری نشان می دهد که با اعمال استراتژی های ترکیبی بهینه خود، بازیکنان اول و دوم 4.6 ساعت را با هم سپری می کنند. حل گرافیکی مشکل با یک خطای کوچک مشخص شد و به 4.5 ساعت رسید.

و همچنین دو کار 2xn و mx2 مدلسازی شد. در مسئله 2xn فرهنگ کشاورزی در نظر گرفته شد و استراتژی نشان می دهد که بهتر است مزرعه را 50 در 50 بکارید و قیمت بازی 3.75 میلیون روبل بود. و در مسئله mx2 یک جفت در نظر گرفته شد که استراتژی آن نشان داد که رفتن به پارک و سینما ارزانتر است و قیمت و هزینه آن 4.3 روبل خواهد بود.

یک کار برای روش ماتریسی مدل‌سازی شد که در آن دو رستوران در نظر گرفته شد، حل مسئله نشان داد که هنگام اعمال استراتژی ترکیبی بهینه آن، سود اولین رستوران 15.6 میلیون روبل خواهد بود و هنگام استفاده از استراتژی ترکیبی بهینه آن توسط رستوران دوم، به اولین رستوران اجازه نمی دهد بیش از 15.6 میلیون روبل کسب کند. راه حل با روش گرافیکی خطا داد و قیمت بازی 14.9 میلیون روبل بود.

برای روش براون، وظیفه ای تنظیم شد که در آن مدیریت اتحادیه و شرکت در نظر گرفته می شود، وظیفه آنها تامین غذا برای کارگران است. وقتی هر دو بازیکن از استراتژی های بهینه خود استفاده کنند، غذا برای هر نفر 2.45 هزار روبل خواهد بود.

فهرست منابع استفاده شده

1) Vilisov V.Ya. یادداشت های سخنرانی "تئوری بازی ها و راه حل های آماری"، - شعبه - "وسخود" MAI. 1979. 146 ص.

2) Krushevsky A.V. نظریه بازی، - کیف: مدرسه ویشچا، 1977. - 216 ص.

3) Cherchmen U., Akof R., Arnof L., Introduction to Operation Research. - م.: علم. 1967. - 488 ص.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0 %B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

میزبانی شده در Allbest.ru

اسناد مشابه

    تصمیم گیری به عنوان نوع خاصی از فعالیت های انسانی. نمایش منطقی ماتریس بازی. نمونه هایی از بازی های ماتریسی در استراتژی های خالص و ترکیبی. تحقیق در عملیات: رابطه مسائل برنامه ریزی خطی با مدل نظری بازی.

    مقاله ترم، اضافه شده 05/05/2010

    بازی هایی که بارها تکرار می شوند، ویژگی ها و مراحل متمایز آنها. استراتژی ها، شرایط و فرصت های ترکیبی برای استفاده از آنها در عمل. روشی تحلیلی برای حل بازی 2*2 قضایای اساسی برای بازی های مستطیلی. راه حل های جبری

    ارائه، اضافه شده در 2013/10/23

    تعاریف اساسی تئوری بازی های دوماتریسی. نمونه ای از بازی دوماتریسی "دانش آموز-معلم". استراتژی های ترکیبی در بازی های دو ماتریکس "وضعیت تعادل" را جستجو کنید. بازی‌ها و فرمول‌های دو ماتریکس ۲×۲ برای مواردی که هر بازیکن دو استراتژی دارد.

    چکیده، اضافه شده در 1390/02/13

    بررسی اطلاعات کلی در مورد بازی های ماتریسی و آنتاگونیستی. مفهوم بازی موقعیتی، درخت، مجموعه اطلاعات. در نظر گرفتن اصل ماکسیمین و اصل تعادل. بهینه پارتو بازی غیر متضاد موقعیتی، خواص آن.

    مقاله ترم، اضافه شده 10/17/2014

    نظریه بازی ها شاخه ای از ریاضیات است که موضوع آن بررسی مدل های ریاضی برای تصمیم گیری بهینه در تعارض است. روش تکراری براون-رابینسون. الگوریتم تکراری یکنواخت برای حل بازی های ماتریسی.

    پایان نامه، اضافه شده 08/08/2007

    گردآوری ماتریس پرداخت، جستجوی قیمت خالص پایین تر و بالای بازی، استراتژی های حداکثر و حداقل حداکثر بازیکنان. ساده سازی ماتریس پرداخت حل یک بازی ماتریسی با استفاده از کاهش به یک مسئله برنامه نویسی خطی و افزودنی "جستجوی راه حل".

    تست، اضافه شده در 11/10/2014

    تئوری بازی یک نظریه ریاضی از موقعیت های تعارض است. توسعه مدل ریاضی بازی دو نفره با جمع صفر، اجرای آن در قالب کدهای برنامه. روش حل مسئله. داده های ورودی و خروجی برنامه، راهنمای کاربر.

    مقاله ترم، اضافه شده در 1392/08/17

    اطلاعات اولیه در مورد روش سیمپلکس، ارزیابی نقش و اهمیت آن در برنامه ریزی خطی. تفسیر هندسی و معنای جبری. یافتن حداکثر و مینیمم یک تابع خطی، موارد خاص. حل مسئله به روش ماتریس سیمپلکس.

    پایان نامه، اضافه شده در 2015/06/01

    تکنیک هایی برای ساخت مدل های ریاضی سیستم های محاسباتی که ساختار و فرآیندهای عملکرد آنها را منعکس می کند. تعداد دسترسی به فایل در طول کار متوسط. تعیین امکان قرار دادن فایل ها در درایوهای حافظه خارجی.

    کار آزمایشگاهی، اضافه شده در 2013/06/21

    طراحی مدل ریاضی توضیحات بازی تیک تاک پا. مدل بازی منطقی بر اساس جبر بولی. دستگاه های الکترونیکی دیجیتال و توسعه مدل ریاضی آنها. کنسول بازی، کنترلر بازی، رشته برد بازی.

نظریه بازی ها نظریه ای از مدل های ریاضی تصمیم گیری در شرایط تضاد یا عدم قطعیت است. فرض بر این است که اقدامات طرفین در بازی با استراتژی های خاصی مشخص می شود - مجموعه قوانین عمل. اگر سود یک طرف به ناچار منجر به باخت طرف مقابل شود، از بازی های متضاد صحبت می کنند. اگر مجموعه استراتژی ها محدود باشد، بازی را یک بازی ماتریسی می نامند و خیلی ساده می توان راه حل را به دست آورد. راه‌حل‌های به‌دست‌آمده با کمک تئوری بازی‌ها در ترسیم برنامه‌ها در مواجهه با مخالفت‌های احتمالی رقبا یا عدم اطمینان در محیط خارجی مفید است.


اگر بازی دو ماتریس متضاد باشد، ماتریس بازده بازیکن 2 کاملاً توسط ماتریس بازده بازیکن 1 تعیین می شود (عناصر متناظر این دو ماتریس فقط در علائم متفاوت هستند). بنابراین، یک بازی آنتاگونیستی دوماتریسی به طور کامل توسط یک ماتریس منفرد (ماتریس پرداخت بازیکن 1) توصیف می شود و بر این اساس، یک بازی ماتریسی نامیده می شود.

این بازی متضاد است. در آن j \u003d x2 - O, P و R (O, O] \u003d H (P, P) \u003d -I و R (O, P) \u003d R (P, O) \u003d 1 یا به صورت ماتریسی o p

اجازه دهید برخی از کلاس‌های بازی Г "آینه‌بسته" باشند، یعنی. همراه با هر یک از بازی های آن شامل یک بازی هم شکل آینه ای است (از آنجایی که همه بازی هایی که به یک بازی معین هم شکل آینه ای هستند نسبت به یکدیگر هم شکل هستند، مطابق آنچه گفته شد می توانیم از یک بازی هم شکل آینه ای صحبت کنیم). چنین کلاسی مثلاً کلاس همه بازی های آنتاگونیستی یا کلاس همه بازی های ماتریسی است.

با یادآوری تعریف موقعیت‌های قابل قبول در بازی آنتاگونیستی، به این نتیجه می‌رسیم که وضعیت (X, Y) در بسط ترکیبی بازی ماتریس برای بازیکن 1 قابل قبول است اگر و فقط اگر برای هر x G x نابرابری

فرآیند تبدیل بازی ها به بازی های متقارن را تقارن می گویند. ما در اینجا یک روش تقارن را توضیح می دهیم. نسخه دیگری که اساساً متفاوت از تقارن است در بخش 26.7 ارائه خواهد شد. هر دوی این گونه‌های تقارن در واقع برای بازی‌های متضاد دلخواه قابل استفاده هستند، اما فقط برای بازی‌های ماتریسی فرمول‌بندی و اثبات خواهند شد.

بنابراین، اصطلاحات و نام‌گذاری‌های اولیه تئوری بازی‌های متضاد کلی با عبارات و نام‌گذاری‌های مربوط به نظریه بازی‌های ماتریسی منطبق است.

برای بازی های آنتاگونیستی محدود (ماتریسی)، وجود این اکسترم ها توسط ما در فصل 10 اثبات شد. 1، و تمام هدف برقراری برابری آنها یا حداقل یافتن راه هایی برای غلبه بر نابرابری آنها بود.

در نظر گرفتن بازی‌های ماتریسی قبلاً نشان می‌دهد که بازی‌های متضاد بدون موقعیت‌های تعادلی (و حتی بدون موقعیت‌های تعادل الکترونیکی برای e> 0 به اندازه کافی کوچک) در استراتژی‌های ارائه‌شده اولیه بازیکنان وجود دارد.

اما هر بازی محدود (ماتریسی) را می توان به یک بازی بی نهایت گسترش داد، به عنوان مثال، با ارائه هر تعداد از استراتژی های تحت سلطه برای هر بازیکن (به 22 فصل 1 مراجعه کنید). بدیهی است که چنین گسترش مجموعه ای از استراتژی های بازیکن واقعاً به معنای گسترش امکانات او نخواهد بود و رفتار واقعی او در بازی گسترش یافته نباید با رفتار او در بازی اصلی متفاوت باشد. بنابراین، ما بلافاصله به تعداد کافی نمونه از بازی‌های آنتاگونیستی بی‌نهایت که نقاط زینی ندارند، به دست آوردیم. نمونه هایی از این دست نیز وجود دارد.

بنابراین، برای اجرای اصل حداکثر در یک بازی آنتاگونیستی بی‌نهایت، لازم است، مانند بازی محدود (ماتریسی)، قابلیت‌های استراتژیک بازیکنان گسترش یابد. برای سال 96

همانند بازی‌های ماتریسی (به فصل 1 و 17 مراجعه کنید)، برای بازی‌های متضاد کلی، مفهوم طیف استراتژی مختلط نقش مهمی ایفا می‌کند، اما در اینجا باید تعریف کلی‌تری ارائه شود.

در نهایت، توجه داشته باشید که مجموعه همه استراتژی های ترکیبی بازیکن 1 در یک بازی متضاد دلخواه مانند ماتریس است.

حتی در نظر گرفتن بازی‌های متضاد نشان می‌دهد که تعداد زیادی از این گونه بازی‌ها، از جمله بازی‌های محدود، بازی‌های ماتریسی، موقعیت‌های تعادلی دارند، نه در استراتژی‌های اصلی و خالص، بلکه فقط در استراتژی‌های عمومی و ترکیبی. بنابراین، برای بازی‌های عمومی، غیر متضاد و غیرهمکاری، طبیعی است که موقعیت‌های تعادلی را دقیقاً در استراتژی‌های ترکیبی جستجو کنیم.

بنابراین، برای مثال (نگاه کنید به شکل 3.1)، ما قبلاً خاطرنشان کردیم که "پیمانکار" تقریباً هرگز مجبور نیست با عدم قطعیت رفتاری مقابله کند. اما اگر سطح مفهومی را از نوع "مدیر" در نظر بگیریم، همه چیز دقیقا برعکس است. به عنوان یک قاعده، نوع اصلی عدم اطمینانی که چنین «تصمیم گیرنده ما» باید با آن مواجه شود «تعارض» است. اکنون می توانیم روشن کنیم که این معمولاً یک رقابت غیر سختگیرانه است. کمی کمتر، "مدیر" در شرایط "عدم قطعیت طبیعی" تصمیم می گیرد و حتی به ندرت با یک درگیری شدید و متضاد روبرو می شود. علاوه بر این، تضاد منافع هنگام تصمیم گیری توسط "مدیر" اتفاق می افتد، به اصطلاح، "یک بار"، یعنی در طبقه بندی ما، او اغلب فقط یک بازی (گاهی اوقات تعداد بسیار کمی) از بازی را انجام می دهد. مقیاس های ارزیابی پیامدها اغلب کیفی هستند تا کمی. استقلال استراتژیک «مدیر» کاملاً محدود است. با در نظر گرفتن موارد فوق، می توان استدلال کرد که موقعیت های مشکل با این بزرگی اغلب باید با استفاده از بازی های دو ماتریس غیر متضاد غیرهمکاری، علاوه بر این، در استراتژی های خالص تحلیل شوند.

اصول حل بازی های آنتاگونیستی ماتریسی

در نتیجه، منطقی است که انتظار داشته باشیم در بازی توضیح داده شده در بالا، حریفان به استراتژی های انتخابی خود پایبند باشند. بازی متضاد ماتریسی که برای آن max min fiv = min max Aiy>

با این حال، همه بازی‌های آنتاگونیستی ماتریسی کاملاً مشخص نیستند و در حالت کلی

بنابراین، در حالت کلی، برای حل یک بازی متضاد ماتریسی با بعد /uxl، باید یک جفت مسئله برنامه‌نویسی خطی دوگانه را حل کرد که در نتیجه مجموعه‌ای از استراتژی‌های بهینه / و هزینه بازی v.

بازی آنتاگونیستی ماتریسی دو نفر چگونه تعریف می شود؟

روش های ساده سازی و حل بازی های آنتاگونیستی ماتریسی چیست؟

در مورد بازی دو نفره، طبیعی است که منافع آنها را مستقیماً متضاد بدانیم - بازی متضاد است. بنابراین، بازده یک بازیکن برابر با از دست دادن بازیکن دیگر است (مجموع بازده هر دو بازیکن صفر است، از این رو نام بازی با جمع صفر است). ما بازی هایی را در نظر خواهیم گرفت که در آنها هر بازیکن تعداد محدودی گزینه دارد. تابع پرداخت برای چنین بازی دو نفره با مجموع صفر را می توان به صورت ماتریسی (به شکل ماتریس پرداخت) ارائه کرد.

همانطور که قبلاً اشاره شد، بازی متضاد نهایی ماتریس نامیده می شود.

MATRIX GAMES - کلاسی از بازی های متضاد که در آن دو بازیکن شرکت می کنند و هر بازیکن دارای تعداد محدودی استراتژی است. اگر یک بازیکن m استراتژی داشته باشد و بازیکن دیگر n استراتژی داشته باشد، می توانیم یک ماتریس بازی با بعد txn بسازیم. M.i. ممکن است نقطه زین داشته باشد یا نداشته باشد. در مورد دوم

یک بازی جفت صفر محدود را در نظر بگیرید. با نشان دادن آبازده بازیکن آ، و از طریق ب- برد بازیکن ب. زیرا آ = –ب، پس هنگام تجزیه و تحلیل چنین بازی نیازی به در نظر گرفتن هر دوی این اعداد نیست - کافی است که سود یکی از بازیکنان را در نظر بگیرید. بگذارید مثلاً آ. در ادامه برای سهولت ارائه، طرف آما مشروط به نام " ما"و طرف ب – "دشمن".

بگذارید داشته باشیم متراستراتژی های ممکن آ 1 , آ 2 , …, صبح، و دشمن nاستراتژی های ممکن ب 1 , ب 2 , …, B n(چنین بازی را بازی می نامند m×n). فرض کنید هر طرف استراتژی خاصی را انتخاب کرده است: ما انتخاب کرده ایم یک آی، حریف Bj. اگر بازی فقط از حرکات شخصی تشکیل شده باشد، پس انتخاب استراتژی یک آیو Bjبه طور منحصر به فرد نتیجه بازی را تعیین می کند - بازده ما (مثبت یا منفی). بیایید این سود را به عنوان نشان دهیم aij(زمانی که استراتژی را انتخاب می کنیم برنده می شویم یک آی، و دشمن - استراتژی ها Bj).

اگر بازی علاوه بر حرکات تصادفی شخصی، شامل یک جفت استراتژی است یک آی, Bjیک متغیر تصادفی است که به نتایج تمام حرکات تصادفی بستگی دارد. در این مورد، برآورد طبیعی سود مورد انتظار است انتظارات ریاضی یک برد تصادفی. برای راحتی، ما با علامت گذاری می کنیم aijهم خود سود (در یک بازی بدون حرکات تصادفی) و هم انتظارات ریاضی آن (در یک بازی با حرکات تصادفی).

فرض کنید ارزش ها را می دانیم aijبرای هر جفت استراتژی این مقادیر را می توان به عنوان یک ماتریس نوشت که ردیف های آن با استراتژی های ما مطابقت دارند ( یک آی، و ستون ها استراتژی های حریف را نشان می دهند ( Bj):

B j A i ب 1 ب 2 B n
آ 1 آ 11 آ 12 آ 1n
آ 2 آ 21 آ 22 آ 2n
صبح صبح 1 صبح 2 آمن

چنین ماتریسی نامیده می شود ماتریس بازده بازییا به سادگی ماتریس بازی.

توجه داشته باشید که ساخت یک ماتریس بازده برای بازی هایی با تعداد زیادی استراتژی می تواند کار دشواری باشد. به عنوان مثال، برای یک بازی شطرنج، تعداد استراتژی های ممکن آنقدر زیاد است که ساخت یک ماتریس بازده عملا غیرممکن است. با این حال، در اصل هر بازی متناهی را می توان به شکل ماتریسی تقلیل داد.

در نظر گرفتن مثال 1بازی متضاد 4×5. ما چهار راهبرد در اختیار داریم، دشمن پنج راهبرد دارد. ماتریس بازی به شرح زیر است:

B j A i ب 1 ب 2 ب 3 ب 4 ب 5
آ 1
آ 2
آ 3
آ 4

چه استراتژی باید (یعنی بازیکن آ) برای استفاده؟ هر استراتژی که انتخاب کنیم، یک دشمن معقول با استراتژی که بازده ما حداقل خواهد بود به آن پاسخ خواهد داد. مثلاً اگر استراتژی را انتخاب کنیم آ 3 (با یک برد 10 وسوسه می شود)، حریف در پاسخ یک استراتژی را انتخاب می کند ب 1، و بازده ما فقط 1 خواهد بود. بدیهی است که بر اساس اصل احتیاط (و این اصل اصلی نظریه بازی است) باید استراتژی را انتخاب کنیم که در آن حداقل سود ما حداکثر است.

با نشان دادن یک منحداقل ارزش بازده برای استراتژی یک آی:

و یک ستون حاوی این مقادیر را به ماتریس بازی اضافه کنید:

B j A i ب 1 ب 2 ب 3 ب 4 ب 5 حداقل در ردیف یک من
آ 1
آ 2
آ 3
آ 4 حداکثر

هنگام انتخاب یک استراتژی، باید استراتژی را انتخاب کنیم که برای آن ارزش دارد یک منبیشترین. بیایید این مقدار حداکثر را با نشان دهیم α :

مقدار α تماس گرفت قیمت بازی پایین تریا حداکثر(حداکثر حداقل برد). استراتژی بازیکن آمربوط به حداکثر α ، نامیده میشود استراتژی حداکثر.

در این مثال، maximin α برابر با 3 است (سلول مربوطه در جدول به رنگ خاکستری مشخص شده است) و استراتژی حداکثر: آ 4 . با انتخاب این استراتژی، می‌توان مطمئن بود که برای هر رفتاری از دشمن، کمتر از 3 (و شاید بیشتر با رفتار غیر منطقی دشمن) نخواهیم برد. خودمان، به محتاطانه ترین استراتژی ("بیمه اتکایی") پایبند باشیم.

اکنون ما استدلال مشابهی را برای دشمن انجام خواهیم داد ب ب آ ب 2 - به او پاسخ می دهیم آ .

با نشان دادن β j آ ب) برای استراتژی یک آی:



β j β :

7. بازی با ارزش بالا چیست اکنون ما استدلال مشابهی را برای حریف انجام خواهیم داد ب. او علاقه دارد که سود ما را به حداقل برساند، یعنی کمتر به ما بدهد، اما باید روی رفتار ما حساب کند که برای او بدترین است. مثلاً اگر استراتژی را انتخاب کند ب 1، سپس با یک استراتژی به او پاسخ خواهیم داد آ 3، و او به ما 10 می دهد. اگر او انتخاب کند ب 2 - به او پاسخ می دهیم آ 2، و او 8 می دهد و غیره. بدیهی است که یک حریف محتاط باید استراتژی را انتخاب کند که در آن حداکثر سود ما حداقل خواهد بود.

با نشان دادن β jحداکثر مقادیر در ستون های ماتریس پرداخت (حداکثر بازده بازیکن آ، یا، که همان، حداکثر باخت بازیکن است ب) برای استراتژی یک آی:

و یک ردیف حاوی این مقادیر را به ماتریس بازی اضافه کنید:

با انتخاب یک استراتژی، دشمن استراتژی را ترجیح می دهد که ارزش آن را دارد β jکمترین. بیایید آن را با علامت گذاری کنیم β :

مقدار β تماس گرفت قیمت بالای بازییا حداقل(حداقل حداکثر برد). استراتژی حریف (بازیکن) مطابق با حداقل ب)، نامیده میشود استراتژی حداقل.

Minimax مقدار سود است، بیش از آن که یک حریف معقول مطمئناً به ما نخواهد داد (به عبارت دیگر، یک حریف معقول بیشتر از آن ضرر نخواهد کرد. β ). در این مثال، minimax β برابر با 5 است (سلول مربوطه در جدول به رنگ خاکستری مشخص شده است) و با استراتژی حریف به دست می آید. ب 3 .

بنابراین، بر اساس اصل احتیاط («همیشه انتظار بدترین ها را داشته باشید!»)، باید استراتژی را انتخاب کنیم آ 4، و دشمن - یک استراتژی ب 3 . اصل احتیاط در تئوری بازی ها اساسی است و نامیده می شود اصل حداقل.

در نظر گرفتن مثال 2. اجازه دهید بازیکنان آو ATیکی از سه عدد به طور همزمان و مستقل از یکدیگر نوشته می شود: "1" یا "2" یا "3". اگر مجموع اعداد نوشته شده زوج باشد، بازیکن ببه بازیکن پرداخت می کند آاین مقدار. اگر مبلغ فرد باشد، بازیکن این مبلغ را پرداخت می کند آبازیکن AT.

بیایید ماتریس بازده بازی را یادداشت کنیم و قیمت های پایین تر و بالاتر بازی را پیدا کنیم (عدد استراتژی مطابق با عدد نوشته شده است):

بازیکن آباید به استراتژی حداکثر پایبند باشد آ 1 برای بردن حداقل -3 (یعنی حداکثر 3 باخت). Minimax Player Strategy بهر یک از استراتژی ها ب 1 و ب 2، که تضمین می کند که او بیش از 4 نخواهد داد.

اگر ماتریس پرداخت را از دید بازیکن بنویسیم همین نتیجه را خواهیم گرفت AT. در واقع این ماتریس با جابجایی ماتریس ساخته شده از دید بازیکن به دست می آید. آ، و تغییر علائم عناصر به عکس (از زمان پرداخت بازیکن آاز دست دادن بازیکن است AT):

بر اساس این ماتریس، چنین است که بازیکن بباید هر یک از استراتژی ها را دنبال کند ب 1 و ب 2 (و سپس او بیش از 4 را از دست نخواهد داد)، و بازیکن آ- استراتژی ها آ 1 (و سپس او بیش از 3 را از دست نخواهد داد). همانطور که می بینید، نتیجه دقیقاً همان نتیجه به دست آمده در بالا است، بنابراین تجزیه و تحلیل از نقطه نظر اینکه کدام بازیکن آن را انجام می دهیم، مهم نیست.

8 یک بازی با ارزش چیست.

9. اصل MINIMAX از چه چیزی تشکیل شده است. 2. قیمت پایین و بالاتر از بازی. اصل Minimax

یک بازی ماتریسی از نوع با ماتریس بازده را در نظر بگیرید

اگر بازیکن واستراتژی را انتخاب خواهد کرد یک آی، سپس تمام بازده های احتمالی آن عناصر خواهد بود من-مین ردیف ماتریس با. بدترین برای یک بازیکن ومورد زمانی که بازیکن ATاستراتژی مناسب را اعمال می کند کمترینعنصر این خط، بازده بازیکن است وبرابر عدد خواهد بود.

بنابراین، به منظور دریافت حداکثر بازده، بازیکن وشما باید یکی از استراتژی هایی را انتخاب کنید که برای آن تعداد بیشترین.

ساده ترین مورد، که در نظریه بازی ها به تفصیل توضیح داده شده است، یک بازی جفت محدود با مجموع صفر است (بازی متضاد دو شخص یا دو ائتلاف). یک بازی G را در نظر بگیرید که در آن دو بازیکن A و B شرکت می کنند و منافع متضاد دارند: سود یکی برابر است با ضرر دیگری. از آنجایی که پرداخت بازیکن A برابر است با پرداخت بازیکن B با علامت مخالف، ما فقط می توانیم به پرداخت بازیکن a علاقه مند باشیم. طبیعتاً A می خواهد a را به حداکثر برساند و B می خواهد a را به حداقل برساند.

برای سادگی، بیایید خودمان را از نظر ذهنی با یکی از بازیکنان (اجازه دهید A باشد) شناسایی کنیم و او را "ما" و بازیکن B - "رقیب" صدا کنیم (البته هیچ مزیت واقعی برای A از این وجود ندارد). اجازه دهید استراتژی های ممکن و حریف - استراتژی های ممکن را داشته باشیم (چنین بازی را بازی می نامند). اگر از استراتژی استفاده می کنیم و حریف از استراتژی استفاده می کند، اجازه دهید نتیجه خود را مشخص کنیم

جدول 26.1

فرض کنید برای هر جفت استراتژی، بازده (یا بازده متوسط) a برای ما مشخص است. سپس، در اصل، می توان یک جدول مستطیل شکل (ماتریس) تهیه کرد که استراتژی های بازیکنان و بازده های مربوطه را فهرست می کند (جدول 26.1 را ببینید).

اگر چنین جدولی جمع آوری شود، گفته می شود که بازی G به یک فرم ماتریسی تقلیل می یابد (به خودی خود، به دلیل تعداد زیاد استراتژی ها، رساندن بازی به چنین شکلی می تواند یک کار دشوار و گاهی عملاً غیرممکن باشد. ). توجه داشته باشید که اگر بازی به یک فرم ماتریسی کاهش یابد، بازی چند حرکتی در واقع به یک بازی یک حرکت کاهش می یابد - بازیکن باید تنها یک حرکت انجام دهد: یک استراتژی را انتخاب کنید. ما به طور خلاصه به ماتریس بازی اشاره می کنیم

نمونه ای از بازی G (4X5) را به صورت ماتریسی در نظر بگیرید. در اختیار ما (برای انتخاب از بین) چهار استراتژی، دشمن پنج استراتژی دارد. ماتریس بازی در جدول 26.2 آورده شده است

بیایید به این فکر کنیم که ما (بازیکن A) از چه استراتژی استفاده می کنیم؟ ماتریس 26.2 بازده فریبنده "10" را دارد. ما به سمت انتخاب یک استراتژی کشیده می شویم که در آن این "مطلب" را دریافت خواهیم کرد.

اما صبر کنید، دشمن هم احمق نیست! اگر ما استراتژی را انتخاب کنیم، او، برای دشمنی با ما، استراتژی را انتخاب می کند و ما بازدهی بد «1» دریافت خواهیم کرد. نه، شما نمی توانید استراتژی انتخاب کنید! چگونه بودن؟ بدیهی است که بر اساس اصل احتیاط (و این اصل اصلی تئوری بازی ها است) باید استراتژی را انتخاب کنیم که حداقل سود ما حداکثر باشد.

جدول 26.2

این به اصطلاح "اصل مینی حداکثر" است: به گونه ای عمل کنید که با بدترین رفتار حریف، حداکثر سود را به دست آورید.

بیایید جدول 26.2 را بازنویسی کنیم و در ستون اضافی سمت راست، حداقل مقدار یک بهره را در هر خط (حداقل یک خط) یادداشت می کنیم. بیایید آن را برای ردیف a نشان دهیم (جدول 26.3 را ببینید).

جدول 26.3

از بین تمام مقادیر (ستون سمت راست)، بزرگترین (3) انتخاب می شود. با استراتژی مطابقت دارد. با انتخاب این استراتژی، در هر صورت می توانیم مطمئن باشیم که (برای هر رفتار دشمن) کمتر از 3 به دست نمی آوریم. این مقدار سود تضمین شده ماست. با دقت رفتار کنیم، نمی توانیم کمتر از این بگیریم، می توانیم بیشتر به دست آوریم).

به این بازده، قیمت پایین‌تر بازی (یا "maximin" - حداکثر حداقل بازده) گفته می‌شود. ما آن را به عنوان یک نشان خواهیم داد. در مورد ما

حال بیایید دیدگاه دشمن را در نظر بگیریم و برای او استدلال کنیم. او نوعی پیاده نیست، بلکه منطقی است! با انتخاب یک استراتژی، او دوست دارد کمتر بدهد، اما باید روی رفتار ما حساب کند که برای او بدترین است. اگر راهبردی انتخاب کرد به او جواب می دهیم و او 10 می دهد. اگر بخواهد به او پاسخ می دهیم و او آن را پس می دهد و غیره. یک ردیف پایین اضافی به جدول 26.3 اضافه می کنیم و حداکثر ستون ها را در آن می نویسیم بدیهی است که یک دشمن محتاط باید استراتژی را انتخاب کند که این مقدار برای آن است. حداقل (مقدار مربوطه 5 در جدول 26.3 مشخص شده است). این مقدار P مقدار سود است که مطمئناً حریف منطقی بیش از آن را به ما نخواهد داد. به آن قیمت بالای بازی (یا "mi-nimax" - حداقل حداکثر برد) گفته می شود. در مثال ما، و با استراتژی حریف به دست می آید

بنابراین، بر اساس اصل احتیاط (قاعده بیمه اتکایی "همیشه روی بدترین ها حساب کن!") باید استراتژی A و استراتژی دشمن را انتخاب کنیم. چنین استراتژی هایی "مینیمکس" نامیده می شوند (بر اساس اصل مینیمکس). تا زمانی که هر دو طرف در مثال ما به استراتژی‌های حداکثر خود پایبند باشند، نتیجه آن خواهد بود

حالا یک لحظه تصور کنید که متوجه شدیم دشمن استراتژی را دنبال می کند. بیا، ما او را به خاطر این تنبیه می کنیم و استراتژی انتخاب می کنیم، 5 می گیریم، و این خیلی بد نیست. اما به هر حال، دشمن نیز از دست رفته نیست. به او اطلاع دهید که استراتژی ما این است، او نیز برای انتخاب عجله خواهد کرد، بازده ما را به 2 کاهش می دهد، و غیره (شریک ها "در راهبردها عجله کردند"). به طور خلاصه، استراتژی‌های حداقل در مثال ما نسبت به اطلاعات مربوط به رفتار طرف مقابل ناپایدار هستند. این استراتژی ها خاصیت تعادل را ندارند.

همیشه اینجوریه؟ نه همیشه نه مثالی را با ماتریس ارائه شده در جدول 26.4 در نظر بگیرید.

در این مثال، قیمت پایین‌تر بازی برابر با قیمت بالایی است: چه چیزی از این نتیجه می شود؟ حداقل استراتژی بازیکنان A و B پایدار خواهد بود. تا زمانی که هر دو بازیکن به آنها پایبند باشند، سود 6 است. بیایید ببینیم اگر (A) متوجه شویم که حریف (B) به استراتژی B پایبند است چه اتفاقی می افتد؟

جدول 26.4

و دقیقاً هیچ چیز تغییر نخواهد کرد، زیرا هرگونه انحراف از استراتژی تنها می تواند وضعیت ما را بدتر کند. به همین ترتیب، اطلاعات دریافت شده توسط حریف باعث نمی شود که او از استراتژی خود عقب نشینی کند. نشانه وجود یک نقطه زینی و یک جفت استراتژی متعادل، برابری قیمت های پایین و بالای بازی است. ارزش کل را قیمت بازی می نامند. ما آن را برچسب گذاری می کنیم

استراتژی هایی (در این مورد، ) که در آنها این سود حاصل می شود، استراتژی خالص بهینه نامیده می شود و ترکیب آنها راه حلی برای بازی است. در این صورت گفته می شود که خود بازی در استراتژی های محض حل می شود. هر دو طرف A و B می توانند استراتژی های بهینه خود را ارائه دهند که در آن موقعیت آنها بهترین است. و آن بازیکن A 6 برنده می شود و بازیکن B می بازد، خوب، این شرایط بازی است: آنها برای A مفید هستند و برای B ضرر.

خواننده ممکن است یک سوال داشته باشد: چرا استراتژی‌های بهینه را «خالص» می‌نامند؟ با کمی نگاه کردن به آینده، بیایید به این سوال پاسخ دهیم: استراتژی های "مخلوط" وجود دارد که شامل این واقعیت است که بازیکن نه از یک استراتژی، بلکه از چندین استراتژی استفاده می کند و آنها را به طور تصادفی جایگزین می کند. بنابراین، اگر بپذیریم، علاوه بر استراتژی های خالص، همچنین استراتژی های ترکیبی، هر بازی متناهی راه حلی دارد - یک نقطه تعادل. اما بیشتر در مورد این هنوز در راه است.

وجود یک نقطه زین در بازی از یک قاعده دور است، بلکه استثناست. اکثر بازی ها نقطه زینی ندارند. با این حال، بازی های مختلفی وجود دارند که همیشه یک نقطه زینتی دارند و بنابراین در استراتژی های ناب حل می شوند. اینها به اصطلاح "بازی با اطلاعات کامل" هستند. بازی با اطلاعات کامل، بازی‌ای است که در آن هر بازیکن در هر حرکت شخصی از کل پیش‌تاریخ توسعه‌اش، یعنی نتایج تمام حرکات قبلی، چه شخصی و چه تصادفی، مطلع است. نمونه هایی از بازی های با اطلاعات کامل عبارتند از: چکرز، شطرنج، تیک تاک و غیره.

در تئوری بازی ها ثابت شده است که هر بازی با اطلاعات کامل دارای یک نقطه زینتی است و بنابراین در استراتژی های محض قابل حل است. در هر بازی با اطلاعات کامل، یک جفت استراتژی بهینه وجود دارد که بازدهی پایدار برابر با قیمت بازی و. اگر چنین بازی فقط از حرکات شخصی تشکیل شده باشد، پس زمانی که هر بازیکن استراتژی بهینه خود را به کار می گیرد، باید به روشی کاملاً مشخص به پایان برسد - با بازدهی برابر با قیمت بازی. پس اگر راه حل بازی معلوم باشد خود بازی معنای خود را از دست می دهد!

بیایید یک مثال ابتدایی از یک بازی با اطلاعات کامل را در نظر بگیریم: دو بازیکن به طور متناوب نیکل ها را روی یک میز گرد قرار می دهند و به طور دلخواه موقعیت مرکز سکه را انتخاب می کنند (همپوشانی متقابل سکه ها مجاز نیست). برنده کسی است که آخرین پنی را بگذارد (زمانی که جایی برای دیگران نیست). به راحتی می توان فهمید که نتیجه این بازی اساساً یک نتیجه قطعی است. استراتژی خاصی وجود دارد که تضمین می کند بازیکنی که سکه را اول قرار می دهد برنده می شود.

یعنی باید برای اولین بار نیکل را در مرکز میز بگذارد و سپس به هر حرکت حریف با یک حرکت متقارن پاسخ دهد. بدیهی است که حریف هر طور که رفتار کند، نمی تواند از باخت اجتناب کند. وضعیت دقیقاً در مورد شطرنج و بازی هایی با اطلاعات کامل به طور کلی یکسان است: هر یک از آنها، که به صورت ماتریس نوشته شده اند، دارای یک نقطه زینتی هستند، و از این رو راه حل در استراتژی های خالص است، و بنابراین تا زمانی که این راه حل منطقی باشد، منطقی است. یافت نشد. بیایید بگوییم بازی شطرنجیا همیشه با یک برد برای سفید به پایان می رسد، یا همیشه با برد برای سیاه به پایان می رسد، یا همیشه با تساوی به پایان می رسد، اما دقیقا چه چیزی - ما هنوز نمی دانیم (خوشبختانه برای عاشقان شطرنج). بیایید یک چیز دیگر اضافه کنیم: به سختی در آینده قابل پیش بینی متوجه خواهیم شد، زیرا تعداد استراتژی ها به قدری زیاد است که کاهش بازی به شکل ماتریسی و یافتن نقطه زینتی در آن بسیار دشوار (اگر نه غیرممکن) است.

و حالا بیایید از خود بپرسیم که اگر بازی نقطه زینی نداشته باشد، چه کنیم: خوب، اگر هر بازیکن مجبور شود یک استراتژی خالص را انتخاب کند، پس کاری برای انجام دادن وجود ندارد: ما باید بر اساس اصل حداقلی هدایت شویم. نکته دیگر این است که اگر می‌توانید استراتژی‌های خود را «ترکیب» کنید، آن‌ها را به‌طور تصادفی با برخی احتمالات جایگزین کنید. استفاده از استراتژی های مختلط به این صورت تصور می شود: بازی چندین بار تکرار می شود. قبل از هر بازی از بازی، وقتی به بازیکن یک حرکت شخصی داده می شود، او انتخاب خود را به شانس "سپرده" می کند، "قرعه می اندازد" و استراتژی شکست خورده را در پیش می گیرد (ما قبلاً می دانیم که چگونه قسمت های فصل قبل را سازماندهی کنیم. ).

استراتژی های مختلط در تئوری بازی ها مدلی از تاکتیک های قابل تغییر و انعطاف پذیر هستند، زمانی که هیچ یک از بازیکنان نمی دانند حریف در یک بازی خاص چگونه رفتار خواهد کرد. این تاکتیک (البته معمولاً بدون هیچ توجیه ریاضی) اغلب در بازی های کارتی. بگذارید در عین حال توجه داشته باشیم که بهترین راه برای پنهان کردن رفتار خود از دشمن این است که به آن یک شخصیت تصادفی بدهید و بنابراین از قبل ندانید که چه خواهید کرد.

بنابراین، بیایید در مورد استراتژی های ترکیبی صحبت کنیم. ما به ترتیب استراتژی های ترکیبی بازیکنان A و B را نشان خواهیم داد

در یک مورد خاص، زمانی که همه احتمالات، به جز یک، برابر با صفر و این یک برابر با یک باشد، استراتژی مختلط به یک خالص تبدیل می شود.

یک قضیه اساسی در تئوری بازی ها وجود دارد: هر بازی مجموع صفر محدود دو نفره حداقل یک راه حل دارد - یک جفت استراتژی بهینه، به طور کلی ترکیبی، و یک قیمت متناظر.

یک جفت استراتژی بهینه که یک راه حل بازی را تشکیل می دهد دارای ویژگی زیر است: اگر یکی از بازیکنان به استراتژی بهینه خود پایبند باشد، آنگاه نمی تواند برای دیگری منحرف شود. این جفت استراتژی نوعی تعادل را در بازی شکل می‌دهد: یک بازیکن می‌خواهد سود را به حداکثر برساند، دیگری - به حداقل، هر کدام به سمت خود می‌کشد، و با رفتار معقول هر دو، یک تعادل و یک بازده پایدار v ایجاد شده است. اگر پس بازی برای ما سودمند است، اگر - برای دشمن. هنگامی که بازی "عادلانه" است، به همان اندازه برای هر دو شرکت کننده مفید است.

نمونه ای از بازی بدون نقطه زین را در نظر بگیرید و (بدون اثبات) راه حل آن را ارائه دهید. بازی به این صورت است: دو بازیکن A و B به طور همزمان و بدون گفتن کلمه ای یک، دو یا سه انگشت خود را نشان می دهند. برنده شدن با تعداد کل انگشتان تعیین می شود: اگر زوج باشد، A برنده می شود و مقداری برابر با این عدد از B دریافت می کند. اگر فرد باشد، برعکس، A مبلغی برابر با این عدد به B می پردازد. بازیکنان باید چه کار کنند؟

بیایید یک ماتریس بازی ایجاد کنیم. در یک بازی، هر بازیکن سه استراتژی دارد: نشان دادن یک، دو یا سه انگشت. ماتریس 3x3 در جدول 26.5 آورده شده است. ستون سمت راست ماکزیمم سطر را نشان می دهد و سطر پایینی اضافی حداکثر ستون را نشان می دهد.

قیمت پایین‌تر بازی با استراتژی مطابقت دارد. این بدان معناست که با یک رفتار منطقی و محتاطانه، تضمین می‌کنیم که بیش از 3 بازی را از دست نخواهیم داد. سلول های ماتریس این برای ما بد است، بازیکن L... اما بیایید خودمان را دلداری دهیم: به نظر می رسد موقعیت حریف حتی بدتر است: قیمت پایین بازی در. رفتار منطقی، او حداقل 4 را به ما می دهد.