Антагонистични матрични игри. Решаване на матрична игра Антагонистични матрични игри

Като основно предположение в теорията на игрите се приема, че всеки играч се стреми да осигури максимална възможна печалба за себе си при всякакви действия на партньора си. Да приемем, че има ограничена игра с нулева сума с матрицата на изплащане на първия играч и, съответно, матрицата на изплащане на втория играч. Нека Играч 1 вярва, че каквато и стратегия да избере, Играч 2 ще избере стратегията, която максимизира печалбата му и по този начин минимизира печалбата на Играч 1.

Така че играч 1 избира аз

Играч 2 също така се стреми да осигури най-голяма печалба (или, еквивалентно, най-малка сума на загуба), независимо от избраната от опонента стратегия. Оптималната му стратегия би била колоната H 0с най-ниско максимално плащане. Така че играч 2 ще избере й-та стратегия, която е решение на проблема

В резултат на това, ако Играч 1 следва избраната стратегия (наречена максимин стратегия ), неговата печалба във всеки случай ще бъде по-малка от максималната стойност (наречена "най-ниската цена на играта" ), т.е.

Съответно, ако Играч 2 се придържа към своята минимакс стратегия, тогава неговата загуба няма да бъде по-голяма от максималната стойност (наречена "топ цена на играта" ), т.е.

В случай, че горната цена на играта е равна на долната, т.е. = , и двамата играчи получават своите гарантирани плащания и стойността h ij *Наречен на цената на играта .

Матричен елемент h ijсе нарича матрица на изплащане, съответстваща на стратегиите седлова точка на матрицата н.

Ако цената на антагонистична игра е 0, играта се извиква справедлив .

Помислете за игра, в която Играч 1 има две стратегии, а Играч 2 има три. Матрицата за изплащане на играч 1 изглежда така:

Коментирайте . Тъй като разглеждаме пример за игра с нулева сума, матрицата на печалбите на Играч 2 ще бъде N 2 = -H 1.

Играч 1 изчислява, че ако избере първата стратегия (т.е. първия ред на матрицата H 1), тогава опонентът ще избере втората си стратегия (т.е. втората колона), така че печалбата да бъде равна на 1 . Ако той избере втората стратегия, тогава опонентът може да избере първата стратегия, така че печалбата ще бъде равна на -1.

След като анализира получените стойности: Играч 1 се спира на първата си стратегия, която му осигурява максимална гарантирана печалба, равна на 1.

По същия начин Играч 2 обмисля най-лошите си възможности, когато опонентът избере първата или втората стратегия, или когато опонентът избере втората стратегия, когато Играч 2 избере третата колона. Тези опции съответстват на максималните стойности на колони 2, 1 и 6.



Вземайки минималните стойности на тези максимуми, Играч 2 се спира на втората си стратегия, при която загубата му е минимална и равна на:

Следователно в тази игра има съвместен избор на стратегии, т.е. д

Следователно в тази игра е разумно да се очаква противниците да се придържат към избраните от тях стратегии. Матрична антагонистична игра, за която - се нарича напълно определена игра, или игра, която има решение в чисти стратегии.

Въпреки това, не всички матрични антагонистични игри са добре дефинирани.

Игрите, в които е валидно строго неравенство, се наричат ​​непълно детерминирани игри (или игри, които нямат решение в чистите стратегии).

Нека да разгледаме пример за тази игра:

За тази игра.

В резултат на това, ако играчите следват предложените по-горе правила, тогава Играч 1 ще избере стратегия 1 и ще очаква Играч 2 да избере стратегия 2, където загубата е -2, докато Играч 2 ще избере стратегия 3 и ще очаква Играч 1 да изберете стратегия 2 с печалба равна на 4.

Въпреки това, ако Играч 2 избере своята трета стратегия, тогава Играч 1 ще се справи по-добре, като избере втората стратегия, а не първата стратегия. По същия начин, ако Играч 1 избере първата стратегия, Играч 2 е по-добре да избере втората стратегия, а не третата. Очевидно в игрите от подъл тип принципът на решението в чистите стратегии се оказва неподходящ.

В описаната ситуация за играчите става важно врагът да не предполага каква стратегия ще използва. За да приложат този план, играчите трябва да използват така наречената смесена стратегия.

По същество смесената стратегия на играча е схема за случаен избор на чиста стратегия. Математически може да се представи като вероятностно разпределение върху множеството от чисти стратегии на даден играч. В резултат на това векторът , където съответства на вероятността играч 1 да използва стратегията и , определя смесената стратегия на този играч. Смесената стратегия на Играч 2 се определя по подобен начин .



Ще приемем, че използването на техните смесени стратегии от играчите е независимо, така че вероятността, с която Играч 1 избира тази стратегия и Играч 2 избира, е равна на . В този случай плащане. Сумирайки и намираме математическото очакване на печалбите на Играч 1:

или матрична нотация

При набор от смесени стратегии Играч 1, стремейки се да постигне най-голямата от гарантираните печалби, избира вектор от вероятности, така че да получи максималната от минималните стойности на очакваните печалби, т.е. решава проблема:

.

По същия начин, целта на Играч 2 е да постигне минималните максимални стойности на своите загуби, т.е. той решава проблема

.

Фундаментален резултат от теорията на игрите е така наречената теорема за минимакс, която гласи, че формулираните проблеми на играч 1 и играч 2 винаги имат решение за всяка матрица на изплащане и в допълнение, .

Що се отнася до добре дефинираните игри, се извиква стратегията на играч 1 Максимин стратегия , стратегия за играч 2 - минимакс стратегия, стойност - на цената на играта ; в случая, когато играта се нарича честна.

Очевидно следствие от теоремата за минимакс е връзката:

.

което означава, че никоя стратегия на Играч 1 няма да му позволи да спечели сума, по-голяма от цената на играта, ако Играч 2 приложи своята минимакс стратегия, и никоя стратегия на Играч 2 няма да му позволи да загуби сума, по-малка от цената на играта ако Играч 1 прилага стратегията си maximin.

Това важи и за чистите стратегии, като специален случай на смесените стратегии. (Тъй като чистата стратегия е стратегия, използвана с вероятност 1): Използването на която и да е чиста стратегия, ако опонентът използва своята оптимална стратегия, не ви позволява да спечелите повече (загубите по-малко) от цената на играта.

Този факт често се използва за разработване на специфични алгоритми за решаване на антагонистични матрични игри.

Изчисляването на оптимални стратегии става много по-трудно с нарастването на броя на стратегиите. Могат да се използват няколко подхода за намиране на оптимални стратегии.

За да се намали размерът на играта, се използва доминиране на редове и колони. Обикновено се казва, че i-тият ред на матрица доминира над i-тия ред (т.е. един чист ред доминира над друг), ако за всички , поне един .

По същия начин, th колона доминира в th колона, ако за всички , поне един .

Смисълът на това определение е, че доминиращата стратегия никога не е по-лоша, а в някои случаи дори по-добра от доминираната стратегия. Следователно важното заключение е, че играчът не трябва да използва доминирана стратегия. Това позволява на практика да се отхвърлят всички доминирани редове и колони, което ще намали размера на матрицата (имайте предвид, че този подход може да се използва и при търсене на решение в чисти стратегии).

Пример. Помислете за игра със следната матрица:

→ третият ред на тази матрица доминира над втория

Елиминирането на втория ред води до матрица: Третата колона в тази съкратена матрица е доминирана от втората, а пропускането на втората колона дава: .

В резултат на това, ако може да се намери решение за получената игра, то може лесно да се използва за решаване на оригиналната игра чрез просто присвояване на нулеви вероятности на изключените редове и колони.

Друг метод за опростяване на матрицата се основава на свойството, според което афинна трансформация на матрицата на изплащане (т.е. трансформация на всички елементи на матрицата според правилото , където ) не променя решението на играта; в допълнение, цената на преобразуваната игра може да бъде получена от цената на оригиналната игра, като се използва същото правило: . Това означава, че за задачата на играта по принцип няма значение в какви единици се измерват печалбите (в рубли или долари); добавянето (изваждането) на някаква фиксирана сума ще промени печалбата (загубата) на всеки играч с същата сума, без да се променя решението на играта.

Това свойство може да се използва за опростяване и изясняване на печелившата матрица (използва се по аналогия с операциите върху матрици - умножаване на матрица по постоянно число, добавяне и изваждане на редове, в допълнение, това свойство позволява да се направи всяка матрична игра с нулева сума справедливо, за това е необходимо да се изчислят ценовите игри от всички елементи на матрицата на изплащане).

Освен това може да се използва графичен метод за решаване на играта (и игрите като цяло).

Например, матрицата на изплащането изглежда така: .

Нека Играч 1 избере първата си стратегия с вероятност, а втората с вероятност. Ако Играч 2 избере своята първа стратегия, тогава (от първата колона на матрицата) очакването за Играч 1 ще бъде . Ако Играч 2 избере втората си стратегия, то в съответствие с втората колона на матрицата: .

Всяко от тези уравнения може да бъде представено графично чрез сегмент от права линия в областта на графиката с координати и .

Тестове за финален контрол

1. Антагонистична игра може да бъде настроена:

а) набор от стратегии за двамата играчи и седлова точка.

б) набор от стратегии за двамата играчи и функцията за изплащане на първия играч.

2. Цената на играта винаги съществува за матрични игри в смесени стратегии.

а) да.

3.Ако всички колони в матрицата на печалбите са еднакви и имат формата (4 5 0 1), тогава коя стратегия е оптимална за първия играч?

а) първо.

б) втори.

в) който и да е от четирите.

4. Нека в матрична игра една от смесените стратегии на 1-вия играч има формата (0.3, 0.7), а една от смесените стратегии на 2-рия играч има формата (0.4, 0, 0.6). Какъв е размерът на тази матрица?

а) 2*3.

в) друго измерение.

5. Принципът на доминиране ви позволява да премахнете от матрицата в една стъпка:

а) цели редове.

б) индивидуални числа.

6. При графичния метод за решаване на игри 2*m се намира директно от графиката:

а) оптимални стратегии на двамата играчи.

б) цената на играта и оптималните стратегии на втория играч.

в) цената на играта и оптималните стратегии на 1-вия играч.

7. Графиката на долната обвивка за графичния метод за решаване на игри 2*m е в общия случай:

а) счупен.

б) прав.

в) парабола.

8. В матрична игра 2*2 има два компонента на смесената стратегия на играча:

а) определят взаимно ценностите си.

б) независими.

9. В матрична игра елементът aij е:

а) печалбите на 1-ви играч, когато използва i-та стратегия, а на 2-ри - j-та стратегия.

б) оптималната стратегия на първия играч, когато противникът използва i-та или j-та стратегия.


в) загубата на 1-ви играч, когато използва j-та стратегия, а 2-ри - i-та стратегия.

10. Матричният елемент aij съответства на седловата точка. Възможни са следните ситуации:

а) този елемент е строго най-малкият от всички в линията.

б) този елемент е вторият по ред в реда.

11. При метода Браун-Робинсън всеки играч, когато избира стратегия на следващата стъпка, се ръководи от:

а) стратегиите на врага на предишните стъпки.

б) вашите стратегии в предишните стъпки.

в) нещо друго.

12. Според критерия на математическото очакване всеки играч изхожда от факта, че:

а) ще се случи най-лошата ситуация за него.

в) всички или някои ситуации са възможни с някои дадени вероятности.

13. Нека една матрична игра е дадена от матрица, в която всички елементи са отрицателни. Цената на играта е положителна:

б) не.

в) няма ясен отговор.

14. Цената на играта е:

номер.

б) вектор.

в) матрица.

15. Какъв е максималният брой седлови точки, които могат да бъдат в игра с размерност 5*5 (матрицата може да съдържа всякакви числа):

16. Нека в матрична игра с размерност 2*3 една от смесените стратегии на 1-вия играч има формата (0.3, 0.7), а една от смесените стратегии на 2-рия играч има формата (0.3, x, 0.5) . Какво е числото x?

в) друго число.

17. За какво измерение на матрицата на играта критерият на Wald се превръща в критерия на Laplace?

в) само в останалите случаи.

18. Горната цена на играта винаги е по-ниска от долната цена на играта.

б) не.

б) въпросът е некоректен.

19. Какви стратегии има в матричната игра:

а) чиста.

б) смесени.

в) и двете.

20. В някаква антагонистична игра могат ли стойностите на функцията за изплащане на двамата играчи за някои стойности на променливите да са равни на 1?

а) винаги.

б) понякога.

в) никога.

21. В матрична игра нека една от смесените стратегии на 1-вия играч е от формата (0.3, 0.7), а една от смесените стратегии на 2-рия играч е от формата (0.4, 0.1,0.1,0.4) . Какъв е размерът на тази матрица?

в) друго измерение.

22. Принципът на доминиране ви позволява да премахнете от матрицата в една стъпка:

а) цели колони,

б) индивидуални числа.

в) подматрици с по-малки размери.

23. В матрична игра 3*3 има два компонента на смесената стратегия на играча:

а) определете третия.

б) не дефинирайте.

24. В матрична игра елементът aij е:

а) загуба на втория играч, когато използва j-тата стратегия, а вторият - i-тата стратегия.

б) оптималната стратегия на втория играч, когато противникът използва i-та или j-та стратегия,

в) печалбите на 1-ви играч, когато използва j-та стратегия, а 2-ри - i-та стратегия,

25. Матричният елемент aij съответства на седловата точка. Възможни са следните ситуации:

а) този елемент е най-големият в колоната.

б) този елемент е строго най-големият в реда.

в) низът съдържа както по-големи, така и по-малки елементи от този елемент.

26. Съгласно критерия на Валд, всеки играч приема, че:

а) ще се случи най-лошата ситуация за него.

б) всички ситуации са еднакво възможни.

в) всички ситуации са възможни с определени вероятности.

27. Долната цена е по-малка от горната цена на играта:

б) не винаги.

в) никога.

28. Сумата от компонентите на смесена стратегия за матрична игра винаги е:

а) е равно на 1.

б) неотрицателни.

в) положителен.

г) не винаги.

29. Нека в матрична игра с размерност 2*3 една от смесените стратегии на първия играч има формата (0.3, 0.7), а една от смесените стратегии на втория играч има формата (0.2, x, x) . Какво е числото x?

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

Въведение

1. Теоретична част

1.3 Ред на играта 2x2

1.4 Алгебричен метод

1.5 Графичен метод

1.6 Игри 2xn или mx2

1.7 Решаване на игри с помощта на матричния метод

2. Практическа част

2.2 Игри 2xn и mx2

2.3 Матричен метод

2.4 Браун метод

Анализ на резултатите

Въведение

Играта с нулева сума е игра с нулева сума. Играта с нулева сума е игра без сътрудничество, включваща двама играчи, чиито печалби са противоположни.

Формално една антагонистична игра може да бъде представена от тройка , където X и Y са наборите от стратегии на първия и втория играч, съответно, F е функцията за изплащане на първия играч, присвояваща всяка двойка стратегии (x,y), където реално число, съответстващо на полезността на първи играч в реализирането на дадена ситуация.

Тъй като интересите на играчите са противоположни, функцията F едновременно представлява загубата на втория играч.

Исторически игрите с нулева сума са първият клас математически модели на теория на игрите, с които е описан хазартът. Смята се, че тази тема на изследване е мястото, където теорията на игрите е получила името си. В наши дни антагонистичните игри се считат за част от по-широкия клас некооперативни игри.

1. Теоретична част

1.1 Основни определения и разпоредби на играта

Играта се характеризира със система от правила, които определят броя на участниците в играта, техните възможни действия и разпределението на печалбите в зависимост от тяхното поведение и резултати. За играч се счита един участник или група участници в играта, които имат общи интереси, които не съвпадат с интересите на други групи. Следователно не всеки участник се счита за играч.

Правилата или условията на играта определят възможните поведения, избори и ходове за играчите на всеки етап от развитието на играта. Да направиш избор за играч означава да избереш една от опциите му за поведение. След това играчът прави тези избори с помощта на движения. Да направите ход означава на определен етап от играта да направите целия или част от избора наведнъж, в зависимост от възможностите, предоставени от правилата на играта. Всеки играч на определен етап от играта прави ход според направения избор. Другият играч, знаейки или не за избора на първия играч, също прави ход. Всеки играч се опитва да вземе предвид информация за миналото развитие на играта, ако такава възможност е разрешена от правилата на играта.

Набор от правила, които ясно показват на играча какъв избор трябва да направи при всеки ход, в зависимост от ситуацията, която възниква в резултат на играта, се нарича стратегия на играча. Стратегията в теорията на игрите означава определен пълен план за действие на играча, показващ как той трябва да действа във всички възможни случаи на развитие на играта. Стратегия означава съвкупността от всички инструкции за всяко състояние на информацията, достъпна за играча на всеки етап от развитието на играта. От тук вече става ясно, че стратегиите могат да бъдат добри и лоши, успешни и неуспешни и т.н.

Игра с нулева сума ще бъде, когато сумата от печалбите на всички играчи във всяка от нейните игри е равна на нула, т.е. в игра с нулева сума общият капитал на всички играчи не се променя, а се преразпределя между играчите в зависимост от получените резултати. По този начин много икономически и военни ситуации могат да се разглеждат като игри с нулева сума.

По-специално, игра с нулева сума между двама играчи се нарича антагонистична, тъй като целите на играчите в нея са директно противоположни: печалбата на един играч се случва само за сметка на загубата на другия.

1.1.1 Определение, примери и решения на матрични игри в чисти стратегии

Матрична игра за двама играчи с нулева сума може да се разглежда като следната абстрактна игра за двама играчи.

Първият играч има t стратегии i =1, 2,…, t, вторият има n стратегии j = 1, 2,…, p. Всяка двойка стратегии (i, j) е свързана с число a ij , изразяващо печалбите на първия играч, дължащи се на втория играч, ако първият играч използва своята i-та стратегия, а вторият играч използва своята j-та стратегия.

Всеки играч прави един ход: първият играч избира своята i-та стратегия (i = 1, 2,..., m), вторият избира своята j-та стратегия (j = 1, 2,..., n) , след което първият играч получава печалби a ij за сметка на втория играч (ако a ij< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

Всяка стратегия на играч i = 1, 2,…, t; j = 1, 2,…, n често се нарича чиста стратегия.

Матрична игра за двама играчи с нулева сума отсега нататък ще се нарича просто матрична игра. Очевидно матричната игра принадлежи към антагонистичните игри. От нейната дефиниция следва, че за да се дефинира матрична игра е достатъчно да се посочи матрица A = (a ij) от реда на печалбите на първия играч.

Ако вземем предвид матрицата на изплащането

след това играенето на всяка игра на матрична игра с матрица А се свежда до избора от първия играч на i-тия ред и втория играч на j-тата колона, като първият играч получава (за сметка на втория ) печалбите, разположени в матрица А в пресечната точка на i-тия ред и j-тата колона.

За да се формализира реална конфликтна ситуация под формата на матрична игра, е необходимо да се идентифицират и преномерират чистите стратегии на всеки играч и да се създаде матрица за изплащане.

Следващият етап е да се определят оптималните стратегии и печалби на играчите.

Основното в изучаването на игрите е концепцията за оптимални стратегии на играчите. Тази концепция интуитивно има следното значение: стратегията на играча е оптимална, ако използването на тази стратегия му осигурява най-голямата гарантирана печалба за всички възможни стратегии на другия играч. Въз основа на тези позиции, първият играч разглежда матрицата A на своите печалби, използвайки формула (1.1), както следва: за всяка стойност на i (i = 1, 2,..., t) минималната стойност на печалба се определя в зависимост от стратегии, използвани от втория играч

(i = 1, 2,..., m) (1.2)

т.е. определя се минималната печалба за първия играч, при условие че той прилага своята i -та чиста стратегия, тогава от тези минимални печалби се намира стратегия i = i 0, за която тази минимална печалба ще бъде максимална, т.е.

Определение. Числото b, определено по формула (1.3), се нарича долната нетна цена на играта и показва какви минимални печалби може да гарантира за себе си първият играч, като приложи своите чисти стратегии за всички възможни действия на втория играч.

Вторият играч, с неговото оптимално поведение, трябва да се стреми, ако е възможно, чрез своите стратегии, да минимизира печалбите на първия играч. Следователно за втория играч, който намираме

т.е. максималната печалба на първия играч се определя, при условие че вторият играч прилага своята j-та чиста стратегия, тогава вторият играч намира своята j = j 1 стратегия, при която първият играч ще получи минималната печалба, т.е. намира

Определение. Числото b, определено по формула (1.5), се нарича нетна горна цена на играта и показва какви максимални печалби може да гарантира първият играч за себе си чрез своите стратегии. С други думи, прилагайки чистите си стратегии, първият играч може да осигури печалба не по-малка от b, а вторият играч, прилагайки своите чисти стратегии, може да попречи на първия играч да спечели повече от b.

Определение. Ако в игра с матрица A долната и горната нетна цена на играта съвпадат, т.е. b = c, тогава се казва, че тази игра има седлова точка в чистите стратегии и нетна цена на играта:

n = b = v (1.6)

Седловата точка е двойка чисти стратегии () съответно на първия и втория играч, при които се постига равенство

Концепцията за седлова точка има следното значение: ако един от играчите се придържа към стратегия, съответстваща на седлова точка, тогава другият играч не може да се справи по-добре от това да се придържа към стратегия, съответстваща на седлова точка. Имайки предвид, че най-доброто поведение на даден играч не трябва да води до намаляване на печалбите му, а най-лошото поведение може да доведе до намаляване на печалбите му, тези условия могат да бъдат записани математически под формата на следните отношения:

където i, j са всякакви чисти стратегии съответно на първия и втория играч; (i 0 , j 0) са стратегии, които образуват седлова точка. По-долу ще покажем, че определението за седлова точка е еквивалентно на условия (1.8).

Така, въз основа на (1.8), седловият елемент е минимален в i 0-ия ред и максимален в j 0-та колона в матрица A. Намирането на седловата точка на матрица A е лесно: в матрица A минималният елемент се намира последователно в всеки ред и проверете дали този елемент е максималният в неговата колона. Ако е такъв, то той е седловиден елемент, а двойката стратегии, съответстваща на него, образува седлова точка. Двойка чисти стратегии (i 0 , j 0) на първия и втория играч, образуващи седлова точка и седлов елемент, се нарича решение на играта.

Чистите стратегии i 0 и j 0, образуващи седлова точка, се наричат ​​оптимални чисти стратегии съответно на първия и втория играч.

Теорема 1. Нека f (x, y) е реална функция на две променливи x A и y B и съществува

тогава b = c.

Доказателство. От определението за минимум и максимум следва, че

Тъй като от лявата страна на (1.11) x е произволно, тогава

Следователно от дясната страна на неравенството (1.12) y е произволно

Q.E.D.

По-специално, матрицата () е специален случай на функцията f (x, y), т.е. ако поставим x = i, y = j, = f (x, y), тогава от теорема 1 получаваме, че долната мрежа цената не надвишава горната нетна цена на играта в матричната игра.

Определение. Нека f (x, y) е реална функция на две променливи x A и y B. Точката (x 0, y 0) се нарича седлова точка за функцията f (x, y), ако са изпълнени следните неравенства

f (x, y 0) f (x 0, y 0)f (x 0, y) (1.14)

за всякакви x A и y B.

1.2 Оптимални смесени стратегии и техните свойства

Изучаването на матрична игра започва с намирането на нейната седлова точка в чистите стратегии. Ако една матрична игра има седлова точка в чистите стратегии, тогава изучаването на играта завършва с намирането на тази точка. Ако в една матрична игра няма седлова точка в чистите стратегии, тогава можете да намерите долната и горната нетни цени на тази игра, които показват, че първият играч не трябва да се надява да спечели повече от горната цена на играта и може бъдете сигурни, че ще спечелите не по-ниска цена от играта. Подобни препоръки относно поведението на играчите в матрична игра без седлова точка в чистите стратегии не могат да задоволят изследователите и практиците. Подобряването на решенията на матричните игри трябва да се търси в използването на тайната на използването на чисти стратегии и възможността за многократно повтаряне на игри под формата на игри. Така например се играят поредица от игри на шах, дама и футбол и всеки път играчите прилагат стратегиите си по такъв начин, че опонентите им нямат представа за тяхното съдържание, и по този начин средно те постигнете определени печалби, като изиграете цялата поредица от игри. Тези печалби са средно по-големи от долната цена на играта и по-малки от горната цена на играта. Колкото по-висока е тази средна стойност, толкова по-добра стратегия използва играчът. Ето защо възникна идеята да се прилагат чисти стратегии на случаен принцип, с известна вероятност. Това напълно гарантира тайната на тяхното използване. Всеки играч може да промени вероятностите за използване на своите чисти стратегии по такъв начин, че да увеличи максимално средната си печалба и да получи оптимални стратегии по пътя. Тази идея доведе до концепцията за смесена стратегия.

Определение. Смесената стратегия на играча е пълният набор от вероятности за използване на неговите чисти стратегии.

Така, ако първият играч има m чисти стратегии 1, 2, … i, … m, тогава неговата смесена стратегия x е набор от числа x = (x 1, x 2, ..., x i,…, x m ), удовлетворяващи отношенията

x i 0 (i = 1, 2, ... , t), = 1. (1.15)

По същия начин, за втория играч, който има n чисти стратегии, смесена стратегия y е набор от числа y = (y 1, ..., y j, ... y n), удовлетворяващи отношенията

y j 0 (j = 1, 2, ... , n), = 1. (1.16)

Тъй като всеки път, когато играч използва една чиста стратегия, това изключва използването на друга, чистите стратегии са несъвместими събития. Освен това те са единствените възможни събития.

Очевидно чистата стратегия е частен случай на смесена стратегия. Наистина, ако в смесена стратегия която и да е i-та чиста стратегия се приложи с вероятност единица, тогава всички други чисти стратегии не се прилагат. И тази i-та чиста стратегия е частен случай на смесена стратегия. За да запази тайната, всеки играч прилага свои собствени стратегии, независимо от избора на другия играч.

Определение. Средната печалба на първия играч в матрична игра с матрица A се изразява като математическото очакване на неговите печалби

E (A, x, y) = (1.20)

Очевидно средната печалба на първия играч е функция на два набора от променливи x и y. Първият играч се стреми, като променя своите смесени стратегии x, да максимизира средната си печалба E (A, x, y), а вторият играч, чрез своите смесени стратегии, се стреми да направи E (A, x, y) минимално, т.е. За решаване на играта е необходимо да се намерят такива x, y, при които се постига горната цена на играта.

1.3 Игра от ред 22

Матрична игра от порядък 22 се дава от следната матрица на изплащане за първия играч:

Решението на тази игра трябва да започне с намиране на седловина в чистите стратегии. За да направите това, намерете минималния елемент в първия ред и проверете дали е максималният в неговата колона. Ако такъв елемент не бъде намерен, тогава вторият ред се проверява по същия начин. Ако такъв елемент се намери във втория ред, тогава това е седло.

Намирането на седловия елемент, ако има такъв, завършва процеса на намиране на решението му, тъй като в този случай е намерена цената на играта - седловия елемент и седловата точка, т.е. двойка чисти стратегии за първата и втори играч, съставляващи оптимални чисти стратегии. Ако в чистите стратегии няма седлова точка, тогава трябва да намерим седлова точка в смесените стратегии, която задължително съществува според основната теорема на матричните игри.

Нека означим с x = (x 1 , x 2), y = (y 1 , y 2) смесените стратегии съответно на първия и втория играч. Спомнете си, че x 1 означава вероятността първият играч да използва първата си стратегия, а x 2 = 1 - x 1 е вероятността той да използва втората си стратегия. По същия начин за втория играч: 1 е вероятността той да използва първата стратегия, 2 = 1 - 1 е вероятността той да използва втората стратегия.

Съгласно следствието от теоремата, за да бъдат оптимални смесените стратегии x и y, е необходимо и достатъчно за неотрицателни x 1, x 2, y 1, y 2 да са изпълнени следните отношения:

Нека сега покажем, че ако една матрична игра няма седлова точка в чистите стратегии, тогава тези неравенства трябва да се превърнат в равенства:

Наистина. Нека играта няма седлова точка в чистите стратегии, тогава оптималните стойности на смесените стратегии удовлетворяват неравенствата

0<<1, 0<< 1,

0< <1, 01. (1.25)

Да приемем, че и двете неравенства от (1.22) са строги

тогава, съгласно теоремата, y 1 = y 2 = 0, което противоречи на условия (1.25).

По подобен начин се доказва, че и двете неравенства от (1.23) не могат да бъдат строги неравенства.

Нека сега приемем, че едно от неравенствата (1.22) може да бъде строго, например първото

Това означава, че според теоремата y 1 = 0, y 2 = 1. Следователно от (1.23) получаваме

Ако и двете неравенства (1.24) са строги, тогава, съгласно теоремата, x 1 = x 2 = 0, което противоречи на (1.25). Ако a 12 е 22, тогава едно от неравенствата (1.27) е строго, а другото е равенство. Освен това, равенството ще се запази за по-големия елемент от 12 и 22, т.е. едно неравенство от (1.27) трябва да е строго. Например 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

По този начин се показва, че ако една матрична игра няма седлова точка в чистите стратегии, тогава за оптималните стратегии на първия играч неравенствата (1.22) се превръщат в равенства. Подобни разсъждения по отношение на неравенствата (1.23) ще доведат до факта, че в този случай неравенствата (1.23) трябва да бъдат равенства.

Така че, ако матрична игра от порядък 22 няма седлова точка, тогава оптималните смесени стратегии на играчите и цената на играта могат да бъдат определени чрез решаване на системата от уравнения (1.24). Установено е също, че ако в матрична игра от порядък 2x2 един от играчите има оптимална чиста стратегия, то другият играч също има оптимална чиста стратегия.

Следователно, ако една матрична игра няма седлова точка в чистите стратегии, тогава тя трябва да има решение в смесените стратегии, които се определят от уравнения (1.24). Решение на система (1.25)

1.4 Алгебричен метод

Има два възможни случая за решаване на проблеми с помощта на алгебричния метод:

1. матрицата има седлова точка;

2. матрицата няма седлова точка.

В първия случай решението е двойка стратегии, които формират седловината на играта. Да разгледаме втория случай. Решенията тук трябва да се търсят в смесени стратегии:

Да намерим стратегии и... Когато първият играч използва своята оптимална стратегия, вторият играч може например да приложи две такива чисти стратегии

Освен това, поради свойството, ако един от играчите използва оптимална смесена стратегия, а другият използва всяка чиста стратегия, включена в неговата оптимална смесена стратегия с вероятност, неравна на нула, тогава математическото очакване за печалба винаги остава непроменено и равно към цената на играта, т.е.

Печалбите във всеки от тези случаи трябва да са равни на цената на играта V. В този случай са валидни следните отношения:

Система от уравнения, подобна на (2.5), (2.6), може да бъде конструирана за оптималната стратегия на втория играч:

Като се вземе предвид условието за нормализиране:

Нека решим уравнението (1.37) - (1.41) заедно по отношение на неизвестните, можете да решите не всички наведнъж, а три наведнъж: отделно (1.36), (1.38), (1.40) и (1.37), ( 1.39), (1.41). В резултат на решението получаваме:

1.5 Графичен метод

Приблизителното решение на игра 22 може да се получи доста просто с помощта на графичния метод. Същността му е следната:

Фигура 1.1 - намиране на участък с единична дължина

Изберете част от единична дължина на оста x. Левият му край ще изобразява първата стратегия на първия играч, а десният ще представлява втората. Всички междинни точки съответстват на смесени стратегии на първия играч, а дължината на сегмента вдясно от точката е равна на вероятността да се използва първата стратегия, а дължината на сегмента вляво от е вероятността да се използва втората стратегия от първия играч.

Начертани са две оси I-I и II-II. Ще поставим печалбите на I-I, когато първият играч използва първата стратегия, на II-II, когато използва втората стратегия. Нека, например, вторият играч приложи първата си стратегия, тогава стойността трябва да бъде нанесена по оста I-I, а стойността трябва да бъде нанесена по оста II-II

За всяка смесена стратегия на първия играч, неговата печалба ще се определя от стойността на сегмента. Линия I-I съответства на прилагането на първата стратегия от втория играч; ще я наречем първа стратегия на втория играч. По същия начин можете да конструирате втората стратегия на втория играч. Тогава, като цяло, графичният дисплей на матрицата на играта ще приеме следната форма:

Фигура 1.2 - намиране на цената на играта

Трябва да се отбележи обаче, че тази конструкция е извършена за първия играч. Тук дължината на сегмента е равна на цената на играта V.

Линията 1N2 се нарича долна граница на печалба. Тук можете ясно да видите, че точка N съответства на максималната сума на гарантираната печалба на първия играч.

Най-общо казано, стратегията на втория играч също може да се определи от тази фигура, например по следните начини. По оста I-I:

или по ос II-II

Стратегията на втория играч обаче може да се определи подобно на начина, по който се прави за първия играч, т.е. изградете такава графика.

Фигура 1.3 - определяне на стратегията на втория играч

Тук линия 1N2 е горната граница на загубата. Точка N съответства на минималната възможна загуба на втория играч и определя стратегията.

В зависимост от конкретните стойности на коефициентите на матрицата, графиките могат да имат различна форма, например това:

Фигура 1.4 - определя оптималната стратегия на първия играч

В такава ситуация оптималната стратегия на първия играч е чиста:

1.6 Игри 2n или m2

В игри от порядък 2n първият играч има 2 чисти стратегии, а вторият играч има n чисти стратегии, т.е. Матрицата на печалбите на първия играч има формата:

Ако такава игра има седлова точка, тогава е лесно да я намерите и да получите решение.

Да приемем, че играта има седлови точки. Тогава е необходимо да се намерят такива смесени стратегии и съответно първи и втори играч и цена на играта v, които да удовлетворяват отношенията:

Тъй като играта няма седлова точка, неравенството (1.54) се заменя с неравенствата

За решаване на системи (1.56), (1.55), (1.53) е препоръчително да се използва графичният метод. За тази цел въвеждаме обозначение за лявата страна на неравенството (1.53)

матрична игра математически модел

или, извеждайки от (1.55) и извършвайки прости трансформации, получаваме

където е средната печалба на първия играч, при условие, че той използва своята смесена стратегия, а вторият неговата j-та чиста стратегия.

Съгласно израза всяка стойност j=1, 2, …, n съответства на права линия в правоъгълна координатна система.

Целта на втория играч е да минимизира печалбите на първия играч, като избира неговите стратегии. Затова изчисляваме

където е долната граница на набора от ограничения. На фигура 1.6 графиката на функцията е показана с дебела линия.

Публикувано на http://www.allbest.ru/

Фигура 1.6 - графика на функцията

Целта на първия играч е да максимизира своите печалби чрез избор, т.е. изчисли

На фигура 1.6 точката означава максималната стойност, която се получава при. Цената на играта е защото:

По този начин се определят графично оптималната смесена стратегия на първия играч и двойка чисти стратегии на втория играч, които в пресечната точка образуват точка на фигура 1.6, която показва 2-ра и 3-та стратегии на втория играч. За такива стратегии неравенствата (1.53) се превръщат в равенства. На фигура 1.6 това са стратегии j=2, j=3.

Сега можем да решим системата от уравнения

и точно определяне на стойностите на и (графично те се определят приблизително). След това, поставяйки всички стойности за тези j, за които те не образуват точка, решавайки системата от уравнения (1.56) За примера, показан на фигура 1.6, това е следната система:

и останалите. Тази система може да бъде решена чрез наклон. Ако за някои j=j 0 стратегиите на втория играч образуват точка M 0 и тогава максималната стойност на долната граница на наборите от ограничения е изобразена от сегмент, успореден на ос В този случай първият играч има безкрайно много оптимални стойности и цената на играта. Този случай е изобразен на фигура 1.7, където сегментът MN изобразява горните граници, оптималните стойности са в границите Вторият играч има чиста оптимална стратегия j=j 0 .

Матрични игри от порядък m2 също могат да бъдат решени с помощта на графичния метод. Матрицата на печалбите на първия играч в този случай има формата

Смесените стратегии на първия и втория играч, съответно, се дефинират подобно на игрите от ред 2n. Нека стойността от 0 до 1 бъде нанесена по хоризонталната ос, а стойността на средната печалба) на първия играч по вертикалната ос, при условията, че първият играч прилага своята чиста i-та стратегия (i=1, 2, ..., m), вторият - неговата смесена стратегия (y 1, 1- y 1) =y. Например, когато m=4 графично) може да се представи, както е показано на фигура 1.7.

Фигура 1.7 - функционална графика)

Първият играч се опитва да максимизира средната си печалба, така че се стреми да намери

Функцията е представена с дебела линия и представлява горната граница на набор от ограничения. Вторият играч се опитва да минимизира, като избира своята стратегия, т.е. стойност съответства

На фигурата стойността е обозначена с точка. С други думи, двете стратегии на първия играч и вероятността за втория играч се определят, при които се постига равенство

От фигурата виждаме, че цената на играта е ординатата на точката, вероятността е абсцисата на точката. За останалите чисти стратегии на първия играч в оптималната смесена стратегия трябва ().

Така, решавайки система (1.69), получаваме оптималната стратегия на втория играч и цената на играта. Ние намираме оптималната смесена стратегия за първия играч, като решаваме следната система от уравнения:

1.7 Матричен метод за решаване на игри

Обозначения:

Всякаква квадратна подматрица на подредната матрица

Матрица (1);

Матрица, транспонирана към;

Матрица, свързана с B;

- (1) матрица, получена от X чрез изтриване на елементи, които съответстват на редовете, изтрити от при получаване;

- (1) матрица, получена чрез изтриване на елементи, които съответстват на редовете, изтрити от при получаване.

Алгоритъм:

1. Изберете квадратна подматрица на матрицата от ред () и изчислете

2. Ако има или, изхвърлете намерената матрица и опитайте друга матрица.

3. Ако (), (), изчисляваме и конструираме X и от и, добавяйки нули на подходящи места.

Проверка дали неравенствата са изпълнени

за всеки (1.75)

и неравенства

за всеки (1.76)

Ако една от връзките не е удовлетворена, тогава опитваме друга. Ако всички отношения са валидни, тогава X и необходимите решения.

1.8 Метод на последователно приближаване на цената на играта

При изучаване на игрови ситуации често може да се случи, че няма нужда да се получи точно решение на играта или по някаква причина е невъзможно или много трудно да се намери точната стойност на цената на играта и оптималните смесени стратегии. След това можете да използвате приблизителни методи за решаване на матрична игра.

Нека опишем един от тези методи - методът за последователно приближаване на цената на една игра. Броят, изчислен при използване на метода, нараства приблизително пропорционално на броя на редовете и колоните на матрицата на изплащане.

Същността на метода е следната: играта се играе мислено много пъти, т.е. последователно, във всяка игра играчът избира стратегията, която му дава най-големите общи (общи) печалби.

След такова изпълнение на някои игри се изчислява средната стойност на печалбите на първия играч и загубите на втория играч, като средноаритметичното им се приема като приблизителна стойност на цената на играта. Методът позволява да се намери приблизителната стойност на оптималните смесени стратегии на двамата играчи: необходимо е да се изчисли честотата на прилагане на всяка чиста стратегия и да се вземе като приблизителна стойност в оптималната смесена стратегия на съответния играч.

Може да се докаже, че с неограничено увеличаване на броя на програмните игри, средната печалба на първия играч и средната загуба на втория играч ще се доближат за неопределено време до цената на играта, а приблизителните стойности на смесените стратегии в случаят, когато играта има уникално решение, ще има тенденция към оптималните смесени стратегии на всеки играч. Най-общо казано, тенденцията на приблизителните стойности над тези стойности да се доближат до истинските стойности е бавна. Въпреки това, този процес е лесен за механизиране и по този начин помага да се получи решение на играта с необходимата степен на точност дори с матрици на изплащане от относително голям порядък.

2. Практическа част

Двойката решава къде да отиде на разходка и да прекара времето си полезно и за двамата.

Момичето решава да се разходи в парка, за да подиша чист въздух, а вечерта да гледа филм в най-близкото кино.

Човекът предлага да отидете в технологичния парк и след това да гледате мач на футболисти от местния клуб на централния стадион.

В съответствие с това трябва да разберете колко време ще отнеме за постигане на целта на един от играчите. Печелившата матрица ще изглежда така:

Таблица 1. Матрица на изплащане

Стратегии

От 1 2 , Очевидно тази игра няма седлова точка в чистите стратегии. Затова използваме следните формули и получаваме:

Публикувано на http://www.allbest.ru/

2.2 Игра 2xn и mx2

Задача 1(2xn)

Отглеждат се две зърнени култури за сух и влажен климат.

А природното състояние може да се разглежда като: сухо, влажно, умерено.

Публикувано на http://www.allbest.ru/

Максималната стойност на M() се постига в точка M, образувана от пресечната точка на линии, съответстващи на j=1, j"=2. Според това приемаме:

Задача 2(mx2)

Момче и момиче обмислят варианти къде да отидат за уикенда.

Изборът на място за почивка може да се разглежда като: парк, кино, ресторант.

Публикувано на http://www.allbest.ru/

Максималната стойност на M() се постига в точка E, образувана от пресечната точка на линии, съответстващи на j=1, j"=2. Според това приемаме:

За да се определи стойността на v, трябва да се решат следните уравнения:

2.5 Матричен метод

Два ресторанта (заведения за обществено хранене), конкуриращи се помежду си, предоставят следните набори от услуги. Първият ресторант се намира в центъра, а другият в покрайнините на града.

Централният ресторант включва следните услуги:

1) по-скъпо и висококачествено обслужване на клиентите;

2) ястията са насочени към френската кухня;

Вторият ресторант предлага:

1) евтино и висококачествено обслужване;

2) менюто съчетава различни известни кухни на света;

3) също постоянни промоции и отстъпки;

4) доставя и приема поръчки за доставка до дома.

В съответствие със задачата печалбата за един ден между два ресторанта ще се разпредели както следва:

Таблица 2. Матрица на изплащане

Стратегии

Решаване на игра от вида с помощта на матричен метод:

Има шест подматрици и:

Помислете за матрицата:

x 1 = ? 0, x 2 = ? 0

Тъй като x 2 =< 0, то мы отбрасываем.

Нека сега разгледаме матрицата:

x 1 = ? 0, x 2 = ? 0

Цена на играта.

Това съотношение противоречи на изискването и следователно не е подходящо.

Нека сега разгледаме матрицата:

x 1 = , x 2 = ? 0,

y 1 =< 0, y 2 = ? 0.

Тъй като y 1 =< 0, то мы отбрасываем и.

Нека сега разгледаме матрицата:

x 1 = , x 2 = 0, тъй като x 2 = 0, тогава изхвърляме и.

Нека сега разгледаме матрицата:

x 1 = , x 2 = ? 0. Тъй като x 1 = 0, изхвърляме и.

Нека сега разгледаме матрицата:

x 1 = , x 2 =, y 1 = , y 2 =, тогава продължаваме по-нататък:

x 1 = , x 2 = , y 1 = , y 2 = или

Цена на играта.

Сега се проверяват основните връзки:

Публикувано на http://www.allbest.ru/

Отговор: x 1 = , x 2 =, y 1 = , y 2 = , y 3 =0, y 4 =0,.

Кафяв метод

По искане на работниците от дадено предприятие синдикатът преговаря с ръководството за организиране на топъл обяд за сметка на предприятието. Синдикатът, представляващ работниците, иска да гарантира, че обядът е възможно най-качествен и следователно по-скъп. Ръководството на компанията има противоположни интереси. В крайна сметка страните се споразумяха за следното. Профсъюзът (играч 1) избира една от трите компании (A 1, A 2, A 3), които доставят топла храна, а ръководството на компанията (играч 2) избира набор от ястия от три възможни варианта (B 1, B 2 , B 3) . След подписване на споразумението съюзът генерира следната платежна матрица, чиито елементи представляват стойността на набор от ястия:

Нека играта се дефинира от следната матрица на изплащане:

Да предположим, че вторият играч е избрал втората си стратегия, тогава първият ще получи:

2, ако използва първата си стратегия,

3, ако използва своята 3-та стратегия.

Получените стойности са обобщени в таблица 1.

Таблица 3. Стратегия на втория играч

Партиден номер

Стратегия за играч 2

1-ва победа на играча

От Таблица 3 може да се види, че с втората стратегия на втория играч, първият ще получи най-голямата печалба 3, използвайки своята 2-ра или 3-та стратегия. Тъй като първият играч иска да получи максимална печалба, той отговаря на втората стратегия на втория играч със своята 2-ра стратегия. При втората стратегия на първия играч, вторият ще загуби:

1, ако използва първата си стратегия,

3, ако използва втората си стратегия,

4, ако използва своята 3-та стратегия.

Таблица 4. Стратегия на първия играч

Партиден номер

Стратегия за 1-ви играч

2-ри играч губи

От таблица 2 може да се види, че при 2-рата стратегия на първия играч, вторият играч ще има най-малката загуба от 1, ако приложи своята 1-ва стратегия. Тъй като вторият играч иска да загуби по-малко, в отговор на 2-рата стратегия на първия играч, той ще използва своята 1-ва стратегия. Получените резултати са обобщени в таблица 5.

Таблица 5. Стратегии съответно на първия и втория играч

Партиден номер

Стратегия за играч 2

Общи печалби на 1-ви играч

Стратегия за 1-ви играч

В табл 5 в колоната стратегия на втория играч на втория ред има число 1, което показва, че във втората игра е изгодно за втория играч да използва своята 1-ва стратегия; в колоната е най-голямата средна печалба 3 на първия играч, получена от него в първата игра; колона w съдържа най-малката средна загуба от 1, получена от втория играч в първата игра; колона v съдържа средното аритметично v = (u + w) - т.е. приблизителната стойност на цената на играта, получена в резултат на загуба на една игра от играта. Ако вторият играч приложи своята 1-ва стратегия, тогава първият ще получи съответно 3, 1, 2 с неговите 1-ва, 2-ра, 3-та стратегия, а общите печалби на първия играч за двете игри ще бъдат:

2 + 3=5 с първата си стратегия,

3 + 1=4 с неговата 2-ра стратегия,

3 + 2=5 с неговата 3-та стратегия.

Тези общи печалби се записват във втория ред на таблицата. 3 и в колоните, съответстващи на стратегиите на първия играч: 1, 2, 3.

От всички печалби най-голямата е 5. Получава се с 1-ва и 3-та стратегия на първия играч, след което той може да избере всяка от тях; Да кажем, че в такива случаи, когато има две (или няколко) еднакви общи печалби, изберете стратегията с най-малко число (в нашия случай трябва да вземем 1-вата стратегия).

С 1-вата стратегия на първия играч, вторият ще загуби съответно 3, 2, 3 от своите 1-ва, 2-ра, 3-та стратегия, а общата загуба на втория играч за двете игри ще бъде:

1 + 3=4 с първата си стратегия,

3 + 2=5 с неговата 2-ра стратегия,

4 + 3=7 с неговата 3-та стратегия.

Тези общи загуби се записват във втория ред на таблицата. 5 и в колоните, съответстващи на 1-ва, 2-ра, 3-та стратегии на втория играч.

От всички общи загуби на втория играч най-малката е 4. Получава се с неговата 1-ва стратегия, следователно в третата игра вторият играч трябва да приложи своята 1-ва стратегия. Най-голямата обща печалба на първия играч за две игри, разделена на броя игри, се поставя в колоната, т.е.; Колона w съдържа най-малката обща загуба на втория играч за две игри, разделена на броя игри, т.е. в колона v се поставя средното аритметично на тези стойности, т.е. = Това число се приема като приблизителна стойност на цената на играта с две „изиграни“ игри.

Така се получава следната таблица 4, за две игри.

Таблица 6. Общи печалби и загуби на играчи след две изиграни игри

Стратегия за играч 2

Общи печалби на 1-ви играч

Стратегия за 1-ви играч

Пълна загуба на втория играч

В третия ред на Таблица 6 в колоната стратегия на втория играч има число 1, което показва, че в третата игра вторият играч трябва да приложи своята 1-ва стратегия. В този случай първият играч печели 3, 1, 2, използвайки съответно своите 1-ва, 2-ра, 3-та стратегии и общите му печалби в три игри ще бъдат:

3 + 5 = 8 с първата му стратегия,

1 +4 = 5 с неговата 2-ра стратегия,

2 + 5 = 7 с неговата 3-та стратегия.

Тези общи печалби на първия играч се записват в третия ред на таблица 6 и колоните, съответстващи на неговите стратегии 1, 2, 3. Тъй като най-голямата обща печалба 8 на първия играч се получава с 1-вата стратегия, първата се избира съответно.

С 1-вата стратегия на първия играч, вторият ще загуби съответно 3, 1, 2 спрямо своите 1-ва, 2-ра, 3-та стратегия, а общата загуба на втория играч за двете игри ще бъде:

3 + 4=7 с първата си стратегия,

2 + 5=7 с неговата 2-ра стратегия,

3 + 7 = 10 с неговата трета стратегия.

Тези общи загуби се записват в третия ред на таблицата. 6 и в колоните, съответстващи на 1-ва, 2-ра, 3-та стратегии на втория играч. От всичките му общи загуби, 7 е най-малката и се получава с неговите 1-ва и 2-ра стратегии, тогава вторият играч трябва да приложи своята 1-ва стратегия.

В табл 6 в третия ред в колоната и записва най-голямата обща печалба на първия играч за три игри, разделена на броя на играта, т.е.; в колона w се поставя най-малката обща загуба на втория играч за три игри, разделена на броя игри, т.е.; колона v съдържа тяхното средно аритметично

Така получаваме таблица. 7 за три игри.

Таблица 7. Общи печалби и загуби на играчи след три изиграни игри

Партиден номер

Стратегия за играч 2

Общи печалби на 1-ви играч

Стратегия за 1-ви играч

Пълна загуба на втория играч

Таблица 8. Финална маса след двадесет изиграни игри

Партиден номер

Стратегия за играч 2

Общи печалби на 1-ви играч

Стратегия за 1-ви играч

Пълна загуба на втория играч

От масата 7 и 8 може да се види, че в 20 загубени игри, стратегии 1, 2, 3 за първия играч се срещат съответно 12, 3, 5 пъти, следователно относителните им честоти са съответно равни; стратегии 1, 2, 3 за втория играч се срещат съответно 7, 11,2 пъти, следователно относителните им честоти са съответно равни; приблизителна цена на играта. Това приближение е доста добро.

И накрая, имайте предвид, че ако една игра има повече от едно решение, тогава приближенията на цената на играта все още ще се доближават за неопределено време до истинската цена на играта и относителните честоти на стратегиите на играчите вече няма да се доближават непременно до истинския оптимален резултат на играчите смесени стратегии.

Анализ на резултатите

В тази курсова работа проучихме материала за намиране на решения на игри с нулева сума, използвайки графичния, матричен метод и метода за последователно приближаване на цената на играта. Бяха открити оптималните стратегии на първия и втория играч, както и цената на играта в игрите 2x2, 2xn и mx2, както и в игрите, използващи матричния метод и метода на Браун.

Използвайки примера на двойка, беше симулирана игра 2x2, която беше решена с помощта на алгебрични и графични методи. Решавайки играта алгебрично, решението показва, че използвайки техните оптимални смесени стратегии, първият и вторият играч ще прекарат 4,6 часа заедно. Графичното решение на задачата е получено с малка грешка и възлиза на 4,5 часа.

И също така бяха симулирани два проблема 2xn и mx2. В задача 2xn беше разгледана селскостопанска култура и стратегията показва, че е по-добре да се засади поле 50 на 50, а цената на играта беше 3,75 милиона рубли. И в проблем mx2 беше разгледана двойка, чиято стратегия показа, че е по-евтино да отидете в парка и киното, а цената ще бъде 4,3 рубли.

Беше моделиран проблем за матричния метод, при който бяха разгледани два ресторанта, решението на проблема показа, че при използване на оптималната му смесена стратегия печалбата на първия ресторант ще бъде 15,6 милиона рубли, а при използване на оптималната му смесена стратегия от вторият ресторант, няма да позволи на първия да спечели повече от 15,6 милиона рубли. Графичното решение доведе до грешка и цената на играта беше 14,9 милиона рубли.

За метода на Браун е изготвена задача, в която се разглежда профсъюзът и ръководството на компанията, чиято задача е да осигурят храна на работниците. Ако и двамата играчи използват оптималните си стратегии, храната на човек ще бъде 2,45 хиляди рубли.

Списък на използваните източници

1) Вилисов В.Я. Бележки за лекции “Теория на игрите и статистически решения”, - Филиал - “Восход” MAI. 1979. 146 с.

2) Крушевски А.В. Теория на игрите, - Киев: Vishcha School, 1977. - 216 с.

3) Чърчмен У., Акоф Р., Арноф Л., Въведение в изследването на операциите. - М.: Наука. 1967. - 488 с.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0 %B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

Публикувано на Allbest.ru

Подобни документи

    Вземането на решения като особен вид човешка дейност. Рационално представяне на матрицата на играта. Примери за матрични игри в чисти и смесени стратегии. Изследване на операции: връзката на проблемите на линейното програмиране с теоретико-игровия модел.

    курсова работа, добавена на 05/05/2010

    Игри, повтарящи се много пъти, техните отличителни свойства и етапи. Смесени стратегии, условия и възможности за тяхното използване на практика. Аналитичен метод за решаване на игра от тип 2 х 2. Основни теореми за правоъгълни игри. Алгебрични решения.

    презентация, добавена на 23.10.2013 г

    Основни определения на теорията на биматричните игри. Пример за биматрична игра "Ученик-учител". Смесени стратегии в биматричните игри. Търсене на "равновесна ситуация". 2x2 биматрични игри и формули за случая, когато всеки играч има две стратегии.

    резюме, добавено на 13.02.2011 г

    Научете обща информация за матричните игри и игрите с нулева сума. Концепцията за позиционна игра, дърво, информационен набор. Разглеждане на принципа на максимин и принципа на равновесието. Оптималност по Парето. Позиционна неантагонистична игра, нейните свойства.

    курсова работа, добавена на 17.10.2014 г

    Теорията на игрите е дял от математиката, чийто предмет е изучаването на математически модели за вземане на оптимални решения в условия на конфликт. Итеративен метод Браун-Робинсън. Монотонен итеративен алгоритъм за решаване на матрични игри.

    дисертация, добавена на 08.08.2007 г

    Съставяне на платежна матрица, търсене на долни и горни нетни цени на играта, максимин и минимакс стратегии на играчите. Опростяване на платежната матрица. Решаване на матрична игра с помощта на редукция до задача за линейно програмиране и добавката „Търсене на решение“.

    тест, добавен на 10.11.2014 г

    Теорията на игрите е математическа теория на конфликтните ситуации. Разработване на математически модел на игра с нулева сума за двама, нейното внедряване под формата на програмни кодове. Метод за решаване на проблема. Входни и изходни данни. Програма, ръководство за потребителя.

    курсова работа, добавена на 17.08.2013 г

    Основни сведения за симплексния метод, оценка на ролята и значението му в линейното програмиране. Геометрична интерпретация и алгебричен смисъл. Намиране на максимум и минимум на линейна функция, частни случаи. Решаване на задачата чрез матричен симплекс метод.

    дисертация, добавена на 01.06.2015 г

    Техники за конструиране на математически модели на компютърни системи, които отразяват структурата и процесите на тяхното функциониране. Броят достъпи до файлове в процеса на решаване на среден проблем. Определяне на възможността за поставяне на файлове във външни устройства с памет.

    лабораторна работа, добавена на 21.06.2013 г

    Проектиране на математически модел. Описание на играта tic-tac-toe. Модел на логическа игра, базирана на булева алгебра. Цифрови електронни устройства и разработване на техния математически модел. Игрова конзола, контролер за игра, линия на игралното поле.

Московски енергиен институт

(Технически университет)

Лабораторен доклад

в теорията на игрите

„Програма за намиране на оптимални стратегии за сдвоена игра с нулева сума, дадена в матрична форма“

Попълнено от студенти

група А5-01

Ашрапов Далер

Ашрапова Олга

Основни понятия на теорията на игрите

Теорията на игрите е предназначена да разрешава конфликтни ситуации , т.е. ситуации, в които се сблъскват интересите на две или повече страни, преследващи различни цели.

Ако целите на страните са директно противоположни, тогава те говорят за антагонистичен конфликт .

Игра наречен опростен формализиран модел на конфликтна ситуация.

Извиква се едно изиграване на игра от началото до края партия . Резултатът от играта е плащане (или печалби ).

Партията се състои от се движи , т.е. избор на играчи от определен набор от възможни алтернативи.

Движенията може да са личниИ случаен.Личен ход , За разлика от случаен , включва съзнателния избор на дадена опция от играча.

Наричат ​​се игри, в които има поне един личен ход стратегически .

Игрите, в които всички ходове са произволни, се наричат хазарт .

Когато правят личен ход, те също говорят за стратегии играч, т.е. относно правило или набор от правила, които определят избора на играча. В същото време стратегията трябва да бъде цялостна, т.е. изборът трябва да бъде определен за всяка възможна ситуация по време на играта.

Проблем на теорията на игрите– намиране на оптимални стратегии за играчите, т.е. стратегии, които им осигуряват максимална печалба или минимална загуба.

Класификация на моделите на теория на игрите

Игра нлица обикновено се обозначават като, където
- набор от стратегии на i-тия играч,
- плащане за играта.

В съответствие с това обозначение може да се предложи следната класификация на моделите на теория на игрите:

Дискретни (множество стратегии отделен)

Финал

Безкраен

Непрекъснато (множество стратегии непрекъснато)

Безкраен

нлица (
)

Коалиция (кооперация)

Некоалиционен (некооперативен)

2 души (двойки)

Антагонистични (игри с нулева сума)

(интересите на страните са противоположни, т.е. загубата на един играч е равна на печалбата на другия)

Неантагонистичен

С пълна информация (ако играчът, който прави личен ход, знае целия фон на играта, т.е. всички ходове на противника)

С непълна информация

С нулева сума (общото плащане е равно на нула)

Ненулева сума

Едно движение (лотарии)

Многопроходен

Матрично представяне на сдвоена игра с нулева сума

В този урок ще разгледаме антагонистични игри за двама души , дадени в матрична форма. Това означава, че знаем много стратегии на първия играч (играч А){ А аз }, аз = 1,…, ми разнообразие от стратегии за втория играч (играч б){ б й }, й = 1,..., н, а също и предвид матрицата А = || а ij || печалба на първия играч. Тъй като говорим за антагонистична игра, се приема, че печалбата на първия играч е равна на загубата на втория. Приемаме, че матричният елемент а ij– печалбите на първия играч, когато той избере стратегия А ази отговорът на втория играч към него със стратегия б й. Ще обозначим такава игра като
, Където м - брой стратегии на играча а,н - брой стратегии на играча IN.Най-общо може да се представи със следната таблица:

б 1

б й

б н

А 1

А аз

А м

Пример 1

Като прост пример, помислете за игра, в която играта се състои от два хода.

1-ви ход: Играч Аизбира едно от числата (1 или 2), без да информира опонента си за избора си.

2-ри ход: Играч INизбира едно от числата (3 или 4).

Долен ред: Избор на играчите АИ INсвиеш. Ако сборът е четен, тогава INплаща своята стойност на играча А, ако е нечетно - обратното, Аплаща сумата на играча IN.

Тази игра може да бъде представена във формата
по следния начин:

(избор 3)

(избор 4)

(избор 1)

(избор 2)

Лесно се вижда, че тази игра е антагонистична, освен това е игра с непълна информация, т.к към играча IN,правейки личен ход, не е известно какъв избор е направил играчът А.

Както беше отбелязано по-горе, задачата на теорията на игрите е да намери оптималните стратегии на играчите, т.е. стратегии, които им осигуряват максимална печалба или минимална загуба. Този процес се нарича решение на играта .

Когато решавате игра в матрична форма, трябва да проверите играта за присъствие решителна точка . За да направите това, се въвеждат две стойности:

– по-ниска оценка на цената на играта и

– горна оценка на цената на играта.

Първият играч най-вероятно ще избере стратегията, при която получава максимална печалба сред всички възможни отговори на втория играч, а вторият играч, напротив, ще избере тази, която минимизира собствената му загуба, т.е. възможно спечелване на първия.

Може да се докаже, че α ≤ V ≤ β , Където Vцена на играта , т.е. вероятната печалба на първия играч.

Ако връзката е в сила α = β = V, тогава те казват, че играта има седлова точка
, И могат да бъдат решени в чисти стратегии . С други думи, има няколко стратегии
, давайки на играча АV.

Пример 2

Нека се върнем към играта, която разгледахме в Пример 1 и я проверим за наличието на седлова точка.

(избор 3)

(избор 4)

(избор 1)

(избор 2)

За тази игра
= -5,
= 4,
, следователно няма седлова точка.

Нека още веднъж да обърнем внимание на факта, че тази игра е игра с непълна информация. В този случай можем само да посъветваме играча Аизберете стратегия , защото в този случай той може да получи най-голямата печалба, но в зависимост от избора на играча INстратегии .

Пример 3

Нека направим някои промени в правилата на играта от пример 1. Ние ще предоставим играча INинформация за избор на играч А.Тогава имайте INще се появят две допълнителни стратегии:

- стратегия, която е от полза за А.Ако изборът А - 1,Че INизбира 3 при избор А - 2,Че INизбира 4;

- стратегия, която не е от полза за А.Ако изборът А - 1,Че INизбира 4 при избор А - 2,Че INизбира 3.

(избор 3)

(избор 4)

(избор 1)

(избор 2)

Тази игра е с пълна информация.

В такъв случай
= -5,
= -5,
, следователно играта има седловина
. Тази седлова точка съответства на две двойки оптимални стратегии:
И
. Цена на играта V= -5. Очевидно е, че за Атакава игра е нерентабилна.

Примери 2 и 3 са добра илюстрация на следната теорема, доказана в теорията на игрите:

Теорема 1

Всяка сдвоена антагонистична игра с пълна информация може да бъде решена в чисти стратегии.

Че. Теорема 1 казва, че всяка игра за двама играчи с пълна информация има седлова точка и има двойка чисти стратегии
, давайки на играча Аустойчиви печалби, равни на цената на играта V.

В случай на липса на седлова точка, т.нар смесени стратегии :, Където стр аз Ир й– вероятности за избор на стратегии А аз И б йсъответно първият и вторият играч. Решението на играта в този случай е двойка смесени стратегии
, максимизирайки математическото очакване на цената на играта.

Следващата теорема обобщава теорема 1 за случай на игра с непълна информация:

Теорема 2

Всяка двойка антагонистична игра има поне едно оптимално решение, т.е. двойка смесени стратегии в общия случай
, давайки на играча Аустойчиви печалби, равни на цената на играта V, и α ≤ V ≤ β .

В специалния случай, за игра със седлова точка, решението при смесените стратегии изглежда като двойка вектори, в които един елемент е равен на единица, а останалите са равни на нула.

Най-простият случай, разработен подробно в теорията на игрите, е игра на двойки с крайна нулева сума (антагонистична игра на две лица или две коалиции). Да разгледаме игра G, в която участват двама играчи А и Б, които имат противоположни интереси: печалбата на единия е равна на загубата на другия. Тъй като печалбата на играч A е равна на печалбата на играч B с противоположен знак, можем да се интересуваме само от печалбата на играч a. Естествено, A иска да максимизира, а B иска да минимизира a.

За простота, нека мислено се идентифицираме с един от играчите (нека бъде А) и да го наречем „ние“, а играч Б „противник“ (разбира се, от това не следват реални предимства за А). Нека имаме възможни стратегии, а противникът - възможни стратегии (такава игра се нарича игра). Нека отбележим нашите печалби, ако използваме стратегията и противникът използва стратегията

Таблица 26.1

Нека приемем, че за всяка двойка стратегии печалбата (или средната печалба) a ни е известна. Тогава по принцип е възможно да се изгради правоъгълна таблица (матрица), която изброява стратегиите на играчите и съответните печалби (виж Таблица 26.1).

Ако се състави такава таблица, тогава те казват, че играта G е намалена до матрична форма (довеждането на играта до такава форма само по себе си вече може да бъде трудна задача, а понякога и почти невъзможно, поради огромното разнообразие от стратегии ). Обърнете внимание, че ако играта е намалена до матрична форма, тогава играта с много ходове всъщност се свежда до игра с един ход - от играча се изисква да направи само един ход: изберете стратегия. Ще обозначим накратко игровата матрица

Нека да разгледаме пример за играта G (4X5) в матрична форма. Имаме четири стратегии на наше разположение (от които да избираме), докато врагът има пет стратегии. Матрицата на играта е дадена в таблица 26.2

Нека помислим каква стратегия трябва да използваме ние (играч А)? В Matrix 26.2 има примамлива печалба от "10"; изкушаваме се да изберем стратегия, при която ще получим тази „лаканина“.

Но почакайте: врагът също не е глупак! Ако изберем стратегия, той, за да ни напука, ще избере стратегията и ние ще получим някаква жалка печалба „1“. Не, не можете да изберете стратегия! Как да бъдем? Очевидно, въз основа на принципа на предпазливостта (и той е основният принцип на теорията на игрите), трябва да изберем стратегията, при която нашата минимална печалба е максимална.

Таблица 26.2

Това е така нареченият „принцип на мини-максимум“: действайте по такъв начин, че при най-лошото поведение на опонента ви да получите максимална печалба.

Нека пренапишем таблица 26.2 и в дясната допълнителна колона запишем минималната печеливша стойност във всеки ред (минимален ред); нека го обозначим за линия a (виж таблица 26.3).

Таблица 26.3

От всички стойности (дясна колона) най-голямата (3) е маркирана. Стратегията съответства на това. Избирайки тази стратегия, във всеки случай можем да сме сигурни, че (при каквото и да е поведение на врага) ще спечелим не по-малко от 3. Тази стойност е нашата гарантирана победа; Държейки се внимателно, не можем да получим по-малко от това, може би ще получим повече).

Тази печалба се нарича най-ниската цена на играта (или „maximin“ – максималната от минималните печалби). Ще го обозначим като a. В нашия случай

Сега нека вземем гледната точка на врага и причината за него. Той не е някаква пешка, но е и умен! Когато избира стратегия, той би искал да даде по-малко, но трябва да разчита на нашето най-лошо поведение за него. Ако избере стратегия, ние ще му отговорим и той ще даде 10; ако той избере, ние ще му отговорим и той ще даде и т.н. Ще добавим допълнителен долен ред към таблица 26.3 и ще запишем максимумите на колоните в него. Очевидно един внимателен противник трябва да избере стратегията, в която е тази стойност минимален (съответстващата стойност 5 е маркирана в Таблица 26.3) . Тази стойност P е стойността на печалбата, повече от която разумен противник със сигурност няма да ни даде. Нарича се горната цена на играта (или “mi-nimax” - минималната от максималните печалби). В нашия пример и се постига със стратегията на врага

Така че, въз основа на принципа на предпазливостта (правилото за презастраховане „винаги разчитайте на най-лошото!”), трябва да изберем стратегия А и враг - стратегия. Такива стратегии се наричат ​​„минимакс” (следвайки принципа на минимакса). Докато и двете страни в нашия пример се придържат към своите минимаксни стратегии, печалбата ще бъде

Сега нека си представим за момент, че сме научили, че врагът следва стратегия. Хайде, да го накажем за това и да изберем стратегия, ще получим 5 и това не е толкова лошо. Но врагът също не е провал; уведомете го, че нашата стратегия е , той също ще побърза да избере, намалявайки печалбите ни до 2 и т.н. (партньорите „бързаха със стратегии“). Накратко, минимаксните стратегии в нашия пример са нестабилни по отношение на информацията за поведението на другата страна; тези стратегии нямат свойството на равновесие.

Винаги ли е така? Не винаги. Разгледайте примера с матрицата, дадена в таблица 26.4.

В този пример долната цена на играта е равна на горната цена: . Какво следва от това? Минимаксните стратегии на играчи А и Б ще бъдат стабилни. Докато и двамата играчи се придържат към тях, печалбата е 6. Нека да видим какво ще се случи, ако (A) разберем, че опонентът (B) се придържа към стратегия B?

Таблица 26.4

Но абсолютно нищо няма да се промени, защото всяко отклонение от стратегията може само да влоши положението ни. По същия начин информацията, получена от опонента, няма да го принуди да се отклони от стратегията си. Една двойка стратегии има свойството на равновесие (балансирана двойка стратегии) ​​и печалбата (в нашия случай 6), постигната с тази двойка стратегии. се нарича „седлова точка на матрицата“. Знак за наличието на седлова точка и балансирана двойка стратегии е равенството на долната и горната цена на играта; общата стойност се нарича цена на играта. Ще го обозначим

Стратегиите (в случая), при които се постига тази печалба, се наричат ​​оптимални чисти стратегии, а тяхната съвкупност се нарича решение на играта. В този случай за самата игра казват, че е решена в чисти стратегии. И двете страни А и Б могат да получат своите оптимални стратегии, в които тяхната позиция е най-добрата възможна. И ако играч А спечели 6, а играч Б загуби, добре, това са условията на играта: те са полезни за А и неизгодни за Б.

Читателят може да има въпрос: защо оптималните стратегии се наричат ​​„чисти“? Гледайки малко напред, ще отговорим на този въпрос: има „смесени“ стратегии, които се състоят в това, че играчът използва не само една стратегия, а няколко, разпръсквайки ги произволно. Така че, ако допуснем смесени стратегии в допълнение към чистите, всяка крайна игра има решение - точка на равновесие. Но това тепърва ще се обсъжда.

Наличието на седлова точка в играта далеч не е правило, а изключение. Повечето игри нямат седлова точка. Има обаче тип игра, която винаги има седлова точка и следователно се решава в чисти стратегии. Това са така наречените „игри с пълна информация“. Игра с пълна информация е игра, в която всеки играч, с всеки личен ход, знае целия фон на своето развитие, тоест резултатите от всички предишни ходове, както лични, така и произволни. Примери за игри с пълна информация включват: дама, шах, тик-так и др.

В теорията на игрите е доказано, че всяка игра с пълна информация има седлова точка и следователно се решава в чисти стратегии. Във всяка игра с пълна информация има двойка оптимални стратегии, които дават стабилна печалба, равна на цената на играта и. Ако такава игра се състои само от лични ходове, тогава когато всеки играч използва своята оптимална стратегия, тя трябва да завърши по много определен начин - с печалба, равна на цената на играта. Това означава, че ако решението на играта е известно, самата игра губи смисъл!

Нека вземем елементарен пример за игра с пълна информация: двама играчи последователно поставят никели на кръгла маса, произволно избирайки позицията на центъра на монетата (не се допуска взаимно припокриване на монети). Този, който постави последния никел, печели (когато няма място за други). Лесно е да се види, че изходът от тази игра по същество е предопределен. Има определена стратегия, която гарантира, че играчът, който пръв постави монетата, печели.

А именно, той трябва първо да постави никел в центъра на масата и след това да отговори на всеки ход на противника със симетричен ход. Очевидно, без значение как се държи врагът, той не може да избегне загубата. Ситуацията е абсолютно същата при шаха и игрите като цяло с пълна информация: всяка от тях, написана в матрична форма, има седлова точка, което означава, че решението е в чисти стратегии и следователно има смисъл само докато това решение не намира. Да кажем, че една шахматна партия или винаги завършва с победа на белите, или винаги с победа на черните, или винаги с равенство, но все още не знаем какво точно (за щастие на феновете на шаха). Нека добавим също: едва ли ще разберем в обозримо бъдеще, тъй като броят на стратегиите е толкова огромен, че е изключително трудно (ако не и невъзможно) играта да се приведе в матрична форма и да се намери седлова точка в нея.

Сега нека се запитаме какво да правим, ако играта няма седлова точка: Е, ако всеки играч е принуден да избере една единствена чиста стратегия, тогава няма какво да правим: трябва да се ръководим от принципа на минимакса. Друг е въпросът дали можете да „смесвате“ стратегиите си, да ги редувате произволно с някои вероятности. Използването на смесени стратегии се мисли по следния начин: играта се повтаря много пъти; преди всяка игра от играта, когато на играча бъде даден личен ход, той „поверява“ избора си на случайността, „хвърля жребий“ и взема предложената стратегия (вече знаем как да организираме жребия от предишната глава ).

Смесените стратегии в теорията на игрите са модел на променлива, гъвкава тактика, когато никой от играчите не знае как ще се държи противникът в дадена игра. Тази тактика (макар и обикновено без никаква математическа обосновка) често се използва в игрите с карти. Нека отбележим в същото време, че най-добрият начин да скриете поведението си от врага е да му придадете произволен характер и следователно да не знаете предварително какво ще направите.

Така че нека поговорим за смесени стратегии. Ще обозначим смесените стратегии на играчи A и B, съответно, където (образувайки общо едно) - вероятността играч A да използва стратегии - вероятността играч B да използва стратегии

В специалния случай, когато всички вероятности с изключение на една са равни на нула, а тази е равна на единица, смесената стратегия се превръща в чиста.

Има фундаментална теорема на теорията на игрите: всяка ограничена игра с нулева сума за двама души има поне едно решение - двойка оптимални стратегии, като цяло смесени, и съответстваща цена

Двойка оптимални стратегии, които формират решение на дадена игра, има следното свойство: ако един от играчите се придържа към оптималната си стратегия, тогава не може да бъде изгодно за другия да се отклони от неговата. Тази двойка стратегии формира определена равновесна позиция в играта: единият играч иска да превърне печалбата в максимум, другият - в минимум, всеки дърпа в своята посока и при разумно поведение и на двамата, равновесие и стабилна печалба v са установени. Ако тогава играта е от полза за нас, ако - за врага; когато играта е „честна“, еднакво изгодна и за двамата участници.

Нека разгледаме пример за игра без седлова точка и да дадем (без доказателство) нейното решение. Играта е следната: двама играчи А и Б едновременно и без да казват дума показват един, два или три пръста. Общият брой пръсти определя печалбите: ако е четен, A печели и получава от B сума, равна на това число; ако е нечетно, тогава, напротив, А плаща на Б сума, равна на това число. Какво трябва да правят играчите?

Нека създадем игрова матрица. В една игра всеки играч има три стратегии: покажете един, два или три пръста. Матрицата 3x3 е дадена в таблица 26.5; допълнителната дясна колона показва минимумите на редовете, а допълнителният долен ред показва максимумите на колоните.

По-ниската цена на играта съответства на стратегията. Това означава, че с разумно, внимателно поведение ние гарантираме, че няма да загубим повече от 3. Малка утеха, но все пак по-добра от, да речем, печалба от 5, открита в някои клетки. на матрицата. Лошо е за нас, играч L... Но нека се утешим: позицията на врага изглежда още по-лоша: по-ниската цена на играта е. разумно поведение той ще ни даде поне 4.