Antagonisztikus játékok folyamatos stratégiákkal. Mátrix antagonista játékok megoldása Antagonisztikus játékok online megoldása

Egy kétszemélyes nulla összegű játékot hívnak, amelyben mindegyiküknek véges stratégiája van. A mátrix játék szabályait a kifizetési mátrix határozza meg, melynek elemei az első játékos nyereményei, amelyek egyben a második játékos veszteségei is.

Mátrix játék egy antagonisztikus játék. Az első játékos a játék árával megegyező maximális (a második játékos viselkedésétől független) garantált nyereményt kapja, hasonlóképpen a második játékos a minimális garantált veszteséget.

Alatt stratégia alatt olyan szabályok (elvek) összességét értjük, amelyek az aktuális helyzettől függően meghatározzák a játékos minden személyes lépéséhez a cselekvési mód kiválasztását.

Most mindenről rendben és részletesen.

Kifizető mátrix, tiszta stratégiák, játék ára

NÁL NÉL mátrix játék szabályai meghatározottak kifizetési mátrix .

Vegyünk egy olyan játékot, amelyben két résztvevő van: az első és a második játékos. Legyen az első játékos m tiszta stratégiák, és a második játékos rendelkezésére áll - n tiszta stratégiák. Mivel egy játékot fontolgatnak, természetes, hogy ebben a játékban vannak győzelmek és vereségek.

NÁL NÉL fizetési mátrix az elemek a játékosok nyereségét és veszteségét kifejező számok. A nyeremények és a veszteségek kifejezhetők pontokban, pénzben vagy más egységekben.

Hozzunk létre egy kifizetési mátrixot:

Ha az első játékos úgy dönt én-a tiszta stratégia, és a második játékos j-a tiszta stratégia, akkor az első játékos nyereménye aij egység, és a második játékos elvesztése is aij egységek.

Mert aij + (- a ij ) = 0, akkor a leírt játék egy nulla összegű mátrixjáték.

A mátrixjáték legegyszerűbb példája az érme feldobása. A játék szabályai a következők. Az első és a második játékos feldob egy érmét, és az eredmény fej vagy farok lesz. Ha fejek és fejek vagy farok vagy farok gurulnak egyszerre, akkor az első játékos egy egységet nyer, más esetekben pedig egy egységet veszít (a második játékos egy egységet nyer). Ugyanez a két stratégia áll a második játékos rendelkezésére. A megfelelő kifizetési mátrix a következő lenne:

A játékelmélet feladata, hogy meghatározza az első játékos stratégiájának megválasztását, amely garantálja számára a maximális átlagos nyereséget, valamint a második játékos stratégiájának megválasztását, amely garantálja számára a maximális átlagos veszteséget.

Hogyan választanak ki stratégiát egy mátrixjátékban?

Nézzük újra a kifizetési mátrixot:

Először is meghatározzuk az első játékos nyereményét, ha használja én tiszta stratégia. Ha az első játékos használja én-th tiszta stratégia, akkor logikus az a feltételezés, hogy a második játékos olyan tiszta stratégiát alkalmaz, ami miatt az első játékos kifizetése minimális lenne. Az első játékos viszont olyan tiszta stratégiát fog alkalmazni, amely a maximális nyereményt biztosítja számára. Ezen feltételek alapján az első játékos kifizetése, amelyet mi jelölünk v1 , nak, nek hívják maximális győzelem vagy alacsonyabb játék ára .

Nál nél ezeknél az értékeknél az első játékosnak a következőképpen kell eljárnia. Minden sorból írja ki a minimális elem értékét, és válassza ki közülük a maximumot. Így az első játékos nyereménye a minimum maximuma lesz. Innen a név – maximin win. Ennek az elemnek a sorszáma az első játékos által választott tiszta stratégia száma lesz.

Most határozzuk meg a második játékos veszteségét, ha használja j-th stratégia. Ebben az esetben az első játékos a saját tiszta stratégiáját használja, amelyben a második játékos vesztesége maximális lenne. A második játékosnak olyan tiszta stratégiát kell választania, amelyben minimális a vesztesége. A második játékos elvesztése, amit mi jelölünk v2 , nak, nek hívják minimális veszteség vagy legjobb játék ára .

Nál nél a játék árával kapcsolatos problémák megoldása és a stratégia meghatározása a második játékos értékeinek meghatározásához a következőképpen járjon el. Minden oszlopból írja ki a maximális elem értékét, és válassza ki közülük a minimumot. Így a második játékos vesztesége a maximum minimuma lesz. Innen a név - minimax gain. Ennek az elemnek az oszlopszáma a második játékos által választott tiszta stratégia száma lesz. Ha a második játékos a „minimax”-ot használja, akkor az első játékos által választott stratégiától függetlenül legfeljebb veszít v2 egységek.

1. példa

.

A sorok legkisebb elemei közül a legnagyobb a 2, ez a játék alacsonyabb ára, ennek az első sor felel meg, ezért az első játékos maximin stratégiája az első. Az oszlopok legnagyobb elemei közül a legkisebb az 5, ez a játék felső ára, a második oszlop ennek felel meg, ezért a második játékos minimax stratégiája a második.

Most, hogy megtanultuk, hogyan találjuk meg a játék alsó és felső árát, a maximin és minimax stratégiákat, itt az ideje megtanulni, hogyan jelöljük ki ezeket a fogalmakat formálisan.

Tehát az első játékos garantált nyereménye:

Az első játékosnak olyan tiszta stratégiát kell választania, amely biztosítja számára a minimális nyeremény maximumát. Ezt az erősítést (maximum) a következőképpen jelöljük:

.

Az első játékos tiszta stratégiáját használja úgy, hogy a második játékos vesztesége maximális legyen. Ezt a veszteséget a következőképpen határozzák meg:

A második játékosnak úgy kell megválasztania tiszta stratégiáját, hogy vesztesége minimális legyen. Ezt a veszteséget (minimax) a következőképpen jelöljük:

.

Egy másik példa ugyanabból a sorozatból.

2. példa Adott egy mátrix játék kifizetési mátrixszal

.

Határozza meg az első játékos maximin stratégiáját, a második játékos minimax stratégiáját, a játék alsó és felső árát.

Megoldás. A kifizetési mátrixtól jobbra kiírjuk a legkisebb elemeket a soraiba, és megjelöljük a maximumot, a mátrix aljáról pedig az oszlopok legnagyobb elemeit, és kiválasztjuk közülük a minimumot:

A sorok legkisebb elemei közül a legnagyobb a 3, ez a játék alacsonyabb ára, a második sor ennek felel meg, ezért az első játékos maximin stratégiája a második. Az oszlopok legnagyobb elemei közül a legkisebb az 5, ez a játék felső ára, az első oszlop ennek felel meg, ezért a második játékos minimax stratégiája az első.

Nyeregpont a mátrixos játékokban

Ha a játék felső és alsó ára megegyezik, akkor a mátrixjáték nyeregpontosnak minősül. Ez fordítva is igaz: ha egy mátrixjátéknak van nyeregpontja, akkor a mátrixjáték felső és alsó ára megegyezik. A megfelelő elem a legkisebb a sorban és a legnagyobb az oszlopban, és megegyezik a játék árával.

Így ha , akkor az első játékos optimális tiszta stratégiája, és a második játékos optimális tiszta stratégiája. Ez azt jelenti, hogy a játék azonos alsó és felső árait ugyanazzal a stratégiapárral érik el.

Ebben az esetben a mátrix játéknak van megoldása a tiszta stratégiákban .

3. példa Adott egy mátrix játék kifizetési mátrixszal

.

Megoldás. A kifizetési mátrixtól jobbra kiírjuk a legkisebb elemeket a soraiba, és megjelöljük a maximumot, a mátrix aljáról pedig az oszlopok legnagyobb elemeit, és kiválasztjuk közülük a minimumot:

A játék alsó ára megegyezik a játék felső árával. Így a játék ára 5. Azaz . A játék ára megegyezik a nyeregpont értékével. Az első játékos maximin stratégiája a második tiszta stratégia, a második játékos minimax stratégiája pedig a harmadik tiszta stratégia. Ez a mátrix játék tisztán stratégiákban kínál megoldást.

Oldja meg saját maga a mátrixjáték problémáját, majd nézze meg a megoldást

4. példa Adott egy mátrix játék kifizetési mátrixszal

.

Keresse meg a játék alsó és felső árát. Ennek a mátrixos játéknak van nyeregpontja?

Mátrix játékok optimális vegyes stratégiával

A legtöbb esetben a mátrixjátéknak nincs nyeregpontja, így a megfelelő mátrixjátéknak nincsenek tiszta stratégiai megoldásai.

De van megoldása az optimális vegyes stratégiákban. Megtalálásukhoz azt kell feltételezni, hogy a játék annyiszor ismétlődik, hogy a tapasztalatok alapján kitalálható legyen, melyik stratégia előnyösebb. Ezért a döntés a valószínűség és az átlag (elvárás) fogalmához kapcsolódik. A végső megoldásban megtalálható a nyeregpont analógja (vagyis a játék alsó és felső árának egyenlősége), valamint a nekik megfelelő stratégiák analógja.

Tehát ahhoz, hogy az első játékos elérje a maximális átlagos nyereséget, a második játékos pedig a minimális átlagos veszteséget, bizonyos valószínűséggel tiszta stratégiákat kell alkalmazni.

Ha az első játékos tiszta stratégiákat alkalmaz valószínűségekkel , majd a vektor az első játékos vegyes stratégiájának nevezik. Más szóval, ez tiszta stratégiák „keveréke”. Ezen valószínűségek összege eggyel egyenlő:

.

Ha a második játékos tiszta stratégiákat alkalmaz valószínűségekkel , majd a vektor a második játékos vegyes stratégiájának nevezik. Ezen valószínűségek összege eggyel egyenlő:

.

Ha az első játékos vegyes stratégiát alkalmaz p, és a második játékos - vegyes stratégia q, akkor van értelme várható érték az első játékos nyer (a második játékos veszít). Ennek megtalálásához meg kell szorozni az első játékos vegyes stratégiai vektorát (amely egysoros mátrix lesz), a kifizetési mátrixot és a második játékos vegyes stratégia vektorát (ami egy oszlopos mátrix lesz):

.

5. példa Adott egy mátrix játék kifizetési mátrixszal

.

Határozza meg az első játékos nyereségének (a második játékos veszteségének) matematikai elvárását, ha az első játékos vegyes stratégiája , a második játékosé pedig .

Megoldás. Az első játékos nyereségének (a második játékos veszteségének) matematikai elvárásának képlete szerint ez egyenlő az első játékos vegyes stratégiai vektorának, a kifizetési mátrixnak és a második játékos vegyes stratégiai vektorának szorzatával:

Az első játékost olyan vegyes stratégiának nevezzük, amely a játék megfelelő számú megismétlése esetén a maximális átlagos nyereményt biztosítaná számára.

Optimális vegyes stratégia A második játékost olyan vegyes stratégiának nevezzük, amely a minimális átlagos veszteséget biztosítaná számára, ha a játékot elegendő számú alkalommal megismétlik.

A tiszta stratégiák esetében a maximin és a minimum max jelölésével analóg módon az optimális vegyes stratégiákat a következőképpen jelöljük (és kapcsolódnak az első játékos nyereségének és a második játékos veszteségének matematikai elvárásához, azaz átlagához):

,

.

Ebben az esetben a funkcióhoz E van egy nyeregpont , ami egyenlőséget jelent.

Az optimális vegyes stratégiák és nyeregpont megtalálása érdekében, pl. oldja meg a mátrix játékot vegyes stratégiákban , le kell redukálnia a mátrixjátékot lineáris programozási problémává, azaz optimalizálási feladattá, és meg kell oldania a megfelelő lineáris programozási feladatot.

Egy mátrixjáték redukálása lineáris programozási problémává

Ahhoz, hogy egy mátrixjátékot vegyes stratégiákban oldjunk meg, egy egyenes vonalat kell összeállítani lineáris programozási problémaés kettős feladata. A duális feladatban a kiterjesztett mátrixot, amely a kényszerrendszerben a változók együtthatóit, a konstans tagokat és a célfüggvényben a változók együtthatóit tárolja, transzponáljuk. Ebben az esetben az eredeti feladat célfüggvényének minimuma a duális feladat maximumához kapcsolódik.

Célfüggvény direkt lineáris programozási feladatban:

.

A kényszerrendszer a lineáris programozás közvetlen problémájában:

Célfüggvény a kettős feladatban:

.

A kettős probléma kényszerrendszere:

Jelölje a direkt lineáris programozási feladat optimális tervét

,

és a duális probléma optimális tervét jelöljük

A megfelelő optimális tervekhez tartozó lineáris formákat és jelöli,

és meg kell találnia őket az optimális tervek megfelelő koordinátáinak összegeként.

Az előző szakasz definícióinak és az optimális tervek koordinátáinak megfelelően az első és második játékos alábbi vegyes stratégiái érvényesek:

.

A matematikusok ezt bebizonyították játék ára az optimális tervek lineáris formáiban fejeződik ki:

,

vagyis az optimális tervek koordinátáinak összegeinek reciproka.

Mi, gyakorlók, ezt a képletet csak vegyes stratégiájú mátrixjátékok megoldására használhatjuk. Tetszik képletek az optimális vegyes stratégiák megtalálásához az első és a második játékos:

amelyben a második faktorok a vektorok. Az optimális vegyes stratégiák is vektorok, amint azt az előző bekezdésben már meghatároztuk. Ezért a számot (a játék árát) megszorozva a vektorral (az optimális tervek koordinátáival), egy vektort is kapunk.

6. példa Adott egy mátrix játék kifizetési mátrixszal

.

Keresse meg a játék árát Vés optimális vegyes stratégiák és .

Megoldás. Összeállítjuk ennek a mátrixjátéknak megfelelő lineáris programozási feladatot:

Megkapjuk a direkt probléma megoldását:

.

Az optimális tervek lineáris alakját a talált koordináták összegeként találjuk meg.

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Diákok, végzős hallgatók, fiatal tudósok, akik a tudásbázist tanulmányaikban és munkájukban használják, nagyon hálásak lesznek Önnek.

Bevezetés

1. Elméleti rész

1.3 Játéksorrend 2v2

1.4 Algebrai módszer

1.5 Grafikus módszer

1.6 Játékok 2xn vagy mx2

1.7 Játékok megoldása mátrix módszerrel

2. Gyakorlati rész

2.2 2xn és mx2 játékok

2.3 Mátrix módszer

2.4 Barna módszer

Az eredmények elemzése

Bevezetés

Az antagonisztikus játék egy nulla összegű játék. Az antagonisztikus játék egy nem kooperatív játék, amelyben két játékos vesz részt, akiknek ellentétes a nyereménye.

Formálisan az antagonisztikus játékot egy hármas képviselheti , ahol X és Y az első és a második játékos stratégiáinak halmaza, F az első játékos kifizetési függvénye, amely az egyes stratégiapárokat (x, y) társítja, ahol a hasznosságnak megfelelő valós szám az első játékos, aki felismerte ezt a helyzetet.

Mivel a játékosok érdekei ellentétesek, az F függvény egyben a második játékos vesztét is jelenti.

Történelmileg az antagonisztikus játékok a játékelmélet matematikai modelljeinek első osztályát képezik, amelyeket leírásra használtak szerencsejáték. Úgy gondolják, hogy ennek a kutatási tárgynak köszönhetően a játékelmélet kapta a nevét. Jelenleg az antagonisztikus játékokat a nem kooperatív játékok szélesebb osztályának tekintik.

1. Elméleti rész

1.1 A játék alapvető definíciói és rendelkezései

A játékot egy olyan szabályrendszer jellemzi, amely meghatározza a játékban résztvevők számát, azok lehetséges cselekvésekés a nyeremények elosztása viselkedésüktől és kimenetelüktől függően. Játékosnak minősül a játék egy résztvevője vagy résztvevőinek csoportja, akiknek olyan közös érdekei vannak, amelyek nem esnek egybe más csoportok érdekeivel. Ezért nem minden résztvevő számít játékosnak.

A játék szabályai vagy feltételei meghatározzák a játékosok lehetséges viselkedését, választásait és lépéseit a játék fejlődésének bármely szakaszában. A játékos választása azt jelenti, hogy megáll egy viselkedési lehetőségnél. A játékos ezután mozdulatokkal választja meg. A lépés megtétele azt jelenti, hogy a játék egy bizonyos szakaszában a játékszabályok által biztosított lehetőségektől függően a választás egészét vagy egy részét egyszerre kell megtenni. A játék egy bizonyos szakaszában minden játékos megtesz egy lépést a választott választásnak megfelelően. A másik játékos, tudva vagy nem tudva az első játékos választásáról, szintén megtesz egy lépést. A játékosok mindegyike igyekszik figyelembe venni a játék múltbeli fejlődésére vonatkozó információkat, ha ezt a játékszabályok lehetővé teszik.

A játékos stratégiájának nevezzük azt a szabályrendszert, amely egyértelműen megmondja a játékosnak, hogy az egyes lépéseknél milyen döntést kell hoznia a játék eredményeként kialakult helyzettől függően. A stratégia a játékelméletben egy bizonyos teljes cselekvési tervet jelent a játékos számára, amely megmutatja, hogyan kell cselekednie a játék fejlődésének minden lehetséges esetben. A stratégia a játék fejlesztésének bármely szakaszában a játékos rendelkezésére álló információk bármely állapotára vonatkozó összes jelzés összességét jelenti. Ez már azt mutatja, hogy a stratégiák lehetnek jók és rosszak, sikeresek és sikertelenek stb.

Nullaösszegű játék akkor lesz, ha minden egyes játékban az összes játékos kifizetésének összege nulla, azaz egy nulla összegű játékban az összes játékos össztőkéje nem változik, hanem újraosztódik a játékosok között. az eredménytől függően. Így sok gazdasági és katonai helyzet nulla összegű játéknak tekinthető.

Különösen a két játékos nulla összegű játékát nevezik antagonisztikusnak, mivel a játékosok céljai közvetlenül ellentétesek: az egyik játékos nyeresége csak a másik veszteségének rovására történik.

1.1.1 Mátrixjátékok definíciója, példái és megoldásai tiszta stratégiákban

A két játékos nulla összegű mátrix játék a következő absztrakt kétjátékos játékként tekinthető.

Az első játékosnak m stratégiája van i =1, 2,…, m, a másodiknak n stratégiája van j = 1, 2,…, n. Minden stratégiapárhoz (i, j) van hozzárendelve egy a ij szám, amely kifejezi a az első játékos kifizetése a második játékosnak, ha az első játékos a sajátját használja i-edik stratégia, a második pedig annak j-edik stratégiája.

Mindegyik játékos tesz egy lépést: az első játékos kiválasztja az i-edik stratégiáját (i = 1, 2, ..., m), a második --a j-ed stratégia (j = 1, 2,…, n), amely után az első játékos ij-t kap a második játékos rovására (ha ij< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

A játékos minden stratégiája i = 1, 2,…, t; j = 1, 2,…, n-t gyakran tiszta stratégiának nevezik.

A két játékos nulla összegű mátrixjátékát egyszerűen mátrixjátéknak nevezik. Nyilvánvaló, hogy a mátrixjáték az antagonisztikus játékok közé tartozik. Definíciójából következik, hogy egy mátrixjáték definiálásához elegendő egy A = (a ij) mátrix megadása az első játékos nyereményeinek m nagyságrendjéből.

Figyelembe véve a kifizetési mátrixot

akkor az A mátrixszal rendelkező mátrixjáték minden egyes játékának végrehajtása az első játékos általi választásra redukálódik i-edik sor, és a második játékos a j-edik oszlopban, és az első játékos (a második rovására) megkapja az A mátrixban az i-edik sor és a j-edik oszlop metszéspontjában található kifizetést.

Ahhoz, hogy egy valós konfliktushelyzetet mátrixjáték formájában formalizáljunk, meg kell határozni és át kell számozni minden játékos tiszta stratégiáját, és össze kell állítani egy kifizetési mátrixot.

A következő lépés a játékosok optimális stratégiáinak és kifizetéseinek meghatározása.

A játékok tanulmányozásában a legfontosabb a játékosok optimális stratégiáinak koncepciója. Ennek a fogalomnak intuitív jelentése a következő: egy játékos stratégiája akkor optimális, ha ennek a stratégiának az alkalmazása biztosítja számára a legnagyobb garantált nyereményt a másik játékos összes lehetséges stratégiája után. Ezen pozíciók alapján az első játékos a nyereményei A mátrixát az (1.1) képlet szerint a következőképpen vizsgálja: minden i értékre (i = 1, 2, ..., m) a minimális nyereményértéket határozzuk meg attól függően, hogy a második játékos által használt stratégiákról

(i = 1, 2,..., m) (1,2)

azaz meghatározzák az első játékos minimális nyereményét, feltéve, hogy az i-edik tiszta stratégiáját alkalmazza, akkor ezekből a minimális nyereményekből olyan i=i 0 stratégiát találunk, amelynél ez a minimális nyeremény maximális lesz, azaz megtalálható.

Meghatározás. Az (1.3) képlet által meghatározott b számot a játék alacsonyabb nettó költségének nevezzük, és azt mutatja meg, hogy az első játékos mekkora minimális kifizetést tud magának garantálni, ha tiszta stratégiáit alkalmazza a második játékos minden lehetséges akciójára.

A második játékosnak optimális viselkedésével törekednie kell arra, hogy lehetőség szerint minimalizálja az első játékos nyereményét stratégiái rovására. Ezért a második játékos esetében azt találjuk

azaz az első játékos maximális nyereményét határozzák meg, feltéve, hogy a második játékos alkalmazza a sajátját j-edik tiszta stratégiát, akkor a második játékos megtalálja a saját j = j 1 stratégiáját, amelyre az első játékos megkapja a minimális nyereményt, azaz megtalálja

Meghatározás. Az (1.5) képlettel meghatározott β számot a játék nettó felső költségének nevezzük, és megmutatja, hogy az első játékos mekkora maximális nyereséget tud magának garantálni stratégiáinak köszönhetően. Más szóval, a tiszta stratégiáinak alkalmazásával az első játékos legalább b nyereményt biztosíthat, a második játékos pedig a tiszta stratégiáinak alkalmazásával megakadályozhatja, hogy az első játékos c-nél többet nyerjen.

Meghatározás. Ha egy A mátrixú játékban a játék alsó és felső nettó ára egybeesik, azaz b = c, akkor ennek a játéknak állítólag van nyeregpontja a tiszta stratégiákban és nettó játékára:

n = b = c (1,6)

A nyeregpont az első és a második játékos tiszta stratégiáinak () párja, amelyek alapján az egyenlőség megvalósul.

A nyeregpont fogalmának jelentése a következő: ha az egyik játékos ragaszkodik a nyeregpontnak megfelelő stratégiához, akkor a másik játékos nem tehet jobban, mint a nyeregpontnak megfelelő stratégiát. Figyelembe véve, hogy a játékos legjobb viselkedése nem vezethet a nyeremény csökkenéséhez, a legrosszabb viselkedés pedig a nyeremény csökkenéséhez vezethet, ezek a feltételek matematikailag a következő összefüggések formájában írhatók fel:

ahol i, j az első és a második játékos bármely tiszta stratégiája; (i 0 , j 0) -- nyeregpontot képező stratégiák. Az alábbiakban megmutatjuk, hogy a nyeregpont definíciója egyenértékű az (1.8) feltételekkel.

Így (1.8) alapján az A mátrixban a nyeregelem a minimum az i 0 -edik sorban, a maximum pedig a j 0 -edik oszlopban. Az A mátrix nyeregpontjának megtalálása egyszerű: a mátrixban A, egymás után minden sorban keresse meg a minimális elemet, és ellenőrizze, hogy ez az elem a maximum az oszlopában. Ha ilyen, akkor nyeregelem, és a neki megfelelő stratégiapár nyeregpontot képez. Az első és második játékos tiszta stratégiapárját (i 0 , j 0), amelyek nyeregpontot és nyeregelemet alkotnak, a játék megoldásának nevezzük.

Az i 0 és j 0 nyeregpontot képező tiszta stratégiákat az első és a második játékos optimális tiszta stratégiájának nevezzük.

1. Tétel. Legyen f (x, y) két x A és y B változó valós függvénye és létezik

akkor b = c.

Bizonyíték. A minimum és maximum definíciójából az következik

Mivel x tetszőleges az (1.11) bal oldalán, akkor

Az (1.12) egyenlőtlenség jobb oldalán y tetszőleges, tehát

Q.E.D.

Konkrétan a () mátrix az f (x, y) függvény speciális esete, azaz ha x = i, y = j, = f (x, y) -t tesszük, akkor az 1. Tételből azt kapjuk, hogy az alsó A nettó ár nem haladja meg a játék felső nettó értékét a mátrixjátékban.

Meghatározás. Legyen f (x, y) két x A és y B változó valós függvénye. Az (x 0, y 0) pontot az f (x, y) függvény nyeregpontjának nevezzük, ha a következő egyenlőtlenségek teljesülnek:

f (x, y 0) f (x 0, y 0) f (x 0, y) (1,14)

bármely x A és y B esetén.

1.2 Optimális vegyes stratégiák és tulajdonságaik

A mátrixjáték tanulmányozása azzal kezdődik, hogy a tiszta stratégiákban megtaláljuk a nyeregpontját. Ha egy mátrixjátéknak van nyeregpontja a tiszta stratégiákban, akkor ennek a pontnak a megtalálása véget vet a játék tanulmányozásának. Ha a mátrixjátékban nincs nyeregpont a tiszta stratégiákban, akkor ennek a játéknak az alsó és felső tiszta árait találjuk, amelyek azt jelzik, hogy az első játékos ne reménykedjen a játék felső áránál nagyobb nyereményben, ill. biztos lehet benne, hogy nem kevesebbet kap, mint a játék alacsonyabb ára. Az ilyen ajánlások a mátrixjátékban a játékosok viselkedésére vonatkozóan, tiszta stratégiák nyeregpontja nélkül, nem elégíthetik ki a kutatókat és a gyakorlati szakembereket. A mátrixjátékok megoldásában a tiszta stratégiák alkalmazásának titkának kihasználásában kell keresni a javulást, valamint a játékok parti formájában történő ismételt megismétlésének lehetőségét. Így például sakk, dáma, foci játszmák sorozatát játsszák, és minden alkalommal, amikor a játékosok úgy alkalmazzák a stratégiájukat, hogy ellenfeleik nincsenek tisztában azok tartalmával, és közben átlagosan bizonyos nyereményeket érnek el. az egész játéksorozatot lejátszva. Ezek a kifizetések átlagosan nagyobbak, mint a játék alsó ára és kisebbek, mint a játék felső ára. Minél nagyobb ez az átlagérték, annál jobb stratégia alkalmazza a játékos. Ezért felmerült az ötlet, hogy a tiszta stratégiákat véletlenszerűen, bizonyos valószínűséggel alkalmazzuk. Ez teljes mértékben biztosítja használatuk titkosságát. Minden játékos megváltoztathatja a tiszta stratégiák alkalmazásának valószínűségét oly módon, hogy maximalizálja átlagos nyereményét, és optimális stratégiákat érjen el az út során. Ez az ötlet vezetett a vegyes stratégia koncepciójához.

Meghatározás. Egy játékos vegyes stratégiája a tiszta stratégiák alkalmazásának valószínűségeinek teljes halmaza.

Így, ha az első játékosnak m tiszta stratégiája van 1, 2, … i, … m, akkor az x vegyes stratégiája x = (x 1 , x 2 , ..., x i ,…, x t ) számok halmaza kielégítő. a kapcsolatokat

x i 0 (i = 1, 2, ... , m), = 1. (1,15)

Hasonlóképpen, a második játékos számára, akinek n tiszta stratégiája van, az y vegyes stratégia az y = (y 1 ,…, y j , … y n) számok halmaza, amely kielégíti az összefüggéseket.

y j 0 (j = 1, 2, ... , n), = 1. (1,16)

Mivel minden alkalommal, amikor egy játékos egy tiszta stratégiát használ, kizárja egy másik használatát, a tiszta stratégiák összeegyeztethetetlen események. Ráadásul ezek az egyetlen lehetséges események.

Nyilvánvaló, hogy a tiszta stratégia a vegyes stratégia speciális esete. Valóban, ha vegyes stratégiában van ilyen i-edik net stratégiát egyes valószínűséggel alkalmazzák, akkor az összes többi tiszta stratégiát nem alkalmazzák. Ez az i-edik tiszta stratégia pedig a vegyes stratégia speciális esete. A titoktartás érdekében minden játékos a saját stratégiáját alkalmazza, függetlenül a másik játékos választásától.

Meghatározás. Az A mátrixú mátrixjátékban az első játékos átlagos nyereményét a nyereményei matematikai elvárásaként fejezzük ki

E (A, x, y) = (1,20)

Nyilvánvaló, hogy az első játékos átlagos nyeresége két x és y változókészlet függvénye. Az első játékos célja, hogy maximalizálja átlagos nyereményét E (A, x, y) az x vegyes stratégiáinak megváltoztatásával, a második játékos pedig arra törekszik, hogy vegyes stratégiái révén E (A, x, y) minimális legyen, azaz pl. a játék megoldásához olyan x, y-t kell találni, amelyre a játék felső árát elérjük.

1.3 Rendelj 22 játékot

A 22-es sorrendű mátrixjátékot a következő kifizetési mátrix adja az első játékos számára:

Ennek a játéknak a megoldását a nyeregpont megtalálásával kell kezdeni a tiszta stratégiákban. Ebből a célból keresse meg az első sorban a minimális elemet, és ellenőrizze, hogy az oszlopában a maximum-e. Ha ilyen elem nem található, akkor a második sort is ugyanúgy ellenőrzi. Ha ilyen elem található a második sorban, akkor ez egy nyeregelem.

A nyeregelem megtalálásával, ha van ilyen, a megoldás megtalálásának folyamata véget ér, hiszen ebben az esetben a játék ára - egy nyeregelem és egy nyeregpont, azaz egy tiszta stratégia pár az első és a második számára - kiderül. játékosok, amelyek optimális tiszta stratégiát alkotnak. Ha a tiszta stratégiákban nincs nyeregpont, akkor vegyes stratégiákban kell nyeregpontot találni, ami a mátrixjátékok főtétele szerint szükségszerűen létezik.

Jelölje x=(x 1 ,x 2), y=(y 1 ,y 2) az első és a második játékos vegyes stratégiáját. Emlékezzünk vissza, hogy x 1 azt a valószínűséget jelenti, hogy az első játékos használja az első stratégiáját, és az x 2 = 1 - x 1 a második stratégiáját. Hasonlóképpen a második játékos esetében: 1 - az első stratégia használatának valószínűsége, y 2 = 1 - 1 - a második stratégia használatának valószínűsége.

A tétel következtetése szerint az x és y vegyes stratégiák optimalitásához szükséges és elegendő, hogy a nem negatív x 1 , x 2 , y 1 , y 2 -re a következő összefüggések teljesüljenek:

Most megmutatjuk, hogy ha a mátrixjátéknak nincs nyeregpontja a tiszta stratégiákban, akkor ezeknek az egyenlőtlenségeknek egyenlőségekké kell alakulniuk:

Valóban. Hagyja, hogy a játéknak ne legyen nyeregpontja a tiszta stratégiákban, akkor a vegyes stratégiák optimális értékei kielégítik az egyenlőtlenségeket

0<<1, 0<< 1,

0< <1, 01. (1.25)

Tegyük fel, hogy (1.22) mindkét egyenlőtlensége szigorú

akkor a tétel szerint y 1 = y 2 = 0, ami ellentmond az (1.25) feltételeknek.

Hasonlóan igazolható, hogy (1.23) mindkét egyenlőtlensége nem lehet szigorú egyenlőtlenség.

Tegyük fel most, hogy az (1.22) egyenlőtlenségek egyike lehet szigorú, például az első

Ez azt jelenti, hogy az y 1 = 0 tétel szerint y 2 =1. Ezért (1.23)-ból azt kapjuk

Ha mindkét egyenlőtlenség (1.24) szigorú, akkor az x1 = x2 = 0 tétel alapján, ami ellentmond (1.25). De ha egy 12 a 22 , akkor az (1.27) egyenlőtlenségek egyike szigorú, a másik pedig egyenlőség. Ezenkívül az egyenlőség a 12-ből és a 22-ből származó nagyobb elemre érvényes, azaz az (1.27)-ből származó egy egyenlőtlenségnek szigorúnak kell lennie. Például egy 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

Így látható, hogy ha a mátrixjátéknak nincs nyeregpontja a tiszta stratégiákban, akkor az (1.22) egyenlőtlenségek az első játékos optimális stratégiáinak egyenlőségévé alakulnak. Az (1.23) egyenlőtlenségekkel kapcsolatos hasonló érvek ahhoz a tényhez vezetnek, hogy ebben az esetben az (1.23) egyenlőtlenségeknek egyenlőségnek kell lenniük.

Tehát, ha egy 22-es sorrendű mátrixjátéknak nincs nyeregpontja, akkor az (1.24) egyenletrendszer megoldásával meghatározható a játékosok optimális vegyes stratégiája és a játék ára. Azt is megállapították, hogy ha egy 2x2-es mátrixos játékban az egyik játékosnak van optimális tiszta stratégiája, akkor a másik játékosnak is van optimális tiszta stratégiája.

Ezért ha egy mátrixjátéknak nincs nyeregpontja tiszta stratégiákban, akkor vegyes stratégiákban kell megoldást találnia, amelyeket az (1.24) egyenletek határoznak meg. Rendszermegoldás (1.25)

1.4 Algebrai módszer

A problémák algebrai módszerrel történő megoldásának két esete van:

1. a mátrixnak van nyeregpontja;

2. a mátrixnak nincs nyeregpontja.

Az első esetben a megoldás a játék nyeregpontját képező stratégiapár. Nézzük a második esetet. A megoldásokat itt vegyes stratégiákban kell keresni:

Keressen stratégiákat és Amikor az első játékos az optimális stratégiáját használja, a második játékos például két ilyen tiszta stratégiát alkalmazhat

Ugyanakkor a tulajdonság alapján, ha az egyik játékos az optimális vegyes stratégiát alkalmazza, a másik pedig bármilyen tiszta, az optimális vegyes stratégiájában nem nulla valószínűséggel szerepel, akkor a kifizetés matematikai elvárása mindig változatlan marad és megegyezik a játék árával, i.e.

A kifizetésnek minden esetben meg kell egyeznie az V játék értékével. Ebben az esetben a következő összefüggések érvényesek:

A (2.5), (2.6)-hoz hasonló egyenletrendszer is összeállítható a második játékos optimális stratégiájához:

Figyelembe véve a normalizálási feltételt:

Oldjuk meg az (1.37) - (1.41) egyenletet az ismeretlenekre nézve együtt, és ne egyszerre, hanem hárman: külön-külön (1.36), (1.38), (1.40) és (1.37), (1.39) , (1,41). A megoldás eredményeként a következőket kapjuk:

1.5 Grafikus módszer

A 22. játék hozzávetőleges megoldása meglehetősen könnyen elérhető grafikus módszerrel. A lényege a következő:

1.1 ábra - egységnyi hosszúságú szakasz megtalálása

Válasszon ki egy egységnyi hosszúságú szakaszt az abszcissza tengelyen. A bal vége az első játékos első stratégiáját fogja ábrázolni, a jobb vége pedig a másodiké. Minden közbenső pont megfelel az első játékos kevert stratégiáinak, és a ponttól jobbra lévő szakasz hossza megegyezik az első stratégia használatának valószínűségével, a bal oldali szakasz hossza pedig a felhasználás valószínűsége. a második stratégia az első játékos által.

Két I-I és II-II tengelyt hajtanak végre. Az I-I-n elhalasztjuk a kifizetést, ha az első játékos az első stratégiát használja, a II-II-n pedig, amikor a második stratégiát. Ha például a második játékos alkalmazza az első stratégiáját, akkor az értéket az I-I tengelyen, az értéket pedig a II-II tengelyen kell ábrázolni.

Az első játékos bármilyen vegyes stratégiája esetén a nyereményét a szegmens mérete határozza meg. Az I-I sor az első stratégia második játékos általi alkalmazásának felel meg, ezt nevezzük a második játékos első stratégiájának. A második játékos második stratégiája hasonló módon építhető fel. Ekkor általában a játékmátrix grafikus megjelenítése a következő formában jelenik meg:

1.2 ábra - a játék árának megállapítása

Meg kell azonban jegyezni, hogy ezt az építkezést az első játékos számára hajtották végre. Itt a szakasz hossza megegyezik a játék V értékével.

Az 1N2 vonalat alsó kifizetési vonalnak nevezik. Itt jól látható, hogy az N pont az első játékos garantált nyereményének maximális értékének felel meg.

Általánosságban elmondható, hogy ebből az ábrából a második játékos stratégiája is meghatározható, például ilyen módon. Az I-I tengelyen:

vagy a II-II tengelyen

A második játékos stratégiája azonban ugyanúgy meghatározható, mint az első játékosnál, azaz. készítsen egy ilyen diagramot.

1.3. ábra - a második játékos stratégiájának meghatározása

Itt az 1N2 vonal a veszteség felső határa. Az N pont a második játékos minimális lehetséges veszteségének felel meg, és ez határozza meg a stratégiát.

Az együtthatók konkrét értékétől függően a gráfmátrixok eltérő formájúak is lehetnek, például az alábbiak szerint:

1.4 ábra - meghatározza az első játékos optimális stratégiáját

Ilyen helyzetben az első játékos optimális stratégiája tiszta:

1.6 Játékok 2n vagy m2

A 2n sorrendű játékokban az első játékosnak 2 tiszta stratégiája van, a másodiknak pedig n tiszta stratégiája van, azaz. Az első játékos kifizetési mátrixa a következő:

Ha egy ilyen játéknak van nyeregpontja, akkor azt könnyű megtalálni és megoldást találni.

Tegyük fel, hogy a játéknak vannak nyeregpontjai. Ekkor olyan vegyes stratégiákat kell találni, illetve az első és második játékost és a játék árat v, amelyek kielégítik az összefüggéseket:

Mivel a játéknak nincs nyeregpontja, az egyenlőtlenséget (1,54) az egyenlőtlenségek váltják fel

Az (1.56), (1.55), (1.53) rendszerek megoldásához a grafikus módszert célszerű alkalmazni. Ebből a célból bevezetjük az egyenlőtlenség bal oldalának jelölését (1,53)

mátrix játék matematikai modellje

vagy (1.55)-ből állítva és egyszerű transzformációkat végrehajtva megkapjuk

hol van az első játékos átlagos kifizetése, feltéve, hogy vegyes stratégiáját használja, a második pedig a j-edik tiszta stratégiáját.

A kifejezés szerint minden j=1, 2, …, n érték egy téglalap alakú koordinátarendszerben egy egyenesnek felel meg.

A második játékos célja, hogy stratégiáinak megválasztásával minimalizálja az első játékos nyereményét. Ezért számolunk

ahol a kényszerhalmaz alsó határa. Az 1.6. ábrán a függvény grafikonja vastag vonallal látható.

Házigazda: http://www.allbest.ru/

1.6. ábra - függvénygrafikon

Az első játékos célja, hogy a választáson keresztül maximalizálja a nyereményét, pl. kiszámítja

Az 1.6. ábrán a pont azt a maximális értéket jelenti, amelynél kapott. A játék ára, mert:

Így grafikusan meghatározásra kerül az első játékos optimális vegyes stratégiája és a második játékos tiszta stratégiáinak párja, amelyek egy pontot alkotnak a metszéspontban Az 1.6. ábra a második játékos 2. és 3. stratégiáját mutatja. Az ilyen stratégiák esetében az egyenlőtlenségek (1,53) egyenlőségekké alakulnak. Az 1.6. ábrán ezek a j=2, j=3 stratégiák.

Most meg tudjuk oldani az egyenletrendszert

és pontosan meghatározza a és értékeit (grafikusan hozzávetőlegesen határozzák meg). Ezután az összes értéket abba a j-be helyezzük, amelyhez nem alkotnak pontot, és megoldjuk az (1.56) egyenletrendszert. Az 1.6. ábrán látható példánál ez a következő rendszer:

és a többi Ez a rendszer megoldható lejtővel Ha valamilyen j=j 0 esetén a második játékos stratégiái egy M 0 pontot alkotnak, majd a kényszerhalmazok alsó korlátjának maximális értékét egy szegmenssel párhuzamosan ábrázoljuk. a tengely Ebben az esetben az első játékosnak végtelen sok optimális értéke és a játék ára van. Ez az 1.7 ábrán látható eset, ahol és az MN szegmens a felső határt jelenti, az optimális értékek a határokon belül vannak. a második játékosnak tiszta optimális stratégiája van j=j 0 .

Az m2-es mátrixjátékokat grafikus módszerrel is megoldják. Az első játékos kifizetési mátrixának ebben az esetben a formája

Az első és a második játékos vegyes stratégiáját ugyanúgy definiáljuk, mint a 2n sorrendű játékok esetében. Ábrázoljuk a vízszintes tengely mentén a 0-tól 1-ig tartó értéket, a függőleges tengelyen az első játékos átlagos nyereményének értékét, olyan feltételek mellett, hogy az első játékos a tiszta i-edik stratégiáját alkalmazza (i=1, 2, ..., m), a második - a vegyes stratégiája (y 1 , 1- y 1) =y. Például ha m=4 grafikusan) az 1.7. ábra szerint ábrázolható.

1.7. ábra - függvénygrafikon)

Az első játékos megpróbálja maximalizálni átlagos nyereményét, ezért megpróbálja megtalálni

A függvény vastag vonalként jelenik meg, és a kényszerkészlet felső határát jelöli. A második játékos stratégiája megválasztásával próbál minimalizálni, pl. érték megfelel

Az ábrán az értéket pont jelzi. Más szavakkal, az első játékos két stratégiája és a második játékos valószínűsége meghatározott, amelyre egyenlőség érhető el.

Az ábráról azt látjuk, hogy a játék ára a pont ordinátája, a valószínűség a pont abszcisszája. A többi tiszta stratégiák az első játékos az optimális vegyes stratégia kell ().

Így az (1.69) rendszer megoldásával megkapjuk a második játékos optimális stratégiáját és a játék értékét. Az első játékos számára optimális vegyes stratégiát a következő egyenletrendszer megoldásával találjuk meg:

1.7 Mátrix módszer a játékok megoldására

Megnevezések:

A sorrendi mátrix bármely négyzetes részmátrixa

Mátrix (1);

Mátrix transzponált;

B-hez csatolt mátrix;

- (1) egy X-ből a vételkor törölt soroknak megfelelő elemek törlésével kapott mátrix;

- (1) a vételkor törölt soroknak megfelelő elemek törlésével kapott mátrix.

Algoritmus:

1. Válassza ki a () sorrendi mátrix négyzetes részmátrixát, és számítsa ki

2. Ha néhány vagy, akkor dobja el a talált mátrixot, és próbáljon ki egy másik mátrixot.

3. Ha (), (), akkor kiszámítjuk és felépítjük az X-et és az és-ből, a megfelelő helyekre nullákat hozzáadva.

Annak ellenőrzése, hogy az egyenlőtlenségek teljesülnek-e

mindegyikre (1,75)

és egyenlőtlenségek

mindegyikre (1,76)

Ha az egyik arány nem teljesül, akkor megpróbálunk másikat. Ha minden összefüggés érvényes, akkor X, és a kívánt megoldások.

1.8 A játék árának egymás utáni közelítésének módszere

A játékszituációk tanulmányozása során gyakran előfordulhat, hogy nem szükséges pontos megoldást találni a játékra, vagy valamilyen oknál fogva lehetetlen vagy nagyon nehéz megtalálni a játékköltség és az optimális vegyes stratégiák pontos értékét. Ezután közelítő módszereket használhat a mátrixjáték megoldására.

Leírjuk ezen módszerek egyikét - a játék árának egymás utáni közelítésének módszerét. A módszerrel számított kifizetések száma megközelítőleg a kifizetési mátrix sorainak és oszlopainak számával arányosan növekszik.

A módszer lényege a következő: mentálisan sokszor játsszák a játékot, i.e. sorrendben, minden játékban a játékos kiválasztja azt a stratégiát, amely a legnagyobb (teljes) nyereményt biztosítja számára.

Egyes játékok ilyen megvalósítása után kiszámítja az első játékos nyerésének és a második játékos veszteségének átlagos értékét, és ezek számtani átlagát a játék árának hozzávetőleges értékének veszi. A módszer lehetővé teszi mindkét játékos optimális vegyes stratégiájának közelítő értékének meghatározását: ki kell számítani az egyes tiszta stratégiák alkalmazási gyakoriságát, és azt közelítő értéknek kell tekinteni a megfelelő játékos optimális vegyes stratégiájában.

Bizonyítható, hogy a programjátékok számának korlátlan növekedésével az első játékos átlagos nyeresége és a második játékos átlagos vesztesége korlátlanul megközelíti a játék árát, illetve a vegyes stratégiák hozzávetőleges értékeit. Az az eset, amikor a játék megoldása egyedi, az egyes játékosok optimális vegyes stratégiáira törekszik. Általánosságban elmondható, hogy a megadott értékek feletti értékek közelítése a valódi értékekhez lassú. Ez a folyamat azonban könnyen gépesíthető, és így viszonylag nagy rendű kifizetési mátrixok mellett is a szükséges pontosságú megoldást segíti elő a játékban.

2. Gyakorlati rész

A pár eldönti, hová menjen sétálni, és hova tölteni az időt kettesben.

A lány elhatározza, hogy elmegy sétálni a parkba, hogy friss levegőt szívjon, este pedig elmegy filmet nézni a legközelebbi moziba.

A srác felajánlja, hogy elmegy a technoparkba, miután megnézte a helyi klub focistáinak meccsét a központi stadionban.

Ennek megfelelően meg kell találni, hogy mennyi ideig éri el valamelyik játékos célja. A kifizetési mátrix így fog kinézni:

1. táblázat: Kifizetési mátrix

Stratégiák

1 2 óta nyilvánvalóan nincs nyereg ebben a játékban a tiszta stratégiákban. Ezért a következő képleteket használjuk, és megkapjuk:

Házigazda: http://www.allbest.ru/

2.2 2xn és mx2 lejátszás

1. feladat (2xn)

Két növényt termesztenek száraz és nedves éghajlatra.

A természet állapota pedig a következőnek tekinthető: száraz, nedves, mérsékelt.

Házigazda: http://www.allbest.ru/

Az M() maximális értékét a j=1, j"=2-nek megfelelő egyenesek metszéspontja által alkotott M pontban érjük el. Ezért feltételezzük: ,

2. feladat (mx2)

A srác és a lány fontolgatják a lehetőségeket, hogy hova menjenek hétvégére.

A pihenőhely kiválasztását a következőképpen ábrázolhatjuk: park, mozi, étterem.

Házigazda: http://www.allbest.ru/

Az M() maximális értékét a j=1, j"=2-nek megfelelő egyenesek metszéspontja által alkotott E pontban érjük el. Ezért feltételezzük: ,

A v érték meghatározásához meg kell oldania a következő egyenleteket:

2.5 Mátrix módszer

Két versengő étterem (vendéglátó egység) az alábbi szolgáltatáscsomagokat nyújtja. Az első étterem a központban, a másik pedig a város szélén található.

A központi étterem az alábbi szolgáltatásokat nyújtja:

1) drágább és jobb ügyfélszolgálat;

2) az ételek középpontjában a francia konyha áll;

A második étterem a következőket kínálja:

1) nem drága és jó minőségű szolgáltatás;

2) a menü ötvözi a világ különböző híres konyháit;

3) rendszeres promóciók és kedvezmények;

4) kézbesítést végez és házhoz szállítással kapcsolatos megrendeléseket fogad.

A feladatnak megfelelően az egy napra jutó nyereség a két étterem között az alábbiak szerint kerül felosztásra:

2. táblázat: Kifizetési mátrix

Stratégiák

Egy ilyen alakú játék mátrixos megoldása:

Hat részmátrix van és:

Tekintsük a mátrixot:

x 1 =? 0,x2=? 0

Mivel x 2 =< 0, то мы отбрасываем.

Tekintsük most a mátrixot:

x 1 =? 0,x2=? 0

A játék ára.

Ez az arány ellentmond a követelménynek, ezért nem megfelelő.

Tekintsük most a mátrixot:

x 1 = , x 2 = ? 0,

y 1 =< 0, y 2 = ? 0.

Mivel y 1 =< 0, то мы отбрасываем и.

Tekintsük most a mátrixot:

x 1 \u003d, x 2 \u003d 0, mivel x 2 \u003d 0, majd eldobjuk és.

Tekintsük most a mátrixot:

x 1 = , x 2 = ? 0. Mivel x 1 \u003d 0, akkor eldobjuk és.

Tekintsük most a mátrixot:

x 1 = , x 2 =, y 1 = , y 2 =, akkor folytatjuk tovább:

x 1 = , x 2 =, y 1 = , y 2 = vagy

A játék ára.

Most a fő kapcsolatokat ellenőrizzük:

Házigazda: http://www.allbest.ru/

Válasz: x 1 =, x 2 =, y 1 =, y 2 =, y 3 =0, y 4 =0,.

Barna módszer

Egy-egy cég dolgozóinak kérésére a szakszervezet tárgyal a vezetőségével a meleg étkezés megszervezéséről a cég költségére. A dolgozók érdekeit képviselő szakszervezet gondoskodik arról, hogy az étkezés a lehető legjobb minőségű és ezáltal drágább legyen. A cég vezetésének érdekei ellentétesek. A felek végül a következőkben állapodtak meg. A szakszervezet (1. játékos) három meleg ételt szállító cég (A 1 , A 2 , A 3 ) közül választ egyet, a cégvezetés (2. játékos) pedig három lehetséges ételkészlet közül (B 1, B 2, B 3) . A megállapodás aláírása után a szakszervezet az alábbi fizetési mátrixot alakítja ki, melynek elemei egy edénykészlet költségét jelentik:

Adja meg a játékot a következő kifizetési mátrix:

Tegyük fel, hogy a második játékos a 2. stratégiáját választotta, akkor az első a következőt kapja:

2, ha az első stratégiáját használja,

3, ha a 3. stratégiáját használja.

A kapott értékeket az 1. táblázat foglalja össze.

3. táblázat. A második játékos stratégiája

tétel száma

2. játékos stratégia

1. játékos nyer

A 3. táblázat azt mutatja, hogy a második játékos 2. stratégiájával az első játékos kapja a legnagyobb nyereményt 3 a 2. vagy 3. stratégiájával. Mivel az első játékos a maximális nyereményt akarja elérni, a második játékos 2. stratégiájára a 2. stratégiájával válaszol. Az első játékos 2. stratégiájával a második elveszíti:

1, ha alkalmazza az első stratégiáját,

3, ha a 2. stratégiáját használja,

4, ha a 3. stratégiáját használja.

4. táblázat. Az első játékos stratégiája

tétel száma

1 játékos stratégia

A 2. játékos elvesztése

A 2. táblázat azt mutatja, hogy az első játékos 2. stratégiájával a második játékos veszíti a legkevesebbet 1, ha alkalmazza az 1. stratégiáját. Mivel a második játékos kevesebbet akar veszíteni, ezért az első játékos 2. stratégiájára válaszul az 1. stratégiáját alkalmazza. A kapott eredményeket az 5. táblázat foglalja össze.

5. táblázat. Az első és a második játékos stratégiája

tétel száma

2. játékos stratégia

Az 1. játékos teljes nyereménye

1 játékos stratégia

táblázatban. 5 a második sorban lévő második játékos stratégiájának oszlopában az 1-es szám, ami azt jelzi, hogy a második játékban előnyös, ha a második játékos az 1. stratégiáját használja; az oszlopban, és az első játékos legnagyobb átlagos kifizetése 3, amelyet az első játékban kapott; a w oszlop tartalmazza a második játékos által az első játékban elszenvedett legkisebb átlagos veszteséget 1; a v oszlop tartalmazza a v = (u + w) számtani átlagot -- vagyis a játék árának hozzávetőleges értékét, amelyet a játék egy játékának megjátszásakor kapunk. Ha a második játékos az 1. stratégiáját használja, akkor az első játékos 3, 1, 2-t kap az 1., 2., 3. stratégiájával, és az első játékos teljes nyereménye mindkét játékban:

2 + 3=5 az első stratégiájával,

3 + 1=4 a 2. stratégiájával,

3 + 2=5 a 3. stratégiájával.

Ezek a teljes nyeremények a táblázat második sorában vannak rögzítve. 3 és az első játékos stratégiáinak megfelelő oszlopokban: 1, 2, 3.

Az összes nyeremény közül a legnagyobb az 5. Ezt az első játékos 1. és 3. stratégiájával kapja meg, majd bármelyiket választhatja; mondjuk ilyen esetekben, amikor két (vagy több) egyforma teljes kifizetés van, akkor a legkisebb számú stratégiát választjuk (esetünkben az 1. stratégiát kell választanunk).

Az első játékos 1. stratégiájával a második játékos 3-at, 2-t, 3-at veszít az 1., 2. és 3. stratégiájával szemben, és a második játékos teljes vesztesége mindkét játékban:

1 + 3=4 az első stratégiájával,

3 + 2=5 a 2. stratégiájával,

4 + 3=7 a 3. stratégiájával.

Ezeket a teljes veszteségeket a táblázat második sorában rögzítjük. 5. és a második játékos 1., 2., 3. stratégiájának megfelelő oszlopokban.

A második játékos összes vesztesége közül a legkisebb a 4. Ezt az 1. stratégiájával kapja, ezért a harmadik játékban a második játékosnak kell alkalmaznia az 1. stratégiáját. Az oszlopba és tegye az első játékos legnagyobb össznyereményét két játékban, osztva a játékok számával, azaz; a w oszlop tartalmazza a második játékos legkisebb összesített veszteségét két játszmában, osztva a játszmák számával, azaz ; ezeknek az értékeknek a számtani átlaga az v oszlopba kerül, azaz = Ez a szám a két „lejátszott” játék árának hozzávetőleges értéke.

Így a következő 4. táblázatot kapjuk a játék két sorozatára vonatkozóan.

6. táblázat: A játékosok összesített nyeresége és vesztesége két lejátszott meccsen

2. játékos stratégia

Az 1. játékos teljes nyereménye

1 játékos stratégia

A 2. játékos teljes elvesztése

A 6. táblázat harmadik sorában, a második játékos stratégia oszlopában az 1-es szám található, ami azt jelzi, hogy a harmadik játékban a második játékosnak kell alkalmaznia az 1. stratégiáját. Ebben az esetben az első játékos nyer 3-at, 1-et, 2-t, az 1., 2., 3. stratégiáját alkalmazva, és a teljes nyereménye három játszmára:

3 + 5 = 8 az első stratégiánál,

1 +4 = 5 a második stratégiájával,

2 + 5 = 7 a 3. stratégiájához.

Az első játékos összes nyereményét a 6. táblázat harmadik sorában és az 1., 2., 3. stratégiájának megfelelő oszlopokban rögzítjük. Mivel az első játékos 8. legnagyobb össznyereményét az 1. stratégiával kapjuk, ennek megfelelően választja ki az 1. .

Az első játékos 1. stratégiájával a második játékos 3-at, 1-et, 2-t veszít az 1., 2. és 3. stratégiával szemben, és a második játékos teljes vesztesége mindkét játékban:

3 + 4=7 az első stratégiájával,

2 + 5=7 a 2. stratégiájával,

3 + 7=10 a 3. stratégiájával.

Ezeket a teljes veszteségeket a táblázat harmadik sorában rögzítjük. 6. és a második játékos 1., 2., 3. stratégiájának megfelelő oszlopokban. Az összes vesztesége közül 7 a legkisebb, és az 1. és 2. stratégiájával éri el, majd a második játékosnak kell alkalmaznia az 1. stratégiáját.

táblázatban. 6 az oszlop harmadik sorában és az első játékos legnagyobb össznyeresége három játékban, osztva a játék számával, azaz ; w oszlop tartalmazza a második játékos legkisebb összesített veszteségét három játszmában, osztva a játszmák számával, azaz ; a v oszlopba tedd a számtani átlagukat

Így megkapjuk a táblázatot. 7 három partira.

7. táblázat: A játékosok összesített nyeresége és vesztesége három lejátszott meccsen

tétel száma

2. játékos stratégia

Az 1. játékos teljes nyereménye

1 játékos stratégia

A 2. játékos teljes elvesztése

8. táblázat: Döntő asztal húsz lejátszott mérkőzéssel

tétel száma

2. játékos stratégia

Az 1. játékos teljes nyereménye

1 játékos stratégia

A 2. játékos teljes elvesztése

Táblázatból. A 7. és 8. ábrán látható, hogy 20 elvesztett játszmában az 1., 2., 3. stratégia az első játékosnál 12, 3, 5 alkalommal fordul elő, így ezek relatív gyakorisága rendre egyenlő; az 1., 2., 3. stratégiák a második játékosnál rendre 7, illetve 11,2 alkalommal fordulnak elő, így relatív gyakoriságuk rendre egyenlő; a játék árának hozzávetőleges értéke. Ez a közelítés elég jó.

Végezetül megjegyezzük, hogy ha a játéknak egynél több megoldása van, akkor a játék költségének hozzávetőleges értékei továbbra is korlátlanul megközelítik a játék valódi költségét, és a stratégiák megjelenésének relatív gyakoriságát. a játékosok többé nem feltétlenül közelítik meg a játékosok valódi optimális vegyes stratégiáit.

Az eredmények elemzése

Ebben a kurzusmunkában az antagonisztikus játékok megoldásának anyagát tanulmányozzuk grafikus, mátrixos módszerrel, a játék árának egymás utáni közelítésének módszerével. Megtalálható az első és második játékos optimális stratégiája, valamint a játék költsége 2x2, 2xn és mx2 játékokban, valamint a mátrix módszert és Brown módszert alkalmazó játékokban.

Egy pár példáján egy 2x2-es játékot modelleztek, amelyet algebrai és grafikus módszerrel oldottak meg. A játékot algebrai módszerrel megoldva a megoldás azt mutatja, hogy optimális vegyes stratégiájuk alkalmazásával az első és a második játékos 4,6 órát tölt együtt. A probléma grafikus megoldása kis hibával sikerült, és 4,5 órát tett ki.

Emellett két feladatot is modelleztek, 2xn és mx2. A 2xn problémában a mezőgazdasági kultúrát vették figyelembe, és a stratégia azt mutatja, hogy jobb, ha a táblát 50-szer 50-re telepítik, és a játék ára 3,75 millió rubel volt. Az mx2 problémában pedig egy párat vettek figyelembe, amelynek stratégiája azt mutatta, hogy olcsóbb a parkba és a moziba menni, az ár és a költség pedig 4,3 rubel lesz.

A mátrix módszerre modelleztem egy feladatot, amelyben két éttermet vettek figyelembe, a probléma megoldása azt mutatta, hogy az optimális vegyes stratégiát alkalmazva az első étterem nyeresége 15,6 millió rubel lesz, az optimális vegyes stratégiát alkalmazva pedig kb. a második étteremben nem engedi, hogy az első 15,6 millió rubelnél többet keressen. A grafikus módszerrel végzett megoldás hibát adott, és a játék ára 14,9 millió rubel volt.

A Brown-módszerhez egy olyan feladatot fogalmaztak meg, amelyben a szakszervezet és a cégvezetés szerepel, az ő feladatuk a dolgozók élelmezése. Ha mindkét játékos az optimális stratégiáját használja, az egy főre jutó étel 2,45 ezer rubel lesz.

A felhasznált források listája

1) Vilisov V.Ya. Előadásjegyzetek "Játékelmélet és statisztikai megoldások", - Ágazat - "Voskhod" MAI. 1979. 146 p.

2) Krushevsky A.V. Játékelmélet, - Kijev: Vishcha iskola, 1977. - 216 p.

3) Cherchmen U., Akof R., Arnof L., Bevezetés a műveletek kutatásába. - M.: Tudomány. 1967. - 488 p.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0%B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

Az Allbest.ru oldalon található

Hasonló dokumentumok

    A döntéshozatal, mint egy speciális emberi tevékenység. A játékmátrix racionális ábrázolása. Példák mátrixjátékokra tiszta és vegyes stratégiákban. Operációkutatás: lineáris programozási problémák kapcsolata játékelméleti modellel.

    szakdolgozat, hozzáadva: 2010.05.05

    Sokszor ismétlődő játékok, jellegzetes tulajdonságaik és szakaszaik. Vegyes stratégiák, gyakorlati felhasználásuk feltételei és lehetőségei. Elemző módszer 2 x 2-es játék megoldására.Téglalapjátékok alaptételei. Algebrai megoldások.

    bemutató, hozzáadva 2013.10.23

    A bimátrix játékok elméletének alapdefiníciói. Példa a „Diák-Tanár” bimátrix játékra. Vegyes stratégiák bimátrixos játékokban. Keresse az "egyensúlyi helyzet" kifejezést. 2x2 bimátrixos játékok és képletek arra az esetre, amikor minden játékosnak két stratégiája van.

    absztrakt, hozzáadva: 2011.02.13

    A mátrixos és antagonisztikus játékokról szóló általános információk tanulmányozása. Helyzeti játék fogalma, fa, információs halmaz. A maximin elv és az egyensúlyi elv figyelembevétele. Pareto optimalitás. Pozicionális nem antagonisztikus játék, tulajdonságai.

    szakdolgozat, hozzáadva 2014.10.17

    A játékelmélet a matematika egyik ága, amelynek tárgya a konfliktusban optimális döntések meghozatalára szolgáló matematikai modellek tanulmányozása. Iteratív Brown-Robinson módszer. Monoton iteratív algoritmus mátrixjátékok megoldására.

    szakdolgozat, hozzáadva: 2007.08.08

    Kifizetési mátrix összeállítása, a játék alsó és felső nettó árának, a játékosok maximin és minimax stratégiáinak keresése. A fizetési mátrix egyszerűsítése. Mátrixos játék megoldása lineáris programozási feladatra való redukálás és a "Megoldás keresése" kiegészítő segítségével.

    teszt, hozzáadva: 2014.11.10

    A játékelmélet a konfliktushelyzetek matematikai elmélete. Kétszemélyes nulla összegű játék matematikai modelljének kidolgozása, megvalósítása programkódok formájában. Problémamegoldó módszer. Bemeneti és kimeneti adatok. Program, használati útmutató.

    szakdolgozat, hozzáadva 2013.08.17

    Alapvető tudnivalók a szimplex módszerről, szerepének és jelentőségének értékelése a lineáris programozásban. Geometriai értelmezés és algebrai jelentés. Lineáris függvény maximumának és minimumának megtalálása, speciális esetek. A feladat megoldása mátrix szimplex módszerrel.

    szakdolgozat, hozzáadva: 2015.06.01

    Számítástechnikai rendszerek matematikai modelljeinek megalkotásának technikái, amelyek tükrözik működésük szerkezetét és folyamatait. A fájlhozzáférések száma az átlagos feladat során. Fájlok külső memóriameghajtókba helyezésének lehetőségének meghatározása.

    labormunka, hozzáadva 2013.06.21

    Matematikai modell tervezése. A tic-tac-toe játék leírása. Logikai játékmodell Boole-algebrán alapul. Digitális elektronikai eszközök és matematikai modelljük fejlesztése. Játékkonzol, játékvezérlő, játéktábla karakterlánc.

A játékelmélet a konfliktus vagy bizonytalanság körülményei között történő döntéshozatal matematikai modelljeinek elmélete. Feltételezzük, hogy a felek cselekvéseit a játékban bizonyos stratégiák – akciószabályok – jellemzik. Ha az egyik oldal nyeresége elkerülhetetlenül a másik oldal elvesztéséhez vezet, akkor antagonisztikus játszmákról beszélnek. Ha a stratégiák halmaza korlátozott, akkor a játékot mátrixjátéknak nevezik, és a megoldást nagyon egyszerűen megkaphatjuk. A játékelmélet segítségével kapott megoldások a versenytársak esetleges ellenállása vagy a külső környezet bizonytalansága esetén is hasznosak a tervek elkészítésében.


Ha a bimátrixos játék antagonisztikus, akkor a 2. játékos kifizetési mátrixát teljes mértékben az 1. játékos kifizetési mátrixa határozza meg (e két mátrix megfelelő elemei csak előjelekben különböznek egymástól). Ezért a bimátrix antagonista játékot teljes egészében egyetlen mátrix (az 1. játékos kifizetési mátrixa) írja le, és ennek megfelelően mátrixjátéknak nevezik.

Ez a játék antagonisztikus. Ebben j \u003d x2 - O, P és R (O, O] \u003d H (P, P) \u003d -I és R (O, P) \u003d R (P, O) \u003d 1, vagy mátrix formában o p

Legyen néhány játékosztály Г „tükörzárt”, pl. minden játékával együtt tartalmaz egy tükörizomorf játékot (mivel minden játék, amelyik tükörizomorf egy adott játékkal, izomorf egymással, az imént elmondottaknak megfelelően egy tükörizomorf játékról beszélhetünk). Ilyen osztály például az összes antagonisztikus játék osztálya vagy az összes mátrixjáték osztálya.

Felidézve az antagonisztikus játékban elfogadható helyzetek meghatározását, azt kapjuk, hogy a mátrixjáték vegyes kiterjesztésében az (X, Y) helyzet akkor és csak akkor elfogadható az 1. játékos számára, ha bármely x G x esetén az egyenlőtlenség.

A játékok szimmetrikussá alakításának folyamatát szimmetrizációnak nevezzük. Leírunk itt egy szimmetrizációs módszert. A szimmetrizáció egy másik, alapvetően eltérő változatát a 26.7. A szimmetrizáció mindkét változata ténylegesen alkalmazható tetszőleges antagonisztikus játékokra, de csak a mátrixos játékokra fogjuk megfogalmazni és bebizonyítani.

Így az általános antagonisztikus játékok elméletének kezdeti kifejezései és megnevezései egybeesnek a mátrixjátékok elméletének megfelelő kifejezéseivel és megnevezéseivel.

A véges antagonista (mátrix) játékoknál ezeknek a szélsőségeknek a létezését a 10. fejezetben bizonyítottuk. 1, és a lényeg az egyenlőség megteremtése volt, vagy legalábbis az egyenlőtlenségük leküzdésének módja.

Már a mátrixjátékok figyelembevétele is mutatja, hogy a játékosok kezdetben megadott stratégiái között vannak egyensúlyi helyzetek nélküli (és kellően kis e > 0 esetén e-egyensúlyi helyzetek nélküli) antagonista játékok is.

De minden véges (mátrix) játék kiterjeszthető egy végtelen játékra, például úgy, hogy minden játékosnak tetszőleges számú dominált stratégiát biztosítunk (lásd 22. Ch. 1). Nyilvánvaló, hogy a játékos stratégiakészletének ilyen bővítése valójában nem jelenti a lehetőségeinek bővülését, és a kibővített játékban való tényleges viselkedése nem térhet el az eredeti játékban tapasztalt viselkedésétől. Így azonnal elegendő számú példát kaptunk végtelen számú antagonisztikus játékra, amelyeknek nincs nyeregpontja. Ilyenre is van példa.

Így a maximin elv megvalósításához egy végtelen antagonisztikus játékban, mint egy véges (mátrix) játék esetében, a játékosok stratégiai képességeinek némi bővítésére van szükség. 96-ért

Akárcsak a mátrixjátékok esetében (lásd 1., 17. fejezet), az általános antagonisztikus játékoknál is fontos szerepet játszik a vegyes stratégiai spektrum fogalma, amelyet itt azonban általánosabb definícióval kell ellátni.

Végül vegye figyelembe, hogy az 1. játékos összes vegyes stratégiájának halmaza egy tetszőleges antagonisztikus játékban olyan, mint a mátrixban

Már az antagonisztikus játékok mérlegelése is azt mutatja, hogy az ilyen játékok nagy része, beleértve a végeseket is, a mátrixjátékok nem az eredeti, tiszta stratégiákban, hanem csak az általánosított, kevert stratégiákban rendelkeznek egyensúlyi helyzetekkel. Ezért az általános, nem antagonisztikus, nem kooperatív játékoknál természetes, hogy az egyensúlyi helyzeteket pontosan vegyes stratégiákban keressük.

Így például (lásd a 3.1. ábrát) már megjegyeztük, hogy a „Vállalkozónak” szinte soha nem kell megküzdenie a viselkedési bizonytalansággal. De ha az "Adminisztrátor" típus fogalmi szintjét vesszük, akkor minden pont az ellenkezője. Általános szabály, hogy az ilyen „döntéshozónknak” a bizonytalanság fő típusa a „konfliktus”. Most tisztázhatjuk, hogy ez általában nem szigorú rivalizálás. Valamivel ritkábban az „Adminisztrátor” a „természetes bizonytalanság” körülményei között hoz döntéseket, és még ritkábban találkozik szigorú, antagonisztikus konfliktussal. Ráadásul az érdekek ütköztetése az „Adminisztrátor” döntései során, úgymond „egyszer” előfordul, vagyis a mi besorolásunk szerint gyakran csak egy (néha nagyon kis számú) játékot játszik. A következmények értékelésére szolgáló skálák gyakrabban kvalitatívak, mint mennyiségiek. Az „Adminisztrátor” stratégiai függetlensége meglehetősen korlátozott. A fentiek figyelembevételével kijelenthető, hogy az ilyen nagyságrendű problémahelyzeteket leggyakrabban nem kooperatív, nem antagonisztikus bi-mátrix játékokkal kell elemezni, ráadásul tiszta stratégiákban.

A mátrix antagonista játékok megoldásának elvei

Ennek eredményeként ésszerűen elvárható, hogy a fent leírt játékban az ellenfelek betartsák a választott stratégiájukat. Mátrix antagonista játék, amelyhez max min fiv = min max Aiy>

Azonban nem minden mátrix antagonista játék egészen határozott, és általában

Így általános esetben egy /uxl dimenziójú mátrixantagonista játék megoldásához meg kell oldani egy pár kettős lineáris programozási feladatot, ami optimális stratégiák halmazát eredményezi, és a játék költségét v.

Hogyan definiálható két személy mátrixantagonista játéka?

Milyen módszerek vannak a mátrixantagonista játékok egyszerűsítésére, megoldására

Kétszemélyes játék esetén természetes, hogy érdekeiket egymással szemben állónak tekintjük – a játék antagonisztikus. Így az egyik játékos nyereménye megegyezik a másik veszteségével (mindkét játékos nyereményének összege nulla, innen a név, a nulla összegű játék). Olyan játékokat fogunk megvizsgálni, amelyekben minden játékosnak véges számú alternatívája van. Egy ilyen nulla összegű kétszemélyes játék kifizetési függvénye megadható mátrix formában (kifizetési mátrix formájában).

Mint már említettük, a végső antagonisztikus játékot mátrixnak nevezik.

MATRIX GAMES – az antagonisztikus játékok osztálya, amelyben két játékos vesz részt, és minden játékosnak véges számú stratégiája van. Ha az egyik játékosnak m stratégiája van, a másiknak pedig n stratégiát, akkor összeállíthatunk egy txn dimenziójú játékmátrixot. M.i. lehet nyereghegye vagy nincs. Az utóbbi esetben

Tekintsünk egy véges nulla összegű páros játékot. Jelölje a játékos nyereményét A, és azon keresztül b- játékos nyer B. Mert a = –b, akkor egy ilyen játék elemzésekor nem kell mindkét számot figyelembe venni - elég az egyik játékos nyereményét figyelembe venni. Legyen ez pl. A. A következőkben a bemutatás megkönnyítése érdekében az oldal A feltételesen elnevezzük " mi"és az oldala B – "ellenség".

Hagyjuk m lehetséges stratégiák A 1 , A 2 , …, A m, és az ellenség n lehetséges stratégiák B 1 , B 2 , …, B n(az ilyen játékot játéknak hívják m×n). Tételezzük fel, hogy mindegyik fél egy bizonyos stratégiát választott: mi választottunk Ai, ellenfél B j. Ha a játék csak személyes mozdulatokból áll, akkor a stratégiák kiválasztása Aiés B j egyedileg határozza meg a játék kimenetelét - a nyereményünket (pozitív vagy negatív). Jelöljük ezt a nyereséget mint aij(A stratégia kiválasztásakor nyerünk Ai, és az ellenség – stratégiák B j).

Ha a játék a személyes véletlenszerű lépéseken kívül tartalmaz egy pár stratégia nyereményét Ai, B j egy valószínűségi változó, amely az összes véletlenszerű lépés eredményétől függ. Ebben az esetben a várható megtérülés természetes becslése az véletlenszerű győzelem matematikai elvárása. A kényelem kedvéért jelöljük aij mind magát a kifizetést (véletlenszerű lépések nélküli játékban), mind annak matematikai elvárását (véletlen lépésekkel rendelkező játékban).

Tegyük fel, hogy ismerjük az értékeket aij minden egyes stratégiapárhoz. Ezeket az értékeket felírhatjuk mátrixként, amelynek sorai megfelelnek a stratégiánknak ( Ai), az oszlopok pedig az ellenfél stratégiáit mutatják ( B j):

B j A i B 1 B 2 B n
A 1 a 11 a 12 a 1n
A 2 a 21 a 22 a 2n
A m a m 1 a m 2 amn

Egy ilyen mátrixot hívnak a játék kifizetési mátrixa vagy egyszerűen játékmátrix.

Ne feledje, hogy a sok stratégiát tartalmazó játékok kifizetési mátrixának felépítése nehéz feladat lehet. Például egy sakkjáték esetében a lehetséges stratégiák száma olyan nagy, hogy a kifizetési mátrix felépítése gyakorlatilag lehetetlen. Azonban elvileg minden véges játék levezethető mátrix formára.

Fontolgat példa 1 4×5 antagonisztikus játék. Négy stratégia áll a rendelkezésünkre, az ellenségnek öt. A játék mátrixa a következő:

B j A i B 1 B 2 B 3 B 4 B 5
A 1
A 2
A 3
A 4

Milyen stratégiát alkalmazzunk (azaz a játékosnak A) használni? Bármilyen stratégiát is választunk, egy ésszerű ellenfél azzal a stratégiával fog válaszolni, amelyre minimális a nyereségünk. Például ha a stratégiát választjuk A 3 (10-es győzelem kísért), az ellenfél válaszul stratégiát választ B 1 , és a nyereményünk csak 1 lesz. Nyilvánvalóan az óvatosság elve alapján (és ez a játékelmélet fő elve) azt a stratégiát kell választanunk, amelyben minimális nyereségünk a maximális.

Jelölje a i a stratégia minimális megtérülési értéke Ai:

és adjunk hozzá egy oszlopot, amely ezeket az értékeket tartalmazza a játék mátrixához:

B j A i B 1 B 2 B 3 B 4 B 5 minimum sorokban a i
A 1
A 2
A 3
A 4 maximin

Stratégia kiválasztásakor azt kell választanunk, amelyikhez az érték a i maximális. Jelöljük ezt a maximális értéket α :

Érték α hívott alacsonyabb játék ára vagy maximin(maximális minimális nyeremény). Játékos stratégia A maximumának megfelelő α , nak, nek hívják maximal stratégia.

Ebben a példában a maximin α egyenlő 3-mal (a táblázatban a megfelelő cella szürkével van kiemelve), a maximin stratégia pedig A négy . Ha ezt a stratégiát választottuk, biztosak lehetünk benne, hogy az ellenség bármilyen viselkedéséért nem kevesebbet nyerünk, mint 3 (és az ellenség „indokolatlan” viselkedésével talán többet is) Ez az érték a mi garantált minimumunk, amit biztosítani tudunk magunkat, ragaszkodva a legóvatosabb („viszontbiztosítási”) stratégiához.

Most hasonló érvelést fogunk végrehajtani az ellenséggel kapcsolatban B B A B 2 - válaszolunk neki A .

Jelölje β j A B) a stratégiához Ai:



β j β :

7. MI A FELSŐ ÉRTÉK JÁTÉK Most hasonló érvelést hajtunk végre az ellenfélnél B. Érdekelt abban, hogy minimalizáljuk a nyereségünket, vagyis kevesebbet adjon nekünk, de számolnia kell a viselkedésünkkel, ami számára a legrosszabb. Például ha a stratégiát választja B 1 , akkor stratégiával válaszolunk neki A 3 , és 10-et ad nekünk. Ha úgy dönt B 2 - válaszolunk neki A 2, és 8-at ad, és így tovább. Nyilván egy óvatos ellenfélnek azt a stratégiát kell választania, amelyben a maximális nyereségünk minimális lesz.

Jelölje β j a maximális értékek a kifizetési mátrix oszlopaiban (a játékos maximális nyereménye A, vagy ami ugyanaz, a játékos maximális vesztesége B) a stratégiához Ai:

és adjunk hozzá egy sort, amely ezeket az értékeket tartalmazza a játék mátrixához:

Stratégiát választva az ellenség azt fogja előnyben részesíteni, amelyik számára értékes β j minimális. Jelöljük azzal β :

Érték β hívott legjobb játék ára vagy minimax(minimális maximális nyeremény). Az ellenfél (játékos) stratégiája, amely megfelel a minimaxnak B), nak, nek hívják minimax stratégia.

A minimax a nyereség értéke, amelynél többet egy ésszerű ellenfél biztosan nem ad nekünk (más szóval, egy ésszerű ellenfél nem veszít többet, mint β ). Ebben a példában a minimax β egyenlő 5-tel (a táblázatban a megfelelő cella szürkével van kiemelve), és az ellenfél stratégiájával érhető el B 3 .

Tehát az óvatosság elve ("mindig a legrosszabbra számíts!") alapján stratégiát kell választanunk A 4, és az ellenség - egy stratégia B 3. Az óvatosság elve alapvető a játékelméletben, és az ún minimax elv.

Fontolgat 2. példa. Hagyjuk a játékosokat Aés NÁL NÉL a három szám egyike egyidejűleg és egymástól függetlenül van írva: "1", vagy "2", vagy "3". Ha a felírt számok összege páros, akkor a játékos B fizet a játékosnak A ez az összeg. Ha az összeg páratlan, akkor a játékos fizeti ezt az összeget A játékos NÁL NÉL.

Írjuk fel a játék kifizetési mátrixát, és keressük meg a játék alsó és felső árát (a stratégia szám megfelel az írott számnak):

Játékos A ragaszkodnia kell a maximin stratégiához A 1-gyel legalább -3-at nyerni (vagyis legfeljebb 3-at veszíteni). Minimax játékos stratégia B bármelyik stratégia B 1 és B 2, ami garantálja, hogy legfeljebb 4-et ad.

Ugyanezt az eredményt kapjuk, ha a kifizetési mátrixot a játékos szemszögéből írjuk fel NÁL NÉL. Valójában ezt a mátrixot a játékos szemszögéből összeállított mátrix transzponálásával kapjuk A, és az elemek előjeleit az ellenkezőjére változtatjuk (a játékos kifizetése óta A a játékos elvesztése NÁL NÉL):

Ebből a mátrixból az következik, hogy a játékos B követnie kell bármelyik stratégiát B 1 és B 2 (és akkor nem veszít többet 4-nél), és a játékos A– stratégiák A 1 (és akkor legfeljebb 3-at veszít). Mint látható, az eredmény teljesen megegyezik a fent kapottal, így az elemzés nem mindegy, hogy melyik játékos szempontjából végezzük el.

8 MI AZ ÉRTÉKES JÁTÉK.

9. MIBŐL ÁLL A MINIMAX ALAPELV. 2. A játék alsó és felső ára. Minimax elv

Tekintsünk egy mátrixjátékot a kifizetési mátrixszal

Ha a játékos DE stratégiát fog választani A i, akkor minden lehetséges hozadéka elem lesz én-a mátrix sora TÓL TŐL. A legrosszabb egy játékos számára DE eset, amikor a játékos NÁL NÉL megfelelő stratégiát alkalmaz minimális eleme ennek a sornak, a játékos nyereményének DE egyenlő lesz a számmal.

Ezért a maximális nyeremény elérése érdekében a játékos DE ki kell választania az egyik stratégiát, amelyhez a szám maximális.

A játékelméletben részletesen kidolgozott legegyszerűbb eset egy nulla összegű véges páros játék (két személy vagy két koalíció antagonisztikus játéka). Tekintsünk egy G játékot, amelyben két A és B játékos vesz részt, ellentétes érdekekkel: az egyik nyeresége egyenlő a másik veszteségével. Mivel az A játékos nyereménye megegyezik a B játékos nyereményével ellenkező előjellel, ezért minket csak az a játékos nyereménye érdekelhet. Természetesen A maximalizálni, B pedig minimalizálni akarja a-t.

Az egyszerűség kedvéért mentálisan azonosítsuk magunkat az egyik játékossal (legyen az A), és hívjuk őt „mi”, B játékost pedig „ellenfélnek” (ebből persze A számára nem származik valódi előny). Legyen lehetséges stratégiáink és az ellenfél - lehetséges stratégiáink (az ilyen játékot játéknak hívják). Jelöljük a nyereményünket, ha mi alkalmazzuk a stratégiát, az ellenfél pedig a stratégiát

26.1. táblázat

Tegyük fel, hogy minden egyes stratégiapár esetében a kifizetés (vagy átlagos kifizetés) a ismert számunkra. Ezután elvileg lehetőség van egy téglalap alakú táblázat (mátrix) összeállítására, amely felsorolja a játékosok stratégiáit és a hozzájuk tartozó kifizetéseket (lásd 26.1. táblázat).

Ha összeállítunk egy ilyen táblázatot, akkor azt mondjuk, hogy a G játék mátrix formára redukálódik (önmagában a játék ilyen formába hozása már nehéz feladat, sőt néha gyakorlatilag lehetetlen feladat lehet a rengeteg stratégia miatt ). Ne feledje, hogy ha a játék mátrixos formára redukálódik, akkor a többlépéses játék valójában egy lépéses játékká redukálódik – a játékosnak csak egy lépést kell tennie: válasszon egy stratégiát. Röviden jelöljük a játékmátrixot

Vegyünk egy példát egy G (4X5) játékra mátrix formában. A rendelkezésünkre álló (választható) négy stratégia közül az ellenségnek öt stratégiája van. A játék mátrixát a 26.2 táblázat tartalmazza

Gondoljuk végig, milyen stratégiát alkalmazunk (A játékos)? A Matrix 26.2 csábító "10"-es kifizetéssel rendelkezik; ki kell választani azt a stratégiát, amelyben megkapjuk ezt a „finomságot”.

De várj, az ellenség sem hülye! Ha mi választjuk a stratégiát, akkor ő, dacára, a stratégiát választja, és kapunk valami nyomorult „1”-et. Nem, nem választhat stratégiát! Hogyan legyen? Nyilvánvalóan az óvatosság elvéből kiindulva (és ez a játékelmélet fő elve) azt a stratégiát kell kiválasztanunk, amelynél a minimális nyereségünk a legnagyobb.

26.2. táblázat

Ez az úgynevezett „mini-max elv”: cselekedj úgy, hogy ellenfeled legrosszabb viselkedésével a maximális nyereséget érd el.

Írjuk át a 26.2 táblázatot, és a jobb oldali további oszlopba minden sorba felírjuk az erősítés minimális értékét (egy sor minimumát); jelöljük az a sorra (lásd a 26.3 táblázatot).

26.3. táblázat

Az összes érték közül (jobb oldali oszlop) a legnagyobb (3) van kiválasztva. Megfelel a stratégiának. Ha ezt a stratégiát választottuk, minden esetben biztosak lehetünk abban, hogy (az ellenség bármilyen viselkedése esetén) legalább 3-at nyerünk. Ez az érték a mi garantált nyereségünk; óvatosan viselkedve ennél kevesebbet nem kaphatunk, többet kaphatunk).

Ezt a nyereményt a játék alacsonyabb árának nevezik (vagy "maximin" - a minimális nyeremények maximuma). Jelöljük a. A mi esetünkben

Most vegyük az ellenség nézőpontját, és érveljünk mellette. Nem valami gyalog, hanem ésszerű is! Stratégiát választva szeretne kevesebbet adni, de számolnia kell a viselkedésünkkel, ami számára a legrosszabb. Ha stratégiát választ, válaszolunk neki, és 10-et ad; ha úgy dönt, válaszolunk neki és visszaadja stb.. A 26.3 táblához egy további alsó sort adunk, és abba írjuk az oszlopok maximumát.. Nyilvánvalóan az óvatos ellenfélnek azt a stratégiát kell választania, amelynél ez az érték minimális (a megfelelő 5 értéket a 26.3 táblázat kiemeli) . Ez a P érték a nyereség értéke, amelynél többet egy ésszerű ellenfél biztosan nem ad nekünk. Ezt a játék felső árának nevezik (vagy "mi-nimax" - a maximális nyeremény minimuma). Példánkban és az ellenfél stratégiájával érhető el

Tehát az óvatosság elve (a „mindig a legrosszabbra számolj!” viszontbiztosítási szabály) alapján az A stratégiát, az ellenséget pedig stratégiát kell választanunk. Az ilyen stratégiákat „minimax”-nak nevezzük (a minimax elv alapján). Mindaddig, amíg példánkban mindkét fél ragaszkodik a minimax stratégiájához, a kifizetődő lesz

Most képzeljük el egy pillanatra, hogy megtanultuk, hogy az ellenség stratégiát követ. Ugyan, megbüntetjük ezért és választunk egy stratégiát, 5-öt kapunk, és ez nem is olyan rossz. De végül is az ellenség sem kisasszony; tudassa vele, hogy a mi stratégiánk a , ő is sietni fog a választással, 2-re csökkentve a nyereményünket stb. (a partnerek „rohantak a stratégiák körül”). Röviden, a példánkban szereplő minimax stratégiák instabilok a másik oldal viselkedésére vonatkozó információk tekintetében; ezek a stratégiák nem rendelkeznek az egyensúlyi tulajdonsággal.

Mindig ilyen? Nem mindig. Tekintsünk egy példát a 26.4. táblázatban megadott mátrixszal.

Ebben a példában a játék alsó ára megegyezik a felsővel: . Mi következik ebből? Az A és B játékosok minimax stratégiája stabil lesz. Amíg mindkét játékos ragaszkodik hozzájuk, a nyeremény 6. Nézzük meg, mi történik, ha (A) megtudjuk, hogy az ellenfél (B) ragaszkodik a B stratégiához?

26.4. táblázat

És pontosan semmi sem fog változni, Mert a stratégiától való bármilyen eltérés csak ronthat helyzetünkön. Ugyanígy az ellenfél által kapott információ nem készteti arra, hogy visszavonuljon stratégiája elől. A nyeregpont és a kiegyensúlyozott stratégiapár jelenlétének jele a játék alsó és felső árának egyenlősége; a teljes értéket a játék árának nevezzük. Felcímkézzük

Azokat a stratégiákat (jelen esetben ), amelyeknél ez a nyereség elérhető, optimális tiszta stratégiáknak nevezzük, és ezek kombinációja megoldást jelent a játékra. Ebben az esetben maga a játék állítólag tiszta stratégiákban oldódik meg. Mind A, mind B fél megkaphatja a maga optimális stratégiáját, amelyben pozíciójuk a lehető legjobb. És hogy A játékos 6-ot nyer, B játékos veszít, hát ezek a játék feltételei: A számára előnyösek, B-nek pedig hátrányosak.

Az olvasóban felmerülhet a kérdés: miért nevezik az optimális stratégiákat „tisztának”? Kicsit előre tekintve válaszoljunk erre a kérdésre: vannak "vegyes" stratégiák, amelyek abból állnak, hogy a játékos nem egy stratégiát alkalmaz, hanem több, véletlenszerűen váltogatva. Tehát, ha elismerjük, a tisztán, vegyes stratégiákon kívül minden véges játéknak van megoldása - egyensúlyi pontja. De erről bővebben még várni kell.

A nyeregpont jelenléte a játékban korántsem szabály, inkább kivétel. A legtöbb játéknak nincs nyeregpontja. Vannak azonban olyan játékok, amelyeknek mindig van nyeregpontja, és ezért tiszta stratégiákkal oldják meg őket. Ezek az úgynevezett „teljes információs játékok”. A teljes információval rendelkező játék olyan játék, amelyben minden játékos minden személyes lépésnél ismeri fejlődésének teljes előtörténetét, azaz minden korábbi lépésének eredményét, mind személyes, mind véletlenszerűen. Példák a teljes információt tartalmazó játékokra: dáma, sakk, tic-tac-toe stb.

A játékelméletben bebizonyosodott, hogy minden teljes információval rendelkező játéknak van nyeregpontja, ezért tiszta stratégiákkal megoldható. Minden tökéletes információval rendelkező játékban van egy pár optimális stratégia, amely a játék árával megegyező stabil kifizetést ad és. Ha egy ilyen játék csak személyes mozdulatokból áll, akkor amikor minden játékos a saját optimális stratégiáját alkalmazza, annak egészen határozottan kell végződnie - a játék árával megegyező nyeremény mellett. Tehát, ha a játék megoldása ismert, akkor maga a játék elveszti értelmét!

Vegyünk egy elemi példát egy teljes információs játékra: két játékos felváltva helyezi el a nikkeleket egy kerek asztalra, tetszőlegesen megválasztva az érme középpontjának helyzetét (az érmék kölcsönös átfedése nem megengedett). Az nyer, aki az utolsó fillért is odateszi (amikor nincs hely másoknak). Könnyen belátható, hogy ennek a játéknak a végeredménye lényegében előre eldöntött dolog. Létezik egy bizonyos stratégia, amely biztosítja, hogy az a játékos nyerjen, aki először teszi az érmét.

Ugyanis először nikkelt kell tennie az asztal közepére, majd az ellenfél minden lépésére szimmetrikus mozdulattal kell válaszolnia. Nyilvánvaló, hogy bárhogyan is viselkedik az ellenfél, nem kerülheti el a vereséget. Pontosan ugyanez a helyzet a sakkkal és a teljes információs játszmákkal általában: bármelyik mátrix formájú játéknak van nyeregpontja, tehát a megoldás tiszta stratégiákban van, ezért csak addig van értelme, amíg ez a megoldás nem található. Mondjuk sakkjátszma vagy mindig fehér győzelmével végződik, vagy mindig fekete győzelmével, vagy mindig döntetlennel, de hogy pontosan mi - azt még nem tudjuk (a sakk szerelmeseinek szerencsére). Tegyük hozzá még: belátható időn belül aligha fogjuk megtudni, mert a stratégiák száma akkora, hogy rendkívül nehéz (ha nem lehetetlen) mátrix formára redukálni és nyeregpontot találni benne.

És most tegyük fel magunknak a kérdést, hogy mit tegyünk, ha a játéknak nincs nyeregpontja: Nos, ha minden játékosnak egyetlen tiszta stratégiát kell választania, akkor nincs mit tenni: a minimax elvnek kell vezérelnie. Egy másik dolog, ha „keverheti” a stratégiáit, véletlenszerűen váltogathatja őket bizonyos valószínűségekkel. A vegyes stratégiák alkalmazását így képzelik el: a játékot sokszor megismétlik; a játék minden egyes játéka előtt, amikor a játékos személyes lépést kap, választását a véletlenre "bízza", "sorsot dob", és a kiesett stratégiát választja (az előző fejezetből már tudjuk, hogyan kell rendezni a sorsolást). ).

A vegyes stratégiák a játékelméletben a változtatható, rugalmas taktika modelljei, amikor egyik játékos sem tudja, hogyan fog viselkedni az ellenfél egy adott játékban. Ezt a taktikát (bár általában minden matematikai indoklás nélkül) gyakran használják kártyajátékok. Egyúttal jegyezzük meg, hogy a viselkedésed elrejtésének legjobb módja az ellenség elől, ha véletlenszerű karaktert adsz neki, és ezért nem tudod előre, mit fogsz tenni.

Szóval, beszéljünk a vegyes stratégiákról. Jelöljük az A és B játékosok vegyes stratégiáit

Egy adott esetben, amikor az egy kivételével minden valószínűség nulla, és ez az egy egyenlő eggyel, a vegyes stratégia tiszta egyessé válik.

A játékelméletnek van egy alaptétele: minden kétfős véges nulla összegű játéknak van legalább egy megoldása – egy pár optimális stratégia, általában vegyes, és a megfelelő ár

A játékmegoldást alkotó optimális stratégiapárnak a következő tulajdonsága van: ha az egyik játékos ragaszkodik az optimális stratégiájához, akkor a másiknak nem lehet kifizetődő, ha eltér az övétől. Ez a stratégiapár egyfajta egyensúlyt teremt a játékban: az egyik játékos a maximumra, a másik minimálisra akarja fordítani a nyereményt, mindegyik a saját irányába húz, és mindkettő ésszerű viselkedésével egyensúlyt és egy stabil kifizetés v jön létre. Ha akkor a játék előnyös nekünk, ha - az ellenségnek; amikor a játék "tisztességes", mindkét résztvevő számára egyaránt előnyös.

Vegyünk egy példát egy nyeregpont nélküli játékra, és adja meg (bizonyíték nélkül) a megoldását. A játék a következő: két játékos A és B egyszerre, szó nélkül mutasson egy, két vagy három ujját. A nyereményt az ujjak teljes száma dönti el: ha páros, akkor A nyer, és ezzel a számmal egyenlő összeget kap B-től; ha páratlan, akkor A éppen ellenkezőleg, ezzel a számmal egyenlő összeget fizet B-nek. Mit tegyenek a játékosok?

Hozzunk létre egy játékmátrixot. Egy játékban minden játékosnak három stratégiája van: mutasson egy, két vagy három ujját. A 3x3-as mátrixot a 26.5. táblázat tartalmazza; az extra jobb oldali oszlop a sor minimumait, az extra alsó sor pedig az oszlopmaximumokat mutatja.

A játék alacsonyabb ára összhangban van a stratégiával, ez azt jelenti, hogy ésszerű, óvatos viselkedéssel garantáljuk, hogy nem veszítünk 3-nál többet. Kis vigasz, de még mindig jobb, mint mondjuk nyerni - 5 a mátrix sejtjei. Rossz nekünk, L játékos... De vigasztaljuk magunkat: az ellenfél helyzete még rosszabbnak tűnik: a játék alacsonyabb ára. ésszerű viselkedés, akkor legalább 4-et ad nekünk.