Lojëra me matricë antagoniste. Zgjidhja e një loje me matricë Lojëra me matricë antagoniste

Si një supozim bazë në teorinë e lojës, supozohet se çdo lojtar përpiqet të sigurojë fitoren maksimale të mundshme për veten e tij nën çdo veprim të partnerit të tij. Le të supozojmë se ka një lojë të fundme me shumë zero me matricën e fitimit të lojtarit të parë dhe, në përputhje me rrethanat, matricën e fitimit të lojtarit të dytë. Lëreni Lojtarin 1 të besojë se çfarëdo strategjie që ai zgjedh, Lojtari 2 do të zgjedhë strategjinë që maksimizon fitimin e tij dhe në këtë mënyrë minimizon fitimin e Lojtarit 1.

Kështu që Lojtari 1 zgjedh i

Lojtari 2 gjithashtu përpiqet të sigurojë sasinë më të lartë të fitores (ose, në mënyrë ekuivalente, shumën më të vogël të humbjes) pavarësisht nga strategjia e zgjedhur e kundërshtarit. Strategjia e tij optimale do të ishte kolona H 0 me pagesën maksimale më të ulët. Kështu që Lojtari 2 do të zgjedhë j-të strategjisë, e cila është një zgjidhje për problemin

Si rezultat, nëse Lojtari 1 ndjek strategjinë e zgjedhur (thirret strategji maksimale ), fitimi i tij në çdo rast do të jetë më i vogël se vlera maksimale (e quajtur "çmimi i poshtëm i lojës" ), d.m.th.

Prandaj, nëse Lojtari 2 i përmbahet strategjisë së tij minimale, atëherë humbja e tij nuk do të jetë më e madhe se vlera maksimale (e quajtur "çmimi më i lartë i lojës" ), d.m.th.

Në rastin kur çmimi i sipërm i lojës është i barabartë me atë më të ulët, d.m.th. = , të dy lojtarët marrin pagesat e tyre të garantuara dhe vlerën h ij * thirrur me koston e lojës .

Elementi i matricës h ij Matrica e fitimit që korrespondon me strategjitë quhet pika e shalës së matricës N.

Nëse kostoja e lojës antagoniste është 0, loja quhet i drejtë .

Konsideroni një lojë në të cilën Lojtari 1 ka dy strategji dhe Lojtari 2 ka tre. Matrica e fitimit të Lojtarit 1 duket si kjo:

Komentoni . Meqenëse po shqyrtojmë një shembull të një loje me shumë zero, matrica e fitimit të Lojtarit 2 do të jetë N 2 = -H 1.

Lojtari 1 llogarit që nëse zgjedh strategjinë e parë (d.m.th. rreshtin e parë të matricës H 1), atëherë kundërshtari do të zgjedhë strategjinë e tij të dytë (d.m.th. kolonën e dytë) në mënyrë që fitimi të jetë i barabartë me 1 . Nëse ai zgjedh strategjinë e dytë, atëherë kundërshtari mund të zgjedhë strategjinë e parë, kështu që fitimi do të jetë i barabartë me -1.

Pas analizimit të vlerave të marra: Lojtari 1 vendos në strategjinë e tij të parë, e cila i siguron atij një fitore maksimale të garantuar të barabartë me 1.

Në mënyrë të ngjashme, Lojtari 2 merr në konsideratë opsionet e tij më të këqija kur kundërshtari zgjedh strategjinë e parë ose të dytë, ose kur kundërshtari zgjedh strategjinë e dytë kur Lojtari 2 zgjedh kolonën e tretë. Këto opsione korrespondojnë me vlerat maksimale të kolonave 2, 1 dhe 6.



Duke marrë vlerat minimale të këtyre maksimumeve, Lojtari 2 vendoset në strategjinë e tij të dytë, në të cilën humbja e tij është minimale dhe e barabartë me:

Rrjedhimisht, në këtë lojë ka zgjedhje të përbashkëta strategjish, ato. E

Prandaj, në këtë lojë është e arsyeshme të pritet që kundërshtarët t'i përmbahen strategjive të tyre të zgjedhura. Një lojë antagoniste matricore për të cilën - quhet një lojë plotësisht e përcaktuar, ose një lojë që ka një zgjidhje në strategji të pastra.

Megjithatë, jo të gjitha lojërat antagoniste të matricës janë të mirëpërcaktuara.

Lojërat në të cilat ekziston një pabarazi strikte quhen lojëra të përcaktuara jo të plota (ose lojëra që nuk kanë zgjidhje në strategji të pastra).

Le të shohim një shembull të kësaj loje:

Për këtë lojë.

Si rezultat, nëse lojtarët ndjekin rregullat e propozuara më sipër, atëherë Lojtari 1 do të zgjedhë strategjinë 1 dhe do të presë që Lojtari 2 të zgjedhë strategjinë 2, ku humbja është -2, ndërsa Lojtari 2 do të zgjedhë strategjinë 3 dhe do të presë që Lojtari 1 të zgjedhë strategjinë 2. zgjidhni strategjinë 2 me fitim të barabartë me 4.

Megjithatë, nëse Lojtari 2 zgjedh strategjinë e tij të tretë, atëherë Lojtari 1 do të bënte më mirë duke zgjedhur strategjinë e dytë dhe jo strategjinë e parë. Në mënyrë të ngjashme, nëse Lojtari 1 zgjedh strategjinë e parë, Lojtari 2 është më mirë të zgjedhë strategjinë e dytë dhe jo të tretën. Me sa duket, në lojërat e tipit të poshtër, parimi i zgjidhjes në strategji të pastra rezulton të jetë i papërshtatshëm.

Në situatën e përshkruar, bëhet e rëndësishme për lojtarët që armiku të mos e marrë me mend se çfarë strategjie do të përdorë. Për të zbatuar këtë plan, lojtarët duhet të përdorin të ashtuquajturën strategji të përzier.

Në thelb, strategjia e përzier e një lojtari është një skemë për zgjedhjen e rastësishme të një strategjie të pastër. Matematikisht, ajo mund të përfaqësohet si një shpërndarje probabiliteti në grupin e strategjive të pastra të një lojtari të caktuar. Si rezultat, vektori , ku korrespondon me probabilitetin që Lojtari 1 të përdorë strategjinë dhe , specifikon strategjinë e përzier të këtij lojtari. Strategjia e përzier e Lojtarit 2 përcaktohet në mënyrë të ngjashme .



Ne do të supozojmë se përdorimi i strategjive të tyre të përziera nga lojtarët është i pavarur, kështu që probabiliteti me të cilin Lojtari 1 zgjedh atë strategji dhe Lojtari 2 zgjedh, është i barabartë me . Në këtë rast pagesa. Duke përmbledhur dhe , ne gjejmë pritshmërinë matematikore të fitimeve të Lojtarit 1:

ose shënimi i matricës

Në një grup strategjish të përziera, Lojtari 1, duke kërkuar të arrijë fitimet më të mëdha të garantuara, zgjedh një vektor probabiliteti në mënyrë që të marrë maksimumin e vlerave minimale të fitimeve të pritura, d.m.th. zgjidh problemin:

.

Në mënyrë të ngjashme, qëllimi i Lojtarit 2 është të arrijë vlerat minimale maksimale të humbjeve të tij, d.m.th. ai e zgjidh problemin

.

Një rezultat themelor i teorisë së lojës është e ashtuquajtura Teorema Minimax, e cila thotë se problemet e formuluara të Lojtarit 1 dhe Lojtarit 2 kanë gjithmonë një zgjidhje për çdo matricë fitimi, dhe përveç kësaj, .

Sa i përket lojërave të mirëpërcaktuara, quhet strategjia e Lojtarit 1 Strategjia maksimale , Strategjia e Lojtarit 2 - strategji minimale, vlera - me koston e lojës ; në rastin kur loja quhet e drejtë.

Një pasojë e dukshme e Teoremës Minimax është relacioni:

.

që do të thotë se asnjë strategji e Lojtarit 1 nuk do ta lejojë atë të fitojë një shumë më të madhe se çmimi i lojës nëse Lojtari 2 zbaton strategjinë e tij minimale dhe asnjë strategji e Lojtarit 2 nuk do ta lejojë atë të humbasë një shumë më të vogël se çmimi i lojës nëse Lojtari 1 zbaton strategjinë e tij maksimale.

Kjo është gjithashtu e vërtetë për strategjitë e pastra, si një rast i veçantë i strategjive të përziera. (Sepse një strategji e pastër është një strategji e përdorur me probabilitetin 1): Përdorimi i ndonjë strategjie të pastër, nëse kundërshtari përdor strategjinë e tij optimale, nuk ju lejon të fitoni më shumë (të humbni më pak) sesa kostoja e lojës.

Ky fakt përdoret shpesh për të zhvilluar algoritme specifike për zgjidhjen e lojërave me matricë antagoniste.

Llogaritja e strategjive optimale bëhet shumë më e vështirë me rritjen e numrit të strategjive. Mund të përdoren disa qasje për të gjetur strategji optimale.

Për të zvogëluar dimensionin e lojës, përdoret dominimi i rreshtave dhe kolonave. Zakonisht thuhet se rreshti i i i një matrice dominon rreshtin e i-të (d.m.th., një rresht i pastër dominon një tjetër) nëse për të gjithë, të paktën një.

Në mënyrë të ngjashme, kolona e th dominon kolonën e th nëse për të gjithë , të paktën një .

Thelbi i këtij përkufizimi është se strategjia dominuese nuk është kurrë më e keqe, dhe në disa raste edhe më e mirë, se strategjia e dominuar. Prandaj, përfundimi i rëndësishëm është se lojtari nuk ka nevojë të përdorë një strategji të dominuar. Kjo lejon në praktikë të hidhen poshtë të gjitha rreshtat dhe kolonat e dominuara, gjë që do të zvogëlojë madhësinë e matricës (vini re se kjo qasje mund të përdoret gjithashtu kur kërkoni një zgjidhje në strategji të pastra).

Shembull. Konsideroni një lojë me matricën e mëposhtme:

→ rreshti i tretë i kësaj matrice dominon të dytin

Eliminimi i rreshtit të dytë rezulton në një matricë: Kolona e tretë në këtë matricë të shkurtuar dominohet nga e dyta, dhe heqja e kolonës së dytë jep: .

Si rezultat, nëse mund të gjendet një zgjidhje për lojën që rezulton, atëherë ajo mund të përdoret lehtësisht për të zgjidhur lojën origjinale thjesht duke caktuar zero probabilitete në rreshtat dhe kolonat e përjashtuara.

Një metodë tjetër e thjeshtimit të matricës bazohet në vetinë sipas së cilës një transformim afinal i matricës së fitimit (d.m.th., transformimi i të gjithë elementëve të matricës sipas rregullit, ku ) nuk ndryshon zgjidhjen e lojës; përveç kësaj, çmimi i lojës së konvertuar mund të merret nga çmimi i lojës origjinale duke përdorur të njëjtin rregull: . Kjo do të thotë që për detyrën e lojës, në parim, nuk ka rëndësi se në cilat njësi maten fitimet (në rubla ose dollarë); shtimi (zbritja) e një shume fikse do të ndryshojë fitimin (humbjen) e secilit lojtar nga të njëjtën sasi pa ndryshuar zgjidhjen e lojës.

Kjo veti mund të përdoret për të thjeshtuar dhe bërë më të qartë matricën fituese (përdoret në analogji me operacionet në matrica - shumëzimi i një matrice me një numër konstant, duke shtuar dhe zbritur rreshtat, përveç kësaj, kjo veti lejon të bëhet çdo lojë e matricës me shumën zero drejtë, për këtë është e nevojshme të llogariten lojërat e çmimeve nga të gjithë elementët e matricës së fitimit).

Për më tepër, një metodë grafike mund të përdoret për të zgjidhur lojën (dhe lojërat në përgjithësi).

Për shembull, matrica e fitimit duket si: .

Lëreni Lojtarin 1 të zgjedhë strategjinë e tij të parë me probabilitet dhe të dytën me probabilitet. Nëse Lojtari 2 zgjedh strategjinë e tij të parë, atëherë (nga kolona e parë e matricës) pritshmëria për Lojtarin 1 do të jetë . Nëse Lojtari 2 zgjedh strategjinë e tij të dytë, atëherë në përputhje me kolonën e dytë të matricës: .

Secili prej këtyre ekuacioneve mund të paraqitet grafikisht me një segment të drejtëz në zonën në grafik me koordinata dhe .

Testet për kontrollin përfundimtar

1. Lojë antagoniste mund të vendoset:

a) një grup strategjish për të dy lojtarët dhe një pikë shale.

b) një grup strategjish për të dy lojtarët dhe funksionin e fitimit të lojtarit të parë.

2. Çmimi i lojës ekziston gjithmonë për lojërat me matricë në strategji të përziera.

a) po.

3.Nëse të gjitha kolonat në matricën e fitimit janë të njëjta dhe kanë formën (4 5 0 1), atëherë cila strategji është optimale për lojtarin e parë?

a) së pari.

b) e dyta.

c) ndonjë nga katër.

4. Lëreni në një lojë matrice një nga strategjitë e përziera të lojtarit të parë të ketë formën (0.3, 0.7), dhe një nga strategjitë e përziera të lojtarit të dytë të ketë formën (0.4, 0, 0.6). Cili është dimensioni i kësaj matrice?

a) 2*3.

c) një dimension tjetër.

5. Parimi i dominimit ju lejon të hiqni nga matrica në një hap:

a) linja të tëra.

b) numrat individualë.

6. Në metodën grafike për zgjidhjen e lojërave 2*m, gjen direkt nga grafiku:

a) strategjitë optimale të të dy lojtarëve.

b) çmimi i lojës dhe strategjitë optimale të lojtarit të dytë.

c) çmimi i lojës dhe strategjitë optimale të lojtarit të parë.

7. Grafiku i zarfit të poshtëm për metodën grafike të zgjidhjes së lojërave 2*m është në rastin e përgjithshëm:

a) i thyer.

b) drejt.

c) parabolë.

8. Në një lojë matrice 2*2 ka dy komponentë të strategjisë së përzier të lojtarit:

a) përcaktoni vlerat e njëri-tjetrit.

b) të pavarur.

9. Në një lojë matrice, elementi aij është:

a) fitimet e lojtarit të parë kur ai përdor strategjinë e i-të, dhe i dyti - strategjinë e j-të.

b) strategjinë optimale të lojtarit të parë kur kundërshtari përdor strategjinë e i-të ose të j-të.


c) humbja e lojtarit të parë kur ai përdor strategjinë e j-të, dhe i dyti - strategjinë e i-të.

10.Elementi i matricës aij i përgjigjet pikës së shalës. Situatat e mëposhtme janë të mundshme:

a) ky element është rreptësisht më i vogli nga të gjithë në rresht.

b) ky element është i dyti me radhë në rresht.

11. Në metodën Brown-Robinson, çdo lojtar, kur zgjedh një strategji në hapin tjetër, udhëhiqet nga:

a) strategjitë e armikut në hapat e mëparshëm.

b) strategjitë tuaja në hapat e mëparshëm.

c) diçka tjetër.

12. Sipas kriterit të pritshmërisë matematikore, çdo lojtar del nga fakti se:

a) do të ndodhë situata më e keqe për të.

c) të gjitha ose disa situata janë të mundshme me disa probabilitete të dhëna.

13. Le të jepet një lojë matrice nga një matricë në të cilën të gjithë elementët janë negativë. Çmimi i lojës është pozitiv:

b) nr.

c) nuk ka përgjigje të qartë.

14. Çmimi i lojës është:

një numër.

b) vektor.

c) matricës.

15. Cili është numri maksimal i pikave të shalës që mund të jenë në një lojë me dimension 5*5 (matrica mund të përmbajë çdo numër):

16. Lëreni në një lojë matrice të dimensionit 2*3 një nga strategjitë e përziera të lojtarit të parë të ketë formën (0.3, 0.7) dhe një nga strategjitë e përziera të lojtarit të dytë të ketë formën (0.3, x, 0.5) . Cili është numri x?

c) një numër tjetër.

17. Për cilin dimension të matricës së lojës, kriteri Wald shndërrohet në kriterin Laplace?

c) vetëm në raste të tjera.

18. Çmimi i lartë i lojës është gjithmonë më i ulët se çmimi më i ulët i lojës.

b) nr.

b) pyetja është e pasaktë.

19. Cilat strategji ekzistojnë në një lojë matrice:

a) të pastër.

b) të përziera.

c) të dyja.

20. Në ndonjë lojë antagoniste, a mund të jenë vlerat e funksionit të fitimit të të dy lojtarëve për disa vlera të variablave të barabarta me 1?

a) gjithmonë.

b) ndonjëherë.

c) kurrë.

21. Në një lojë matrice, le të jetë një nga strategjitë e përziera të lojtarit të parë të formës (0.3, 0.7) dhe një nga strategjitë e përziera të lojtarit të dytë të jetë e formës (0.4, 0.1,0.1,0.4) . Cili është dimensioni i kësaj matrice?

c) një dimension tjetër.

22. Parimi i dominimit ju lejon të hiqni nga matrica në një hap:

a) kolona të tëra,

b) numrat individualë.

c) nënmatrica me përmasa më të vogla.

23. Në një lojë matrice 3*3 ka dy komponentë të strategjisë së përzier të lojtarit:

a) përcaktoni të tretën.

b) nuk përcaktojnë.

24. Në një lojë matrice, elementi aij është:

a) humbja e lojtarit të dytë kur ai përdor strategjinë e j-të, dhe i dyti - strategjinë e i-të.

b) strategjinë optimale të lojtarit të dytë kur kundërshtari përdor strategjinë e i-të ose të j-të,

c) fitimet e lojtarit të parë kur ai përdor strategjinë e j-të, dhe të dytit - strategjinë e i-të,

25. Elementi i matricës aij i përgjigjet pikës së shalës. Situatat e mëposhtme janë të mundshme:

a) ky element është më i madhi në kolonë.

b) ky element është rreptësisht më i madhi sipas renditjes në linjë.

c) vargu përmban elementë më të mëdhenj dhe më të vegjël se ky element.

26. Sipas kriterit Wald, çdo lojtar supozon se:

a) do të ndodhë situata më e keqe për të.

b) të gjitha situatat janë njëlloj të mundshme.

c) të gjitha situatat janë të mundshme me probabilitete të caktuara.

27. Çmimi më i ulët është më i vogël se çmimi i sipërm i lojës:

b) jo gjithmonë.

c) kurrë.

28. Shuma e komponentëve të një strategjie të përzier për një lojë matrice është gjithmonë:

a) është e barabartë me 1.

b) jonegative.

c) pozitive.

d) jo gjithmonë.

29. Le të ketë në një lojë matrice të dimensionit 2*3 një nga strategjitë e përziera të lojtarit të parë të ketë formën (0.3, 0.7) dhe një nga strategjitë e përziera të lojtarit të dytë të ketë formën (0.2, x, x) . Cili është numri x?

Dërgoni punën tuaj të mirë në bazën e njohurive është e thjeshtë. Përdorni formularin e mëposhtëm

Studentët, studentët e diplomuar, shkencëtarët e rinj që përdorin bazën e njohurive në studimet dhe punën e tyre do t'ju jenë shumë mirënjohës.

Prezantimi

1. Pjesa teorike

1.3 Porosia e lojës 2x2

1.4 Metoda algjebrike

1.5 Metoda grafike

1.6 Lojëra 2xn ose mx2

1.7 Zgjidhja e lojërave duke përdorur metodën e matricës

2. Pjesa praktike

2.2 Lojëra 2xn dhe mx2

2.3 Metoda e matricës

2.4 Metoda kafe

Analiza e rezultateve

Prezantimi

Një lojë me shumë zero është një lojë me shumë zero. Një lojë me shumë zero është një lojë jo bashkëpunuese që përfshin dy lojtarë, fitimet e të cilëve janë të kundërta.

Formalisht, një lojë antagoniste mund të përfaqësohet nga një trojkë , ku X dhe Y janë grupet e strategjive të lojtarëve të parë dhe të dytë, përkatësisht, F është funksioni fitues i lojtarit të parë, duke caktuar çdo çift strategjish (x,y), ku një numër real që korrespondon me dobinë e lojtari i parë në zbatimin e një situate të caktuar.

Meqenëse interesat e lojtarëve janë të kundërta, funksioni F përfaqëson njëkohësisht humbjen e lojtarit të dytë.

Historikisht, lojërat me shumën zero janë klasa e parë e modeleve matematikore të teorisë së lojës me të cilat u përshkrua kumari. Besohet se kjo lëndë studimi është vendi ku mori emrin teoria e lojës. Në ditët e sotme, lojërat antagoniste konsiderohen si pjesë e klasës më të gjerë të lojërave jobashkëpunuese.

1. Pjesa teorike

1.1 Përkufizimet dhe dispozitat bazë të lojës

Loja karakterizohet nga një sistem rregullash që përcaktojnë numrin e pjesëmarrësve në lojë, veprimet e tyre të mundshme dhe shpërndarjen e fitimeve në varësi të sjelljes dhe rezultateve të tyre. Një lojtar konsiderohet të jetë një pjesëmarrës ose një grup pjesëmarrësish të lojës që kanë disa interesa të përbashkëta që nuk përkojnë me interesat e grupeve të tjera. Prandaj, jo çdo pjesëmarrës konsiderohet lojtar.

Rregullat ose kushtet e lojës përcaktojnë sjelljet, zgjedhjet dhe lëvizjet e mundshme për lojtarët në çdo fazë të zhvillimit të lojës. Të bësh një zgjedhje për një lojtar do të thotë të zgjedhësh një nga opsionet e sjelljes së tij. Më pas lojtari i bën këto zgjedhje duke përdorur lëvizjet. Të bësh një lëvizje do të thotë në një fazë të caktuar të lojës të bësh të gjithë ose një pjesë të zgjedhjes menjëherë, në varësi të mundësive të parashikuara nga rregullat e lojës. Çdo lojtar në një fazë të caktuar të lojës bën një lëvizje sipas zgjedhjes së bërë. Lojtari tjetër, duke ditur ose duke mos ditur për zgjedhjen e lojtarit të parë, gjithashtu bën një lëvizje. Çdo lojtar përpiqet të marrë parasysh informacionin për zhvillimin e kaluar të lojës, nëse një mundësi e tillë lejohet nga rregullat e lojës.

Një grup rregullash që i tregojnë qartë lojtarit se çfarë zgjedhje duhet të bëjë në çdo lëvizje, në varësi të situatës që krijohet si rezultat i lojës, quhet strategjia e lojtarit. Strategjia në teorinë e lojës nënkupton një plan të caktuar të plotë veprimi për lojtarin, duke treguar se si duhet të veprojë në të gjitha rastet e mundshme të zhvillimit të lojës. Strategjia nënkupton tërësinë e të gjitha udhëzimeve për çdo gjendje informacioni në dispozicion të lojtarit në çdo fazë të zhvillimit të lojës. Nga kjo tashmë është e qartë se strategjitë mund të jenë të mira dhe të këqija, të suksesshme dhe të pasuksesshme, etj.

Një lojë me shumë zero do të jetë kur shuma e fitimeve të të gjithë lojtarëve në secilën nga lojërat e saj është e barabartë me zero, d.m.th. në një lojë me shumë zero, kapitali total i të gjithë lojtarëve nuk ndryshon, por rishpërndahet midis lojtarëve. në varësi të rezultateve që rezultojnë. Kështu, shumë situata ekonomike dhe ushtarake mund të shihen si lojëra me shumën zero.

Në veçanti, një lojë me shumë zero midis dy lojtarëve quhet antagoniste, pasi qëllimet e lojtarëve në të janë drejtpërdrejt të kundërta: fitimi i njërit lojtar ndodh vetëm në kurriz të humbjes së tjetrit.

1.1.1 Përkufizimi, shembuj dhe zgjidhje të lojërave me matricë në strategji të pastra

Një lojë me matricë me shumë zero me dy lojtarë mund të mendohet si loja e mëposhtme abstrakte me dy lojtarë.

Lojtari i parë ka t strategji i =1, 2,…, t, i dyti ka n strategji j = 1, 2,..., fq. Çdo çift strategjish (i, j) shoqërohet me një numër a ij , duke shprehur Fitimet e lojtarit të parë për shkak të lojtarit të dytë nëse lojtari i parë përdor strategjinë e tij të i-të, dhe lojtari i dytë përdor strategjinë e tij të j-të.

Secili lojtar bën një lëvizje: lojtari i parë zgjedh strategjinë e tij të i-të (i = 1, 2,..., m), i dyti zgjedh strategjinë e tij të j-të (j = 1, 2,..., n) , pas së cilës i pari lojtari merr një ij në kurriz të lojtarit të dytë (nëse një ij< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

Çdo strategji e lojtarit i = 1, 2,…, t; j = 1, 2,…, n shpesh quhet një strategji e pastër.

Një lojë me matricë me shumë zero me dy lojtarë tani e tutje do të quhet thjesht një lojë matrice. Natyrisht, loja e matricës i përket lojërave antagoniste. Nga përkufizimi i tij rezulton se për të përcaktuar një lojë matrice mjafton të specifikoni një matricë A = (a ij) të renditjes së fitimeve të lojtarit të parë.

Nëse marrim parasysh matricën e fitimit

pastaj luajtja e çdo loje të një loje matrice me matricën A reduktohet në zgjedhjen e lojtarit të parë të rreshtit të i-të, dhe lojtarit të dytë të kolonës së j-të dhe lojtarit të parë që merr (në kurriz të të dytit ) fitimet e vendosura në matricën A në kryqëzimin e rreshtit të i-të dhe kolonës j-të.

Për të zyrtarizuar një situatë reale konflikti në formën e një loje matrice, është e nevojshme të identifikohen dhe të rinumërohen strategjitë e pastra të secilit lojtar dhe të krijohet një matricë fitimi.

Faza tjetër është përcaktimi i strategjive dhe fitimeve optimale të lojtarëve.

Gjëja kryesore në studimin e lojërave është koncepti i strategjive optimale të lojtarëve. Ky koncept në mënyrë intuitive ka kuptimin e mëposhtëm: strategjia e një lojtari është optimale nëse përdorimi i kësaj strategjie i siguron atij fitoren më të madhe të garantuar për të gjitha strategjitë e mundshme të lojtarit tjetër. Bazuar në këto pozicione, lojtari i parë shqyrton matricën A të pagesave të tij duke përdorur formulën (1.1) si më poshtë: për secilën vlerë të i (i = 1, 2,..., t) vlera minimale e pagesës përcaktohet në varësi të strategjitë e përdorura nga lojtari i dytë

(i = 1, 2,..., m) (1.2)

d.m.th., përcaktohet fitimi minimal për lojtarin e parë, me kusht që ai të zbatojë strategjinë e tij të i-të të pastër, atëherë nga këto pagesa minimale, gjendet një strategji i = i 0 për të cilën kjo fitim minimal do të jetë maksimal, d.m.th.

Përkufizimi. Numri b, i përcaktuar nga formula (1.3), quhet çmimi më i ulët neto i lojës dhe tregon se çfarë fitimesh minimale mund të garantojë lojtari i parë për veten e tij duke zbatuar strategjitë e tij të pastra për të gjitha veprimet e mundshme të lojtarit të dytë.

Lojtari i dytë, me sjelljen e tij optimale, duhet të përpiqet, nëse është e mundur, nëpërmjet strategjive të tij, të minimizojë fitimet e lojtarit të parë. Prandaj, për lojtarin e dytë gjejmë

d.m.th., përcaktohet fitimi maksimal i lojtarit të parë, me kusht që lojtari i dytë të zbatojë strategjinë e tij të j-të të pastër, atëherë lojtari i dytë gjen strategjinë e tij j = j 1 sipas së cilës lojtari i parë do të marrë shpërblimin minimal, d.m.th., gjen

Përkufizimi. Numri b, i përcaktuar nga formula (1.5), quhet çmimi i sipërm neto i lojës dhe tregon se çfarë fitimesh maksimale mund të garantojë lojtari i parë për veten e tij nëpërmjet strategjive të tij. Me fjalë të tjera, duke zbatuar strategjitë e tij të pastra, lojtari i parë mund të sigurojë një fitim jo më pak se b, dhe lojtari i dytë, duke zbatuar strategjitë e tij të pastra, mund të parandalojë lojtarin e parë që të fitojë më shumë se b.

Përkufizimi. Nëse në një lojë me matricën A, çmimet neto të poshtme dhe të sipërme të lojës përputhen, d.m.th. b = c, atëherë kjo lojë thuhet se ka një pikë shale në strategjitë e pastra dhe një çmim neto të lojës:

n = b = v (1.6)

Një pikë shale është një palë strategjish të pastra () të lojtarëve të parë dhe të dytë, përkatësisht, në të cilat arrihet barazia

Koncepti i një pike shale ka kuptimin e mëposhtëm: nëse njëri nga lojtarët i përmbahet një strategjie që korrespondon me një pikë shale, atëherë lojtari tjetër nuk mund të bëjë më mirë sesa t'i përmbahet një strategjie që korrespondon me një pikë shale. Duke pasur parasysh se sjellja më e mirë e një lojtari nuk duhet të çojë në një ulje të fitimeve të tij dhe sjellja më e keqe mund të çojë në një ulje të fitimeve të tij, këto kushte mund të shkruhen matematikisht në formën e marrëdhënieve të mëposhtme:

ku i, j janë çdo strategji e pastër e lojtarëve të parë dhe të dytë, përkatësisht; (i 0, j 0) janë strategji që formojnë një pikë shale. Më poshtë do të tregojmë se përkufizimi i një pike shale është ekuivalent me kushtet (1.8).

Kështu, bazuar në (1.8), elementi i shalës është minimal në rreshtin i 0 dhe maksimumi në kolonën j 0 në matricën A. Gjetja e pikës së shalës së matricës A është e lehtë: në matricën A, elementi minimal gjendet në mënyrë të njëpasnjëshme në çdo rresht dhe kontrolloni nëse ky element është maksimumi në kolonën e tij. Nëse është i tillë, atëherë është një element shalë dhe çifti i strategjive që korrespondojnë me të formon një pikë shale. Një palë strategjish të pastra (i 0 , j 0) të lojtarëve të parë dhe të dytë, duke formuar një pikë shale dhe një element shalë quhet një zgjidhje për lojën.

Strategjitë e pastra i 0 dhe j 0 që formojnë një pikë shale quhen përkatësisht strategji të pastra optimale të lojtarëve të parë dhe të dytë.

Teorema 1. Le të jetë f (x, y) një funksion real i dy ndryshoreve x A dhe y B dhe ekziston

atëherë b = c.

Dëshmi. Nga përkufizimi i minimumit dhe maksimumit del se

Meqenëse në anën e majtë të (1.11) x është arbitrare, atëherë

Prandaj, në anën e djathtë të pabarazisë (1.12) y është arbitrar

Q.E.D.

Në veçanti, matrica () është një rast i veçantë i funksionit f (x, y), d.m.th. nëse vendosim x = i, y = j, = f (x, y), atëherë nga teorema 1 marrim se netoja më e ulët çmimi nuk e kalon çmimin e sipërm neto të lojës në lojën matricë.

Përkufizimi. Le të jetë f (x, y) një funksion real i dy ndryshoreve x A dhe y B. Pika (x 0, y 0) quhet pikë shalë për funksionin f (x, y) nëse plotësohen pabarazitë e mëposhtme

f (x, y 0) f (x 0, y 0)f (x 0, y) (1.14)

për çdo x A dhe y B.

1.2 Strategjitë e përziera optimale dhe vetitë e tyre

Studimi i një loje matrice fillon me gjetjen e pikës së saj të shalës në strategji të pastra. Nëse një lojë matrice ka një pikë shalë në strategji të pastra, atëherë studimi i lojës përfundon me gjetjen e kësaj pike. Nëse në një lojë matrice nuk ka pikë shalë në strategjitë e pastra, atëherë mund të gjenden çmimet neto të ulëta dhe të sipërme të kësaj loje, të cilat tregojnë se lojtari i parë nuk duhet të shpresojë të fitojë më shumë se çmimi i sipërm i lojës, dhe mund të sigurohuni që të merrni një fitore jo më pak çmim më të ulët të lojës. Rekomandime të tilla në lidhje me sjelljen e lojtarëve në një lojë matrice pa pikë shale në strategji të pastra nuk mund të kënaqin studiuesit dhe praktikuesit. Përmirësimi i zgjidhjeve të lojërave me matricë duhet kërkuar në përdorimin e fshehtësisë së përdorimit të strategjive të pastra dhe mundësinë e përsëritjes shumë herë të lojërave në formën e lojërave. Kështu, për shembull, luhen një sërë lojërash shahu, dami dhe futbolli, dhe çdo herë lojtarët i zbatojnë strategjitë e tyre në atë mënyrë që kundërshtarët e tyre të mos kenë asnjë ide për përmbajtjen e tyre, dhe në këtë mënyrë, mesatarisht, ata arrini disa fitime duke luajtur të gjithë serinë e lojërave. Këto fitime janë mesatarisht më të mëdha se çmimi më i ulët i lojës dhe më pak se çmimi i sipërm i lojës. Sa më e lartë të jetë kjo vlerë mesatare, aq më e mirë është strategjia që përdor lojtari. Prandaj, lindi ideja për të aplikuar strategji të pastra në mënyrë të rastësishme, me një probabilitet të caktuar. Kjo siguron plotësisht fshehtësinë e përdorimit të tyre. Çdo lojtar mund të ndryshojë probabilitetin e përdorimit të strategjive të tij të pastra në atë mënyrë që të maksimizojë fitimin e tij mesatar dhe të marrë strategji optimale gjatë rrugës. Kjo ide çoi në konceptin e strategjisë së përzier.

Përkufizimi. Strategjia e përzier e një lojtari është grupi i plotë i probabiliteteve të përdorimit të strategjive të tij të pastra.

Kështu, nëse lojtari i parë ka m strategji të pastra 1, 2, … i, … m, atëherë strategjia e tij e përzier x është një grup numrash x = (x 1, x 2, ..., x i,…, x m ) të kënaqshme marrëdhëniet

x i 0 (i = 1, 2, ... , t), = 1. (1,15)

Në mënyrë të ngjashme, për lojtarin e dytë, i cili ka n strategji të pastra, një strategji e përzier y është një grup numrash y = (y 1, ..., y j, ... y n) që kënaqin marrëdhëniet

y j 0 (j = 1, 2, ... , n), = 1. (1.16)

Meqenëse çdo herë që një lojtar përdor një strategji të pastër përjashton përdorimin e një tjetri, strategjitë e pastra janë ngjarje të papajtueshme. Për më tepër, ato janë të vetmet ngjarje të mundshme.

Natyrisht, një strategji e pastër është një rast i veçantë i një strategjie të përzier. Në të vërtetë, nëse në një strategji të përzier çdo strategji e pastër e i-të zbatohet me probabilitet një, atëherë të gjitha strategjitë e tjera të pastra nuk zbatohen. Dhe kjo strategji e i-të e pastër është një rast i veçantë i një strategjie të përzier. Për të ruajtur sekretin, çdo lojtar zbaton strategjitë e tij, pavarësisht nga zgjedhjet e lojtarit tjetër.

Përkufizimi. Shpërblimi mesatar i lojtarit të parë në një lojë matricë me matricën A shprehet si pritshmëri matematikore e fitimeve të tij

E (A, x, y) = (1.20)

Natyrisht, fitimi mesatar i lojtarit të parë është një funksion i dy grupeve të ndryshoreve x dhe y. Lojtari i parë synon, duke ndryshuar strategjitë e tij të përziera x, të maksimizojë fitimin e tij mesatar E (A, x, y), dhe lojtari i dytë, përmes strategjive të tij të përziera, përpiqet ta bëjë E (A, x, y) minimale, d.m.th. Për të zgjidhur lojën është e nevojshme të gjeni x, y të tillë, me të cilat arrihet çmimi më i lartë i lojës.

1.3 Lojë me porosi 22

Një lojë matrice e rendit 22 jepet nga matrica e mëposhtme e fitimit për lojtarin e parë:

Zgjidhja për këtë lojë duhet të fillojë duke gjetur një pikë shale në strategjitë e pastra. Për ta bërë këtë, gjeni elementin minimal në rreshtin e parë dhe kontrolloni nëse është maksimumi në kolonën e tij. Nëse një element i tillë nuk gjendet, atëherë rreshti i dytë kontrollohet në të njëjtën mënyrë. Nëse një element i tillë gjendet në rreshtin e dytë, atëherë është një shalë.

Gjetja e elementit të shalës, nëse ka, përfundon procesin e gjetjes së zgjidhjes së tij, pasi në këtë rast është gjetur çmimi i lojës - elementi i shalës dhe pika e shalës, d.m.th., një palë strategji të pastra për të parën dhe lojtari i dytë, që përbën strategji të pastra optimale. Nëse nuk ka pikë shale në strategjitë e pastra, atëherë duhet të gjejmë një pikë shale në strategjitë e përziera, e cila ekziston domosdoshmërisht sipas teoremës kryesore të lojërave të matricës.

Le të shënojmë me x = (x 1 , x 2), y = (y 1 , y 2) strategjitë e përziera të lojtarëve të parë dhe të dytë, përkatësisht. Kujtoni se x 1 do të thotë probabiliteti që lojtari i parë të përdorë strategjinë e tij të parë, dhe x 2 = 1 - x 1 është probabiliteti që ai të përdorë strategjinë e tij të dytë. Në mënyrë të ngjashme për lojtarin e dytë: 1 është probabiliteti që ai të përdorë strategjinë e parë, 2 = 1 - 1 është probabiliteti që ai të përdorë strategjinë e dytë.

Sipas konkluzionit të teoremës, që strategjitë e përziera x dhe y të jenë optimale, është e nevojshme dhe e mjaftueshme që për x 1, x 2, y 1, y 2 jo-negative të mbahen marrëdhëniet e mëposhtme:

Le të tregojmë tani se nëse një lojë matrice nuk ka një pikë shalë në strategjitë e pastra, atëherë këto pabarazi duhet të kthehen në barazi:

Me të vërtetë. Lëreni që loja të mos ketë një pikë shale në strategjitë e pastra, atëherë vlerat optimale të strategjive të përziera plotësojnë pabarazitë

0<<1, 0<< 1,

0< <1, 01. (1.25)

Le të supozojmë se të dyja pabarazitë nga (1.22) janë strikte

atëherë, sipas teoremës, y 1 = y 2 = 0, që bie ndesh me kushtet (1.25).

Është vërtetuar në mënyrë të ngjashme se të dyja pabarazitë nga (1.23) nuk mund të jenë pabarazi strikte.

Le të supozojmë tani se një nga pabarazitë (1.22) mund të jetë strikte, për shembull e para

Kjo do të thotë që sipas teoremës, y 1 = 0, y 2 = 1. Rrjedhimisht, nga (1.23) marrim

Nëse të dyja pabarazitë (1.24) janë strikte, atëherë, sipas teoremës, x 1 = x 2 = 0, e cila bie ndesh me (1.25). Nëse është 12 a 22, atëherë njëra nga pabarazitë (1.27) është e rreptë dhe tjetra është barazi. Për më tepër, barazia do të jetë për elementin më të madh të një 12 dhe një 22, d.m.th., një pabarazi nga (1.27) duhet të jetë strikte. Për shembull një 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

Kështu, tregohet se nëse një lojë matrice nuk ka një pikë shale në strategjitë e pastra, atëherë për strategjitë optimale të lojtarit të parë, pabarazitë (1.22) kthehen në barazi. Një arsyetim i ngjashëm në lidhje me pabarazitë (1.23) do të çojë në faktin se në këtë rast pabarazitë (1.23) duhet të jenë barazi.

Pra, nëse një lojë matrice e rendit 22 nuk ka një pikë shale, atëherë strategjitë optimale të përziera të lojtarëve dhe çmimi i lojës mund të përcaktohen duke zgjidhur sistemin e ekuacioneve (1.24). Është vërtetuar gjithashtu se nëse në një lojë matrice të rendit 2x2 njëri nga lojtarët ka një strategji optimale të pastër, atëherë lojtari tjetër ka gjithashtu një strategji të pastër optimale.

Rrjedhimisht, nëse një lojë matrice nuk ka një pikë shale në strategjitë e pastra, atëherë ajo duhet të ketë një zgjidhje në strategjitë e përziera, të cilat përcaktohen nga ekuacionet (1.24). Zgjidhja e sistemit (1.25)

1.4 Metoda algjebrike

Ekzistojnë dy raste të mundshme për zgjidhjen e problemeve duke përdorur metodën algjebrike:

1. matrica ka një pikë shale;

2. matrica nuk ka pikë shale.

Në rastin e parë, zgjidhja është një palë strategjish që formojnë pikën e shalës së lojës. Le të shqyrtojmë rastin e dytë. Zgjidhjet këtu duhet të kërkohen në strategji të përziera:

Le të gjejmë strategji dhe... Kur lojtari i parë përdor strategjinë e tij optimale, lojtari i dytë, për shembull, mund të zbatojë dy strategji të tilla të pastra

Për më tepër, për shkak të pronës, nëse njëri nga lojtarët përdor një strategji të përzier optimale, dhe tjetri përdor çdo strategji të pastër të përfshirë në strategjinë e tij optimale të përzier me një probabilitet jo të barabartë me zero, atëherë pritshmëria matematikore për të fituar mbetet gjithmonë e pandryshuar dhe e barabartë. ndaj çmimit të lojës, d.m.th.

Fitimet në secilin prej këtyre rasteve duhet të jenë të barabarta me çmimin e lojës V. Në këtë rast, marrëdhëniet e mëposhtme janë të vlefshme:

Një sistem ekuacionesh i ngjashëm me (2.5), (2.6) mund të ndërtohet për strategjinë optimale të lojtarit të dytë:

Duke marrë parasysh gjendjen e normalizimit:

Le të zgjidhim ekuacionin (1.37) - (1.41) së bashku në lidhje me të panjohurat, ju mund të zgjidhni jo të gjitha menjëherë, por tre në një kohë: veçmas (1.36), (1.38), (1.40) dhe (1.37), ( 1,39), (1,41). Si rezultat i zgjidhjes marrim:

1.5 Metoda grafike

Një zgjidhje e përafërt për lojën 22 mund të merret thjesht duke përdorur metodën grafike. Thelbi i saj është si më poshtë:

Figura 1.1 - gjetja e një seksioni të gjatësisë së njësisë

Zgjidhni një seksion të gjatësisë njësi në boshtin x. Fundi i majtë i tij do të përshkruajë strategjinë e parë të lojtarit të parë, dhe fundi i djathtë do të përfaqësojë të dytin. Të gjitha pikat e ndërmjetme korrespondojnë me strategjitë e përziera të lojtarit të parë, dhe gjatësia e segmentit në të djathtë të pikës është e barabartë me probabilitetin e përdorimit të strategjisë së parë, dhe gjatësia e segmentit në të majtë është probabiliteti i përdorimit strategjia e dytë nga lojtari i parë.

Janë vizatuar dy boshte I-I dhe II-II. Ne do t'i vendosim fitimet në I-I kur lojtari i parë përdor strategjinë e parë, në II-II kur ai përdor strategjinë e dytë. Le të, për shembull, lojtari i dytë të zbatojë strategjinë e tij të parë, më pas vlera duhet të vizatohet në boshtin I-I dhe vlera duhet të vizatohet në boshtin II-II

Për çdo strategji të përzier të lojtarit të parë, fitimi i tij do të përcaktohet nga vlera e segmentit. Linja I-I korrespondon me aplikimin e strategjisë së parë nga lojtari i dytë; ne do ta quajmë atë strategjia e parë e lojtarit të dytë. Në mënyrë të ngjashme, ju mund të ndërtoni strategjinë e dytë të lojtarit të dytë. Pastaj, në përgjithësi, shfaqja grafike e matricës së lojës do të marrë formën e mëposhtme:

Figura 1.2 - gjetja e çmimit të lojës

Megjithatë, duhet theksuar se ky ndërtim është realizuar për lojtarin e parë. Këtu gjatësia e segmentit është e barabartë me çmimin e lojës V.

Linja 1N2 quhet kufiri i poshtëm fitues. Këtu mund të shihni qartë se pika N korrespondon me shumën maksimale të fitimeve të garantuara të lojtarit të parë.

Në përgjithësi, strategjia e lojtarit të dytë mund të përcaktohet edhe nga kjo shifër, për shembull në mënyrat e mëposhtme. Në boshtin I-I:

ose në aksin II-II

Megjithatë, strategjia e lojtarit të dytë mund të përcaktohet në mënyrë të ngjashme me mënyrën se si bëhet për lojtarin e parë, d.m.th. ndërtoni një grafik të tillë.

Figura 1.3 - përcaktimi i strategjisë së lojtarit të dytë

Këtu rreshti 1N2 është kufiri i sipërm i humbjes. Pika N korrespondon me humbjen minimale të mundshme të lojtarit të dytë dhe përcakton strategjinë.

Në varësi të vlerave specifike të koeficientëve të matricës, grafikët mund të kenë një formë të ndryshme, për shembull, kjo:

Figura 1.4 - përcakton strategjinë optimale të lojtarit të parë

Në një situatë të tillë, strategjia optimale e lojtarit të parë është e pastër:

1.6 Lojëra 2n ose m2

Në lojërat e rendit 2n, lojtari i parë ka 2 strategji të pastra, dhe lojtari i dytë ka n strategji të pastra, d.m.th. Matrica e fitimit të lojtarit të parë ka formën:

Nëse një lojë e tillë ka një pikë shale, atëherë është e lehtë ta gjesh atë dhe të marrësh një zgjidhje.

Le të supozojmë se loja ka pika shalë. Atëherë është e nevojshme të gjenden strategji të tilla të përziera dhe, në përputhje me rrethanat, lojtarët e parë dhe të dytë dhe çmimi i lojës v, të cilat plotësojnë marrëdhëniet:

Meqenëse loja nuk ka një pikë shale, pabarazia (1.54) zëvendësohet nga pabarazitë

Për të zgjidhur sistemet (1.56), (1.55), (1.53), këshillohet të përdorni metodën grafike. Për këtë qëllim, ne prezantojmë shënimin për anën e majtë të pabarazisë (1.53)

modeli matematikor i lojës së matricës

ose, duke vendosur nga (1.55) dhe duke kryer transformime të thjeshta, marrim

ku është fitimi mesatar i lojtarit të parë me kusht që ai të përdorë strategjinë e tij të përzier, dhe lojtari i dytë strategjinë e tij të j-të të pastër.

Sipas shprehjes, secila vlerë j=1, 2, …, n i përgjigjet një drejtëz në një sistem koordinativ drejtkëndor.

Qëllimi i lojtarit të dytë është të minimizojë fitimet e lojtarit të parë duke zgjedhur strategjitë e tij. Prandaj ne llogarisim

ku është kufiri i poshtëm i grupit të kufizimeve. Në figurën 1.6, grafiku i funksionit është paraqitur me një vijë të trashë.

Postuar në http://www.allbest.ru/

Figura 1.6 - grafiku i funksionit

Qëllimi i lojtarit të parë është të maksimizojë fitimet e tij përmes zgjedhjes, d.m.th. llogarit

Në figurën 1.6, pika nënkupton vlerën maksimale që është marrë në. Çmimi i lojës është sepse:

Në këtë mënyrë përcaktohen grafikisht strategjia e përzier optimale e lojtarit të parë dhe një çift strategjish të pastra të lojtarit të dytë, të cilat në kryqëzim formojnë një pikë.Figura 1.6 tregon strategjitë e 2-të dhe të 3-të të lojtarit të dytë. Për strategji të tilla, pabarazitë (1.53) kthehen në barazi. Në figurën 1.6 këto janë strategji j=2, j=3.

Tani mund të zgjidhim sistemin e ekuacioneve

dhe përcaktoni me saktësi vlerat e dhe (grafikisht ato përcaktohen afërsisht). Pastaj, duke vendosur të gjitha vlerat për ato j për të cilat nuk formojnë një pikë, duke zgjidhur sistemin e ekuacioneve (1.56) Për shembullin e paraqitur në figurën 1.6, ky është sistemi i mëposhtëm:

dhe pjesa tjetër Ky sistem mund të zgjidhet me pjerrësi Nëse për disa j=j 0 strategjitë e lojtarit të dytë formojnë një pikë M 0 dhe atëherë vlera maksimale e kufirit të poshtëm të grupeve të kufizimeve përshkruhet nga një segment paralel me aksi Në këtë rast, lojtari i parë ka pafundësisht shumë vlera optimale dhe çmimi i lojës Ky rast është paraqitur në figurën 1.7, ku segmenti MN përshkruan kufijtë e sipërm, vlerat optimale janë brenda kufijve Lojtari i dytë ka një strategji të pastër optimale j=j 0 .

Lojërat matricë të rendit m2 gjithashtu mund të zgjidhen duke përdorur metodën grafike. Matrica e fitimit të lojtarit të parë në këtë rast ka formën

Strategjitë e përziera të lojtarëve të parë dhe të dytë, përkatësisht, përcaktohen në mënyrë të ngjashme si në rastin e lojërave të rendit 2n. Le të vizatohet vlera nga 0 në 1 përgjatë boshtit horizontal dhe vlera e fitimit mesatar) të lojtarit të parë përgjatë boshtit vertikal, në kushtet që lojtari i parë të zbatojë strategjinë e tij të pastër i-të (i=1, 2, ..., m), e dyta - strategjia e tij e përzier (y 1, 1- y 1) =y. Për shembull, kur m=4 grafikisht) mund të paraqitet siç tregohet në figurën 1.7.

Figura 1.7 - grafiku i funksionit)

Lojtari i parë përpiqet të maksimizojë fitimin e tij mesatar, kështu që ai përpiqet të gjejë

Funksioni përfaqësohet nga një vijë e trashë dhe përfaqëson kufirin e sipërm të një grupi kufizimesh. Lojtari i dytë përpiqet të minimizojë duke zgjedhur strategjinë e tij, d.m.th. vlera korrespondon

Në figurë, vlera tregohet me një pikë. Me fjalë të tjera, përcaktohen dy strategjitë e lojtarit të parë dhe probabiliteti për lojtarin e dytë në të cilin arrihet barazia.

Nga figura shohim se çmimi i lojës është ordinata e pikës, probabiliteti është abshisa e pikës. Për strategjitë e mbetura të pastra të lojtarit të parë në strategjinë e përzier optimale duhet ().

Kështu, duke zgjidhur sistemin (1.69), marrim strategjinë optimale të lojtarit të dytë dhe çmimin e lojës. Ne gjejmë strategjinë e përzier optimale për lojtarin e parë duke zgjidhur sistemin e mëposhtëm të ekuacioneve:

1.7 Metoda matricore për zgjidhjen e lojërave

Emërtimet:

Çdo nënmatricë katrore e matricës së rendit

Matrica (1);

Matrica e transpozuar në;

Matrica ngjitur me B;

- (1) një matricë e marrë nga X duke fshirë elementët që korrespondojnë me rreshtat e fshirë nga pas marrjes;

- (1) një matricë e përftuar duke fshirë elementët që korrespondojnë me rreshtat e fshirë nga pas marrjes.

Algoritmi:

1. Zgjidhni një nënmatricë katrore të matricës së rendit () dhe llogarisni

2. Nëse disa ose, atëherë hidhni matricën e gjetur dhe provoni një matricë tjetër.

3. Nëse (), (), llogarisim dhe ndërtojmë X dhe nga dhe, duke shtuar zero në vendet e duhura.

Kontrollimi nëse pabarazitë janë të kënaqura

për të gjithë (1.75)

dhe pabarazitë

për të gjithë (1.76)

Nëse njëra nga marrëdhëniet nuk është e kënaqur, atëherë ne provojmë një tjetër. Nëse të gjitha marrëdhëniet janë të vlefshme, atëherë X dhe zgjidhjet e kërkuara.

1.8 Metoda e përafrimit të njëpasnjëshëm të çmimit të lojës

Gjatë studimit të situatave të lojës, shpesh mund të ndodhë që të mos ketë nevojë për të marrë një zgjidhje të saktë të lojës ose, për ndonjë arsye, është e pamundur ose shumë e vështirë të gjesh vlerën e saktë të çmimit të lojës dhe strategjitë e përziera optimale. Atëherë mund të përdorni metoda të përafërta për zgjidhjen e një loje matrice.

Le të përshkruajmë një nga këto metoda - metodën e përafrimit të njëpasnjëshëm të çmimit të një loje. Numri i llogaritur gjatë përdorimit të metodës rritet afërsisht në proporcion me numrin e rreshtave dhe kolonave të matricës së fitimit.

Thelbi i metodës është si vijon: loja luhet mendërisht shumë herë, d.m.th. në mënyrë sekuenciale, në çdo lojë lojtari zgjedh strategjinë që i jep atij fitimet më të mëdha të përgjithshme (totali).

Pas një zbatimi të tillë të disa lojërave, llogaritet vlera mesatare e fitimeve të lojtarit të parë dhe humbjeve të lojtarit të dytë dhe mesatarja aritmetike e tyre merret si një vlerë e përafërt e kostos së lojës. Metoda bën të mundur gjetjen e vlerës së përafërt të strategjive të përziera optimale të të dy lojtarëve: është e nevojshme të llogaritet frekuenca e aplikimit të secilës strategji të pastër dhe të merret si një vlerë e përafërt në strategjinë e përzier optimale të lojtarit përkatës.

Mund të vërtetohet se me një rritje të pakufizuar të numrit të lojërave programore, fitimi mesatar i lojtarit të parë dhe humbja mesatare e lojtarit të dytë do t'i afrohen pafundësisht çmimit të lojës, dhe vlerave të përafërta të strategjive të përziera në rasti kur loja ka një zgjidhje unike do të priret drejt strategjive optimale të përziera të secilit lojtar. Në përgjithësi, tendenca e vlerave të përafërta mbi këto vlera për t'iu afruar vlerave të vërteta është e ngadaltë. Sidoqoftë, ky proces është i lehtë për t'u mekanizuar dhe në këtë mënyrë ndihmon në marrjen e një zgjidhjeje për lojën me shkallën e kërkuar të saktësisë edhe me matricat e fitimit të një rendi relativisht të madh.

2. Pjesa praktike

Çifti vendos se ku të shkojë për shëtitje dhe të kalojë kohë të dobishme për të dy.

Vajza vendos të shkojë për një shëtitje në park për të marrë pak ajër të pastër, dhe në mbrëmje për të parë një film në kinemanë më të afërt.

Djali sugjeron të shkosh në parkun teknologjik dhe më pas të shikosh një ndeshje të futbollistëve të klubeve lokale në stadiumin qendror.

Në përputhje me këtë, ju duhet të gjeni se sa kohë do të duhet për të arritur qëllimin e njërit prej lojtarëve. Matrica fituese do të duket kështu:

Tabela 1. Matrica e fitimit

Strategjitë

Që nga 1 2, Natyrisht, kjo lojë nuk ka një pikë shale në strategjitë e pastra. Prandaj, ne përdorim formulat e mëposhtme dhe marrim:

Postuar në http://www.allbest.ru/

2.2 Lojë 2xn dhe mx2

Problemi 1 (2xn)

Dy kultura drithërash rriten për klimë të thatë dhe të lagësht.

Dhe gjendja e natyrës mund të konsiderohet si: e thatë, e lagësht, e moderuar.

Postuar në http://www.allbest.ru/

Vlera maksimale e M() arrihet në pikën M, e formuar nga kryqëzimi i drejtëzave që i përgjigjen j=1, j"=2. Sipas kësaj supozojmë:

Problemi 2 (mx2)

Një djalë dhe një vajzë po shqyrtojnë opsionet se ku të shkojnë për fundjavë.

Zgjedhja e një vendi pushimi mund të konsiderohet si: një park, një kinema, një restorant.

Postuar në http://www.allbest.ru/

Vlera maksimale e M() arrihet në pikën E, e formuar nga kryqëzimi i drejtëzave që i përgjigjen j=1, j"=2. Sipas kësaj supozojmë:

Për të përcaktuar vlerën e v, duhet të zgjidhen ekuacionet e mëposhtme:

2.5 Metoda e matricës

Dy restorante (objekte hotelierie) që konkurrojnë me njëri-tjetrin ofrojnë grupet e mëposhtme të shërbimeve. Restoranti i parë ndodhet në qendër, ndërsa tjetri në periferi të qytetit.

Restoranti qendror përfshin shërbimet e mëposhtme:

1) shërbim më i shtrenjtë dhe me cilësi të lartë ndaj klientit;

2) pjatat janë të përqendruara në kuzhinën franceze;

Restoranti i dytë ofron:

1) shërbim i lirë dhe me cilësi të lartë;

2) menuja kombinon kuzhina të ndryshme të famshme të botës;

3) gjithashtu promovime dhe zbritje të vazhdueshme;

4) dorëzon dhe pranon porosi për dërgesë në shtëpi.

Në përputhje me detyrën, fitimi për një ditë ndërmjet dy restoranteve do të shpërndahet si më poshtë:

Tabela 2. Matrica e fitimit

Strategjitë

Zgjidhja e një loje të formës duke përdorur metodën e matricës:

Ka gjashtë nënmatrica dhe:

Konsideroni matricën:

x 1 = ? 0, x 2 = ? 0

Meqenëse x 2 =< 0, то мы отбрасываем.

Le të shqyrtojmë tani matricën:

x 1 = ? 0, x 2 = ? 0

Çmimi i lojës.

Ky raport bie ndesh me kërkesën dhe për këtë arsye nuk është i përshtatshëm.

Le të shqyrtojmë tani matricën:

x 1 = , x 2 = ? 0,

y 1 =< 0, y 2 = ? 0.

Meqenëse y 1 =< 0, то мы отбрасываем и.

Le të shqyrtojmë tani matricën:

x 1 = , x 2 = 0, meqë x 2 = 0, atëherë e hedhim dhe.

Le të shqyrtojmë tani matricën:

x 1 = , x 2 = ? 0. Meqenëse x 1 = 0, ne hedhim dhe.

Le të shqyrtojmë tani matricën:

x 1 = , x 2 =, y 1 = , y 2 =, pastaj vazhdojmë më tej:

x 1 = , x 2 = , y 1 = , y 2 = ose

Çmimi i lojës.

Tani kontrollohen marrëdhëniet themelore:

Postuar në http://www.allbest.ru/

Përgjigje: x 1 = , x 2 =, y 1 = , y 2 = , y 3 =0, y 4 =0,.

Metoda kafe

Me kërkesë të punëtorëve të një kompanie të caktuar, sindikata negocion me menaxhmentin e saj për organizimin e drekës së nxehtë me shpenzimet e kompanisë. Sindikata që përfaqëson punëtorët dëshiron të sigurojë që dreka të jetë sa më cilësore dhe për këtë arsye më e shtrenjtë. Menaxhmenti i kompanisë ka interesa të kundërta. Në fund, palët ranë dakord për sa vijon. Sindikata (lojtari 1) zgjedh një nga tre kompanitë (A 1, A 2, A 3) që furnizojnë ushqime të ngrohta dhe menaxhmenti i kompanisë (lojtari 2) zgjedh një grup pjatash nga tre opsionet e mundshme (B 1, B 2 , B 3) . Pas nënshkrimit të marrëveshjes, sindikata gjeneron matricën e mëposhtme të pagesave, elementët e së cilës përfaqësojnë koston e një grupi pjatash:

Lëreni që loja të përcaktohet nga matrica e mëposhtme e fitimit:

Supozoni se lojtari i dytë zgjodhi strategjinë e tij të dytë, atëherë i pari do të marrë:

2, nëse ai përdor strategjinë e tij të parë,

3 nëse ai përdor strategjinë e tij të tretë.

Vlerat e marra janë përmbledhur në tabelën 1.

Tabela 3. Strategjia e lojtarit të dytë

Numri i grupit

Strategjia e lojtarit 2

Fitorja e lojtarit të parë

Nga Tabela 3 mund të shihet se me strategjinë e dytë të lojtarit të dytë, i pari do të marrë fitimin më të madh 3 duke përdorur strategjinë e tij të dytë ose të tretë. Meqenëse lojtari i parë dëshiron të marrë maksimumin e fitores, ai i përgjigjet strategjisë së dytë të lojtarit të dytë me strategjinë e tij të dytë. Me strategjinë e dytë të lojtarit të parë, i dyti do të humbasë:

1 nëse ai përdor strategjinë e tij të parë,

3, nëse ai përdor strategjinë e tij të dytë,

4 nëse ai përdor strategjinë e tij të tretë.

Tabela 4. Strategjia e lojtarit të parë

Numri i grupit

Strategjia e lojtarit të parë

Lojtari i dytë humbet

Nga tabela 2 shihet se me strategjinë e dytë të lojtarit të parë, lojtari i dytë do të ketë humbjen më të vogël prej 1 nëse zbaton strategjinë e tij të parë. Meqenëse lojtari i dytë dëshiron të humbasë më pak, në përgjigje të strategjisë së dytë të lojtarit të parë, ai do të përdorë strategjinë e tij të parë. Rezultatet e marra janë përmbledhur në tabelën 5.

Tabela 5. Strategjitë e lojtarëve të parë dhe të dytë, përkatësisht

Numri i grupit

Strategjia e lojtarit 2

Fitimet totale të lojtarit të parë

Strategjia e lojtarit të parë

Në tabelë 5 në kolonën e strategjisë së lojtarit të dytë në rreshtin e dytë ka një numër 1, i cili tregon se në lojën e dytë është e dobishme që lojtari i dytë të përdorë strategjinë e tij të parë; në kolonë është mesatarja më e madhe fituese 3 e lojtarit të parë, të marra prej tij në ndeshjen e parë; kolona w përmban humbjen më të vogël mesatare prej 1 të marrë nga lojtari i dytë në ndeshjen e parë; kolona v përmban mesataren aritmetike v = (u + w) - d.m.th., vlerën e përafërt të çmimit të lojës, e marrë si rezultat i humbjes së një loje të lojës. Nëse lojtari i dytë zbaton strategjinë e tij të parë, atëherë i pari do të marrë respektivisht 3, 1, 2, me strategjitë e tij të 1, 2, 3, dhe fitimet totale të lojtarit të parë për të dyja ndeshjet do të jenë:

2 + 3=5 me strategjinë e tij të parë,

3 + 1=4 me strategjinë e tij të dytë,

3 + 2=5 me strategjinë e tij të tretë.

Këto fitime totale regjistrohen në rreshtin e dytë të tabelës. 3 dhe në kolonat që korrespondojnë me strategjitë e lojtarit të parë: 1, 2, 3.

Nga të gjitha fitimet totale, më e madhja është 5. Merret me strategjinë e 1-rë dhe të tretë të lojtarit të parë, më pas ai mund të zgjedhë ndonjë prej tyre; Le të themi, në raste të tilla, kur ka dy (ose disa) fitime totale identike, zgjidhni strategjinë me numrin më të ulët (në rastin tonë, ne duhet të marrim strategjinë e parë).

Me strategjinë e parë të lojtarit të parë, i dyti do të humbasë përkatësisht 3, 2, 3 nga strategjitë e tij 1, 2, 3, dhe humbja totale e lojtarit të dytë për të dyja ndeshjet do të jetë:

1 + 3=4 me strategjinë e tij të parë,

3 + 2=5 me strategjinë e tij të dytë,

4 + 3=7 me strategjinë e tij të tretë.

Këto humbje totale janë regjistruar në rreshtin e dytë të tabelës. 5 dhe në kolonat që korrespondojnë me strategjitë 1, 2, 3 të lojtarit të dytë.

Nga të gjitha humbjet totale të lojtarit të dytë, më e vogla është 4. Ajo merret me strategjinë e tij të parë, prandaj, në ndeshjen e tretë lojtari i dytë duhet të zbatojë strategjinë e tij të parë. Fitimet më të mëdha totale të lojtarit të parë në dy ndeshje, pjesëtuar me numrin e lojërave, vendosen në kolonë, d.m.th.; Kolona w përmban humbjen më të vogël totale të lojtarit të dytë gjatë dy ndeshjeve, pjesëtuar me numrin e lojërave, d.m.th. në kolonën v është vendosur mesatarja aritmetike e këtyre vlerave, d.m.th. = Ky numër merret si një vlerë e përafërt e çmimit të lojës me dy lojëra "të luajtura".

Kështu, fitohet tabela e mëposhtme 4, për dy ndeshje.

Tabela 6. Totali i fitimeve dhe humbjeve të lojtarëve pas dy ndeshjeve të luajtura

Strategjia e lojtarit 2

Fitimet totale të lojtarit të parë

Strategjia e lojtarit të parë

Humbja totale e lojtarit të dytë

Në rreshtin e tretë të tabelës 6 në kolonën e strategjisë së lojtarit të dytë ka një numër 1, i cili tregon se në ndeshjen e tretë lojtari i dytë duhet të zbatojë strategjinë e tij të parë. Në këtë rast, lojtari i parë fiton 3, 1, 2, duke përdorur respektivisht strategjitë e tij të 1, 2, 3, dhe fitimet e tij totale në tre ndeshje do të jenë:

3 + 5 = 8 me strategjinë e tij të parë,

1 +4 = 5 me strategjinë e tij të dytë,

2 + 5 = 7 me strategjinë e tij të tretë.

Këto fitime totale të lojtarit të parë regjistrohen në rreshtin e tretë të tabelës 6 dhe kolonat që korrespondojnë me strategjitë e tij 1, 2, 3. Meqenëse fitimet më të mëdha 8 të lojtarit të parë fitohen me strategjinë e parë, zgjidhet e para. në përputhje me rrethanat.

Me strategjinë e parë të lojtarit të parë, i dyti do të humbasë përkatësisht 3, 1, 2 nga strategjitë e tij 1, 2, 3 dhe humbja totale e lojtarit të dytë për të dyja ndeshjet do të jetë:

3 + 4=7 me strategjinë e tij të parë,

2 + 5=7 me strategjinë e tij të dytë,

3 + 7 = 10 me strategjinë e tij të tretë.

Këto humbje totale janë regjistruar në rreshtin e tretë të tabelës. 6 dhe në kolonat që korrespondojnë me strategjitë 1, 2, 3 të lojtarit të dytë. Nga të gjitha humbjet e tij totale, 7 është më e vogla dhe fitohet me strategjinë e tij të parë dhe të dytë, atëherë lojtari i dytë duhet të zbatojë strategjinë e tij të parë.

Në tabelë 6 në rreshtin e tretë në kolonë dhe regjistron fitimet më të mëdha totale të lojtarit të parë në tre ndeshje, pjesëtuar me numrin e lojës, d.m.th.; në kolonën w vendoset humbja më e vogël totale e lojtarit të dytë në tre ndeshje, pjesëtuar me numrin e lojërave, d.m.th.; kolona v përmban mesataren e tyre aritmetike

Kështu marrim tabelën. 7 për tre ndeshje.

Tabela 7. Totali i fitimeve dhe humbjeve të lojtarëve pas tre ndeshjeve të luajtura

Numri i grupit

Strategjia e lojtarit 2

Fitimet totale të lojtarit të parë

Strategjia e lojtarit të parë

Humbja totale e lojtarit të dytë

Tabela 8. Tabela përfundimtare pas njëzet ndeshjeve të luajtura

Numri i grupit

Strategjia e lojtarit 2

Fitimet totale të lojtarit të parë

Strategjia e lojtarit të parë

Humbja totale e lojtarit të dytë

Nga tavolina 7 dhe 8 mund të shihet se në 20 ndeshje të humbura, strategjitë 1, 2, 3 për lojtarin e parë ndodhin përkatësisht 12, 3, 5 herë, prandaj, frekuencat e tyre relative janë përkatësisht të barabarta; strategjitë 1, 2, 3 për lojtarin e dytë ndodhin përkatësisht 7, 11,2 herë, prandaj frekuencat e tyre relative janë përkatësisht të barabarta; çmimi i përafërt i lojës. Ky përafrim është mjaft i mirë.

Së fundi, vini re se nëse një lojë ka më shumë se një zgjidhje, atëherë përafrimet e kostos së lojës do të vazhdojnë të përafrojnë koston e vërtetë të lojës për një kohë të pacaktuar dhe frekuencat relative të strategjive të lojtarëve nuk do të përafrojnë më domosdoshmërisht optimalen e vërtetë të përzier të lojtarëve. strategjive.

Analiza e rezultateve

Në këtë punë kursi, ne studiuam materialin për gjetjen e zgjidhjeve për lojërat me shumë zero duke përdorur metodën grafike, matricore dhe metodën e përafrimit të njëpasnjëshëm të çmimit të lojës. U gjetën strategjitë optimale të lojtarëve të parë dhe të dytë, si dhe kostoja e të luajturit në lojërat 2x2, 2xn dhe mx2, si dhe në lojërat që përdorin metodën e matricës dhe metodën e Brown.

Duke përdorur shembullin e një çifti, u simulua një lojë 2x2, e cila u zgjidh duke përdorur metoda algjebrike dhe grafike. Duke zgjidhur lojën në mënyrë algjebrike, zgjidhja tregon se duke përdorur strategjitë e tyre optimale të përziera, lojtarët e parë dhe të dytë do të kalojnë 4.6 orë së bashku. Zgjidhja grafike e problemit u mor me një gabim të vogël dhe arriti në 4.5 orë.

Dhe gjithashtu u simuluan dy probleme 2xn dhe mx2. Në problemin 2xn, u konsiderua një kulture bujqësore dhe strategjia tregon se është më mirë të mbillni një fushë 50 deri në 50, dhe çmimi i lojës ishte 3.75 milion rubla. Dhe në problemin mx2, u konsiderua një çift, strategjia e të cilit tregoi se ishte më e lirë të shkosh në park dhe kinema, dhe kostoja do të ishte 4.3 rubla.

Një problem u modelua për metodën e matricës, në të cilën u morën parasysh dy restorante; zgjidhja e problemit tregoi se kur përdorni strategjinë e tij optimale të përzier, fitimi i restorantit të parë do të jetë 15.6 milion rubla, dhe kur përdorni strategjinë e tij optimale të përzier nga i dyti. restorant, nuk do të lejojë që i pari të fitojë më shumë se 15.6 milion rubla. Zgjidhja grafike rezultoi në një gabim dhe çmimi i lojës ishte 14.9 milion rubla.

Për metodën e Brown, u hartua një detyrë në të cilën merret parasysh sindikata dhe menaxhmenti i kompanisë, detyra e tyre është të sigurojnë ushqim për punëtorët. Nëse të dy lojtarët përdorin strategjitë e tyre optimale, ushqimi për person do të jetë 2.45 mijë rubla.

Lista e burimeve të përdorura

1) Vilisov V.Ya. Shënime leksioni “Teoria e lojës dhe vendimet statistikore”, - Dega - “Voskhod” MAI. 1979. 146 f.

2) Krushevsky A.V. Teoria e Lojërave, - Kiev: Shkolla Vishcha, 1977. - 216 f.

3) Churchmen U., Akof R., Arnof L., Hyrje në kërkimin e operacioneve. - M.: Shkencë. 1967. - 488 f.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0 %B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

Postuar në Allbest.ru

Dokumente të ngjashme

    Vendimmarrja si një lloj i veçantë i veprimtarisë njerëzore. Paraqitja racionale e matricës së lojës. Shembuj të lojërave matricë në strategji të pastra dhe të përziera. Hulumtimi i operacioneve: lidhja e problemeve të programimit linear me një model të teorisë së lojës.

    puna e kursit, shtuar 05/05/2010

    Lojëra të përsëritura shumë herë, veçoritë dhe fazat e tyre dalluese. Strategjitë e përziera, kushtet dhe mundësitë e përdorimit të tyre në praktikë. Metoda analitike për zgjidhjen e një loje të tipit 2 x 2. Teorema bazë për lojëra drejtkëndëshe. Zgjidhje algjebrike.

    prezantim, shtuar më 23.10.2013

    Përkufizimet bazë të teorisë së lojërave bimatrikse. Një shembull i një loje bimatrikse "Nxënës-Mësues". Strategji të përziera në lojërat bimatrikse. Kërkoni për një "situatë ekuilibri". Lojëra bimatrikse 2x2 dhe formula për rastin kur secili lojtar ka dy strategji.

    abstrakt, shtuar më 13.02.2011

    Mësoni informacione të përgjithshme rreth lojërave me matricë dhe me shumë zero. Koncepti i lojës pozicionale, pema, grup informacioni. Konsiderimi i parimit maximin dhe parimit të ekuilibrit. Optimaliteti Pareto. Lojë pozicionale jo antagoniste, vetitë e saj.

    puna e kursit, shtuar 17.10.2014

    Teoria e lojës është një degë e matematikës, lënda e së cilës është studimi i modeleve matematikore për marrjen e vendimeve optimale në kushte konflikti. Metoda përsëritëse Brown-Robinson. Një algoritëm përsëritës monoton për zgjidhjen e lojërave me matricë.

    tezë, shtuar 08/08/2007

    Hartimi i një matrice pagese, kërkimi i çmimeve neto të ulëta dhe të sipërme të lojës, strategjitë maksimale dhe minimale të lojtarëve. Thjeshtimi i matricës së pagesave. Zgjidhja e një loje matrice duke përdorur një reduktim në një problem programimi linear dhe shtesën "Kërko një zgjidhje".

    test, shtuar 11/10/2014

    Teoria e lojës është një teori matematikore e situatave të konfliktit. Zhvillimi i një modeli matematikor të një loje me shumë zero me dy persona, zbatimi i tij në formën e kodeve të programit. Metoda për zgjidhjen e problemit. Të dhënat hyrëse dhe dalëse. Programi, manuali i përdorimit.

    puna e kursit, shtuar 17.08.2013

    Informacion bazë për metodën simplex, vlerësimi i rolit dhe rëndësisë së saj në programimin linear. Interpretimi gjeometrik dhe kuptimi algjebrik. Gjetja e maksimumit dhe minimumit të një funksioni linear, raste të veçanta. Zgjidhja e problemit duke përdorur metodën e matricës simplex.

    tezë, shtuar 06/01/2015

    Teknikat për ndërtimin e modeleve matematikore të sistemeve kompjuterike që pasqyrojnë strukturën dhe proceset e funksionimit të tyre. Numri i akseseve të skedarëve në procesin e zgjidhjes së një problemi mesatar. Përcaktimi i mundësisë së vendosjes së skedarëve në disqet e memories së jashtme.

    punë laboratorike, shtuar 21.06.2013

    Hartimi i një modeli matematikor. Përshkrimi i lojës tic-tac-toe. Modeli i një loje logjike të bazuar në algjebrën e Bulit. Pajisjet elektronike dixhitale dhe zhvillimi i modelit të tyre matematikor. Konsola e lojërave, kontrolluesi i lojës, linja e fushës së lojës.

Instituti i Energjisë në Moskë

(Universiteti Teknik)

Raporti i laboratorit

në teorinë e lojës

"Një program për gjetjen e strategjive optimale për një lojë të çiftuar me shumë zero të dhënë në formën e matricës"

Plotësuar nga studentët

grupi A5-01

Ashrapov Daler

Ashrapova Olga

Konceptet themelore të teorisë së lojës

Teoria e lojës është krijuar për të zgjidhur situatat e konfliktit , d.m.th. situata në të cilat përplasen interesat e dy ose më shumë palëve, që ndjekin qëllime të ndryshme.

Nëse qëllimet e palëve janë drejtpërdrejt të kundërta, atëherë ato flasin konflikt antagonist .

Lojë quhet një model i thjeshtuar i formalizuar i një situate konflikti.

Një lojë e vetme e një loje nga fillimi në fund quhet partisë . Rezultati i lojës është pagesa (ose fitimet ).

Partia përbëhet nga lëviz , d.m.th. zgjedhje të lojtarëve nga një grup i caktuar alternativash të mundshme.

Lëvizjet mund të jenë personale Dhe e rastit.Lëvizje personale , Ndryshe nga e rastit , përfshin zgjedhjen e vetëdijshme të lojtarit për disa opsione.

Quhen lojëra në të cilat ka të paktën një lëvizje personale strategjike .

Quhen lojëra në të cilat të gjitha lëvizjet janë të rastësishme lojërat e fatit .

Kur bëjnë një lëvizje personale, ata gjithashtu flasin për strategjive lojtar, d.m.th. për një rregull ose grup rregullash që përcaktojnë zgjedhjen e një lojtari. Në të njëjtën kohë, strategjia duhet të jetë gjithëpërfshirëse, d.m.th. zgjedhja duhet të përcaktohet për çdo situatë të mundshme gjatë lojës.

Problemi i teorisë së lojës– gjetja e strategjive optimale për lojtarët, d.m.th. strategji që u ofrojnë atyre fitim maksimal ose humbje minimale.

Klasifikimi i modeleve të teorisë së lojës

Lojë n personat zakonisht shënohen si, ku
- grup i strategjive të lojtarit të i-të,
- pagesa për lojën.

Në përputhje me këtë përcaktim, mund të propozohet klasifikimi i mëposhtëm i modeleve të teorisë së lojës:

Diskret (strategji të shumta diskrete)

Final

Pafund

E vazhdueshme (strategji të shumta e vazhdueshme)

Pafund

n persona (
)

Koalicion (kooperativë)

Jo koalicion (jo bashkëpunues)

2 persona (çifte)

Antagoniste (lojëra me shumë zero)

(interesat e palëve janë të kundërta, d.m.th. humbja e njërit lojtar është e barabartë me fitimin e tjetrit)

Jo antagoniste

Me informacion të plotë (nëse lojtari që bën një lëvizje personale e njeh të gjithë sfondin e lojës, pra të gjitha lëvizjet e kundërshtarit)

Me informacion jo të plotë

Me shumë zero (pagesa totale është zero)

Shuma jo zero

Me një lëvizje (llotaritë)

Shumë-kalime

Paraqitja matricore e një loje të çiftuar me shumë zero

Në këtë tutorial do të shikojmë lojëra antagoniste me dy persona , dhënë në formë matrice. Kjo do të thotë që ne njohim shumë strategji të lojtarit të parë (lojtarit A){ A i }, i = 1,…, m dhe një shumëllojshmëri strategjish për lojtarin e dytë (lojtar B){ B j }, j = 1,..., n, dhe gjithashtu jepet matrica A = || a ij || fitimet e lojtarit të parë. Meqenëse po flasim për një lojë antagoniste, supozohet se fitimi i lojtarit të parë është i barabartë me humbjen e të dytit. Supozojmë se elementi i matricës a ij– fitimet e lojtarit të parë kur ai zgjedh një strategji A i dhe përgjigja e lojtarit të dytë ndaj tij me një strategji B j. Ne do të shënojmë një lojë të tillë si
, Ku m - numri i strategjive të lojtarëve A,n - numri i strategjive të lojtarëve NË. Në përgjithësi, ajo mund të përfaqësohet nga tabela e mëposhtme:

B 1

B j

B n

A 1

A i

A m

Shembulli 1

Si një shembull i thjeshtë, merrni parasysh një lojë në të cilën një lojë përbëhet nga dy lëvizje.

Lëvizja e 1-rë: Lojtar A zgjedh një nga numrat (1 ose 2) pa e informuar kundërshtarin për zgjedhjen e tij.

Lëvizja e 2-të: Lojtar zgjedh një nga numrat (3 ose 4).

Fundi: Zgjedhjet e lojtarëve A Dhe paloset. Nëse shuma është e barabartë, atëherë ia paguan vlerën lojtarit A, nëse është tek - anasjelltas, A ia paguan shumën lojtarit .

Kjo lojë mund të paraqitet në formë
në mënyrën e mëposhtme:

(zgjedhja 3)

(zgjedhja 4)

(zgjedhja 1)

(zgjedhja 2)

Është e lehtë të shihet se kjo lojë është antagoniste, përveç kësaj, është një lojë me informacion jo të plotë, sepse te lojtari NË, duke bërë një lëvizje personale, nuk dihet se çfarë zgjedhje ka bërë lojtari A.

Siç u përmend më lart, detyra e teorisë së lojës është të gjejë strategjitë optimale të lojtarëve, d.m.th. strategji që u ofrojnë atyre fitim maksimal ose humbje minimale. Ky proces quhet zgjidhje loje .

Kur zgjidhni një lojë në formë matrice, duhet të kontrolloni lojën për praninë pikë shale . Për ta bërë këtë, futen dy vlera:

– vlerësim më i ulët i çmimit të lojës dhe

– vlerësimi i sipërm i çmimit të lojës.

Lojtari i parë ka shumë të ngjarë të zgjedhë strategjinë në të cilën ai merr fitimin maksimal midis të gjitha përgjigjeve të mundshme të lojtarit të dytë, dhe lojtari i dytë, përkundrazi, do të zgjedhë atë që minimizon humbjen e tij, d.m.th. fitorja e mundshme e të parit.

Mund të vërtetohet se α ≤ V ≤ β , Ku Vçmimi i lojës , d.m.th., fitorja e mundshme e lojtarit të parë.

Nëse lidhja qëndron α = β = V, atëherë ata thonë se loja ka një pikë shale
, Dhe mund të zgjidhen në strategji të pastra . Me fjalë të tjera, ka disa strategji
, duke i dhënë lojtarit AV.

Shembulli 2

Le të kthehemi te loja që kemi konsideruar në Shembullin 1 dhe ta kontrollojmë atë për praninë e një pike shale.

(zgjedhja 3)

(zgjedhja 4)

(zgjedhja 1)

(zgjedhja 2)

Për këtë lojë
= -5,
= 4,
, pra, nuk ka një pikë shale.

Le të tërheqim edhe një herë vëmendjen për faktin se kjo lojë është një lojë me informacion jo të plotë. Në këtë rast, ne mund të këshillojmë vetëm lojtarin A zgjidhni një strategji , sepse në këtë rast, ai mund të marrë fitoren më të madhe, megjithatë, në varësi të zgjedhjes së lojtarit strategjive .

Shembulli 3

Le të bëjmë disa ndryshime në rregullat e lojës nga shembulli 1. Ne do të japim lojtarin informacion për zgjedhjen e lojtarit A. Pastaj keni do të shfaqen dy strategji shtesë:

- një strategji e dobishme për A. Nëse zgjedhja A - 1, Se zgjedh 3 nëse zgjedh A - 2, Se zgjedh 4;

- një strategji që nuk është e dobishme për A. Nëse zgjedhja A - 1, Se zgjedh 4 nëse zgjedh A - 2, Se zgjedh 3.

(zgjedhja 3)

(zgjedhja 4)

(zgjedhja 1)

(zgjedhja 2)

Kjo lojë është me informacion të plotë.

Në këtë rast
= -5,
= -5,
, pra, loja ka një pikë shale
. Kjo pikë e shalës korrespondon me dy palë strategjish optimale:
Dhe
. Çmimi i lojës V= -5. Është e qartë se për A një lojë e tillë është e padobishme.

Shembujt 2 dhe 3 janë një ilustrim i mirë i teoremës së mëposhtme, të provuar në teorinë e lojës:

Teorema 1

Çdo lojë antagoniste e çiftuar me informacion të plotë mund të zgjidhet në strategji të pastra.

Se. Teorema 1 thotë se çdo lojë me dy lojtarë me informacion të plotë ka një pikë shale dhe ka një palë strategji të pastra
, duke i dhënë lojtarit A fitime të qëndrueshme të barabarta me çmimin e lojës V.

Në rastin e mungesës së një pike shale, të ashtuquajturat strategji të përziera :, Ku fq i Dheq j– probabilitetet e zgjedhjes së strategjive A i Dhe B j lojtarët e parë dhe të dytë përkatësisht. Zgjidhja e lojës në këtë rast është një palë strategji të përziera
, duke maksimizuar pritshmërinë matematikore të çmimit të lojës.

Teorema e mëposhtme përgjithëson Teoremën 1 në rastin e një loje me informacion jo të plotë:

Teorema 2

Çdo lojë antagoniste e çiftuar ka të paktën një zgjidhje optimale, d.m.th., një palë strategji të përziera në rastin e përgjithshëm
, duke i dhënë lojtarit A fitime të qëndrueshme të barabarta me çmimin e lojës V, dhe α ≤ V ≤ β .

Në rastin e veçantë, për një lojë me një pikë shale, zgjidhja në strategjitë e përziera duket si një çift vektorësh në të cilët një element është i barabartë me një dhe pjesa tjetër është e barabartë me zero.

Rasti më i thjeshtë, i zhvilluar në detaje në teorinë e lojës, është një lojë me çifte të fundme zero (një lojë antagoniste e dy personave ose e dy koalicioneve). Konsideroni një lojë G në të cilën marrin pjesë dy lojtarë A dhe B, duke pasur interesa të kundërta: fitimi i njërit është i barabartë me humbjen e tjetrit. Meqenëse fitimi i lojtarit A është i barabartë me shpërblimin e lojtarit B me shenjën e kundërt, ne mund të jemi të interesuar vetëm për shpërblimin e lojtarit a. Natyrisht, A dëshiron të maksimizojë, dhe B dëshiron të minimizojë a.

Për thjeshtësi, le të identifikohemi mendërisht me një nga lojtarët (le të jetë A) dhe ta quajmë atë "ne" dhe lojtarin B "kundërshtar" (natyrisht, asnjë avantazh real për A nuk rrjedh nga kjo). Le të kemi strategji të mundshme dhe kundërshtari - strategji të mundshme (një lojë e tillë quhet lojë). Le të tregojmë fitimet tona nëse përdorim strategjinë dhe kundërshtari përdor strategjinë

Tabela 26.1

Le të supozojmë se për çdo palë strategjish fitimi (ose fitimi mesatar) a është i njohur për ne. Më pas, në parim, është e mundur të ndërtohet një tabelë (matricë) drejtkëndëshe që liston strategjitë e lojtarëve dhe përfitimet përkatëse (shih Tabelën 26.1).

Nëse përpilohet një tabelë e tillë, atëherë ata thonë se loja G është reduktuar në një formë matrice (sjellja e lojës në një formë të tillë në vetvete mund të jetë tashmë një detyrë e vështirë, dhe nganjëherë pothuajse e pamundur, për shkak të shumëllojshmërisë së madhe të strategjive ). Vini re se nëse loja reduktohet në formën e matricës, atëherë loja me shumë lëvizje reduktohet në të vërtetë në një lojë me një lëvizje - lojtarit i kërkohet të bëjë vetëm një lëvizje: të zgjedhë një strategji. Do të shënojmë shkurtimisht matricën e lojës

Le të shohim një shembull të lojës G (4X5) në formë matrice. Ne kemi në dispozicion katër strategji (për të zgjedhur), ndërsa armiku ka pesë strategji. Matrica e lojës është dhënë në tabelën 26.2

Le të mendojmë se çfarë strategjie duhet të përdorim ne (lojtari A)? Në Matricën 26.2 ka një fitim tundues prej "10"; ne jemi të tunduar të zgjedhim një strategji në të cilën do ta marrim këtë "goditje".

Por prisni: as armiku nuk është budalla! Nëse zgjedhim një strategji, ai do të zgjedhë strategjinë, për të na keqardhur, dhe ne do të marrim një fitim patetik "1". Jo, nuk mund të zgjidhni një strategji! Si të jesh? Natyrisht, bazuar në parimin e kujdesit (dhe është parimi bazë i teorisë së lojës), ne duhet të zgjedhim strategjinë në të cilën fitimi ynë minimal është maksimal.

Tabela 26.2

Ky është i ashtuquajturi "parimi mini-maks": veproni në atë mënyrë që, duke pasur parasysh sjelljen më të keqe të kundërshtarit tuaj për ju, të merrni fitoren maksimale.

Le të rishkruajmë tabelën 26.2 dhe në kolonën shtesë djathtas shkruajmë vlerën minimale fituese në çdo rresht (minimumi i rreshtit); le ta shënojmë për rreshtin a (shih tabelën 26.3).

Tabela 26.3

Nga të gjitha vlerat (kolona e djathtë), theksohet më e madhja (3). Strategjia korrespondon me të. Duke zgjedhur këtë strategji, ne mund të jemi në çdo rast të sigurt se (për çdo sjellje të armikut) do të fitojmë jo më pak se 3. Kjo vlerë është fitorja jonë e garantuar; Duke u sjellë me kujdes, nuk mund të marrim më pak se kaq, ndoshta do të marrim më shumë).

Kjo fitore quhet çmimi më i ulët i lojës (ose "maksimumi" - maksimumi i fitimeve minimale). Do ta shënojmë si një. Në rastin tonë

Tani le të marrim këndvështrimin dhe arsyen e armikut për të. Ai nuk është një lloj pengu, por është gjithashtu i zgjuar! Kur zgjedh një strategji, ai do të donte të jepte më pak, por ai duhet të llogarisë në sjelljen tonë më të keqe për të. Nëse ai zgjedh një strategji, ne do t'i përgjigjemi dhe ai do të japë 10; nëse ai zgjedh, ne do t'i përgjigjemi atij dhe ai do të japë, etj. Ne do t'i shtojmë një fund shtesë tabelës 26.3 dhe do të shkruajmë maksimalet e kolonave në të. Natyrisht, një kundërshtar i kujdesshëm duhet të zgjedhë strategjinë në të cilën është kjo vlerë minimale (vlera përkatëse 5 është theksuar në tabelën 26.3). Kjo vlerë P është vlera e fitimit, më shumë se të cilën një kundërshtar i arsyeshëm me siguri nuk do të na japë. Quhet çmimi i sipërm i lojës (ose "mi-nimax" - minimumi i fitimeve maksimale). Në shembullin tonë, dhe arrihet me strategjinë e armikut

Pra, bazuar në parimin e kujdesit (rregulli i risigurimit "gjithmonë llogarisni më të keqen!"), duhet të zgjedhim strategjinë A dhe strategjinë armiku - Strategjitë e tilla quhen "minimax" (duke u nisur nga parimi minimax). Për sa kohë që të dyja palët në shembullin tonë i përmbahen strategjive të tyre maksimale, fitimi do të jetë

Tani le të imagjinojmë për një moment se kemi mësuar se armiku po ndjek një strategji. Hajde, le ta ndëshkojmë për këtë dhe të zgjedhim një strategji, do të marrim 5, dhe kjo nuk është aq keq. Por armiku gjithashtu nuk është një dështim; le ta dijë se strategjia jonë është , edhe ai do të nxitojë të zgjedhë, duke ulur fitimet tona në 2, etj. (partnerët "nguteshin me strategji"). Me pak fjalë, strategjitë minimale në shembullin tonë janë të paqëndrueshme në lidhje me informacionin për sjelljen e palës tjetër; këto strategji nuk kanë vetinë e ekuilibrit.

A është gjithmonë kështu? Jo jo gjithmonë. Shqyrtoni shembullin me matricën e dhënë në tabelën 26.4.

Në këtë shembull, çmimi më i ulët i lojës është i barabartë me çmimin e sipërm: . Çfarë rrjedh nga kjo? Strategjitë minimale të lojtarëve A dhe B do të jenë të qëndrueshme. Për sa kohë që të dy lojtarët u përmbahen atyre, fitimi është 6. Le të shohim se çfarë ndodh nëse (A) zbulojmë se kundërshtari (B) i përmbahet strategjisë B?

Tabela 26.4

Por absolutisht asgjë nuk do të ndryshojë, sepse çdo devijim nga strategjia mund të përkeqësojë situatën tonë. Po kështu, informacioni i marrë nga kundërshtari nuk do ta detyrojë atë të devijojë nga strategjia e tij.Një palë strategjish ka vetinë e ekuilibrit (një palë strategjish të balancuara), dhe fitimi (në rastin tonë 6) arrihet me këtë palë strategjish. quhet "pika e shalës së matricës". Një shenjë e pranisë së një pike shale dhe një çifti të ekuilibruar strategjish është barazia e çmimeve më të ulëta dhe të larta të lojës; vlera totale quhet çmimi i lojës. Ne do ta shënojmë atë

Strategjitë (në këtë rast) me të cilat arrihet ky fitim quhen strategji të pastra optimale dhe tërësia e tyre quhet zgjidhje e lojës. Në këtë rast, ata thonë për vetë lojën se ajo zgjidhet në strategji të pastra. Të dy palëve A dhe B mund t'u jepen strategjitë e tyre optimale, në të cilat pozicioni i tyre është më i miri i mundshëm. Dhe nëse lojtari A fiton 6, dhe lojtari B humbet, mirë, këto janë kushtet e lojës: ato janë të dobishme për A dhe të pafavorshme për B.

Lexuesi mund të ketë një pyetje: pse strategjitë optimale quhen "të pastra"? Duke parë pak përpara, ne do t'i përgjigjemi kësaj pyetjeje: ka strategji "të përziera", të cilat konsistojnë në faktin se lojtari përdor jo vetëm një strategji, por disa, duke i ndërthurur ato në mënyrë të rastësishme. Pra, nëse lejojmë strategji të përziera përveç atyre të pastra, çdo lojë e fundme ka një zgjidhje - një pikë ekuilibri. Por kjo mbetet ende për t'u diskutuar.

Prania e një pike shale në një lojë është larg të qenit një rregull; përkundrazi, është një përjashtim. Shumica e lojërave nuk kanë një pikë shale. Sidoqoftë, ekziston një lloj loje që ka gjithmonë një pikë shale dhe, për rrjedhojë, zgjidhet në strategji të pastra. Këto janë të ashtuquajturat "lojëra me informacion të plotë". Një lojë me informacion të plotë është një lojë në të cilën çdo lojtar, me çdo lëvizje personale, njeh të gjithë sfondin e zhvillimit të saj, d.m.th., rezultatet e të gjitha lëvizjeve të mëparshme, si personale ashtu edhe të rastësishme. Shembuj të lojërave me informacion të plotë përfshijnë: damë, shah, tik-tac-toe, etj.

Në teorinë e lojës është vërtetuar se çdo lojë me informacion të plotë ka një pikë shale, dhe për këtë arsye zgjidhet në strategji të pastra. Në çdo lojë me informacion të plotë, ka një palë strategjish optimale që japin një fitim të qëndrueshëm të barabartë me koston e lojës dhe. Nëse një lojë e tillë përbëhet vetëm nga lëvizje personale, atëherë kur secili lojtar përdor strategjinë e tij optimale, ajo duhet të përfundojë në një mënyrë shumë të caktuar - me një fitore të barabartë me koston e lojës. Kjo do të thotë që nëse dihet zgjidhja e lojës, vetë loja humbet kuptimin e saj!

Le të marrim një shembull elementar të një loje me informacion të plotë: dy lojtarë vendosin në mënyrë alternative nikelet në një tryezë të rrumbullakët, duke zgjedhur rastësisht pozicionin e qendrës së monedhës (mbivendosje e ndërsjellë e monedhave nuk lejohet). Ai që fut nikelin e fundit fiton (kur nuk ka vend për të tjerët). Është e lehtë të shihet se rezultati i kësaj loje është, në thelb, i paracaktuar. Ekziston një strategji e caktuar që siguron që lojtari që vendos i pari monedhën të fitojë.

Domethënë, ai duhet së pari të vendosë një nikel në qendër të tabelës, dhe më pas t'i përgjigjet lëvizjes së secilit kundërshtar me një lëvizje simetrike. Natyrisht, pavarësisht se si sillet armiku, ai nuk mund të shmangë humbjen. Situata është saktësisht e njëjtë me shahun dhe lojërat në përgjithësi me informacion të plotë: secila prej tyre, e shkruar në formë matrice, ka një pikë shale, që do të thotë se zgjidhja është në strategji të pastra, dhe për këtë arsye ka kuptim vetëm për aq kohë sa kjo zgjidhje. nuk gjendet. Le të themi se një lojë shahu ose përfundon gjithmonë me fitoren e Bardhëve, ose gjithmonë me fitoren e Zezakëve, ose gjithmonë me një barazim, por ne ende nuk e dimë se çfarë saktësisht (për fat të mirë për adhuruesit e shahut). Le të shtojmë gjithashtu: nuk ka gjasa ta dimë në të ardhmen e parashikueshme, sepse numri i strategjive është aq i madh sa është jashtëzakonisht e vështirë (nëse jo e pamundur) ta çosh lojën në një formë matrice dhe të gjesh një pikë shalë në të.

Tani le të pyesim veten se çfarë të bëjmë nëse loja nuk ka një pikë shale: Epo, nëse secili lojtar detyrohet të zgjedhë një strategji të vetme të pastër, atëherë nuk ka asgjë për të bërë: ne duhet të udhëhiqemi nga parimi minimal. Është një çështje tjetër nëse mund të "përzieni" strategjitë tuaja, t'i alternoni ato në mënyrë të rastësishme me disa probabilitete. Përdorimi i strategjive të përziera mendohet në këtë mënyrë: loja përsëritet shumë herë; para çdo loje të lojës, kur lojtarit i jepet një lëvizje personale, ai "ia beson" rastësisë zgjedhjen e tij, "hedh short" dhe merr strategjinë që doli (ne tashmë dimë se si ta organizojmë shortin nga kapitulli i mëparshëm ).

Strategjitë e përziera në teorinë e lojës janë një model i taktikave të ndryshueshme, fleksibël kur asnjë nga lojtarët nuk e di se si do të sillet kundërshtari në një lojë të caktuar. Kjo taktikë (edhe pse zakonisht pa ndonjë justifikim matematikor) përdoret shpesh në lojërat me letra. Le të theksojmë në të njëjtën kohë se mënyra më e mirë për të fshehur sjelljen tuaj nga armiku është t'i jepni një karakter të rastësishëm dhe, për rrjedhojë, të mos dini paraprakisht se çfarë do të bëni.

Pra, le të flasim për strategji të përziera. Ne do të shënojmë strategjitë e përziera të lojtarëve A dhe B, përkatësisht, ku (duke formuar një total prej një) - probabiliteti i lojtarit A duke përdorur strategji - probabiliteti i lojtarit B duke përdorur strategji

Në rastin e veçantë kur të gjitha probabilitetet përveç njërës janë të barabarta me zero dhe kjo është e barabartë me një, strategjia e përzier kthehet në një të pastër.

Ekziston një teoremë themelore e teorisë së lojës: çdo lojë e fundme me dy persona me shumën zero ka të paktën një zgjidhje - një palë strategjish optimale, përgjithësisht të përziera, dhe një çmim përkatës.

Një palë strategjish optimale që formojnë një zgjidhje për një lojë kanë këtë vetinë: nëse njëri nga lojtarët i përmbahet strategjisë së tij optimale, atëherë nuk mund të jetë fitimprurëse që tjetri të devijojë nga e tija. Kjo palë strategjish formon një pozicion të caktuar ekuilibri në lojë: njëri lojtar dëshiron ta kthejë fitimin në maksimum, tjetri në minimum, secili tërhiqet në drejtimin e tij dhe, me sjellje të arsyeshme të të dyjave, ekuilibër dhe fitim të qëndrueshëm. v janë vendosur. Nëse atëherë loja është e dobishme për ne, nëse - për armikun; kur loja është "e drejtë", po aq e dobishme për të dy pjesëmarrësit.

Le të shqyrtojmë një shembull të një loje pa një pikë shale dhe të japim (pa prova) zgjidhjen e saj. Loja është si më poshtë: dy lojtarë A dhe B njëkohësisht dhe pa thënë asnjë fjalë tregojnë një, dy ose tre gishta. Numri i përgjithshëm i gishtërinjve vendos për fitimet: nëse është çift, A fiton dhe merr nga B një shumë të barabartë me këtë numër; nëse është tek, atëherë, përkundrazi, A i paguan B një shumë të barabartë me këtë numër. Çfarë duhet të bëjnë lojtarët?

Le të krijojmë një matricë loje. Në një lojë, çdo lojtar ka tre strategji: tregoni një, dy ose tre gishta. Matrica 3x3 është dhënë në Tabelën 26.5; kolona shtesë djathtas tregon minimumin e rreshtit dhe rreshti shtesë i poshtëm tregon maksimumin e kolonës.

Çmimi më i ulët i lojës korrespondon me strategjinë. Kjo do të thotë se me sjellje të arsyeshme, të kujdesshme, garantojmë se nuk do të humbasim më shumë se 3. Ngushëllim i vogël, por gjithsesi më i mirë se, të themi, një fitore prej 5, që gjendet në disa qeliza të matricës. Është keq për ne, lojtari L... Por le të ngushëllojmë veten: pozicioni i armikut duket se është edhe më i keq: çmimi më i ulët i lojës është. sjellje të arsyeshme ai do të na japë të paktën 4.