Lojëra antagoniste me strategji të vazhdueshme. Zgjidhja e lojërave antagoniste me matricë Zgjidhja e lojërave antagoniste në internet

Quhet një lojë me shumë zero me dy persona, në të cilën secili prej tyre ka një grup të kufizuar strategjish. Rregullat e lojës së matricës përcaktohen nga matrica e fitimit, elementët e së cilës janë fitimet e lojtarit të parë, të cilat janë edhe humbjet e lojtarit të dytë.

Lojë matrice është një lojë antagoniste. Lojtari i parë merr shpërblimin maksimal të garantuar (që nuk varet nga sjellja e lojtarit të dytë) të barabartë me çmimin e lojës, në mënyrë të ngjashme, lojtari i dytë arrin humbjen minimale të garantuar.

Nën strategjisë kuptohet si një grup rregullash (parimesh) që përcaktojnë zgjedhjen e një varianti veprimesh për çdo lëvizje personale të një lojtari, në varësi të situatës aktuale.

Tani për gjithçka në rregull dhe në detaje.

Matrica e fitimit, strategjitë e pastra, çmimi i lojës

AT lojë me matricë përcaktohen rregullat e saj matrica e fitimit .

Konsideroni një lojë në të cilën ka dy pjesëmarrës: lojtari i parë dhe lojtari i dytë. Le të ketë lojtari i parë m strategji të pastra, dhe në dispozicion të lojtarit të dytë - n strategji të pastra. Duke qenë se po konsiderohet një lojë, është e natyrshme që në këtë lojë të ketë fitore dhe humbje.

AT matrica e pagesave Elementet janë numra që shprehin fitimet dhe humbjet e lojtarëve. Fitimet dhe humbjet mund të shprehen në pikë, para ose njësi të tjera.

Le të krijojmë një matricë fitimi:

Nëse lojtari i parë zgjedh i-të strategjisë së pastër, dhe lojtari i dytë j-të strategji e pastër, atëherë fitimi i lojtarit të parë është aij njësi, dhe humbja e lojtarit të dytë është gjithashtu aij njësi.

Sepse aij + (- a ij ) = 0, atëherë loja e përshkruar është një lojë matrice me shumë zero.

Shembulli më i thjeshtë i një loje matrice është hedhja e një monedhe. Rregullat e lojës janë si më poshtë. Lojtarët e parë dhe të dytë hedhin një monedhë dhe rezultati është koka ose bishti. Nëse kokat dhe kokat ose bishtat ose bishtat rrotullohen në të njëjtën kohë, atëherë lojtari i parë do të fitojë një njësi, dhe në raste të tjera ai do të humbasë një njësi (lojtari i dytë do të fitojë një njësi). Të njëjtat dy strategji janë në dispozicion të lojtarit të dytë. Matrica përkatëse e fitimit do të ishte:

Detyra e teorisë së lojës është të përcaktojë zgjedhjen e strategjisë së lojtarit të parë, e cila do t'i garantonte atij fitimin mesatar maksimal, si dhe zgjedhjen e strategjisë së lojtarit të dytë, e cila do t'i garantonte atij humbjen maksimale mesatare.

Si zgjidhet një strategji në një lojë matrice?

Le të shohim përsëri matricën e fitimit:

Së pari, ne përcaktojmë shpërblimin e lojtarit të parë nëse ai përdor i th strategji e pastër. Nëse lojtari i parë përdor i-të strategjisë së pastër, atëherë është logjike të supozohet se lojtari i dytë do të përdorë një strategji të tillë të pastër, për shkak të së cilës fitimi i lojtarit të parë do të ishte minimal. Nga ana tjetër, lojtari i parë do të përdorë një strategji kaq të pastër që do t'i siguronte atij përfitimin maksimal. Bazuar në këto kushte, shpërblimi i lojtarit të parë, të cilin e shënojmë si v1 , quhet maksimumi fiton ose çmim më i ulët i lojës .

për këto vlera, lojtari i parë duhet të veprojë si më poshtë. Nga çdo rresht, shkruani vlerën e elementit minimal dhe zgjidhni maksimumin prej tyre. Kështu, fitimi i lojtarit të parë do të jetë maksimumi i minimumit. Prandaj emri - maximin win. Numri i linjës së këtij elementi do të jetë numri i strategjisë së pastër të zgjedhur nga lojtari i parë.

Tani le të përcaktojmë humbjen e lojtarit të dytë nëse ai përdor j-të strategjisë. Në këtë rast, lojtari i parë përdor strategjinë e tij të pastër, në të cilën humbja e lojtarit të dytë do të ishte maksimale. Lojtari i dytë duhet të zgjedhë një strategji kaq të pastër në të cilën humbja e tij do të ishte minimale. Humbja e lojtarit të dytë, të cilin e shënojmë si v2 , quhet humbje minimale ose çmimi më i lartë i lojës .

zgjidhjen e problemeve mbi çmimin e lojës dhe përcaktimin e strategjisë për të përcaktuar këto vlera për lojtarin e dytë, veproni si më poshtë. Nga çdo kolonë, shkruani vlerën e elementit maksimal dhe zgjidhni minimumin prej tyre. Kështu, humbja e lojtarit të dytë do të jetë minimumi i maksimumit. Prandaj emri - fitimi minimal. Numri i kolonës së këtij elementi do të jetë numri i strategjisë së pastër të zgjedhur nga lojtari i dytë. Nëse lojtari i dytë përdor "minimaks", atëherë pavarësisht nga zgjedhja e strategjisë nga lojtari i parë, ai do të humbasë më së shumti. v2 njësi.

Shembulli 1

.

Më i madhi nga elementët më të vegjël të rreshtave është 2, ky është çmimi më i ulët i lojës, rreshti i parë korrespondon me të, prandaj, strategjia maksimale e lojtarit të parë është e para. Më i vogli nga elementët më të mëdhenj të kolonave është 5, ky është çmimi i sipërm i lojës, kolona e dytë korrespondon me të, prandaj, strategjia minimale e lojtarit të dytë është e dyta.

Tani që kemi mësuar se si të gjejmë çmimin më të ulët dhe të lartë të lojës, strategjitë maksimale dhe minimale, është koha të mësojmë se si t'i përcaktojmë këto koncepte zyrtarisht.

Pra, fitimi i garantuar i lojtarit të parë është:

Lojtari i parë duhet të zgjedhë një strategji të pastër që do t'i sigurojë atij maksimumin e fitimeve minimale. Ky fitim (maksimumi) shënohet si më poshtë:

.

Lojtari i parë përdor strategjinë e tij të pastër në mënyrë që humbja e lojtarit të dytë të jetë maksimale. Kjo humbje përcaktohet si më poshtë:

Lojtari i dytë duhet të zgjedhë strategjinë e tij të pastër në mënyrë që humbja e tij të jetë minimale. Kjo humbje (maksimumi) shënohet si më poshtë:

.

Një shembull tjetër nga e njëjta seri.

Shembulli 2 Jepet një lojë matrice me një matricë fitimi

.

Përcaktoni strategjinë maksimale të lojtarit të parë, strategjinë minimale të lojtarit të dytë, çmimin më të ulët dhe të sipërm të lojës.

Zgjidhje. Në të djathtë të matricës së fitimit, ne shkruajmë elementët më të vegjël në rreshtat e saj dhe shënojmë maksimumin e tyre, dhe nga fundi i matricës - elementët më të mëdhenj në kolona dhe zgjedhim minimumin e tyre:

Më i madhi nga elementët më të vegjël të rreshtave është 3, ky është çmimi më i ulët i lojës, rreshti i dytë korrespondon me të, prandaj, strategjia maksimale e lojtarit të parë është e dyta. Më i vogli nga elementët më të mëdhenj të kolonave është 5, ky është çmimi i sipërm i lojës, kolona e parë korrespondon me të, prandaj, strategjia minimale e lojtarit të dytë është e para.

Pika e shalës në lojërat e matricës

Nëse çmimi i sipërm dhe i poshtëm i lojës janë të njëjta, atëherë loja e matricës konsiderohet të ketë një pikë shale. E kundërta është gjithashtu e vërtetë: nëse një lojë me matricë ka një pikë shale, atëherë çmimet e sipërme dhe të poshtme të lojës së matricës janë të njëjta. Elementi përkatës është më i vogli në rresht dhe më i madhi në kolonë dhe është i barabartë me çmimin e lojës.

Kështu, nëse , atëherë është strategjia e pastër optimale e lojtarit të parë dhe është strategjia e pastër optimale e lojtarit të dytë. Kjo do të thotë, çmimet e barabarta më të ulëta dhe të larta të lojës arrihen në të njëjtën palë strategjish.

Në këtë rast loja e matricës ka një zgjidhje në strategji të pastra .

Shembulli 3 Jepet një lojë matrice me një matricë fitimi

.

Zgjidhje. Në të djathtë të matricës së fitimit, ne shkruajmë elementët më të vegjël në rreshtat e saj dhe shënojmë maksimumin e tyre, dhe nga fundi i matricës - elementët më të mëdhenj në kolona dhe zgjedhim minimumin e tyre:

Çmimi më i ulët i lojës është i njëjtë me çmimin e sipërm të lojës. Kështu, çmimi i lojës është 5. Kjo është . Çmimi i lojës është i barabartë me vlerën e pikës së shalës. Strategjia maksimale e lojtarit të parë është strategjia e dytë e pastër dhe strategjia minimale e lojtarit të dytë është strategjia e tretë e pastër. Kjo lojë matrice ka një zgjidhje në strategji të pastra.

Zgjidheni vetë problemin e lojës së matricës dhe më pas shikoni zgjidhjen

Shembulli 4 Jepet një lojë matrice me një matricë fitimi

.

Gjeni çmimin më të ulët dhe të lartë të lojës. A ka kjo lojë matrice një pikë shale?

Lojëra matricë me strategji të përzier optimale

Në shumicën e rasteve, loja e matricës nuk ka një pikë shale, kështu që loja përkatëse e matricës nuk ka zgjidhje të pastra strategjike.

Por ka një zgjidhje në strategji të përziera optimale. Për t'i gjetur ato, duhet të supozohet se loja përsëritet aq herë sa, në bazë të përvojës, mund të merret me mend se cila strategji është e preferueshme. Prandaj, vendimi shoqërohet me konceptin e probabilitetit dhe mesatares (pritshmërisë). Në zgjidhjen përfundimtare, ekziston edhe një analog i pikës së shalës (d.m.th., barazia e çmimeve të ulëta dhe të sipërme të lojës), dhe një analog i strategjive që korrespondojnë me to.

Pra, në mënyrë që lojtari i parë të marrë fitimin mesatar maksimal dhe lojtari i dytë të ketë humbjen mesatare minimale, duhet të përdoren strategji të pastra me një probabilitet të caktuar.

Nëse lojtari i parë përdor strategji të pastra me probabilitete , pastaj vektori quhet strategjia e përzier e lojtarit të parë. Me fjalë të tjera, është një "përzierje" e strategjive të pastra. Shuma e këtyre probabiliteteve është e barabartë me një:

.

Nëse lojtari i dytë përdor strategji të pastra me probabilitete , pastaj vektori quhet strategjia e përzier e lojtarit të dytë. Shuma e këtyre probabiliteteve është e barabartë me një:

.

Nëse lojtari i parë përdor një strategji të përzier fq, dhe lojtari i dytë - një strategji e përzier q, atëherë ka kuptim vlera e pritur lojtari i parë fiton (lojtari i dytë humbet). Për ta gjetur atë, duhet të shumëzoni vektorin e strategjisë së përzier të lojtarit të parë (i cili do të jetë një matricë me një rresht), matricën e fitimit dhe vektorin e strategjisë së përzier të lojtarit të dytë (i cili do të jetë një matricë me një kolonë):

.

Shembulli 5 Jepet një lojë matrice me një matricë fitimi

.

Përcaktoni pritshmërinë matematikore të fitimit të lojtarit të parë (humbja e lojtarit të dytë), nëse strategjia e përzier e lojtarit të parë është , dhe strategjia e përzier e lojtarit të dytë është .

Zgjidhje. Sipas formulës për pritshmërinë matematikore të fitimit të lojtarit të parë (humbja e lojtarit të dytë), është e barabartë me produktin e vektorit të strategjisë së përzier të lojtarit të parë, matricës së fitimit dhe vektorit të strategjisë së përzier të lojtarit të dytë:

Lojtari i parë quhet një strategji e tillë e përzier që do t'i siguronte atij fitimin mesatar maksimal nëse loja përsëritet një numër të mjaftueshëm herë.

Strategji e përzier optimale Lojtari i dytë quhet një strategji e tillë e përzier që do t'i siguronte atij humbjen minimale mesatare nëse loja përsëritet një numër të mjaftueshëm herë.

Në analogji me shënimin e maksimumit dhe maksimumit në rastet e strategjive të pastra, strategjitë e përziera optimale shënohen si më poshtë (dhe janë të lidhura me pritshmërinë matematikore, domethënë mesataren e fitimit të lojtarit të parë dhe humbjes së lojtarit të dytë):

,

.

Në këtë rast, për funksionin E ka një pikë shale , që do të thotë barazi.

Për të gjetur strategjitë e përziera optimale dhe pikën e shalës, d.m.th. zgjidh lojën e matricës në strategji të përziera , ju duhet ta reduktoni lojën e matricës në një problem programimi linear, domethënë në një problem optimizimi, dhe të zgjidhni problemin përkatës të programimit linear.

Reduktimi i një loje matrice në një problem programimi linear

Për të zgjidhur një lojë matrice në strategji të përziera, duhet të hartoni një vijë të drejtë problemi i programimit linear dhe detyrën e tij të dyfishtë. Në problemin e dyfishtë, matrica e shtuar, e cila ruan koeficientët e variablave në sistemin e kufizimit, termat konstante dhe koeficientët e ndryshoreve në funksionin e qëllimit, është transpozuar. Në këtë rast, minimumi i funksionit të qëllimit të problemit origjinal shoqërohet me maksimumin në problemin e dyfishtë.

Funksioni i qëllimit në problemin e programimit linear të drejtpërdrejtë:

.

Sistemi i kufizimeve në problemin e drejtpërdrejtë të programimit linear:

Funksioni i qëllimit në problemin e dyfishtë:

.

Sistemi i kufizimeve në problemin e dyfishtë:

Tregoni planin optimal të problemit të programimit direkt linear

,

dhe plani optimal i problemit të dyfishtë shënohet me

Format lineare për dizajnet optimale përkatëse do të shënohen me dhe ,

dhe duhet t'i gjeni si shuma e koordinatave përkatëse të planeve optimale.

Në përputhje me përcaktimet e seksionit të mëparshëm dhe koordinatat e planeve optimale, strategjitë e mëposhtme të përziera të lojtarëve të parë dhe të dytë janë të vlefshme:

.

Matematikanët e kanë vërtetuar këtë çmimi i lojës shprehet me forma lineare të planeve optimale si më poshtë:

,

pra është reciproke e shumave të koordinatave të planeve optimale.

Ne, praktikuesit, mund ta përdorim këtë formulë vetëm për të zgjidhur lojërat e matricës në strategji të përziera. si formulat për gjetjen e strategjive optimale të përziera përkatësisht lojtarët e parë dhe të dytë:

në të cilat faktorët e dytë janë vektorë. Strategjitë e përziera optimale janë gjithashtu vektorë, siç e kemi përcaktuar tashmë në paragrafin e mëparshëm. Prandaj, duke shumëzuar numrin (çmimin e lojës) me vektorin (me koordinatat e planeve optimale), marrim edhe një vektor.

Shembulli 6 Jepet një lojë matrice me një matricë fitimi

.

Gjeni çmimin e një loje V dhe strategji të përziera optimale dhe .

Zgjidhje. Ne hartojmë problemin e programimit linear që korrespondon me këtë lojë matrice:

Ne marrim zgjidhjen e problemit të drejtpërdrejtë:

.

Formën lineare të planeve optimale e gjejmë si shumë e koordinatave të gjetura.

Dërgoni punën tuaj të mirë në bazën e njohurive është e thjeshtë. Përdorni formularin e mëposhtëm

Studentët, studentët e diplomuar, shkencëtarët e rinj që përdorin bazën e njohurive në studimet dhe punën e tyre do t'ju jenë shumë mirënjohës.

Prezantimi

1. Pjesa teorike

1.3 Porosia e lojës 2v2

1.4 Metoda algjebrike

1.5 Metoda grafike

1.6 Lojëra 2xn ose mx2

1.7 Zgjidhja e lojërave me metodën e matricës

2. Pjesa praktike

2.2 lojëra 2xn dhe mx2

2.3 Metoda e matricës

2.4 Metoda kafe

Analiza e rezultateve

Prezantimi

Loja antagoniste është një lojë me shumë zero. Një lojë antagoniste është një lojë jo bashkëpunuese në të cilën marrin pjesë dy lojtarë, fitimet e të cilëve janë të kundërta.

Formalisht, një lojë antagoniste mund të përfaqësohet nga një treshe , ku X dhe Y janë grupet e strategjive të lojtarëve të parë dhe të dytë, përkatësisht, F është funksioni fitues i lojtarit të parë, i cili lidh çdo palë strategjish (x, y), ku është një numër real që korrespondon me dobinë i lojtarit të parë në realizimin e kësaj situate.

Meqenëse interesat e lojtarëve janë të kundërta, funksioni F përfaqëson njëkohësisht humbjen e lojtarit të dytë.

Historikisht, lojërat antagoniste janë klasa e parë e modeleve matematikore të teorisë së lojës, të cilat janë përdorur për të përshkruar lojërat e fatit. Besohet se falë kësaj lënde kërkimi, teoria e lojës mori emrin e saj. Aktualisht, lojërat antagoniste konsiderohen si pjesë e një klase më të gjerë lojërash jobashkëpunuese.

1. Pjesa teorike

1.1 Përkufizimet dhe dispozitat bazë të lojës

Loja karakterizohet nga një sistem rregullash që përcaktojnë numrin e pjesëmarrësve në lojë, të tyre veprimet e mundshme dhe shpërndarja e fitimeve në varësi të sjelljes dhe rezultateve të tyre. Një lojtar konsiderohet të jetë një pjesëmarrës ose një grup pjesëmarrësish në lojë që kanë disa interesa të përbashkëta për ta që nuk përkojnë me interesat e grupeve të tjera. Prandaj, jo çdo pjesëmarrës konsiderohet lojtar.

Rregullat ose kushtet e lojës përcaktojnë sjelljet, zgjedhjet dhe lëvizjet e mundshme për lojtarët në çdo fazë të zhvillimit të lojës. Të bësh një zgjedhje për lojtarin do të thotë të ndalesh në një nga mundësitë e tij të sjelljes. Lojtari më pas e bën atë zgjedhje me lëvizje. Të bësh një lëvizje do të thotë në një fazë të caktuar të lojës të bësh të gjithë ose një pjesë të zgjedhjes menjëherë, në varësi të mundësive të parashikuara nga rregullat e lojës. Çdo lojtar në një fazë të caktuar të lojës bën një lëvizje sipas zgjedhjes së bërë. Lojtari tjetër, duke ditur ose duke mos ditur për zgjedhjen e lojtarit të parë, gjithashtu bën një lëvizje. Secili nga lojtarët përpiqet të marrë parasysh informacionin për zhvillimin e kaluar të lojës, nëse një mundësi e tillë lejohet nga rregullat e lojës.

Një grup rregullash që i tregojnë pa mëdyshje lojtarit se çfarë zgjedhje duhet të bëjë në çdo lëvizje, në varësi të situatës që është krijuar si rezultat i lojës, quhet strategjia e lojtarit. Strategjia në teorinë e lojës nënkupton një plan të caktuar të plotë veprimi për lojtarin, duke treguar se si duhet të veprojë në të gjitha rastet e mundshme të zhvillimit të lojës. Strategjia nënkupton tërësinë e të gjitha indikacioneve për çdo gjendje informacioni në dispozicion të lojtarit në çdo fazë të zhvillimit të lojës. Kjo tashmë tregon se strategjitë mund të jenë të mira dhe të këqija, të suksesshme dhe të pasuksesshme, etj.

Do të ketë një lojë me shumën zero kur shuma e pagesave të të gjithë lojtarëve në secilën nga lojërat e saj është zero, d.m.th., në një lojë me shumën zero, kapitali total i të gjithë lojtarëve nuk ndryshon, por rishpërndahet midis lojtarëve. në varësi të rezultateve që rezultojnë. Kështu, shumë situata ekonomike dhe ushtarake mund të shihen si lojëra me shumën zero.

Në veçanti, një lojë me shumë zero me dy lojtarë quhet antagoniste, pasi qëllimet e lojtarëve në të janë drejtpërdrejt të kundërta: fitimi i një lojtari ndodh vetëm në kurriz të humbjes së tjetrit.

1.1.1 Përkufizimi, shembuj dhe zgjidhje të lojërave me matricë në strategji të pastra

Loja me matricë me shumë zero me dy lojtarë mund të shihet si loja e mëposhtme abstrakte me dy lojtarë.

Lojtari i parë ka m strategji i =1, 2,…, m, i dyti ka n strategji j = 1, 2,…, n. Secilit çift strategjish (i, j) i caktohet një numër a ij , i cili shpreh shpërblimi i lojtarit të parë për shkak të lojtarit të dytë nëse lojtari i parë përdor të tijën strategjia e i-të, dhe e dyta - strategjia e saj j-të.

Secili nga lojtarët bën një lëvizje: lojtari i parë zgjedh strategjinë e tij të i-të (i = 1, 2, ..., m), i dyti -- j-ja jote strategjia (j = 1, 2,…, n), pas së cilës lojtari i parë merr një shpërblim ij në kurriz të lojtarit të dytë (nëse një ij< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

Çdo strategji e lojtarit i = 1, 2,…, t; j = 1, 2,…, n shpesh quhet një strategji e pastër.

Një lojë me matricë me shumë zero me dy lojtarë do të referohet thjesht si një lojë matrice. Natyrisht, loja e matricës i përket lojërave antagoniste. Nga përkufizimi i tij rrjedh se për të përcaktuar një lojë matrice, mjafton të specifikoni një matricë A = (a ij) të rendit të m të fitimeve të lojtarit të parë.

Duke marrë parasysh matricën e fitimit

atëherë ekzekutimi i çdo loje të lojës së matricës me matricën A reduktohet në zgjedhjen e lojtarit të parë rreshti i-të, dhe nga lojtari i dytë në kolonën j dhe lojtari i parë (në kurriz të të dytit) merr shpërblimin e vendosur në matricën A në kryqëzimin e rreshtit të i-të dhe kolonës j-të.

Për të formalizuar një situatë reale konflikti në formën e një loje matrice, është e nevojshme të identifikohen dhe rinumërohen strategjitë e pastra të secilit lojtar dhe të përpilohet një matricë fitimi.

Hapi tjetër është përcaktimi i strategjive dhe përfitimeve optimale të lojtarëve.

Gjëja kryesore në studimin e lojërave është koncepti i strategjive optimale për lojtarët. Ky koncept në mënyrë intuitive ka kuptimin e mëposhtëm: strategjia e një lojtari është optimale nëse aplikimi i kësaj strategjie i siguron atij fitimin më të madh të garantuar për të gjitha strategjitë e mundshme të lojtarit tjetër. Bazuar në këto pozicione, lojtari i parë shqyrton matricën A të pagesave të tij sipas formulës (1.1) si më poshtë: për secilën vlerë i (i = 1, 2, ..., m), vlera minimale e pagesës përcaktohet në varësi të mbi strategjitë e përdorura nga lojtari i dytë

(i = 1, 2,..., m) (1.2)

d.m.th., përcaktohet fitimi minimal për lojtarin e parë, me kusht që ai të zbatojë strategjinë e tij të i-të të pastër, atëherë nga këto fitime minimale gjendet një strategji e tillë i=i 0 për të cilën kjo fitim minimal do të jetë maksimal, d.m.th.

Përkufizimi. Numri b i përcaktuar nga formula (1.3) quhet kosto neto më e ulët e lojës dhe tregon se çfarë fitimi minimal mund t'i garantojë vetes lojtari i parë duke zbatuar strategjitë e tij të pastra për të gjitha veprimet e mundshme të lojtarit të dytë.

Lojtari i dytë, me sjelljen e tij optimale, duhet të përpiqet, nëse është e mundur, të minimizojë fitimin e lojtarit të parë në kurriz të strategjive të tij. Prandaj, për lojtarin e dytë, ne gjejmë

d.m.th., përcaktohet fitimi maksimal i lojtarit të parë, me kusht që lojtari i dytë të zbatojë të tijën j-të pastër strategjinë, atëherë lojtari i dytë gjen strategjinë e tij j = j 1 për të cilën lojtari i parë merr shpërblimin minimal, d.m.th., gjen

Përkufizimi. Numri β i përcaktuar nga formula (1.5) quhet kosto e sipërme neto e lojës dhe tregon se çfarë fitimi maksimal mund t'i garantojë vetes lojtari i parë për shkak të strategjive të tij. Me fjalë të tjera, duke zbatuar strategjitë e tij të pastra, lojtari i parë mund të sigurojë një fitim prej të paktën b, dhe lojtari i dytë, duke zbatuar strategjitë e tij të pastra, mund të parandalojë lojtarin e parë që të fitojë më shumë se c.

Përkufizimi. Nëse në një lojë me matricën A, çmimet neto të poshtme dhe të sipërme të lojës përputhen, d.m.th., b = c, atëherë kjo lojë thuhet se ka një pikë shale në strategjitë e pastra dhe një çmim neto të lojës:

n = b = c (1.6)

Një pikë shale është një palë strategjish të pastra () të lojtarëve të parë dhe të dytë, respektivisht, sipas të cilave arrihet barazia

Koncepti i një pike shale ka kuptimin e mëposhtëm: nëse njëri nga lojtarët i përmbahet strategjisë që korrespondon me pikën e shalës, atëherë lojtari tjetër nuk mund të bëjë më mirë sesa t'i përmbahet strategjisë që korrespondon me pikën e shalës. Duke pasur parasysh se sjellja më e mirë e lojtarit nuk duhet të çojë në një ulje të fitimit të tij, dhe sjellja më e keqe mund të çojë në një ulje të fitimit të tij, këto kushte mund të shkruhen matematikisht në formën e marrëdhënieve të mëposhtme:

ku i, j janë çdo strategji e pastër e lojtarëve të parë dhe të dytë, përkatësisht; (i 0, j 0) -- strategji që formojnë një pikë shale. Më poshtë do të tregojmë se përkufizimi i një pike shale është ekuivalent me kushtet (1.8).

Kështu, bazuar në (1.8), elementi i shalës është minimumi në rreshtin i 0-të dhe maksimumi në kolonën j 0-të në matricën A. Gjetja e pikës së shalës së matricës A është e lehtë: në matricë A, radhazi në çdo rresht, gjeni elementin minimal dhe kontrolloni nëse ky element është maksimumi në kolonën e tij. Nëse është i tillë, atëherë është një element shalë dhe çifti i strategjive që korrespondojnë me të formon një pikë shale. Një palë strategjish të pastra (i 0 , j 0) të lojtarëve të parë dhe të dytë, duke formuar një pikë shale dhe një element shale, quhet një zgjidhje për lojën.

Strategjitë e pastra i 0 dhe j 0 që formojnë një pikë shale quhen përkatësisht strategji të pastra optimale të lojtarëve të parë dhe të dytë.

Teorema 1. Le të jetë f (x, y) një funksion real i dy ndryshoreve x A dhe y B dhe ekziston

atëherë b = c.

Dëshmi. Nga përkufizimi i minimumit dhe maksimumit, rezulton se

Meqenëse x është arbitrare në anën e majtë të (1.11), atëherë

Në anën e djathtë të pabarazisë (1.12), y është arbitrar, pra

Q.E.D.

Në veçanti, matrica () është një rast i veçantë i funksionit f (x, y), d.m.th. nëse vendosim x = i, y = j, = f (x, y), atëherë nga teorema 1 marrim se më e ulëta Çmimi neto nuk e kalon vlerën e sipërme neto të lojës në lojën e matricës.

Përkufizimi. Le të jetë f (x, y) një funksion real i dy ndryshoreve x A dhe y B. Një pikë (x 0, y 0) quhet pikë shale për funksionin f (x, y) nëse vlejnë pabarazitë e mëposhtme:

f (x, y 0) f (x 0, y 0) f (x 0, y) (1.14)

për çdo x A dhe y B.

1.2 Strategjitë e përziera optimale dhe vetitë e tyre

Studimi i një loje matrice fillon me gjetjen e pikës së saj të shalës në strategji të pastra. Nëse një lojë matrice ka një pikë shalë në strategji të pastra, atëherë gjetja e kësaj pike përfundon studimin e lojës. Nëse në lojën e matricës nuk ka pikë shalë në strategjitë e pastra, atëherë mund të gjejmë çmimet e pastra të ulëta dhe të sipërme të kësaj loje, të cilat tregojnë se lojtari i parë nuk duhet të shpresojë për një fitim më të madh se çmimi i sipërm i lojës, dhe mund të jetë i sigurt për të marrë një fitim jo më pak se çmimi më i ulët i lojës. Rekomandime të tilla në lidhje me sjelljen e lojtarëve në një lojë matrice pa pikë shale në strategji të pastra nuk mund të kënaqin studiuesit dhe praktikuesit. Një përmirësim në zgjidhjen e lojërave me matricë duhet kërkuar në përdorimin e fshehtësisë së aplikimit të strategjive të pastra dhe mundësinë e përsëritjes së përsëritur të lojërave në formën e partive. Kështu, për shembull, luhen një sërë lojërash shahu, damë, futbolli dhe çdo herë lojtarët zbatojnë strategjitë e tyre në atë mënyrë që kundërshtarët e tyre të mos jenë të vetëdijshëm për përmbajtjen e tyre dhe gjatë rrugës arrijnë përfitime të caktuara mesatarisht nga duke luajtur të gjithë serinë e lojërave. Këto përfitime janë, mesatarisht, më të mëdha se çmimi më i ulët i lojës dhe më pak se çmimi i sipërm i lojës. Sa më e madhe kjo vlerë mesatare, aq strategji më të mirë aplikuar nga lojtari. Prandaj, lindi ideja për të aplikuar strategji të pastra në mënyrë të rastësishme, me një probabilitet të caktuar. Kjo siguron plotësisht fshehtësinë e përdorimit të tyre. Çdo lojtar mund të ndryshojë probabilitetet e zbatimit të strategjive të tij të pastra në atë mënyrë që të maksimizojë fitimin mesatar dhe të marrë strategji optimale gjatë rrugës. Kjo ide çoi në konceptin e strategjisë së përzier.

Përkufizimi. Strategjia e përzier e një lojtari është grupi i plotë i probabiliteteve të zbatimit të strategjive të tij të pastra.

Kështu, nëse lojtari i parë ka m strategji të pastra 1, 2, … i, … m, atëherë strategjia e tij e përzier x është një grup numrash x = (x 1 , x 2 , ..., x i ,…, x t ) të kënaqshme marrëdhëniet

x i 0 (i = 1, 2, ... , m), = 1. (1,15)

Në mënyrë të ngjashme, për lojtarin e dytë, i cili ka n strategji të pastra, strategjia e përzier y është bashkësia e numrave y = (y 1 ,…, y j , … y n) që kënaqin marrëdhëniet

y j 0 (j = 1, 2, ... , n), = 1. (1.16)

Meqenëse çdo herë që një lojtar përdor një strategji të pastër përjashton përdorimin e një tjetri, strategjitë e pastra janë ngjarje të papajtueshme. Përveç kësaj, ato janë të vetmet ngjarje të mundshme.

Është e qartë se një strategji e pastër është një rast i veçantë i një strategjie të përzier. Në të vërtetë, nëse në një strategji të përzier ndonjë i-të neto strategjia zbatohet me probabilitetin një, atëherë nuk zbatohen të gjitha strategjitë e tjera të pastra. Dhe kjo strategji e i-të e pastër është një rast i veçantë i një strategjie të përzier. Për të ruajtur sekretin, secili lojtar zbaton strategjitë e tij, pavarësisht nga zgjedhja e lojtarit tjetër.

Përkufizimi. Shpërblimi mesatar i lojtarit të parë në lojën e matricës me matricën A shprehet si pritshmëri matematikore e fitimeve të tij

E (A, x, y) = (1.20)

Natyrisht, fitimi mesatar i lojtarit të parë është një funksion i dy grupeve të ndryshoreve x dhe y. Lojtari i parë synon të maksimizojë fitimin e tij mesatar E (A, x, y) duke ndryshuar strategjitë e tij të përziera x, dhe lojtari i dytë kërkon të bëjë E (A, x, y) minimale përmes strategjive të tij të përziera, d.m.th. për të zgjidhur lojën, është e nevojshme të gjendet x, y i tillë për të cilin arrihet çmimi më i lartë i lojës.

1.3 Porosit lojë 22

Një lojë matrice e rendit 22 jepet nga matrica e mëposhtme e fitimit për lojtarin e parë:

Zgjidhja e kësaj loje duhet të fillojë me gjetjen e një pike shale në strategjitë e pastra. Për këtë qëllim, gjeni elementin minimal në rreshtin e parë dhe kontrolloni nëse është maksimumi në kolonën e tij. Nëse një element i tillë nuk gjendet, atëherë rreshti i dytë kontrollohet në të njëjtën mënyrë. Nëse një element i tillë gjendet në rreshtin e dytë, atëherë ai është një element shalë.

Me gjetjen e një elementi shale, nëse ka, përfundon procesi i gjetjes së zgjidhjes së tij, pasi në këtë rast gjendet çmimi i lojës - një element shale dhe një pikë shale, pra një palë strategji të pastra për të parën dhe të dytën. lojtarët, që përbëjnë strategji të pastra optimale. Nëse nuk ka pikë shale në strategjitë e pastra, atëherë është e nevojshme të gjendet një pikë shale në strategjitë e përziera, e cila ekziston domosdoshmërisht sipas teoremës kryesore të lojërave të matricës.

Shënoni me x=(x 1 ,x 2), y=(y 1 ,y 2) strategjitë e përziera të lojtarëve të parë dhe të dytë, respektivisht. Kujtoni që x 1 do të thotë probabiliteti që lojtari i parë të përdorë strategjinë e tij të parë, dhe x 2 \u003d 1 - x 1 është probabiliteti i përdorimit të strategjisë së tij të dytë. Në mënyrë të ngjashme për lojtarin e dytë: 1 - probabiliteti i përdorimit të strategjisë së parë, y 2 = 1 - 1 - probabiliteti i përdorimit të strategjisë së dytë.

Sipas konkluzionit të teoremës, për optimalitetin e strategjive të përziera x dhe y është e nevojshme dhe e mjaftueshme që për x 1 , x 2 , y 1 , y 2 jo negative të mbahen marrëdhëniet e mëposhtme:

Tani tregojmë se nëse loja e matricës nuk ka pikë shalë në strategjitë e pastra, atëherë këto pabarazi duhet të kthehen në barazi:

Me të vërtetë. Lëreni që loja të mos ketë pikë shale në strategjitë e pastra, atëherë vlerat optimale të strategjive të përziera plotësojnë pabarazitë

0<<1, 0<< 1,

0< <1, 01. (1.25)

Supozoni se të dyja pabarazitë nga (1.22) janë strikte

atëherë, sipas teoremës, y 1 = y 2 = 0, që bie ndesh me kushtet (1.25).

Mund të vërtetohet në mënyrë të ngjashme se të dyja pabarazitë në (1.23) nuk mund të jenë pabarazi strikte.

Supozoni tani që një nga pabarazitë (1.22) mund të jetë strikte, për shembull, e para

Kjo do të thotë se sipas teoremës y 1 = 0, y 2 =1. Prandaj, nga (1.23) marrim

Nëse të dyja pabarazitë (1.24) janë strikte, atëherë nga teorema x1 = x2 = 0, e cila bie ndesh me (1.25). Por nëse një 12 a 22, atëherë njëra nga pabarazitë (1.27) është e rreptë dhe tjetra është barazi. Për më tepër, barazia do të jetë për elementin më të madh nga një 12 dhe një 22, pra një pabarazi nga (1.27) duhet të jetë strikte. Për shembull një 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

Kështu, tregohet se nëse loja e matricës nuk ka pikë shalë në strategjitë e pastra, atëherë pabarazitë (1.22) kthehen në barazi për strategjitë optimale të lojtarit të parë. Argumente të ngjashme për pabarazitë (1.23) do të çojnë në faktin se në këtë rast pabarazitë (1.23) duhet të jenë barazi.

Pra, nëse një lojë matrice e rendit 22 nuk ka pikë shale, atëherë strategjitë optimale të përziera të lojtarëve dhe çmimi i lojës mund të përcaktohen duke zgjidhur sistemin e ekuacioneve (1.24). Është vërtetuar gjithashtu se nëse në një lojë matrice 2x2 njëri nga lojtarët ka një strategji optimale të pastër, atëherë lojtari tjetër ka gjithashtu një strategji të pastër optimale.

Prandaj, nëse një lojë matrice nuk ka një pikë shale në strategjitë e pastra, atëherë ajo duhet të ketë një zgjidhje në strategjitë e përziera, të cilat përcaktohen nga ekuacionet (1.24). Zgjidhja e sistemit (1.25)

1.4 Metoda algjebrike

Ekzistojnë dy raste për zgjidhjen e problemeve me metodën algjebrike:

1. matrica ka një pikë shale;

2. matrica nuk ka pikë shale.

Në rastin e parë, zgjidhja është një palë strategjish që formojnë pikën e shalës së lojës. Le të shqyrtojmë rastin e dytë. Zgjidhjet këtu duhet të kërkohen në strategji të përziera:

Gjeni strategji dhe Kur lojtari i parë përdor strategjinë e tij optimale, lojtari i dytë, për shembull, mund të zbatojë dy strategji të tilla të pastra

Në të njëjtën kohë, për shkak të pronës, nëse njëri nga lojtarët përdor strategjinë e përzier optimale, dhe tjetri - çdo i pastër, i përfshirë në strategjinë e tij optimale të përzier me një probabilitet jo zero, atëherë pritja matematikore e fitimit gjithmonë mbetet i pandryshuar dhe i barabartë me çmimin e lojës, d.m.th.

Shpërblimi duhet në secilin prej këtyre rasteve të jetë i barabartë me vlerën e lojës V. Në këtë rast, marrëdhëniet e mëposhtme janë të vlefshme:

Një sistem ekuacionesh i ngjashëm me (2.5), (2.6) gjithashtu mund të përbëhet për strategjinë optimale të lojtarit të dytë:

Duke marrë parasysh gjendjen e normalizimit:

Le të zgjidhim ekuacionin (1.37) - (1.41) së bashku në lidhje me të panjohurat, dhe jo të gjitha menjëherë, por tre në të njëjtën kohë: veçmas (1.36), (1.38), (1.40) dhe (1.37), (1.39) , (1.41). Si rezultat i zgjidhjes, marrim:

1.5 Metoda grafike

Një zgjidhje e përafërt e lojës 22 mund të merret mjaft lehtë duke përdorur metodën grafike. Thelbi i tij është si më poshtë:

Figura 1.1 - gjetja e një seksioni të gjatësisë së njësisë

Zgjidhni një seksion të gjatësisë së njësisë në boshtin e abshisës. Fundi i majtë i tij do të përshkruajë strategjinë e parë të lojtarit të parë dhe fundin e djathtë të të dytit. Të gjitha pikat e ndërmjetme korrespondojnë me strategjitë e përziera të lojtarit të parë, dhe gjatësia e segmentit në të djathtë të pikës është e barabartë me probabilitetin e përdorimit të strategjisë së parë, dhe gjatësia e segmentit në të majtë është probabiliteti i përdorimit strategjia e dytë nga lojtari i parë.

Janë kryer dy akse I-I dhe II-II. Në I-I ne do të shtyjmë fitimin kur lojtari i parë përdor strategjinë e parë, në II-II kur ai përdor strategjinë e dytë. Le të, për shembull, lojtari i dytë aplikoi strategjinë e tij të parë, atëherë vlera duhet të vizatohet në boshtin I-I dhe vlera në boshtin II-II

Për çdo strategji të përzier të lojtarit të parë, fitimi i tij do të përcaktohet nga madhësia e segmentit. Linja I-I korrespondon me aplikimin e strategjisë së parë nga lojtari i dytë, do ta quajmë strategjia e parë e lojtarit të dytë. Strategjia e dytë e lojtarit të dytë mund të ndërtohet në mënyrë të ngjashme. Pastaj, në përgjithësi, shfaqja grafike e matricës së lojës do të marrë formën e mëposhtme:

Figura 1.2 - gjetja e çmimit të lojës

Megjithatë, duhet theksuar se ky ndërtim është realizuar për lojtarin e parë. Këtu gjatësia e segmentit është e barabartë me vlerën e lojës V.

Linja 1N2 quhet linja më e ulët e fitimit. Këtu shihet qartë se pika N korrespondon me vlerën maksimale të fitimit të garantuar të lojtarit të parë.

Në përgjithësi, strategjia e lojtarit të dytë mund të përcaktohet edhe nga kjo shifër, për shembull në mënyra të tilla. Në boshtin I-I:

ose në aksin II-II

Megjithatë, strategjia e lojtarit të dytë gjithashtu mund të përcaktohet në të njëjtën mënyrë siç bëhet për lojtarin e parë, d.m.th. ndërtoni një tabelë të tillë.

Figura 1.3 - përcaktimi i strategjisë së lojtarit të dytë

Këtu rreshti 1N2 është kufiri i sipërm i humbjes. Pika N korrespondon me humbjen minimale të mundshme të lojtarit të dytë dhe përcakton strategjinë.

Në varësi të vlerave specifike të koeficientëve, matricat e grafikut mund të kenë gjithashtu një formë të ndryshme, për shembull, si më poshtë:

Figura 1.4 - përcakton strategjinë optimale të lojtarit të parë

Në një situatë të tillë, strategjia optimale e lojtarit të parë është e pastër:

1.6 Lojëra 2n ose m2

Në lojërat e rendit 2n, lojtari i parë ka 2 strategji të pastra, dhe lojtari i dytë ka n strategji të pastra, d.m.th. Matrica e fitimit për lojtarin e parë është:

Nëse një lojë e tillë ka një pikë shale, atëherë është e lehtë ta gjesh atë dhe të marrësh një zgjidhje.

Supozoni se loja ka pika shalë. Atëherë është e nevojshme të gjenden strategji të tilla të përziera dhe, përkatësisht, lojtarët e parë dhe të dytë dhe çmimi i lojës v, të cilat kënaqin marrëdhëniet:

Meqenëse loja nuk ka pikë shale, pabarazia (1.54) zëvendësohet nga pabarazitë

Për të zgjidhur sistemet (1.56), (1.55), (1.53) është e përshtatshme të përdoret metoda grafike. Për këtë qëllim, ne prezantojmë shënimin për anën e majtë të pabarazisë (1.53)

modeli matematikor i lojës së matricës

ose, duke vendosur nga (1.55) dhe duke kryer transformime të thjeshta, marrim

ku është fitimi mesatar i lojtarit të parë, me kusht që ai të përdorë strategjinë e tij të përzier, dhe të dytin - strategjinë e tij të j-të të pastër.

Sipas shprehjes, secila vlerë j=1, 2, …, n i përgjigjet një drejtëz në një sistem koordinativ drejtkëndor.

Qëllimi i lojtarit të dytë është të minimizojë fitimin e lojtarit të parë duke zgjedhur strategjitë e tij. Prandaj, ne llogarisim

ku është kufiri i poshtëm i grupit të kufizimeve. Në figurën 1.6, grafiku i funksionit është paraqitur me një vijë të trashë.

Priti në http://www.allbest.ru/

Figura 1.6 - grafiku i funksionit

Qëllimi i lojtarit të parë është të maksimizojë fitimin e tij përmes zgjedhjes, d.m.th. llogarit

Në figurën 1.6, pika nënkupton vlerën maksimale që është marrë në. Çmimi i lojës, sepse:

Kështu përcaktohen grafikisht strategjia e përzier optimale e lojtarit të parë dhe një çift strategjish të pastra të lojtarit të dytë, të cilat formojnë një pikë në kryqëzim.Figura 1.6 tregon strategjitë e 2-të dhe të 3-të të lojtarit të dytë. Për strategji të tilla, pabarazitë (1.53) kthehen në barazi. Në figurën 1.6, këto janë strategji j=2, j=3.

Tani mund të zgjidhim sistemin e ekuacioneve

dhe përcaktoni saktësisht vlerat e dhe (grafikisht ato përcaktohen afërsisht). Pastaj duke vendosur të gjitha vlerat në ato j për të cilat ato nuk formojnë një pikë, duke zgjidhur sistemin e ekuacioneve (1.56) Për shembullin e paraqitur në figurën 1.6, ky është sistemi i mëposhtëm:

dhe pjesa tjetër Ky sistem mund të zgjidhet me pjerrësi Nëse, për disa j=j 0, strategjitë e lojtarit të dytë formojnë një pikë M 0 dhe atëherë vlera maksimale e kufirit të poshtëm të grupeve të kufizimeve përfaqësohet nga një segment paralel me aksi Në këtë rast, lojtari i parë ka pafundësisht shumë vlera optimale dhe çmimin e lojës Ky rast i paraqitur në figurën 1.7, ku dhe segmenti MN përfaqëson kufirin e sipërm, vlerat optimale janë brenda kufijve. lojtari i dytë ka një strategji të pastër optimale j=j 0 .

Lojërat matricore të rendit m2 zgjidhen gjithashtu duke përdorur metodën grafike. Matrica e fitimit të lojtarit të parë në këtë rast ka formën

Strategjitë e përziera të lojtarëve të parë dhe të dytë, përkatësisht, përcaktohen në të njëjtën mënyrë si në rastin e lojërave të rendit 2n. Le të vizatohet vlera nga 0 në 1 përgjatë boshtit horizontal, vlera e fitimit mesatar) të lojtarit të parë në boshtin vertikal në kushtet që lojtari i parë të zbatojë strategjinë e tij të pastër i-të (i=1, 2, ..., m), e dyta - strategjia e tij e përzier (y 1, 1- y 1) =y. Për shembull, kur m=4 grafikisht) mund të paraqitet siç tregohet në figurën 1.7.

Figura 1.7 - grafiku i funksionit)

Lojtari i parë përpiqet të maksimizojë fitimin e tij mesatar, kështu që ai përpiqet të gjejë

Funksioni tregohet si një vijë e trashë dhe përfaqëson kufirin e sipërm të grupit të kufizimeve. Lojtari i dytë përpiqet të minimizojë duke zgjedhur strategjinë e tij, d.m.th. vlera korrespondon

Në figurë, vlera tregohet me një pikë. Me fjalë të tjera, përcaktohen dy strategji të tilla të lojtarit të parë dhe probabilitetit për lojtarin e dytë për të cilat arrihet barazia.

Nga figura shohim se çmimi i lojës është ordinata e pikës, probabiliteti është abshisa e pikës. Për pjesën tjetër të strategjive të pastra të lojtarit të parë në strategjinë e përzier optimale duhet ().

Kështu, duke zgjidhur sistemin (1.69), marrim strategjinë optimale të lojtarit të dytë dhe vlerën e lojës. Ne gjejmë strategjinë e përzier optimale për lojtarin e parë duke zgjidhur sistemin e mëposhtëm të ekuacioneve:

1.7 Metoda matricore për zgjidhjen e lojërave

Emërtimet:

Çdo nënmatricë katrore e matricës së rendit

Matrica (1);

Matrica e transpozuar në;

Matrica e bashkangjitur në B;

- (1) një matricë e marrë nga X duke fshirë elementët që korrespondojnë me rreshtat e fshirë nga momenti i marrjes;

- (1) një matricë e marrë nga fshirja e elementeve që korrespondojnë me rreshtat e fshirë nga momenti i marrjes.

Algoritmi:

1. Zgjidhni një nënmatricë katrore të matricës së rendit () dhe llogarisni

2. Nëse disa ose, atëherë hidhni matricën e gjetur dhe provoni një matricë tjetër.

3. Nëse (), (), ne llogarisim dhe ndërtojmë X dhe nga dhe, duke shtuar zero në vendet e duhura.

Kontrollimi nëse pabarazitë janë të kënaqura

për secilin (1.75)

dhe pabarazitë

për secilin (1.76)

Nëse një nga raportet nuk është i kënaqur, atëherë provojmë një tjetër. Nëse të gjitha marrëdhëniet janë të vlefshme, atëherë X dhe zgjidhjet e dëshiruara.

1.8 Metoda e përafrimit të njëpasnjëshëm të çmimit të lojës

Në studimin e situatave të lojës, shpesh mund të ndodhë që të mos jetë e nevojshme të merret një zgjidhje e saktë e lojës ose, për ndonjë arsye, është e pamundur ose shumë e vështirë të gjendet vlera e saktë e kostos së lojës dhe strategjive optimale të përziera. Pastaj mund të përdorni metoda të përafërta për zgjidhjen e lojës së matricës.

Le të përshkruajmë një nga këto metoda - metodën e përafrimit të njëpasnjëshëm të çmimit të lojës. Numri i fitimeve të llogaritura duke përdorur metodën rritet afërsisht në proporcion me numrin e rreshtave dhe kolonave të matricës së fitimit.

Thelbi i metodës është si vijon: mendërisht loja luhet shumë herë, d.m.th. në mënyrë sekuenciale, në çdo lojë loje, lojtari zgjedh strategjinë që i jep atij fitimin më të madh të përgjithshëm (total).

Pas një zbatimi të tillë të disa lojërave, ai llogarit vlerën mesatare të fitores së lojtarit të parë dhe humbjes së lojtarit të dytë, dhe mesatarja aritmetike e tyre merret si një vlerë e përafërt e çmimit të lojës. Metoda bën të mundur gjetjen e një vlere të përafërt të strategjive optimale të përziera të të dy lojtarëve: është e nevojshme të llogaritet frekuenca e aplikimit të çdo strategjie të pastër dhe të merret si një vlerë e përafërt në strategjinë e përzier optimale të lojtarit përkatës.

Mund të vërtetohet se me një rritje të pakufizuar të numrit të lojërave programore, fitimi mesatar i lojtarit të parë dhe humbja mesatare e lojtarit të dytë do t'i afrohen pafundësisht çmimit të lojës, dhe vlerave të përafërta të strategjive të përziera në rasti kur zgjidhja e lojës është unike do të priret drejt strategjive optimale të përziera të secilit lojtar. Në përgjithësi, përafrimi i vlerave mbi vlerat e specifikuara me vlerat e vërteta është i ngadaltë. Sidoqoftë, ky proces mund të mekanizohet lehtësisht dhe kështu të ndihmojë në marrjen e një zgjidhjeje për lojën me shkallën e kërkuar të saktësisë edhe me matricat e fitimit të një rendi relativisht të madh.

2. Pjesa praktike

Çifti vendos se ku të shkojnë për një shëtitje dhe të kalojnë kohë për të mirën e dy.

Vajza vendos të shkojë një shëtitje në park për të marrë pak ajër të pastër, në mbrëmje për të shkuar për të parë një film në kinemanë më të afërt.

Djaloshi ofron të shkojë në teknopark, pasi të shohë ndeshjen e futbollistëve të klubit vendas në stadiumin qendror.

Në përputhje me këtë, ju duhet të gjeni se për sa kohë do të arrihet qëllimi i njërit prej lojtarëve. Matrica e fitimit do të duket si kjo:

Tabela 1. Matrica e fitimit

Strategjitë

Që nga 1 2, nuk ka padyshim asnjë pikë shalë në këtë lojë në strategjitë e pastra. Prandaj, ne përdorim formulat e mëposhtme dhe marrim:

Priti në http://www.allbest.ru/

2.2 Duke luajtur 2xn dhe mx2

Problemi 1 (2xn)

Dy kultura kultivohen për klimë të thatë dhe të lagësht.

Dhe gjendja e natyrës mund të konsiderohet si: e thatë, e lagësht, e moderuar.

Priti në http://www.allbest.ru/

Vlera maksimale e M() arrihet në pikën M të formuar nga kryqëzimi i drejtëzave që korrespondojnë me j=1, j"=2. Prandaj supozojmë: ,

Problemi 2 (mx2)

Djali dhe vajza po shqyrtojnë opsionet se ku të shkojnë për fundjavë.

Zgjedhja e një vendi pushimi mund të përfaqësohet si: një park, një kinema, një restorant.

Priti në http://www.allbest.ru/

Vlera maksimale e M() arrihet në pikën E të formuar nga kryqëzimi i drejtëzave që i korrespondojnë j=1, j"=2. Prandaj supozojmë: ,

Për të përcaktuar vlerën, v, duhet të zgjidhni ekuacionet e mëposhtme:

2.5 Metoda e matricës

Dy restorante konkurruese (institucione hotelierike) ofrojnë grupet e mëposhtme të shërbimeve. Restoranti i parë ndodhet në qendër dhe tjetri në periferi të qytetit.

Restoranti qendror përfshin shërbimet e mëposhtme:

1) shërbim më i shtrenjtë dhe më i mirë ndaj klientit;

2) pjatat janë të përqendruara në kuzhinën franceze;

Restoranti i dytë ofron:

1) shërbim jo i shtrenjtë dhe me cilësi të lartë;

2) menuja kombinon kuzhina të ndryshme të famshme të botës;

3) gjithashtu promovime dhe zbritje të rregullta;

4) kryen dorëzim dhe pranon porosi për dërgesë në shtëpi.

Në përputhje me detyrën, fitimi për një ditë ndërmjet dy restoranteve do të shpërndahet si më poshtë:

Tabela 2. Matrica e pagimit

Strategjitë

Zgjidhja e një loje të formës në mënyrë matricore:

Ka gjashtë nënmatrica dhe:

Konsideroni matricën:

x 1 =? 0,x2=? 0

Meqenëse x 2 =< 0, то мы отбрасываем.

Konsideroni tani matricën:

x 1 =? 0,x2=? 0

Çmimi i lojës.

Ky raport bie ndesh me kërkesën, prandaj nuk është i përshtatshëm.

Konsideroni tani matricën:

x 1 = , x 2 = ? 0,

y 1 =< 0, y 2 = ? 0.

Meqenëse y 1 =< 0, то мы отбрасываем и.

Konsideroni tani matricën:

x 1 \u003d, x 2 \u003d 0, pasi x 2 \u003d 0, atëherë e hedhim poshtë dhe.

Konsideroni tani matricën:

x 1 = , x 2 = ? 0. Meqenëse x 1 \u003d 0, atëherë ne hedhim dhe.

Konsideroni tani matricën:

x 1 = , x 2 =, y 1 = , y 2 =, pastaj vazhdojmë më tej:

x 1 = , x 2 =, y 1 = , y 2 = ose

Çmimi i lojës.

Tani kontrollohen marrëdhëniet kryesore:

Priti në http://www.allbest.ru/

Përgjigje: x 1 =, x 2 =, y 1 =, y 2 =, y 3 =0, y 4 =0,.

Metoda kafe

Me kërkesë të punëtorëve të një kompanie të caktuar, sindikata negocion me menaxhmentin e saj për organizimin e vakteve të ngrohta me shpenzimet e kompanisë. Sindikata që përfaqëson interesat e punëtorëve siguron që vakti të jetë sa më cilësor dhe për rrjedhojë edhe më i shtrenjtë. Menaxhmenti i kompanisë ka interesa kontradiktore. Në fund, palët ranë dakord për sa vijon. Sindikata (lojtari 1) zgjedh një nga tre firmat (A 1 , A 2 , A 3) që furnizojnë ushqime të nxehta dhe menaxhmenti i kompanisë (lojtari 2) zgjedh një grup pjatash nga tre opsione të mundshme (B 1 , B 2 , B 3) . Pas nënshkrimit të marrëveshjes, sindikata formon matricën e mëposhtme të pagesave, elementët e së cilës përfaqësojnë koston e një grupi pjatash:

Lëreni lojën të jepet nga matrica e mëposhtme e fitimit:

Supozoni se lojtari i dytë ka zgjedhur strategjinë e tij të dytë, atëherë i pari do të marrë:

2 nëse ai përdor strategjinë e tij të parë,

3 nëse ai përdor strategjinë e tij të tretë.

Vlerat e marra janë përmbledhur në tabelën 1.

Tabela 3. Strategjia e lojtarit të dytë

numri i grupit

Strategjia e lojtarit të dytë

Fitorja e lojtarit të parë

Tabela 3 tregon se me strategjinë e dytë të lojtarit të dytë, lojtari i parë do të marrë fitimin më të madh 3 duke përdorur strategjinë e tij të dytë ose të tretë. Meqenëse lojtari i parë dëshiron të marrë përfitimin maksimal, ai i përgjigjet strategjisë së dytë të lojtarit të dytë me strategjinë e tij të dytë. Me strategjinë e dytë të lojtarit të parë, i dyti do të humbasë:

1 nëse ai zbaton strategjinë e tij të parë,

3 nëse ai përdor strategjinë e tij të dytë,

4 nëse ai përdor strategjinë e tij të tretë.

Tabela 4. Strategjia e lojtarit të parë

numri i grupit

1 Strategjia e lojtarit

Humbja e lojtarit të dytë

Tabela 2 tregon se me strategjinë e dytë të lojtarit të parë, lojtari i dytë do të ketë humbjen më të vogël 1 nëse zbaton strategjinë e tij të parë. Meqenëse lojtari i dytë dëshiron të humbasë më pak, atëherë në përgjigje të strategjisë së dytë të lojtarit të parë, ai do të zbatojë strategjinë e tij të parë. Rezultatet e marra janë përmbledhur në tabelën 5.

Tabela 5. Strategjitë e lojtarëve të parë dhe të dytë, përkatësisht

numri i grupit

Strategjia e lojtarit të dytë

Fitimet totale të lojtarit të parë

1 Strategjia e lojtarit

Në tabelë. 5 në kolonën e strategjisë së lojtarit të dytë në rreshtin e dytë është numri 1, i cili tregon se në lojën e dytë është e dobishme që lojtari i dytë të përdorë strategjinë e tij të parë; në kolonë dhe është fitimi mesatar më i madh 3 i lojtarit të parë, i marrë prej tij në ndeshjen e parë; kolona w përmban humbjen më të vogël mesatare 1 të marrë nga lojtari i dytë në ndeshjen e parë; kolona v përmban mesataren aritmetike v = (u + w) -- domethënë, vlerën e përafërt të çmimit të lojës, e marrë si rezultat i luajtjes së një loje të lojës. Nëse lojtari i dytë përdor strategjinë e tij të parë, atëherë lojtari i parë do të marrë respektivisht 3, 1, 2, me strategjitë e tij të 1, 2, 3, dhe fitimi total i lojtarit të parë për të dy ndeshjet do të jetë:

2 + 3=5 me strategjinë e tij të parë,

3 + 1=4 me strategjinë e tij të dytë,

3 + 2=5 me strategjinë e tij të tretë.

Këto fitime totale regjistrohen në rreshtin e dytë të tabelës. 3 dhe në kolonat që korrespondojnë me strategjitë e lojtarit të parë: 1, 2, 3.

Nga të gjitha pagesat totale, më e madhja është 5. Merret me strategjinë 1 dhe 3 të lojtarit të parë, më pas ai mund të zgjedhë ndonjë prej tyre; le të themi, në raste të tilla kur ka dy (ose disa) fitime totale identike, zgjidhet strategjia me numrin më të vogël (në rastin tonë, ne duhet të marrim strategjinë e parë).

Me strategjinë e parë të lojtarit të parë, lojtari i dytë do të humbasë përkatësisht 3, 2, 3 nga strategjitë e tij 1, 2, 3 dhe humbja totale e lojtarit të dytë për të dyja ndeshjet do të jetë:

1 + 3=4 me strategjinë e tij të parë,

3 + 2=5 me strategjinë e tij të dytë,

4 + 3=7 me strategjinë e tij të tretë.

Këto humbje totale janë regjistruar në rreshtin e dytë të tabelës. 5 dhe në kolonat që korrespondojnë me strategjitë 1, 2, 3 të lojtarit të dytë.

Nga të gjitha humbjet totale të lojtarit të dytë, më e vogla është 4. Përftohet me strategjinë e tij të parë, prandaj, në ndeshjen e tretë, lojtari i dytë duhet të zbatojë strategjinë e tij të parë. Në kolonë dhe vendosni fitimin më të madh total të lojtarit të parë në dy ndeshje, pjesëtuar me numrin e lojërave, d.m.th.; kolona w përmban humbjen më të vogël totale të lojtarit të dytë në dy ndeshje, pjesëtuar me numrin e lojërave, d.m.th. mesatarja aritmetike e këtyre vlerave vendoset në kolonën v, d.m.th. = Ky numër merret si një vlerë e përafërt e çmimit të lojës me dy lojëra "të luajtura".

Kështu, fitohet tabela e mëposhtme 4, për dy grupe të lojës.

Tabela 6. Totali i fitimeve dhe humbjeve të lojtarëve në dy ndeshje të luajtura

Strategjia e lojtarit të dytë

Fitimet totale të lojtarit të parë

1 Strategjia e lojtarit

Humbja totale e lojtarit të dytë

Në rreshtin e tretë të tabelës 6, në kolonën e strategjisë së lojtarit të dytë, është numri 1, i cili tregon se në ndeshjen e tretë lojtari i dytë duhet të zbatojë strategjinë e tij të parë. Në këtë rast, lojtari i parë fiton 3, 1, 2, duke përdorur respektivisht strategjitë e tij të 1, 2, 3, dhe fitimi i tij total për tre ndeshje do të jetë:

3 + 5 = 8 në strategjinë e tij të parë,

1 +4 = 5 me strategjinë e tij të dytë,

2 + 5 = 7 për strategjinë e tij të tretë.

Këto pagesa totale të lojtarit të parë regjistrohen në rreshtin e tretë të tabelës 6 dhe kolonave që korrespondojnë me strategjitë e tij 1, 2, 3. Meqenëse fitimi më i madh total 8 i lojtarit të parë merret me strategjinë e parë, ai zgjedh të parin në përputhje me rrethanat. .

Me strategjinë e parë të lojtarit të parë, lojtari i dytë do të humbasë përkatësisht 3, 1, 2 nga strategjitë e 1, 2, 3, dhe humbja totale e lojtarit të dytë për të dyja ndeshjet do të jetë:

3 + 4=7 me strategjinë e tij të parë,

2 + 5=7 me strategjinë e tij të dytë,

3 + 7=10 me strategjinë e tij të tretë.

Këto humbje totale janë regjistruar në rreshtin e tretë të tabelës. 6 dhe në kolonat që korrespondojnë me strategjitë 1, 2, 3 të lojtarit të dytë. Nga të gjitha humbjet e tij totale, 7 është më e vogla dhe fitohet me strategjinë e tij të parë dhe të dytë, atëherë lojtari i dytë duhet të zbatojë strategjinë e tij të parë.

Në tabelë. 6 në rreshtin e tretë në kolonë dhe fitimet më të mëdha totale të lojtarit të parë në tre ndeshje, pjesëtuar me numrin e lojës, d.m.th. kolona w përmban humbjen më të vogël totale të lojtarit të dytë në tre ndeshje, pjesëtuar me numrin e lojërave, d.m.th. në kolonën v vendosni mesataren e tyre aritmetike

Kështu marrim tabelën. 7 për tre palë.

Tabela 7. Totali i fitimeve dhe humbjeve të lojtarëve në tre ndeshje të luajtura

numri i grupit

Strategjia e lojtarit të dytë

Fitimet totale të lojtarit të parë

1 Strategjia e lojtarit

Humbja totale e lojtarit të dytë

Tabela 8. Tabela përfundimtare me njëzet ndeshje të luajtura

numri i grupit

Strategjia e lojtarit të dytë

Fitimet totale të lojtarit të parë

1 Strategjia e lojtarit

Humbja totale e lojtarit të dytë

Nga Tabela. 7 dhe 8, shihet se në 20 ndeshje të humbura, strategjitë 1, 2, 3 për lojtarin e parë ndodhin përkatësisht 12, 3, 5 herë, prandaj, frekuencat e tyre relative janë përkatësisht të barabarta; strategjitë 1, 2, 3 për lojtarin e dytë ndodhin përkatësisht 7, 11.2 herë, prandaj frekuencat e tyre relative janë përkatësisht të barabarta; vlera e përafërt e çmimit të lojës. Ky përafrim është mjaft i mirë.

Si përfundim, vërejmë se nëse loja ka më shumë se një zgjidhje, atëherë vlerat e përafërta të kostos së lojës do t'i afrohen akoma kostos së vërtetë të lojës për një kohë të pacaktuar, dhe frekuencave relative të shfaqjes së strategjive të lojtarët nuk do t'i qasen më domosdoshmërisht strategjive të përziera të vërteta optimale të lojtarëve.

Analiza e rezultateve

Në këtë punë kursi, materiali për gjetjen e një zgjidhjeje për lojërat antagoniste studiohet me metodën grafike, matricore, metodën e përafrimit të njëpasnjëshëm të çmimit të lojës. Gjenden strategjitë optimale të lojtarëve të parë dhe të dytë, si dhe kostoja e lojës në lojërat 2x2, 2xn dhe mx2, si dhe në lojërat që përdorin metodën e matricës dhe metodën e Brown.

Në shembullin e një çifti, u modelua një lojë 2x2, e cila u zgjidh me një metodë algjebrike dhe grafike. Duke zgjidhur lojën me metodën algjebrike, zgjidhja tregon se duke zbatuar strategjitë e tyre optimale të përziera, lojtari i parë dhe i dytë do të kalojnë 4,6 orë së bashku. Zgjidhja grafike e problemit doli me një gabim të vogël dhe arriti në 4.5 orë.

Dhe gjithashtu u modeluan dy detyra 2xn dhe mx2. Në problemin 2xn, kultura bujqësore u konsiderua dhe strategjia tregon se është më mirë të mbillet fusha 50 me 50, dhe çmimi i lojës ishte 3.75 milion rubla. Dhe në problemin mx2, u konsiderua një palë, strategjia e së cilës tregoi se është më e lirë të shkosh në park dhe kinema, dhe çmimi dhe kostoja do të jenë 4.3 rubla.

U modelua një detyrë për metodën e matricës, në të cilën u morën parasysh dy restorante, zgjidhja e problemit tregoi se kur zbatohet strategjia e tij optimale e përzier, fitimi i restorantit të parë do të jetë 15.6 milion rubla, dhe kur përdoret strategjia e tij optimale e përzier nga restoranti i dytë, nuk do të lejojë që i pari të fitojë më shumë se 15.6 milion rubla. Zgjidhja me metodën grafike dha një gabim dhe çmimi i lojës ishte 14.9 milion rubla.

Për metodën Brown, u hartua një detyrë në të cilën merret parasysh sindikata dhe menaxhmenti i kompanisë, detyra e tyre është të sigurojnë ushqim për punëtorët. Kur të dy lojtarët përdorin strategjitë e tyre optimale, ushqimi për person do të jetë 2.45 mijë rubla.

Lista e burimeve të përdorura

1) Vilisov V.Ya. Shënime leksioni "Teoria e lojës dhe zgjidhjet statistikore", - Dega - "Voskhod" MAI. 1979. 146 f.

2) Krushevsky A.V. Teoria e lojës, - Kiev: shkolla Vishcha, 1977. - 216 f.

3) Cherchmen U., Akof R., Arnof L., Hyrje në Kërkimin Operacional. - M.: Shkencë. 1967. - 488 f.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0 %B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

Organizuar në Allbest.ru

Dokumente të ngjashme

    Vendimmarrja si një lloj i veçantë i veprimtarisë njerëzore. Paraqitja racionale e matricës së lojës. Shembuj të lojërave matricë në strategji të pastra dhe të përziera. Hulumtimi i operacioneve: lidhja e problemeve të programimit linear me një model të teorisë së lojës.

    punim afatshkurtër, shtuar 05/05/2010

    Lojëra të përsëritura shumë herë, veçoritë dhe fazat e tyre dalluese. Strategji të përziera, kushte dhe mundësi për përdorimin e tyre në praktikë. Një metodë analitike për zgjidhjen e një loje 2 x 2. Teorema bazë për lojërat drejtkëndore. Zgjidhje algjebrike.

    prezantim, shtuar më 23.10.2013

    Përkufizimet bazë të teorisë së lojërave bimatrikse. Një shembull i një loje bimatrikse "Nxënës-Mësues". Strategji të përziera në lojërat bimatrikse. Kërkoni për "situatën e ekuilibrit". Lojëra bimatrikse 2x2 dhe formula për rastin kur secili lojtar ka dy strategji.

    abstrakt, shtuar më 13.02.2011

    Studimi i informacionit të përgjithshëm rreth lojërave matricë dhe antagoniste. Koncepti i lojës pozicionale, pema, grup informacioni. Konsiderimi i parimit maximin dhe parimit të ekuilibrit. Optimaliteti Pareto. Lojë pozicionale jo antagoniste, vetitë e saj.

    punim afatshkurtër, shtuar 17.10.2014

    Teoria e lojës është një degë e matematikës, lënda e së cilës është studimi i modeleve matematikore për marrjen e vendimeve optimale në një konflikt. Metoda përsëritëse Brown-Robinson. Algoritmi përsëritës monoton për zgjidhjen e lojërave me matricë.

    tezë, shtuar 08/08/2007

    Përpilimi i matricës së fitimit, kërkimi i çmimeve neto të ulëta dhe të sipërme të lojës, strategjitë maksimale dhe minimale të lojtarëve. Thjeshtimi i matricës së pagesave. Zgjidhja e një loje matrice duke përdorur reduktimin në një problem programimi linear dhe shtesën "Kërko një zgjidhje".

    test, shtuar 11/10/2014

    Teoria e lojës është një teori matematikore e situatave të konfliktit. Zhvillimi i një modeli matematikor të një loje me shumë zero me dy persona, zbatimi i tij në formën e kodeve të programit. Metoda e zgjidhjes së problemeve. Të dhënat hyrëse dhe dalëse. Programi, manuali i përdorimit.

    punim afatshkurtër, shtuar 17.08.2013

    Informacion bazë për metodën simplex, vlerësimi i rolit dhe rëndësisë së saj në programimin linear. Interpretimi gjeometrik dhe kuptimi algjebrik. Gjetja e maksimumit dhe minimumit të një funksioni linear, raste të veçanta. Zgjidhja e problemit me metodën e matricës simplex.

    tezë, shtuar 06/01/2015

    Teknikat për ndërtimin e modeleve matematikore të sistemeve llogaritëse që pasqyrojnë strukturën dhe proceset e funksionimit të tyre. Numri i akseseve të skedarëve gjatë detyrës mesatare. Përcaktimi i mundësisë së vendosjes së skedarëve në disqet e memories së jashtme.

    punë laboratorike, shtuar 21.06.2013

    Hartimi i një modeli matematikor. Përshkrimi i lojës tic-tac-toe. Modeli i lojës logjike bazuar në algjebrën e Bulit. Pajisjet elektronike dixhitale dhe zhvillimi i modelit të tyre matematikor. Konsola e lojërave, kontrolluesi i lojës, vargu i tabelës së lojës.

Teoria e lojës është një teori e modeleve matematikore të vendimmarrjes në kushte konflikti ose pasigurie. Supozohet se veprimet e palëve në lojë karakterizohen nga strategji të caktuara - grupe rregullash veprimi. Nëse fitimi i njërës palë në mënyrë të pashmangshme çon në humbjen e palës tjetër, atëherë flitet për lojëra antagoniste. Nëse grupi i strategjive është i kufizuar, atëherë loja quhet lojë matrice dhe zgjidhja mund të merret shumë thjesht. Zgjidhjet e marra me ndihmën e teorisë së lojës janë të dobishme në hartimin e planeve përballë kundërshtimeve të mundshme nga konkurrentët ose pasigurisë në mjedisin e jashtëm.


Nëse loja bimatrikse është antagoniste, atëherë matrica e fitimit të lojtarit 2 përcaktohet plotësisht nga matrica e fitimit të lojtarit 1 (elementet përkatëse të këtyre dy matricave ndryshojnë vetëm në shenja). Prandaj, një lojë antagoniste bimatrikse përshkruhet plotësisht nga një matricë e vetme (matrica e fitimit të lojtarit 1) dhe, në përputhje me rrethanat, quhet një lojë matrice.

Kjo lojë është antagoniste. Në të j \u003d x2 - O, P dhe R (O, O] \u003d H (P, P) \u003d -I dhe R (O, P) \u003d R (P, O) \u003d 1, ose në formë matrice o p

Le të jetë një klasë lojërash Г "të mbyllura në pasqyrë", d.m.th. së bashku me secilën lojë të saj përmban një lojë izomorfe pasqyre (duke qenë se të gjitha lojërat që janë izomorfe pasqyre ndaj një të dhënë janë izomorfe ndaj njëra-tjetrës, ne, në përputhje me sa u tha, mund të flasim për një lojë izomorfe pasqyre). Një klasë e tillë është, për shembull, klasa e të gjitha lojërave antagoniste ose klasa e të gjitha lojërave matricë.

Duke kujtuar përkufizimin e situatave të pranueshme në lojën antagoniste, marrim se situata (X, Y) në shtrirjen e përzier të lojës së matricës është e pranueshme për lojtarin 1 nëse dhe vetëm nëse për ndonjë x G x pabarazia

Procesi i shndërrimit të lojërave në ato simetrike quhet simetrizim. Ne përshkruajmë këtu një metodë të simetrizimit. Një version tjetër, thelbësisht i ndryshëm i simetrizimit do të jepet në seksionin 26.7. Të dyja këto variante të simetrizimit janë në të vërtetë të zbatueshme për lojërat antagoniste arbitrare, por do të formulohen dhe vërtetohen vetëm për lojërat me matricë.

Kështu, termat dhe emërtimet fillestare të teorisë së lojërave të përgjithshme antagoniste përkojnë me termat dhe emërtimet përkatëse të teorisë së lojërave matricë.

Për lojërat antagoniste të fundme (matricë), ekzistenca e këtyre ekstremeve u vërtetua nga ne në Kapitullin 10. 1, dhe e gjithë çështja ishte vendosja e barazisë së tyre, ose të paktën gjetja e mënyrave për të kapërcyer pabarazinë e tyre.

Shqyrtimi i lojërave me matricë tregon tashmë se ka lojëra antagoniste pa situata ekuilibri (dhe madje edhe pa situata e-ekuilibri për e mjaftueshëm të vogël e > 0) në strategjitë e dhëna fillimisht të lojtarëve.

Por çdo lojë e fundme (matricë) mund të zgjerohet në një lojë të pafundme, për shembull, duke i siguruar çdo lojtari çdo numër strategjish të dominuara (shih 22 Kapitulli 1). Natyrisht, një zgjerim i tillë i grupit të strategjive të lojtarit nuk do të thotë në të vërtetë një zgjerim i mundësive të tij dhe sjellja e tij aktuale në lojën e zgjeruar nuk duhet të ndryshojë nga sjellja e tij në lojën origjinale. Kështu, menjëherë morëm një numër të mjaftueshëm shembujsh të lojërave antagoniste të pafundme që nuk kanë pika shalë. Ka edhe shembuj të këtij lloji.

Kështu, për të zbatuar parimin maximin në një lojë antagoniste të pafundme, është e nevojshme, si në rastin e një loje të fundme (matrice), njëfarë zgjerimi i aftësive strategjike të lojtarëve. Për 96

Ashtu si në rastin e lojërave me matricë (shih Kapitullin 1, 17), për lojërat e përgjithshme antagoniste një rol të rëndësishëm luan koncepti i një spektri strategjik të përzier, të cilit, megjithatë, këtu duhet t'i jepet një përkufizim më i përgjithshëm.

Së fundi, vini re se grupi i të gjitha strategjive të përziera të lojtarit 1 në një lojë arbitrare antagoniste është, si në matricë

Edhe një shqyrtim i lojërave antagoniste tregon se një numër i madh lojërash të tilla, përfshirë ato të fundme, lojëra matrice kanë situata ekuilibri jo në strategjitë origjinale, të pastra, por vetëm në strategji të përgjithësuara, të përziera. Prandaj, për lojërat e përgjithshme, jo antagoniste, jo bashkëpunuese, është e natyrshme të kërkohen situata ekuilibri pikërisht në strategji të përziera.

Kështu, për shembull (shih Fig. 3.1), ne kemi vërejtur tashmë se "Kontraktori" pothuajse kurrë nuk duhet të merret me pasigurinë e sjelljes. Por nëse marrim nivelin konceptual të tipit “Administrator”, atëherë gjithçka është krejt e kundërta. Si rregull, lloji kryesor i pasigurisë me të cilin duhet të përballet një "vendimmarrës ynë" është "Konflikti". Tani mund të sqarojmë se ky është zakonisht një rivalitet jo i rreptë. Disi më rrallë, “Administratori” merr vendime në kushte “pasigurie natyrore”, madje më rrallë has në një konflikt të rreptë, antagonist. Për më tepër, përplasja e interesave gjatë marrjes së vendimeve nga "Administratori" ndodh, si të thuash, "një herë", d.m.th. në klasifikimin tonë, ai shpesh luan vetëm një (ndonjëherë një numër shumë të vogël) lojëra të lojës. Shkallët për vlerësimin e pasojave janë më shpesh cilësore sesa sasiore. Pavarësia strategjike e "Administratorit" është mjaft e kufizuar. Duke marrë parasysh sa më sipër, mund të argumentohet se situatat problemore të kësaj përmasash më së shpeshti duhet të analizohen duke përdorur lojëra jo-antagoniste bimatricore jo-bashkëpunuese, për më tepër, në strategji të pastra.

Parimet për zgjidhjen e lojërave antagoniste të matricës

Si rezultat, është e arsyeshme të pritet që në lojën e përshkruar më sipër, kundërshtarët do t'i përmbahen strategjive të tyre të zgjedhura. Lojë antagoniste matricore për të cilën max min fiv = min max Aiy>

Sidoqoftë, jo të gjitha lojërat antagoniste të matricës janë mjaft të përcaktuara, dhe në rastin e përgjithshëm

Kështu, në rastin e përgjithshëm, për të zgjidhur një lojë antagoniste matricore të dimensionit /uxl, është e nevojshme të zgjidhen një çift problemesh të programimit linear të dyfishtë, duke rezultuar në një grup strategjish optimale, / dhe koston e lojës v.

Si përcaktohet loja antagoniste matricore e dy personave?

Cilat janë metodat për thjeshtimin dhe zgjidhjen e lojërave antagoniste matricore

Në rastin e një loje me dy persona, është e natyrshme të konsiderohen interesat e tyre si të kundërta - loja është antagoniste. Kështu, fitimi i një lojtari është i barabartë me humbjen e tjetrit (shuma e fitimeve të të dy lojtarëve është zero, prandaj emri, loja me shumën zero). Ne do të shqyrtojmë lojërat në të cilat secili lojtar ka një numër të kufizuar alternativash. Funksioni i fitimit për një lojë të tillë me shumë zero me dy persona mund të jepet në formë matrice (në formën e një matrice fitimi).

Siç u përmend tashmë, loja përfundimtare antagoniste quhet matricë.

LOJËRAT MATRIX - një klasë lojërash antagoniste në të cilat marrin pjesë dy lojtarë dhe secili lojtar ka një numër të kufizuar strategjish. Nëse një lojtar ka m strategji dhe lojtari tjetër ka n strategji, atëherë mund të ndërtojmë një matricë loje me dimension txn. M.i. mund ose nuk mund të ketë një pikë shale. Në rastin e fundit

Merrni parasysh një lojë të fundme çift me shumë zero. Shënoni me a shpërblimi i lojtarit A, dhe përmes b- lojtari fiton B. Sepse a = –b, atëherë kur analizoni një lojë të tillë nuk ka nevojë të merren parasysh të dy këta numra - mjafton të merret parasysh fitimi i njërit prej lojtarëve. Le të jetë, për shembull, A. Në vijim, për lehtësinë e prezantimit, ana A ne do të emërtojmë me kusht " ne"dhe anën B – "armik".

Le të kemi m strategjitë e mundshme A 1 , A 2 , …, Jam, dhe armiku n strategjitë e mundshme B 1 , B 2 , …, B n(një lojë e tillë quhet lojë m×n). Supozoni se secila palë ka zgjedhur një strategji të caktuar: ne kemi zgjedhur A i, kundërshtar B j. Nëse loja përbëhet vetëm nga lëvizje personale, atëherë zgjedhja e strategjive A i dhe B j përcakton në mënyrë unike rezultatin e lojës - fitimin tonë (pozitiv ose negativ). Le ta shënojmë këtë fitim si aij(fitim kur zgjedhim strategjinë A i, dhe armiku - strategjitë B j).

Nëse loja përmban, përveç lëvizjeve personale të rastësishme, atëherë shpërblimi për një palë strategji A i, B jështë një ndryshore e rastësishme që varet nga rezultatet e të gjitha lëvizjeve të rastësishme. Në këtë rast, vlerësimi natyror i fitimit të pritshëm është pritja matematikore e një fitoreje të rastësishme. Për lehtësi, ne do të shënojmë me aij si vetë fitimi (në një lojë pa lëvizje të rastësishme) ashtu edhe pritshmëria e saj matematikore (në një lojë me lëvizje të rastësishme).

Supozoni se i dimë vlerat aij për çdo çift strategjish. Këto vlera mund të shkruhen si një matricë, rreshtat e së cilës korrespondojnë me strategjitë tona ( A i), dhe kolonat tregojnë strategjitë e kundërshtarit ( B j):

B j A i B 1 B 2 B n
A 1 a 11 a 12 a 1n
A 2 a 21 a 22 a 2n
Jam jam 1 jam 2 amn

Një matricë e tillë quhet matrica e fitimit të lojës ose thjesht matrica e lojës.

Vini re se ndërtimi i një matrice fitimi për lojëra me një numër të madh strategjish mund të jetë një detyrë e vështirë. Për shembull, për një lojë shahu, numri i strategjive të mundshme është aq i madh sa që ndërtimi i një matrice fitimi është praktikisht i pamundur. Megjithatë, në parim, çdo lojë e fundme mund të reduktohet në një formë matrice.

Merrni parasysh shembulli 1 Lojë antagoniste 4×5. Ne kemi në dispozicion katër strategji, armiku ka pesë strategji. Matrica e lojës është si më poshtë:

B j A i B 1 B 2 B 3 B 4 B 5
A 1
A 2
A 3
A 4

Çfarë strategjie duhet ne (d.m.th., lojtari A) per te perdorur? Çfarëdo strategjie që zgjedhim, një kundërshtar i arsyeshëm do t'i përgjigjet asaj me strategjinë për të cilën fitimi ynë do të jetë minimal. Për shembull, nëse zgjedhim strategjinë A 3 (i tunduar nga një fitore prej 10), kundërshtari do të zgjedhë një strategji si përgjigje B 1, dhe fitimi ynë do të jetë vetëm 1. Natyrisht, bazuar në parimin e kujdesit (dhe është parimi kryesor i teorisë së lojës), ne duhet të zgjedhim strategjinë në të cilën fitimi ynë minimal është maksimal.

Shënoni me a i vlera minimale e fitimit për strategjinë A i:

dhe shtoni një kolonë që përmban këto vlera në matricën e lojës:

B j A i B 1 B 2 B 3 B 4 B 5 minimale në rreshta a i
A 1
A 2
A 3
A 4 maksimalin

Kur zgjedhim një strategji, duhet të zgjedhim atë për të cilën është vlera a i maksimale. Le ta shënojmë këtë vlerë maksimale me α :

Vlera α thirrur çmim më i ulët i lojës ose maksimalin(fitimi minimal maksimal). Strategjia e lojtarit A që korrespondon me maksimumin α , quhet strategji maksimale.

Në këtë shembull, maksimumi α është e barabartë me 3 (qeliza përkatëse në tabelë është e theksuar me gri), dhe strategjia maksimale është A katër. Duke zgjedhur këtë strategji, mund të jemi të sigurt se për çdo sjellje të armikut do të fitojmë jo më pak se 3 (dhe ndoshta më shumë me sjelljen “të paarsyeshme” të armikut). Kjo vlerë është minimumi ynë i garantuar, të cilin mund ta sigurojmë për veten, duke iu përmbajtur strategjisë më të kujdesshme ("risigurimit").

Tani do të kryejmë arsyetime të ngjashme për armikun B B A B 2 - ne do t'i përgjigjemi atij A .

Shënoni me βj A B) për strategjinë A i:



βj β :

7. CILA ËSHTË LOJA E VLERËS SË SIPËRME Tani do të kryejmë arsyetime të ngjashme për kundërshtarin B. Ai është i interesuar të minimizojë fitimin tonë, domethënë të na japë më pak, por duhet të llogarisë në sjelljen tonë, që është më e keqja për të. Për shembull, nëse ai zgjedh strategjinë B 1 , atëherë ne do t'i përgjigjemi atij me një strategji A 3 , dhe ai do të na japë 10. Nëse ai zgjedh B 2 - ne do t'i përgjigjemi atij A 2, dhe ai do të japë 8, e kështu me radhë. Natyrisht, një kundërshtar i kujdesshëm duhet të zgjedhë strategjinë në të cilën fitimi ynë maksimal do të jetë minimal.

Shënoni me βj vlerat maksimale në kolonat e matricës së fitimit (shlyerja maksimale e lojtarit A, ose, që është e njëjta, humbja maksimale e lojtarit B) për strategjinë A i:

dhe shtoni një rresht që përmban këto vlera në matricën e lojës:

Zgjedhja e një strategjie, armiku do të preferojë atë për të cilën vlera βj minimale. Le ta shënojmë me β :

Vlera β thirrur çmimi më i lartë i lojës ose maksimumi(Fitorja maksimale minimale). Strategjia e kundërshtarit (lojtarit) që korrespondon me minimumin B), quhet strategji minimale.

Minimax është vlera e fitimit, më shumë se të cilën një kundërshtar i arsyeshëm me siguri nuk do të na japë (me fjalë të tjera, një kundërshtar i arsyeshëm nuk do të humbasë më shumë se β ). Në këtë shembull, maksimumi β është e barabartë me 5 (qeliza përkatëse në tabelë është e theksuar me gri) dhe kjo arrihet me strategjinë e kundërshtarit. B 3 .

Pra, bazuar në parimin e kujdesit ("prit gjithmonë më të keqen!"), ne duhet të zgjedhim një strategji A 4, dhe armiku - një strategji B 3 . Parimi i kujdesit është themelor në teorinë e lojës dhe quhet parimi minimal.

Merrni parasysh shembulli 2. Lërini lojtarët A dhe AT një nga tre numrat shkruhet njëkohësisht dhe në mënyrë të pavarur nga njëri-tjetri: ose "1", ose "2", ose "3". Nëse shuma e numrave të shkruar është çift, atëherë lojtari B paguan lojtarin A këtë shumë. Nëse shuma është tek, atëherë lojtari e paguan këtë shumë A lojtar AT.

Le të shkruajmë matricën e fitimit të lojës dhe të gjejmë çmimet më të ulëta dhe të larta të lojës (numri i strategjisë korrespondon me numrin e shkruar):

Lojtar A duhet t'i përmbahet strategjisë maksimale A 1 për të fituar të paktën -3 (d.m.th., për të humbur më së shumti 3). Strategjia e lojtarit Minimax B ndonjë nga strategjitë B 1 dhe B 2, e cila garanton se ai nuk do të japë më shumë se 4.

Do të marrim të njëjtin rezultat nëse shkruajmë matricën e fitimit nga këndvështrimi i lojtarit AT. Në fakt, kjo matricë fitohet duke transpozuar matricën e ndërtuar nga këndvështrimi i lojtarit A, dhe ndryshimi i shenjave të elementeve në të kundërtën (që nga fitimi i lojtarit Aështë humbja e lojtarit AT):

Bazuar në këtë matricë, rezulton se lojtari B duhet të ndjekë ndonjë nga strategjitë B 1 dhe B 2 (dhe pastaj ai do të humbasë jo më shumë se 4), dhe lojtari A– strategjitë A 1 (dhe pastaj ai do të humbasë jo më shumë se 3). Siç mund ta shihni, rezultati është saktësisht i njëjtë me atë të marrë më lart, kështu që analiza nuk ka rëndësi nga këndvështrimi se cilit lojtar e bëjmë atë.

8 ÇFARË ËSHTË NJË LOJË ME VLERË.

9. NGA QKA PËRBËHET PARIMI MINIMAKS. 2. Çmimi më i ulët dhe më i lartë i lojës. Parimi Minimax

Konsideroni një lojë matrice të tipit me matricë fitimi

Nëse lojtari POR do të zgjedhë një strategji A i, atëherë të gjitha përfitimet e tij të mundshme do të jenë elemente i-rreshti i matricës NGA. Më e keqja për një lojtar POR rastin kur lojtari AT zbaton një strategji të përshtatshme për minimale elementi i kësaj linje, fitimi i lojtarit POR do të jetë e barabartë me numrin.

Prandaj, për të marrë shpërblimin maksimal, lojtari POR ju duhet të zgjidhni një nga strategjitë për të cilat numri maksimale.

Rasti më i thjeshtë, i përpunuar në detaje në teorinë e lojës, është një lojë me çifte të fundme me shumë zero (një lojë antagoniste e dy personave ose e dy koalicioneve). Konsideroni një lojë G në të cilën marrin pjesë dy lojtarë A dhe B, me interesa të kundërta: fitimi i njërit është i barabartë me humbjen e tjetrit. Meqenëse fitimi i lojtarit A është i barabartë me shpërblimin e lojtarit B me shenjën e kundërt, ne mund të jemi të interesuar vetëm për shpërblimin e lojtarit a. Natyrisht, A dëshiron të maksimizojë dhe B dëshiron të minimizojë a.

Për thjeshtësi, le të identifikohemi mendërisht me një nga lojtarët (le të jetë A) dhe ta quajmë atë "ne", dhe lojtarin B - "kundërshtar" (natyrisht, nga kjo nuk rrjedhin asnjë avantazh real për A). Le të kemi strategji të mundshme dhe kundërshtari - strategji të mundshme (një lojë e tillë quhet lojë). Le të shënojmë fitimin tonë nëse përdorim strategjinë dhe kundërshtari përdor strategjinë

Tabela 26.1

Supozoni se për secilën palë strategjish, fitimi (ose fitimi mesatar) a është i njohur për ne. Pastaj, në parim, është e mundur të përpilohet një tabelë (matricë) drejtkëndëshe, e cila rendit strategjitë e lojtarëve dhe fitimet përkatëse (shih tabelën 26.1).

Nëse përpilohet një tabelë e tillë, atëherë loja G thuhet se reduktohet në një formë matrice (në vetvete, sjellja e lojës në një formë të tillë tashmë mund të jetë një detyrë e vështirë, dhe ndonjëherë praktikisht e pamundur, për shkak të numrit të madh të strategjive ). Vini re se nëse loja reduktohet në një formë matrice, atëherë loja me shumë lëvizje reduktohet në të vërtetë në një lojë me një lëvizje - lojtarit i kërkohet të bëjë vetëm një lëvizje: të zgjedhë një strategji. Do të shënojmë shkurtimisht matricën e lojës

Shqyrtoni një shembull të një loje G (4X5) në formë matrice. Në dispozicionin tonë (për të zgjedhur) katër strategji, armiku ka pesë strategji. Matrica e lojës është dhënë në tabelën 26.2

Le të mendojmë se çfarë strategjie përdorim ne (lojtari A)? Matrica 26.2 ka fitimin tërheqës "10"; ne jemi të tërhequr të zgjedhim një strategji në të cilën do ta marrim këtë "gjë".

Por prisni, as armiku nuk është budalla! Nëse ne zgjedhim strategjinë, ai, për të na bërë keq, do të zgjedhë strategjinë dhe ne do të marrim një fitim të mjerueshëm "1". Jo, nuk mund të zgjedhësh një strategji! Si të jesh? Natyrisht, duke u nisur nga parimi i kujdesit (dhe është parimi kryesor i teorisë së lojës), ne duhet të zgjedhim strategjinë për të cilën fitimi ynë minimal është maksimal.

Tabela 26.2

Ky është i ashtuquajturi "parimi mini-maks": veproni në atë mënyrë që, me sjelljen më të keqe të kundërshtarit, të merrni përfitimin maksimal.

Le të rishkruajmë tabelën 26.2 dhe në kolonën e djathtë shtesë do të shkruajmë vlerën minimale të një fitimi në çdo rresht (një minimum prej një rreshti); le ta shënojmë për rreshtin a (shih tabelën 26.3).

Tabela 26.3

Nga të gjitha vlerat (kolona e djathtë), zgjidhet më e madhja (3). Përputhet me strategjinë. Duke zgjedhur këtë strategji, ne mund të jemi në çdo rast të sigurt se (për çdo sjellje të armikut) do të fitojmë jo më pak se 3. Kjo vlerë është fitimi ynë i garantuar; duke u sjellë me kujdes, nuk mund të marrim më pak se kaq, mund të marrim më shumë).

Ky fitim quhet çmimi më i ulët i lojës (ose "maximin" - maksimumi i fitimeve minimale). Do ta shënojmë si një. Në rastin tonë

Tani le të marrim këndvështrimin e armikut dhe të argumentojmë për të. Ai nuk është një lloj pengu, por edhe i arsyeshëm! Duke zgjedhur një strategji, ai do të donte të jepte më pak, por ai duhet të llogarisë në sjelljen tonë, që është më e keqja për të. Nëse ai zgjedh një strategji, ne do t'i përgjigjemi dhe ai do të japë 10; nëse ai zgjedh, ne do t'i përgjigjemi atij dhe ai do t'ia kthejë, etj. Shtojmë një rresht shtesë të poshtëm në tabelën 26.3 dhe shkruajmë maksimalet e kolonave në të. Natyrisht, një kundërshtar i kujdesshëm duhet të zgjedhë strategjinë për të cilën është kjo vlerë minimale (vlera përkatëse 5 është theksuar në tabelën 26.3). Kjo vlerë P është vlera e fitimit, më shumë se të cilën një kundërshtar i arsyeshëm me siguri nuk do të na japë. Quhet çmimi i sipërm i lojës (ose "mi-nimax" - minimumi i fitimeve maksimale). Në shembullin tonë, dhe arrihet me strategjinë e kundërshtarit

Pra, bazuar në parimin e kujdesit (rregulli i risigurimit “gjithmonë llogarisni më të keqen!”), duhet të zgjedhim strategjinë A dhe strategjinë armikun. Strategjitë e tilla quhen “minimax” (sipas parimit minimax). Për sa kohë që të dyja palët në shembullin tonë i përmbahen strategjive të tyre maksimale, fitimi do të jetë

Tani imagjinoni për një moment që ne kemi mësuar se armiku po ndjek strategjinë. Hajde, e ndëshkojmë për këtë dhe zgjedhim një strategji, marrim 5, dhe kjo nuk është aq e keqe. Por në fund të fundit, armiku nuk është gjithashtu një miss; le ta dijë se strategjia jonë është , ai gjithashtu do të nxitojë të zgjedhë , duke e ulur fitimin tonë në 2, etj. (partnerët "nxituan rreth strategjive"). Shkurtimisht, strategjitë minimale në shembullin tonë janë të paqëndrueshme në lidhje me informacionin për sjelljen e palës tjetër; këto strategji nuk kanë vetinë e ekuilibrit.

A është gjithmonë kështu? Jo jo gjithmonë. Shqyrtoni një shembull me matricën e dhënë në tabelën 26.4.

Në këtë shembull, çmimi më i ulët i lojës është i barabartë me atë të sipërm: . Çfarë rrjedh nga kjo? Strategjitë minimale të lojtarëve A dhe B do të jenë të qëndrueshme. Për sa kohë që të dy lojtarët i përmbahen atyre, fitimi është 6. Le të shohim se çfarë ndodh nëse (A) zbulojmë se kundërshtari (B) i përmbahet strategjisë B?

Tabela 26.4

Dhe saktësisht asgjë nuk do të ndryshojë, sepse çdo devijim nga strategjia vetëm sa mund të përkeqësojë situatën tonë. Po kështu, informacioni i marrë nga kundërshtari nuk do ta bëjë atë të tërhiqet nga strategjia e tij. Një shenjë e pranisë së një pike shale dhe një çifti të ekuilibruar strategjish është barazia e çmimeve më të ulëta dhe të larta të lojës; vlera totale quhet çmimi i lojës. Ne do ta etiketojmë atë

Strategjitë (në këtë rast, ) në të cilat arrihet ky fitim quhen strategji të pastra optimale dhe kombinimi i tyre është një zgjidhje për lojën. Në këtë rast, vetë loja thuhet se zgjidhet në strategji të pastra. Të dy palëve A dhe B mund t'u jepen strategjitë e tyre optimale në të cilat pozicioni i tyre është më i miri i mundshëm. Dhe ai lojtar A fiton 6, dhe lojtari B humbet, mirë, këto janë kushtet e lojës: ato janë të dobishme për A dhe të pafavorshme për B.

Lexuesi mund të ketë një pyetje: pse strategjitë optimale quhen "të pastra"? Duke parë pak përpara, le t'i përgjigjemi kësaj pyetjeje: ka strategji "të përziera", të cilat konsistojnë në faktin se lojtari nuk përdor një strategji, por disa, duke i alternuar ato në mënyrë të rastësishme. Pra, nëse pranojmë, përveç atyre të pastra, edhe strategjive të përziera, çdo lojë e fundme ka një zgjidhje - një pikë ekuilibri. Por më shumë për këtë nuk ka ardhur ende.

Prania e një pike shale në lojë është larg nga të qenit rregull; përkundrazi, është përjashtim. Shumica e lojërave nuk kanë një pikë shale. Sidoqoftë, ka një shumëllojshmëri lojërash që kanë gjithmonë një pikë shale dhe, për rrjedhojë, zgjidhen në strategji të pastra. Këto janë të ashtuquajturat "lojëra me informacion të plotë". Një lojë me informacion të plotë është një lojë në të cilën çdo lojtar njeh të gjithë parahistorinë e zhvillimit të saj në çdo lëvizje personale, d.m.th., rezultatet e të gjitha lëvizjeve të mëparshme, si personale ashtu edhe të rastësishme. Shembuj lojërash me informacion të plotë janë damë, shah, tik-tac-toe, etj.

Në teorinë e lojës, është vërtetuar se çdo lojë me informacion të plotë ka një pikë shale, dhe për këtë arsye mund të zgjidhet në strategji të pastra. Në çdo lojë me informacion të përsosur, ka një palë strategjish optimale që japin një fitim të qëndrueshëm të barabartë me çmimin e lojës dhe. Nëse një lojë e tillë përbëhet vetëm nga lëvizje personale, atëherë kur secili lojtar zbaton strategjinë e tij optimale, ajo duhet të përfundojë në një mënyrë mjaft të caktuar - me një fitim të barabartë me çmimin e lojës. Pra, nëse dihet zgjidhja e lojës, vetë loja humb kuptimin e saj!

Le të marrim një shembull elementar të një loje me informacion të plotë: dy lojtarë vendosin në mënyrë alternative nikelet në një tryezë të rrumbullakët, duke zgjedhur në mënyrë arbitrare pozicionin e qendrës së monedhës (mbivendosje e ndërsjellë e monedhave nuk lejohet). Fitues është ai që vendos qindarkën e fundit (kur nuk ka vend për të tjerët). Është e lehtë të shihet se rezultati i kësaj loje është në thelb një përfundim i paramenduar. Ekziston një strategji e caktuar që siguron që lojtari që vendos monedhën e parë të fitojë.

Domethënë, ai duhet të vendosë një nikel në qendër të tabelës për herë të parë, dhe më pas t'i përgjigjet çdo lëvizjeje të kundërshtarit me një lëvizje simetrike. Natyrisht, sido që të sillet kundërshtari, ai nuk mund të shmangë humbjen. Situata është saktësisht e njëjtë me shahun dhe lojërat me informacion të plotë në përgjithësi: secila prej tyre, e shkruar në formë matrice, ka një pikë shale, dhe për këtë arsye zgjidhja është në strategji të pastra, dhe për këtë arsye ka kuptim vetëm për aq kohë sa kjo zgjidhje ka nuk u gjet. Le të themi lojë shahu ose përfundon gjithmonë me fitore për të bardhët, ose përfundon gjithmonë me fitore për të zinjtë, ose gjithmonë përfundon në barazim, por çfarë saktësisht - nuk e dimë ende (për fat të mirë për adhuruesit e shahut). Le të shtojmë edhe një gjë: vështirë se do ta dimë në të ardhmen e parashikueshme, sepse numri i strategjive është aq i madh sa është jashtëzakonisht e vështirë (nëse jo e pamundur) ta reduktosh lojën në një formë matrice dhe të gjesh një pikë shalë në të.

Dhe tani le të pyesim veten se çfarë të bëjmë nëse loja nuk ka një pikë shalë: Epo, nëse secili lojtar detyrohet të zgjedhë një strategji të vetme të pastër, atëherë nuk ka asgjë për të bërë: ne duhet të udhëhiqemi nga parimi minimal. Një tjetër gjë është nëse mund të "përzieni" strategjitë tuaja, alternoni ato në mënyrë të rastësishme me disa probabilitete. Përdorimi i strategjive të përziera konceptohet në këtë mënyrë: loja përsëritet shumë herë; para çdo loje të lojës, kur lojtarit i jepet një lëvizje personale, ai "ia beson" rastësisë zgjedhjen e tij, "hedh short" dhe merr strategjinë që ka rënë (ne tashmë dimë se si ta organizojmë shortin nga kapitulli i mëparshëm ).

Strategjitë e përziera në teorinë e lojës janë një model i taktikave të ndryshueshme, fleksibël, kur asnjë nga lojtarët nuk e di se si do të sillet kundërshtari në një lojë të caktuar. Kjo taktikë (edhe pse zakonisht pa ndonjë justifikim matematikor) përdoret shpesh në Lojera me letra. Le të theksojmë në të njëjtën kohë se mënyra më e mirë për të fshehur sjelljen tuaj nga armiku është t'i jepni një karakter të rastësishëm dhe, për rrjedhojë, të mos dini paraprakisht se çfarë do të bëni.

Pra, le të flasim për strategji të përziera. Ne do të shënojmë strategjitë e përziera të lojtarëve A dhe B, respektivisht

Në një rast të veçantë, kur të gjitha probabilitetet, përveç njërës, janë të barabarta me zero, dhe kjo është e barabartë me një, strategjia e përzier kthehet në një të pastër.

Ekziston një teoremë themelore e teorisë së lojës: çdo lojë me shumë zero të fundme me dy lojtarë ka të paktën një zgjidhje - një palë strategjish optimale, përgjithësisht të përziera, dhe një çmim përkatës.

Një palë strategjish optimale që formojnë një zgjidhje loje kanë këtë vetinë: nëse njëri nga lojtarët i përmbahet strategjisë së tij optimale, atëherë nuk mund të jetë fitimprurëse që tjetri të devijojë nga e tija. Kjo palë strategjish formon një lloj ekuilibri në lojë: njëri lojtar dëshiron ta kthejë fitimin në maksimum, tjetri - në minimum, secili tërhiqet në drejtimin e tij dhe, me sjellje të arsyeshme të të dyve, një ekuilibër dhe një fitim i qëndrueshëm v janë vendosur. Nëse atëherë loja është e dobishme për ne, nëse - për armikun; kur loja është "e drejtë", po aq e dobishme për të dy pjesëmarrësit.

Shqyrtoni një shembull të një loje pa pikë shale dhe jepni (pa prova) zgjidhjen e saj. Loja është si më poshtë: dy lojtarë A dhe B njëkohësisht dhe pa thënë asnjë fjalë tregojnë një, dy ose tre gishta. Fitimi përcaktohet nga numri i përgjithshëm i gishtërinjve: nëse është çift, A fiton dhe merr nga B një shumë të barabartë me këtë numër; nëse është tek, atëherë, përkundrazi, A i paguan B një shumë të barabartë me këtë numër. Çfarë duhet të bëjnë lojtarët?

Le të krijojmë një matricë loje. Në një lojë, çdo lojtar ka tre strategji: tregoni një, dy ose tre gishta. Matrica 3x3 është dhënë në Tabelën 26.5; kolona shtesë djathtas tregon minimumin e rreshtit dhe rreshti shtesë i poshtëm tregon maksimumin e kolonës.

Çmimi më i ulët i lojës është në përputhje me strategjinë. Kjo do të thotë se me një sjellje të arsyeshme, të kujdesshme, ne garantojmë se nuk do të humbasim më shumë se 3. Ngushëllim i vogël, por gjithsesi më i mirë se, të themi, fitimi - 5, që gjendet në disa qelizat e matricës. Është keq për ne, lojtari L... Por le të ngushëllohemi: pozicioni i kundërshtarit duket të jetë edhe më i keq: çmimi më i ulët i lojës. sjellje të arsyeshme, ai do të na japë një minimum prej 4.