Matematisk spelteori. Exempel på att spela in och lösa spel från livet. Matematisk spelteori Spelteori tillämpas på

Matematisk spelteori, som växte fram på 40-talet av 1900-talet, används oftast inom ekonomi. Men hur kan vi använda begreppet spel för att modellera människors beteende i samhället? Varför studerar ekonomer, i vilket hörn skjuter fotbollsspelare straffar oftare och hur man vinner på "Rock, Paper, Scissors", förklarade lektor vid HSE-avdelningen för mikroekonomisk analys Danil Fedorovykh i sin föreläsning.

John Nash och en blondin i en bar

Ett spel är varje situation där en agents vinst inte bara beror på hans egna handlingar utan också på andra deltagares beteende. Om du spelar patiens hemma, ur en ekonoms och spelteoris synvinkel, är detta inget spel. Det innebär obligatorisk närvaro av en intressekonflikt.

I filmen A Beautiful Mind, om John Nash, nobelpristagaren i ekonomi, finns en scen med en blond kvinna i en bar. Det visar idén som vetenskapsmannen fick priset för - detta är idén om Nash-jämvikt, som han själv kallade kontrolldynamik.

Ett spel- varje situation där agenternas utbetalningar beror på varandra.

Strategi är en beskrivning av spelarens agerande i alla möjliga situationer.

Resultatet är en kombination av valda strategier.

Så ur en teoretisk synvinkel är spelarna i den här situationen bara män, det vill säga de som fattar beslutet. Deras preferenser är enkla: en blondin är bättre än en brunett, och en brunett är bättre än ingenting. Du kan agera på två sätt: gå till en blondin eller till "din" brunett. Spelet består av ett enda drag, beslut fattas samtidigt (det vill säga du kan inte se vart de andra tog vägen och sedan flytta på egen hand). Om någon tjej avvisar en man tar spelet slut: det är omöjligt att återvända till henne eller välja en annan.

Vad är det troliga resultatet av den här spelsituationen? Det vill säga, vad är dess stabila konfiguration från vilken alla kommer att förstå att de gjorde det bästa valet? För det första, som Nash korrekt påpekar, om alla går till blondinen kommer det inte att sluta bra. Därför föreslår forskaren vidare att alla behöver gå till brunetter. Men sedan, om det är känt att alla kommer att gå till brunetter, borde han gå till blondinen, för hon är bättre.

Detta är den sanna balansen - ett resultat där man går till blondinen och resten går till brunetter. Detta kan verka orättvist. Men i en situation av jämvikt kan ingen ångra sitt val: de som går till brunetter förstår att de inte skulle få något av en blondin ändå. Således är en Nash-jämvikt en konfiguration där ingen individuellt vill ändra den strategi som valts av alla. Det vill säga, när man reflekterar i slutet av spelet förstår varje deltagare att även om han visste hur andra hade det så skulle han ha gjort detsamma. Ett annat sätt att kalla det är ett resultat, där varje deltagare reagerar optimalt på de andras handlingar.

"Sten sax påse"

Låt oss titta på andra spel för balans. Till exempel har Rock, Paper, Scissors ingen Nash-jämvikt: i alla möjliga resultat finns det inget alternativ där båda deltagarna skulle vara nöjda med sitt val. Det finns dock ett världsmästerskap och World Rock Paper Scissors Society, som samlar in spelstatistik. Självklart kan du förbättra dina chanser att vinna om du vet något om det allmänna beteendet hos människor i det här spelet.

En ren strategi i ett spel är en där en person alltid spelar på samma sätt och väljer samma drag.

Enligt World RPS Society är sten det vanligaste draget (37,8%). 32,6 % använder papper, 29,6 % använder sax. Nu vet du att du måste välja papper. Men om du spelar med någon som också kan detta behöver du inte längre välja papper, eftersom det samma förväntas av dig. Det finns ett känt fall: 2005 bestämde två auktionshus Sotheby's och Christie's vem som skulle få en mycket stor lott - en samling av Picasso och Van Gogh med ett startpris på 20 miljoner dollar. Ägaren föreslog att de skulle spela Rock, Paper, Scissors, och representanter för husen mailade honom sina alternativ. Sotheby's, som de senare sa, valde tidningen utan större eftertanke. Vann på Christie's. När de fattade ett beslut vände de sig till en expert - den 11-åriga dottern till en av toppcheferna. Hon sa: "Stenen verkar vara den starkaste, det är därför de flesta väljer den. Men om vi inte leker med en helt dum nybörjare kommer han inte att slänga stenen, han förväntar sig att vi gör det, och han kommer själv att slänga pappret. Men vi kommer att tänka ett steg framåt och slänga saxen.”

Således kan du tänka framåt, men detta leder dig inte nödvändigtvis till seger, eftersom du kanske inte är medveten om din motståndares kompetens. Därför är det ibland, istället för rena strategier, mer korrekt att välja blandade, det vill säga fatta beslut slumpmässigt. Sålunda, i "Sten, papper, sax" är jämvikten som vi inte hade funnit tidigare just i blandade strategier: att välja vart och ett av de tre rörelsealternativen med en tredjedels sannolikhet. Om du väljer en sten oftare kommer din motståndare att justera sitt val. Genom att veta detta kommer du att justera din, och balans kommer inte att uppnås. Men ingen av er kommer att börja ändra beteende om alla helt enkelt väljer sten, sax eller papper med lika stor sannolikhet. Detta beror på att det i blandade strategier är omöjligt att förutsäga ditt nästa drag baserat på tidigare handlingar.

Blandad strategi och sport

Det finns många allvarligare exempel på blandade strategier. Till exempel var man servar i tennis eller tar/tar en straff i fotboll. Om du inte vet något om din motståndare eller bara spelar mot olika hela tiden är den bästa strategin att göra saker mer eller mindre slumpmässigt. London School of Economics professor Ignacio Palacios-Huerta publicerade en artikel i American Economic Review 2003, vars essens var att hitta Nash-jämvikten i blandade strategier. Palacios-Huerta valde fotboll som ämne för sin forskning och tittade därför på mer än 1 400 straffar. Naturligtvis i sport är allt mer listigt arrangerat än i "Sten, papper, sax": det tar hänsyn till idrottarens starka ben, slår olika vinklar när man slår med full kraft och liknande. Nash-jämvikten består här av att beräkna alternativ, det vill säga att till exempel bestämma hörnen på målet som man ska skjuta mot för att vinna med större sannolikhet, att känna till dina svagheter och styrkor. Statistik för varje fotbollsspelare och den jämvikt som finns i dem i blandade strategier visade att fotbollsspelare agerar ungefär som ekonomer förutspår. Det är knappast värt att säga att människor som tar straff har läst läroböcker om spelteori och gjort en ganska komplicerad matematik. Troligtvis finns det olika sätt att lära sig att bete sig optimalt: du kan vara en briljant fotbollsspelare och känna vad du ska göra, eller så kan du vara ekonom och leta efter balans i blandade strategier.

2008 träffade professor Ignacio Palacios-Huerta Abraham Grant, Chelsea-tränaren som då spelade i Champions League-finalen i Moskva. Forskaren skrev en lapp till tränaren med rekommendationer för en straffläggning som gällde beteendet hos motståndarmålvakten Edwin van der Sar från Manchester United. Till exempel, enligt statistik, räddade han nästan alltid skott på en genomsnittlig nivå och kastade sig oftare i den naturliga riktningen för att ta en straff. Som vi bestämt ovan är det fortfarande mer korrekt att randomisera ditt beteende med hänsyn till kunskap om din motståndare. När straffresultatet redan var 6:5 borde Nicolas Anelka, Chelsea-anfallaren, ha gjort mål. Pekade på det högra hörnet före skottet och van der Sar verkade fråga Anelka om han skulle skjuta där.

Poängen är att alla Chelseas tidigare skott var riktade mot anfallarens högra hörn. Vi vet inte exakt varför, kanske på grund av råd från en ekonom, att slå i en riktning som är onaturlig för dem, för enligt statistiken är van der Sar mindre redo för detta. De flesta av Chelsea-spelarna var högerhänta: de slog det onaturliga högra hörnet och alla gjorde mål, förutom Terry. Tydligen var strategin att Anelka skulle skjuta där. Men van der Sar verkade förstå detta. Han agerade briljant: han pekade på det vänstra hörnet och sa: "Ska du skjuta där?", vilket förmodligen förskräckte Anelka, eftersom de hade gissat honom. I sista stund bestämde han sig för att agera annorlunda och slog i sin naturliga riktning, vilket var vad van der Sar behövde, som tog detta skott och säkrade Manchesters seger. Denna situation lär ut slumpmässiga val, för annars kan ditt beslut beräknas och du kommer att förlora.

"Fångens dilemma"

Det förmodligen mest kända spelet som startar universitetskurser i spelteori är Fångens Dilemma. Enligt legenden greps två misstänkta för grovt brott och låstes in i separata celler. Det finns bevis för att de förvarade vapen, och det gör att de kan fängslas under en kort tid. Det finns dock inga bevis för att de begått detta fruktansvärda brott. Utredaren berättar för varje individ om förutsättningarna för spelet. Om båda brottslingarna erkänner kommer båda att dömas till fängelse i tre år. Om den ene erkänner och medbrottslingen förblir tyst släpps den som erkänt omedelbart och den andre döms till fängelse i fem år. Om tvärtom den första inte erkänner, och den andra lämnar in honom, kommer den första att hamna i fängelse i fem år, och den andra kommer att släppas omedelbart. Om ingen erkänner kommer båda att avtjäna ett års fängelse för vapeninnehav.

Nash-jämvikten här ligger i den första kombinationen, när båda misstänkta inte förblir tysta och båda går i fängelse i tre år. Allas resonemang är som följer: "om jag talar, kommer jag att gå i fängelse i tre år, om jag förblir tyst, kommer jag att gå i fängelse i fem år. Om den andra förblir tyst är det bättre för mig att säga det också: det är bättre att inte gå i fängelse än att gå i fängelse i ett år." Detta är den dominerande strategin: att tala är fördelaktigt, oavsett vad den andre gör. Det finns dock ett problem med det - det finns ett bättre alternativ, eftersom att vara fängslad i tre år är värre än att fängslas i ett år (om du bara betraktar historien ur deltagarnas synvinkel och inte tar hänsyn till moraliska frågor). Men det är omöjligt att sitta ner i ett år, eftersom det, som vi förstod ovan, är olönsamt för båda brottslingarna att tiga.

Pareto förbättring

Det finns en berömd metafor om marknadens osynliga hand, som tillhör Adam Smith. Han sa att om en slaktare försöker tjäna pengar till sig själv, kommer det att vara bättre för alla: han kommer att göra gott kött, som bagaren kommer att köpa för pengar från försäljningen av bullar, som han i sin tur också måste göra välsmakande så att de säljer . Men det visar sig att denna osynliga hand inte alltid fungerar, och det finns många situationer när alla agerar för sig själva, och alla mår dåligt.

Därför tänker ibland ekonomer och spelteoretiker inte på det optimala beteendet för varje spelare, det vill säga inte på Nash-jämvikten, utan på resultatet där hela samhället kommer att ha det bättre (i Dilemmat består samhället av två kriminella) . Ur denna synvinkel är ett resultat effektivt när det inte finns någon Pareto-förbättring i det, det vill säga det är omöjligt att göra någon bättre utan att göra andra sämre. Om människor bara byter varor och tjänster är detta en Pareto-förbättring: de gör det frivilligt, och det är osannolikt att någon kommer att må dåligt av det. Men ibland, om du bara låter folk interagera och inte ens ingriper, kommer det de kommer fram till inte att vara Pareto-optimalt. Detta är vad som händer i Fångens Dilemma. I den, om vi låter alla agera på det sätt som är fördelaktigt för dem, visar det sig att detta får alla att må dåligt. Det vore bättre för alla om alla agerade mindre än optimalt för sig själva, det vill säga höll tyst.

De vanligas tragedi

The Prisoner's Dilemma är en leksakshistoria. Det är inte en situation du förväntar dig att hamna i, men liknande effekter finns runt omkring oss. Tänk på ett dilemma med många spelare, som ibland kallas allmänningens tragedi. Det är till exempel trafikstockningar på vägarna, och jag bestämmer hur jag ska ta mig till jobbet: med bil eller buss. Resten gör detsamma. Om jag åker bil och alla bestämmer sig för att göra detsamma blir det trafikstockning, men vi kommer dit bekvämt. Om jag åker buss blir det fortfarande bilkö, men resan blir obekväm och inte speciellt snabbare, så det här resultatet blir ännu värre. Om alla i snitt tar bussen, så kommer jag, om jag gör samma sak, dit ganska snabbt utan bilkö. Men åker jag bil under sådana förhållanden så kommer jag också dit snabbt, men också bekvämt. Så förekomsten av en trafikstockning beror inte på mina handlingar. Nash-jämvikten här är i en situation där alla väljer att köra bil. Oavsett vad andra gör är det bättre för mig att välja en bil, för det är okänt om det blir bilkö eller inte, men jag kommer i alla fall dit bekvämt. Detta är den dominerande strategin, så i slutändan kör alla bil, och vi har det vi har. Statens uppgift är att göra att resa med buss är det bästa alternativet för åtminstone vissa, varför det dyker upp avgiftsbelagda entréer till centrum, parkeringsplatser och så vidare.

En annan klassisk historia är väljarens rationella okunnighet. Tänk dig att inte veta utgången av ett val i förväg. Du kan studera alla kandidaternas program, lyssna på debatterna och sedan rösta på den bästa. Den andra strategin är att komma till vallokalen och rösta på måfå eller på den som visades på tv oftare. Vad är det optimala beteendet om min röst aldrig avgör vem som vinner (och i ett land med 140 miljoner människor kommer en röst aldrig att avgöra någonting)? Naturligtvis vill jag att landet ska ha en bra president, men jag vet att ingen längre kommer att studera kandidaternas program noggrant. Att inte slösa tid på detta är därför den dominerande beteendestrategin.

När du blir kallad att komma till en städdag beror det inte på någon individuellt om gården blir ren eller inte: om jag går ut ensam kommer jag inte att kunna städa upp allt, eller om alla kommer ut , då går jag inte ut, för allt kommer att göras utan mig. Ett annat exempel är transport av varor i Kina, som jag lärde mig om i Stephen Landsburgs underbara bok, The Economist on the Couch. För 100-150 år sedan fanns det i Kina ett vanligt sätt att transportera varor: allt veks ihop till en stor kropp, som drogs av sju personer. Kunderna betalade om varorna levererades i tid. Föreställ dig att du är en av dessa sex. Man kan anstränga sig och dra så hårt man kan och gör alla det kommer lasten fram i tid. Om en person inte gör detta kommer alla också i tid. Alla tänker: "Om alla andra drar så bra som de borde, varför skulle jag göra det, och om alla andra inte drar så hårt som de kan, då kommer jag inte att kunna ändra någonting." Som ett resultat var allt mycket dåligt med leveranstiden, och lastarna själva hittade en väg ut: de började anställa den sjunde och betala honom pengar för att piska de lata människorna med en piska. Själva närvaron av en sådan person tvingade alla att arbeta så hårt de kunde, för annars skulle alla hamna i en dålig jämvikt från vilken ingen med lönsamhet kunde fly.

Samma exempel kan observeras i naturen. Ett träd som växer i en trädgård skiljer sig från ett som växer i en skog i sin krona. I det första fallet omger det hela stammen, i det andra ligger det bara på toppen. I skogen är detta en Nash-jämvikt. Om alla träd kom överens och växte likadant skulle de fördela antalet fotoner lika, och alla skulle ha det bättre. Men det är inte lönsamt för någon individ att göra detta. Därför vill varje träd växa lite högre än de runt omkring.

Engagemang enhet

I många situationer kan en av deltagarna i spelet behöva ett verktyg som övertygar andra om att han inte bluffar. Det kallas en engagemang. Till exempel förbjuder lagen i vissa länder att betala lösen till kidnappare för att minska motivationen hos brottslingarna. Denna lagstiftning fungerar dock ofta inte. Om din släkting blir tillfångatagen och du har möjlighet att rädda honom genom att kringgå lagen så gör du det. Låt oss föreställa oss en situation där lagen kan kringgås, men släktingarna är fattiga och har ingenting att betala lösen. Brottslingen har två alternativ i den här situationen: släpp eller döda offret. Han gillar inte att döda, men han gillar inte fängelse längre. Det frigivna offret kan i sin tur antingen vittna så att kidnapparen straffas, eller förbli tyst. Det bästa resultatet för brottslingen är att släppa offret om han inte lämnar in honom. Offret vill släppas och vittna.

Balansen här är att terroristen inte vill bli gripen, vilket innebär att offret dör. Men detta är inte en Pareto-jämvikt, eftersom det finns ett alternativ där alla har det bättre - offret i frihet förblir tyst. Men för att göra detta är det nödvändigt att se till att det är fördelaktigt för henne att vara tyst. Någonstans läste jag ett alternativ där hon kan be en terrorist att ordna en erotisk fotografering. Om brottslingen fängslas kommer hans medbrottslingar att lägga upp fotografier på Internet. Om nu kidnapparen förblir fri är detta dåligt, men fotografier i det offentliga området är ännu värre, så det finns en balans. För offret är detta ett sätt att överleva.

Andra spelexempel:

Bertrand modell

Eftersom vi pratar om ekonomi, låt oss titta på ett ekonomiskt exempel. I Bertrand-modellen säljer två butiker samma produkt och köper den från tillverkaren till samma pris. Om priserna i butikerna är desamma, är deras vinster ungefär densamma, för då väljer köparna en butik slumpmässigt. Den enda Nash-jämvikten här är att sälja produkten till självkostnadspris. Men butiker vill tjäna pengar. Därför, om man sätter priset till 10 rubel, kommer den andra att minska det med ett öre, och därmed fördubbla sin inkomst, eftersom alla köpare kommer att gå till honom. Därför är det fördelaktigt för marknadsaktörer att sänka priserna och därigenom fördela vinster mellan sig.

Kör på en smal väg

Låt oss titta på exempel på att välja mellan två möjliga jämvikter. Föreställ dig att Petya och Masha kör mot varandra längs en smal väg. Vägen är så smal att de båda måste dra över vid sidan av vägen. Om de bestämmer sig för att svänga åt vänster eller höger, kommer de helt enkelt att flytta isär. Om den ena svänger höger och den andra svänger vänster, eller vice versa, inträffar en olycka. Hur väljer man var man ska flytta? För att hjälpa till att hitta balans i sådana spel finns det till exempel trafikregler. I Ryssland måste alla svänga höger.

I spelet Chicken, när två personer kör i hög hastighet mot varandra, finns det också två jämvikter. Om båda stannar vid sidan av vägen uppstår en situation som kallas Chicken out; om båda inte stannar, dör de i en fruktansvärd olycka. Om jag vet att min motståndare går rakt, är det fördelaktigt för mig att flytta över för att överleva. Om jag vet att min motståndare kommer att lämna, då är det lönsamt för mig att gå direkt så att jag kan få 100 dollar senare. Det är svårt att förutsäga vad som faktiskt kommer att hända, men varje spelare har sin egen metod för att vinna. Tänk att jag fixade ratten så att den inte går att vrida, och visade detta för min motståndare. Att veta att jag inte har något val kommer motståndaren att hoppa iväg.

QWERTY-effekt

Ibland kan det vara väldigt svårt att gå från en jämvikt till en annan, även om det innebär nytta för alla. QWERTY-layouten har utformats för att sakta ner skrivhastigheten. För om alla skrev för fort skulle skrivmaskinshuvudena som träffade pappret haka på varandra. Därför placerade Christopher Scholes bokstäver som ofta låg intill varandra på längsta möjliga avstånd. Om du går till tangentbordsinställningarna på din dator kan du välja Dvorak-layouten där och skriva mycket snabbare, eftersom det inte är några problem med analoga skrivmaskiner nu. Dvorak förväntade sig att världen skulle byta till hans tangentbord, men vi lever fortfarande med QWERTY. Naturligtvis, om vi bytte till Dvorak-layouten, skulle framtida generationer vara oss tacksamma. Vi skulle alla anstränga oss och lära oss om, och resultatet skulle bli en jämvikt där alla skriver snabbt. Nu är vi också i balans – på ett dåligt sätt. Men det är inte fördelaktigt för någon att vara den enda som omskolar sig, eftersom det kommer att vara obekvämt att arbeta på någon annan dator än en personlig.

Som ett resultat av att studera detta kapitel bör studenten:

känna till

Spelbegrepp baserade på dominansprincipen, Nash-jämvikt, vad är bakåtinduktion etc.; konceptuella tillvägagångssätt för att lösa spelet, innebörden av begreppet rationalitet och jämvikt inom ramen för interaktionsstrategi;

kunna

Skilj mellan spel i strategiska och detaljerade former, bygg ett "spelträd"; formulera spelmodeller för konkurrens för olika typer av marknader;

egen

Metoder för att bestämma spelresultat.

Spel: grundläggande begrepp och principer

Det första försöket att skapa en matematisk teori om spel gjordes 1921 av E. Borel. Som ett självständigt vetenskapsområde presenterades spelteorin först systematiskt i monografin av J. von Neumann och O. Morgenstern "Game Theory and Economic Behavior" 1944. Sedan dess har många grenar av ekonomisk teori (till exempel teorin om ofullkomlig konkurrens, teorin om ekonomiska incitament etc.) .) utvecklats i nära kontakt med spelteorin. Spelteori används också framgångsrikt inom samhällsvetenskap (till exempel analys av röstningsförfaranden, sökning efter jämviktsbegrepp som bestämmer kooperativa och icke-samarbetande beteenden hos individer). Väljare föredrar vanligtvis kandidater som representerar extrema åsikter, men det är en kamp när man väljer en av två kandidater som erbjuder olika kompromisser. Till och med Rousseaus idé om evolution från "naturlig frihet" till "medborgerlig frihet" motsvarar formellt sett, ur spelteoretisk synvinkel, samarbetssynpunkt.

Ett spelär en idealiserad matematisk modell av det kollektiva beteendet hos flera individer (spelare) vars intressen är olika, vilket ger upphov till konflikter. Konflikt innebär inte nödvändigtvis förekomsten av antagonistiska motsättningar mellan parterna, utan är alltid förknippad med någon form av oenighet. En konfliktsituation kommer att vara antagonistisk om en ökning av en av parternas vinster med ett visst belopp leder till en minskning av den andra sidans vinster med samma belopp och vice versa. Antagonism av intressen ger upphov till konflikter, och sammanträffande av intressen reducerar spelet till samordning av handlingar (samarbete).

Exempel på en konfliktsituation är situationer som uppstår i förhållandet mellan en köpare och en säljare; under konkurrensförhållanden mellan olika företag; under stridsoperationer etc. Exempel på spel är vanliga spel: schack, dam, kort, sällskapsspel etc. (därav namnet "spelteori" och dess terminologi).

I de flesta spel som härrör från analys av finansiella, ekonomiska och administrativa situationer är spelarnas (parternas) intressen varken strikt antagonistiska eller helt sammanfallande. Köpare och säljare är överens om att det ligger i deras ömsesidiga intresse att komma överens om köp och försäljning, men de förhandlar kraftfullt om ett specifikt pris inom ramen för ömsesidig nytta.

Spel teoriär en matematisk teori om konfliktsituationer.

Spelet skiljer sig från en verklig konflikt genom att det spelas enligt vissa regler. Dessa regler fastställer sekvensen av drag, mängden information varje sida har om den andras beteende och resultatet av spelet beroende på den aktuella situationen. Reglerna fastställer också slutet på spelet när en viss sekvens av drag redan har gjorts och inga fler drag är tillåtna.

Spelteori, som vilken matematisk modell som helst, har sina begränsningar. En av dem är antagandet om fullständig (ideal) intelligens hos motståndare. I verkliga konflikter är ofta den bästa strategin att gissa vad fienden är dum om och använda den dumheten till din fördel.

En annan nackdel med spelteorin är att varje spelare måste känna till alla möjliga handlingar (strategier) hos motståndaren. Det är bara okänt vilka av dem han kommer att använda i ett givet spel. I en verklig konflikt är detta vanligtvis inte fallet: listan över alla möjliga strategier för fienden är exakt okänd, och den bästa lösningen i en konfliktsituation är ofta att gå utanför gränserna för de strategier som fienden känner till, för att "bedöva" honom med något helt nytt, oförutsett.

Spelteorin inkluderar inte de riskelement som oundvikligen följer med rimliga beslut i verkliga konflikter. Det bestämmer det mest försiktiga återförsäkringsbeteendet för parterna i konflikten.

Dessutom, inom spelteorin, hittas optimala strategier baserat på en indikator (kriterium). I praktiska situationer är det ofta nödvändigt att inte ta hänsyn till ett, utan flera numeriska kriterier. En strategi som är optimal för en indikator kanske inte är optimal för andra.

Genom att vara medveten om dessa begränsningar och därför inte blint följa de rekommendationer som spelteorierna ger, är det fortfarande möjligt att utveckla en helt acceptabel strategi för många verkliga konfliktsituationer.

För närvarande bedrivs vetenskaplig forskning som syftar till att utöka tillämpningsområdena för spelteori.

Följande definitioner av de element som utgör spelet finns i litteraturen.

Spelare- dessa är ämnen involverade i interaktion, representerade i form av ett spel. I vårt fall är dessa hushåll, företag och myndigheter. Men i händelse av osäkerhet om yttre omständigheter är det ganska bekvämt att representera de slumpmässiga komponenterna i spelet, oberoende av spelarnas beteende, som "naturens handlingar".

Spelets regler. Reglerna för ett spel hänvisar till de uppsättningar av åtgärder eller drag som är tillgängliga för spelare. I det här fallet kan åtgärderna vara mycket olika: köparnas beslut om volymen av köpta varor eller tjänster; företag - på produktionsvolymer; den skattenivå som regeringen fastställt.

Fastställande av resultatet (resultatet) av spelet. För varje kombination av spelaråtgärder bestäms resultatet av spelet nästan mekaniskt. Resultatet kan vara: sammansättningen av konsumentkorgen, vektorn för företagets produktion eller en uppsättning andra kvantitativa indikatorer.

Vinster. Innebörden av begreppet vinna kan variera för olika typer av spel. I det här fallet är det nödvändigt att tydligt skilja mellan vinster mätta på en ordinalskala (till exempel nyttonivån) och värden för vilka intervalljämförelse är meningsfull (till exempel vinst, nivå av välbefinnande).

Information och förväntningar. Osäkerhet och ständigt föränderlig information kan ha en extremt allvarlig inverkan på de möjliga resultaten av en interaktion. Det är därför det är nödvändigt att ta hänsyn till informationens roll i utvecklingen av spelet. I detta avseende kommer konceptet i förgrunden informationsuppsättning spelare, dvs. helheten av all information om spelets tillstånd som han har vid viktiga ögonblick i tiden.

När man överväger spelares tillgång till information, den intuitiva idén om delad kunskap, eller publicitet, betyder följande: ett faktum är allmänt känt om alla spelare är medvetna om det och alla spelare vet att andra spelare också vet om det.

För fall där tillämpningen av begreppet allmän kunskap inte räcker, begreppet individ förväntningar deltagare - idéer om hur spelsituationen är i detta skede.

I spelteorin antar man att ett spel består av rör sig, utförs av spelare samtidigt eller sekventiellt.

Rörelser är personliga och slumpmässiga. Flytten kallas personlig, om en spelare medvetet väljer det från en uppsättning möjliga alternativ för åtgärder och utför det (till exempel alla drag i ett schackspel). Flytten kallas slumpmässig, om dess val inte görs av spelaren, utan av någon slumpmässig urvalsmekanism (till exempel baserat på resultatet av att kasta ett mynt).

Uppsättningen av drag som spelarna tar från början till slutet av spelet kallas fest.

Ett av spelteorins grundläggande begrepp är begreppet strategi. Strategi En spelare är en uppsättning regler som bestämmer valet av handling för varje personligt drag, beroende på situationen som uppstår under spelet. I enkla (en-drag) spel, när en spelare bara kan göra ett drag i varje spel, sammanfaller konceptet med strategi och möjlig handling. I det här fallet täcker uppsättningen av spelarstrategier alla hans möjliga handlingar, och alla möjliga för spelaren i handling är hans strategi. I komplexa (multi-turn-spel) kan begreppen "alternativ för möjliga åtgärder" och "strategi" skilja sig från varandra.

Spelarens strategi kallas optimal, om det ger en given spelare flera upprepningar av spelet maximalt möjliga genomsnittliga vinst eller minsta möjliga genomsnittliga förlust, oavsett vilka strategier motståndaren använder. Andra optimalitetskriterier kan användas.

Det är möjligt att strategin som ger maximal vinst inte har en annan viktig representation av optimalitet, såsom stabiliteten (jämvikten) hos lösningen. Lösningen på spelet är hållbar(jämvikt) om de strategier som motsvarar detta beslut bildar en situation som ingen av spelarna är intresserad av att ändra.

Låt oss upprepa att spelteorins uppgift är att hitta optimala strategier.

Klassificeringen av spel presenteras i fig. 8.1.

  • 1. Beroende på typen av drag delas spel in i strategiska och hasardspel. Spelande spel består endast av slumpmässiga drag, som spelteorin inte behandlar. Om det, tillsammans med slumpmässiga drag, finns personliga drag eller alla drag är personliga, så kallas sådana spel strategisk.
  • 2. Beroende på antalet spelare delas spel in i dubbelspel och multipla spel. I dubbelspel antalet deltagare är två, in flera olika- mer än två.
  • 3. Deltagare i ett multipelspel kan bilda koalitioner, både permanenta och tillfälliga. Baserat på karaktären av relationerna mellan spelare delas spel in i icke-koalition, koalition och kooperativ.

Icke-koalitionell Det är spel där spelare inte har rätt att ingå avtal eller bilda koalitioner, och målet för varje spelare är att få största möjliga individuella vinst.

Spel där spelarnas handlingar syftar till att maximera vinsterna för grupper (koalitioner) utan att deras efterföljande uppdelning mellan spelarna kallas koalition.

Ris. 8.1.

Resultatet kooperativ Spelet är uppdelningen av koalitionens vinster, som inte uppstår som en konsekvens av vissa handlingar från spelarna, utan som ett resultat av deras förutbestämda överenskommelser.

I enlighet med detta är det i kooperativa spel inte situationer som jämförs med preferenser, vilket är fallet i icke-kooperativa spel, utan divisioner; och denna jämförelse är inte begränsad till att överväga individuella vinster, utan är mer komplex.

  • 4. Enligt antalet strategier för varje spelare delas spel in i slutlig(antalet strategier för varje spelare är begränsat) och ändlös(uppsättningen strategier för varje spelare är oändlig).
  • 5. Enligt mängden information som är tillgänglig för spelare angående tidigare drag, delas spel in i spel med fullständig information(all information om tidigare drag finns) och ofullständig information. Exempel på spel med fullständig information inkluderar schack, dam, etc.
  • 6. Baserat på typen av spelbeskrivningar delas de in i positionsspel (eller spel i utökad form) och spel i normal form. Positionsspel ges i form av ett spelträd. Men vilket lägesspel som helst kan reduceras till normal form, där varje spelare endast gör ett oberoende drag. I positionsspel görs drag vid diskreta ögonblick i tiden. Existera differentialspel, där rörelser görs kontinuerligt. Dessa spel studerar problemet med att jaga ett kontrollerat objekt av ett annat kontrollerat objekt, med hänsyn till dynamiken i deras beteende, vilket beskrivs av differentialekvationer.

Det finns också reflekterande spel, som överväger situationer med hänsyn till den mentala reproduktionen av fiendens möjliga handlingssätt och beteende.

7. Om något möjligt spel i något spel har en nollsumma av vinster av alla N players(), då pratar vi om nollsummespel. Annars heter spelen spel med icke-nollsumma.

Uppenbarligen är ett nollsummepar spel antagonistisk, eftersom vinsten för en spelare är lika med förlusten för den andra, och därför är dessa spelares mål direkt motsatta.

Ett ändligt nollsummeparspel kallas matrisspel. Ett sådant spel beskrivs av en utdelningsmatris där den första spelarens vinster specificeras. Matrisens radnummer motsvarar numret på den första spelarens tillämpade strategi, kolumnen – numret på den andra spelarens tillämpade strategi; i skärningspunkten mellan raden och kolumnen finns motsvarande vinst för den första spelaren (förlust av den andra spelaren).

Ett ändligt icke-nollsummespel kallas bimatrix spel. Ett sådant spel beskrivs av två utdelningsmatriser, var och en för motsvarande spelare.

Låt oss ta följande exempel. Spelet "Test". Låt spelare 1 vara en elev som förbereder sig för provet och spelare 2 vara en lärare som gör provet. Vi kommer att anta att eleven har två strategier: A1 – förbereda sig väl inför provet; A 2 – inte förberedd. Läraren har också två strategier: B1 – ge ett prov; B 2 – ge inte kredit. Grunden för att bedöma värdena på spelarnas utdelning kan baseras på till exempel följande överväganden som återspeglas i utdelningsmatriserna:

Detta spel, i enlighet med ovanstående klassificering, är strategiskt, parat, icke-samarbetsvilligt, ändligt, beskrivet i normal form, med en summa som inte är noll. Mer kortfattat kan detta spel kallas bimatrix.

Uppgiften är att fastställa de optimala strategierna för eleven och för läraren.

Ytterligare ett exempel på det välkända bimatrisspelet "Prisoner's Dilemma".

Var och en av de två spelarna har två strategier: A 2 och B 2 – strategier för aggressivt beteende, a A jag och B i – fredligt beteende. Låt oss anta att "fred" (båda spelarna är fredliga) är bättre för båda spelarna än "krig". Fallet när en spelare är aggressiv och den andra är fredlig är mer lönsamt för angriparen. Låt utdelningsmatriserna för spelare 1 och 2 i detta bimatrisspel ha formen

För båda spelarna dominerar aggressiva strategier A2 och B2 fredliga strategier A och B v Den enda jämvikten i de dominerande strategierna har alltså formen (A2, B 2), dvs. det postuleras att resultatet av icke-samarbetsvilligt beteende är krig. Samtidigt ger utfallet (A1, B1) (världen) en större utdelning för båda spelarna. Således kommer icke-samarbetsvilligt egoistiskt beteende i konflikt med kollektiva intressen. Kollektiva intressen dikterar valet av fredliga strategier. Samtidigt, om spelarna inte utbyter information, är krig det mest troliga resultatet.

I detta fall är situationen (A1, B1) Pareto optimal. Denna situation är dock instabil, vilket leder till möjligheten att spelare bryter mot det etablerade avtalet. Faktum är att om den första spelaren bryter avtalet, men den andra inte gör det, kommer den första spelarens utdelning att öka till tre, och den andra kommer att sjunka till noll, och vice versa. Dessutom förlorar varje spelare som inte bryter mot avtalet mer när den andra spelaren bryter mot avtalet än i fallet när de båda bryter mot avtalet.

Det finns två huvudformer av spelet. Spel av omfattande form presenteras som ett beslutsfattande träddiagram, med "roten" som motsvarar startpunkten för spelet, och början på varje ny "gren", kallad Knut,– staten uppnått i detta skede med dessa åtgärder som redan vidtagits av spelarna. Varje sista nod – varje slutpunkt i spelet – tilldelas en utdelningsvektor, en komponent för varje spelare.

Strategisk, annars kallas normal, form Representationen av spelet motsvarar en flerdimensionell matris, där varje dimension (i det tvådimensionella fallet, rader och kolumner) inkluderar en uppsättning möjliga åtgärder för en agent.

En separat cell i matrisen innehåller en vektor av vinster som motsvarar en given kombination av spelarstrategier.

I fig. 8.2 visar den omfattande formen av spelet och tabellen. 8.1 – strategisk form.

Ris. 8.2.

Tabell 8.1. Spel med samtidigt beslutsfattande i strategisk form

Det finns en ganska detaljerad klassificering av komponenterna i spelteorin. Ett av de mest allmänna kriterierna för en sådan klassificering är uppdelningen av spelteori i teorin om icke-kooperativa spel, där ämnena för beslutsfattande är individerna själva, och teorin om kooperativa spel, där beslutsämnena -making är grupper eller koalitioner av individer.

Icke-kooperativa spel presenteras vanligtvis i normala (strategiska) och utökade (omfattande) former.

  • Vorobyov N. N. Spelteori för eko-cyberetiker. M.: Nauka, 1985.
  • Ventzel E.S. Operationsforskning. M.: Nauka, 1980.

Från den populära amerikanska bloggen Cracked.

Spelteori handlar om att studera sätt att göra det bästa draget och, som ett resultat, få en så stor del av den vinnande kakan som möjligt genom att skära av en del av den från andra spelare. Den lär dig att analysera många faktorer och dra logiskt balanserade slutsatser. Jag tycker att det ska studeras efter siffror och före alfabetet. Helt enkelt för att för många människor fattar viktiga beslut utifrån intuition, hemliga profetior, stjärnornas placering och liknande. Jag har noggrant studerat spelteori, och nu vill jag berätta om dess grunder. Kanske kommer detta att tillföra lite sunt förnuft till ditt liv.

1. Fångens dilemma

Berto och Robert greps för bankrån efter att ha misslyckats med att använda en stulen bil på rätt sätt för att fly. Polisen kan inte bevisa att det var de som rånade banken, men de tog dem på bar gärning i en stulen bil. De fördes till olika rum och var och en erbjöds en överenskommelse: att överlämna en medbrottsling och skicka honom till fängelse i 10 år och att själv släppas. Men om de båda förråder varandra, kommer var och en att få 7 år. Om ingen säger något så kommer båda att få fängelse i 2 år bara för bilstöld.

Det visar sig att om Berto förblir tyst, men Robert överlämnar honom, hamnar Berto i fängelse i 10 år och Robert går fri.

Varje fånge är en spelare, och allas fördel kan uttryckas som en "formel" (vad de båda får, vad den andre får). Till exempel, om jag slår dig, skulle mitt vinnande mönster se ut så här (jag får en grov vinst, du lider mycket smärta). Eftersom varje fånge har två alternativ kan vi presentera resultaten i en tabell.

Praktisk tillämpning: Identifiera sociopater

Här ser vi den huvudsakliga tillämpningen av spelteori: identifiera sociopater som bara tänker på sig själva. Sann spelteori är ett kraftfullt analytiskt verktyg, och amatörism fungerar ofta som en röd flagga som flaggar för någon som inte har någon hederskänsla. Människor som gör intuitiva beräkningar tror att det är bättre att göra något fult eftersom det kommer att resultera i ett kortare fängelsestraff oavsett vad den andra spelaren gör. Tekniskt sett är detta korrekt, men bara om du är en kortsynt person som värderar siffror över människoliv. Det är därför spelteorin är så populär inom finans.

Det verkliga problemet med fångens dilemma är att den ignorerar uppgifterna. Till exempel tar den inte hänsyn till möjligheten att du träffar vänner, släktingar eller ens borgenärer till den person du skickade till fängelse i 10 år.

Det värsta är att alla inblandade i fångens dilemma agerar som om de aldrig hört talas om det.

Och det bästa draget är att vara tyst och efter två år, tillsammans med en god vän, använda samma pengar.

2. Dominerande strategi

Detta är en situation där dina handlingar ger den största utdelningen, oavsett vad din motståndare gör. Oavsett vad som händer gjorde du allt rätt. Det är därför många människor med Fångens Dilemma tror att svek leder till det "bästa" resultatet oavsett vad den andra personen gör, och okunnigheten om verkligheten som ligger i denna metod gör att det ser superlätt ut.

De flesta av spelen vi spelar har inte strikt dominerande strategier, för annars skulle de vara hemska. Tänk om du alltid gjorde samma sak. Det finns ingen dominerande strategi i spelet sten-papper-sax. Men om du lekte med en person som hade ugnsvantar på och bara kunde visa sten eller papper, skulle du ha en dominerande strategi: papper. Ditt papper kommer att slå in hans sten eller resultera i oavgjort, och du kan inte förlora eftersom din motståndare inte kan visa sax. Nu när du har en dominerande strategi skulle du vara dum om du provade något annat.

3. Kampen mellan könen

Spel är mer intressanta när de inte har en strikt dominerande strategi. Till exempel könens kamp. Anjali och Borislav går på dejt, men kan inte välja mellan balett och boxning. Anjali älskar boxning eftersom hon tycker om att se blod flöda till glädje för en skrikande skara åskådare som tror att de är civiliserade bara för att de betalat för att någons huvud ska krossas.

Borislav vill titta på balett eftersom han förstår att ballerinor går igenom ett stort antal skador och svår träning, med vetskapen om att en skada kan göra slut på allt. Balettdansare är de största idrottarna på jorden. En ballerina kan sparka dig i huvudet, men hon kommer aldrig att göra det, eftersom hennes ben är värt mycket mer än ditt ansikte.

Var och en av dem vill gå till sitt favoritevenemang, men de vill inte njuta av det ensamma, så deras vinnande mönster är: högsta värde är att göra vad de vill, lägsta värde är att bara vara med en annan person, och noll är att vara ensam .

Vissa människor föreslår envis brinksmanship: om du gör vad du vill oavsett vad, måste den andra personen anpassa sig till ditt val eller förlora allt. Som jag redan sa, förenklad spelteori är bra på att identifiera dårar.

Praktisk användning: Undvik skarpa hörn

Naturligtvis har denna strategi också sina betydande nackdelar. För det första, om du behandlar din dejting som en "kamp mellan könen", kommer det inte att fungera. Bryt upp så att var och en av er kan hitta någon de gillar. Och det andra problemet är att deltagarna i den här situationen är så osäkra på sig själva att de inte kan göra detta.

Den verkligt vinnande strategin för alla är att göra vad de vill. och efter, eller nästa dag, när de är lediga, gå till ett café tillsammans. Eller växla mellan boxning och balett tills en revolution sker i underhållningsvärlden och boxningsbalett uppfinns.

4. Nash-jämvikt

En Nash-jämvikt är en uppsättning rörelser där ingen vill göra något annorlunda i efterhand. Och om vi kan få det att fungera kommer spelteorin att ersätta hela det filosofiska, religiösa och finansiella systemet på planeten, eftersom "lusten att inte gå sönder" har blivit en mer kraftfull drivkraft för mänskligheten än eld.

Låt oss snabbt dela upp $100. Du och jag bestämmer hur många av de hundra vi kräver och aviserar samtidigt beloppen. Om vår totalsumma är mindre än hundra får alla som de ville. Om summan är mer än hundra får den som bett om det minsta beloppet det belopp han ville ha, och den girigare får det som är kvar. Om vi ​​ber om samma summa får alla $50. Hur mycket kommer du att fråga? Hur ska du dela upp pengarna? Det finns bara ett vinnande drag.

Att kräva $51 ger dig det maximala beloppet oavsett vad din motståndare väljer. Om han ber om mer får du $51. Om han ber om $50 eller $51, får du $50. Och om han ber om mindre än $50 får du $51. Hur som helst, det finns inget annat alternativ som ger dig mer pengar än det här. Nash-jämvikt - en situation där vi båda väljer $51.

Praktisk tillämpning: Tänk först

Detta är hela poängen med spelteorin. Du behöver inte vinna, än mindre skada andra spelare, men du måste göra det bästa draget för dig själv, oavsett vad de runt omkring dig har i beredskap för dig. Och det är ännu bättre om detta drag är fördelaktigt för andra spelare. Det är den här typen av matematik som kan förändra samhället.

En intressant variant av denna idé är att dricka, som kan kallas en tidsberoende Nash Equilibrium. När du dricker tillräckligt bryr du dig inte om andra människors handlingar oavsett vad de gör, men dagen efter ångrar du verkligen att du inte gjorde något annorlunda.

5. Kasta spel

Kasten spelas mellan spelare 1 och spelare 2. Varje spelare väljer samtidigt huvuden eller svansar. Om de gissar rätt får spelare 1 spelare 2:s öre. Om inte får spelare 2 spelare 1s mynt.

Den vinnande matrisen är enkel...

...optimal strategi: spela helt slumpmässigt. Det är svårare än du tror eftersom valet måste vara helt slumpmässigt. Om du har en heads eller tails preferens kan din motståndare använda den för att ta dina pengar.

Naturligtvis är det verkliga problemet här att det skulle vara mycket bättre om de bara kastade en krona på varandra. Som ett resultat skulle deras vinster bli desamma, och det resulterande traumat kan hjälpa dessa olyckliga människor att känna något annat än fruktansvärd tristess. Detta är trots allt det sämsta spelet någonsin. Och det här är den idealiska modellen för en straffläggning.

Praktisk tillämpning: Påföljd

I fotboll, hockey och många andra matcher är förlängning en straffläggning. Och de skulle vara mer intressanta om de var baserade på hur många gånger spelare i full form kunde göra vagnhjulet, för det skulle åtminstone vara en indikator på deras fysiska förmåga och skulle vara kul att titta på. Målvakter kan inte tydligt bestämma rörelsen av en boll eller puck i början av dess rörelse, eftersom robotar tyvärr fortfarande inte deltar i våra sporttävlingar. Målvakten måste välja vänster eller höger riktning och hoppas att hans val stämmer överens med motståndarens val som skjuter i mål. Detta har något gemensamt med att spela mynt.

Observera dock att detta inte är ett perfekt exempel på likheten med spelet med huvuden och svansar, för även med rätt riktning kanske målvakten inte fångar bollen och angriparen kanske inte träffar målet.

Så vad är vår slutsats enligt spelteorin? Bollspel ska avslutas på ett "multi-ball" sätt, där en-mot-en-spelare varje minut får en extra boll/puck tills ena sidan uppnår ett visst resultat, vilket är en indikation på spelarnas verkliga skicklighet, och inte en spektakulär slumpmässig slump.

I slutet av dagen bör spelteori användas för att göra spelet smartare. Vilket betyder att det är bättre.

Vad är fria radikaler?

Varför, om man blandar alla färger, får man brunt och inte vitt, eftersom vitt innehåller alla färger?

7 oväntade fakta om världen omkring oss

Fantastisk värld

10 fantastiska fakta om hundtänkande

En hund är en mans vän och lär sig ofta något av honom

I varje situation följer vi en viss strategi. Detta sker vanligtvis omedvetet, därav de frekventa misstagen. Du kan undvika dem om du lär dig att gissa en annan persons handlingar.

Ta dejting till exempel. Vi väljer alla en huvudstrategi: vi försöker dölja negativa karaktärsdrag och visa positiva.

För nu ska jag inte berätta att jag gillar att ligga ner med en öl på soffan varje kväll. Jag säger till när hon lär känna mig bättre och förstår att jag annars mår bra.

Pavel, soffexpert

En sådan strategi är snarare inte en lögn, utan en tystnad.

Exempel

Föreställ dig situationen: en man och en kvinna har dejtat i flera månader och en dag... Mannen har en liten lägenhet, så det är logiskt att vi pratar om att flytta in i en kvinnas lägenhet.

Det ska sägas att mannen jobbar som ekonom. Han analyserade situationen och insåg att det ännu inte var lönsamt att vägra hyra en lägenhet. Nu betalar han lite pengar och om förhållandet går sönder hittar han inte ett lika bra alternativ. Kvinnan, som har lärt sig om detta, lämnar omedelbart herrn.

Vad gjorde det här paret för fel? Mannen, efter att ha beräknat situationen korrekt ur ekonomisk synvinkel, tog inte hänsyn till den psykologiska faktorn. Kvinnan uppfattade gesten med lägenheten som lättsinniga avsikter. Men hon tänkte inte på det faktum att hennes pojkvän, en ekonom, därför fattar beslut i första hand utifrån positionen "lönsam eller olönsam". Därmed förlorades detta spel av båda deltagarna.

Vad ska man göra

Beräkna inte bara dina handlingar utan också andra människors reaktioner. Fråga dig själv ofta: hur kan du tolka min handling? Råd speciellt för män: förklara dina handlingar och kom ihåg att all återhållsamhet är en anledning för din andra hälft att fantisera. Strategiskt tänkande är inte bara matematik, utan också psykologi!

2. Spel för 90 poäng

Gåtor, uppdrag och logik kommer inte längre att vara ett problem efter att ha studerat spelteori. Du kommer att lära dig att söka efter alla befintliga svarsalternativ och välja det lämpligaste bland dem.

Exempel

Två studenter bad professorn att skjuta upp tentamen. De berättade en hjärtskärande historia om hur de åkte till en annan stad för helgen, men på vägen tillbaka fick de punktering. De var tvungna att söka hjälp hela natten, så de fick inte tillräckligt med sömn och mådde inte bra. (Faktum är att vänner firade slutet av sessionen, och det här provet var det sista och inte det svåraste.)

Professorn höll med. Nästa dag satte han eleverna i olika klassrum och delade ut ett papper med bara två frågor. Det första kostade bara 10 poäng och det andra kostade 90 och lät så här: "Vilket däck är punkterat?"

Om du litar på logik kommer svaret att vara "Höger framhjul": det är till höger, närmare sidan av vägen, som oftast ligger något skräp, vilket är det första som träffas av framdäck. Men skynda dig inte.

I den här situationen är det viktigt att inte ge så mycket det korrekta (logiska) svaret, utan svaret som kommer att skrivas på en väns papper.

Därför är det uppenbart att båda eleverna kommer att göra gissningar utifrån antagandet att den andra tycker.

Vi kan tänka så här: har eleverna något "gemensamt" med ett av hjulen? För kanske ett år sedan var de redan tvungna att byta däck tillsammans. Eller så är det ena däcket spacklat med färg, och båda eleverna vet om det. Om ett sådant ögonblick hittas är det här alternativet värt att välja. Även om en annan elev inte är bekant med spelteori kan han komma ihåg denna händelse och peka på rätt hjul.

Vad ska man göra

I ditt resonemang, lita inte bara på logik, utan också på livsförhållanden. Kom ihåg: inte allt som är logiskt för dig är också logiskt för någon annan. Involvera vänner och familj i tankespel oftare. Detta gör att du kan förstå hur människor nära dig tänker och i framtiden undvika svåra situationer, som i exemplet ovan.

3. Leker med dig själv

Kunskap om strategiska spel hjälper dig att analysera dina egna beslut djupare.

Exempel

En viss Olga bestämmer om hon ska försöka röka eller inte.

Spelträd

Bilden visar det så kallade spelträdet: det är användbart att rita det varje gång du behöver fatta ett beslut. Grenarna på detta träd är alternativ för utveckling av händelser. Siffrorna (0, 1 och -1) är vinsterna, det vill säga om spelaren blir en vinnare om han väljer ett eller annat alternativ.

Så var ska man börja. Först måste du bestämma vilken lösning som är den bästa och den sämsta. Låt oss anta att Olgas bästa händelseförlopp är att försöka röka, men att inte fortsätta med det. Låt oss tilldela en utdelning på 1 till detta alternativ (den första siffran i den nedre vänstra grenen). I värsta fall kommer flickan att bli beroende av rökning: vi tilldelar det här alternativet en utdelning på -1 (den första siffran i den nedre högra grenen). Således får en trädgren med möjlighet att inte försöka röka alls 0.

Låt oss anta att Olga bestämde sig för att försöka röka. Vad kommer härnäst? Kommer hon att sluta eller inte? Detta kommer att bestämmas av Future Olga på bilden går hon in i spelet längs "Try"-grenen. Om hon redan har utvecklat ett beroende, kommer hon inte att vilja sluta röka, så för alternativet "Fortsätt" sätter vi vinsten till 1 (den andra siffran i den nedre högra grenen).

Vad får vi? Dagens Olga kommer att tjäna på om hon försöker röka men inte blir beroende. Och detta beror i sin tur på Future Olga, för vilken det är mer lönsamt att röka (hon har rökt ganska länge, vilket betyder att hon har ett beroende, därför kommer hon inte att vilja sluta). Så är det värt risken? Kanske spela oavgjort: få en vinst på 0 och inte försöka röka alls?

Vad ska man göra

Du kan beräkna strategi inte bara i ett spel med någon, utan också i ett spel med dig själv. Testa att rita spelträdet och se om ditt nuvarande beslut kommer att leda till en vinst.

4. Auktionsspel

Det finns olika typer av auktioner. Till exempel i filmen "The Twelve Chairs" fanns en så kallad engelsk auktion. Hans schema är enkelt: den som erbjuder det högsta beloppet för den utställda lotten vinner. Vanligtvis sätts ett minimisteg för att höja priset, annars finns det inga begränsningar.

Exempel

I auktionsavsnittet från "The Twelve Chairs" gjorde Ostap Bender ett strategiskt misstag. Efter ett erbjudande på 145 rubel per lot höjde han omedelbart priset till tvåhundra.

Ur spelteoretisk synvinkel borde Ostap ha höjt insatsen, men bara minimalt tills det inte fanns några konkurrenter kvar. På så sätt kunde han spara pengar och inte hamna i problem: Ostap saknade 30 rubel för att betala provisionsavgiften.

Vad ska man göra

Det finns spel, som till exempel auktion, som du bara behöver spela med huvudet. Bestäm din taktik i förväg och tänk på det högsta belopp du är villig att betala för föremålet. Förbind dig själv att inte överskrida gränsen. Det här steget hjälper dig att hantera spänningen om den plötsligt kommer över dig.

5. Att spela på en opersonlig marknad

Den opersonliga marknaden inkluderar banker, försäkringsbolag, entreprenörer och konsulat. I allmänhet de deltagare i spelet som inte har för- och efternamn. De är opersonliga, men det är ett misstag att tro att spelteorin inte gäller dem.

Exempel

Maxim vänder sig till banken i hopp om att få ett lån. Hans kredithistorik är inte perfekt: för två år sedan vägrade han att återbetala ett nytt lån i sex månader. Den anställde som accepterar dokumenten säger att Maxim troligtvis inte kommer att få ett lån.

Sedan ber Maxim om tillstånd att leverera handlingarna. Han tar med ett utdrag från sjukhuset som bekräftar att hans far var allvarligt sjuk under dessa sex månader. Maxim skriver ett uttalande som anger orsakerna till förseningen med att återbetala det tidigare lånet (pengarna behövdes för sin fars behandling). Och efter en tid får han ett nytt lån.

Vad ska man göra

När du har att göra med opersonliga spelare, kom alltid ihåg att det finns personligheter bakom dem. Ta reda på hur du drar in dina motståndare i spelet och sätter dina egna regler.

Spelteori är en ny vetenskap, men den studeras redan vid de bästa universiteten i världen. Förlaget "MYTH" gav ut läroboken "Strategic Games". Det kommer att vara användbart om du vill lära dig att analysera varje handling, fatta välgrundade beslut och bättre förstå inte bara andra utan också dig själv.

Från den populära amerikanska bloggen Cracked.

Spelteori handlar om att studera sätt att göra det bästa draget och, som ett resultat, få en så stor del av den vinnande kakan som möjligt genom att skära av en del av den från andra spelare. Den lär dig att analysera många faktorer och dra logiskt balanserade slutsatser. Jag tycker att det ska studeras efter siffror och före alfabetet. Helt enkelt för att för många människor fattar viktiga beslut utifrån intuition, hemliga profetior, stjärnornas placering och liknande. Jag har noggrant studerat spelteori, och nu vill jag berätta om dess grunder. Kanske kommer detta att tillföra lite sunt förnuft till ditt liv.

1. Fångens dilemma

Berto och Robert greps för bankrån efter att ha misslyckats med att använda en stulen bil på rätt sätt för att fly. Polisen kan inte bevisa att det var de som rånade banken, men de tog dem på bar gärning i en stulen bil. De fördes till olika rum och var och en erbjöds en överenskommelse: att överlämna en medbrottsling och skicka honom till fängelse i 10 år och att själv släppas. Men om de båda förråder varandra, kommer var och en att få 7 år. Om ingen säger något så kommer båda att få fängelse i 2 år bara för bilstöld.

Det visar sig att om Berto förblir tyst, men Robert överlämnar honom, hamnar Berto i fängelse i 10 år och Robert går fri.

Varje fånge är en spelare, och allas fördel kan uttryckas som en "formel" (vad de båda får, vad den andre får). Till exempel, om jag slår dig, skulle mitt vinnande mönster se ut så här (jag får en grov vinst, du lider mycket smärta). Eftersom varje fånge har två alternativ kan vi presentera resultaten i en tabell.

Praktisk tillämpning: Identifiera sociopater

Här ser vi den huvudsakliga tillämpningen av spelteori: identifiera sociopater som bara tänker på sig själva. Sann spelteori är ett kraftfullt analytiskt verktyg, och amatörism fungerar ofta som en röd flagga som flaggar för någon som inte har någon hederskänsla. Människor som gör intuitiva beräkningar tror att det är bättre att göra något fult eftersom det kommer att resultera i ett kortare fängelsestraff oavsett vad den andra spelaren gör. Tekniskt sett är detta korrekt, men bara om du är en kortsynt person som värderar siffror över människoliv. Det är därför spelteorin är så populär inom finans.

Det verkliga problemet med fångens dilemma är att den ignorerar uppgifterna. Till exempel tar den inte hänsyn till möjligheten att du träffar vänner, släktingar eller ens borgenärer till den person du skickade till fängelse i 10 år.

Det värsta är att alla inblandade i fångens dilemma agerar som om de aldrig hört talas om det.

Och det bästa draget är att vara tyst och efter två år, tillsammans med en god vän, använda samma pengar.

2. Dominerande strategi

Detta är en situation där dina handlingar ger den största utdelningen, oavsett vad din motståndare gör. Oavsett vad som händer gjorde du allt rätt. Det är därför många människor med Fångens Dilemma tror att svek leder till det "bästa" resultatet oavsett vad den andra personen gör, och okunnigheten om verkligheten som ligger i denna metod gör att det ser superlätt ut.

De flesta av spelen vi spelar har inte strikt dominerande strategier, för annars skulle de vara hemska. Tänk om du alltid gjorde samma sak. Det finns ingen dominerande strategi i spelet sten-papper-sax. Men om du lekte med en person som hade ugnsvantar på och bara kunde visa sten eller papper, skulle du ha en dominerande strategi: papper. Ditt papper kommer att slå in hans sten eller resultera i oavgjort, och du kan inte förlora eftersom din motståndare inte kan visa sax. Nu när du har en dominerande strategi skulle du vara dum om du provade något annat.

3. Kampen mellan könen

Spel är mer intressanta när de inte har en strikt dominerande strategi. Till exempel könens kamp. Anjali och Borislav går på dejt, men kan inte välja mellan balett och boxning. Anjali älskar boxning eftersom hon tycker om att se blod flöda till glädje för en skrikande skara åskådare som tror att de är civiliserade bara för att de betalat för att någons huvud ska krossas.

Borislav vill titta på balett eftersom han förstår att ballerinor går igenom ett stort antal skador och svår träning, med vetskapen om att en skada kan göra slut på allt. Balettdansare är de största idrottarna på jorden. En ballerina kan sparka dig i huvudet, men hon kommer aldrig att göra det, eftersom hennes ben är värt mycket mer än ditt ansikte.

Var och en av dem vill gå till sitt favoritevenemang, men de vill inte njuta av det ensamma, så deras vinnande mönster är: högsta värde är att göra vad de vill, lägsta värde är att bara vara med en annan person, och noll är att vara ensam .

Vissa människor föreslår envis brinksmanship: om du gör vad du vill oavsett vad, måste den andra personen anpassa sig till ditt val eller förlora allt. Som jag redan sa, förenklad spelteori är bra på att identifiera dårar.

Praktisk användning: Undvik skarpa hörn

Naturligtvis har denna strategi också sina betydande nackdelar. För det första, om du behandlar din dejting som en "kamp mellan könen", kommer det inte att fungera. Bryt upp så att var och en av er kan hitta någon de gillar. Och det andra problemet är att deltagarna i den här situationen är så osäkra på sig själva att de inte kan göra detta.

Den verkligt vinnande strategin för alla är att göra vad de vill. och efter, eller nästa dag, när de är lediga, gå till ett café tillsammans. Eller växla mellan boxning och balett tills en revolution sker i underhållningsvärlden och boxningsbalett uppfinns.

4. Nash-jämvikt

En Nash-jämvikt är en uppsättning rörelser där ingen vill göra något annorlunda i efterhand. Och om vi kan få det att fungera kommer spelteorin att ersätta hela det filosofiska, religiösa och finansiella systemet på planeten, eftersom "lusten att inte gå sönder" har blivit en mer kraftfull drivkraft för mänskligheten än eld.

Låt oss snabbt dela upp $100. Du och jag bestämmer hur många av de hundra vi kräver och aviserar samtidigt beloppen. Om vår totalsumma är mindre än hundra får alla som de ville. Om summan är mer än hundra får den som bett om det minsta beloppet det belopp han ville ha, och den girigare får det som är kvar. Om vi ​​ber om samma summa får alla $50. Hur mycket kommer du att fråga? Hur ska du dela upp pengarna? Det finns bara ett vinnande drag.

Att kräva $51 ger dig det maximala beloppet oavsett vad din motståndare väljer. Om han ber om mer får du $51. Om han ber om $50 eller $51, får du $50. Och om han ber om mindre än $50 får du $51. Hur som helst, det finns inget annat alternativ som ger dig mer pengar än det här. Nash-jämvikt - en situation där vi båda väljer $51.

Praktisk tillämpning: Tänk först

Detta är hela poängen med spelteorin. Du behöver inte vinna, än mindre skada andra spelare, men du måste göra det bästa draget för dig själv, oavsett vad de runt omkring dig har i beredskap för dig. Och det är ännu bättre om detta drag är fördelaktigt för andra spelare. Det är den här typen av matematik som kan förändra samhället.

En intressant variant av denna idé är att dricka, som kan kallas en tidsberoende Nash Equilibrium. När du dricker tillräckligt bryr du dig inte om andra människors handlingar oavsett vad de gör, men dagen efter ångrar du verkligen att du inte gjorde något annorlunda.

5. Kasta spel

Kasten spelas mellan spelare 1 och spelare 2. Varje spelare väljer samtidigt huvuden eller svansar. Om de gissar rätt får spelare 1 spelare 2:s öre. Om inte får spelare 2 spelare 1s mynt.

Den vinnande matrisen är enkel...

...optimal strategi: spela helt slumpmässigt. Det är svårare än du tror eftersom valet måste vara helt slumpmässigt. Om du har en heads eller tails preferens kan din motståndare använda den för att ta dina pengar.

Naturligtvis är det verkliga problemet här att det skulle vara mycket bättre om de bara kastade en krona på varandra. Som ett resultat skulle deras vinster bli desamma, och det resulterande traumat kan hjälpa dessa olyckliga människor att känna något annat än fruktansvärd tristess. Detta är trots allt det sämsta spelet någonsin. Och det här är den idealiska modellen för en straffläggning.

Praktisk tillämpning: Påföljd

I fotboll, hockey och många andra matcher är förlängning en straffläggning. Och de skulle vara mer intressanta om de var baserade på hur många gånger spelare i full form kunde göra vagnhjulet, för det skulle åtminstone vara en indikator på deras fysiska förmåga och skulle vara kul att titta på. Målvakter kan inte tydligt bestämma rörelsen av en boll eller puck i början av dess rörelse, eftersom robotar tyvärr fortfarande inte deltar i våra sporttävlingar. Målvakten måste välja vänster eller höger riktning och hoppas att hans val stämmer överens med motståndarens val som skjuter i mål. Detta har något gemensamt med att spela mynt.

Observera dock att detta inte är ett perfekt exempel på likheten med spelet med huvuden och svansar, för även med rätt riktning kanske målvakten inte fångar bollen och angriparen kanske inte träffar målet.

Så vad är vår slutsats enligt spelteorin? Bollspel ska avslutas på ett "multi-ball" sätt, där en-mot-en-spelare varje minut får en extra boll/puck tills ena sidan uppnår ett visst resultat, vilket är en indikation på spelarnas verkliga skicklighet, och inte en spektakulär slumpmässig slump.

I slutet av dagen bör spelteori användas för att göra spelet smartare. Vilket betyder att det är bättre.

Vad är fria radikaler?

Varför, om man blandar alla färger, får man brunt och inte vitt, eftersom vitt innehåller alla färger?

7 oväntade fakta om världen omkring oss

Fantastisk värld

10 fantastiska fakta om hundtänkande

En hund är en mans vän och lär sig ofta något av honom