เกมที่เป็นศัตรูกับกลยุทธ์ต่อเนื่อง การแก้เกมที่เป็นปรปักษ์กับเมทริกซ์ การแก้เกมที่เป็นปรปักษ์กันทางออนไลน์

เรียกว่าเกมผลรวมศูนย์สำหรับสองคน ซึ่งแต่ละคนมีชุดกลยุทธ์ที่จำกัด กฎของเกมเมทริกซ์ถูกกำหนดโดยเมทริกซ์การจ่ายผลตอบแทน ซึ่งมีองค์ประกอบคือผลตอบแทนของผู้เล่นคนแรก ซึ่งเป็นผลขาดทุนของผู้เล่นคนที่สองด้วย

เกมเมทริกซ์ เป็นเกมที่เป็นปฏิปักษ์ ผู้เล่นคนแรกจะได้รับผลตอบแทนสูงสุดที่รับประกัน (ไม่ขึ้นอยู่กับพฤติกรรมของผู้เล่นคนที่สอง) เท่ากับราคาของเกม ในทำนองเดียวกัน ผู้เล่นคนที่สองจะได้รับการสูญเสียขั้นต่ำที่รับประกัน

ภายใต้ กลยุทธ์ เป็นที่เข้าใจกันว่าเป็นชุดของกฎ (หลักการ) ที่กำหนดทางเลือกของการกระทำที่แตกต่างกันสำหรับการเคลื่อนไหวส่วนตัวของผู้เล่นแต่ละคน ขึ้นอยู่กับสถานการณ์ปัจจุบัน

ตอนนี้เกี่ยวกับทุกอย่างตามลำดับและในรายละเอียด

เมทริกซ์ผลตอบแทน กลยุทธ์บริสุทธิ์ ราคาเกม

ที่ เกมเมทริกซ์ กฎของมันถูกกำหนด เมทริกซ์ผลตอบแทน .

พิจารณาเกมที่มีผู้เข้าร่วมสองคน: ผู้เล่นคนแรกและผู้เล่นคนที่สอง ให้ผู้เล่นคนแรกมี กลยุทธ์ที่บริสุทธิ์และผู้เล่นคนที่สอง - กลยุทธ์ที่บริสุทธิ์ เนื่องจากเกมกำลังพิจารณาอยู่ เป็นเรื่องธรรมดาที่เกมนี้จะมีแพ้และชนะ

ที่ เมทริกซ์การชำระเงิน องค์ประกอบคือตัวเลขที่แสดงการได้และเสียของผู้เล่น การชนะและแพ้สามารถแสดงเป็นคะแนน เงิน หรือหน่วยอื่นๆ

มาสร้างเมทริกซ์ผลตอบแทน:

หากผู้เล่นคนแรกเลือก ผม-th กลยุทธ์ที่บริสุทธิ์และผู้เล่นคนที่สอง เจ- กลยุทธ์ที่บริสุทธิ์จากนั้นผลตอบแทนของผู้เล่นคนแรกคือ ไอเจหน่วยและการสูญเสียของผู้เล่นคนที่สองก็เช่นกัน ไอเจหน่วย

เพราะ อิจ + (- ij ) = 0จากนั้นเกมที่อธิบายคือเกมเมทริกซ์ผลรวมเป็นศูนย์

ตัวอย่างที่ง่ายที่สุดของเกมเมทริกซ์คือการโยนเหรียญ กฎของเกมมีดังนี้ ผู้เล่นคนแรกและคนที่สองโยนเหรียญและผลที่ได้คือหัวหรือก้อย หากมีการทอยหัวและหัวหรือก้อยพร้อมกัน ผู้เล่นคนแรกจะชนะหนึ่งหน่วย และในกรณีอื่น ๆ เขาจะเสียหนึ่งหน่วย (ผู้เล่นคนที่สองจะชนะหนึ่งหน่วย) กลยุทธ์สองแบบเดียวกันนั้นอยู่ที่การกำจัดของผู้เล่นคนที่สอง เมทริกซ์ผลตอบแทนที่เกี่ยวข้องจะเป็น:

งานของทฤษฎีเกมคือการกำหนดทางเลือกของกลยุทธ์ของผู้เล่นคนแรก ซึ่งจะรับประกันว่าเขาจะได้รับค่าเฉลี่ยสูงสุด เช่นเดียวกับการเลือกกลยุทธ์ของผู้เล่นคนที่สอง ซึ่งจะรับประกันว่าเขาจะได้รับการสูญเสียโดยเฉลี่ยสูงสุด

วิธีการเลือกกลยุทธ์ในเกมเมทริกซ์?

ลองดูเมทริกซ์ผลตอบแทนอีกครั้ง:

ขั้นแรก เราจะกำหนดผลตอบแทนของผู้เล่นคนแรกหากเขาใช้ ผมกลยุทธ์ที่บริสุทธิ์ หากผู้เล่นคนแรกใช้ ผม-th กลยุทธ์ที่บริสุทธิ์ ดังนั้นจึงมีเหตุผลที่จะสันนิษฐานว่าผู้เล่นคนที่สองจะใช้กลยุทธ์ที่บริสุทธิ์ดังกล่าว เนื่องจากผลตอบแทนของผู้เล่นคนแรกจะน้อยที่สุด ในทางกลับกัน ผู้เล่นคนแรกจะใช้กลยุทธ์ที่แท้จริงที่จะให้ผลตอบแทนสูงสุดแก่เขา ตามเงื่อนไขเหล่านี้ ผลตอบแทนของผู้เล่นคนแรกซึ่งเราแสดงว่าเป็น โวลต์1 , ถูกเรียก ชนะสูงสุด หรือ ราคาเกมที่ต่ำกว่า .

ที่ สำหรับค่าเหล่านี้ ผู้เล่นคนแรกควรดำเนินการดังนี้ จากแต่ละบรรทัด ให้เขียนค่าขององค์ประกอบขั้นต่ำและเลือกค่าสูงสุดจากองค์ประกอบเหล่านั้น ดังนั้น ผลตอบแทนของผู้เล่นคนแรกจะสูงสุดจากขั้นต่ำ ดังนั้นชื่อ - ชนะสูงสุด หมายเลขบรรทัดขององค์ประกอบนี้จะเป็นหมายเลขของกลยุทธ์บริสุทธิ์ที่ผู้เล่นคนแรกเลือก

ตอนนี้เรามาพิจารณาการสูญเสียของผู้เล่นคนที่สองหากเขาใช้ เจ-th กลยุทธ์ ในกรณีนี้ ผู้เล่นคนแรกใช้กลยุทธ์ของตัวเอง ซึ่งผู้เล่นคนที่สองจะสูญเสียมากที่สุด ผู้เล่นคนที่สองต้องเลือกกลยุทธ์ที่บริสุทธิ์ซึ่งการสูญเสียของเขาจะน้อยที่สุด การสูญเสียผู้เล่นคนที่สองซึ่งเราแสดงว่า โวลต์2 , ถูกเรียก การสูญเสียขั้นต่ำ หรือ ราคาเกมชั้นนำ .

ที่ การแก้ปัญหาราคาของเกมและการกำหนดกลยุทธ์ เพื่อกำหนดค่าเหล่านี้สำหรับผู้เล่นคนที่สองให้ดำเนินการดังนี้ จากแต่ละคอลัมน์ ให้เขียนค่าขององค์ประกอบสูงสุดและเลือกค่าต่ำสุดจากองค์ประกอบเหล่านั้น ดังนั้น การสูญเสียของผู้เล่นคนที่สองจะเป็นค่าต่ำสุดของค่าสูงสุด ดังนั้นชื่อ - กำไรขั้นต่ำ หมายเลขคอลัมน์ขององค์ประกอบนี้จะเป็นหมายเลขของกลยุทธ์บริสุทธิ์ที่ผู้เล่นคนที่สองเลือก หากผู้เล่นคนที่สองใช้ "minimax" ผู้เล่นคนแรกจะแพ้มากที่สุดโดยไม่คำนึงถึงการเลือกกลยุทธ์ โวลต์2 หน่วย

ตัวอย่างที่ 1

.

ที่ใหญ่ที่สุดในองค์ประกอบที่เล็กที่สุดของแถวคือ 2 นี่คือราคาที่ต่ำกว่าของเกม แถวแรกสอดคล้องกับมัน ดังนั้นกลยุทธ์สูงสุดของผู้เล่นคนแรกคือคนแรก องค์ประกอบที่เล็กที่สุดของคอลัมน์ที่ใหญ่ที่สุดคือ 5 ซึ่งเป็นราคาสูงสุดของเกม คอลัมน์ที่สองสอดคล้องกับมัน ดังนั้นกลยุทธ์ขั้นต่ำสุดของผู้เล่นคนที่สองจึงเป็นที่สอง

ตอนนี้เราได้เรียนรู้วิธีหาราคาที่ต่ำและสูงของเกม กลยุทธ์ maximin และ minimax แล้วก็ถึงเวลาเรียนรู้วิธีกำหนดแนวคิดเหล่านี้อย่างเป็นทางการ

ดังนั้นการรับประกันผลตอบแทนของผู้เล่นคนแรกคือ:

ผู้เล่นคนแรกต้องเลือกกลยุทธ์ที่บริสุทธิ์ที่จะให้ผลตอบแทนขั้นต่ำสูงสุดแก่เขา กำไร (สูงสุด) นี้แสดงดังนี้:

.

ผู้เล่นคนแรกใช้กลยุทธ์ที่บริสุทธิ์เพื่อให้ผู้เล่นคนที่สองสูญเสียมากที่สุด การสูญเสียนี้ถูกกำหนดดังนี้:

ผู้เล่นคนที่สองต้องเลือกกลยุทธ์ที่แท้จริงเพื่อให้การสูญเสียน้อยที่สุด การสูญเสียนี้ (minimax) แสดงดังนี้:

.

อีกตัวอย่างหนึ่งจากซีรีส์เดียวกัน

ตัวอย่างที่ 2กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

.

กำหนดกลยุทธ์สูงสุดของผู้เล่นคนแรก กลยุทธ์ขั้นต่ำของผู้เล่นคนที่สอง ราคาที่ต่ำกว่าและสูงกว่าของเกม

การตัดสินใจ. ทางด้านขวาของเมทริกซ์ payoff เราเขียนองค์ประกอบที่เล็กที่สุดในแถวและทำเครื่องหมายค่าสูงสุดและจากด้านล่างของเมทริกซ์ - องค์ประกอบที่ใหญ่ที่สุดในคอลัมน์และเลือกค่าต่ำสุด:

ที่ใหญ่ที่สุดในองค์ประกอบที่เล็กที่สุดของแถวคือ 3 นี่คือราคาที่ต่ำกว่าของเกม แถวที่สองสอดคล้องกับมัน ดังนั้นกลยุทธ์สูงสุดของผู้เล่นคนแรกคือคนที่สอง องค์ประกอบที่เล็กที่สุดของคอลัมน์ที่ใหญ่ที่สุดคือ 5 นี่คือราคาสูงสุดของเกม คอลัมน์แรกสอดคล้องกับมัน ดังนั้นกลยุทธ์ขั้นต่ำของผู้เล่นคนที่สองจึงเป็นกลยุทธ์แรก

จุดอานในเกมเมทริกซ์

หากราคาบนและล่างของเกมเท่ากัน เกมเมทริกซ์จะถือว่ามีจุดอาน ในทางกลับกันก็เป็นความจริงเช่นกัน: หากเกมเมทริกซ์มีจุดอาน ราคาบนและล่างของเกมเมทริกซ์จะเท่ากัน องค์ประกอบที่สอดคล้องกันนั้นเป็นทั้งองค์ประกอบที่เล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์ และมีค่าเท่ากับราคาของเกม

ดังนั้น ถ้า เป็นกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดสำหรับผู้เล่นคนแรก และเป็นกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดของผู้เล่นคนที่สอง นั่นคือ ราคาที่ต่ำกว่าและสูงกว่าของเกมจะเท่ากันในกลยุทธ์คู่เดียวกัน

ในกรณีนี้ เกมเมทริกซ์มีวิธีแก้ปัญหาด้วยกลยุทธ์ที่บริสุทธิ์ .

ตัวอย่างที่ 3กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

.

การตัดสินใจ. ทางด้านขวาของเมทริกซ์ payoff เราเขียนองค์ประกอบที่เล็กที่สุดในแถวและทำเครื่องหมายค่าสูงสุดและจากด้านล่างของเมทริกซ์ - องค์ประกอบที่ใหญ่ที่สุดในคอลัมน์และเลือกค่าต่ำสุด:

ราคาที่ต่ำกว่าของเกมจะเหมือนกับราคาที่สูงขึ้นของเกม ดังนั้นราคาของเกมคือ 5 นั่นคือ ราคาของเกมจะเท่ากับมูลค่าของอานม้า กลยุทธ์สูงสุดของผู้เล่นคนแรกคือกลยุทธ์บริสุทธิ์ที่สอง และกลยุทธ์ขั้นต่ำสูงสุดของผู้เล่นคนที่สองคือกลยุทธ์บริสุทธิ์ที่สาม เกมเมทริกซ์นี้มีวิธีแก้ปัญหาด้วยกลยุทธ์ที่บริสุทธิ์

แก้ปัญหาเกมเมทริกซ์ด้วยตัวคุณเอง แล้วดูวิธีแก้ปัญหา

ตัวอย่างที่ 4กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

.

ค้นหาราคาที่ต่ำกว่าและสูงกว่าของเกม เกมเมทริกซ์นี้มีจุดอานหรือไม่?

เกมเมทริกซ์พร้อมกลยุทธ์ผสมผสานที่ดีที่สุด

ในกรณีส่วนใหญ่ เกมเมทริกซ์ไม่มีอานม้า ดังนั้นเกมเมทริกซ์ที่เกี่ยวข้องจึงไม่มีวิธีแก้ปัญหาเชิงกลยุทธ์อย่างแท้จริง

แต่มีวิธีแก้ปัญหาในกลยุทธ์ผสมที่เหมาะสมที่สุด ในการค้นหาพวกเขาจะต้องสันนิษฐานว่าเกมนั้นเล่นซ้ำหลายครั้งพอสมควรซึ่งขึ้นอยู่กับประสบการณ์ที่ใคร ๆ ก็สามารถเดาได้ว่ากลยุทธ์ใดดีกว่า ดังนั้นการตัดสินใจจึงเกี่ยวข้องกับแนวคิดของความน่าจะเป็นและค่าเฉลี่ย (ความคาดหวัง) ในการแก้ปัญหาขั้นสุดท้ายมีทั้งแบบอะนาล็อกของจุดอานม้า (นั่นคือความเท่าเทียมกันของราคาที่ต่ำกว่าและสูงกว่าของเกม) และแบบอะนาล็อกของกลยุทธ์ที่เกี่ยวข้อง

ดังนั้น เพื่อให้ผู้เล่นคนแรกได้กำไรเฉลี่ยสูงสุด และสำหรับผู้เล่นคนที่สองได้ขาดทุนเฉลี่ยน้อยที่สุด ควรใช้กลยุทธ์บริสุทธิ์ด้วยความน่าจะเป็นที่แน่นอน

หากผู้เล่นคนแรกใช้กลยุทธ์ที่บริสุทธิ์ด้วยความน่าจะเป็น แล้วเวกเตอร์ เรียกว่ากลยุทธ์ผสมของผู้เล่นคนแรก กล่าวอีกนัยหนึ่ง มันเป็น "ส่วนผสม" ของกลยุทธ์บริสุทธิ์ ผลรวมของความน่าจะเป็นเหล่านี้เท่ากับหนึ่ง:

.

หากผู้เล่นคนที่สองใช้กลยุทธ์ที่บริสุทธิ์ด้วยความน่าจะเป็น แล้วเวกเตอร์ เรียกว่ากลยุทธ์ผสมของผู้เล่นคนที่สอง ผลรวมของความน่าจะเป็นเหล่านี้เท่ากับหนึ่ง:

.

หากผู้เล่นคนแรกใช้กลยุทธ์แบบผสม หน้าและผู้เล่นคนที่สอง - กลยุทธ์แบบผสม ถามแล้วมันสมเหตุสมผล มูลค่าที่คาดหวัง ผู้เล่นคนแรกชนะ (ผู้เล่นคนที่สองแพ้) ในการหามัน คุณต้องคูณเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนแรก (ซึ่งจะเป็นเมทริกซ์หนึ่งแถว) เมทริกซ์ผลตอบแทน และเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนที่สอง (ซึ่งจะเป็นเมทริกซ์แบบหนึ่งคอลัมน์):

.

ตัวอย่างที่ 5กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

.

กำหนดความคาดหวังทางคณิตศาสตร์ของกำไรของผู้เล่นคนแรก (การสูญเสียของผู้เล่นคนที่สอง) หากกลยุทธ์แบบผสมของผู้เล่นคนแรกคือ และกลยุทธ์แบบผสมของผู้เล่นคนที่สองคือ

การตัดสินใจ. ตามสูตรสำหรับความคาดหวังทางคณิตศาสตร์ของการได้รับของผู้เล่นคนแรก (การสูญเสียของผู้เล่นคนที่สอง) จะเท่ากับผลคูณของเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนแรก เมทริกซ์ผลตอบแทน และเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนที่สอง:

ผู้เล่นคนแรกเรียกว่ากลยุทธ์แบบผสมที่จะให้ผลตอบแทนเฉลี่ยสูงสุดแก่เขาหากเกมเล่นซ้ำในจำนวนครั้งที่เพียงพอ

กลยุทธ์ผสมที่เหมาะสมที่สุด ผู้เล่นคนที่สองเรียกว่ากลยุทธ์แบบผสมซึ่งจะทำให้เขาสูญเสียโดยเฉลี่ยน้อยที่สุดหากเกมเล่นซ้ำในจำนวนครั้งที่เพียงพอ

โดยการเปรียบเทียบกับสัญลักษณ์ของ maximin และ minimax ในกรณีของกลยุทธ์บริสุทธิ์ กลยุทธ์ผสมที่เหมาะสมจะแสดงดังนี้ (และเชื่อมโยงกับความคาดหวังทางคณิตศาสตร์ นั่นคือ ค่าเฉลี่ยของกำไรของผู้เล่นคนแรกและการสูญเสียของผู้เล่นคนที่สอง):

,

.

ในกรณีนี้ สำหรับฟังก์ชัน อี มีจุดอาน ซึ่งหมายถึงความเท่าเทียมกัน

เพื่อค้นหากลยุทธ์ผสมและจุดอานที่เหมาะสมที่สุด กล่าวคือ แก้เกมเมทริกซ์ด้วยกลยุทธ์แบบผสม คุณต้องลดเกมเมทริกซ์ให้เป็นปัญหาโปรแกรมเชิงเส้น นั่นคือ เป็นปัญหาการปรับให้เหมาะสม และแก้ปัญหาโปรแกรมเชิงเส้นที่สอดคล้องกัน

การย่อเกมเมทริกซ์ให้เป็นปัญหาการเขียนโปรแกรมเชิงเส้น

ในการแก้เกมเมทริกซ์ด้วยกลยุทธ์แบบผสม คุณต้องสร้างเส้นตรง ปัญหาการโปรแกรมเชิงเส้นและ งานคู่ของมัน. ในปัญหาคู่ เมทริกซ์เสริมซึ่งเก็บค่าสัมประสิทธิ์ของตัวแปรในระบบจำกัด ค่าคงที่ และค่าสัมประสิทธิ์ของตัวแปรในฟังก์ชันเป้าหมายจะถูกย้าย ในกรณีนี้ ฟังก์ชันเป้าหมายขั้นต่ำของปัญหาเดิมจะสัมพันธ์กับค่าสูงสุดในปัญหาคู่

ฟังก์ชันเป้าหมายในปัญหาการโปรแกรมเชิงเส้นตรง:

.

ระบบข้อจำกัดในปัญหาโดยตรงของโปรแกรมเชิงเส้น:

ฟังก์ชั่นเป้าหมายในปัญหาคู่:

.

ระบบข้อ จำกัด ในปัญหาคู่:

แสดงแผนที่เหมาะสมที่สุดของปัญหาการโปรแกรมเชิงเส้นตรง

,

และแผนที่ดีที่สุดของปัญหาคู่จะแสดงด้วย

รูปแบบเชิงเส้นสำหรับการออกแบบที่เหมาะสมที่สุดจะแสดงด้วย และ ,

และคุณต้องค้นหาผลรวมของพิกัดที่สอดคล้องกันของแผนที่เหมาะสมที่สุด

ตามคำจำกัดความของส่วนก่อนหน้าและพิกัดของแผนที่ดีที่สุด กลยุทธ์แบบผสมต่อไปนี้ของผู้เล่นคนแรกและคนที่สองใช้ได้:

.

นักคณิตศาสตร์ได้พิสูจน์แล้วว่า ราคาเกม จะแสดงในรูปแบบเส้นตรงของแผนที่เหมาะสมดังนี้

,

นั่นคือเป็นผลรวมของพิกัดของแผนที่เหมาะสมที่สุด

เราผู้ปฏิบัติงานสามารถใช้สูตรนี้เพื่อแก้ปัญหาเกมเมทริกซ์ในกลยุทธ์แบบผสม เช่น สูตรสำหรับการค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด ผู้เล่นคนแรกและคนที่สองตามลำดับ:

ซึ่งปัจจัยที่สองคือเวกเตอร์ กลยุทธ์แบบผสมที่เหมาะสมที่สุดคือเวกเตอร์ ดังที่เราได้กำหนดไว้ในย่อหน้าก่อนหน้า ดังนั้นการคูณจำนวน (ราคาของเกม) ด้วยเวกเตอร์ (ด้วยพิกัดของแผนที่เหมาะสมที่สุด) เราก็จะได้เวกเตอร์ด้วย

ตัวอย่างที่ 6กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

.

ค้นหาราคาของเกม วีและกลยุทธ์ผสมที่เหมาะสมที่สุด และ

การตัดสินใจ. เราสร้างปัญหาการเขียนโปรแกรมเชิงเส้นที่สอดคล้องกับเกมเมทริกซ์นี้:

เราได้รับวิธีแก้ปัญหาโดยตรง:

.

เราพบรูปแบบเชิงเส้นของแผนที่ดีที่สุดเป็นผลรวมของพิกัดที่พบ

ส่งงานที่ดีของคุณในฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง

นักศึกษา บัณฑิต นักวิทยาศาสตร์รุ่นเยาว์ที่ใช้ฐานความรู้ในการศึกษาและการทำงานจะขอบคุณมาก

บทนำ

1. ส่วนทางทฤษฎี

1.3 ลำดับเกม 2v2

1.4 วิธีพีชคณิต

1.5 วิธีการแบบกราฟิก

1.6 เกม 2xn หรือ mx2

1.7 การแก้เกมด้วยวิธีเมทริกซ์

2. ภาคปฏิบัติ

2.2 เกม 2xn และ mx2

2.3 วิธีเมทริกซ์

2.4 วิธีสีน้ำตาล

การวิเคราะห์ผลลัพธ์

บทนำ

เกมปฏิปักษ์เป็นเกมผลรวมศูนย์ เกมที่เป็นปรปักษ์กันคือเกมที่ไม่ร่วมมือกันซึ่งผู้เล่นสองคนมีส่วนร่วมซึ่งมีผลตอบแทนที่ตรงกันข้าม

อย่างเป็นทางการ เกมที่เป็นปรปักษ์สามารถแสดงด้วยสาม โดยที่ X และ Y คือชุดของกลยุทธ์ของผู้เล่นคนแรกและคนที่สอง ตามลำดับ F คือฟังก์ชันผลตอบแทนของผู้เล่นคนแรก ซึ่งเชื่อมโยงแต่ละคู่ของกลยุทธ์ (x, y) โดยที่จำนวนจริงที่สอดคล้องกับยูทิลิตี้ ของผู้เล่นคนแรกที่ตระหนักถึงสถานการณ์นี้

เนื่องจากผลประโยชน์ของผู้เล่นตรงกันข้าม ฟังก์ชัน F พร้อมกันจึงแสดงถึงการสูญเสียของผู้เล่นคนที่สอง

ในอดีต เกมที่เป็นปรปักษ์กันเป็นแบบจำลองทางคณิตศาสตร์ของทฤษฎีเกมชั้นหนึ่งซึ่งใช้ในการอธิบาย การพนัน. เป็นที่เชื่อกันว่าต้องขอบคุณหัวข้อการวิจัยนี้ ทฤษฎีเกม ได้ชื่อมา ปัจจุบัน เกมที่เป็นปรปักษ์กันถือเป็นส่วนหนึ่งของเกมที่ไม่ร่วมมือในระดับที่กว้างขึ้น

1. ส่วนทางทฤษฎี

1.1 คำจำกัดความพื้นฐานและข้อกำหนดของเกม

เกมดังกล่าวมีลักษณะเป็นระบบกฎที่กำหนดจำนวนผู้เข้าร่วมในเกมของพวกเขา การกระทำที่เป็นไปได้และการกระจายการชนะขึ้นอยู่กับพฤติกรรมและผลลัพธ์ของพวกเขา ผู้เล่นถือเป็นผู้เข้าร่วมหนึ่งคนหรือกลุ่มผู้เข้าร่วมในเกมที่มีความสนใจร่วมกันบางอย่างที่ไม่ตรงกับความสนใจของกลุ่มอื่น ดังนั้นไม่ใช่ว่าผู้เข้าร่วมทุกคนจะถูกพิจารณาว่าเป็นผู้เล่น

กฎหรือเงื่อนไขของเกมจะกำหนดพฤติกรรม ทางเลือก และการเคลื่อนไหวที่เป็นไปได้สำหรับผู้เล่นในทุกขั้นตอนของการพัฒนาเกม การเลือกผู้เล่นหมายถึงการหยุดพฤติกรรมที่เป็นไปได้อย่างหนึ่งของเขา จากนั้นผู้เล่นจะทำการเลือกด้วยการเคลื่อนไหว ในการเคลื่อนไหวหมายถึงในบางช่วงของเกมเพื่อเลือกทั้งหมดหรือบางส่วนพร้อมกันขึ้นอยู่กับความเป็นไปได้ที่กฎของเกมกำหนด ผู้เล่นแต่ละคนในแต่ละช่วงของเกมจะเคลื่อนไหวตามตัวเลือกที่เลือกไว้ ผู้เล่นคนอื่นที่รู้หรือไม่รู้เกี่ยวกับตัวเลือกของผู้เล่นคนแรกก็เคลื่อนไหวเช่นกัน ผู้เล่นแต่ละคนพยายามที่จะคำนึงถึงข้อมูลเกี่ยวกับการพัฒนาที่ผ่านมาของเกม หากความเป็นไปได้ดังกล่าวได้รับอนุญาตตามกฎของเกม

ชุดของกฎที่บอกผู้เล่นอย่างชัดเจนว่าเขาควรเลือกอะไรในแต่ละการเคลื่อนไหว ขึ้นอยู่กับสถานการณ์ที่พัฒนาขึ้นอันเป็นผลมาจากเกม เรียกว่ากลยุทธ์ของผู้เล่น กลยุทธ์ในทฤษฎีเกมหมายถึงแผนปฏิบัติการที่สมบูรณ์สำหรับผู้เล่น ซึ่งแสดงให้เห็นว่าเขาควรดำเนินการอย่างไรในทุกกรณีที่เป็นไปได้ของการพัฒนาเกม กลยุทธ์ หมายถึงผลรวมของตัวบ่งชี้ทั้งหมดสำหรับสถานะของข้อมูลใด ๆ ที่มีให้ผู้เล่นในทุกขั้นตอนของการพัฒนาเกม สิ่งนี้แสดงให้เห็นแล้วว่ากลยุทธ์สามารถดีและไม่ดี สำเร็จและไม่สำเร็จ ฯลฯ

จะมีเกมผลรวมเป็นศูนย์เมื่อผลรวมของการจ่ายเงินของผู้เล่นทั้งหมดในแต่ละเกมเป็นศูนย์ นั่นคือในเกมผลรวมศูนย์ ทุนรวมของผู้เล่นทั้งหมดจะไม่เปลี่ยนแปลง แต่จะถูกแจกจ่ายให้กับผู้เล่น ขึ้นอยู่กับผลลัพธ์ที่ได้ ดังนั้น สถานการณ์ทางเศรษฐกิจและการทหารหลายๆ

โดยเฉพาะอย่างยิ่งเกมผลรวมศูนย์ของผู้เล่นสองคนเรียกว่าเป็นปรปักษ์กันเนื่องจากเป้าหมายของผู้เล่นในนั้นตรงกันข้าม: การได้รับของผู้เล่นคนหนึ่งเกิดขึ้นจากการสูญเสียของอีกฝ่ายเท่านั้น

1.1.1 ความหมาย ตัวอย่าง และวิธีแก้ปัญหาของเกมเมทริกซ์ในกลยุทธ์ล้วน ๆ

เกมเมทริกซ์ผลรวมศูนย์สำหรับผู้เล่นสองคนสามารถดูได้เป็นเกมนามธรรมสำหรับผู้เล่นสองคนต่อไปนี้

ผู้เล่นคนแรกมี m กลยุทธ์ i =1, 2,…, m คนที่สองมี n กลยุทธ์ j = 1, 2,…, n กลยุทธ์แต่ละคู่ (i, j) ถูกกำหนดเป็นตัวเลข a ij ซึ่งแสดงถึง ผลตอบแทนของผู้เล่นคนแรกเนื่องจากผู้เล่นคนที่สองหากผู้เล่นคนแรกใช้ของเขา กลยุทธ์ i-thและประการที่สอง - กลยุทธ์ j-th

ผู้เล่นแต่ละคนทำการเคลื่อนไหวหนึ่งครั้ง: ผู้เล่นคนแรกเลือกกลยุทธ์ i-th ของเขา (i = 1, 2, ..., m) คนที่สอง --j-th ของคุณกลยุทธ์ (j = 1, 2, …, n) หลังจากนั้นผู้เล่นคนแรกจะได้รับผลตอบแทน ij โดยเป็นค่าใช้จ่ายของผู้เล่นคนที่สอง (หาก a ij< 0, то это значит, что первый игрок платит второму сумму a ij). На этом игра заканчивается.

แต่ละกลยุทธ์ของผู้เล่น i = 1, 2,…, t; j = 1, 2,…, n มักเรียกว่ากลยุทธ์บริสุทธิ์

เกมเมทริกซ์ผลรวมศูนย์ของผู้เล่นสองคนจะเรียกง่าย ๆ ว่าเป็นเกมเมทริกซ์ เห็นได้ชัดว่าเกมเมทริกซ์เป็นเกมที่เป็นปรปักษ์กัน มันเป็นไปตามคำนิยามที่ว่า ในการกำหนดเกมเมทริกซ์ ก็เพียงพอแล้วที่จะระบุเมทริกซ์ A = (a ij) ของลำดับ m ของผลตอบแทนของผู้เล่นคนแรก

พิจารณาเมทริกซ์ผลตอบแทน

จากนั้นการดำเนินการของแต่ละเกมของเกมเมทริกซ์ด้วยเมทริกซ์ A จะลดลงเป็นตัวเลือกโดยผู้เล่นคนแรก บรรทัด i-thและโดยผู้เล่นคนที่สองในคอลัมน์ที่ j และผู้เล่นคนแรก (เป็นค่าใช้จ่ายของผู้เล่นคนที่สอง) จะได้รับผลตอบแทนที่อยู่ในเมทริกซ์ A ที่จุดตัดของแถวที่ i และคอลัมน์ที่ j

เพื่อทำให้สถานการณ์ความขัดแย้งที่แท้จริงเป็นรูปเป็นร่างในรูปแบบของเกมเมทริกซ์ จำเป็นต้องระบุและกำหนดลำดับกลยุทธ์ใหม่ของผู้เล่นแต่ละคนและรวบรวมเมทริกซ์ผลตอบแทน

ขั้นตอนต่อไปคือการกำหนดกลยุทธ์ที่เหมาะสมที่สุดและผลตอบแทนของผู้เล่น

สิ่งสำคัญในการศึกษาเกมคือแนวคิดของกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่น แนวคิดนี้มีความหมายโดยสัญชาตญาณดังต่อไปนี้: กลยุทธ์ของผู้เล่นจะเหมาะสมที่สุดหากการใช้กลยุทธ์นี้รับประกันผลตอบแทนสูงสุดสำหรับกลยุทธ์ที่เป็นไปได้ทั้งหมดของผู้เล่นอีกฝ่าย ตามตำแหน่งเหล่านี้ ผู้เล่นคนแรกตรวจสอบเมทริกซ์ A ของผลตอบแทนของเขาตามสูตร (1.1) ดังต่อไปนี้: สำหรับแต่ละค่า i (i = 1, 2, ..., m) มูลค่าผลตอบแทนขั้นต่ำจะถูกกำหนดขึ้นอยู่กับ เกี่ยวกับกลยุทธ์ที่ใช้โดยผู้เล่นคนที่สอง

(ผม = 1, 2,..., ม.) (1.2)

กล่าวคือ มีการกำหนดผลตอบแทนขั้นต่ำสำหรับผู้เล่นคนแรก โดยมีเงื่อนไขว่าเขาใช้กลยุทธ์ i-th บริสุทธิ์ จากนั้นจากผลตอบแทนขั้นต่ำเหล่านี้จะพบกลยุทธ์ i=i 0 ซึ่งผลตอบแทนขั้นต่ำนี้จะสูงสุด เช่น พบ

คำนิยาม. จำนวน b ที่กำหนดโดยสูตร (1.3) เรียกว่าต้นทุนสุทธิที่ต่ำกว่าของเกม และแสดงให้เห็นว่าผลตอบแทนขั้นต่ำเท่าใดที่ผู้เล่นคนแรกสามารถรับประกันตนเองได้โดยใช้กลยุทธ์ที่แท้จริงของเขาสำหรับการกระทำที่เป็นไปได้ทั้งหมดของผู้เล่นคนที่สอง

ผู้เล่นคนที่สองที่มีพฤติกรรมที่เหมาะสมควรพยายามหากเป็นไปได้เพื่อลดผลตอบแทนของผู้เล่นคนแรกด้วยค่าใช้จ่ายของกลยุทธ์ของเขา ดังนั้นสำหรับผู้เล่นคนที่สองเราพบ

กล่าวคือ ผลตอบแทนสูงสุดของผู้เล่นคนแรกจะถูกกำหนด โดยมีเงื่อนไขว่าผู้เล่นคนที่สองจะใช้ของเขา j-th สะอาดกลยุทธ์ จากนั้นผู้เล่นคนที่สองพบ j = j 1 กลยุทธ์ที่ผู้เล่นคนแรกได้รับผลตอบแทนขั้นต่ำ เช่น พบ

คำนิยาม. จำนวน β ที่กำหนดโดยสูตร (1.5) เรียกว่าต้นทุนสูงสุดสุทธิของเกม และแสดงให้เห็นว่ากำไรสูงสุดเท่าใดที่ผู้เล่นคนแรกสามารถรับประกันตนเองได้เนื่องจากกลยุทธ์ของเขา กล่าวอีกนัยหนึ่ง ด้วยการใช้กลยุทธ์บริสุทธิ์ของเขา ผู้เล่นคนแรกสามารถได้รับผลตอบแทนอย่างน้อย b และผู้เล่นคนที่สอง ด้วยการใช้กลยุทธ์บริสุทธิ์ของเขา สามารถป้องกันไม่ให้ผู้เล่นคนแรกชนะมากกว่า c

คำนิยาม. หากในเกมที่มีเมทริกซ์ A ราคาสุทธิล่างและบนของเกมตรงกัน เช่น b = c เกมนี้กล่าวกันว่ามีจุดอานอยู่ที่กลยุทธ์ล้วน ๆ และราคาสุทธิของเกม:

n = b = ค (1.6)

จุดอานคือคู่ของกลยุทธ์บริสุทธิ์ () ของผู้เล่นคนแรกและคนที่สองตามลำดับซึ่งบรรลุความเท่าเทียมกัน

แนวคิดของจุดอานม้ามีความหมายดังต่อไปนี้: หากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่สอดคล้องกับอานม้า ผู้เล่นคนอื่นจะไม่สามารถทำได้ดีไปกว่าการปฏิบัติตามกลยุทธ์ที่สอดคล้องกับอานม้า โปรดทราบว่าพฤติกรรมที่ดีที่สุดของผู้เล่นไม่ควรนำไปสู่การลดลงของผลตอบแทน และพฤติกรรมที่เลวร้ายที่สุดอาจทำให้ผลตอบแทนลดลง เงื่อนไขเหล่านี้สามารถเขียนทางคณิตศาสตร์ในรูปแบบของความสัมพันธ์ต่อไปนี้:

โดยที่ i, j คือกลยุทธ์บริสุทธิ์ใดๆ ของผู้เล่นคนแรกและคนที่สอง ตามลำดับ; (i 0 , j 0) -- กลยุทธ์สร้างจุดอานม้า ด้านล่างเราจะแสดงให้เห็นว่าคำจำกัดความของจุดอานเทียบเท่ากับเงื่อนไข (1.8)

ดังนั้น ตาม (1.8) องค์ประกอบอานคือค่าต่ำสุดในแถว i 0 -th และสูงสุดในคอลัมน์ j 0 -th ในเมทริกซ์ A การหาจุดอานของเมทริกซ์ A นั้นง่ายมาก: ในเมทริกซ์ A ในแต่ละแถว ค้นหาองค์ประกอบขั้นต่ำและตรวจสอบว่าองค์ประกอบนี้มีค่าสูงสุดในคอลัมน์หรือไม่ หากเป็นเช่นนั้น แสดงว่าเป็นองค์ประกอบของอานม้า และคู่ของกลยุทธ์ที่สอดคล้องกันจะก่อตัวเป็นอานม้า กลยุทธ์บริสุทธิ์คู่หนึ่ง (i 0 , j 0) ของผู้เล่นคนแรกและคนที่สองสร้างจุดอานและองค์ประกอบอาน เรียกว่าวิธีแก้ปัญหาของเกม

กลยุทธ์บริสุทธิ์ i 0 และ j 0 สร้างจุดอานเรียกว่ากลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดของผู้เล่นคนแรกและคนที่สองตามลำดับ

ทฤษฎีบท 1. ให้ f (x, y) เป็นฟังก์ชันจริงของตัวแปรสองตัว x A และ y B และมีอยู่จริง

แล้ว b = c

การพิสูจน์. จากนิยามของค่าต่ำสุดและค่าสูงสุดจะได้ดังนี้

เนื่องจาก x อยู่ทางด้านซ้ายของ (1.11) โดยพลการ ดังนั้น

ทางขวามือของอสมการ (1.12) y เป็นไปตามอำเภอใจ ดังนั้น

คิวอีดี

โดยเฉพาะอย่างยิ่ง เมทริกซ์ () เป็นกรณีพิเศษของฟังก์ชัน f (x, y) เช่น ถ้าเราใส่ x = i, y = j, = f (x, y) จากทฤษฎีบทที่ 1 เราจะได้ค่าที่ต่ำกว่า ราคาสุทธิไม่เกินมูลค่าสุทธิด้านบนของเกมในเกมเมทริกซ์

คำนิยาม. ให้ f (x, y) เป็นฟังก์ชันจริงของตัวแปร x A และ y B สองตัว จุด (x 0, y 0) เรียกว่าจุดอานสำหรับฟังก์ชัน f (x, y) ถ้าอสมการต่อไปนี้มีอยู่:

ฉ (x, y 0) ฉ (x 0, y 0) ฉ (x 0, y) (1.14)

สำหรับ x A และ y B ใดๆ

1.2 กลยุทธ์ผสมที่เหมาะสมที่สุดและคุณสมบัติของมัน

การศึกษาเกมเมทริกซ์เริ่มต้นด้วยการค้นหาจุดอานม้าด้วยกลยุทธ์ที่บริสุทธิ์ หากเกมเมทริกซ์มีจุดอานบนกลยุทธ์ล้วน ๆ การค้นหาจุดนี้จะสิ้นสุดการศึกษาเกม หากในเกมเมทริกซ์ไม่มีจุดอานม้าในกลยุทธ์ล้วน ๆ เราสามารถหาราคาที่ต่ำและสูงของเกมนี้ได้ ซึ่งบ่งชี้ว่าผู้เล่นคนแรกไม่ควรหวังผลตอบแทนที่มากกว่าราคาบนของเกม และ มั่นใจได้ว่าจะได้รับผลตอบแทนไม่น้อยกว่าราคาที่ต่ำกว่าของเกม คำแนะนำดังกล่าวเกี่ยวกับพฤติกรรมของผู้เล่นในเกมเมทริกซ์ที่ไม่มีจุดอานม้าในกลยุทธ์ล้วน ๆ ไม่สามารถตอบสนองนักวิจัยและผู้ปฏิบัติงานได้ ควรค้นหาการปรับปรุงในการแก้ปัญหาของเกมเมทริกซ์ในการใช้ความลับของการใช้กลยุทธ์ที่บริสุทธิ์และความเป็นไปได้ของเกมซ้ำ ๆ ในรูปแบบของปาร์ตี้ ตัวอย่างเช่น มีการเล่นหมากรุก หมากฮอส ฟุตบอลเป็นชุด และทุกครั้งที่ผู้เล่นใช้กลยุทธ์ของตนในลักษณะที่ฝ่ายตรงข้ามไม่ทราบเนื้อหา และตลอดทางจะได้รับผลตอบแทนที่แน่นอนโดยเฉลี่ย เล่นเกมทั้งชุด โดยเฉลี่ยแล้วผลตอบแทนเหล่านี้จะมากกว่าราคาที่ต่ำกว่าของเกมและน้อยกว่าราคาที่สูงขึ้นของเกม ยิ่งค่าเฉลี่ยนี้มีค่ามากเท่าไร กลยุทธ์ที่ดีกว่าสมัครโดยผู้เล่น ดังนั้นความคิดจึงเกิดขึ้นเพื่อใช้กลยุทธ์บริสุทธิ์แบบสุ่มโดยมีความเป็นไปได้ที่แน่นอน สิ่งนี้ทำให้มั่นใจได้ถึงความลับในการใช้งานอย่างเต็มที่ ผู้เล่นแต่ละคนสามารถเปลี่ยนความน่าจะเป็นของการใช้กลยุทธ์ที่แท้จริงของตนในลักษณะที่จะเพิ่มผลตอบแทนเฉลี่ยสูงสุดและได้รับกลยุทธ์ที่เหมาะสมที่สุดไปพร้อมกัน แนวคิดนี้นำไปสู่แนวคิดของกลยุทธ์แบบผสม

คำนิยาม. กลยุทธ์แบบผสมของผู้เล่นคือชุดของความน่าจะเป็นที่สมบูรณ์ของการใช้กลยุทธ์ที่แท้จริงของเขา

ดังนั้น หากผู้เล่นคนแรกมี m กลยุทธ์บริสุทธิ์ 1, 2, … i, … m ดังนั้นกลยุทธ์ผสมของเขา x จะเป็นชุดของตัวเลข x = (x 1 , x 2 , ..., x i ,…, x t ) น่าพอใจ ความสัมพันธ์

x ผม 0 (ผม = 1, 2, ... , ม.), = 1. (1.15)

ในทำนองเดียวกัน สำหรับผู้เล่นคนที่สองซึ่งมีกลยุทธ์บริสุทธิ์ n กลยุทธ์ กลยุทธ์แบบผสม y คือชุดของตัวเลข y = (y 1 ,…, y j , … y n) ตอบสนองความสัมพันธ์

y j 0 (j = 1, 2, ... , n), = 1. (1.16)

เนื่องจากแต่ละครั้งที่ผู้เล่นใช้กลยุทธ์ล้วน ๆ ขัดขวางการใช้กลยุทธ์อื่น ๆ กลยุทธ์ล้วน ๆ จึงเป็นเหตุการณ์ที่เข้ากันไม่ได้ นอกจากนี้ยังเป็นเหตุการณ์เดียวที่เป็นไปได้

เห็นได้ชัดว่ากลยุทธ์บริสุทธิ์เป็นกรณีพิเศษของกลยุทธ์ผสม แน่นอนหากอยู่ในกลยุทธ์แบบผสมก็ตาม ฉันสุทธิมีการใช้กลยุทธ์ด้วยความน่าจะเป็น 1 จากนั้นจะไม่ใช้กลยุทธ์บริสุทธิ์อื่นๆ ทั้งหมด และกลยุทธ์ i-th บริสุทธิ์นี้เป็นกรณีพิเศษของกลยุทธ์แบบผสม เพื่อรักษาความลับ ผู้เล่นแต่ละคนจะใช้กลยุทธ์ของตนเองโดยไม่คำนึงถึงทางเลือกของผู้เล่นคนอื่น

คำนิยาม. ผลตอบแทนเฉลี่ยของผู้เล่นคนแรกในเกมเมทริกซ์ที่มีเมทริกซ์ A แสดงเป็นความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของเขา

จ (ก x ย) = (1.20)

เห็นได้ชัดว่าผลตอบแทนเฉลี่ยของผู้เล่นคนแรกเป็นฟังก์ชันของตัวแปร x และ y สองชุด ผู้เล่นคนแรกตั้งเป้าหมายที่จะเพิ่มผลตอบแทนโดยเฉลี่ยของเขา E (A, x, y) โดยการเปลี่ยนกลยุทธ์แบบผสม x และผู้เล่นคนที่สองพยายามทำให้ E (A, x, y) น้อยที่สุดโดยใช้กลยุทธ์แบบผสม เช่น ในการแก้ปัญหาเกมจำเป็นต้องค้นหา x, y ซึ่งถึงราคาสูงสุดของเกม

1.3 สั่งซื้อ 22 เกม

เกมเมทริกซ์ลำดับที่ 22 ถูกกำหนดโดยเมทริกซ์ผลตอบแทนต่อไปนี้สำหรับผู้เล่นคนแรก:

ทางออกของเกมนี้ควรเริ่มต้นด้วยการหาจุดอานด้วยกลยุทธ์ล้วนๆ เพื่อจุดประสงค์นี้ ให้หาองค์ประกอบขั้นต่ำในแถวแรกและตรวจสอบว่าเป็นองค์ประกอบสูงสุดในคอลัมน์หรือไม่ หากไม่พบองค์ประกอบดังกล่าว บรรทัดที่สองจะถูกตรวจสอบในลักษณะเดียวกัน หากพบองค์ประกอบดังกล่าวในบรรทัดที่สอง แสดงว่าเป็นองค์ประกอบอานม้า

โดยการค้นหาองค์ประกอบอาน หากมีหนึ่ง กระบวนการค้นหาวิธีแก้ปัญหาจะสิ้นสุดลง เนื่องจากในกรณีนี้จะพบราคาของเกม - องค์ประกอบอานและจุดอาน เช่น คู่ของกลยุทธ์บริสุทธิ์สำหรับตัวที่หนึ่งและตัวที่สอง ผู้เล่นประกอบด้วยกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด หากไม่มีจุดอานในกลยุทธ์ล้วน ๆ ก็จำเป็นต้องหาจุดอานในกลยุทธ์แบบผสม ซึ่งจำเป็นต้องเป็นไปตามทฤษฎีบทหลักของเกมเมทริกซ์

แสดงโดย x=(x 1 ,x 2), y=(y 1 ,y 2) กลยุทธ์ผสมของผู้เล่นคนแรกและคนที่สองตามลำดับ จำไว้ว่า x 1 หมายถึงความน่าจะเป็นของผู้เล่นคนแรกที่ใช้กลยุทธ์แรก และ x 2 \u003d 1 - x 1 คือความน่าจะเป็นที่จะใช้กลยุทธ์ที่สอง ในทำนองเดียวกันสำหรับผู้เล่นคนที่สอง: 1 - ความน่าจะเป็นของการใช้กลยุทธ์แรก y 2 = 1 - 1 - ความน่าจะเป็นของการใช้กลยุทธ์ที่สอง

ตามข้อพิสูจน์ของทฤษฎีบท เพื่อความเหมาะสมของกลยุทธ์แบบผสม x และ y มีความจำเป็นและเพียงพอสำหรับความสัมพันธ์ที่ไม่เป็นลบ x 1 , x 2 , y 1 , y 2:

ตอนนี้เราแสดงให้เห็นว่าหากเกมเมทริกซ์ไม่มีจุดอานม้าในกลยุทธ์ที่บริสุทธิ์ ความไม่เท่าเทียมกันเหล่านี้จะต้องกลายเป็นความเท่าเทียมกัน:

อย่างแท้จริง. ปล่อยให้เกมไม่มีจุดอานในกลยุทธ์ที่บริสุทธิ์ จากนั้นค่าที่เหมาะสมที่สุดของกลยุทธ์แบบผสมจะตอบสนองความไม่เท่าเทียมกัน

0<<1, 0<< 1,

0< <1, 01. (1.25)

สมมติว่าอสมการทั้งสองจาก (1.22) เข้มงวด

จากนั้น ตามทฤษฎีบท y 1 = y 2 = 0 ซึ่งขัดแย้งกับเงื่อนไข (1.25)

สามารถพิสูจน์ได้ในทำนองเดียวกันว่าอสมการทั้งสองใน (1.23) ไม่สามารถเป็นอสมการแบบเข้มงวดได้

สมมติว่าตอนนี้หนึ่งในอสมการ (1.22) สามารถเข้มงวดได้ เช่น อสมการแรก

ซึ่งหมายความว่าตามทฤษฎีบท y 1 = 0, y 2 =1 ดังนั้นเราจึงได้รับจาก (1.23)

หากอสมการทั้งสอง (1.24) เคร่งครัด ดังนั้นตามทฤษฎีบท x1 = x2 = 0 ซึ่งขัดแย้งกับ (1.25) แต่ถ้า 12 เป็น 22 แล้วหนึ่งในอสมการ (1.27) เข้มงวด และอีกอันหนึ่งคือความเสมอภาค นอกจากนี้ ความเท่าเทียมกันจะคงไว้สำหรับองค์ประกอบที่ใหญ่กว่าจาก 12 และ 22 นั่นคือ หนึ่งอสมการจาก (1.27) จะต้องเคร่งครัด ตัวอย่างเช่น 12< а 22 . Тогда справедливо а 12 < v, а это равносильно тому, что первое неравенство из (1.24) строгое. Тогда согласно теореме должно х 1 = 0, что противоречит условию (1.25). Если а 12 = а 22 , то оба неравенства (1.27) превращаются в равенства и тогда можно положить х 1 = 0, что противоречит (1.25). Итак, предположение о том, что первое неравенство из (1.22) может быть строгим, не справедливо. Аналогично можно показать, что второе неравенство из (1.22) также не может быть строгим.

ดังนั้นจึงแสดงให้เห็นว่าหากเกมเมทริกซ์ไม่มีจุดอานม้าในกลยุทธ์ล้วน ๆ ความไม่เท่าเทียมกัน (1.22) จะกลายเป็นความเท่าเทียมกันสำหรับกลยุทธ์ที่ดีที่สุดของผู้เล่นคนแรก ข้อโต้แย้งที่คล้ายกันเกี่ยวกับความไม่เท่าเทียมกัน (1.23) จะนำไปสู่ความจริงที่ว่าในกรณีนี้ความไม่เท่าเทียมกัน (1.23) จะต้องมีความเท่าเทียมกัน

ดังนั้น หากเกมเมทริกซ์ลำดับที่ 22 ไม่มีอานม้า กลยุทธ์ผสมที่เหมาะสมที่สุดของผู้เล่นและราคาของเกมสามารถกำหนดได้โดยการแก้ระบบสมการ (1.24) นอกจากนี้ยังเป็นที่ยอมรับว่าหากในเกมเมทริกซ์ 2x2 ผู้เล่นคนใดคนหนึ่งมีกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด ผู้เล่นอีกคนก็มีกลยุทธ์บริสุทธิ์ที่เหมาะสมเช่นกัน

ดังนั้น หากเกมเมทริกซ์ไม่มีจุดอานม้าในกลยุทธ์ล้วน ๆ ก็จะต้องมีวิธีแก้ปัญหาในกลยุทธ์ผสม ซึ่งพิจารณาจากสมการ (1.24) โซลูชันระบบ (1.25)

1.4 วิธีพีชคณิต

มีสองกรณีสำหรับการแก้ปัญหาด้วยวิธีพีชคณิต:

1. เมทริกซ์มีจุดอาน

2. เมทริกซ์ไม่มีจุดอาน

ในกรณีแรก วิธีแก้ปัญหาคือกลยุทธ์คู่หนึ่งที่สร้างจุดอานม้าของเกม ลองพิจารณากรณีที่สอง วิธีแก้ปัญหาที่นี่ควรเป็นกลยุทธ์แบบผสม:

ค้นหากลยุทธ์และ เมื่อผู้เล่นคนแรกใช้กลยุทธ์ที่ดีที่สุดของเขา ผู้เล่นคนที่สองสามารถใช้กลยุทธ์บริสุทธิ์เช่นนั้นได้สองอย่าง

ในเวลาเดียวกัน โดยอาศัยอำนาจตามคุณสมบัติ หากผู้เล่นคนใดคนหนึ่งใช้กลยุทธ์แบบผสมที่เหมาะสมที่สุด และอีกคนหนึ่ง - บริสุทธิ์ใดๆ ที่รวมอยู่ในกลยุทธ์แบบผสมที่เหมาะสมที่สุดของเขาโดยมีความน่าจะเป็นที่ไม่เป็นศูนย์ ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนเสมอ ยังคงไม่เปลี่ยนแปลงและเท่ากับราคาของเกม นั่นคือ

ผลตอบแทนในแต่ละกรณีเหล่านี้จะต้องเท่ากับมูลค่าของเกม V ในกรณีนี้ ความสัมพันธ์ต่อไปนี้ถูกต้อง:

ระบบสมการที่คล้ายกับ (2.5), (2.6) สามารถประกอบขึ้นสำหรับกลยุทธ์ที่เหมาะสมที่สุดของผู้เล่นคนที่สอง:

คำนึงถึงสภาวะการทำให้เป็นมาตรฐาน:

เรามาแก้สมการ (1.37) - (1.41) ด้วยความเคารพต่อสิ่งที่ไม่รู้ ไม่ใช่ทั้งหมดในคราวเดียว แต่ครั้งละสาม: แยกกัน (1.36), (1.38), (1.40) และ (1.37), (1.39) , (1.41). จากผลการแก้ปัญหา เราได้รับ:

1.5 วิธีการแบบกราฟิก

วิธีแก้ปัญหาโดยประมาณของเกม 22 สามารถหาได้ค่อนข้างง่ายโดยใช้วิธีการแบบกราฟิก สาระสำคัญมีดังนี้:

รูปที่ 1.1 - การหาส่วนของความยาวหน่วย

เลือกส่วนของความยาวหน่วยบนแกน abscissa ด้านซ้ายสุดจะแสดงกลยุทธ์แรกของผู้เล่นคนแรก และด้านขวาของผู้เล่นคนที่สอง จุดกึ่งกลางทั้งหมดสอดคล้องกับกลยุทธ์แบบผสมของผู้เล่นคนแรก และความยาวของส่วนทางด้านขวาของจุดนั้นเท่ากับความน่าจะเป็นที่จะใช้กลยุทธ์แรก และความยาวของส่วนทางด้านซ้ายคือความน่าจะเป็นที่จะใช้ กลยุทธ์ที่สองโดยผู้เล่นคนแรก

ดำเนินการสองแกน I-I และ II-II ใน I-I เราจะเลื่อนการจ่ายเงินเมื่อผู้เล่นคนแรกใช้กลยุทธ์แรก ใน II-II เมื่อเขาใช้กลยุทธ์ที่สอง ตัวอย่างเช่น ผู้เล่นคนที่สองใช้กลยุทธ์แรกของเขา จากนั้นค่าควรลงจุดบนแกน II-I และค่าบนแกน II-II

สำหรับกลยุทธ์ผสมใดๆ ของผู้เล่นคนแรก ผลตอบแทนของเขาจะถูกกำหนดโดยขนาดของกลุ่ม บรรทัด I-I สอดคล้องกับการใช้กลยุทธ์แรกโดยผู้เล่นคนที่สอง เราจะเรียกมันว่ากลยุทธ์แรกของผู้เล่นคนที่สอง กลยุทธ์ที่สองของผู้เล่นคนที่สองสามารถสร้างได้เช่นเดียวกัน โดยทั่วไปแล้ว การแสดงกราฟิกของเมทริกซ์เกมจะอยู่ในรูปแบบต่อไปนี้:

รูปที่ 1.2 - การค้นหาราคาของเกม

อย่างไรก็ตาม ควรสังเกตว่าการก่อสร้างนี้ดำเนินการสำหรับผู้เล่นคนแรก ที่นี่ความยาวของส่วนเท่ากับมูลค่าของเกม V

เส้น 1N2 เรียกว่าเส้นผลตอบแทนที่ต่ำกว่า เห็นได้ชัดเจนว่าจุด N ตรงกับค่าสูงสุดของการรับประกันผลตอบแทนของผู้เล่นคนแรก

โดยทั่วไปแล้ว กลยุทธ์ของผู้เล่นคนที่สองสามารถกำหนดได้จากตัวเลขนี้ ตัวอย่างเช่น ด้วยวิธีดังกล่าว บนแกน I-I:

หรือบนแกน II-II

อย่างไรก็ตาม กลยุทธ์ของผู้เล่นคนที่สองสามารถกำหนดได้ในลักษณะเดียวกับที่ทำกับผู้เล่นคนแรก นั่นคือ สร้างแผนภูมิดังกล่าว

รูปที่ 1.3 - คำจำกัดความของกลยุทธ์ของผู้เล่นคนที่สอง

บรรทัดที่ 1N2 คือขีดจำกัดบนของการขาดทุน จุด N สอดคล้องกับการสูญเสียขั้นต่ำที่เป็นไปได้ของผู้เล่นคนที่สอง และกำหนดกลยุทธ์

ขึ้นอยู่กับค่าเฉพาะของค่าสัมประสิทธิ์ เมทริกซ์ของกราฟอาจมีรูปแบบที่แตกต่างกัน เช่น ดังนี้

รูปที่ 1.4 - กำหนดกลยุทธ์ที่เหมาะสมที่สุดของผู้เล่นคนแรก

ในสถานการณ์เช่นนี้ กลยุทธ์ที่ดีที่สุดของผู้เล่นคนแรกคือบริสุทธิ์:

1.6 เกม 2n หรือ m2

ในเกมลำดับที่ 2n ผู้เล่นคนแรกมี 2 กลยุทธ์ล้วน และผู้เล่นคนที่สองมี n กลยุทธ์ล้วน เช่น เมทริกซ์ผลตอบแทนสำหรับผู้เล่นคนแรกคือ:

หากเกมดังกล่าวมีจุดอานก็จะง่ายต่อการค้นหาและรับวิธีแก้ปัญหา

สมมติว่าเกมมีจุดอาน จากนั้นจำเป็นต้องค้นหากลยุทธ์แบบผสมและตามลำดับผู้เล่นคนแรกและคนที่สองและราคาของเกม v ซึ่งตอบสนองความสัมพันธ์:

เนื่องจากเกมไม่มีจุดอาน ความไม่เท่าเทียมกัน (1.54) จึงถูกแทนที่ด้วยความไม่เท่าเทียมกัน

ในการแก้ปัญหาระบบ (1.56), (1.55), (1.53) ควรใช้วิธีการแบบกราฟิก เพื่อจุดประสงค์ เราแนะนำสัญกรณ์สำหรับด้านซ้ายของอสมการ (1.53)

แบบจำลองทางคณิตศาสตร์เกมเมทริกซ์

หรือเราได้รับการตั้งค่าจาก (1.55) และทำการแปลงอย่างง่าย

ผลตอบแทนเฉลี่ยของผู้เล่นคนแรกอยู่ที่ไหน โดยมีเงื่อนไขว่าเขาใช้กลยุทธ์แบบผสม และคนที่สอง - กลยุทธ์บริสุทธิ์ j-th ของเขา

ตามนิพจน์ แต่ละค่า j=1, 2, …, n สอดคล้องกับเส้นตรงในระบบพิกัดสี่เหลี่ยม

เป้าหมายของผู้เล่นคนที่สองคือการลดผลตอบแทนของผู้เล่นคนแรกโดยการเลือกกลยุทธ์ของเขา ดังนั้นเราจึงคำนวณ

ขอบเขตล่างของชุดข้อจำกัดอยู่ที่ไหน ในรูปที่ 1.6 กราฟของฟังก์ชันจะแสดงด้วยเส้นหนา

โฮสต์ที่ http://www.allbest.ru/

รูปที่ 1.6 - กราฟฟังก์ชัน

เป้าหมายของผู้เล่นคนแรกคือการเพิ่มผลตอบแทนสูงสุดผ่านตัวเลือก เช่น คำนวณ

ในรูป 1.6 จุดหมายถึงค่าสูงสุดที่หาได้ที่ ราคาของเกมเนื่องจาก:

ดังนั้น กลยุทธ์ผสมที่เหมาะสมที่สุดของผู้เล่นคนแรกและคู่ของกลยุทธ์บริสุทธิ์ของผู้เล่นคนที่สองจะถูกกำหนดแบบกราฟิกซึ่งเป็นจุดตัดกัน รูปที่ 1.6 แสดงกลยุทธ์ที่ 2 และ 3 ของผู้เล่นคนที่สอง สำหรับกลยุทธ์ดังกล่าว ความไม่เท่าเทียมกัน (1.53) จะกลายเป็นความเท่าเทียมกัน ในรูป 1.6 กลยุทธ์เหล่านี้คือ j=2, j=3

ตอนนี้เราแก้ระบบสมการได้แล้ว

และกำหนดค่าของและอย่างแม่นยำ (กราฟิกจะถูกกำหนดโดยประมาณ) จากนั้นใส่ค่าทั้งหมดที่ j ที่ไม่ได้สร้างจุดแก้ระบบสมการ (1.56) สำหรับตัวอย่างที่แสดงในรูปที่ 1.6 นี่คือระบบต่อไปนี้:

และส่วนที่เหลือ ระบบนี้สามารถแก้ไขได้โดยการลาดเอียง หากสำหรับบาง j=j 0 กลยุทธ์ของผู้เล่นคนที่สองสร้างจุด M 0 จากนั้นค่าสูงสุดของขอบเขตล่างของชุดข้อจำกัดจะแสดงด้วยส่วนที่ขนานกับ แกน ในกรณีนี้ผู้เล่นคนแรกมีค่าที่เหมาะสมที่สุดมากมายและราคาของเกม กรณีนี้แสดงในรูปที่ 1.7 โดยที่และส่วน MN แสดงถึงขีด จำกัด บน ค่าที่เหมาะสมที่สุดจะอยู่ภายในขีด จำกัด ผู้เล่นคนที่สองมีกลยุทธ์ที่ดีที่สุดอย่างแท้จริง j=j 0

เกมเมทริกซ์ของคำสั่ง m2 ยังได้รับการแก้ไขโดยใช้วิธีการแบบกราฟิก เมทริกซ์ผลตอบแทนของผู้เล่นคนแรกในกรณีนี้มีรูปแบบ

กลยุทธ์แบบผสมของผู้เล่นคนแรกและคนที่สองตามลำดับถูกกำหนดในลักษณะเดียวกับในกรณีของเกมลำดับที่ 2n ให้ค่าจาก 0 ถึง 1 วาดตามแกนนอน ซึ่งเป็นค่าของผลตอบแทนเฉลี่ย) ของผู้เล่นคนแรกบนแกนตั้ง ภายใต้เงื่อนไขที่ผู้เล่นคนแรกใช้กลยุทธ์ i-th บริสุทธิ์ของเขา (i=1, 2, ..., m) อันที่สอง - กลยุทธ์แบบผสมของเขา (y 1 , 1- y 1) =y. ตัวอย่างเช่น เมื่อ m=4 ในเชิงกราฟ) สามารถแสดงได้ดังรูปที่ 1.7

รูปที่ 1.7 - กราฟฟังก์ชัน)

ผู้เล่นคนแรกพยายามเพิ่มผลตอบแทนเฉลี่ยให้ได้มากที่สุด ดังนั้นเขาจึงพยายามค้นหา

ฟังก์ชันจะแสดงเป็นเส้นหนาและแสดงถึงขอบเขตบนของชุดข้อจำกัด ผู้เล่นคนที่สองพยายามลดขนาดโดยเลือกกลยุทธ์ของเขา เช่น ค่าที่สอดคล้องกัน

ในรูป ค่าจะถูกระบุด้วยจุด กล่าวอีกนัยหนึ่ง กลยุทธ์ทั้งสองดังกล่าวของผู้เล่นคนแรกและความน่าจะเป็นสำหรับผู้เล่นคนที่สองถูกกำหนดให้บรรลุความเท่าเทียมกัน

จากรูปเราจะเห็นว่าราคาของเกมนั้นขึ้นอยู่กับจุด ความน่าจะเป็นคือจุดย่อยของจุด สำหรับกลยุทธ์บริสุทธิ์ที่เหลือของผู้เล่นคนแรกในกลยุทธ์ผสมที่ดีที่สุดจะต้อง ()

ดังนั้น ระบบการแก้ปัญหา (1.69) เราได้รับกลยุทธ์ที่เหมาะสมที่สุดของผู้เล่นคนที่สองและมูลค่าของเกม เราพบกลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับผู้เล่นคนแรกโดยการแก้ระบบสมการต่อไปนี้:

1.7 วิธีเมทริกซ์สำหรับการแก้เกม

ชื่อ:

เมทริกซ์ย่อยสี่เหลี่ยมใดๆ ของเมทริกซ์ลำดับ

เมทริกซ์ (1);

เมทริกซ์เปลี่ยนไป;

เมทริกซ์แนบกับ B;

- (1) เมทริกซ์ที่ได้จาก X โดยการลบองค์ประกอบที่สอดคล้องกับแถวที่ถูกลบเมื่อได้รับ;

- (1) เมทริกซ์ที่ได้จากการลบองค์ประกอบที่สอดคล้องกับแถวที่ถูกลบเมื่อได้รับ

อัลกอริทึม:

1. เลือกเมทริกซ์ย่อยตารางของเมทริกซ์ลำดับ () และคำนวณ

2. ถ้ามีหรือ ให้ทิ้งเมทริกซ์ที่พบและลองเมทริกซ์อื่น

3. ถ้า (), () เราคำนวณและสร้าง X และจาก และ เพิ่มศูนย์ในตำแหน่งที่เหมาะสม

การตรวจสอบว่าความไม่เท่าเทียมกันเป็นที่พอใจหรือไม่

สำหรับแต่ละ (1.75)

และความไม่เท่าเทียมกัน

สำหรับแต่ละ (1.76)

หากหนึ่งในอัตราส่วนไม่เป็นที่พอใจเราจะลองอีกครั้ง หากความสัมพันธ์ทั้งหมดถูกต้อง X และคำตอบที่ต้องการ

1.8 วิธีการประมาณราคาของเกมอย่างต่อเนื่อง

ในการศึกษาสถานการณ์ของเกม บ่อยครั้งอาจเกิดขึ้นได้ว่าไม่จำเป็นต้องได้รับวิธีแก้ปัญหาที่แน่นอนสำหรับเกม หรือด้วยเหตุผลบางประการ เป็นไปไม่ได้หรือยากมากที่จะหามูลค่าที่แน่นอนของราคาเกมและกลยุทธ์แบบผสมที่เหมาะสมที่สุด จากนั้นคุณสามารถใช้วิธีการโดยประมาณในการแก้เกมเมทริกซ์

ให้เราอธิบายหนึ่งในวิธีการเหล่านี้ - วิธีการประมาณราคาเกมอย่างต่อเนื่อง จำนวนผลตอบแทนที่คำนวณด้วยวิธีนี้จะเพิ่มขึ้นโดยประมาณตามสัดส่วนของจำนวนแถวและคอลัมน์ของเมทริกซ์ผลตอบแทน

สาระสำคัญของวิธีการมีดังนี้: จิตใจมีการเล่นเกมหลายครั้งเช่น ตามลำดับ ในแต่ละเกมผู้เล่นเลือกกลยุทธ์ที่ให้ผลตอบแทนโดยรวม (ทั้งหมด) มากที่สุด

หลังจากใช้งานบางเกมดังกล่าวแล้ว ระบบจะคำนวณค่าเฉลี่ยของการชนะของผู้เล่นคนแรกและการแพ้ของผู้เล่นคนที่สอง และค่าเฉลี่ยเลขคณิตจะถือเป็นมูลค่าโดยประมาณของราคาเกม วิธีการนี้ทำให้สามารถหาค่าโดยประมาณของกลยุทธ์แบบผสมที่เหมาะสมที่สุดของผู้เล่นทั้งสองได้: จำเป็นต้องคำนวณความถี่ของการใช้กลยุทธ์บริสุทธิ์แต่ละกลยุทธ์ และใช้เป็นค่าโดยประมาณในกลยุทธ์ผสมที่เหมาะสมที่สุดของผู้เล่นที่เกี่ยวข้อง

สามารถพิสูจน์ได้ว่าด้วยจำนวนเกมโปรแกรมที่เพิ่มขึ้นอย่างไม่จำกัด กำไรเฉลี่ยของผู้เล่นคนแรกและการสูญเสียเฉลี่ยของผู้เล่นคนที่สองจะเข้าใกล้ราคาของเกมอย่างไม่มีกำหนด และค่าโดยประมาณของกลยุทธ์ผสมใน กรณีที่การแก้ปัญหาของเกมไม่ซ้ำกันมักจะเป็นกลยุทธ์แบบผสมผสานที่เหมาะสมที่สุดของผู้เล่นแต่ละคน โดยทั่วไปแล้วการประมาณค่าเหนือค่าที่ระบุเป็นค่าจริงนั้นช้า อย่างไรก็ตาม กระบวนการนี้สามารถใช้กลไกได้อย่างง่ายดาย และด้วยเหตุนี้จึงช่วยให้ได้รับโซลูชันสำหรับเกมด้วยระดับความแม่นยำที่จำเป็น แม้จะมีเมทริกซ์ผลตอบแทนของคำสั่งซื้อที่ค่อนข้างใหญ่ก็ตาม

2. ภาคปฏิบัติ

ทั้งคู่ตัดสินใจว่าจะไปเดินเล่นที่ไหนและใช้เวลาเพื่อประโยชน์ของสองคน

หญิงสาวตัดสินใจไปเดินเล่นในสวนสาธารณะเพื่อรับอากาศบริสุทธิ์ในตอนเย็นเพื่อไปดูหนังที่โรงภาพยนตร์ที่ใกล้ที่สุด

ผู้ชายคนนั้นเสนอให้ไปที่เทคโนปาร์คหลังจากดูการแข่งขันของผู้เล่นฟุตบอลของสโมสรท้องถิ่นในสนามกีฬากลาง

ตามนี้คุณต้องค้นหาว่าเป้าหมายของผู้เล่นคนใดคนหนึ่งจะบรรลุได้นานแค่ไหน เมทริกซ์ผลตอบแทนจะมีลักษณะดังนี้:

ตารางที่ 1 เมทริกซ์ผลตอบแทน

กลยุทธ์

ตั้งแต่ 1 2 เห็นได้ชัดว่าไม่มีจุดอานในเกมนี้ด้วยกลยุทธ์ล้วนๆ ดังนั้นเราจึงใช้สูตรต่อไปนี้และเราได้:

โฮสต์ที่ http://www.allbest.ru/

2.2 เล่น 2xn และ mx2

ปัญหา 1(2xn)

มีการปลูกพืชสองชนิดสำหรับสภาพอากาศที่แห้งและชื้น

และสถานะของธรรมชาติถือได้ว่าเป็น: แห้ง, เปียก, ปานกลาง

โฮสต์ที่ http://www.allbest.ru/

ค่าสูงสุดของ M() ถึงจุด M ที่เกิดจากจุดตัดของเส้นที่สอดคล้องกับ j=1, j"=2 ดังนั้น เราถือว่า: ,

ปัญหาที่ 2(mx2)

ชายหนุ่มและหญิงสาวกำลังพิจารณาทางเลือกว่าจะไปที่ไหนในวันหยุดสุดสัปดาห์

ทางเลือกของสถานที่พักผ่อนสามารถแสดงเป็น: สวนสาธารณะ, โรงภาพยนตร์, ร้านอาหาร

โฮสต์ที่ http://www.allbest.ru/

ถึงค่าสูงสุดของ M() ที่จุด E ซึ่งเกิดจากจุดตัดของเส้นที่สอดคล้องกับ j=1, j"=2 ดังนั้น เราถือว่า: ,

ในการกำหนดค่า v คุณต้องแก้สมการต่อไปนี้:

2.5 วิธีเมทริกซ์

ร้านอาหารสองแห่งที่แข่งขันกัน (สถานประกอบการจัดเลี้ยง) ให้บริการดังต่อไปนี้ ร้านอาหารแห่งแรกตั้งอยู่ใจกลางเมืองและอีกแห่งอยู่นอกเมือง

ห้องอาหารส่วนกลางมีบริการดังต่อไปนี้:

1) การบริการลูกค้าแพงกว่าและดีกว่า;

2) อาหารเน้นไปที่อาหารฝรั่งเศส

ร้านอาหารแห่งที่สองให้บริการ:

1) บริการไม่แพงและมีคุณภาพสูง

2) เมนูผสมผสานอาหารที่มีชื่อเสียงของโลก

3) โปรโมชั่นและส่วนลดปกติ;

4) ดำเนินการจัดส่งและรับคำสั่งซื้อสำหรับการจัดส่งที่บ้าน

ตามภารกิจ กำไรสำหรับหนึ่งวันระหว่างสองร้านอาหารจะถูกแจกจ่ายดังนี้:

ตารางที่ 2 เมทริกซ์ผลตอบแทน

กลยุทธ์

การแก้เกมในรูปแบบเมทริกซ์:

มีหกเมทริกซ์ย่อยและ:

พิจารณาเมทริกซ์:

x 1 = ? 0,x2=? 0

เนื่องจาก x 2 =< 0, то мы отбрасываем.

พิจารณาเมทริกซ์ตอนนี้:

x 1 = ? 0,x2=? 0

ราคาเกม.

อัตราส่วนนี้ขัดแย้งกับข้อกำหนด จึงไม่เหมาะ

พิจารณาเมทริกซ์ตอนนี้:

x 1 = , x 2 = ? 0,

ปี 1 =< 0, y 2 = ? 0.

ตั้งแต่ y 1 =< 0, то мы отбрасываем и.

พิจารณาเมทริกซ์ตอนนี้:

x 1 \u003d, x 2 \u003d 0 เนื่องจาก x 2 \u003d 0 เราจึงละทิ้ง และ

พิจารณาเมทริกซ์ตอนนี้:

x 1 = , x 2 = ? 0. เนื่องจาก x 1 \u003d 0 เราจึงละทิ้ง และ

พิจารณาเมทริกซ์ตอนนี้:

x 1 = , x 2 =, y 1 = , y 2 = จากนั้นเราดำเนินการต่อไป:

x 1 = , x 2 =, y 1 = , y 2 = หรือ

ราคาเกม.

ตอนนี้มีการตรวจสอบความสัมพันธ์หลัก:

โฮสต์ที่ http://www.allbest.ru/

คำตอบ: x 1 =, x 2 =, y 1 =, y 2 =, y 3 =0, y 4 =0,

วิธีสีน้ำตาล

ตามคำร้องขอของพนักงานของบริษัทแห่งหนึ่ง สหภาพแรงงานจะเจรจากับผู้บริหารเกี่ยวกับการจัดอาหารร้อนโดยบริษัทเป็นผู้ออกค่าใช้จ่าย สหภาพแรงงานที่เป็นตัวแทนผลประโยชน์ของคนงานทำให้มั่นใจได้ว่าอาหารมีคุณภาพสูงสุดเท่าที่จะเป็นไปได้และมีราคาแพงกว่า ฝ่ายบริหารของบริษัทมีส่วนได้เสียที่ขัดแย้งกัน ในที่สุดคู่สัญญาก็ตกลงดังต่อไปนี้ สหภาพแรงงาน (ผู้เล่น 1) เลือกหนึ่งในสามบริษัท (A 1 , A 2 , A 3) จัดหาอาหารร้อน และผู้บริหารบริษัท (ผู้เล่น 2) เลือกชุดอาหารจากสามตัวเลือกที่เป็นไปได้ (B 1 , B 2 , ข3). หลังจากลงนามในข้อตกลงแล้ว สหภาพแรงงานจะสร้างเมทริกซ์การชำระเงินต่อไปนี้ ซึ่งองค์ประกอบดังกล่าวแสดงถึงต้นทุนของชุดอาหาร:

ให้เกมได้รับจากเมทริกซ์ผลตอบแทนต่อไปนี้:

สมมติว่าผู้เล่นคนที่สองเลือกกลยุทธ์ที่ 2 แล้ว ผู้เล่นคนแรกจะได้รับ:

2 ถ้าเขาใช้กลยุทธ์ที่ 1

3 ถ้าเขาใช้กลยุทธ์ที่ 3 ของเขา

ค่าที่ได้สรุปไว้ในตารางที่ 1

ตารางที่ 3 กลยุทธ์ของผู้เล่นคนที่สอง

หมายเลขแบทช์

กลยุทธ์ผู้เล่นที่ 2

ผู้เล่นคนที่ 1 ชนะ

ตารางที่ 3 แสดงให้เห็นว่าด้วยกลยุทธ์ที่ 2 ของผู้เล่นคนที่สอง ผู้เล่นคนแรกจะได้รับผลตอบแทนสูงสุด 3 โดยใช้กลยุทธ์ที่ 2 หรือ 3 ของเขา เนื่องจากผู้เล่นคนแรกต้องการได้รับผลตอบแทนสูงสุด เขาตอบสนองต่อกลยุทธ์ที่ 2 ของผู้เล่นคนที่สองด้วยกลยุทธ์ที่ 2 ของเขา ด้วยกลยุทธ์ที่ 2 ของผู้เล่นคนแรก คนที่สองจะแพ้:

1 ถ้าเขาใช้กลยุทธ์ที่ 1 ของเขา

3 ถ้าเขาใช้กลยุทธ์ที่ 2

4 ถ้าเขาใช้กลยุทธ์ที่ 3 ของเขา

ตารางที่ 4 กลยุทธ์ของผู้เล่นคนแรก

หมายเลขแบทช์

กลยุทธ์ผู้เล่น 1 คน

การสูญเสียผู้เล่นคนที่ 2

ตารางที่ 2 แสดงให้เห็นว่าด้วยกลยุทธ์ที่ 2 ของผู้เล่นคนแรก ผู้เล่นคนที่สองจะสูญเสียน้อยที่สุด 1 ถ้าเขาใช้กลยุทธ์ที่ 1 ของเขา เนื่องจากผู้เล่นคนที่สองต้องการที่จะสูญเสียน้อยลง จากนั้นเพื่อตอบสนองต่อกลยุทธ์ที่ 2 ของผู้เล่นคนแรก เขาจะใช้กลยุทธ์ที่ 1 ของเขา ผลลัพธ์ที่ได้สรุปไว้ในตารางที่ 5

ตารางที่ 5 กลยุทธ์ของผู้เล่นคนแรกและคนที่สองตามลำดับ

หมายเลขแบทช์

กลยุทธ์ผู้เล่นที่ 2

เงินรางวัลรวมของผู้เล่นคนที่ 1

กลยุทธ์ผู้เล่น 1 คน

ในตาราง 5 ในคอลัมน์ของกลยุทธ์ของผู้เล่นคนที่สองในบรรทัดที่สองคือหมายเลข 1 ซึ่งบ่งชี้ว่าในเกมที่สองจะเป็นประโยชน์สำหรับผู้เล่นคนที่สองในการใช้กลยุทธ์ที่ 1 ของเขา ในคอลัมน์และเป็นผลตอบแทนเฉลี่ยที่ใหญ่ที่สุด 3 ของผู้เล่นคนแรกที่เขาได้รับในเกมแรก คอลัมน์ w มีการสูญเสียเฉลี่ยน้อยที่สุด 1 ที่ผู้เล่นคนที่สองได้รับในเกมแรก คอลัมน์ v มีค่าเฉลี่ยเลขคณิต v = (u + w) -- นั่นคือมูลค่าโดยประมาณของราคาของเกม ที่ได้รับจากการเล่นเกมหนึ่งเกม หากผู้เล่นคนที่สองใช้กลยุทธ์ที่ 1 ของเขา ผู้เล่นคนแรกจะได้รับ 3, 1, 2 ตามลำดับด้วยกลยุทธ์ที่ 1, 2 และ 3 ของเขา และผลตอบแทนรวมของผู้เล่นคนแรกสำหรับทั้งสองเกมจะเป็น:

2 + 3=5 ด้วยกลยุทธ์ที่ 1 ของเขา

3 + 1=4 ด้วยกลยุทธ์ที่ 2 ของเขา

3 + 2=5 ด้วยกลยุทธ์ที่ 3 ของเขา

การชนะทั้งหมดเหล่านี้จะถูกบันทึกไว้ในบรรทัดที่สองของตาราง 3 และในคอลัมน์ที่สอดคล้องกับกลยุทธ์ของผู้เล่นคนแรก: 1, 2, 3

จากผลตอบแทนทั้งหมด ที่ใหญ่ที่สุดคือ 5 จะได้รับจากกลยุทธ์ที่ 1 และ 3 ของผู้เล่นคนแรก จากนั้นเขาสามารถเลือกหนึ่งในนั้น กล่าวคือ ในกรณีเช่นนี้เมื่อมีผลตอบแทนรวมที่เหมือนกันสองรายการ (หรือหลายรายการ) กลยุทธ์ที่มีจำนวนน้อยที่สุดจะถูกเลือก (ในกรณีของเรา เราจำเป็นต้องใช้กลยุทธ์ที่ 1)

ด้วยกลยุทธ์ที่ 1 ของผู้เล่นคนแรก ผู้เล่นคนที่สองจะเสีย 3, 2, 3 ตามลำดับสำหรับกลยุทธ์ที่ 1, 2, 3 ของเขา และการสูญเสียทั้งหมดของผู้เล่นคนที่สองสำหรับทั้งสองเกมจะเป็น:

1 + 3=4 ด้วยกลยุทธ์ที่ 1 ของเขา

3 + 2=5 ด้วยกลยุทธ์ที่ 2 ของเขา

4 + 3=7 ด้วยกลยุทธ์ที่ 3 ของเขา

การสูญเสียทั้งหมดเหล่านี้จะถูกบันทึกไว้ในบรรทัดที่สองของตาราง 5 และในคอลัมน์ที่สอดคล้องกับกลยุทธ์ที่ 1, 2, 3 ของผู้เล่นคนที่สอง

จากการสูญเสียทั้งหมดของผู้เล่นคนที่สอง จำนวนที่น้อยที่สุดคือ 4 ซึ่งได้มาจากกลยุทธ์ที่ 1 ของเขา ดังนั้นในเกมที่สาม ผู้เล่นคนที่สองต้องใช้กลยุทธ์ที่ 1 ของเขา ในคอลัมน์และใส่ผลตอบแทนรวมที่ใหญ่ที่สุดของผู้เล่นคนแรกในสองเกม หารด้วยจำนวนเกม เช่น; คอลัมน์ w ประกอบด้วยการสูญเสียรวมที่น้อยที่สุดของผู้เล่นคนที่สองในสองเกม หารด้วยจำนวนเกม เช่น ; ค่าเฉลี่ยเลขคณิตของค่าเหล่านี้ใส่ในคอลัมน์ v เช่น = ตัวเลขนี้ใช้เป็นค่าประมาณของราคาของเกมที่มีเกมที่ "เล่นแล้ว" สองเกม

ดังนั้นจึงได้ตาราง 4 ต่อไปนี้สำหรับสองชุดของเกม

ตารางที่ 6 กำไรและขาดทุนทั้งหมดของผู้เล่นในสองเกมที่เล่น

กลยุทธ์ผู้เล่นที่ 2

เงินรางวัลรวมของผู้เล่นคนที่ 1

กลยุทธ์ผู้เล่น 1 คน

การสูญเสียทั้งหมดของผู้เล่นที่ 2

ในแถวที่สามของตารางที่ 6 ในคอลัมน์กลยุทธ์ของผู้เล่นคนที่สอง จะมีหมายเลข 1 ซึ่งแสดงว่าในเกมที่สาม ผู้เล่นคนที่สองต้องใช้กลยุทธ์ที่ 1 ของเขา ในกรณีนี้ ผู้เล่นคนแรกชนะ 3, 1, 2 โดยใช้กลยุทธ์ที่ 1, 2, 3 ตามลำดับ และผลตอบแทนรวมสำหรับสามเกมจะเป็น:

3 + 5 = 8 ที่กลยุทธ์ที่ 1 ของเขา

1 +4 = 5 ด้วยกลยุทธ์ที่ 2 ของเขา

2 + 5 = 7 สำหรับกลยุทธ์ที่ 3 ของเขา

ผลตอบแทนรวมของผู้เล่นคนแรกเหล่านี้จะถูกบันทึกไว้ในแถวที่สามของตาราง 6 และคอลัมน์ที่สอดคล้องกับกลยุทธ์ 1, 2, 3 ของเขา เนื่องจากผลตอบแทนรวมที่ใหญ่ที่สุด 8 ของผู้เล่นคนแรกได้มาจากกลยุทธ์ที่ 1 เขาจึงเลือกที่ 1 ตามนั้น .

ด้วยกลยุทธ์ที่ 1 ของผู้เล่นคนแรก ผู้เล่นคนที่สองจะเสีย 3, 1, 2 ตามลำดับ สำหรับกลยุทธ์ที่ 1, 2, 3 และการสูญเสียทั้งหมดของผู้เล่นคนที่สองสำหรับทั้งสองเกมจะเป็น:

3 + 4=7 ด้วยกลยุทธ์ที่ 1 ของเขา

2 + 5=7 ด้วยกลยุทธ์ที่ 2 ของเขา

3 + 7=10 ด้วยกลยุทธ์ที่ 3 ของเขา

การสูญเสียทั้งหมดเหล่านี้จะถูกบันทึกไว้ในบรรทัดที่สามของตาราง 6 และในคอลัมน์ที่สอดคล้องกับกลยุทธ์ที่ 1, 2, 3 ของผู้เล่นคนที่สอง จากการสูญเสียทั้งหมดของเขา 7 เป็นจำนวนที่น้อยที่สุดและได้มาจากกลยุทธ์ที่ 1 และ 2 จากนั้นผู้เล่นคนที่สองต้องใช้กลยุทธ์ที่ 1 ของเขา

ในตาราง 6 ในแถวที่สามในคอลัมน์และรางวัลรวมที่ใหญ่ที่สุดของผู้เล่นคนแรกในสามเกม หารด้วยจำนวนเกม เช่น ; คอลัมน์ w มีการสูญเสียรวมน้อยที่สุดของผู้เล่นคนที่สองในสามเกม หารด้วยจำนวนเกม เช่น ; ในคอลัมน์ v ใส่ค่าเฉลี่ยเลขคณิต

ดังนั้นเราจึงได้ตาราง 7 สำหรับสามฝ่าย

ตารางที่ 7 กำไรและขาดทุนรวมของผู้เล่นในสามเกมที่เล่น

หมายเลขแบทช์

กลยุทธ์ผู้เล่นที่ 2

เงินรางวัลรวมของผู้เล่นคนที่ 1

กลยุทธ์ผู้เล่น 1 คน

การสูญเสียทั้งหมดของผู้เล่นที่ 2

ตารางที่ 8 ตารางสุดท้ายที่มีการแข่งขัน 20 เกม

หมายเลขแบทช์

กลยุทธ์ผู้เล่นที่ 2

เงินรางวัลรวมของผู้เล่นคนที่ 1

กลยุทธ์ผู้เล่น 1 คน

การสูญเสียทั้งหมดของผู้เล่นที่ 2

จากตาราง 7 และ 8 จะเห็นได้ว่าในเกมที่แพ้ 20 เกม กลยุทธ์ 1, 2, 3 สำหรับผู้เล่นคนแรกเกิดขึ้น 12, 3, 5 ครั้งตามลำดับ ดังนั้นความถี่สัมพัทธ์จึงเท่ากันตามลำดับ กลยุทธ์ 1, 2, 3 สำหรับผู้เล่นคนที่สองเกิดขึ้นตามลำดับ 7, 11.2 ครั้ง ดังนั้นความถี่สัมพัทธ์ของพวกเขาจึงเท่ากันตามลำดับ มูลค่าโดยประมาณของราคาของเกม ประมาณนี้พอดี

โดยสรุป เราทราบว่าหากเกมมีวิธีแก้ปัญหามากกว่าหนึ่งวิธี ค่าโดยประมาณของต้นทุนของเกมจะยังคงเข้าใกล้ต้นทุนที่แท้จริงของเกมอย่างไม่มีกำหนด และความถี่สัมพัทธ์ของลักษณะที่ปรากฏของกลยุทธ์ของเกม ผู้เล่นไม่จำเป็นต้องเข้าใกล้กลยุทธ์แบบผสมที่เหมาะสมที่สุดของผู้เล่นอีกต่อไป

การวิเคราะห์ผลลัพธ์

ในงานหลักสูตรนี้ เนื้อหาสำหรับการหาทางออกของเกมที่เป็นปฏิปักษ์ได้รับการศึกษาโดยวิธีกราฟิก เมทริกซ์ ซึ่งเป็นวิธีการประมาณราคาของเกมอย่างต่อเนื่อง พบกลยุทธ์ที่ดีที่สุดของผู้เล่นคนแรกและคนที่สองรวมถึงราคาของเกมในเกม 2x2, 2xn และ mx2 รวมถึงในเกมที่ใช้วิธีเมทริกซ์และวิธีของบราวน์

ในตัวอย่างของคู่ เกม 2x2 ถูกสร้างแบบจำลอง ซึ่งแก้ไขโดยวิธีพีชคณิตและกราฟิก การแก้เกมด้วยวิธีพีชคณิต วิธีแก้ปัญหาแสดงให้เห็นว่าโดยการใช้กลยุทธ์ผสมที่เหมาะสมที่สุด ผู้เล่นคนแรกและคนที่สองจะใช้เวลา 4.6 ชั่วโมงร่วมกัน การแก้ปัญหากราฟิกมีข้อผิดพลาดเล็กน้อยและใช้เวลา 4.5 ชั่วโมง

และยังมีการสร้างแบบจำลองสองงาน 2xn และ mx2 ในปัญหา 2xn มีการพิจารณาวัฒนธรรมการเกษตรและกลยุทธ์แสดงให้เห็นว่าเป็นการดีกว่าที่จะปลูกพืช 50 คูณ 50 และราคาของเกมคือ 3.75 ล้านรูเบิล และในปัญหา mx2 มีการพิจารณาคู่หนึ่งซึ่งเป็นกลยุทธ์ที่แสดงให้เห็นว่าการไปสวนสาธารณะและโรงภาพยนตร์นั้นถูกกว่าและราคาและค่าใช้จ่ายจะอยู่ที่ 4.3 รูเบิล

งานถูกสร้างแบบจำลองสำหรับวิธีเมทริกซ์ซึ่งพิจารณาร้านอาหารสองแห่ง การแก้ปัญหาแสดงให้เห็นว่าเมื่อใช้กลยุทธ์แบบผสมผสานที่เหมาะสมที่สุด กำไรของร้านอาหารแห่งแรกจะเท่ากับ 15.6 ล้านรูเบิล และเมื่อใช้กลยุทธ์แบบผสมผสานที่เหมาะสมโดย ร้านอาหารแห่งที่สองจะไม่อนุญาตให้ร้านแรกมีรายได้มากกว่า 15.6 ล้านรูเบิล การแก้ปัญหาด้วยวิธีกราฟิกทำให้เกิดข้อผิดพลาดและราคาของเกมอยู่ที่ 14.9 ล้านรูเบิล

สำหรับวิธีการของบราวน์ มีการร่างงานที่สหภาพแรงงานและผู้บริหารบริษัทพิจารณา หน้าที่ของพวกเขาคือจัดหาอาหารให้คนงาน เมื่อผู้เล่นทั้งสองใช้กลยุทธ์ที่ดีที่สุด อาหารต่อคนจะอยู่ที่ 2.45 พันรูเบิล

รายการแหล่งที่มาที่ใช้

1) วิลิซอฟ วียา เอกสารประกอบการบรรยาย "ทฤษฎีเกมและการแก้ปัญหาทางสถิติ", - สาขา - "Voskhod" MAI 2522. 146 น.

2) Krushevsky A.V. ทฤษฎีเกม - Kyiv: Vishcha school, 1977 - 216 p.

3) Cherchmen U., Akof R., Arnof L., Introduction to Operations Research. - ม.: วิทยาศาสตร์. 2510. - 488 น.

4) http://www.math-pr.com/exampl_gt2.htm

5) http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D1% 82%D0%B0%D0 %B3%D0%BE%D0%BD%D0%B8%D1%81 %D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B8%D0%B3%D1%80%D0%B0

โฮสต์บน Allbest.ru

เอกสารที่คล้ายกัน

    การตัดสินใจเป็นกิจกรรมพิเศษของมนุษย์ การแสดงเหตุผลของเมทริกซ์เกม ตัวอย่างเกมเมทริกซ์ในกลยุทธ์ล้วนและผสม การวิจัยเชิงปฏิบัติการ: ความสัมพันธ์ของปัญหาโปรแกรมเชิงเส้นกับแบบจำลองทฤษฎีเกม

    ภาคนิพนธ์ เพิ่ม 05/05/2010

    เกมซ้ำหลายครั้งคุณสมบัติและขั้นตอนที่โดดเด่นของพวกเขา กลยุทธ์ เงื่อนไข และโอกาสแบบผสมสำหรับนำไปใช้ในทางปฏิบัติ วิธีการวิเคราะห์เพื่อแก้ปัญหาเกม 2 x 2 ทฤษฎีบทพื้นฐานสำหรับเกมสี่เหลี่ยม วิธีแก้ปัญหาเกี่ยวกับพีชคณิต

    การนำเสนอเพิ่ม 10/23/2013

    คำจำกัดความพื้นฐานของทฤษฎีเกม bimatrix ตัวอย่างเกม bimatrix "Student-Teacher" กลยุทธ์ผสมในเกม bimatrix ค้นหา "สภาวะสมดุล" เกม bimatrix 2x2 และสูตรสำหรับกรณีที่ผู้เล่นแต่ละคนมีสองกลยุทธ์

    บทคัดย่อ เพิ่ม 02/13/2011

    การศึกษาข้อมูลทั่วไปเกี่ยวกับเมทริกซ์และเกมปฏิปักษ์ ที่เก็บเกมตำแหน่งต้นไม้ชุดข้อมูล . การพิจารณาหลักสูงสุดและหลักดุลยภาพ พาเรโตเหมาะสมที่สุด เกมตำแหน่งที่ไม่ใช่คู่ต่อสู้คุณสมบัติของมัน

    ภาคนิพนธ์ เพิ่ม 10/17/2557

    ทฤษฎีเกมเป็นสาขาหนึ่งของคณิตศาสตร์ ซึ่งเป็นเรื่องของการศึกษาแบบจำลองทางคณิตศาสตร์สำหรับการตัดสินใจที่เหมาะสมที่สุดในความขัดแย้ง วิธีการทำซ้ำของ Brown-Robinson อัลกอริทึมการวนซ้ำแบบโมโนโทนสำหรับการแก้เกมเมทริกซ์

    วิทยานิพนธ์, เพิ่ม 08/08/2550

    การรวบรวมเมทริกซ์ผลตอบแทน ค้นหาราคาสุทธิที่ต่ำกว่าและสูงกว่าของเกม กลยุทธ์สูงสุดและต่ำสุดของผู้เล่น ลดความซับซ้อนของเมทริกซ์การชำระเงิน การแก้ปัญหาเกมเมทริกซ์โดยใช้การลดปัญหาการเขียนโปรแกรมเชิงเส้นและส่วนเสริม "ค้นหาวิธีแก้ปัญหา"

    ทดสอบเพิ่ม 11/10/2014

    ทฤษฎีเกมเป็นทฤษฎีทางคณิตศาสตร์เกี่ยวกับสถานการณ์ความขัดแย้ง การพัฒนาแบบจำลองทางคณิตศาสตร์ของเกมผลรวมศูนย์ 2 คน การใช้งานในรูปแบบของรหัสโปรแกรม วิธีการแก้ปัญหา. ข้อมูลอินพุตและเอาต์พุต โปรแกรม, คู่มือการใช้งาน.

    ภาคนิพนธ์ เพิ่ม 08/17/2013

    ข้อมูลพื้นฐานเกี่ยวกับวิธีซิมเพล็กซ์ การประเมินบทบาทและความสำคัญในโปรแกรมเชิงเส้น การตีความทางเรขาคณิตและความหมายเชิงพีชคณิต การหาค่าสูงสุดและต่ำสุดของฟังก์ชันเชิงเส้น กรณีพิเศษ การแก้ปัญหาด้วยวิธีเมทริกซ์ซิมเพล็กซ์

    วิทยานิพนธ์, เพิ่ม 06/01/2015

    เทคนิคการสร้างแบบจำลองทางคณิตศาสตร์ของระบบคอมพิวเตอร์ที่สะท้อนถึงโครงสร้างและกระบวนการทำงาน จำนวนการเข้าถึงไฟล์ระหว่างงานเฉลี่ย การกำหนดความเป็นไปได้ของการวางไฟล์ในไดรฟ์หน่วยความจำภายนอก

    งานห้องปฏิบัติการเพิ่ม 06/21/2013

    การออกแบบแบบจำลองทางคณิตศาสตร์ คำอธิบายของเกมโอเอกซ์ โมเดลเกมลอจิกขึ้นอยู่กับพีชคณิตบูลีน อุปกรณ์อิเล็กทรอนิกส์ดิจิทัลและการพัฒนาแบบจำลองทางคณิตศาสตร์ เกมคอนโซล ตัวควบคุมเกม สตริงเกมกระดาน

ทฤษฎีเกมเป็นทฤษฎีของแบบจำลองทางคณิตศาสตร์ของการตัดสินใจภายใต้เงื่อนไขของความขัดแย้งหรือความไม่แน่นอน สันนิษฐานว่าการกระทำของฝ่ายในเกมมีลักษณะเฉพาะด้วยกลยุทธ์บางอย่าง - ชุดของกฎการกระทำ หากการได้รับจากฝ่ายหนึ่งนำไปสู่การสูญเสียของอีกฝ่ายอย่างหลีกเลี่ยงไม่ได้ พวกเขาก็พูดถึงเกมที่เป็นปรปักษ์กัน หากชุดของกลยุทธ์มีจำกัด เกมจะเรียกว่าเกมเมทริกซ์ และวิธีแก้ปัญหานั้นง่ายมาก วิธีแก้ปัญหาที่ได้รับด้วยความช่วยเหลือของทฤษฎีเกมมีประโยชน์ในการวางแผนเมื่อเผชิญกับการต่อต้านที่อาจเกิดขึ้นจากคู่แข่งหรือความไม่แน่นอนในสภาพแวดล้อมภายนอก


หากเกม bimatrix เป็นปฏิปักษ์กัน เมทริกซ์ผลตอบแทนของผู้เล่น 2 จะถูกกำหนดโดยเมทริกซ์ผลตอบแทนของผู้เล่น 1 โดยสมบูรณ์ (องค์ประกอบที่สอดคล้องกันของเมทริกซ์ทั้งสองนี้ต่างกันที่สัญญาณเท่านั้น) ดังนั้น เกมที่เป็นปรปักษ์กันแบบ bimatrix จึงอธิบายได้อย่างสมบูรณ์โดยเมทริกซ์เดียว (เมทริกซ์ผลตอบแทนของผู้เล่น 1) และด้วยเหตุนี้จึงเรียกว่าเกมเมทริกซ์

เกมนี้เป็นปฏิปักษ์ ในนั้น j \u003d x2 - O, P และ R (O, O] \u003d H (P, P) \u003d -I และ R (O, P) \u003d R (P, O) \u003d 1 หรือ ในรูปเมทริกซ์ op

ให้เกมบางประเภท Г เป็น "ปิดกระจก" เช่น แต่ละเกมประกอบด้วยเกมไอโซมอร์ฟิกแบบมิเรอร์ (เนื่องจากเกมทั้งหมดที่เป็นไอโซมอร์ฟิกแบบมิเรอร์สำหรับเกมที่กำหนดนั้นเป็นไอโซมอร์ฟิกซึ่งกันและกัน ตามที่เพิ่งพูดไป เราสามารถพูดถึงเกมไอโซมอร์ฟิกแบบมิเรอร์หนึ่งเกมได้) คลาสดังกล่าวคือคลาสของเกมที่เป็นปฏิปักษ์ทั้งหมดหรือคลาสของเกมเมทริกซ์ทั้งหมด

เมื่อนึกถึงคำจำกัดความของสถานการณ์ที่ยอมรับได้ในเกมที่เป็นปฏิปักษ์ เราพบว่าสถานการณ์ (X, Y) ในส่วนต่อขยายแบบผสมของเกมเมทริกซ์นั้นยอมรับได้สำหรับผู้เล่น 1 ก็ต่อเมื่อสำหรับ x G x ความไม่เท่าเทียมกัน

กระบวนการแปลงเกมเป็นเกมสมมาตรเรียกว่าสมมาตร เราอธิบายวิธีการสมมาตรวิธีหนึ่งไว้ที่นี่ อีกรูปแบบหนึ่งของความสมมาตรที่แตกต่างกันโดยพื้นฐานจะได้รับในส่วนที่ 26.7 ความสมมาตรทั้งสองรูปแบบนี้ใช้ได้กับเกมที่เป็นปรปักษ์ตามอำเภอใจ แต่จะถูกกำหนดและพิสูจน์เฉพาะสำหรับเกมเมทริกซ์เท่านั้น

ดังนั้น คำศัพท์เริ่มต้นและการกำหนดทฤษฎีของเกมที่เป็นปรปักษ์กันทั่วไปจึงตรงกับข้อกำหนดและการกำหนดที่สอดคล้องกันของทฤษฎีเกมเมทริกซ์

สำหรับเกมที่เป็นปรปักษ์กันจำกัด (เมทริกซ์) การมีอยู่ของ extrema เหล่านี้ได้รับการพิสูจน์โดยเราในบทที่ 10 1 และประเด็นทั้งหมดคือการสร้างความเท่าเทียมกัน หรืออย่างน้อยก็เพื่อหาวิธีที่จะเอาชนะความไม่เท่าเทียมของพวกเขา

การพิจารณาเกมเมทริกซ์แสดงให้เห็นแล้วว่ามีเกมที่เป็นปรปักษ์กันโดยไม่มีสถานการณ์สมดุล (และแม้ว่าจะไม่มีสถานการณ์สมดุลทางอิเล็กทรอนิกส์สำหรับ e > 0 ที่มีขนาดเล็กเพียงพอ) ในกลยุทธ์ที่ผู้เล่นกำหนดในตอนแรก

แต่เกมที่จำกัด (เมทริกซ์) แต่ละเกมสามารถขยายไปสู่เกมที่ไม่มีที่สิ้นสุดได้ ตัวอย่างเช่น โดยการจัดหากลยุทธ์ที่โดดเด่นให้กับผู้เล่นแต่ละคนจำนวนเท่าใดก็ได้ (ดู 22 Ch. 1) เห็นได้ชัดว่า การขยายตัวของชุดกลยุทธ์ของผู้เล่นดังกล่าวไม่ได้หมายถึงการขยายความเป็นไปได้ของเขา และพฤติกรรมที่แท้จริงของเขาในเกมที่ขยายก็ไม่ควรแตกต่างจากพฤติกรรมของเขาในเกมต้นฉบับ ดังนั้นเราจึงได้รับตัวอย่างจำนวนมากเพียงพอของเกมที่เป็นปฏิปักษ์อย่างไม่มีที่สิ้นสุดซึ่งไม่มีจุดอานม้า ตัวอย่างแบบนี้ก็มีด้วย

ดังนั้น เพื่อที่จะนำหลักการสูงสุดไปใช้ในเกมที่เป็นปฏิปักษ์อย่างไม่มีที่สิ้นสุด มีความจำเป็น เช่นเดียวกับในกรณีของเกมที่มีขอบเขตจำกัด (เมทริกซ์) การขยายความสามารถเชิงกลยุทธ์ของผู้เล่น สำหรับ 96

เช่นเดียวกับในกรณีของเกมเมทริกซ์ (ดูบทที่ 1, 17) สำหรับเกมที่เป็นปรปักษ์กันทั่วไป แนวคิดของสเปกตรัมกลยุทธ์แบบผสมมีบทบาทสำคัญ ซึ่งในที่นี้จะต้องให้คำจำกัดความที่กว้างกว่านี้

สุดท้าย โปรดทราบว่าชุดของกลยุทธ์แบบผสมทั้งหมดของผู้เล่น 1 ในเกมที่เป็นปฏิปักษ์โดยพลการนั้นเหมือนกับในเมทริกซ์

แม้แต่การพิจารณาเกมที่เป็นปรปักษ์กันก็แสดงให้เห็นว่าเกมดังกล่าวจำนวนมาก รวมถึงเกมที่มีขอบเขตจำกัด เกมเมทริกซ์มีสถานการณ์สมดุลที่ไม่ได้อยู่ในกลยุทธ์เดิมแท้ แต่อยู่ในกลยุทธ์ผสมทั่วไปเท่านั้น ดังนั้นสำหรับเกมทั่วไปที่ไม่เป็นปฏิปักษ์และไม่ให้ความร่วมมือ เป็นเรื่องปกติที่จะมองหาสถานการณ์สมดุลอย่างแม่นยำในกลยุทธ์แบบผสม

ตัวอย่างเช่น (ดูรูปที่ 3.1) เราสังเกตแล้วว่า "ผู้รับจ้าง" แทบไม่ต้องรับมือกับความไม่แน่นอนทางพฤติกรรมเลย แต่ถ้าเราใช้ระดับแนวคิดของประเภท "ผู้ดูแลระบบ" ทุกอย่างจะตรงกันข้าม ตามกฎแล้ว ความไม่แน่นอนประเภทหลักที่ "ผู้ตัดสินใจของเรา" ต้องเผชิญคือ "ความขัดแย้ง" ตอนนี้เราสามารถชี้แจงได้ว่านี่เป็นการแข่งขันที่ไม่เข้มงวด ค่อนข้างน้อย "ผู้ดูแลระบบ" ตัดสินใจในเงื่อนไขของ "ความไม่แน่นอนตามธรรมชาติ" และยิ่งไม่ค่อยพบความขัดแย้งที่เข้มงวดและเป็นปฏิปักษ์ นอกจากนี้การปะทะกันของผลประโยชน์เมื่อทำการตัดสินใจโดย "ผู้ดูแลระบบ" เกิดขึ้นเพื่อที่จะพูด "ครั้งเดียว" เช่น ในการจัดประเภทของเราเขามักจะเล่นเกมของเกมเพียงเกมเดียว (บางครั้งก็มีจำนวนน้อยมาก) มาตราส่วนสำหรับการประเมินผลที่ตามมามักเป็นเชิงคุณภาพมากกว่าเชิงปริมาณ ความเป็นอิสระเชิงกลยุทธ์ของ "ผู้ดูแลระบบ" ค่อนข้างจำกัด เมื่อคำนึงถึงสิ่งที่กล่าวมาข้างต้น อาจเป็นที่ถกเถียงกันอยู่ว่าสถานการณ์ปัญหาในระดับนี้ส่วนใหญ่มักต้องได้รับการวิเคราะห์โดยใช้เกมสองเมทริกซ์ที่ไม่ร่วมมือและไม่เป็นปรปักษ์กัน ยิ่งกว่านั้นในกลยุทธ์ที่บริสุทธิ์

หลักการแก้เกมเมทริกซ์ปฏิปักษ์

ด้วยเหตุนี้ จึงมีเหตุผลที่จะคาดหวังว่าในเกมที่อธิบายไว้ข้างต้น ฝ่ายตรงข้ามจะปฏิบัติตามกลยุทธ์ที่เลือกไว้ เกมที่เป็นปฏิปักษ์กับเมทริกซ์ซึ่ง max min fiv = min max Aiy>

อย่างไรก็ตาม ไม่ใช่ว่าเกมที่เป็นปรปักษ์กันทุกเกมจะค่อนข้างชัดเจน และในกรณีทั่วไป

ดังนั้น ในกรณีทั่วไป เพื่อแก้ปัญหาเกมที่เป็นปฏิปักษ์กับเมทริกซ์ของมิติ /uxl จำเป็นต้องแก้ปัญหาการเขียนโปรแกรมเชิงเส้นคู่ ทำให้เกิดชุดของกลยุทธ์ที่เหมาะสม / และต้นทุนของเกม v

เกมเมทริกซ์ที่เป็นปรปักษ์กันของคนสองคนถูกกำหนดอย่างไร?

อะไรคือวิธีการลดความซับซ้อนและแก้ปัญหาเกมที่เป็นปฏิปักษ์กับเมทริกซ์

ในกรณีของเกมที่มีผู้เล่นสองคน เป็นเรื่องธรรมดาที่จะถือว่าความสนใจของพวกเขาตรงข้ามกัน - เกมนั้นเป็นปฏิปักษ์ ดังนั้น ผลตอบแทนของผู้เล่นคนหนึ่งจะเท่ากับการสูญเสียของอีกคนหนึ่ง (ผลรวมของผลตอบแทนของผู้เล่นทั้งสองเป็นศูนย์ ดังนั้นชื่อเกมผลรวมศูนย์) เราจะพิจารณาเกมที่ผู้เล่นแต่ละคนมีจำนวนทางเลือกที่จำกัด ฟังก์ชันผลตอบแทนสำหรับเกมสองคนที่มีผลรวมเป็นศูนย์สามารถกำหนดได้ในรูปแบบเมทริกซ์ (ในรูปแบบของเมทริกซ์ผลตอบแทน)

ตามที่ระบุไว้แล้ว เกมที่เป็นปฏิปักษ์ขั้นสุดท้ายเรียกว่าเมทริกซ์

MATRIX GAMES - คลาสของเกมที่เป็นปรปักษ์กันซึ่งมีผู้เล่นสองคนเข้าร่วม และผู้เล่นแต่ละคนมีจำนวนกลยุทธ์ที่จำกัด ถ้าผู้เล่นคนหนึ่งมีกลยุทธ์ m และผู้เล่นอีกคนหนึ่งมี n กลยุทธ์ เราก็สามารถสร้างเมทริกซ์เกมขนาด txn ได้ มิ อาจมีหรือไม่มีจุดอานก็ได้ ในกรณีหลัง

พิจารณาเกมคู่ผลรวมศูนย์ที่แน่นอน แสดงโดย ผลตอบแทนของผู้เล่น และผ่าน - ผู้เล่นชนะ . เพราะ = –จากนั้นเมื่อวิเคราะห์เกมดังกล่าว ไม่จำเป็นต้องพิจารณาตัวเลขทั้งสองนี้ - การพิจารณาผลตอบแทนของผู้เล่นคนใดคนหนึ่งก็เพียงพอแล้ว ยกตัวอย่างเช่น . ต่อไปนี้เพื่อความสะดวกในการนำเสนอด้าน เราจะตั้งชื่อแบบมีเงื่อนไขว่า " เรา"และด้านข้าง – "ศัตรู".

ให้เราได้ กลยุทธ์ที่เป็นไปได้ 1 , 2 , …, เป็นและศัตรู กลยุทธ์ที่เป็นไปได้ 1 , 2 , …, บี เอ็น(เกมดังกล่าวเรียกว่าเกม ม×น). สมมติว่าแต่ละฝ่ายได้เลือกกลยุทธ์บางอย่าง: เราเลือกแล้ว ฉัน, ศัตรู บีเจ. หากเกมประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น การเลือกกลยุทธ์ ฉันและ บีเจกำหนดผลลัพธ์ของเกมโดยเฉพาะ - ผลตอบแทนของเรา (บวกหรือลบ) สมมติว่ากำไรนี้เป็น ไอจ(ชนะเมื่อเราเลือกกลยุทธ์ ฉันและศัตรู - กลยุทธ์ บีเจ).

หากเกมมีนอกเหนือจากการเคลื่อนไหวแบบสุ่มส่วนบุคคล ผลตอบแทนสำหรับคู่ของกลยุทธ์ ฉัน, บีเจเป็นตัวแปรสุ่มที่ขึ้นอยู่กับผลลัพธ์ของการเคลื่อนไหวแบบสุ่มทั้งหมด ในกรณีนี้ ค่าประมาณตามธรรมชาติของผลตอบแทนที่คาดหวังคือ ความคาดหวังทางคณิตศาสตร์ของการชนะแบบสุ่ม. เพื่อความสะดวกเราจะแสดงโดย ไอจทั้งผลตอบแทน (ในเกมที่ไม่มีการเคลื่อนไหวแบบสุ่ม) และความคาดหวังทางคณิตศาสตร์ (ในเกมที่มีการเคลื่อนไหวแบบสุ่ม)

สมมติว่าเรารู้ค่า ไอจสำหรับกลยุทธ์แต่ละคู่ ค่าเหล่านี้สามารถเขียนเป็นเมทริกซ์ที่มีแถวสอดคล้องกับกลยุทธ์ของเรา ( ฉัน) และคอลัมน์แสดงกลยุทธ์ของคู่ต่อสู้ ( บีเจ):

บี เจ เอ 1 2 บี เอ็น
1 11 12 1
2 21 22 2
เป็น เป็น 1 เป็น 2 สาธุ

เมทริกซ์ดังกล่าวเรียกว่า เมทริกซ์ผลตอบแทนของเกมหรือเพียงแค่ เมทริกซ์เกม.

โปรดทราบว่าการสร้างเมทริกซ์ผลตอบแทนสำหรับเกมที่มีกลยุทธ์จำนวนมากอาจเป็นงานที่ยาก ตัวอย่างเช่น สำหรับเกมหมากรุก จำนวนกลยุทธ์ที่เป็นไปได้มีมากจนการสร้างเมทริกซ์ผลตอบแทนเป็นไปไม่ได้ในทางปฏิบัติ อย่างไรก็ตาม โดยหลักการแล้ว เกมจำกัดใดๆ สามารถย่อขนาดลงเป็นรูปแบบเมทริกซ์ได้

พิจารณา ตัวอย่างที่ 1เกมที่เป็นปฏิปักษ์ 4 × 5 เรามีสี่กลยุทธ์ในการจัดการศัตรูมีห้ากลยุทธ์ เมทริกซ์ของเกมมีดังนี้:

บี เจ เอ 1 2 3 4 5
1
2
3
4

เราควรใช้กลยุทธ์ใด (เช่น ผู้เล่น ) ใช้? ไม่ว่าเราจะเลือกกลยุทธ์ใด ศัตรูที่มีเหตุผลจะตอบโต้ด้วยกลยุทธ์ที่ผลตอบแทนของเราจะน้อยที่สุด ตัวอย่างเช่น หากเราเลือกกลยุทธ์ 3 (ชนะ 10) ฝ่ายตรงข้ามจะเลือกกลยุทธ์ในการตอบสนอง 1 และผลตอบแทนของเราจะเป็นเพียง 1 เห็นได้ชัดว่า ตามหลักความระมัดระวัง (และเป็นหลักสำคัญของทฤษฎีเกม) เราต้องเลือกกลยุทธ์ที่ กำไรขั้นต่ำของเราคือสูงสุด.

แสดงโดย ฉันมูลค่าผลตอบแทนขั้นต่ำสำหรับกลยุทธ์ ฉัน:

และเพิ่มคอลัมน์ที่มีค่าเหล่านี้ในเมทริกซ์เกม:

บี เจ เอ 1 2 3 4 5 ขั้นต่ำในแถว ฉัน
1
2
3
4 สูงสุด

เมื่อเลือกกลยุทธ์ เราต้องเลือกกลยุทธ์ที่มีค่า ฉันขีดสุด. แสดงค่าสูงสุดนี้ด้วย α :

ค่า α เรียกว่า ราคาเกมที่ต่ำกว่าหรือ สูงสุด(ชนะขั้นต่ำสูงสุด). กลยุทธ์ของผู้เล่น ตรงกับค่าสูงสุด α , ถูกเรียก กลยุทธ์สูงสุด.

ในตัวอย่างนี้ ค่าสูงสุด α เท่ากับ 3 (เซลล์ที่เกี่ยวข้องในตารางถูกเน้นด้วยสีเทา) และกลยุทธ์สูงสุดคือ 4 . เมื่อเลือกกลยุทธ์นี้แล้วเรามั่นใจได้ว่าสำหรับพฤติกรรมใด ๆ ของศัตรูเราจะชนะไม่น้อยกว่า 3 (และอาจมากกว่านั้นด้วยพฤติกรรมที่ "ไร้เหตุผล" ของศัตรู) ค่านี้เป็นค่าขั้นต่ำที่รับประกันซึ่งเราสามารถรับประกันได้ โดยยึดมั่นในกลยุทธ์ ("ประกันภัยต่อ") ที่ระมัดระวังที่สุด

ตอนนี้เราจะใช้เหตุผลที่คล้ายกันกับศัตรู 2 - เราจะตอบเขา .

แสดงโดย เบต้าเจ ) สำหรับกลยุทธ์ ฉัน:



เบต้าเจ β :

7. เกมที่มีมูลค่าสูงสุดคืออะไร ตอนนี้เราจะใช้เหตุผลที่คล้ายกันกับฝ่ายตรงข้าม . เขาสนใจที่จะลดผลประโยชน์ของเรา นั่นคือ ให้เราน้อยลง แต่เขาต้องพึ่งพาพฤติกรรมของเรา ซึ่งเป็นสิ่งที่แย่ที่สุดสำหรับเขา ตัวอย่างเช่น หากเขาเลือกกลยุทธ์ 1 แล้วเราจะตอบเขาด้วยกุศโลบาย 3 , และเขาจะให้เรา 10. ถ้าเขาเลือก 2 - เราจะตอบเขา 2 และเขาจะให้ 8 และอื่น ๆ เห็นได้ชัดว่าคู่ต่อสู้ที่ระมัดระวังจะต้องเลือกกลยุทธ์ที่ กำไรสูงสุดของเราจะน้อยที่สุด.

แสดงโดย เบต้าเจค่าสูงสุดในคอลัมน์ของเมทริกซ์ผลตอบแทน (ผลตอบแทนสูงสุดของผู้เล่น หรือ ซึ่งก็เหมือนกัน การสูญเสียสูงสุดของผู้เล่น ) สำหรับกลยุทธ์ ฉัน:

และเพิ่มแถวที่มีค่าเหล่านี้ในเมทริกซ์เกม:

การเลือกกลยุทธ์ศัตรูจะชอบกลยุทธ์ที่มีค่า เบต้าเจขั้นต่ำ มาแสดงโดย β :

ค่า β เรียกว่า ราคาเกมชั้นนำหรือ มินิแม็กซ์(ชนะสูงสุดขั้นต่ำ). กลยุทธ์ของฝ่ายตรงข้าม (ของผู้เล่น) ที่สอดคล้องกับค่าต่ำสุด ), ถูกเรียก กลยุทธ์ขั้นต่ำ.

ขั้นต่ำคือมูลค่าของการได้รับ มากกว่าที่คู่ต่อสู้ที่สมเหตุสมผลจะไม่ให้เราอย่างแน่นอน (กล่าวคือ คู่ต่อสู้ที่สมเหตุสมผลจะเสียไม่เกิน β ). ในตัวอย่างนี้ minimax β เท่ากับ 5 (เซลล์ที่เกี่ยวข้องในตารางถูกเน้นด้วยสีเทา) และทำได้ด้วยกลยุทธ์ของฝ่ายตรงข้าม 3 .

ดังนั้น ตามหลักการของการระมัดระวัง ("มักจะคาดหวังสิ่งที่เลวร้ายที่สุด!") เราจะต้องเลือกกลยุทธ์ 4 และศัตรู - กลยุทธ์ 3 . หลักความระมัดระวังเป็นพื้นฐานในทฤษฎีเกมและเรียกว่า หลักการขั้นต่ำ.

พิจารณา ตัวอย่างที่ 2. ให้ผู้เล่น และ ที่หนึ่งในสามของตัวเลขเขียนพร้อมกันและเป็นอิสระจากกัน: ทั้ง "1" หรือ "2" หรือ "3" หากผลรวมของตัวเลขที่เขียนเป็นเลขคู่ แสดงว่าผู้เล่น จ่ายผู้เล่น จำนวนนี้ หากจำนวนเงินเป็นเลขคี่ ผู้เล่นจะจ่ายเงินจำนวนนี้ ผู้เล่น ที่.

ลองเขียนเมทริกซ์ผลตอบแทนของเกมและค้นหาราคาที่ต่ำกว่าและสูงกว่าของเกม (หมายเลขกลยุทธ์ตรงกับหมายเลขที่เขียน):

ผู้เล่น ต้องยึดกลยุทธ์สูงสุด 1 ชนะอย่างน้อย -3 (นั่นคือ แพ้มากสุด 3) กลยุทธ์ผู้เล่น Minimax กลยุทธ์ใดๆ 1 และ 2 ซึ่งรับรองว่าเขาจะให้ไม่เกิน 4

เราจะได้ผลลัพธ์เดียวกันหากเราเขียนเมทริกซ์ผลตอบแทนจากมุมมองของผู้เล่น ที่. ในความเป็นจริง เมทริกซ์นี้ได้มาจากการย้ายเมทริกซ์ที่สร้างขึ้นจากมุมมองของผู้เล่น และเปลี่ยนสัญญาณของธาตุเป็นตรงกันข้าม (เนื่องจากผลตอบแทนของผู้เล่น คือการสูญเสียของผู้เล่น ที่):

จากเมทริกซ์นี้เป็นไปตามที่ผู้เล่น จะต้องปฏิบัติตามกลยุทธ์ข้อใดข้อหนึ่ง 1 และ 2(แล้วเขาจะเสียไม่เกิน 4) และผู้เล่น – กลยุทธ์ 1 (แล้วเขาจะเสียไม่เกิน 3). อย่างที่คุณเห็น ผลลัพธ์จะเหมือนกับผลลัพธ์ด้านบนทุกประการ ดังนั้นการวิเคราะห์จึงไม่สำคัญจากมุมมองของผู้เล่นที่เราดำเนินการ

8 เกมที่มีค่าคืออะไร

9. หลักการของ MINIMAX ประกอบด้วยอะไรบ้าง 2. ราคาที่ต่ำกว่าและสูงกว่าของเกม หลักการมินิแม็กซ์

พิจารณาเกมเมทริกซ์ประเภทที่มีผลตอบแทนเมทริกซ์

หากผู้เล่น และจะเลือกกลยุทธ์ ฉันจากนั้นผลตอบแทนที่เป็นไปได้ทั้งหมดจะเป็นองค์ประกอบ ผมแถวที่ -th ของเมทริกซ์ กับ. แย่ที่สุดสำหรับผู้เล่น และกรณีที่ผู้เล่น ที่ใช้กลยุทธ์ที่เหมาะสมกับ ขั้นต่ำองค์ประกอบของบรรทัดนี้ ผลตอบแทนของผู้เล่น และจะเท่ากับจำนวน

ดังนั้นเพื่อให้ผู้เล่นได้รับผลตอบแทนสูงสุด และคุณต้องเลือกหนึ่งในกลยุทธ์ที่ใช้ตัวเลข ขีดสุด.

กรณีที่ง่ายที่สุดซึ่งมีรายละเอียดโดยละเอียดในทฤษฎีเกมคือเกมคู่จำกัดที่มีผลรวมเป็นศูนย์ พิจารณาเกม G ที่ผู้เล่นสองคน A และ B เข้าร่วมโดยมีความสนใจตรงข้ามกัน: การได้อย่างหนึ่งเท่ากับการเสียของอีกอันหนึ่ง เนื่องจากผลตอบแทนของผู้เล่น A เท่ากับผลตอบแทนของผู้เล่น B ที่มีเครื่องหมายตรงกันข้าม เราจึงสนใจแต่ผลตอบแทนของผู้เล่น A เท่านั้น โดยธรรมชาติ A ต้องการเพิ่มและ B ต้องการลดขนาด A

เพื่อความง่าย เรามาระบุตัวตนของเรากับผู้เล่นคนใดคนหนึ่ง (ขอเป็น A) และเรียกเขาว่า "เรา" และผู้เล่น B - "คู่ต่อสู้" (แน่นอนว่าไม่มีข้อดีที่แท้จริงสำหรับ A ต่อจากนี้) ให้เรามีกลยุทธ์ที่เป็นไปได้และคู่ต่อสู้ - กลยุทธ์ที่เป็นไปได้ (เกมดังกล่าวเรียกว่าเกม) ให้เราแสดงผลตอบแทนของเราหากเราใช้กลยุทธ์และฝ่ายตรงข้ามใช้กลยุทธ์

ตารางที่ 26.1

สมมติว่าสำหรับแต่ละคู่ของกลยุทธ์ เรารู้จักผลตอบแทน (หรือผลตอบแทนเฉลี่ย) a ตามหลักการแล้ว คุณสามารถรวบรวมตารางสี่เหลี่ยม (เมทริกซ์) ซึ่งแสดงรายการกลยุทธ์ของผู้เล่นและผลตอบแทนที่สอดคล้องกัน (ดูตาราง 26.1)

หากมีการรวบรวมตารางดังกล่าว เกม G จะถูกลดขนาดลงเป็นรูปแบบเมทริกซ์ (ด้วยตัวของมันเอง การนำเกมไปสู่รูปแบบดังกล่าวอาจเป็นงานที่ยากอยู่แล้ว และบางครั้งก็แทบจะเป็นไปไม่ได้ เนื่องจากกลยุทธ์จำนวนมาก ). โปรดทราบว่าหากเกมถูกลดขนาดลงเป็นรูปแบบเมทริกซ์ เกมมัลติมูฟจะถูกลดขนาดลงเป็นเกมที่มีการเคลื่อนไหวเพียงครั้งเดียว ผู้เล่นจำเป็นต้องทำการเคลื่อนไหวเพียงครั้งเดียว: เลือกกลยุทธ์ เราจะแสดงเมทริกซ์ของเกมโดยสังเขป

พิจารณาตัวอย่างเกม G (4X5) ในรูปแบบเมทริกซ์ ในการกำจัดของเรา (ให้เลือก) สี่กลยุทธ์ ศัตรูมีห้ากลยุทธ์ เมทริกซ์ของเกมระบุไว้ในตาราง 26.2

ลองคิดดูว่าเรา (ผู้เล่น A) ใช้กลยุทธ์อะไร? Matrix 26.2 มีผลตอบแทนที่น่าดึงดูด "10"; เราถูกดึงดูดให้เลือกกลยุทธ์ที่เราจะได้รับ "เกร็ดเล็กเกร็ดน้อย" นี้

แต่เดี๋ยวก่อน ศัตรูไม่ได้โง่ด้วย! หากเราเลือกกลยุทธ์ เขาจะเลือกกลยุทธ์ และเราจะได้รับผลตอบแทนที่น่าสังเวช "1" ไม่ คุณไม่สามารถเลือกกลยุทธ์ได้! จะเป็นอย่างไร? เห็นได้ชัดว่า ดำเนินการตามหลักการแห่งความระมัดระวัง (และเป็นหลักการสำคัญของทฤษฎีเกม) เราต้องเลือกกลยุทธ์ที่กำไรขั้นต่ำของเราคือสูงสุด

ตารางที่ 26.2

นี่คือสิ่งที่เรียกว่า "หลักการมินิแม็กซ์": ดำเนินการในลักษณะที่คุณจะได้รับผลประโยชน์สูงสุดด้วยพฤติกรรมที่เลวร้ายที่สุดของฝ่ายตรงข้าม

ลองเขียนตาราง 26.2 ใหม่ และในคอลัมน์เพิ่มเติมด้านขวา เราจะเขียนค่าต่ำสุดของกำไรในแต่ละบรรทัด (ขั้นต่ำของบรรทัด) มาแทนกันสำหรับแถว a (ดูตาราง 26.3)

ตารางที่ 26.3

จากค่าทั้งหมด (คอลัมน์ขวา) เลือกค่าที่ใหญ่ที่สุด (3) มันตรงกับกลยุทธ์ เมื่อเลือกกลยุทธ์นี้แล้ว เราสามารถมั่นใจได้ว่า (สำหรับพฤติกรรมใดๆ ของศัตรู) เราจะได้ไม่น้อยกว่า 3 ค่านี้เป็นกำไรที่รับประกันของเรา ประพฤติพรหมจรรย์ย่อมได้น้อยได้มากกว่านี้)

ผลตอบแทนนี้เรียกว่าราคาที่ต่ำกว่าของเกม (หรือ "สูงสุด" - สูงสุดของผลตอบแทนขั้นต่ำ) เราจะแสดงว่ามันเป็น ในกรณีของเรา

ตอนนี้ให้เราใช้มุมมองของศัตรูและโต้เถียงแทนเขา เขาไม่ใช่คนจำนำ แต่ก็มีเหตุผลด้วย! การเลือกกลยุทธ์เขาอยากจะให้น้อยลงแต่เขาต้องคำนึงถึงพฤติกรรมของเราซึ่งแย่ที่สุดสำหรับเขา ถ้าเขาเลือกกลยุทธ์ เราจะตอบเขา และเขาจะให้ 10; ถ้าเขาเลือก เราจะตอบเขาและเขาจะคืนให้ ฯลฯ เราเพิ่มแถวล่างเพิ่มเติมในตาราง 26.3 และเขียนจำนวนสูงสุดของคอลัมน์ในนั้น แน่นอน ศัตรูที่ระมัดระวังจะต้องเลือกกลยุทธ์ที่มีค่านี้ น้อยที่สุด (ค่าที่สอดคล้องกัน 5 ถูกเน้นในตาราง 26.3) . ค่า P นี้คือมูลค่าของการได้รับซึ่งมากกว่าที่คู่ต่อสู้ที่สมเหตุสมผลจะไม่ให้เราอย่างแน่นอน เรียกว่าราคาสูงสุดของเกม (หรือ "mi-nimax" - ขั้นต่ำของการชนะสูงสุด) ในตัวอย่างของเรา และสำเร็จได้ด้วยกลยุทธ์ของฝ่ายตรงข้าม

ดังนั้น ตามหลักการแห่งความระมัดระวัง (กฎการประกันภัยต่อ “มักจะพึ่งพาสิ่งที่เลวร้ายที่สุดเสมอ!”) เราจะต้องเลือกกลยุทธ์ A และศัตรู - กลยุทธ์ กลยุทธ์ดังกล่าวเรียกว่า “minimax” (ต่อจากหลักการ minimax) ตราบใดที่ทั้งสองฝ่ายในตัวอย่างของเรายังคงยึดมั่นในกลยุทธ์ขั้นต่ำของพวกเขา ผลตอบแทนก็จะเป็นเช่นนั้น

ลองนึกภาพสักครู่ว่าเราได้เรียนรู้ว่าศัตรูกำลังติดตามกลยุทธ์ เอาเลย เราลงโทษเขาสำหรับสิ่งนี้และเลือกกลยุทธ์ เราได้ 5 และนี่ก็ไม่เลวร้ายนัก แต่หลังจากนั้น ศัตรูก็ไม่พลาดเช่นกัน ให้เขารู้ว่ากลยุทธ์ของเราคือ เขาจะรีบเลือก ลดผลตอบแทนของเราเป็น 2 เป็นต้น (คู่ค้า "รีบหากลยุทธ์") กล่าวโดยย่อ กลยุทธ์ขั้นต่ำสุดในตัวอย่างของเรานั้นไม่เสถียรเมื่อเทียบกับข้อมูลเกี่ยวกับพฤติกรรมของอีกฝ่าย กลยุทธ์เหล่านี้ไม่มีคุณสมบัติสมดุล

มันเป็นเช่นนี้เสมอหรือไม่? ไม่เสมอไป พิจารณาตัวอย่างด้วยเมทริกซ์ที่กำหนดในตาราง 26.4

ในตัวอย่างนี้ ราคาที่ต่ำกว่าของเกมจะเท่ากับราคาที่สูงขึ้น: อะไรต่อจากนี้? กลยุทธ์ขั้นต่ำของผู้เล่น A และ B จะคงที่ ตราบใดที่ผู้เล่นทั้งสองยังยึดมั่น ผลตอบแทนคือ 6 มาดูกันว่าจะเกิดอะไรขึ้นหากเรา (A) พบว่าฝ่ายตรงข้าม (B) ยึดมั่นในกลยุทธ์ B?

ตารางที่ 26.4

และจะไม่มีอะไรเปลี่ยนแปลงอย่างแน่นอน เพราะการเบี่ยงเบนจากกลยุทธ์มีแต่จะทำให้สถานการณ์ของเราแย่ลง ข้อมูลที่ฝ่ายตรงข้ามได้รับจะไม่ทำให้เขาถอยห่างจากกลยุทธ์ของเขา สัญญาณของการมีอยู่ของจุดอานม้าและคู่ของกลยุทธ์ที่สมดุลคือความเท่าเทียมกันของราคาที่ต่ำกว่าและสูงของเกม มูลค่ารวมเรียกว่าราคาของเกม เราจะติดป้ายไว้

กลยุทธ์ (ในกรณีนี้ ) ซึ่งได้รับความสำเร็จนี้เรียกว่ากลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด และการรวมกันเป็นวิธีแก้ปัญหาของเกม ในกรณีนี้ ตัวเกมได้รับการกล่าวขานว่าแก้ไขได้ด้วยกลยุทธ์ล้วนๆ ทั้งสองฝ่าย A และ B สามารถได้รับกลยุทธ์ที่เหมาะสมที่สุดโดยตำแหน่งของพวกเขาจะดีที่สุดเท่าที่จะเป็นไปได้ และผู้เล่นคนนั้น A ชนะ 6 คน และผู้เล่น B แพ้ นี่คือเงื่อนไขของเกม: พวกเขาได้ประโยชน์สำหรับ A และเสียเปรียบสำหรับ B

ผู้อ่านอาจมีคำถามว่าเหตุใดกลยุทธ์ที่ดีที่สุดจึงเรียกว่า "บริสุทธิ์" เมื่อมองไปข้างหน้า ลองตอบคำถามนี้: มีกลยุทธ์แบบ "ผสม" ซึ่งประกอบด้วยข้อเท็จจริงที่ว่าผู้เล่นไม่ได้ใช้กลยุทธ์เดียว แต่ใช้หลายกลยุทธ์สลับกันแบบสุ่ม ดังนั้น หากเรายอมรับว่านอกจากกลยุทธ์ที่บริสุทธิ์แล้ว ยังมีกลยุทธ์แบบผสม เกมที่จำกัดทุกเกมย่อมมีทางออก นั่นคือจุดสมดุล แต่เพิ่มเติมเกี่ยวกับเรื่องนี้ยังมาไม่ถึง

การมี Saddle Point ในเกมนั้นห่างไกลจากการเป็นกฎ แต่เป็นข้อยกเว้น เกมส่วนใหญ่ไม่มีจุดอาน อย่างไรก็ตาม มีหลายเกมที่มักจะมีจุดอานเสมอ และดังนั้นจึงได้รับการแก้ไขด้วยกลยุทธ์ล้วนๆ สิ่งเหล่านี้เรียกว่า "เกมที่มีข้อมูลครบถ้วน" เกมที่มีข้อมูลครบถ้วนคือเกมที่ผู้เล่นแต่ละคนรู้ประวัติศาสตร์ก่อนประวัติศาสตร์ทั้งหมดของการพัฒนาในแต่ละการเคลื่อนไหว กล่าวคือ ผลลัพธ์ของการเคลื่อนไหวก่อนหน้านี้ทั้งหมด ทั้งส่วนบุคคลและแบบสุ่ม ตัวอย่างเกมที่มีข้อมูลครบถ้วน เช่น หมากฮอส หมากรุก ทิคแทคโท ฯลฯ

ในทฤษฎีเกม ได้รับการพิสูจน์แล้วว่าทุกเกมที่มีข้อมูลครบถ้วนมีจุดอาน ดังนั้นสามารถแก้ไขได้ด้วยกลยุทธ์ล้วน ๆ ในทุก ๆ เกมที่มีข้อมูลที่สมบูรณ์แบบ มีกลยุทธ์ที่ดีที่สุดคู่หนึ่งซึ่งให้ผลตอบแทนที่แน่นอนเท่ากับราคาของเกมและ หากเกมดังกล่าวประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น เมื่อผู้เล่นแต่ละคนใช้กลยุทธ์ที่เหมาะสมที่สุดของตนเอง เกมจะต้องจบลงด้วยวิธีที่ค่อนข้างแน่นอน - โดยมีผลตอบแทนเท่ากับราคาของเกม ดังนั้นหากทราบวิธีแก้ปัญหาของเกม เกมนั้นจะสูญเสียความหมายไป!

ลองมาดูตัวอย่างเบื้องต้นของเกมที่มีข้อมูลครบถ้วน: ผู้เล่นสองคนสลับกันวางนิเกิลบนโต๊ะกลม โดยเลือกตำแหน่งตรงกลางของเหรียญโดยพลการ (ไม่อนุญาตให้มีการทับซ้อนกันของเหรียญ) ผู้ชนะคือผู้ที่วางเงินก้อนสุดท้าย (เมื่อไม่มีที่ว่างสำหรับคนอื่น) มันง่ายที่จะเห็นว่าผลลัพธ์ของเกมนี้โดยพื้นฐานแล้วเป็นบทสรุปมาก่อน มีกลยุทธ์บางอย่างที่ทำให้มั่นใจได้ว่าผู้เล่นที่วางเหรียญก่อนเป็นผู้ชนะ

กล่าวคือเขาต้องวางนิกเกิลไว้ตรงกลางโต๊ะเป็นครั้งแรกจากนั้นจึงตอบสนองต่อการเคลื่อนไหวของฝ่ายตรงข้ามด้วยการเคลื่อนไหวที่สมมาตร เห็นได้ชัดว่าไม่ว่าฝ่ายตรงข้ามจะมีพฤติกรรมอย่างไร เขาก็ไม่สามารถหลีกเลี่ยงการสูญเสียได้ สถานการณ์จะเหมือนกันทุกประการกับหมากรุกและเกมที่มีข้อมูลครบถ้วนโดยทั่วไป: หมากรุกและเกมใด ๆ ที่เขียนในรูปแบบเมทริกซ์ มีจุดอาน และด้วยเหตุนี้วิธีแก้ปัญหาจึงอยู่ในกลยุทธ์ล้วน ๆ ดังนั้นจึงสมเหตุสมผลตราบเท่าที่โซลูชันนี้ทำ ไม่พบ สมมติว่า เกมหมากรุกไม่ว่าจะจบลงด้วยการชนะของ White เสมอ หรือจบลงด้วยการชนะของ Black เสมอ หรือจบลงด้วยการเสมอกัน แต่อะไรกันแน่ - เรายังไม่รู้ (โชคดีสำหรับคนรักหมากรุก) ขอเพิ่มอีกสิ่งหนึ่ง: เราแทบจะไม่รู้ในอนาคตอันใกล้ เนื่องจากจำนวนของกลยุทธ์มีมากจนเป็นเรื่องยากมาก (หากไม่ใช่เป็นไปไม่ได้) ที่จะลดเกมลงในรูปแบบเมทริกซ์และหาจุดอานในนั้น

และตอนนี้ลองถามตัวเองว่าจะทำอย่างไรถ้าเกมไม่มีจุดอาน: ถ้าผู้เล่นแต่ละคนถูกบังคับให้เลือกกลยุทธ์ที่บริสุทธิ์เพียงอย่างเดียว ก็ไม่มีอะไรต้องทำ: เราต้องได้รับคำแนะนำจากหลักการขั้นต่ำ อีกสิ่งหนึ่งคือหากคุณสามารถ "ผสมผสาน" กลยุทธ์ของคุณ สลับกลยุทธ์ด้วยความน่าจะเป็นบางอย่างแบบสุ่ม การใช้กลยุทธ์แบบผสมเกิดขึ้นในลักษณะนี้: เกมเล่นซ้ำหลายครั้ง ก่อนเกมแต่ละเกม เมื่อผู้เล่นได้รับการเคลื่อนไหวส่วนตัว ผู้เล่นจะ "วางใจ" ในการเลือกโอกาส "โยนล็อต" และใช้กลยุทธ์ที่หลุดออกมา (เรารู้วิธีจัดล็อตจากบทที่แล้วแล้ว ).

กลยุทธ์แบบผสมในทฤษฎีเกมเป็นรูปแบบของกลยุทธ์ที่เปลี่ยนแปลงได้และยืดหยุ่น เมื่อไม่มีผู้เล่นคนใดรู้ว่าฝ่ายตรงข้ามจะมีพฤติกรรมอย่างไรในเกมที่กำหนด ชั้นเชิงนี้ (แม้ว่าโดยปกติจะไม่มีเหตุผลทางคณิตศาสตร์ก็ตาม) มักใช้ใน การ์ดเกม. ขอให้เราทราบในเวลาเดียวกันว่าวิธีที่ดีที่สุดในการซ่อนพฤติกรรมของคุณจากศัตรูคือการสุ่มตัวละคร ดังนั้นอย่ารู้ล่วงหน้าว่าคุณจะทำอะไร

เรามาพูดถึงกลยุทธ์แบบผสมผสานกัน เราจะแสดงกลยุทธ์แบบผสมของผู้เล่น A และ B ตามลำดับ

ในกรณีเฉพาะ เมื่อความน่าจะเป็นทั้งหมด ยกเว้นหนึ่ง มีค่าเท่ากับศูนย์ และค่านี้เท่ากับหนึ่ง กลยุทธ์แบบผสมจะกลายเป็นแบบบริสุทธิ์

มีทฤษฎีบทพื้นฐานของทฤษฎีเกม: เกมใด ๆ ที่มีผู้เล่นสองคนที่มีผลรวมศูนย์เป็นศูนย์จะมีวิธีแก้ปัญหาอย่างน้อยหนึ่งวิธี - คู่ของกลยุทธ์ที่ดีที่สุด โดยทั่วไปจะผสมกัน และราคาที่สอดคล้องกัน

กลยุทธ์ที่ดีที่สุดคู่หนึ่งที่สร้างโซลูชันเกมมีคุณสมบัติดังต่อไปนี้: หากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่ดีที่สุดของเขา ก็จะไม่สามารถทำกำไรได้หากอีกฝ่ายเบี่ยงเบนไปจากเขา กลยุทธ์คู่นี้สร้างสมดุลชนิดหนึ่งในเกม: ผู้เล่นคนหนึ่งต้องการเปลี่ยนผลตอบแทนให้สูงสุด อีกคนหนึ่ง - ให้น้อยที่สุด แต่ละคนดึงไปในทิศทางของตนเอง และด้วยพฤติกรรมที่สมเหตุสมผลของทั้งคู่ ความสมดุลและ มีการสร้างผลตอบแทนที่มั่นคง v ถ้าเกมมีประโยชน์สำหรับเรา ถ้า - สำหรับศัตรู; เมื่อเกมนั้น "ยุติธรรม" เป็นประโยชน์เท่าเทียมกันสำหรับผู้เข้าร่วมทั้งสองฝ่าย

พิจารณาตัวอย่างเกมที่ไม่มีอานม้าและให้คำตอบ (โดยไม่มีข้อพิสูจน์) เกมดังกล่าวมีดังต่อไปนี้: ผู้เล่นสองคน A และ B พร้อมกันโดยไม่พูดอะไร แสดงหนึ่ง สองหรือสามนิ้ว การชนะจะตัดสินจากจำนวนนิ้วทั้งหมด หากเป็นเลขคู่ A จะชนะและได้รับเงินจาก B ในจำนวนเท่ากับจำนวนนี้ ถ้าคี่ ตรงกันข้าม A จ่าย B เป็นจำนวนเท่ากับจำนวนนี้ ผู้เล่นควรทำอย่างไร?

มาสร้างเมทริกซ์เกมกันเถอะ ในหนึ่งเกม ผู้เล่นแต่ละคนมีสามกลยุทธ์: แสดงหนึ่ง สองหรือสามนิ้ว เมทริกซ์ 3x3 ระบุไว้ในตาราง 26.5; คอลัมน์ขวาพิเศษแสดงค่าต่ำสุดของแถว และแถวด้านล่างพิเศษแสดงค่าสูงสุดของคอลัมน์

ราคาที่ต่ำกว่าของเกมสอดคล้องกับกลยุทธ์ ซึ่งหมายความว่าด้วยพฤติกรรมที่สมเหตุสมผลและระมัดระวังเรารับประกันว่าเราจะไม่เสียมากกว่า 3 ปลอบใจเล็กน้อย แต่ก็ยังดีกว่าชนะ - 5 ซึ่งพบได้ในบางครั้ง เซลล์ของเมทริกซ์ มันแย่สำหรับเรา ผู้เล่นแอล... พฤติกรรมที่เหมาะสมเขาจะให้เราอย่างน้อย 4