ჯონ ნეშის ბრწყინვალე გონება და პოკერი

+ პოსტის დამატება

23 მაისს, 86 წლის ასაკში, ავტოკატასტროფის შედეგად გარდაიცვალა მეოცე საუკუნის ერთ-ერთი საუკეთესო მოაზროვნე და ისტორიაში ერთ-ერთი საუკეთესო მათემატიკოსი, ნობელის პრემიის ლაურეატი ჯონ ნეში. დღევანდელი ბლოგიც სწორედ მას ეძღვნება. 

სამეცნიერო და აკადემიური წრეების გარეთ, უმეტესობას, ჯონ ნეშის სახელი გაუგია 2001 წელს გადაღებულ ბიოგრაფიულ ფილმში Beautiful Mind, სადაც მთავარ როლს რასელ ქროუ თამაშობს. მკითხველს შეიძლება გაუჩნდეს კითხვა: რა საერთო შეიძლება ჰქონდეს ჯონ ნეშს პოკერთან? უამრავი! თქვენ შეიძლება გსმენიათ რამე 'დაუმარცხებელ სტრატეგიაზე', რომელიც სწორედ ნეშის იდეებიდან გამომდინარეობს. სტრატეგიის საილუსტრაციოდ გთავაზობთ ერთ-ერთ მაგალითს ჯონ ნეშის ნაშრომებიდან, რომელიც 'პატიმრის დილემის' სახელითაა ცნობილი. 

პატიმრის დილემა

პოლიციამ დაიჭირა კრიმინალური ბანდის ორი წევრი. ორივე მათგანს აკრძალული აქვს ერთმანეთთან საუბარი და ნებისმიერი სახის ინფორმაციის გაცვლა. ბრალმდებლებს არ აქვთ საკმარისი მტკიცებულება იმისთვის, რომ მათ ბრალი წაუყენონ. მათ მხოლოს იმის იმედი აქვთ, რომ ნაკლები ბრალდების საფუძველზე, ერთი წლით მაინც ჩასვან დამნაშავეები ციხეში. ბრალმდებლები თითოეულ მათგანს სთავაზობენ შემდეგ წინადადებას: პატიმარს შეუძლია ითანამშრომლოს გამოძიებასთან და დაასმინოს მეორე, ან საერთოდ არ მისცეს ჩვენება. შეთავაზება ასეთია:

  • თუ ორივე პატიმარი დაასმენს ერთმანეთს, მაშინ ორივე მათგანი 2 წლით დარჩება ციხეში
  • თუ 'ა' დაასმენს 'ბ'-ს, ხოლო 'ბ' ჩუმად იქნება, მაშინ 'ა' თავისუფლებას მოიპოვებს, ხოლო 'ბ' 3 წლიან სასჯელს მოიხდის (და პირიქით)
  • თუ ორივე სიჩუმეს შეინარჩუნებს, ისინი მხოლოდ 1 წელს მიიღებენ

დავუშვათ, თქვენ ხართ 'ა'. როგორ უნდა მოიქცეთ ასეთ სიტუაციაში? რა თქმა უნდა, ყველაფერი დამოკიდებულია იმაზე, როგორ მოიქცევა 'ბ'. თუ ის დაგასმენთ და თქვენც იგივეს გააკეთებთ, მაშინ ორივე 2 წელს მოიხდით. თუ მხოლოდ ის დაგასმენთ და თქვენ ჩუმად იქნებით, მაშინ 3 წელი იჯდებით ციხეში. აქედან ცხადია, რომ თქვენთვის საუკეთესო ვარიანტი თქვენი ჩვენებაა 'ბ'-ს წინააღმდეგ. 

რა მოხდება თუ 'ბ' ჩუმად იქნება? თუ ის ჩუმადაა და თქვენც არ აძლევთ ჩვენებას მის წინააღმდეგ, მაშინ ორივეს 1-1 წელს გისჯიან, ხოლო თუ თქვენ მას დაასმენთ, თქვენ თავისუფალი ხართ. ამ შემთხვევაშიც, თქვენთვის საუკეთესო შედეგის მომტანი გადაწყვეტილება დასმენაა. 

ამ განხილვიდან გამომდინარეობს, რომ საერთოდ არ აქვს მნიშვნელობა, რა გადაწყვეტილებას მიიღებს 'ბ', მთავარია რომ თქვენ მასზე ჩვენება მისცეთ. აბსოლუტურად იდენტური აზრები უჩნდება 'ბ'-საც. ისიც ზუსტად მსგავსი ლოგიკით მოქმედებს. ეს არის ყველაზე მარტივი მაგალითი იმისა, რასაც "ნეშის ეკვილიბრიუმს" ეძახიან. ამ მაგალითის მთავარი იდეა იმაში არ მდგომარეობს, რომ ორივე პატიმარი საუკეთესო ვარიანტის აღწევს. ორივე მათგანის ქმედება, რეალურად, არც თავისუფლების მომტანია და არც შემცირებული სასჯელის. ამ მაგალითის მთავარი იდეა მდგომარეობს იმაში, რომ არცერთმა პატიმარმა არ მიიღო ისეთი გადაწყვეტილება, რომელიც მას უარეს შედეგს არ მოუტანდა. 

იგივე პრინციპი შეიძლება გავრცელდეს თამაშზე "მაკრატელი,ჩაქუჩი,ქაღალდი". თუ თქვენ 100%-ში მაკრატელს აჩვენებთ, მოწინააღმდეგეს შეუძლია 100%-იანი უპირატესობა მოიპოვოს თქვენზე. თუ 50% მაკრატელი იქნება და 50% ჩაქუჩი, მაშინ თქვენ 50%-იანი მოგებით ითამაშებთ, რაც გრძელ დისტანციაზე 0-ზე თამაშის საშუალებას მოგცემთ - თქვენ არც წააგებთ და არც მოიგებთ. "ნეშის ეკვილიბრიუმის" მიხედვით, საუკეთესო სტრატეგია 1/3 შემთხვევაში ჩაქუჩის, 1/3 შემთხვევაში მაკრატლის და დარჩენილ 1/3-ში ქაღალდის ჩვენებაა, რაც დისტანციაზე უპირობო პლუსის მომტანი იქნება. 

GTO - ოპტიმალური თამაშის სტრატეგია

ოპტიმალური თამაშის სტრატეგია გულისხმობს ისეთ ტაქტიკას, რომლის განხორციელების შემთხვევაშიც, ოპონენტს აღარ რჩება მომგებიანი გადაწყვეტილების მიღების საშუალება. პოკერში, ნებისმიერ სიტუაციაში არსებობს GTO-ს ამოქმედების საშუალება. მაგრამ პოკერი იმდენად რთული და კომპლექსური თამაშია, რომ უმეტეს შემთხვევაში, თითქმის შეუძლებელია ასე ზედაპირულად იმის თქმა, თუ რა იქნება კონკრეტული შემთხვევის ოპტიმალური სტრატეგია. საუკეთესო ალგორითმებით აღჭურვილი საუკეთესო კომპიუტერებიც კი ვერ გამოითვლიან, რა იქნება ამა თუ იმ სიტუაციის ოპტიმალური გადაწყვეტა. მაგრამ ოპტიმალური გადაწყვეტილებები ნამდვილად არსებობს! თუ ჩვენ თეორიულად დავუშვებთ, რომ ყოველი კონკრეტული სიტუაციისთვის შეგვიძლია ოპტიმალური გადაწყვეტილების მიღება, მაშინ არ არსებობს სტრატეგია, რომელიც ჩვენს წინააღმდეგ იმუშავებდა და რომელსაც გრძელ დისტანციაზე ვერ დავამარცხებდით. 

რა თქმა უნდა არავინ თამაშობს ასე. რეალური ადამიანი, მანქანისგან განსხვავებით, გამუდმებით ცდება GTO-ს ფარგლებს. სწორედ ამიტომაცაა ის ასე ადვილად დამარცხებადი. მაგალითისთვის განვიხილოთ, ზედმეტად სულელური სიტუაცია, მაგრამ დავუშვათ, რომ შეიძლება ასე ხდებოდეს: ვთქვათ თამაშობთ ჰედს-აპს იმდენად თაითი ოპონენტის წინააღმდეგ, რომელიც მხოლოდ AA-ის შემთხვევაში შემოდის ბანკში. თქვენ შეგიძლიათ გამუდმებით აკეთოთ პრეფლოპ რეიზი და უბრალოდ გაძარცვოთ ის, ხოლო როცა თავად გადმოვა აგრესიაზე, მარტივად გადაყაროთ ხელი. ასეთ შემთხვევაში თქვენ საშუალოდ 221 დარიგებაში ერთხელ წააგებთ. ასეთი ოპონენტი თქვენ გაიძულებთ, რომ გადაუხვიოთ GTO-ს და აკეთოთ რეიზი ყოველ დარიგებაზე. ყველამ ვიცით, რომ გამუდმებული ოპენ რეიზები ოპტიმალურ თამაშად ვერ ჩაითვლება და გრძელ დისტანციაზე ის წამგებიანია, მაგრამ შექმნილი დინამიკა, იძულებულს გვხდის, რომ საწინააღმდეგოდ ვიმოქმედოთ. ოპტიმალური გადაწყვეტილებებიდან ასეთი გადახვევა, რეალურად, თქვენ საკმაოდ წამგებიან სიტუაციაში გაგდებთ. თუ მაგიდაზე მესამე ოპონენტი შემოვა, რომელმაც რამდენიმეწუთიანი დაკვირვების შედეგად, შეისწავლა თქვენი ქმედებები, თქვენ სერიოზული პრობლემები შეგექმნებათ - მას შეუძლია პერიოდულად რირეიზები გაგიკეთოთ და თქვენ იძულებული იქნებით დიდი რაოდენობით ფული ტყუილად გადაყაროთ. 

პოკერთან შეთავსება

არსებობს თუ არა რეალური სიტუაციები პოკერში, რომელშიც შეიძლება 'ნეშის ეკვილიბრიუმის' გამოყენება? დიახ, არსებობს. თქვენ შეიძლება გინახავთ, ტურნირების ფინალურ სტადიაზე, 3-4 ოპონენტს შორის, ან ჰედს-აპ S'n'G-ებზე ე.წ. 'ფუშ ორ ფოლდ' თამაში, როდესაც სტეკები იმდენად მცირეა, რომ მოთამაშეს მხოლოდ ორი გადაწყვეტილება დარჩენია - გააკეთოს ოლ ინი, ან გადაყაროს კარტი. რამდენადაც სიტუაცია საკმაოდ მარტივია - მხოლოდ ორი გადაწყვეტილებაა მისაღები, არსებობს ამ პრობლემის მათემატიკური გადაჭრა, სადაც თქვენ მიერ მიღებულ გადაწყვეტილებებს, ოპონენტი ვერ დაუპირისპირებს ვერანაირ სტრატეგიას. 

2015 წლის იანვარში, ალბერტას უნივერსიტეტში შექმნეს ალგორითმი, რომელიც თამაშობს GTO პოკერს, მხოლოდ Fix-Limit Hold'em ჰედს-აპს. ნებისმიერი დონის მოთამაშის საუკეთესო იმედი, ასეთ ალგორითმთა, მხოლოდ 0-ში თამაშია, როცა ის ვერც იგებს და ვერც აგებს. უმეტეს შემთხვევაში კი, რა თქმა უნდა, ადამიანი მარცხდება. თუმცა ისიც უნდა ითქვას, რომ ასეთი მანქანა, ადამიანზე უკეთესად ვერ ითამაშებდა, რადგან ის მხოლოდ წინასწარ გაწერილი სტრატეგიით მოქმედებს, რომლისგან გადახვევაც მას არ შეუძლია. ეს კი იმას ნიშნავს, რომ ადამიანისგან განსხვავებით, ის მოწინააღმდეგის შეცდომას ვერ გამოიყენებს. სხვანაირად რომ ვთქვათ: ცუდი მოთამაშე აუცილებლად წააგებს ფულს ასეთ მანქანასთან, მაგრამ ასეთ მოთამაშეს, მანქანაზე გაცილებით ჩქარა მოუგებს რეალური ადამიანი, რომელიც იგივე სტრატეგიით თამაშობს. 

ჩვენს პირველ მაგალითს რომ დავუბრუნდეთ - არცერთ პატიმარს არ ექნება მეორეზე უპირატესობა, მაგრამ ვერცერთი მიიღებს გადაწყვეტილებას, რომელიც მას საერთოდ თავისუფალს დატოვებს. მსგავსია აქაც - GTO-ს მოთამაშე კომპიუტერის დამარცხება შეუძლებელია, მაგრამ ის ვერ გაზრდის მოგებას სუსტი ოპონენტის შეცდომების ხარჯზე. ამიტომაც GTO თავდაცვით თამაშად უფრო შეიძლება მივიჩნიოთ, ვიდრე მომგებიანად. 

რეალური თამაში თითქმის გამორიცხავს GTO-ს გამოყენებას. ყოველ შემთხვევაში გადაცდენა ამ სტრატეგიიდან თითქმის აუცილებელია. პოკერის მთელი ხიბლი იმაში მდგომარეობს, რომ ყოველი მოთამაშე უშვებს შეცდომას, მათ შორის ჩვენც, მაგრამ მთავარია ჩვენ გაცილებით ხშირად აღმოვაჩინოთ სხვების შეცდომა, ვიდრე სხვებმა ჩვენი. 

შემაჯამებლად შეიძლება ითქვას, რომ თქვენი მოწინააღმდეგეები ვერასდროს ითამაშებენ ოპტიმალურ თამაშს და თქვენც ვალდებული ხართ გადაუხვიოთ GTO-ს გამუდმებით, მაგრამ არა იმდენად, რომ თქვენი მოქმედებები არაადეკვატური და ადვილად დასამარცხებელი იყოს. სავარაუდოდ, კიდევ მრავალი წელი გავა ისე, რომ ისეთი რთული თამაში, როგორიც ჰოლდემია, გადაუჭრელი იქნება. ეს იმას ნიშნავს, რომ GTO ყოველი კონკრეტული სიტუაციისთვის კიდევ კარგა ხანი არ იარსებებს. და თუ ოდესმე ეს მოხდება, თუ ჰოლდემი ჭადრაკივით ამოწურვადი თამაში გახდება, მაშინ არ დაგავიწყდეთ ჯონ ნეშის და მისი ბრწყინვალე გონების გახსენება. 

რუმები

ქართული უცხოური