Σελίδες

Πέμπτη 2 Μαΐου 2013

Θεωρία Παιγνίων Παίγνια Μηδενικού Αθροίσματος


Συνεχίζοντας, στη Θεωρία Παιγνίων, θα αναλύσουμε, τα παίγνια μηδενικού αθροίσματος σε κανονική μορφή (zero sum games in canonical form).
Περιγράφοντας ένα τέτοιο σύστημα, θα ξεκινήσουμε με ένα απλό παράδειγμα, ένα παίγνιο, στο οποίο, συμμετέχουν 2 παίκτες, ο Α και ο Β. Ας υποθέσουμε ότι ο  Β, θα πρέπει να «πληρώνει» τον Α για κάποιον λόγο, ενώ το ποσό πληρωμής του Α, θα καθορίζεται από τον παρακάτω πίνακα: 

         2     6     8 
 Π =  4    -1     3
         0     1     3                    

Το παιχνίδι παίζεται ως εξής: αν παίζει ο παίκτης Α πρώτος, επιλέγει μία γραμμή του Π, ενώ ο παίκτης Β, θα επιλέξει μία στήλη του Π. Το στοιχείο που θα επιλεγεί με συντεταγμένες τους επιλεγμένους αριθμούς των δύο παικτών είναι το ποσό «πληρωμής» του Β στον Α, το οποίο μπορεί να είναι και αρνητικό ή και ίσο με το μηδέν. Αν πάιξει από την άλλη, ο Β πρώτος, θα επιλέξει πάλι την στήλη ενώ ο Α την γραμμή.
Μελετώντας, θεωρητικά για λίγο, την στρατηγική των δύο παικτών, ίσως να έχει γίνει ήδη αντιληπτός, ο τρόπος με τον οποίο θα πρέπει να κινηθούν οι δύο πλευρές. Σκοπός του Α, είναι να επιλέξει τη γραμμή, με τη μέγιστη ελάχιστη τιμή πληρωμής (από τα στοιχεία της κάθε γραμμής: inf{2,-1,0}), ψάχνοντας να βρει την στήλη με τον καλύτερο συνδυασμό τιμών ώστε να έχει το μέγιστο κέρδος, η οποία σε αυτό το παράδειγμα, είναι η 1η. Από την άλλη, ο Β, θα πρέπει να επιλέξει, προφανώς, την ελάχιστη πληρωμή που θα μπορούσε να δώσει σε εκείνη τη γραμμή, η οποία και είναι η 1η στήλη και άρα, καταλήγουμε στο στοιχείο π11 = 2. Σε περίπτωση που παίξει πρώτος ο Β, θα πρέπει να επιλέξει την στήλη, με την ελάχιστη μέγιστη τιμή (πάλι από τα στοιχεία της κάθε γραμμής: sup{4,6,8}), δηλαδή, να επιλέξει τη γραμμή με τον καλύτερο συνδυασμό στοιχείων, ώστε να πληρώσει τα λιγότερα, η οποία είναι πάλι η 1η στήλη. Ωστόσο, ο παίκτης Α, θα επιλέξει την 2η γραμμή αφού σε εκείνη την στήλη, σε εκείνη τη γραμμή υπάρχει το μέγιστο στοιχείο της. Το στοιχείο που θα επιλεχθεί λοιπόν, είναι το π21= 4. 
Σε αυτή την περίπτωση, έχει σημασία, ποιος από τους δύο παίκτες θα παίξει πρώτος. Υπάρχουν, ωστόσο περιπτώσεις, στις οποίες, το ποσό «συναλλαγής-πληρωμής» είναι ίδιο είτε παίξει ο Α, είτε παίξει ο Β πρώτος. Ένα τέτοιο παράδειγμα, είναι το παιγνίδι, που περιγράφεται με τον εξής πίνακα Ρ, έχοντας την ίδια ακριβώς λογική.

          1 -3 5
 Ρ =    2  0    -1
         -1  1    0,5    

Παρατηρώντας λοιπόν, ότι inf{-3,-1,1} =  1, στοιχείο της 3ης γραμμής και sup{5,2,1}, στοιχείο της 2ης στήλης, ισχύει ότι το στοιχείο ρ32 = 1 είναι αυτό που θα επιλέγεται ανεξάρτητα από την σειρά με την οποία παίζουν οι παίκτες.
Με έναν απλό ορισμό, αυτόν του σαγματικού στοιχείου σε πίνακες, μπορούμε να καταλάβουμε πότε ένα παίγνιο μηδενικού αθροίσματος, είναι ανεξάρτητο της σειράς (διάταξης) των παικτών. 
Αν σε έναν πίνακα Α=(αij) ισχύει ότι maximinjαij = maxjminiαij τότε ακριβώς, αυτό το στοιχείο λέγεται και σαγματικό και αυτό είναι το στοιχείο το οποίο επιλέγεται ανεξάρτητα από τη σειρά των παικτών. Ωστόσο, αν ισχύει ότι maximinjαij < maxjminiαij ο πίνακας, δεν έχει σαγματικό σημείο. 
Ορολογίες: παίγνιο μηδενικού αθροίσματος σε κανονική μορφή, πληρωμή - συναλλαγή, στρατηγική, ανεξαρτησία διάταξης, σαγματικό στοιχείο.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου