Σελίδες

Σάββατο 27 Απριλίου 2013

Εισαγωγή στη Θεωρία Παιγνίων


Η Θεωρία Παιγνίων, έχει μεγάλο φάσμα εφαρμογών.Μπορούμε να πούμε ότι όλες οι υπόλοιπες επιστήμες έχουν σχέση με αυτή, αφού έχει εφαρμογές στην πληροφορική, στη βιολογία, στην οικονομία, στην πολιτική, στην κοινωνιολογία και σε πολλά άλλα πράγματα της καθημερινότητας. Είναι μία σύγχρονη μαθηματική Θεωρία, με την οποία μπορούμε να αναλύσουμε, κάθε είδος «αναμέτρησης», σε οποιοδήποτε επίπεδο, όπως π.χ. ένα παιχνίδι σκάκι, το τζόγο, ή ακόμα και έναν πόλεμο. 
Αν θέλουμε να δώσουμε έναν ορισμό στη Θεωρία Παιγνίων, μπορούμε να πούμε ότι είναι μία μεθοδολογία ανάλυσης καταστάσεων μεταξύ μιας ομάδας λογικών ατόμων, στην οποία υπάρχουν στοιχεία ανταγωνιστικής αλληλεξάρτησης, προκειμένου να παρθεί μία απόφαση από κάθε άτομο, ώστε να αποκτήσει το μεγαλύτερο όφελος. 
Σκοπός της, δηλαδή,  είναι να καταλάβουμε διάφορες καταστάσεις (ή παίγνια), στις οποίες αλληλεπιδρούν δύο ή περισσότερες οντότητες (ή παίκτες), κάθε μία από τις οποίες συμπεριφέρεται με στρατηγικό τρόπο και προσπαθεί να πάρει κάποιες αποφάσεις, οι οποίες δημιουργούν καταστάσεις αλληλεξαρτησίας ανάμεσα σε αυτές, οι οποίες προσπαθούν να έχουν το μεγαλύτερο όφελος, μετά από κάθε ενέργειά τους. 


Ιστορική Αναδρομή

Η πρώτη γνωστή αναφορά, στη θεωρία παιγνίων, είχε γίνει από το Γάλλο οικονομολόγο Augustin Cournot, το 1838 ο οποίος είχε αναλύσει τις ολιγοπωλιακές καταστάσεις με τρόπο παρόμοιο με τις σύγχρονες μεθόδους, της Θεωρίας Παιγνίων. Ωστόσο, η θεωρία αυτή, ξεκίνησε το 1944, σαν κλάδος οικονομικών, με το βιβλίο των John von Neumann και Oskar Morgenstein: “Theory of Games and economic behavior” (Θεωρία Παιγνίων και οικονομική συμπεριφορά), το οποίο σχετίζονταν, με τα παιχνίδια μηδενικού αθροίσματος (zero-sum games).
Το 1928, ο Neumann,  απέδειξε ότι τα παιχνίδια μηδενικού αθροίσματος, έχουν πάντα λύση και ότι η απώλεια ενός παίκτη, είναι ίση με το κέρδος του αντιπάλου του.
Στις αρχές της δεκαετίας του 1950, ο Αμερικανός μαθηματικός John Forbes Nash, εισήγαγε μία ισορροπία για τα παιχνίδια μη-μηδενικού αθροίσματος, γνωστή σαν ισορροπία Nash (Nash’ Equilibrium). Πρόκειται για μία κατάσταση, από την οποία δεν συμφέρει σε κανέναν παίκτη να απομακρυνθεί ( ή αποχωρήσει), δεδομένων των επιλογών των αντιπάλων τους.
Μετά την ισορροπία του Nash, παρατηρείται μία αλματώδη ανάπτυξη στη θεωρία παιγνίων, αρχίζοντας να χρησιμοποιείται σε πολλές επιστήμες, ενώ πληθώρα ερευνητικών πειραμάτων, άρχισαν προσπαθώντας να βρουν λύση σε πολλά προβλήματα. Το 1965 ο Reinhard Selten, μελέτησε τα δυναμικά παίγνια (αυτά δηλαδή, που εξελίσσονται στο χρόνο), εισάγοντας την έννοια της ισορροπίας στα υποπαίγνια (subgame perfect equilibrium) και της ισορροπίας του τρεμάμενου χεριού (trebling hand perfect equilibrium), ενώ το 1975, ο John Harsanyi, γενίκευσε τις ιδέες του Nash και μελέτησε παίγνια, μη-πλήρους πληροφόρησης (ή παίγνια υπό μερικής πληροφόρησης “Incomplete Information Games”) . Για τις εργασίες τους, αυτοί οι τρεις επιστήμονες (John Nash, Reinhard Selten, John Harsanyi) θεωρήθηκαν οι θεμελιωτές της Θεωρίας Παιγνίων, ενώ το 1994, τιμήθηκαν, με το βραβείο Nobel. 

Βασικές έννοιες της Θεωρίας Παιγνίων

Θεμέλιο λίθο στη Θεωρία Παιγνίων, αποτελούν τα βασικά χαρακτηριστικά του παιγνίου. Τέτοια θεωρούνται: το σύνολο των παικτών, το σύνολο των πιθανών ενεργειών που μπορούν να πραγματοποιήσουν οι παίκτες, οι πληροφορίες που υπάρχουν κατά τη διάρκεια του παιχνιδιού, τα αποτελέσματα που μπορεί να αποκομίσει ο παίκτης για κάθε ενέργειά του, καθώς επίσης και οι προτιμήσεις των παικτών βάσει των αποτελεσμάτων. Το αποτέλεσμα (outcome) που μπορεί να αποκομίσει κάθε παίκτης, εξαρτάται από τις στρατηγικές που θα ακολουθήσει και από τις αποδόσεις που μπορεί να λάβει. Η απόδοση (payoff), είναι η αριθμητική αποτίμηση των στόχων του, ή αλλιώς, η χρησιμότητα που θα αποκτήσει όταν το παιχνίδι θα τελειώσει.
Με τον όρο «στρατηγική», ορίζουμε το σύνολο των κανόνων, που ορίζουν τις εφικτές επιλογές των κινήσεων ενός παίκτη, σε κάθε παίγνιο ξεχωριστά, έχοντας όμως υπ’όψιν του και τις επιλογές του αντιπάλου. Προφανώς, οι παίκτες ακολουθούν την στρατηγική με την ο οποία θα έχουν το βέλτιστο αποτέλεσμα. Μία διάκριση που μπορεί να γίνει στις στρατηγικές είναι, σε «αμιγείς» (“Μ”) και σε «μεικτές» (“mixed”) στρατηγικές. 
 Μία αμιγής,(ή  «καθαρή») στρατηγική, είναι εκείνη, στην οποία κάθε μία από τις δυνατές επιλογές που έχει ο παίκτης, επιλέγεται στο ακέραιο, δηλαδή, κάθε παίκτης επιλέγει μία μόνο από τις δυνατές «επιλογές» του με πιθανότητα ίση με τη μονάδα. 
Αντίθετα, μεικτή είναι η στρατηγική, η οποία περιλαμβάνει συνδυασμό επιλογών, από τις οποίες τουλάχιστον μία επιλέγεται με μη ακέραιες τιμές, δηλαδή, περιλαμβάνει συνδυασμό «επιλογών» (στρατηγικών) οι οποίες επιλέγονται με πιθανότητα μικρότερη της μονάδας. Οι μεικτές στρατηγικές, δηλαδή, καθορίζουν ότι η στρατηγική του παίκτη, θα επιλεγεί τυχαία από το σύνολο των «καθαρών στρατηγικών» που έχει, με κάποια πιθανότητα. Επομένως, μία μεικτή στρατηγική, είναι, μία κατανομή πιθανοτήτων πάνω στις καθαρές στρατηγικές που έχει ο παίκτης. 
Ένα παίγνιο, στο οποίο οι παίκτες παίζουν ταυτόχρονα, μπορεί να απεικονιστεί ως «κανονική» (normal), ή «στρατηγική» (strategic) μορφή, χρησιμοποιώντας έναν πίνακα, οποίος συσχετίζει τις στρατηγικές των παικτών, με τις αποδόσεις που θα έχουν και ονομάζεται πίνακας αποτελεσμάτων.
Ένα στρατηγικό παιχνίδι, είναι ένα μοντέλο, όπου έχουμε Ν παίκτες, καθένας από τους οποίους, διαλέγει μόνο μία στρατηγική, η οποία δεν αλλάζει. Σε ένα στρατηγικό παιχνίδι, υπάρχουν διάφορες συμπεριφορές παικτών (κανόνες):
Το παιχνίδι παίζεται μόνο μία φορά.
Κάθε παίκτης, ξέρει το παιχνίδι, με βάση την αρχή κοινής γνώσης (δηλαδή, γνωρίζει τις κινήσεις και τις αποδόσεις (χρησιμότητα), της κάθε κίνησης, του παιχνιδιού αλλά γνωρίζει ότι και ο αντίπαλος γνωρίζει τα ίδια)
Οι παίκτες είναι ορθολογικοί. Ένας ορθολογικός παίκτης, παίζει προκειμένου να μεγιστοποιήσει τα δικά του κέρδη (με βάση τους «πίνακες αποτελεσμάτων»), ενώ ταυτόχρονα, γνωρίζει πως και οι αντίπαλοί του είναι ορθολογιστές. 
Οι παίκτες είναι «απομονωμένοι» πριν από το παίγνιο, δηλαδή ενώ επιλέγουν ταυτόχρονα στρατηγική, χωρίς να ξέρουν ποια επέλεξε ο αντίπαλός τους, κατά τη διάρκεια του παιγνίου δε συνεργάζονται, για τα παίγνια μηδενικού αθροίσματος, σε αντίθεση με τα παίγνια μη-μηδενικού αθροίσματος που μπορούν να συνεργαστούν, ενώ δεν μπορούν να επικοινωνήσουν μεταξύ τους.  

Ορολογία: Θεωρία Παιγνίων – Αποτέλεσμα – Απόδοση - Στρατηγική (Αμιγής, Μεικτή) - Πίνακας Αποτελεσμάτων - Ορθολογικός Παίκτης - Αρχή της Κοινής Γνώσης

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου