Παρασκευή 9 Ιανουαρίου 2015

Υπολογιστής ανακηρύσσεται άσος στο πόκερ. Computer program 'perfect at poker'

Οι καλύτεροι παίκτες πόκερ είναι πλέον μηχανές. Και αυτό ισχύει και για άλλα παιχνίδια. Scientists have created a computer program they say is the perfect poker player and never makes a mistake.

Το ένα μετά το άλλο πέφτουν τα ″κάστρα″ της ανθρώπινης νοημοσύνης και στο μέλλον καλά θα έκαναν τα καζίνα να απαγορεύσουν την πρόσβαση όχι μόνο στους ανήλικους, αλλά και στα ρομπότ – παίκτες. Ο καλύτερος παίκτης πόκερ, που δεν κάνει ποτέ λάθη, είναι ένα νέο πρόγραμμα λογισμικού που δημιούργησαν καναδοί επιστήμονες και βασίζεται σε ένα εξελιγμένο αλγόριθμο τεχνητής νοημοσύνης.

Το πρόγραμμα έτρεχε επί δύο μήνες σε μια συστοιχία ισχυρών υπολογιστών. Όταν οι υπολογισμοί τέλειωσαν, το Cepheus ήταν πια ο καλύτερος παίκτης του κόσμου σε μια παραλλαγή του πόκερ. Μπορείτε μάλιστα να το δοκιμάσετε, αν είστε προετοιμασμένος για την ήττα.

Η παραλλαγή

University of Alberta researcher Michael Bowling and his team have solved heads-up, limit, Texas hold'em poker. (John Ulan/University of Alberta)

Έχοντας παίξει δισεκατομμύρια παρτίδες με αντίπαλο τον εαυτό του, το Cepheus («Κηφεύς» πρόσωπο της ελληνικής μυθολογίας και όνομα αστερισμού) έχει τελειοποιηθεί στο Heads-Up, Limit Hold'em, μια παραλλαγή του δημοφιλούς παιχνιδιού πόκερ Texas Hold'em. Οι δημιουργοί του προγράμματος στο Πανεπιστήμιο της Αλμπέρτα παρουσιάζουν το επίτευγμά τους στο κορυφαίο περιοδικό Science.

The probabilities for the dealer’s first action of the game. Each cell represents one of the possible 169 hands (i.e., two private cards), with the upper right diagonal consisting of cards with the same suit and the lower left diagonal consisting of cards of different suits. The color of the cell represents the action taken: red for fold, blue for call, and green for raise, with mixtures of colors representing a stochastic decision. (Bowling et al/Science/AAAS)

H αλήθεια βέβαια είναι ότι το λογισμικό δεν έχει «λύσει» τη συγκεκριμένη παραλλαγή του πόκερ με τη μαθηματική έννοια της λέξης. Επισήμως, η νίκη δεν είναι εξασφαλισμένη με απόλυτη βεβαιότητα σε κάθε παρτίδα. Πρακτικά, όμως, η πιθανότητα ήττας είναι μηδαμινή.

«Ακόμα κι αν έπαιζες 60 εκατομμύρια παρτίδες για 70 χρόνια, 12 ώρες την ημέρα, και δεν έκανες ποτέ λάθος, δεν θα ήσουν σε θέσει να πεις με στατιστική βεβαιότητα ότι είσαι καλύτερος από το πρόγραμμα» λέει στη Washington Post ο Μάικλ Μπόουλινγκ, πρώτος συγγραφέας της δημοσίευσης.

Παραδέχεται πάντως ότι το παιχνίδι δεν έχει επισήμως λυθεί: «Δεν είμαστε τέλειοι, βρισκόμαστε όμως τόσο κοντά ώστε, ακόμα κι αν έπαιζε κανείς μαζί του μια ζωή, δεν θα μπορούσες να επιβεβαιώσεις ότι δεν είναι τέλειο» λέει.

Τέλειες μαθηματικές λύσεις έχουν βρεθεί για παιχνίδια όπως η ντάμα και το Connect Four, τα οποία είναι γνωστά ως «παιχνίδια τέλειας πληροφορίας». Αυτό σημαίνει ότι όλοι οι παίκτες γνωρίζουν όλα όσα συμβαίνουν στο παιχνίδι.

The software could mean better approaches to auctions are on the cards (Image: Eric Robison/Alamy)

Αυτό δεν ισχύει για το πόκερ, ένα παιχνίδι που έχει στην καρδιά του την απόκρυψη στοιχείων και τη μπλόφα. Μαθηματικές λύσεις δεν έχουν βρεθεί για κανένα τέτοιο παιχνίδι «ατελούς πληροφορίας».

Ο Μπόουλινγκ και οι συνεργάτες του πλησίασαν ένα βήμα πιο κοντά στη λύση στη συγκεκριμένη παραλλαγή του πόκερ, την οποία επέλεξαν επειδή είναι μάλλον απλή. Το παιχνίδι παίζεται μόνο από δύο παίκτες και το ποσό που ποντάρουν παραμένει σταθερό. Αυτό σημαίνει ότι υπάρχουν μόνο 13,8 δισεκατομμύρια διαφορετικές πιθανές κινήσεις, επισημαίνει ο Economist.

Για να εξετάσει όλες αυτές τις πιθανές παρτίδες, το Cepheus χρειάστηκε να τρέξει για δύο μήνες σε 200 υπολογιστές με 24 επεξεργαστές ο καθένας.

Computer says “fold”. The poker-ace algorithm is also now available online for people to test, query and even play against.

Μπορείτε να διαβάσετε για τη στρατηγική που ακολουθεί, αλλά και να αναμετρηθείτε με το πρόγραμμα στο poker.srv.ualberta.ca. Οι χρόνοι αντίδρασής του έχουν πάντως αυξηθεί εσκεμμένα. Μέχρι σήμερα το λογισμικό δεν έχει αναμετρηθεί με πρωταθλητές του πόκερ, νίκησε όμως όλους όσους έπαιξαν μαζί του.

Η νίκη του Cepheus έναντι των ανθρώπων, έστω και ανεπίσημη, έρχεται να προστεθεί σε μια σειρά προηγούμενων επιτυχιών. Η ντάμα έγινε το 1994 το πρώτο παιχνίδι στο οποίο ο άνθρωπος χάνει από τις μηχανές. Η επόμενη μεγάλη επιτυχία ήρθε το 1997, όταν το σύστημα Deep Blue της IBM νίκησε τον τότε παγκόσμιο πρωταθλητή στο σκάκι Γκάρι Κασπάροφ. Η αλήθεια είναι όμως ότι το σκάκι, ένα παιχνίδι τέλειας πληροφορίας, επισήμως δεν έχει λυθεί μαθηματικά.

Το πόκερ θα ήταν ακόμα δυσκολότερο να επιλυθεί, δεδομένου ότι είναι παιχνίδι ατελούς πληροφορίας.  Για παράδειγμα, η κατάργηση του περιορισμού των σταθερών ποσών στο ποντάρισμα στο Heads-Up, Limit Hold'em θα αύξανε τις παραλλαγές του παιχνιδιού στα 6,38 x 10161, ένας ασύλληπτα μεγάλος αριθμός που υπερβαίνει τον αριθμό των ατόμων στο Σύμπαν.

Η επίλυση τέτοιων παιχνιδιών παραμένει υπερβαίνει μακράν τις δυνατότητες της σημερινής τεχνολογίας. Παρόλα αυτά, η τεχνολογία του Cepheus θα μπορούσε να έχει σημαντικές εφαρμογές σε προβλήματα που μπορούν να θεωρηθούν παιχνίδια από μαθηματική άποψη.

Για παράδειγμα, ο Μπόουλινγκ συνεργάζεται με διαβητολόγους για την ανάπτυξη αλγορίθμων που θα δίνουν τη βέλτιστη θεραπεία, θεωρώντας τον διαβήτη «αντίπαλο» σε ένα τέτοιο παιχνίδι. Άλλες πιθανές εφαρμογές είναι η ασφάλεια και τα στρατιωτικά παίγνια.

Για τους μαθηματικούς, πολλά προβλήματα της καθημερινής ζωής είναι περίπου σαν παιχνίδια πόκερ.





Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου