O
νοτιοκορεάτης Λι Σέντολ χρειάστηκε πέντε ώρες για να πετύχει την πρώτη νίκη του
έναντι της μηχανής. Go Grandmaster Lee Sedol. Credit: GEORDIE WOOD FOR WIRED
Έπειτα
από τρεις συνεχόμενες ήττες, ο παγκόσμιος πρωταθλητής στο ασιατικό παιχνίδι
Γκο, το οποίο θεωρείται μακράν πιο περίπλοκο από το σκάκι, πέτυχε την Κυριακή
την πρώτη νίκη του απέναντι στο AlphaGo, έναν αλγόριθμο τεχνητής νοημοσύνης της
Google. Η αναμέτρηση ολοκληρώνεται την Τρίτη με την πέμπτη παρτίδα.
Στο
ασυνήθιστο τουρνουά που διεξάγεται στη Σεούλ, το AlphaGo παραδέχτηκε την ήττα
του απέναντι στο νοτιοκορεάτη Λι Σέντολ πέντε ώρες μετά την έναρξη της
αναμέτρησης. «Η νίκη αυτή είναι τόσο πολύτιμη για μένα που
δεν θα την άλλαζα με τίποτα στον κόσμο» σχολίασε ο Λι, ο οποίος έχει στην
κατοχή του νίκες σε 18 διεθνή τουρνουά Γκο.
Ο
Λι, όμως, έχασε στην πρώτη, τη δεύτερη και την τρίτη αναμέτρηση με τη μηχανή. Η
τέταρτη αναμέτρηση:
Το
AlphaGo, ένα «νευρωνικό δίκτυο» που μιμείται την αρχιτεκτονική του εγκεφάλου,
αναπτύχθηκε από τη λονδρέζικη εταιρεία DeepMind, η οποία εξαγοράστηκε από τη
Google πριν από δύο χρόνια.
Η
τεχνολογία του AlphaGo, λέει ο δημιουργός του Ντένις Χασάμπις της DeepMind, θα
μπορούσε να αξιοποιηθεί και σε άλλες εφαρμογές που απαιτούν λήψη αποφάσεων,
σχεδιασμό στρατηγικής και αναγνώριση περίπλοκων μοτίβων. Παραδείγματα είναι οι
αυτόματες διαγνώσεις σε απεικονιστικές εξετάσεις και η βελτίωση των μοντέλων
του παγκόσμιου κλίματος.
Το
Γκο, το οποίο θεωρείται μακράν πιο περίπλοκο από το σκάκι, εκ πρώτης όψης
φαίνεται απλό. Το ταμπλό του είναι ένας πίνακας με 19 επί 19 τετράγωνα, στα
οποία οι δύο παίκτες παίζουν εναλλάξ τοποθετώντας μαύρα ή άσπρα βότσαλα. Κάθε
παίκτης προσπαθεί να περικυκλώσει τα πούλια του αντιπάλου του έτσι ώστε να μην
υπάρχουν ελεύθερες θέσεις γύρω του. Τα περικυκλωμένα πούλια απομακρύνονται από τον
ταμπλό και η τελική βαθμολογία υπολογίζεται από την περιοχή που ελέγχει ο κάθε
παίκτης και τον αριθμό των βότσαλων που κατάφερε να φυλακίσει.
Σε
μια τυπική αναμέτρηση των 150 κινήσεων, οι πιθανές διατάξεις των πετρών στο
ταμπλό φτάνει τις 10170 -ένας αριθμός μεγαλύτερος από τον αριθμό όλων των
ατόμων στο Σύμπαν. Αυτό σημαίνει ότι θα ήταν πρακτικά αδύνατο να εξετάσει ένας
υπολογιστής όλες τις δυνατές κινήσεις και τις εκβάσεις τους.
Σε
αντίθεση με άλλα προγράμματα Γκο, τα οποία δημιουργήθηκαν ειδικά για να παίζουν
το παιχνίδι, ο αλγόριθμος AlphaGo δεν διδάχθηκε καν τους κανόνες του παιχνιδιού
-είναι ένας αλγόριθμος μάθησης που βελτιώνεται με την εμπειρία.
Το
πρόγραμμα αρχικά μελέτησε 50 εκατομμύρια κινήσεις από παιχνίδια επαγγελματιών
παικτών και έμαθε έτσι να προβλέπει ποια είναι η καλύτερη κίνηση. Έπαιξε επίσης
εκατομμύρια παρτίδες εναντίον του εαυτού του και διδάχτηκε να εκτιμά ποιος
παίκτης έχει το πάνω χέρι υπολογίζοντας την πιθανότητα να κερδίσει τελικά το
παιχνίδι η μία ή η άλλη πλευρά.
Το
AlphaGo μπορεί να μαθαίνει επειδή βασίζεται σε ένα δίκτυο από εικονικούς
νευρώνες που συνδέονται μεταξύ τους με εικονικές συνάψεις, οι οποίες
ισχυροποιούνται ή εξασθενίζουν ανάλογα με τα παραδείγματα και την εμπειρία.
Σε
μια από τις καλύτερες σκηνές της ταινίας «A
Beautiful Mind» o John Nash (Russel Crowe) δέχεται την πρόκληση από τους
συμφοιτητές του να παίξει Go. This is one of the best scenes in the movie ”A Beautiful Mind” where John Nash (Russel Crowe) is challenged to a
game of Go by one of his competitors at Princeton.
Παρόμοιες
τεχνικές θα μπορούσαν να εφαρμοστούν τώρα σε άλλες εφαρμογές που απαιτούν λήψη
αποφάσεων, σχεδιασμό στρατηγικής, μακροπρόθεσμο σχεδιασμό και αναγνώριση
περίπλοκων μοτίβων.
Η
πρώτη μεγάλη νίκη των υπολογιστών έναντι των ανθρώπων ήρθε το 1997, όταν ο
υπολογιστής Deep Blue της IBM νίκησε τον τότε παγκόσμιο πρωταθλητή στο σκάκι
Γκάρι Κασπάροφ. Έκτοτε οι αλγόριθμοι έχουν κατατροπώσει τους ανθρώπους στη
ντάμα, το τάβλι και το τηλεπαιχνίδι Jeopardy!, μεταξύ άλλων.
Πηγή:
news.in.gr – www.wired.com