Τεχνολογια - Επιστημη

Homo Sapiens: Οι υπολογιστές μας νίκησαν στο σκάκι

Ευτυχώς στο πόκερ κρατάμε ακόμα γερά

thanasis_panagopoulos.jpg
Θανάσης Παναγόπουλος
3’ ΔΙΑΒΑΣΜΑ
Σκάκι, Google
© Juno Jo/ Unsplash

Ο AlphaZero είναι η καινούργια μηχανή της Google που κυριαρχεί στο σκάκι

Το 1997, o υπολογιστής της IBM με το λίγο ρομαντικό όνομα Deep Blue κατέπληξε τον πλανήτη όταν νίκησε τον Γκάρι Κασπάροφ, τον μεγαλύτερο παίκτη όλων των εποχών. Ο Deep Blue ήταν ένα απίστευτο κατόρθωμα της μηχανικής, αλλά αν έπαιζε με τους σημερινούς υπολογιστές σκακιού - όπως ο Stockfish, ο Komodo και ο Deep Shredder - η μηχανή της IBM δεν θα είχε πολλή τύχη. Και οι υπολογιστές συνεχίζουν να ενισχύονται. Μια νέα παρτίδα ηλεκτρονικών υπολογιστών σκακιού, με επικεφαλής τον AlphaZero της Google, έχει αρχίσει να προσεγγίζει το παιχνίδι με έναν θεμελιωδώς διαφορετικό τρόπο. Δεν βασίζονται σε προσεκτικά ισορροπημένους αλγορίθμους και να κάνουν τρισεκατομμύρια υπολογισμούς το δευτερόλεπτο δοκιμάζοντας όλους τους συνδυασμούς κινήσεων.

Χρησιμοποιούν τη μηχανική μάθηση για να αναγνωρίσουν τα επαναλαμβανόμενα μοτίβα και να κάνουν κινήσεις βασισμένες σε αυτό που αποκαλούμε «ανθρώπινη διαίσθηση». Έτσι, ενώ οι πρώτες εκδόσεις των υπολογιστών σκακιού ήταν καλές μόνο για το παιχνίδι, οι νέοι παίκτες είναι προσαρμόσιμοι - εξίσου ικανοί να κυριαρχήσουν στο σκάκι αλλά και στο κινέζικο παιχνίδι στρατηγικής go ή το ιαπωνικό ανάλογο με το σκάκι shogi. 

200 εκατομμύρια: Κινήσεις ανά δευτερόλεπτο που μπορούσε να αναλύσει ο Deep Blue 

20: Για τόσες κινήσεις μπροστά ισχυρίζεται ότι μπορεί να υπολογίσει τους συνδυασμούς ο παγκόσμιος πρωταθλητής Magnus Carlsen

10120: Συντηρητική εκτίμηση των πιθανών αποτελεσμάτων σε ένα παιχνίδι σκακιού, υπολογίστηκε από τον Claude Shannon το 1950 και είναι γνωστός ως αριθμός Shannon

3,2880: Τα άτομα στο σύμπαν - περισσότερο από ένα τρισεκατομμύριο τρισεκατομμύρια τρισεκατομμύρια φορές λιγότερα από τον αριθμό Shannon 

487: Το μέγεθος σε bytes του BootChess, του μικρότερου προγράμματος σκακιού του κόσμου 

400: Το μέγεθος σε bytes ενός tweet

4: Οι ώρες που χρειάστηκε το AlphaZero για να εκπαιδεύσει τον εαυτό του ώστε να γίνει ο καλύτερος παίκτης σκακιού όλων των εποχών

Οι παλιομοδίτικες μηχανές σκακιού, όπως ο Deep Blue, κατατρόπωναν τους ανθρώπινους αντιπάλους τους μέσω της ωμής υπολογιστικής τους δύναμης. Τη στιγμή που ο ανθρώπινος εγκέφαλος του Κασπάροφ μπορούσε να υπολογίζει μια χούφτα δυνητικών κινήσεων το Deep Blue υπολόγιζε δισεκατομμύρια πιθανές θέσεις στη σκακιέρα με βάση κάθε κίνηση που θα μπορούσε να κάνει. Ένας αλγόριθμος από τους μηχανικούς της IBM βαθμολογούσε κάθε μία από αυτές τις θέσεις ένα σκορ με βάση τον αριθμό των κομματιών στη σκακιέρα, την αξία τους, τη θέση τους, την τρωτότητα του βασιλιά και άλλους παράγοντες). Στο τέλος, επέλεγε την κίνηση που ο αλγόριθμος θεωρούσε πιο πιθανό να οδηγήσει σε μια τοποθέτηση της σκακιέρας με το καλύτερο σκορ.

Αυτή η μέθοδος ήταν αρκετά καλή για να κερδίζει στα σίγουρα όλους τους ανθρώπους. Το 2017 όμως η Google απέδειξε ότι ένα νέο είδος μηχανής σκακιού, το οποίο λειτουργεί με μηχανική μάθηση, θα μπορούσε να νικήσει κάθε προηγούμενο υπολογιστή. Ήταν ο AlphaZero και είχε αρχικά μηδενική «ανθρώπινη» γνώση. Οι μηχανικοί του δεν το έμαθαν κανένα από τα τυπικά ανοίγματα στο σκάκι, δεν του έδωσαν αλγόριθμους για να αξιολογεί μια τοποθέτηση της σκακιέρας και δεν το τροφοδότησαν με παιχνίδια μεταξύ των καλύτερων παικτών του κόσμου. Το μόνο που έδωσαν στον υπολογιστή ήταν οι κανόνες του παιχνιδιού και το άφησαν να παίξει 44 εκατομμύρια παιχνίδια εναντίον του εαυτού του.

Τέσσερις ώρες μετά την ενεργοποίηση του μηχανήματος από τους μηχανικούς αυτό νίκησε το Stockfish, την καλύτερη πλατφόρμα σκακιού στον κόσμο μέχρι τότε. Το μηχάνημα έβγαλε ακόμη και «ανθρώπινο» οίστρο και ζωηράδα. «Είναι εκπληκτικό να βλέπεις μια μηχανή που παίζει τόσο επιθετικά και με τόσο μεγάλη δημιουργικότητα», δήλωνε ο Κασπάροφ.

Το AlphaZero δεν κυριάρχησε μόνο στο σκάκι. Έγινε σε 2 ώρες ο μεγαλύτερος παίκτης όλων των εποχών στο shogi και σε 8 ώρες στο Go, αποδεικνύοντας την ικανότητά του να προσαρμόζεται και να υπερέχει σε νέες καταστάσεις. Μέσα σε λίγες ώρες ο υπολογιστής βρήκε τις στρατηγικές που είχαν αναπτύξει οι άνθρωποι εδώ και αιώνες και βρήκε νέες τακτικές που οι άνθρωποι δεν είχαν ανακαλύψει ακόμα. Αυτά τα κατορθώματα έδωσαν στους μηχανικούς της AlphaZero την ελπίδα ότι μπορούν να το χρησιμοποιήσουν και σε άλλα προβλήματα, όπως η πρόβλεψη των σχημάτων που θα προκύψουν από το «δίπλωμα» των πρωτεϊνών.

Μια τροποποιημένη έκδοση του λογισμικού που ονομάζεται AlphaFold ήταν ο κυρίαρχος σε ένα διαγωνισμό για την καλύτερη πρόβλεψη των δομών των πρωτεϊνών. Αυτό σημαίνει ότι προγράμματα ηλεκτρονικών υπολογιστών όπως το AlphaZero μπορούν να βοηθήσουν τους επιστήμονες να κατανοήσουν καλύτερα ασθένειες όπως το Parkinson και το Alzheimer αλλά και να σχεδιάσουν χημικές ουσίες που θα αντιμετωπίσουν τους περιβαλλοντικούς ρύπους. Υπάρχει όμως ένα όριο στις προκλήσεις που μπορεί να αντιμετωπίσει το AlphaZero.

Το σκάκι, το shogi και το go είναι παιχνίδια με σαφώς καθορισμένους κανόνες και πλήρης πληροφόρηση - κάθε παίκτης έχει στη διάθεση του όλες τις διαθέσιμες πληροφορίες. Το AlphaZero για παράδειγμα δεν θα ήταν σε θέση να κυριαρχήσει στο πόκερ, όπου οι άλλοι παίκτες μπορούν να μπλοφάρουν και τα χαρτιά που έχουν στα χέρια τους είναι ένα μυστήριο (αν και ο δημιουργός του AlphaZero Demis Hassabis επιμένει ότι μια μέρα θα μπορούσε). Πολλά προβλήματα του πραγματικού κόσμου είναι ακόμα πιο μπλεγμένα και αόριστα από το πόκερ, με ασαφείς κανόνες και πολλές άγνωστες μεταβλητές. Σε αυτές τις περιπτώσεις, η ανθρώπινη διαίσθηση εξακολουθεί να έχει το πάνω χέρι, για την ώρα.

Με πληροφορίες από: Quartz

ΕΓΓΡΑΦΕΙΤΕ ΣΤΟ NEWSLETTER ΜΑΣ

Tα καλύτερα άρθρα της ημέρας έρχονται στο mail σου

ΠΡΟΣΦΑΤΑ

ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ