Τεχνολογια - Επιστημη

GPT και Νοημοσύνη: Κινδυνεύει ο άνθρωπος από τα γλωσσικά μοντέλα;

Τα όρια του κόσμου μας δεν είναι η γλώσσα. Ο κόσμος είναι πολύ πιο πολύπλοκος από αυτόν που μπορούμε να «πούμε», που μπορούμε να «ονοματίσουμε» με τη γλώσσα

Σέργιος Θεοδωρίδης
6’ ΔΙΑΒΑΣΜΑ
UPD

Τα γλωσσικά μοντέλα Τεχνητής Νοημοσύνης, τα προβλήματα, οι κίνδυνοι και η ανθρώπινη νοημοσύνη

Τα αποκαλούμενα μεγάλα γλωσσικά μοντέλα, τύπου GPT, έχουν προκαλέσει το έντονο ενδιαφέρον τόσο σε ειδικούς όσο και στο ευρύτερο κοινό. Οι απόψεις που εκφράζονται συνοδεύονται συχνά και από αντικρουόμενα συναισθήματα, όπως αυτά του θαυμασμού, του φόβου, αλλά και της απληστίας. Βαρύγδουπες απόψεις –που πολλές φορές αγγίζουν τα όρια της συνθηματολογίας– διατυπώνονται, όπως για παράδειγμα: «οι μηχανές αυτές δείχνουν τον δρόμο για να επιτύχουμε νοημοσύνη εφάμιλλη ή και ανώτερη του ανθρώπου».

Η σύγχυση που ελλοχεύει σε πολλές από τις συζητήσεις τέτοιου περιεχομένου οφείλεται συχνά στην άγνοιά μας για το πώς οι μηχανές αυτές λειτουργούν. Αλλά πάνω απ’ όλα, η σύγχυσή μας οφείλεται στις μάλλον επιφανειακές ερμηνείες μας για το τι είναι «νοημοσύνη», τι σημαίνει «γλώσσα», τι εννοούμε με τον όρο «κατανόηση» κειμένου και εννοιών και τι συνιστά αυτό που αποκαλούμε «έλλογη σκέψη».

Στο αλληγορικό διήγημα η «Βιβλιοθήκη της Βαβέλ» του Μπόρχες περιγράφεται μια φανταστική βιβλιοθήκη που περιέχει όλα τα βιβλία που έχουν ποτέ γραφτεί, αλλά και όλα τα βιβλία που θα μπορούσαν, εν δυνάμει, να γραφτούν με χρήση όλων των πιθανών συνδυασμών λέξεων και συμβόλων. Μία τέτοια αλληγορία δεν απέχει πολύ από ένα ιδανικό στατιστικό γλωσσικό μοντέλο. Μέσα από τις, εν δυνάμει, άπειρες εκδοχές που θα αποτελούσαν την απόκριση ενός υπολογιστικού συστήματος, θα επιλέξουμε την πιο πιθανή.

Τα γλωσσικά μοντέλα και τα «παιχνίδια της γλώσσας»

Τα βιβλία της βιβλιοθήκης του Μπόρχες, που έχουν ήδη γραφτεί, συμβολίζουν την πληροφορία που χρησιμοποιείται για την εκπαίδευση των γλωσσικών μοντέλων, για την απορρόφηση της υπάρχουσας γνώσης. Πώς όμως τα μοντέλα αυτά απορροφούν γνώση από τα κείμενα που τους παρέχουμε; Σύμφωνα με τον Βιτγκενστάιν, κάθε λέξη αποκτά το νόημά της μέσα από τη χρήση της στη γλώσσα. Οι λέξεις αποκτούν το νόημά τους μέσα από τα συμφραζόμενα στο πλαίσιο του «όλου» μιας πρότασης. Όπως μία νότα αποκτά την αξία της στο πλαίσιο του όλου της μελωδίας.

Τα μεγάλα γλωσσικά μοντέλα, έχοντας πρόσβαση σε τεράστιο όγκο κειμένων, έχουν τη δυνατότητα να μαθαίνουν πώς χρησιμοποιείται μια συγκεκριμένη λέξη/σύμβολο στο πλαίσιο εκατομμυρίων φράσεων. Και όταν λέμε μαθαίνει, αυτό που μαθαίνει δεν είναι έννοιες αλλά πιθανότητες. Μαθαίνει να προβλέπει την επόμενη λέξη, όταν παρέχουμε στην είσοδο τις προηγούμενες λέξεις μιας φράσης. Κατά τη διαδικασία της εκπαίδευσης, τα δισεκατομμύρια παραμέτρων που περιγράφουν το μοντέλο, αλλάζουν τιμές έτσι ώστε η πιθανότητα που αντιστοιχεί στη σωστή λέξη, αυτή που θα έπρεπε να προβλέψουμε ως την επόμενη λέξη μιας φράσης, να μεγιστοποιείται. Οι πιθανότητες αυτές προκύπτουν υπολογίζοντας «ομοιότητες» χρήσης των λέξεων στο πλαίσιο των συμφραζομένων σε κάθε φράση. Τα μοντέλα αυτά μαθαίνουν, δηλαδή, ομοιότητες μέσα από τη χρήση της γλώσσας που εκμαιεύεται από τα εκατομμύρια κειμένων. Ταυτόχρονα, με το να μαθαίνουν να προβλέπουν την επόμενη λέξη, έμμεσα μαθαίνουν και τους κανόνες χρήσης της γλώσσας. Κάτι αντίστοιχο με το πώς μαθαίνει ο άνθρωπος από την εμπειρία. Με άλλα λόγια, τα μοντέλα αυτά μαθαίνουν τα «παιχνίδια της γλώσσας», όπως τα ονόμασε ο Βιτγκενστάιν. Το παιχνίδι της γλώσσας, από εννοιολογικό, μετατρέπεται σ’ ένα παιχνίδι υπολογισμού ομοιοτήτων και αντίστοιχων πιθανοτήτων.

 Τα γλωσσικά μοντέλα γεννούν «ιστορίες» παίζοντας τα παιχνίδια ομοιότητας που έχουν μάθει. Σε αυτές τις ιστορίες, τον κυρίαρχο ρόλο έχουν οι πιθανότητες.

Τα βιβλία που δεν έχουν γραφτεί, στην αλληγορία του Μπόρχες, είναι αυτά που, εν δυνάμει, μπορούν να παραγάγουν το γλωσσικό μοντέλο στην έξοδό του. Πληκτρολογώντας μία φράση, το μοντέλο υπολογίζει την πιθανότητα της πρώτης λέξης με βάση τις ομοιότητες που έχει μάθει κατά τη διαδικασία της εκπαίδευσης. «Διψάω, γέμισε το ποτήρι με…», θα προβλέψει «νερό». «Θέλω να μεθύσω, γέμισε το ποτήρι με…». Θα απαντήσει, ας πούμε, «κρασί» ή «μπίρα». Παράγει το κείμενο λέξη λέξη και κάθε φορά μειώνει τον χώρο των πιθανών αναζητήσεων, μέσα από την απειρία των πιθανών άγραφων κειμένων, αποκλείοντας λέξεις μη όμοιες με τις προηγούμενες που έχει ήδη παράγει. Με άλλα λόγια, τα γλωσσικά μοντέλα γεννούν «ιστορίες» παίζοντας τα παιχνίδια ομοιότητας που έχουν μάθει. Σε αυτές τις ιστορίες, τον κυρίαρχο ρόλο έχουν οι πιθανότητες. H αλήθεια ή το ψέμα, η πρόθεση, το συναίσθημα, ο κόσμος –του οποίου η γλώσσα είναι απλά μία μερική εικόνα– δεν παίζουν κανέναν μα κανέναν ρόλο. Οι απαντήσεις είναι απλά αφηγήματα που μπορεί να έχουν ή να μην έχουν σχέση με την πραγματικότητα του κόσμου. Αυτό δεν σημαίνει ότι δεν είναι χρήσιμα. Αντίθετα, είναι πάρα πολύ χρήσιμα.

Η «ευφυΐα» των γλωσσικών μοντέλων και τα προβλήματα

© Freepik

Βέβαια, η γλώσσα δεν είναι απλά χειρισμός συμβόλων, και όταν μιλάμε για ευφυΐα δεν μπορεί παρά να απαιτήσουμε ότι η παραγωγή προτάσεων και κειμένων να συνοδεύεται και από αντίστοιχη κατανόηση. Ένα κύριο χαρακτηριστικό αυτού που αποκαλούμε κατανόηση είναι η δυνατότητα «εξήγησης» μιας πρότασης που διατυπώνεται. Η εξήγηση/ερμηνεία συνίσταται στα πώς και στα γιατί, στις σχέσεις και στις αιτίες που οδήγησαν σε συγκεκριμένο συμπέρασμα/απάντηση. Τα γλωσσικά μοντέλα έχουν εντυπωσιακή ικανότητα να εξηγούν τους λόγους που οδήγησαν σε συγκεκριμένη απάντηση. Η ικανότητά τους αυτή συνιστά ένα τεχνολογικό άλμα, άξιο θαυμασμού και, όντως, είναι ένα ισχυρό χαρακτηριστικό ευφυΐας που πρέπει να αποδώσουμε στις μηχανές αυτές. Πολλοί μιλούν για αναδυόμενες ιδιότητες που πηγάζουν από την πολυπλοκότητα των μοντέλων αυτών.

Τα μοντέλα αυτά δεν έχουν μνήμη και επομένως δεν μπορούν να έχουν «εαυτό»

Μια πιο προσεκτική, όμως, μελέτη αναδεικνύει και μια σειρά προβλημάτων. Οι μηχανές γλωσσικών μοντέλων παρέχουν εξηγήσεις κι αν ακόμα η απάντηση είναι λανθασμένη. Επίσης, οι απαντήσεις και οι εξηγήσεις μπορεί να διαφέρουν μεταξύ τους από αρκετά έως και πολύ, και εξαρτώνται από τον τρόπο που διατυπώνεται το εκάστοτε ερώτημα, έστω κι αν δεν αλλάζει η ουσία του ερωτήματος αλλά μόνο οι λέξεις με τις οποίες αυτό διατυπώνεται. Τα μοντέλα αυτά δεν έχουν μνήμη και επομένως δεν μπορούν να έχουν «εαυτό», όπως ο άνθρωπος, που να εξασφαλίζει μια σχετική συνέχεια και συνέπεια στη συμπεριφορά τους. Το νόημα της ερώτησης δεν παίζει κανέναν ρόλο. Οι εξηγήσεις που παρέχονται αντιστοιχούν στην ιεραρχία ομοιοτήτων και πιθανοτήτων που το μοντέλο υπολόγισε.

Η νοημοσύνη συνίσταται από ένα σύνολο δεξιοτήτων/γνώσεων, αλλά και από την ικανότητα τού να αποκτά νέες δεξιότητες/γνώσεις. Η έλλειψη μνήμης στα γλωσσικά μοντέλα τους στερεί τη δυνατότητα να μάθουν νέα γεγονότα. Με άλλα λόγια, τα μοντέλα αυτά δεν έχουν την ικανότητα να εξελίσσουν σταδιακά και να εμπλουτίζουν τη μνήμη τους με νέες καταστάσεις και πλαίσια γνώσης. Ταυτόχρονα, η έλλειψη μνήμης περιορίζει και την ικανότητα σκέψης που τα μοντέλα αυτά επιδεικνύουν, σε κάποιον βαθμό. Δεν έχουν τη δυνατότητα, από μόνα τους, επανεξέτασης ενός συλλογισμού που οδηγεί σε λάθος απάντηση. Για την ακρίβεια, δεν έχουν τη δυνατότητα, από μόνα τους, να κρίνουν αν κάτι είναι λάθος ή σωστό.

Τα μοντέλα αυτά στερούνται της ικανότητας να προτείνουν νέα προβλήματα, νέες ιδέες, νέους μουσικούς δρόμους έκφρασης και νέα στιλ γραφής

Η άλλη καίρια διάσταση της νοημοσύνης του ανθρώπου είναι η δημιουργικότητα του νου. Η δημιουργικότητα αφορά στην ικανότητα του ανθρώπινου νου να λύνει προβλήματα με έναν νέο και καινοτόμο τρόπο. Τα γλωσσικά μοντέλα δεν έχουν τη δυνατότητα να προτείνουν, από μόνα τους, καινοτόμες ιδέες και λύσεις που απαιτούν ασυνέχεια και άλμα στη σκέψη. Η ασυνέχεια, από τη φύση της, δεν συνάδει με πιθανοτικές προβλέψεις. Το καινοτόμο δεν προβλέπεται. Το πιο σημαντικό, όμως, είναι ότι τα μοντέλα αυτά στερούνται της ικανότητας να προτείνουν νέα προβλήματα, νέες ιδέες, νέους μουσικούς δρόμους έκφρασης και νέα στιλ γραφής. Γιατί όλα αυτά προϋποθέτουν, πέρα από την ικανότητα δημιουργικότητας, να ζει κανείς στον κόσμο. Να εντοπίζει τα προβλήματα, να τα διατυπώνει και να προτείνει λύσεις.

Τα γλωσσικά μοντέλα αντλούν την ευφυΐα τους μέσα από τη γλώσσα. Η νοημοσύνη όμως του ανθρώπου δεν εξαντλείται στη γλώσσα. Τα όρια του κόσμου μας δεν είναι η γλώσσα. Ο κόσμος είναι πολύ πιο πολύπλοκος από αυτόν που μπορούμε να «πούμε», που μπορούμε να «ονοματίσουμε» με τη γλώσσα. Τα συναισθήματα και οι αισθήσεις μας καθορίζουν τι είναι καλό ή κακό, αρχικά βιολογικά και στη συνέχεια κοινωνικά. Ιδεολογίες, πιστεύω, πρότυπα, προθέσεις, επιθυμίες, στόχοι, αξίες, συνδέονται άρρηκτα με την ύπαρξη συναισθημάτων και παίζουν καθοριστικό ρόλο στη νοημοσύνη και τη δημιουργική διαδικασία. Επίσης, σε αντίθεση με τον άνθρωπο, τα μοντέλα αυτά δεν διαθέτουν ένα «μοντέλο του κόσμου». Δεν διαθέτουν, δηλαδή, αυτό που λέγεται κοινή λογική και που σε μεγάλο βαθμό δεν εξαρτάται από τη γλώσσα αλλά την αποκτούμε στα πρώτα χρόνια της παιδικής μας ηλικίας. Δεν διαθέτουν την αίσθηση της βαρύτητας, του χώρου, του χρόνου, των εικόνων, των ήχων, αν και μπορούν να προσομοιάζουν και να χειρίζονται τα αντίστοιχα σύμβολα/λέξεις. Η προσομοίωση, όμως, δεν θα οδηγήσει σε προθέσεις, στόχους και στη συνέχεια στη διατύπωση νέων προβλημάτων που με τη σειρά τους θα ωθήσουν τη νόηση στη δημιουργική φάση λειτουργίας της. Αν πρόκειται να αναπτύξουμε μοντέλα γενικής ΤΝ, αυτά θα πρέπει να έχουν δυνατότητες μάθησης μοντέλων του κόσμου.

Εν κατακλείδι, τα γλωσσικά μοντέλα στερούνται πολύ σημαντικών ικανοτήτων της ανθρώπινης νοημοσύνης. Ο άνθρωπος δεν κινδυνεύει από τα μοντέλα αυτά. Ο κίνδυνος που ελλοχεύει είναι να πάρουμε στα σοβαρά τον ρόλο τους –πολύ περισσότερο από ό,τι αναλογεί σ’ ένα εργαλείο– και να αρχίσουμε να πιστεύουμε και να υιοθετούμε άκριτα τα αφηγήματα που τα μοντέλα αυτά παράγουν. Ο κίνδυνος που ελλοχεύει είναι να αφήσουμε τα παιδιά μας να αφεθούν στις ευκολίες που παρέχει ένα εργαλείο και πολύ περισσότερο να του αποδώσουν, ασύνειδα, ιδιότητες αυθεντίας. Κάτι σαν μια σύγχρονη Πυθία (από το πιθ-ανότητες) που θα ξεδιπλώνει τα άγραφα αφηγήματα του Μπόρχες.