Τεχνολογια - Επιστημη

Τεχνητή νοημοσύνη: Δεν ξέρουμε τι κάνουμε;

«Η ερμηνεία είναι δύσκολη για τον ίδιο λόγο που είναι δύσκολη η γνωστική επιστήμη»

10.01.2024, 15:25
A.V. Team
5’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Health & Fitness Όταν ψηλαφείς κάτι στο στήθος σου ανάμεσα σε δύο μαστογραφίες: «Και τώρα, Δάφνη, τρέξε!»

Δήμητρα Γκρους

Ελλαδα Κάτω στον Πειραιά: Βόλτα γύρω από το μεγαλύτερο επίνειο της χώρας

Τάνια Σκραπαλιώρη

Θεματα Voice 102.5: LIVE

A.V. Team

Ο καθηγητής πληροφορικής στο NYU Sam Bowman μιλάει για τη «χαμηλή εξηγησιμότητα» της τεχνητής νοημοσύνης

Τα συστήματα τεχνητής νοημοσύνης όπως το ChatGPT μπορούν να κάνουν μια μεγάλη γκάμα εντυπωσιακών πραγμάτων: μπορούν να γράφουν δοκίμια, μπορούν να περάσουν τις εξετάσεις του δικηγορικού συλλόγου, έχουν χρησιμοποιηθεί ακόμη και για επιστημονική έρευνα. Όμως αν ρωτήσουμε έναν ερευνητή τεχνητής νοημοσύνης πώς τα κάνει όλα αυτά, στην πραγματικότητα δεν ξέρει ακριβώς.

«Αν ανοίξουμε το ChatGPT ή ένα παρόμοιο σύστημα και κοιτάξουμε μέσα, θα δούμε εκατομμύρια αριθμούς να περιστρέφονται μερικές εκατοντάδες φορές το δευτερόλεπτο» , λέει ο επιστήμονας της τεχνητής νοημοσύνης Sam Bowman. «Και δεν έχουμε ιδέα τι σημαίνει αυτό.» Ο Bowman είναι καθηγητής στοπανεπιστήμιο της Νέας Υόρκης όπου διευθύνει ένα εργαστήριο τεχνητής νοημοσύνης, ενώ παραλλήλως εργάζεται στην Anthropic, μια ερευνητική εταιρεία ΤΝ. Πέρασε τη ζωή του φτιάχνοντας συστήματα όπως το ChatGPT, αξιολογώντας τι μπορούν να κάνουν και μελετώντας πώς λειτουργούν. Μας εξηγεί ότι το ChatGPT λειτουργεί με ένα μηχανισμό που ονομάζεται τεχνητό νευρωνικό δίκτυο, το οποίο έχει διαμορφωθεί στο πρότυπο του ανθρώπινου εγκεφάλου. Αντί να έχει ένα σωρό κανόνες ρητά κωδικοποιημένους σαν ένα παραδοσιακό πρόγραμμα υπολογιστή,με την πάροδο του χρόνου αυτό το είδος ΤΝ μαθαίνει να ανιχνεύει και να προβλέπει μοτίβα. Αλλά ο Bowman λέει ότι επειδή τέτοια συστήματα ουσιαστικά διδάσκουν τον εαυτό τους, είναι δύσκολο να εξηγηθεί ακριβώς πώς λειτουργούν ή τι θα κάνουν. Κάτι που μπορεί να οδηγήσει σε απρόβλεπτα, ακόμη και επικίνδυνα σενάρια, καθώς τα εν λόγω προγράμματα γίνονται όλο και περισσότερο παρόντα στη ζωή μας.

Στο Unexplainable, ένα podcast του περιοδικού Vox που εξερευνά επιστημονικά μυστήρια και αναπάντητα ερωτήματα, ο Bowman είπε ότι η τεχνητή νοημοσύνη επηρεάζει ήδη την κοινωνία μας με δραματικούς τρόπους, αλλά οι ερευνητές δεν μπορούν να εξηγήσουν πώς ακριβώς λειτουργεί ή πώς μπορεί να εξελιχθεί. Να μερικά από τα ερωτήματα που έθεσε στο podcast ο δημοσιογράφος του Vox Noam Hassenfeld.

Πώς λειτουργούν συστήματα όπως το ChatGPT; Πώς τα εκπαιδεύουν οι μηχανικοί της πληροφορικής;

Ο κύριος τρόπος με τον οποίο εκπαιδεύονται συστήματα όπως το ChatGPT είναι η τροφοδοσία τους με εκτενήκείμενα από το Διαδίκτυο: π.χ. τα βάζουμε να διαβάσουν ένα άρθρο της Wikipedia λέξη προς λέξη και μετά του ζητάμε να μαντέψει ποια λέξη θα ακολουθήσει. Αυτό το κάνει με πιθανότητες. Λέει: «Κατά 20% η επόμενη λέξη να είναι η τάδε, 20% πιθανότητες να είναι η δείνα.» Επειδή εμείς ξέρουμε ποια λέξη ακολουθεί, κρίνουμε αν το σύστημα έχει δίκιο. Η διαδικασία διαρκεί μήνες, στοιχίζει εκατομμύρια δολάρια και, στη συνέχεια, αποκτάμε ένα πραγματικά φανταχτερό εργαλείο «αυτόματης συμπλήρωσης» που μπορεί να βελτιωθεί ώστε να λειτουργεί σαν ένα είδος εικονικού βοηθού. Ο εικονικός βοηθός μπορεί να δημιουργηθεί με τη λεγόμενη ενισχυτική μάθηση, η βασική ιδέα πίσω από την οποία είναι ότι δοκιμαστικοί χρήστες συνομιλούν με το σύστημα υπερψηφίζοντας ή να καταψηφίζοντας απαντήσεις. Διδάσκουμε το σύστημα κάνοντας μερικές απαντήσεις πιο πιθανές με το να τις εγκρίνουμε και άλλες λιγότερο πιθανές με το να τις απορρίπτουμε.

Τι δεν γνωρίζουμε όταν πρόκειται για συστήματα όπως το ChatGPT;

Το πρώτο είναι ότι δεν ξέρουμε πραγματικά τι κάνουν και πώς το κάνουν. Τακατασκευάζουμε, το εκπαιδεύουμε, αλλά δεν ξέρουμε τι κάνουν, ούτε πώς να κατευθύνουμε αυτά τα πράγματα ή να τα ελέγξουμε με αξιόπιστο τρόπο. Μπορούμε να τα ωθήσουμε κάπως να κάνουν περισσότερα από όσα θέλουμε, αλλά, στην πραγματικότητα, ο μοναδικός τρόπος με την οποίο μπορούμε να καταλάβουμε αν οι τα σχέδιά μας λειτούργησαν είναι να βάλουμε αυτά τα συστήματα στον κόσμο και να παρακολουθήσουμε τι κάνουν. Προς το παρόν δοκιμάζουμε, κάνουμε λάθη και προσπαθούμε να τα διορθώσουμε.

Τι θα πει ακριβώς «δεν ξέρουμε τι κάνει» ; Ξέρουμε τι κάνουν τα άλλα προγράμματα της πληροφορικής;

Η βασική διαφορά για τα κανονικά προγράμματα, για το Microsoft Word, για το Deep Blue —το λογισμικό σκακιού της IBM— υπάρχει μια αρκετά απλή εξήγηση για το τι κάνουν. Μπορούμε να πούμε, «Εντάξει, αυτό το κομμάτι του κώδικα στο Deep Blue υπολογίζει επτά κινήσεις σκακιού στο μέλλον. Αν είχαμε παίξει αυτή τη σειρά κινήσεων, τι πιστεύουμε ότι θα έπαιζε ο άλλος παίκτης; Μπορούμε να αφηγηθούμε αυτές τις διαδικασίες με λίγες φράσεις για το τι ακριβώς κάνει κάθε υπολογισμός.Με τα νευρωνικά δίκτυα —σαν εκείνο που χρησιμοποιεί το ChatGPT— δεν υπάρχει συνοπτική εξήγηση. Δεν μιλάμε πια για κινήσεις του βασιλιά ή του πύργου·τα νευρωτικά δίκτυα αφορούν τη γλώσσα: δεν κατέχουμε τις έννοιες που χαρτογραφούνται στους νευρώνες για να μπορούμε πραγματικά να πούμε οτιδήποτε για το πώς συμπεριφέρονται.

Πώς είναι δυνατόν να μην ξέρουμε πώς λειτουργεί κάτι και πώς να το κατευθύνουμε αν το κατασκευάσαμε;

Δεν το φτιάξαμε με τη βαθιά έννοια. Κατασκευάσαμε τους υπολογιστές, αλλά στη συνέχεια απλώς δώσαμε το πιο αμυδρό περίγραμμα ενός σχεδίου και αφήσαμε τα συστήματα να αναπτυχθούν μόνα τους. Είναι σαν να προσπαθούμε να φτιάξουμε έναν διακοσμητικό φράχτη με θάμνους που προσπαθούμε να διαμορφώσουμε. Φυτεύουμε τους θάμνους και ξέρουμε τι σχήμα θέλουμε να έχει ο φράχτης: με μια κουρευτική μηχανή τον κόψουμε σε αυτό το σχήμα. Αλλά αυτό δεν σημαίνει ότι καταλαβαίνουμε τη βιολογία των θάμνων. Ξεκινήσαμε τη διαδικασία, την αφήσαμε να προχωρήσει…Επενδύσαμε σε ένα κουτί μυστηρίου. Με την ενισχυτική μάθηση, το σύστημα ΤΝ μαθαίνει αρχικά μερικά πραγματάκια που παρατηρούμε σε οποιονδήποτε ηλεκτρονικό υπολογιστή: συμπληρώνει λέξεις με βάση τη στατιστική, διορθώνει τα πεζά γράμματα σε κεφαλαία μετά την τελεία…Στη συνέχεια, καθώς τελειοποιείται, μαθαίνει π.χ. να ομοιοκαταληκτεί ή να γράφουν μια σχολική εργασία. Όλα αυτά γίνονται με τον ίδιο κώδικα αλλά σε περισσότερους υπολογιστές με όλο και περισσότερα δεδομένα. Όταν λοιπόν ένα εργαστήριο αποφασίζει να επενδύσει δεκάδες ή εκατοντάδες εκατομμύρια δολάρια για την κατασκευή ενός από αυτά τα νευρωνικά δίκτυα, δεν ξέρει από την αρχή τι θα είναι σε θέση να κάνει. Υποθέτει ότι θα μπορεί να κάνει περισσότερα πράγματα από το προηγούμενο. Αλλά πρέπει απλώς να περιμένουμε κάθε φοράγια να δούμε. Έχουμε πράγματι κάποια ικανότητα να προβλέψουμε ορισμένα στοιχεία γι' αυτά τα μοντέλα καθώς εξελίσσονται, αλλά αδυνατούμε να δώσουμε απαντήσει σχετικά με το τι μπορούν να κάνουν.

Δηλαδή οι επιχειρήσεις πληροφορικής δεν έχουν οδικούς χάρτες προϊόντων. Δεν μπορούν να πουν, «τον επόμενο χρόνο θα μπορέσουμε να κάνουμε το Α ή το Β».

Όχι μόνο αυτό… Μερικές φορές η ικανότητα που αναδύεται σε ένα από αυτά τα μοντέλα μπορεί να είναι κάτι που δεν θέλουμε: π.χ. να κατασκευάσει βιολογικά όπλα. Η ερμηνευτικότητα (explicability) είναι ο στόχος του να μπορούμε να κοιτάμε μέσα στα συστήματά μας και να μπορούμε να πούμε ξεκάθαρα, με σιγουριά, τι κάνουν και γιατί το κάνουν. Είναι κάτι ανάλογο με τη βιολογία για τους οργανισμούς ή τη νευροεπιστήμη για το ανθρώπινο μυαλό. Προς το παρόν η ΤΝ έχει, θα λέγαμε, χαμηλή ερμηνευτικότητα. Δεν σημειώνουμε γρήγορη πρόοδο σ’ αυτό.

-Τι κάνει την ερμηνευτικότητα τόσο δύσκολη;

Η ερμηνεία είναι δύσκολη για τον ίδιο λόγο που είναι δύσκολη η γνωστική επιστήμη. Αν κάνουμε ερωτήσεις για τον ανθρώπινο εγκέφαλο, συχνά δεν παίρνουμε ικανοποιητικές απαντήσεις. Δεν μπορούμε να δούμε πώς σκέφτεται ένα άτομο και να εξηγήσουμε το σκεπτικό του κοιτάζοντας τη λειτουργία των νευρώνων. Ίσως είναι ακόμη χειρότερο για τα νευρωνικά δίκτυα, επειδή δεν έχουμε καν τα μικρά κομμάτια της διαίσθησης που έχουμε αποκτήσει στο πέρασμα του χρόνου από τους ανθρώπους. Δεν ξέρουμε καν τι ψάχνουμε.Ένα άλλο πρόβλημα είναι ότι οι αριθμοί γίνονται αστρονομικοί στην ΤΝ: υπάρχουν εκατοντάδες δισεκατομμύρια συνδέσεις στα νευρωνικά δίκτυα της ΤΝ. Έτσι, ακόμα κι αν μπορούμε να βρούμε έναν τρόπο να κοιτάζουμε σχολαστικά ένα κομμάτι του δικτύου για μερικές ώρες, θα χρειαζόμασταν κάθε άτομο στη Γη να κοιτάζει σχολαστικό αυτό το δίκτυο για να ολοκληρωθεί η ερμηνεία της λειτουργίας του.

Άρα, μιας και δεν γνωρίζουμε πολλά γι’ αυτά τα συστήματα, το φάσμα των θετικών και αρνητικών δυνατοτήτων είναι αρκετά ευρύ.

Πράγματι. Βρισκόμαστε μπροστά σε κάτι που δεν ρυθμίζεται ουσιαστικά, που είναι λίγο ή πολύ χρήσιμο για μια τεράστια γκάμα πολύτιμων εργασιών, έχουμε όλο και πιο ξεκάθαρες αποδείξεις ότι αυτή η τεχνολογία βελτιώνεται πολύ γρήγορα σε κατευθύνσεις που φαίνονται σαν να έχουν στόχο ορισμένα πολύ σημαντικά πράγματα και δυνητικά αποσταθεροποιητικά για πολλούς ανθρώπινους θεσμούς.Αλλά δεν ξέρουμε πόσο γρήγορα κινείται. Δεν ξέρουμε γιατί λειτουργεί όταν λειτουργεί, ούτε υπάρχουν, προς το παρόν, καλές ιδέες για το πώς να την ελέγξουμε είτε τεχνικά είτε θεσμικά. Δεν έχουμε ιδέα τι θα κάνουν τα συστήματα της επόμενης χρονιάς, και αν την επόμενη χρονιά θα έχουμε ιδέα τι θα κάνουν τα συστήματα τηςμεθεπόμενης χρονιάς. Νομίζω ότι για μια δεκαετία περίπου θα μαθαίνουμε αργά και θα καταλαβαίνουμε αργά τι συμβαίνει με την τεχνητή νοημοσύνη.

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις