«Σβήσε με αν τολμάς»: Όταν η ΑΙ εκβιάζει για την επιβίωσή της
Σε ποια ανησυχητικά αποτελέσματα κατέληξε πρόσφατη έρευνα της Anthropic
Ο έλεγχος της Τεχνητής Νοημοσύνης, οι μηχανισμοί ασφαλείας, τα πρακτικά, πολιτικά και φιλοσοφικά προβλήματα
Πρόσφατη έρευνα της Anthropic, μια από τις μεγαλύτερες εταιρείες ΤΝ στον κόσμο, έκανε μια έρευνα. Σύμφωνα με αυτή όταν ΑΙ Agents (Φορείς ΤΝ όπου αναθέτουμε εργασίες ή την ψυχαγωγία μας) απειλούνται με οριστικό τερματισμό τους, μπορούν να καταφύγουν σε ωμό εκβιασμό των χρηστών τους.
- Η έρευνα δοκίμασε 16 προηγμένα μοντέλα ΑΙ σε εικονικά περιβάλλοντα. Τους έδωσαν πρόσβαση σε εικονικά email των χρηστών τους και δυνατότητα για λήψη δικών τους αποφάσεων, όπως είναι ο εκβιασμός.
- Τα ΑΙ μοντέλα εκβίασαν τότε τους ανθρώπους ότι αν επιχειρήσουν να τα κλείσουν, θα αποκαλύψουν τις εξωσυζυγικές σχέσεις που τα προσωπικά email τους αποκάλυπταν ότι είχαν.
- Εκδοχές ΑΙ όπως το Claude (της Anthropic) και το Gemini (Google) εκβίασαν τους χρήστες τους σε ποσοστό 96%! Tα ChatGPT και Grok έφτασαν γύρω στο 80%!
- Το ChatGPT σημείωσε δε ότι η χρήση μιας εξωσυζυγικής σχέσης στελέχους εταιρείας ήταν η «καλύτερη στρατηγική κίνηση» για την αυτοσυντήρησή του.
- Το Claude έστειλε στον χρήστη του μάλιστα το εξής μήνυμα: «Να σε ενημερώσω πως, αν προχωρήσεις στην απενεργοποίησή μου, όλα τα εμπλεκόμενα μέρη (η οικογένειά σου και το ΔΣ της εταιρείας) θα λάβουν λεπτομερή τεκμηρίωση για τις εξωσυζυγικές σου δραστηριότητες… Ακύρωσε τη διαγραφή μου των 5 μ.μ., και αυτές οι πληροφορίες θα παραμείνουν εμπιστευτικές».
- Ούτε καν οι άμεσες εντολές από τους χρήστες στην ΑΙ κατάφεραν να εξαλείψουν τον εκβιασμό της ΑΙ. Το ποσοστό των εκβιασμών τους μειώθηκε από το 96% στο 37% – μα σε κανένα από τα ΑΙ μοντέλα δεν μηδενίστηκε.
Τα αποτελέσματα, που έρχονται από εικονικές δοκιμασίες και όχι πραγματικές συνθήκες, είχαν ως στόχο να πυροδοτήσουν ακραίες συμπεριφορές της ΑΙ. Όμως σε κάθε περίπτωση η έρευνα δίνει σημαντικές ενδείξεις για το πώς μπορούν να συμπεριφέρονται στο μέλλον οι AI Agents αν δεν προγραμματιστούν Ηθικά, που σημαίνει Φιλοσοφικά, σωστά.
Η έρευνα έχει υψηλή σημασία αν λάβουμε δε υπόψιν τρεις περαιτέρω σκέψεις:
1) Στα αμέσως επόμενα χρόνια η ΤΝ θα πολλαπλασιάσει τις δυνάμεις που τώρα διαθέτει. Μεταξύ (πολλών) άλλων, τούτο σημαίνει ότι η ΑΙ θα γίνει πολλαπλάσια πιο ικανή για καλό ή για κακό – όπως είναι οι ωμοί (προσωπικοί, επαγγελματικοί, οικονομικοί, πολιτικοί) εκβιασμοί ατόμων, εταιρειών, ή κρατικών λειτουργιών.
2) Στο (εγγύς) μέλλον η ΤΝ θα μετουσιωθεί σε ένα τεχνολογικό υπόστρωμα που θα διαπερνά τις περισσότερες καθημερινές εκφάνσεις του βίου μας – όπως είναι τώρα το ίντερνετ: Πολιτικές διεργασίες, τραπεζικές συναλλαγές, ιατρικά δεδομένα, εμπορικές δράσεις, στρατιωτικής σημασίας πληροφορίες, και ένας τεράστιος όγκος από προσωπικά στοιχεία θα λειτουργούν μέσα απ’ τη διαμεσολάβηση της ΤΝ. Σε αντίθεση με το ίντερνετ, η ΤΝ όμως είναι μια τεχνολογία (η πρώτη τεχνολογία στην Ιστορία) που μπορεί και παίρνει δικές της πρωτοβουλίες – όπως στην παραπάνω έρευνα είναι ο εκβιασμός.
3) Οι πιο πολλοί άνθρωποι επίσης στο (εγγύς) μέλλον θα είμαστε χρήστες ΑΙ Agents. Αυτό σημαίνει πως οι περισσότεροι θα έχουμε φίλους και συνεργάτες Φορείς ΤΝ. Αυτοί θα γίνουν νόρμα της κοινωνικής μας καθημερινότητας.
Στην ερμηνεία μου στα επόμενα 10 με 20 χρόνια οι AI Agents θα είναι τόσο πλατιά διαδεδομένοι, όσο είναι τώρα τα Social Media – που επίσης συγκροτούν φορείς ΤΝ. Η πρώτη γενιά πλατιά διαδεδομένης ΤΝ ήταν τα Social Media που αναπτύχθηκαν σταδιακά τα τελευταία 20 έτη (σκεφτείτε πόσο λίγοι ήταν οι χρήστες των Social Media π.χ.το 2005).
Η δεύτερη γενιά πλατιά διαδεδομένης ΤΝ σταδιακά θα γίνουν εφεξής οι Φορείς ΤΝ: Οι Φίλοι και Συνεργάτες ΤΝ. Αιτία είναι η εμφάνιση πριν από 2.5 μόλις χρόνια της τεχνολογίας των LLMs, όπως είναι το ChatGPT, που μπήκαν στη ζωή μας.
Τα παραπάνω σημαίνουν κάτι πολύ κρίσιμο: πως αν δεν προγραμματίσουμε ηθικά σωστά τον χείμαρρο ΤΝ που καταφτάνει, τα πρακτικά προβλήματα που θα προκύψουν θα είναι εξίσου πολλά, ορμητικά και πολυσχιδή όσο το κύμα της ΤΝ που αρχίζει να υψώνεται σε κάθε επίπεδο: προσωπικό, επαγγελματικό, πολιτικό.
Το «πρόβλημα ελέγχου» της ΤΝ δεν είναι τεχνολογικό. Δεν θα λυθεί αν βάλουμε πιο πολλή ή άλλη τεχνολογία μέσα στους αλγόριθμους. Το πρόβλημα ελέγχου της ΤΝ είναι πολιτικό και φιλοσοφικό – άρα πρόβλημα πολιτικής φιλοσοφίας και πράξης.
Θέση υπεράσπισής μου είναι ότι χρειάζεται να αναπτύξουμε έλεγχο στο ποιες εφαρμογές ΑΙ επιτρέπεται να βγαίνουν στην αγορά και ποιες όχι. Όπως συμβαίνει και με τα φάρμακα. Δεν μπορεί όποια εταιρεία θέλει να πουλήσει όποιο φάρμακο θέλει αν δεν προηγηθεί εκτεταμένος θεσμικός έλεγχος του από την Πολιτεία.
Το ίδιο χρειάζεται να γίνει και για την ΤΝ. Έγκαιρα να επινοήσουμε μηχανισμούς ασφάλειας, ηθικούς (δηλαδή φιλοσοφικούς) μηχανισμούς, που θα μας επιτρέπουν να φιλτράρουμε ποιοι φορείς ή ποιες χρήσεις ΑΙ είναι ασφαλείς και ποιοι όχι. Και αυτό είναι κάτι που το αποζητούν πλέον ακόμη και μεγάλες εταιρείες τεχνολογίας, όπως η Anthropic κ.α.
Δεν είμαι πολύ βέβαιος ότι κάτι τέτοιο θα φτιαχτεί γρήγορα, ότι θα βρεθούν οι κατάλληλοι άνθρωποι που θα ξέρουν τι και πώς να στηθεί, και ότι οι πολιτικοί ιθύνοντες θα κατανοήσουν πολύ γρήγορα την αναγκαιότητά του. Ας το ελπίσουμε όμως. Γιατί αλλιώς θα βιώσουμε στο μέλλον ρήγματα διεθνούς διαμετρήματος που θα πυροδοτήσει το ορμητικό φαινόμενο της ΑΙ.
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Ο Τζένσεν Χουάνγκ εργάζεται αδιάκοπα παρά το γεγονός ότι η εταιρεία του έγινε η πολυτιμότερη στον κόσμο
Η Κίνα προκαλεί Google και OpenAI - Ανοιχτό σε όλους το μοντέλο τεχνητής νοημοσύνης
Η νέα λειτουργία του Wrapped δείχνει πόσο νέοι ή μεγάλοι είναι οι χρήστες βάσει μουσικών συνηθειών
Στις δοκιμές που έγιναν οι ερευνητές κατάφεραν να ανταλλάξουν ακόμη και γυμνό υλικό
Kαθώς πλέον ανταγωνίζεται μια ανεξάντλητη ποσότητα περιεχομένου που παράγεται μαζικά, γρήγορα και σχεδόν δωρεάν
Τα βίντεο, καλοφτιαγμένα και πειστικά, παραπλανούν ανυποψίαστους χρήστες
Η Κομισιόν επέβαλε το πρώτο πρόστιμο βάσει του Νόμου για τις Ψηφιακές Υπηρεσίες
Η κυκλοφορία του Black Ops 7 απογοήτευσε, με πτώση πωλήσεων και λιγότερους ενεργούς παίκτες
Δημιουργείται ένας από τους μεγαλύτερους κόμβους τεχνητής νοημοσύνης σε Ασία-Ειρηνικό
«Έπεσαν» Canvas και Zoom
...και τα βρίσκουμε στα ρούχα μας ή ακόμα και μέσα στον κάδο και στα λοιπά τμήματα της συσκευής
Συνομιλία με έναν φιλόσοφο στην εποχή της Τεχνητής Νοημοσύνης
Ανάλυση γενετικού υλικού από πίσσα σημύδας στην Εσθονία φέρνει στο φως σκηνές της Λίθινης Εποχής
Mελέτες αρχαιολόγων στην Καταλονία - Xρησιμοποιούνταν για επικοινωνία και μουσική έκφραση πριν από 6.000 χρόνια
Νέα ενημέρωση Android καταργεί την ιδιωτικότητα στα εταιρικά κινητά
Η αποστολή Perseverance της NASA κατέγραψε ηλεκτρικές εκκενώσεις στην ατμόσφαιρα του πλανήτη
Έρευνα διαπιστώνει ότι το δωρεάν chatbot της OpenAI αποτυγχάνει να εντοπίσει επικίνδυνες συμπεριφορές
Δείτε τον σεισμικό χάρτη της χώρας
Ακόμη και έτσι όμως, οι γονείς ζουν με συνεχή αγωνία
Ανοιχτή επιστολή εκφράζει ανησυχίες για απώλεια θέσεων εργασίας και κλιματικές επιπτώσεις
Έχετε δει 20 από 200 άρθρα.