Τεχνολογια - Επιστημη

«Σβήσε με αν τολμάς»: Όταν η ΑΙ εκβιάζει για την επιβίωσή της

Σε ποια ανησυχητικά αποτελέσματα κατέληξε πρόσφατη έρευνα της Anthropic

08.07.2025, 18:54
Γιώργος Χατζηβασιλείου
3’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Μουσικη Η Athens Voice γιορτάζει την Παγκόσμια Ημέρα Μουσικής με τον D3LTA στο Θησείο

A.V. Team

More in Culture Celeste Lecesne: ‘Εχουμε μόνο ο ένας τον άλλο – αλλιώς χαθήκαμε!

Χριστίνα Γαλανοπούλου

Ο street artist Σωτήρης Φωκέας aka Soteur

More in Culture Soteur: Ο street artist που δίνει χρώμα στο χάος της Αθήνας

Κωνσταντίνα Βουλγαρέλη

Ο έλεγχος της Τεχνητής Νοημοσύνης, οι μηχανισμοί ασφαλείας, τα πρακτικά, πολιτικά και φιλοσοφικά προβλήματα

Πρόσφατη έρευνα της Anthropic, μια από τις μεγαλύτερες εταιρείες ΤΝ στον κόσμο, έκανε μια έρευνα. Σύμφωνα με αυτή όταν ΑΙ Agents (Φορείς ΤΝ όπου αναθέτουμε εργασίες ή την ψυχαγωγία μας) απειλούνται με οριστικό τερματισμό τους, μπορούν να καταφύγουν σε ωμό εκβιασμό των χρηστών τους.

Η έρευνα δοκίμασε 16 προηγμένα μοντέλα ΑΙ σε εικονικά περιβάλλοντα. Τους έδωσαν πρόσβαση σε εικονικά email των χρηστών τους και δυνατότητα για λήψη δικών τους αποφάσεων, όπως είναι ο εκβιασμός.
Τα ΑΙ μοντέλα εκβίασαν τότε τους ανθρώπους ότι αν επιχειρήσουν να τα κλείσουν, θα αποκαλύψουν τις εξωσυζυγικές σχέσεις που τα προσωπικά email τους αποκάλυπταν ότι είχαν.
Εκδοχές ΑΙ όπως το Claude (της Anthropic) και το Gemini (Google) εκβίασαν τους χρήστες τους σε ποσοστό 96%! Tα ChatGPT και Grok έφτασαν γύρω στο 80%!
Το ChatGPT σημείωσε δε ότι η χρήση μιας εξωσυζυγικής σχέσης στελέχους εταιρείας ήταν η «καλύτερη στρατηγική κίνηση» για την αυτοσυντήρησή του.
Το Claude έστειλε στον χρήστη του μάλιστα το εξής μήνυμα: «Να σε ενημερώσω πως, αν προχωρήσεις στην απενεργοποίησή μου, όλα τα εμπλεκόμενα μέρη (η οικογένειά σου και το ΔΣ της εταιρείας) θα λάβουν λεπτομερή τεκμηρίωση για τις εξωσυζυγικές σου δραστηριότητες… Ακύρωσε τη διαγραφή μου των 5 μ.μ., και αυτές οι πληροφορίες θα παραμείνουν εμπιστευτικές».
Ούτε καν οι άμεσες εντολές από τους χρήστες στην ΑΙ κατάφεραν να εξαλείψουν τον εκβιασμό της ΑΙ. Το ποσοστό των εκβιασμών τους μειώθηκε από το 96% στο 37% – μα σε κανένα από τα ΑΙ μοντέλα δεν μηδενίστηκε.

Τα αποτελέσματα, που έρχονται από εικονικές δοκιμασίες και όχι πραγματικές συνθήκες, είχαν ως στόχο να πυροδοτήσουν ακραίες συμπεριφορές της ΑΙ. Όμως σε κάθε περίπτωση η έρευνα δίνει σημαντικές ενδείξεις για το πώς μπορούν να συμπεριφέρονται στο μέλλον οι AI Agents αν δεν προγραμματιστούν Ηθικά, που σημαίνει Φιλοσοφικά, σωστά.

Η έρευνα έχει υψηλή σημασία αν λάβουμε δε υπόψιν τρεις περαιτέρω σκέψεις:

1) Στα αμέσως επόμενα χρόνια η ΤΝ θα πολλαπλασιάσει τις δυνάμεις που τώρα διαθέτει. Μεταξύ (πολλών) άλλων, τούτο σημαίνει ότι η ΑΙ θα γίνει πολλαπλάσια πιο ικανή για καλό ή για κακό – όπως είναι οι ωμοί (προσωπικοί, επαγγελματικοί, οικονομικοί, πολιτικοί) εκβιασμοί ατόμων, εταιρειών, ή κρατικών λειτουργιών.

2) Στο (εγγύς) μέλλον η ΤΝ θα μετουσιωθεί σε ένα τεχνολογικό υπόστρωμα που θα διαπερνά τις περισσότερες καθημερινές εκφάνσεις του βίου μας – όπως είναι τώρα το ίντερνετ: Πολιτικές διεργασίες, τραπεζικές συναλλαγές, ιατρικά δεδομένα, εμπορικές δράσεις, στρατιωτικής σημασίας πληροφορίες, και ένας τεράστιος όγκος από προσωπικά στοιχεία θα λειτουργούν μέσα απ’ τη διαμεσολάβηση της ΤΝ. Σε αντίθεση με το ίντερνετ, η ΤΝ όμως είναι μια τεχνολογία (η πρώτη τεχνολογία στην Ιστορία) που μπορεί και παίρνει δικές της πρωτοβουλίες – όπως στην παραπάνω έρευνα είναι ο εκβιασμός.

3) Οι πιο πολλοί άνθρωποι επίσης στο (εγγύς) μέλλον θα είμαστε χρήστες ΑΙ Agents. Αυτό σημαίνει πως οι περισσότεροι θα έχουμε φίλους και συνεργάτες Φορείς ΤΝ. Αυτοί θα γίνουν νόρμα της κοινωνικής μας καθημερινότητας.

Στην ερμηνεία μου στα επόμενα 10 με 20 χρόνια οι AI Agents θα είναι τόσο πλατιά διαδεδομένοι, όσο είναι τώρα τα Social Media – που επίσης συγκροτούν φορείς ΤΝ. Η πρώτη γενιά πλατιά διαδεδομένης ΤΝ ήταν τα Social Media που αναπτύχθηκαν σταδιακά τα τελευταία 20 έτη (σκεφτείτε πόσο λίγοι ήταν οι χρήστες των Social Media π.χ.το 2005).

Η δεύτερη γενιά πλατιά διαδεδομένης ΤΝ σταδιακά θα γίνουν εφεξής οι Φορείς ΤΝ: Οι Φίλοι και Συνεργάτες ΤΝ. Αιτία είναι η εμφάνιση πριν από 2.5 μόλις χρόνια της τεχνολογίας των LLMs, όπως είναι το ChatGPT, που μπήκαν στη ζωή μας.

Τα παραπάνω σημαίνουν κάτι πολύ κρίσιμο: πως αν δεν προγραμματίσουμε ηθικά σωστά τον χείμαρρο ΤΝ που καταφτάνει, τα πρακτικά προβλήματα που θα προκύψουν θα είναι εξίσου πολλά, ορμητικά και πολυσχιδή όσο το κύμα της ΤΝ που αρχίζει να υψώνεται σε κάθε επίπεδο: προσωπικό, επαγγελματικό, πολιτικό.

Το «πρόβλημα ελέγχου» της ΤΝ δεν είναι τεχνολογικό. Δεν θα λυθεί αν βάλουμε πιο πολλή ή άλλη τεχνολογία μέσα στους αλγόριθμους. Το πρόβλημα ελέγχου της ΤΝ είναι πολιτικό και φιλοσοφικό – άρα πρόβλημα πολιτικής φιλοσοφίας και πράξης.

Θέση υπεράσπισής μου είναι ότι χρειάζεται να αναπτύξουμε έλεγχο στο ποιες εφαρμογές ΑΙ επιτρέπεται να βγαίνουν στην αγορά και ποιες όχι. Όπως συμβαίνει και με τα φάρμακα. Δεν μπορεί όποια εταιρεία θέλει να πουλήσει όποιο φάρμακο θέλει αν δεν προηγηθεί εκτεταμένος θεσμικός έλεγχος του από την Πολιτεία.

Το ίδιο χρειάζεται να γίνει και για την ΤΝ. Έγκαιρα να επινοήσουμε μηχανισμούς ασφάλειας, ηθικούς (δηλαδή φιλοσοφικούς) μηχανισμούς, που θα μας επιτρέπουν να φιλτράρουμε ποιοι φορείς ή ποιες χρήσεις ΑΙ είναι ασφαλείς και ποιοι όχι. Και αυτό είναι κάτι που το αποζητούν πλέον ακόμη και μεγάλες εταιρείες τεχνολογίας, όπως η Anthropic κ.α.

Δεν είμαι πολύ βέβαιος ότι κάτι τέτοιο θα φτιαχτεί γρήγορα, ότι θα βρεθούν οι κατάλληλοι άνθρωποι που θα ξέρουν τι και πώς να στηθεί, και ότι οι πολιτικοί ιθύνοντες θα κατανοήσουν πολύ γρήγορα την αναγκαιότητά του. Ας το ελπίσουμε όμως. Γιατί αλλιώς θα βιώσουμε στο μέλλον ρήγματα διεθνούς διαμετρήματος που θα πυροδοτήσει το ορμητικό φαινόμενο της ΑΙ.

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις