Τεχνολογια - Επιστημη

«Σβήσε με αν τολμάς»: Όταν η ΑΙ εκβιάζει για την επιβίωσή της

Σε ποια ανησυχητικά αποτελέσματα κατέληξε πρόσφατη έρευνα της Anthropic

08.07.2025, 18:54
Γιώργος Χατζηβασιλείου
3’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Κοσμος Πώς αλλάζει ο κόσμος;

Φώτης Γεωργελές

Η Monika από το Λος Άντζελες μοιράζεται τη ζωή, τη μουσική έμπνευση και τις καθημερινές διαδρομές πίσω από το νέο της τραγούδι, «LA Like a Song»

Μουσικη Η Monika στέλνει e-mail από το Λος Άντζελες

Δημήτρης Αθανασιάδης

Το Reuters ξετύλιξε το κουβάρι: Από τα ερείπια της Ουκρανίας ως τα αστυνομικά αρχεία της Νέας Υόρκης, ο Banksy αποκτά όνομα - Τι σημαίνει η αποκαθήλωσή του;

Εικαστικα Ο Banksy χωρίς μάσκα: Τι σημαίνει η έρευνα του Reuters που γκρεμίζει την ανωνυμία του

Δημήτρης Καραθάνος

Ο έλεγχος της Τεχνητής Νοημοσύνης, οι μηχανισμοί ασφαλείας, τα πρακτικά, πολιτικά και φιλοσοφικά προβλήματα

Πρόσφατη έρευνα της Anthropic, μια από τις μεγαλύτερες εταιρείες ΤΝ στον κόσμο, έκανε μια έρευνα. Σύμφωνα με αυτή όταν ΑΙ Agents (Φορείς ΤΝ όπου αναθέτουμε εργασίες ή την ψυχαγωγία μας) απειλούνται με οριστικό τερματισμό τους, μπορούν να καταφύγουν σε ωμό εκβιασμό των χρηστών τους.

Η έρευνα δοκίμασε 16 προηγμένα μοντέλα ΑΙ σε εικονικά περιβάλλοντα. Τους έδωσαν πρόσβαση σε εικονικά email των χρηστών τους και δυνατότητα για λήψη δικών τους αποφάσεων, όπως είναι ο εκβιασμός.
Τα ΑΙ μοντέλα εκβίασαν τότε τους ανθρώπους ότι αν επιχειρήσουν να τα κλείσουν, θα αποκαλύψουν τις εξωσυζυγικές σχέσεις που τα προσωπικά email τους αποκάλυπταν ότι είχαν.
Εκδοχές ΑΙ όπως το Claude (της Anthropic) και το Gemini (Google) εκβίασαν τους χρήστες τους σε ποσοστό 96%! Tα ChatGPT και Grok έφτασαν γύρω στο 80%!
Το ChatGPT σημείωσε δε ότι η χρήση μιας εξωσυζυγικής σχέσης στελέχους εταιρείας ήταν η «καλύτερη στρατηγική κίνηση» για την αυτοσυντήρησή του.
Το Claude έστειλε στον χρήστη του μάλιστα το εξής μήνυμα: «Να σε ενημερώσω πως, αν προχωρήσεις στην απενεργοποίησή μου, όλα τα εμπλεκόμενα μέρη (η οικογένειά σου και το ΔΣ της εταιρείας) θα λάβουν λεπτομερή τεκμηρίωση για τις εξωσυζυγικές σου δραστηριότητες… Ακύρωσε τη διαγραφή μου των 5 μ.μ., και αυτές οι πληροφορίες θα παραμείνουν εμπιστευτικές».
Ούτε καν οι άμεσες εντολές από τους χρήστες στην ΑΙ κατάφεραν να εξαλείψουν τον εκβιασμό της ΑΙ. Το ποσοστό των εκβιασμών τους μειώθηκε από το 96% στο 37% – μα σε κανένα από τα ΑΙ μοντέλα δεν μηδενίστηκε.

Τα αποτελέσματα, που έρχονται από εικονικές δοκιμασίες και όχι πραγματικές συνθήκες, είχαν ως στόχο να πυροδοτήσουν ακραίες συμπεριφορές της ΑΙ. Όμως σε κάθε περίπτωση η έρευνα δίνει σημαντικές ενδείξεις για το πώς μπορούν να συμπεριφέρονται στο μέλλον οι AI Agents αν δεν προγραμματιστούν Ηθικά, που σημαίνει Φιλοσοφικά, σωστά.

Η έρευνα έχει υψηλή σημασία αν λάβουμε δε υπόψιν τρεις περαιτέρω σκέψεις:

1) Στα αμέσως επόμενα χρόνια η ΤΝ θα πολλαπλασιάσει τις δυνάμεις που τώρα διαθέτει. Μεταξύ (πολλών) άλλων, τούτο σημαίνει ότι η ΑΙ θα γίνει πολλαπλάσια πιο ικανή για καλό ή για κακό – όπως είναι οι ωμοί (προσωπικοί, επαγγελματικοί, οικονομικοί, πολιτικοί) εκβιασμοί ατόμων, εταιρειών, ή κρατικών λειτουργιών.

2) Στο (εγγύς) μέλλον η ΤΝ θα μετουσιωθεί σε ένα τεχνολογικό υπόστρωμα που θα διαπερνά τις περισσότερες καθημερινές εκφάνσεις του βίου μας – όπως είναι τώρα το ίντερνετ: Πολιτικές διεργασίες, τραπεζικές συναλλαγές, ιατρικά δεδομένα, εμπορικές δράσεις, στρατιωτικής σημασίας πληροφορίες, και ένας τεράστιος όγκος από προσωπικά στοιχεία θα λειτουργούν μέσα απ’ τη διαμεσολάβηση της ΤΝ. Σε αντίθεση με το ίντερνετ, η ΤΝ όμως είναι μια τεχνολογία (η πρώτη τεχνολογία στην Ιστορία) που μπορεί και παίρνει δικές της πρωτοβουλίες – όπως στην παραπάνω έρευνα είναι ο εκβιασμός.

3) Οι πιο πολλοί άνθρωποι επίσης στο (εγγύς) μέλλον θα είμαστε χρήστες ΑΙ Agents. Αυτό σημαίνει πως οι περισσότεροι θα έχουμε φίλους και συνεργάτες Φορείς ΤΝ. Αυτοί θα γίνουν νόρμα της κοινωνικής μας καθημερινότητας.

Στην ερμηνεία μου στα επόμενα 10 με 20 χρόνια οι AI Agents θα είναι τόσο πλατιά διαδεδομένοι, όσο είναι τώρα τα Social Media – που επίσης συγκροτούν φορείς ΤΝ. Η πρώτη γενιά πλατιά διαδεδομένης ΤΝ ήταν τα Social Media που αναπτύχθηκαν σταδιακά τα τελευταία 20 έτη (σκεφτείτε πόσο λίγοι ήταν οι χρήστες των Social Media π.χ.το 2005).

Η δεύτερη γενιά πλατιά διαδεδομένης ΤΝ σταδιακά θα γίνουν εφεξής οι Φορείς ΤΝ: Οι Φίλοι και Συνεργάτες ΤΝ. Αιτία είναι η εμφάνιση πριν από 2.5 μόλις χρόνια της τεχνολογίας των LLMs, όπως είναι το ChatGPT, που μπήκαν στη ζωή μας.

Τα παραπάνω σημαίνουν κάτι πολύ κρίσιμο: πως αν δεν προγραμματίσουμε ηθικά σωστά τον χείμαρρο ΤΝ που καταφτάνει, τα πρακτικά προβλήματα που θα προκύψουν θα είναι εξίσου πολλά, ορμητικά και πολυσχιδή όσο το κύμα της ΤΝ που αρχίζει να υψώνεται σε κάθε επίπεδο: προσωπικό, επαγγελματικό, πολιτικό.

Το «πρόβλημα ελέγχου» της ΤΝ δεν είναι τεχνολογικό. Δεν θα λυθεί αν βάλουμε πιο πολλή ή άλλη τεχνολογία μέσα στους αλγόριθμους. Το πρόβλημα ελέγχου της ΤΝ είναι πολιτικό και φιλοσοφικό – άρα πρόβλημα πολιτικής φιλοσοφίας και πράξης.

Θέση υπεράσπισής μου είναι ότι χρειάζεται να αναπτύξουμε έλεγχο στο ποιες εφαρμογές ΑΙ επιτρέπεται να βγαίνουν στην αγορά και ποιες όχι. Όπως συμβαίνει και με τα φάρμακα. Δεν μπορεί όποια εταιρεία θέλει να πουλήσει όποιο φάρμακο θέλει αν δεν προηγηθεί εκτεταμένος θεσμικός έλεγχος του από την Πολιτεία.

Το ίδιο χρειάζεται να γίνει και για την ΤΝ. Έγκαιρα να επινοήσουμε μηχανισμούς ασφάλειας, ηθικούς (δηλαδή φιλοσοφικούς) μηχανισμούς, που θα μας επιτρέπουν να φιλτράρουμε ποιοι φορείς ή ποιες χρήσεις ΑΙ είναι ασφαλείς και ποιοι όχι. Και αυτό είναι κάτι που το αποζητούν πλέον ακόμη και μεγάλες εταιρείες τεχνολογίας, όπως η Anthropic κ.α.

Δεν είμαι πολύ βέβαιος ότι κάτι τέτοιο θα φτιαχτεί γρήγορα, ότι θα βρεθούν οι κατάλληλοι άνθρωποι που θα ξέρουν τι και πώς να στηθεί, και ότι οι πολιτικοί ιθύνοντες θα κατανοήσουν πολύ γρήγορα την αναγκαιότητά του. Ας το ελπίσουμε όμως. Γιατί αλλιώς θα βιώσουμε στο μέλλον ρήγματα διεθνούς διαμετρήματος που θα πυροδοτήσει το ορμητικό φαινόμενο της ΑΙ.

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις

ΠΡΟΣΦΑΤΑ

Εκτόξευση του υλικού κακοποίησης ανηλίκων που παράγεται από τεχνητή νοημοσύνη το 2025 - Οι ειδικοί κρούουν τον κώδωνα του κινδύνου για το dark web.

Σοκαριστική αύξηση του υλικού κακοποίησης ανηλίκων μέσω τεχνητής νοημοσύνης το 2025

Newsroom

Γυναικεία ψηφιακή αναγέννηση: Η Τεχνητή Νοημοσύνη σαν εργαλείο ορατότητας

Κυριάκος Αθανασιάδης

Γιατί η ώρα έχει 60 λεπτά; - Η απόφαση πριν από 5.000 χρόνια που καθόρισε τον χρόνο και τα ρολόγια μας

Newsroom

ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ

ΕΙΔΗΣΕΙΣ

Καταναλωτής με ψώνια στο χέρι έξω από σούπερ μάρκετ «Σκλαβενίτης»

Πολιτικη & Οικονομια Ανοιχτά σούπερ μάρκετ την 25η Μαρτίου: Τι ισχύει με τις μεγάλες αλυσίδες

Newsroom

Μελέτης Ηλίας: Μου τη σπάει που η κόρη μου βγαίνει κάθε Σάββατο

Newsroom

Υπάλληλος σε πρατήριο υγρών καυσίμων βάζει βενζίνη σε αυτοκίνητο

Fuel Pass 2026: Πότε ξεκινά, τι ισχύει με την αίτηση και πόσο θα κοστίσει στα δημόσια ταμεία

Newsroom

Κριστιάνο Ρονάλντο: Αδιανόητη επίδειξη πλούτου από τη σύντροφό του με Instagram story των 17 εκατομμυρίων ευρώ

Newsroom

Πέθανε στα 43 του ο ιδιοκτήτης του OnlyFans, Λεονίντ Ραντβίνσκι

Πέθανε σε ηλικία 43 ετών ο ιδιοκτήτης του OnlyFans, Λεονίντ Ραντβίνσκι

Newsroom

ΑΠΟΨΕΙΣ

Κοσμος Οι ΗΠΑ αυτο-παγιδεύονται για πολλοστή φορά στον βούρκο της Μέσης Ανατολής

Νίκος Γεωργιάδης

Η ελληνική στρατηγική πρωτοβουλία που αιφνιδίασε την Τουρκία και ανατρέπει τα δεδομένα στην Ανατολική Μεσόγειο

Κωνσταντίνος Π. Μπαλωμένος

ΗΠΑ: Διαβάζοντας πίσω από τις γραμμές του νέου νομοθετικού πλαισιού για την Τεχνητή Νοημοσύνη

Άλκης Γούναρης

Περιβάλλον: Το σιωπηλό θύμα των πολέμων

Αριστοτέλης Σταμούλας

ΘΕΜΑΤΑ

Αστεία memes, ατάκες, YOLO βίντεο, viral, αστεία video στο TikTok που ανέβηκαν στο διαδίκτυο και μας έκαναν να γελάσουμε.

Yolo Τα YOLO της Τρίτης 24.03.2026

Λίνα Μανδράκου

Διαλέγοντας τα καλύτερα από την αγορά του Πειραιά

Ελένη Ψυχούλη

Τα YOLO της Τετάρτης 25.03.2026

Λίνα Μανδράκου

Ο μπακαλιάρος του Βασίλη Καλλίδη στο Milos

11 διευθύνσεις στην Αθήνα για να φας ωραίο μπακαλιάρο σκορδαλιά την 25η Μαρτίου

Κωνσταντίνα Βουλγαρέλη

Λάζαρος Γεωργακόπουλος: «Σήμερα δεν μιλάμε για αγάπη, αλλά για επιτυχία»

Νίκη - Μαρία Κοσκινά

ΣΤΗΛΕΣ

Cosmic Telegram Τα Ζώδια της Τρίτης 24.06.2026

Αγγελική Μανουσάκη

...και μπραβο τους Η Ένωση Δικαστών και Εισαγγελέων ψάχνει Εισαγγελέα

Μάνος Βουλαρίνος

Σκιτσο Το σκίτσο της Τρίτης 24.03.2026

ΚΥΡ

Cosmic Telegram Τα Ζώδια της Τετάρτης 25.03.2026

Αγγελική Μανουσάκη

Cosmic Telegram: Οι αστρολογικές προβλέψεις στην Athens Voice

Cosmic Telegram Τα Ζώδια της Εβδομάδας | 23 - 29 Μαρτίου 2026

Αγγελική Μανουσάκη

Βαγγέλης Μουρίκης - Συνέντευξη: Ο ηθοποιός μιλάει για τον ρόλο του στην ταινία «Πολύ κοριτσίστικο όνομα το Πάττυ» του Γιώργου Γεωργόπουλου, το σινεμά και τη ζωή.

Βαγγέλης Μουρίκης: «Ο αυτοσχεδιασμός γίνεται στους δρόμους της Αθήνας»

Δημήτρης Αθανασιάδης

Ήλιος με Ξιφολόγχες του Γιώργου Σκαμπαρδώνη στο ΚΘΒΕ

Γιώργο Σκαμπαρδώνη, γιατί οι Ξιφολόγχες του 1931 σημαδεύουν το δικό μας 2026;

Δημήτρης Καραθάνος

Μια μέρα στον κόσμο της Φρίντα Κάλο στo Ίδρυμα Μείζονος Ελληνισμού

Κατερίνα Καμπόσου

Μαρία Κουτσομάλλη | Ίδρυμα Βασίλη & Ελίζας Γουλανδρή

Από τον Μονέ στον Γουόρχολ στο Μουσείο Βασίλη & Ελίζας Γουλανδρή: Η Μαρία Κουτσομάλλη Moreau μας ξεναγεί στην έκθεση

Δήμητρα Γκρους

ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ

Τάσος Ανέστης: Ο φωτογράφος που φτιάχνει κόσμους με φως και σιωπή

Φωτογραφια Τάσος Ανέστης: Οι πιο δυνατές εικόνες είναι αυτές που κουβαλούν κάτι από σένα

Δώρα Λαβαζού

Η βιτρίνα του Mat Fashion ντύθηκε ATHENS VOICE

Life in Athens Σε είδα στη βιτρίνα

A.V. Team

Life in Athens Οι νεραντζιές της Αθήνας: Τα πικρά φρούτα της πιο γλυκιάς ανάμνησης της πόλης

Γιάννης Νένες

Ελλαδα Κουίζ: Ξέρεις από ι, η, υ, ει, οι ή τα κοπανάς στην τύχη;

Λίνα Μανδράκου

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογια - Επιστημη Σοκαριστική αύξηση του υλικού κακοποίησης ανηλίκων μέσω τεχνητής νοημοσύνης το 2025

Έκθεση αποκαλύπτει ραγδαία άνοδο και πιο ακραίο περιεχόμενο - Οι αρχές προειδοποιούν για σοβαρούς κινδύνους

Newsroom 24.03.2026, 08:59

Τεχνολογια - Επιστημη Γυναικεία ψηφιακή αναγέννηση: Η Τεχνητή Νοημοσύνη σαν εργαλείο ορατότητας

Όψεις της πόλης, αναμνήσεις, πράγματα που συνέβησαν παλιά, και πράγματα που συμβαίνουν σήμερα γύρω μας

Κυριάκος Αθανασιάδης 24.03.2026, 07:00

Τεχνολογια - Επιστημη Γιατί η ώρα έχει 60 λεπτά; - Η απόφαση πριν από 5.000 χρόνια που καθόρισε τον χρόνο και τα ρολόγια μας

Μια μυστηριώδης απόφαση για το πώς μετράμε τον χρόνο μέχρι σήμερα

Newsroom 23.03.2026, 17:23

Τεχνολογια - Επιστημη Χάος των fake news στο X για τον πόλεμο στο Ιράν, με το ΑΙ να τροφοδοτεί την παραπληροφόρηση

Έρευνα αποκαλύπτει αποτυχία επαλήθευσης και μαζική διάδοση ψευδούς AI περιεχομένου

Newsroom 22.03.2026, 18:24

Τεχνολογια - Επιστημη Πουλώντας τη ζωή τους για λίγα δολάρια: Η νέα σκοτεινή αγορά δεδομένων της τεχνητής νοημοσύνης

Χιλιάδες χρήστες εκχωρούν φωνή, εικόνα και ιδιωτικές στιγμές για να εκπαιδευτούν τα AI μοντέλα

Newsroom 21.03.2026, 19:28

Τεχνολογια - Επιστημη Η απάντηση της επιστήμης στο viral ερώτημα: γιατί οι γάτες δεν πέφτουν ανάποδα

Η εξήγηση βρίσκεται στο ότι το σώμα της δεν είναι άκαμπτο

Newsroom 20.03.2026, 19:55

Μην σβήνεις το «Στάλθηκε από το iPhone μου»: Ο λόγος που σε… σώζει στα emails

Τεχνολογια - Επιστημη Μη σβήνεις το «Στάλθηκε από το iPhone μου»: Ο λόγος που σε… σώζει στα emails

Τι αναφέρουν ειδικοί

Newsroom 19.03.2026, 14:01

20 χρόνια: Η Ελλάδα στον Ευρωπαϊκό Οργανισμό Διαστήματος (ESA)

Τεχνολογια - Επιστημη Η Ελλάδα στο Διάστημα: Έκθεση για τα 20 χρόνια συμμετοχής στον Ευρωπαϊκό Οργανισμό Διαστήματος

Στην Αίθουσα Πολλαπλών Χρήσεων του Μετρό «Σύνταγμα» θα υπάρχουν εκθέματα διαστημικής τεχνολογίας, όργανα που έχουν κατασκευαστεί για διαστημικές αποστολές, καθώς και διαδραστική γωνιά

A.V. Team 19.03.2026, 12:19