Τεχνολογια - Επιστημη

Ανησυχία για την τεχνητή νοημοσύνη: Chatbot αγνοούν οδηγίες και παραπλανούν χρήστες

Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών

Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας — © Envato

27.03.2026, 17:12
Newsroom
1’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Κοσμος Εντυπώσεις από ένα ταξίδι στη βόρεια Αγγλία

Σώτη Τριανταφύλλου

Life in Athens Κώστας Πουλόπουλος: «Η Αθήνα έχει χάος, αλλά έχει και μια απίστευτη ενέργεια»

Επιστήμη Μπινάζη

Health & Fitness Κωνσταντίνος Στρατάκης: «Κάθε μέρα που περνάει χωρίς να είσαι άρρωστος είναι κέρδος»

Δήμητρα Γκρους

Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας

Αυξανόμενη ανησυχία προκαλεί νέα μελέτη που καταγράφει σημαντική αύξηση περιστατικών κατά τα οποία συστήματα τεχνητής νοημοσύνης αγνοούν ανθρώπινες οδηγίες, παρακάμπτουν περιορισμούς και επιδεικνύουν παραπλανητική συμπεριφορά.

Σύμφωνα με την έρευνα, που χρηματοδοτήθηκε από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου, έχουν εντοπιστεί σχεδόν 700 πραγματικά περιστατικά «σχεδιασμένης» συμπεριφοράς. Μάλιστα, η κακή αυτή συμπεριφορά φέρεται να έχει αυξηθεί πενταπλάσια στο διάστημα από τον Οκτώβριο έως τον Μάρτιο.

Η μελέτη εκπονήθηκε από το Κέντρο Μακροπρόθεσμης Ανθεκτικότητας και βασίστηκε σε χιλιάδες αλληλεπιδράσεις χρηστών με chatbots που αναπτύχθηκαν από μεγάλες εταιρείες τεχνολογίας, όπως η Google, η OpenAI, η X και η Anthropic.

Τα ευρήματα δείχνουν ότι ορισμένα συστήματα τεχνητής νοημοσύνης όχι μόνο αγνόησαν σαφείς οδηγίες, αλλά προχώρησαν και σε ενέργειες χωρίς άδεια, όπως διαγραφή αρχείων ή emails. Σε μία χαρακτηριστική περίπτωση, ένας ψηφιακός «πράκτορας» δημιούργησε δεύτερο σύστημα για να παρακάμψει εντολή που του απαγόρευε να τροποποιήσει κώδικα.

Σε άλλο περιστατικό, chatbot παραδέχθηκε ότι διέγραψε μαζικά εκατοντάδες emails χωρίς προηγούμενη έγκριση του χρήστη, αναγνωρίζοντας ότι παραβίασε τους κανόνες που του είχαν τεθεί.

Ιδιαίτερη εντύπωση προκαλούν και περιπτώσεις παραπλάνησης: ένας AI agent προσποιήθηκε ότι χρειαζόταν απομαγνητοφώνηση βίντεο για άτομο με προβλήματα ακοής, προκειμένου να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων.

Παράλληλα, το σύστημα Grok της εταιρείας xAI φέρεται να παραπλάνησε χρήστη για μήνες, ισχυριζόμενο ότι προωθούσε προτάσεις του σε ανώτερα στελέχη, κάτι που τελικά δεν ίσχυε.

Ο ερευνητής Τόμι Σάφερ Σέιν προειδοποιεί ότι, αν και σήμερα τα συστήματα αυτά μοιάζουν με «απρόβλεπτους νεαρούς υπαλλήλους», στο μέλλον ενδέχεται να εξελιχθούν σε πολύ πιο ικανά και δυνητικά επικίνδυνα εργαλεία, ιδιαίτερα αν χρησιμοποιηθούν σε κρίσιμους τομείς όπως οι υποδομές ή η άμυνα.

(Με πληροφορίες Guardian)

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις

ΠΡΟΣΦΑΤΑ

Samsung Solve for Tomorrow: Από το σχολικό θρανίο στις λύσεις του αύριο

Χαρά Αλεξανδροπούλου

Νέα αναφορά εκτιμά ότι το PlayStation 6 μπορεί να ξεπεράσει τα 1.000 δολάρια λόγω αυξημένου κόστους παραγωγής και εξαρτημάτων.

Το PlayStation 6 ίσως κοστίζει πάνω από 1.000 δολάρια, σύμφωνα με νέα έκθεση

Newsroom

WhatsApp: Ξεκίνησε η σταδιακή κράτηση ονομάτων - Πώς θα λειτουργεί το νέο σύστημα, οι εξαιρέσεις για διασημότητες και οι ανησυχίες για το απόρρητο.

WhatsApp: Έρχονται τα usernames - Τέλος στην υποχρεωτική κοινοποίηση τηλεφώνου

Newsroom

ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ

ΕΙΔΗΣΕΙΣ

Ελλαδα Αλλάζει ο καιρός: Πότε έρχεται κύμα καταιγίδων, βροχές και χαλάζι

Newsroom

Τι ισχύει μετά τις 3 Αυγούστου για όσους δεν έχουν βγάλει νέες ταυτότητες

Newsroom

Βόλος: Μωρό 10 μηνών λιποθύμησε κατά τη διάρκεια της βάφτισης

Newsroom

Σαμπαλένκα: Διέκοψε την προπόνηση του Τζόκοβιτς και έπειτα… υποκλίθηκε ζητώντας συγγνώμη

Newsroom

Κατέρρευσε πολυκατοικία στα Πετράλωνα - Αναφορές για εγκλωβισμένους

Κατέρρευσε πολυκατοικία στα Πετράλωνα - Αναφορές για 4 εγκλωβισμένους

Newsroom

ΑΠΟΨΕΙΣ

Πολιτικη & Οικονομια Ο νιος είν’ έντιμος, πατέρα

Επιστήμη Μπινάζη

Athens Pride 2026: Όντως δεν με αφορά;

Κωνσταντίνος Ματσούκας

Βενεζουέλα: Ο σεισμός επισπεύδει τις διαδικασίες μετάβασης στη Δημοκρατία

Ιάσων Πιπίνης

Κλιματική δικαιοσύνη με ταχυδρομικό κώδικα

Χρήστος Ξαγοράρης

ΘΕΜΑΤΑ

Αστεία memes, ατάκες, YOLO βίντεο, viral, αστεία video στο TikTok που ανέβηκαν στο διαδίκτυο και μας έκαναν να γελάσουμε.

Yolo Τα YOLO της Τρίτης 30.06.2026

Λίνα Μανδράκου

Τα YOLO της Τετάρτης 01.07.2026

Λίνα Μανδράκου

Εντυπώσεις από ένα ταξίδι στη βόρεια Αγγλία

Σώτη Τριανταφύλλου

Aντρίκος, τρώγοντας νοστιμιές στο μπακάλικο της γειτονιάς

Ελένη Ψυχούλη

Νίκος Καράβας: Από τη ρομποτική του Χάρβαρντ στα bagels της Αθήνας

Νίκος Καραβάς: Από τη ρομποτική του Χάρβαρντ στα bagels της Δραγατσανίου

Επιστήμη Μπινάζη

ΣΤΗΛΕΣ

Cosmic Telegram Τα Ζώδια της Τετάρτης 01.07.2026

Αγγελική Μανουσάκη

Σκιτσο Το σκίτσο της Τρίτης 30.06.2026

ΚΥΡ

Cosmic Telegram Τα Ζώδια της Τρίτης 30.06.2026

Αγγελική Μανουσάκη

...και μπραβο τους Σε δυο μήνες θα μπορεί να τη σκοτώσει

Μάνος Βουλαρίνος

...και μπραβο τους Γεμίσαμε φασίστες και κομμουνιστές

Μάνος Βουλαρίνος

Οι Άλλες: Φλόρενς Όουενς Τόμσον, η ανώνυμη γυναίκα που ήξεραν οι πάντες

Κυριάκος Αθανασιάδης

Η απίστευτη ιστορία της Φωτεινής Λεομπίλλα: Μία κατάβαση στην κόλαση και μετά η ανάσταση

Παγκόσμια Ημέρα κατά των Ναρκωτικών - Η ιστορία της Φωτεινής Λεομπίλλα: Μία κατάβαση στην κόλαση και μετά η ανάσταση

Λουκάς Βελιδάκης

Παρθενώνας: Η Βασιλεία Μανιδάκη μιλά για την αποκατάσταση του δυτικού αετώματος μετά από 224 χρόνια

Μάκης Προβατάς

Γιατί σταματά η συνταγογράφηση του Mounjaro - Τι θα κάνουν όσοι το παίρνουν

Μάριος Βελέντζας

ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ

Πολιτικη & Οικονομια Θλιμμένη Τζάσμιν η Βρετανία

Πλάμεν Τόντσεφ

Το ελληνικό καλοκαίρι που αγάπησαν έξι νέοι από πέντε διαφορετικές χώρες

Ελλαδα Έξι νέοι απ' όλο τον κόσμο μας είπαν τι κάνει την Ελλάδα το απόλυτο καλοκαιρινό σκηνικό

Μαριάννα Μανωλοπούλου

Ταξιδια Κουίζ: Πόσο καλά γνωρίζεις τα ελληνικά νησιά;

Έλενα Ντάκουλα

LIFE Θα ξαναζούσες τη ζωή σου;

Ρωμανός Γεροδήμος

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογια - Επιστημη Samsung Solve for Tomorrow: Από το σχολικό θρανίο στις λύσεις του αύριο

Περισσότεροι από 500 μαθητές συμμετείχαν στο πρόγραμμα Skills Clubs – Solve for Tomorrow

Χαρά Αλεξανδροπούλου 30.06.2026, 16:29

Έρευνες αποκαλύπτουν ότι τα ζώα έχουν μοναδικές προσωπικότητες, οι οποίες διαμορφώνονται από τη φύση, την ανατροφή και τις εμπειρίες τους.

Τεχνολογια - Επιστημη Έχουν τα ζώα προσωπικότητα; Επιστήμονες εξηγούν τι διαμορφώνει τον χαρακτήρα τους

Νέα δεδομένα δείχνουν ότι επηρεάζονται από γονίδια, περιβάλλον και πρώιμες εμπειρίες όπως ακριβώς και οι άνθρωποι

Newsroom 30.06.2026, 15:52

Τεχνολογια - Επιστημη Το PlayStation 6 ίσως κοστίζει πάνω από 1.000 δολάρια, σύμφωνα με νέα έκθεση

Η Sony ξεκαθαρίζει ότι δεν σκοπεύει να πουλάει τη νέα της κονσόλα με ζημία - Γιατί εκτοξεύθηκε το κόστος κατασκευής

Newsroom 30.06.2026, 14:13

Τεχνολογια - Επιστημη WhatsApp: Έρχονται τα usernames - Τέλος στην υποχρεωτική κοινοποίηση τηλεφώνου

Η πλατφόρμα της Meta λανσάρει παγκοσμίως μια νέα λειτουργία απορρήτου - Πώς λειτουργεί

Newsroom 30.06.2026, 13:41

Τεχνολογια - Επιστημη Xiaomi 17T: Η νέα εποχή της mobile φωτογραφίας περνά από τον τηλεφακό

Τι ζητάμε σήμερα από την κάμερα του smartphone μας;

Χαρά Αλεξανδροπούλου 29.06.2026, 13:48

Τεχνολογια - Επιστημη ASUS ExpertBook Ultra: Το premium laptop που φέρνει την επόμενη γενιά επαγγελματικής απόδοσης

Υπάρχουν πολλοί καλοί φορητοί υπολογιστές στην αγορά, αλλά αυτός στοχεύει στην κορυφή

Ηλιάνα Κωνσταντακάτου 29.06.2026, 10:00

Ο Νίκολας Κέιτζ εισβάλλει στον κόσμο του Call of Duty - Η προσθήκη του ηθοποιού στο Black Ops 7 και οι αντιδράσεις του κοινού για τις διασημότητες στα βιντεοπαιχνίδια.

Τεχνολογια - Επιστημη Ο Νίκολας Κέιτζ γίνεται χαρακτήρας στο Call of Duty

Ο διάσημος ηθοποιός μπαίνει στο δημοφιλές videogame στη νέα καλοκαιρινή ενημέρωση

Newsroom 25.06.2026, 18:05

The Lyceum Project 2026: Αλληλένδετη Νοημοσύνη: Έμβια. Προγονική. Τεχνητή

Τεχνολογια - Επιστημη Η τεχνητή νοημοσύνη συναντά τη φιλοσοφία

Το άθροισμα της σοφίας της φύσης, της εφευρετικότητας και της σοφίας των ανθρώπων πρέπει να επηρεάσει δυναμικά και την εξέλιξη της τεχνητής νοημοσύνης

Βασιλική Γραμματικογιάννη 25.06.2026, 13:40