Τεχνολογια - Επιστημη

Ανησυχία για την τεχνητή νοημοσύνη: Chatbot αγνοούν οδηγίες και παραπλανούν χρήστες

Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών

Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας — Όλο και περισσότερα συστήματα τεχνητής νοημοσύνης αγνοούν ανθρώπινες εντολές και επιδεικνύουν παραπλανητική συμπεριφορά © Envato

27.03.2026, 17:12
Newsroom
1’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Κοινωνια Ταράνα Μπερκ: «Δεν υπάρχει τοξική αρρενωπότητα – τοξικές κοινωνίες υπάρχουν»

Χριστίνα Γαλανοπούλου

Βιβλιο Η καλή, η κακή και η άσχημη λογοτεχνία

Κυριάκος Αθανασιάδης

Vidcast | Γιώργος Χρούσος: Πώς τα πρώτα παιδικά χρόνια διαμορφώνουν τη ζωή μας

Health & Fitness Vidcast Η επιστήμη και οι επιστήμονες | Γιώργος Χρούσος: Πώς τα πρώτα παιδικά χρόνια διαμορφώνουν τη ζωή μας

Μάκης Προβατάς

Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας

Αυξανόμενη ανησυχία προκαλεί νέα μελέτη που καταγράφει σημαντική αύξηση περιστατικών κατά τα οποία συστήματα τεχνητής νοημοσύνης αγνοούν ανθρώπινες οδηγίες, παρακάμπτουν περιορισμούς και επιδεικνύουν παραπλανητική συμπεριφορά.

Σύμφωνα με την έρευνα, που χρηματοδοτήθηκε από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου, έχουν εντοπιστεί σχεδόν 700 πραγματικά περιστατικά «σχεδιασμένης» συμπεριφοράς. Μάλιστα, η κακή αυτή συμπεριφορά φέρεται να έχει αυξηθεί πενταπλάσια στο διάστημα από τον Οκτώβριο έως τον Μάρτιο.

Η μελέτη εκπονήθηκε από το Κέντρο Μακροπρόθεσμης Ανθεκτικότητας και βασίστηκε σε χιλιάδες αλληλεπιδράσεις χρηστών με chatbots που αναπτύχθηκαν από μεγάλες εταιρείες τεχνολογίας, όπως η Google, η OpenAI, η X και η Anthropic.

Τα ευρήματα δείχνουν ότι ορισμένα συστήματα τεχνητής νοημοσύνης όχι μόνο αγνόησαν σαφείς οδηγίες, αλλά προχώρησαν και σε ενέργειες χωρίς άδεια, όπως διαγραφή αρχείων ή emails. Σε μία χαρακτηριστική περίπτωση, ένας ψηφιακός «πράκτορας» δημιούργησε δεύτερο σύστημα για να παρακάμψει εντολή που του απαγόρευε να τροποποιήσει κώδικα.

Σε άλλο περιστατικό, chatbot παραδέχθηκε ότι διέγραψε μαζικά εκατοντάδες emails χωρίς προηγούμενη έγκριση του χρήστη, αναγνωρίζοντας ότι παραβίασε τους κανόνες που του είχαν τεθεί.

Ιδιαίτερη εντύπωση προκαλούν και περιπτώσεις παραπλάνησης: ένας AI agent προσποιήθηκε ότι χρειαζόταν απομαγνητοφώνηση βίντεο για άτομο με προβλήματα ακοής, προκειμένου να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων.

Παράλληλα, το σύστημα Grok της εταιρείας xAI φέρεται να παραπλάνησε χρήστη για μήνες, ισχυριζόμενο ότι προωθούσε προτάσεις του σε ανώτερα στελέχη, κάτι που τελικά δεν ίσχυε.

Ο ερευνητής Τόμι Σάφερ Σέιν προειδοποιεί ότι, αν και σήμερα τα συστήματα αυτά μοιάζουν με «απρόβλεπτους νεαρούς υπαλλήλους», στο μέλλον ενδέχεται να εξελιχθούν σε πολύ πιο ικανά και δυνητικά επικίνδυνα εργαλεία, ιδιαίτερα αν χρησιμοποιηθούν σε κρίσιμους τομείς όπως οι υποδομές ή η άμυνα.

(Με πληροφορίες Guardian)

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις

ΠΡΟΣΦΑΤΑ

Το Netflix αυξάνει και πάλι τις τιμές - Ακριβότερα όλα τα πακέτα

Newsroom

UBITECH: Σημείο αναφοράς στον χώρο της τεχνολογίας και της καινοτομίας

A.V. Team

Apple: Όλες οι νέες δυνατότητες του iOS 26.4 για iPhone - Δείτε αναλυτικά τις αλλαγές που βελτιώνουν την εμπειρία χρήσης και την προσβασιμότητα.

iOS 26.4: Όλες οι νέες δυνατότητες που φέρνει η Apple στο iPhone σας

Newsroom

ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ

ΕΙΔΗΣΕΙΣ

Εργαζόμενος σε πρατήριο υγρών καυσίμων βάζει βενζίνη σε όχημα

Πολιτικη & Οικονομια Fuel Pass 2026: Ανατροπή με την αίτηση, πότε ανοίγει η πλατφόρμα

Newsroom

Η μαγεία της φύσης σ' ένα καρέ: Η φωτογραφία του Ιβηρικού λύγκα που κέρδισε το βραβείο στα People's Choice 2026

Newsroom

Τσερνόμπιλ: 5 απόκοσμα πράγματα που συμβαίνουν στη φύση 40 χρόνια μετά

A.V. Team

Ισπανία: Πέθανε με ευθανασία η 25χρονη - Η συγκλονιστική ιστορία της από τον ομαδικό βιασμό μέχρι το τέλος

Newsroom

Βουλιαγμένη: «Προσπαθούσε για 40 λεπτά» - Τις δραματικές στιγμές πριν χάσει τη ζωή του περιέγραψε ο δεύτερος δύτης

Βουλιαγμένη: «Προσπαθούσε για 40 λεπτά» - Οι δραματικές στιγμές του δύτη πριν χάσει τη ζωή του

Newsroom

ΑΠΟΨΕΙΣ

Κοσμος Υβριδικές επιχειρήσεις στην Ευρώπη και η προοπτική της «χαοτικής τρομοκρατίας»

Σώτη Τριανταφύλλου

Εκλογές εδώ και τώρα

Λεωνίδας Καστανάς

ΠΑΣΟΚ: Μια πινακοθήκη από το παρελθόν

Παντελής Καψής

Ανταγωνιστικοί μισθοί για την προσέλκυση επιστημονικού δυναμικού και η αναγκαία κατάργηση του ενιαίου μισθολογίου στα πανεπιστήμια

Γιώργος Λάσκαρης

Ιράν: Το αδιέξοδο του Ντόναλντ Τραμπ και η ανάγκη για έναν «άξονα λογικής»

Λουκάς Βελιδάκης

ΘΕΜΑΤΑ

Αστεία memes, ατάκες, YOLO βίντεο, viral, αστεία video στο TikTok που ανέβηκαν στο διαδίκτυο και μας έκαναν να γελάσουμε.

Yolo Τα YOLO της Πέμπτης 26.03.2026

Λίνα Μανδράκου

Τα YOLO της Παρασκευής 27.03.2026

Λίνα Μανδράκου

«Το παιδί» που… βγάζει γλώσσα

Πόπη Διαμαντάκου

Η καλή, η κακή και η άσχημη λογοτεχνία

Κυριάκος Αθανασιάδης

Φάρμα Βρούβα: Μια πολύ γλυκιά γιορτή για τα ηλικιωμένα ζώα στην Αίγινα

Κατερίνα Καμπόσου

ΣΤΗΛΕΣ

Cosmic Telegram Τα Ζώδια της Πέμπτης 26.03.2026

Αγγελική Μανουσάκη

Info-diet Info Diet | Ράδιο Αρβύλα: Δεν είναι χιουμοριστική εκπομπή, είναι διατεταγμένη υπηρεσία

Σταυρούλα Παναγιωτάκη

Σκιτσο Το σκίτσο της Πέμπτης 26.03.2026

ΚΥΡ

Σκιτσο Το σκίτσο της Παρασκευής 27.03.2026

ΚΥΡ

...και μπραβο τους Η αριστερά ως ευάλωτη κοινωνική ομάδα

Μάνος Βουλαρίνος

Dead Can Dance: Το νέο τραγούδι «Our Day Will Come» ηχογραφήθηκε στην Επίδαυρο

Δημήτρης Αθανασιάδης

Ο Αχιλλέας ΙΙΙ δηλώνει «απαισιαισιόδοξος» και καταφέρνει να παραχαράξει την πραγματικότητα

Γιώργος Φλωράκης

Πολυκατοικίες: Ένα κόμικ εμπνευσμένο από το ομώνυμο τραγούδι του Λεξ

Γιώργος Φλωράκης

200 χρόνια από την Έξοδο του Μεσολογγίου μέσα από τον φακό του Βασίλη Αρτίκου

Δώρα Λαβαζού

ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ

Πολιτικη & Οικονομια Δεν υπάρχει τίποτα πιο συστημικό από τον ελληνικό αντισυστημικό λαϊκισμό

Φώτης Γεωργελές

Βιβλιο Μαρκ Μαζάουερ: «Κυριεύτηκα από το φως και το τοπίο της Ελλάδας»

Αγγελική Μπιρμπίλη

Ελλαδα Quiz: 21 ερωτήσεις για την Επανάσταση του 1821

Μάνος Νομικός

Η βιτρίνα του Mat Fashion ντύθηκε ATHENS VOICE

Life in Athens Σε είδα στη βιτρίνα

A.V. Team

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογια - Επιστημη Ανησυχία για την τεχνητή νοημοσύνη: Chatbot αγνοούν οδηγίες και παραπλανούν χρήστες

Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών

Newsroom 27.03.2026, 17:12

Τεχνολογια - Επιστημη Το Netflix αυξάνει και πάλι τις τιμές - Ακριβότερα όλα τα πακέτα

Ακριβότερες όλες οι συνδρομές χωρίς νέες παροχές

Newsroom 27.03.2026, 16:43

Τεχνολογια - Επιστημη UBITECH: Σημείο αναφοράς στον χώρο της τεχνολογίας και της καινοτομίας

20 χρόνια δημιουργεί λύσεις που ανταποκρίνονται στις σύγχρονες ανάγκες της ψηφιακής εποχής

A.V. Team 27.03.2026, 14:47

Τεχνολογια - Επιστημη iOS 26.4: Όλες οι νέες δυνατότητες που φέρνει η Apple στο iPhone σας

Διαθέσιμη η μεγάλη αναβάθμιση - Bελτιώσεις σε μουσική, podcasts, TV, emojis και προσβασιμότητα

Newsroom 26.03.2026, 17:36

Τεχνολογια - Επιστημη Στο μυαλό του Θάνου Παπαδημητρίου: Ένας παλιός «κατσαβιδάκιας» στο τιμόνι της ελληνικής τεχνητής νοημοσύνης

Από τα εργαστήρια των 80s μέχρι την προεδρία του «Φάρος AI Factory», σε μια διαδρομή που ενώνει το χόμπι με την αιχμή της τεχνολογίας

Λουκάς Βελιδάκης 26.03.2026, 17:16

Τεχνολογια - Επιστημη Βασσιλεία Ορφανού: Το παραδοσιακό επιχειρηματικό μοντέλο πέθανε

Η διευθύντρια του Luxembourg's Diplomatic & Communications Institute μιλάει στην Athens Voice για την επιχειρηματικότητα στην εποχή της τεχνητής νοημοσύνης

Λουκάς Βελιδάκης 26.03.2026, 16:53

Αρχαιολόγοι στο Μάαστριχτ εξετάζουν σκελετό που φέρει σφαίρα στο στήθος, όπως ο Ντ’ Αρτανιάν του Αλέξανδρου Δουμά - Δείγμα DNA στάλθηκε σε εργαστήριο

Τεχνολογια - Επιστημη Βρέθηκε ο σκελετός του Ντ’ Αρτανιάν; Σπουδαία αρχαιολογική ανακάλυψη στο Μάαστριχτ

Οστά που εντοπίστηκαν σε ναό της Ολλανδίας ίσως ανήκουν στον θρυλικό σωματοφύλακα που ενέπνευσε τον Αλέξανδρο Δουμά

Newsroom 26.03.2026, 12:44

Τεχνολογια - Επιστημη Meta και Google κρίθηκαν υπεύθυνες για εθισμό στα social media σε μία ιστορική δίκη

Γονείς παιδιών στις ΗΠΑ προσφεύγουν στη Δικαιοσύνη κατά social media

Newsroom 26.03.2026, 10:32

Εκτόξευση του υλικού κακοποίησης ανηλίκων που παράγεται από τεχνητή νοημοσύνη το 2025 - Οι ειδικοί κρούουν τον κώδωνα του κινδύνου για το dark web.

Τεχνολογια - Επιστημη Σοκαριστική αύξηση του υλικού κακοποίησης ανηλίκων μέσω τεχνητής νοημοσύνης το 2025

Έκθεση αποκαλύπτει ραγδαία άνοδο και πιο ακραίο περιεχόμενο - Οι αρχές προειδοποιούν για σοβαρούς κινδύνους

Newsroom 24.03.2026, 08:59

Τεχνολογια - Επιστημη Γυναικεία ψηφιακή αναγέννηση: Η Τεχνητή Νοημοσύνη σαν εργαλείο ορατότητας

Όψεις της πόλης, αναμνήσεις, πράγματα που συνέβησαν παλιά, και πράγματα που συμβαίνουν σήμερα γύρω μας

Κυριάκος Αθανασιάδης 24.03.2026, 07:00

Τεχνολογια - Επιστημη Γιατί η ώρα έχει 60 λεπτά; - Η απόφαση πριν από 5.000 χρόνια που καθόρισε τον χρόνο και τα ρολόγια μας

Μια μυστηριώδης απόφαση για το πώς μετράμε τον χρόνο μέχρι σήμερα

Newsroom 23.03.2026, 17:23

Τεχνολογια - Επιστημη Χάος των fake news στο X για τον πόλεμο στο Ιράν, με το ΑΙ να τροφοδοτεί την παραπληροφόρηση

Έρευνα αποκαλύπτει αποτυχία επαλήθευσης και μαζική διάδοση ψευδούς AI περιεχομένου

Newsroom 22.03.2026, 18:24

Τεχνολογια - Επιστημη Πουλώντας τη ζωή τους για λίγα δολάρια: Η νέα σκοτεινή αγορά δεδομένων της τεχνητής νοημοσύνης

Χιλιάδες χρήστες εκχωρούν φωνή, εικόνα και ιδιωτικές στιγμές για να εκπαιδευτούν τα AI μοντέλα

Newsroom 21.03.2026, 19:28

Τεχνολογια - Επιστημη Η απάντηση της επιστήμης στο viral ερώτημα: γιατί οι γάτες δεν πέφτουν ανάποδα

Η εξήγηση βρίσκεται στο ότι το σώμα της δεν είναι άκαμπτο

Newsroom 20.03.2026, 19:55

Μην σβήνεις το «Στάλθηκε από το iPhone μου»: Ο λόγος που σε… σώζει στα emails

Τεχνολογια - Επιστημη Μη σβήνεις το «Στάλθηκε από το iPhone μου»: Ο λόγος που σε… σώζει στα emails

Τι αναφέρουν ειδικοί

Newsroom 19.03.2026, 14:01

20 χρόνια: Η Ελλάδα στον Ευρωπαϊκό Οργανισμό Διαστήματος (ESA)

Τεχνολογια - Επιστημη Η Ελλάδα στο Διάστημα: Έκθεση για τα 20 χρόνια συμμετοχής στον Ευρωπαϊκό Οργανισμό Διαστήματος

Στην Αίθουσα Πολλαπλών Χρήσεων του Μετρό «Σύνταγμα» θα υπάρχουν εκθέματα διαστημικής τεχνολογίας, όργανα που έχουν κατασκευαστεί για διαστημικές αποστολές, καθώς και διαδραστική γωνιά

A.V. Team 19.03.2026, 12:19