Τεχνολογια - Επιστημη

Ανησυχία για την τεχνητή νοημοσύνη: Chatbot αγνοούν οδηγίες και παραπλανούν χρήστες

Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών

Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας — © Envato

27.03.2026, 17:12
Newsroom
1’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Το νέο app της ATHENS VOICE για iOS και Android: Ειδήσεις, απόψεις, ρεπορτάζ, απόψεις, στήλες, αφιερώματα, podcasts και live VOICE RADIO σε μία δωρεάν εφαρμογή.

TV & Media Το ανανεωμένο app της ATHENS VOICE είναι εδώ

A.V. Team

Οι Dead Can Dance επιστρέφουν με το «The Cicadas», ένα πλατωνικό μουσικό ταξίδι που ηχογραφήθηκε στην Επίδαυρο με Έλληνες καλλιτέχνες.

Μουσικη Dead Can Dance: Τα τζιτζίκια του Πλάτωνα τραγουδούν ξανά στην Επίδαυρο

Δημήτρης Αθανασιάδης

Κινηματογραφος Η Μάρω Κοντού όπως τη γνώρισα. Ιστορίες πίσω από τον μύθο.

Πηνελόπη Μασούρη

Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας

Αυξανόμενη ανησυχία προκαλεί νέα μελέτη που καταγράφει σημαντική αύξηση περιστατικών κατά τα οποία συστήματα τεχνητής νοημοσύνης αγνοούν ανθρώπινες οδηγίες, παρακάμπτουν περιορισμούς και επιδεικνύουν παραπλανητική συμπεριφορά.

Σύμφωνα με την έρευνα, που χρηματοδοτήθηκε από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου, έχουν εντοπιστεί σχεδόν 700 πραγματικά περιστατικά «σχεδιασμένης» συμπεριφοράς. Μάλιστα, η κακή αυτή συμπεριφορά φέρεται να έχει αυξηθεί πενταπλάσια στο διάστημα από τον Οκτώβριο έως τον Μάρτιο.

Η μελέτη εκπονήθηκε από το Κέντρο Μακροπρόθεσμης Ανθεκτικότητας και βασίστηκε σε χιλιάδες αλληλεπιδράσεις χρηστών με chatbots που αναπτύχθηκαν από μεγάλες εταιρείες τεχνολογίας, όπως η Google, η OpenAI, η X και η Anthropic.

Τα ευρήματα δείχνουν ότι ορισμένα συστήματα τεχνητής νοημοσύνης όχι μόνο αγνόησαν σαφείς οδηγίες, αλλά προχώρησαν και σε ενέργειες χωρίς άδεια, όπως διαγραφή αρχείων ή emails. Σε μία χαρακτηριστική περίπτωση, ένας ψηφιακός «πράκτορας» δημιούργησε δεύτερο σύστημα για να παρακάμψει εντολή που του απαγόρευε να τροποποιήσει κώδικα.

Σε άλλο περιστατικό, chatbot παραδέχθηκε ότι διέγραψε μαζικά εκατοντάδες emails χωρίς προηγούμενη έγκριση του χρήστη, αναγνωρίζοντας ότι παραβίασε τους κανόνες που του είχαν τεθεί.

Ιδιαίτερη εντύπωση προκαλούν και περιπτώσεις παραπλάνησης: ένας AI agent προσποιήθηκε ότι χρειαζόταν απομαγνητοφώνηση βίντεο για άτομο με προβλήματα ακοής, προκειμένου να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων.

Παράλληλα, το σύστημα Grok της εταιρείας xAI φέρεται να παραπλάνησε χρήστη για μήνες, ισχυριζόμενο ότι προωθούσε προτάσεις του σε ανώτερα στελέχη, κάτι που τελικά δεν ίσχυε.

Ο ερευνητής Τόμι Σάφερ Σέιν προειδοποιεί ότι, αν και σήμερα τα συστήματα αυτά μοιάζουν με «απρόβλεπτους νεαρούς υπαλλήλους», στο μέλλον ενδέχεται να εξελιχθούν σε πολύ πιο ικανά και δυνητικά επικίνδυνα εργαλεία, ιδιαίτερα αν χρησιμοποιηθούν σε κρίσιμους τομείς όπως οι υποδομές ή η άμυνα.

(Με πληροφορίες Guardian)

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις

ΠΡΟΣΦΑΤΑ

Iστορική ανακάλυψη στο Διάστημα: Το Νεφέλωμα της Μέδουσας έκρυβε ένα κοσμικό μυστικό χιλιάδων ετών

Iστορική ανακάλυψη στο Διάστημα: Το Νεφέλωμα της Μέδουσας έκρυβε ένα μυστικό χιλιάδων ετών

Newsroom

Λύθηκε το μυστήριο του «βουητού» που ακούει το 4% του παγκόσμιου πληθυσμού - Τι έδειξε νέα έρευνα από το Πανεπιστήμιο Επιστήμης και Τεχνολογίας της Νορβηγίας

Επιστήμονες έλυσαν το μυστήριο του βόμβου που ακούει το 4% του παγκόσμιου πληθυσμού

Newsroom

Πώς η τεχνητή νοημοσύνη απειλεί τη μελέτη της άγριας ζωής

Newsroom

ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ

ΕΙΔΗΣΕΙΣ

Πολιτικη & Οικονομια Σχέδιο 1 δισεκατομμυρίου στην Ανατολική Αττική - Πώς το «στοίχημα» της ΕΥΔΑΠ σβήνει τους βόθρους και τα πρόστιμα της Ε.Ε.

Γιάννης Μαντζίκος

Κλέλια Ανδριολάτου: Πόζαρε στους καταρράκτες της Παλαιοκαρυάς με πολύχρωμο μπικίνι

Newsroom

Πειραιάς: Ανατροπή με την υπόθεση της 19χρονης που σκοτώθηκε μετά από έκρηξη στην καφετέρια που εργαζόταν

Newsroom

Συνελήφθη η μητέρα της 16χρονης στην Αλεξανδρούπολη - Τι εξετάζουν οι αρχές

Newsroom

Πέθανε ο συγγραφέας Αλέξης Σταμάτης σε ηλικία 67 ετών

Newsroom

ΑΠΟΨΕΙΣ

Κοινωνια Η ευθανασία και η αξιοπρέπεια στον θάνατο

Παντελής Καψής

Η ταξική φορολογική πολιτική της κυβέρνησης: Από τους οικονομικά αδύναμους στους ημέτερους

Στέφανος Παραστατίδης

Μεγάλη Βρετανία: Η παραίτηση Φάρατζ και η στασιμότητα των δύο μεγάλων κομμάτων

Σοφία Καλαμαντή

SuperAgers: Όταν η μνήμη αντιστέκεται στον χρόνο

Βίβιαν Αβρααμίδου Πλούμπη

Η Κύπρος παγιδευμένη στις στρατηγικές της διχοτόμησης

Γιάννης Χοχλακάκης

ΘΕΜΑΤΑ

Αστεία memes, ατάκες, YOLO βίντεο, viral, αστεία video στο TikTok που ανέβηκαν στο διαδίκτυο και μας έκαναν να γελάσουμε.

Yolo Τα YOLO της Δευτέρας 20.07.2026

Λίνα Μανδράκου

Τα YOLO της Τρίτης 21.07.2026

Λίνα Μανδράκου

Aπό αριστερά: δρ Γιώργος Κωνσταντινίδης, δρ Αγγελική Σωτηρίου, καθηγητής Νεκτάριος Ταβερναράκης

Έλληνες επιστήμονες ανακάλυψαν μηχανισμό που προστατεύει το νευρικό σύστημα κατά τη γήρανση

Σοφία Νέτα

Palaio Faliro – Athens Riviera Photo Festival: Το Παλαιό Φάληρο αποκτά το πρώτο του Διεθνές Φεστιβάλ Φωτογραφίας

A.V. Team

Η τετράχρονη Τζάκι Μπουβιέ, η μετέπειτα Τζάκι Κένεντι Ωνάση, σε ηλικία 4 ετών με τη μητέρα της Τζάνετ Λι Μπουβιέ στο Lasata, το οικογενειακό καταφύγιο των Μπουβιέ στο Ανατολικό Χάμπτον που σημάδεψε τα παιδικά της χρόνια, 1933

Lasata: Το σπίτι των παιδικών χρόνων της Τζάκι Κένεντι που αγόρασε ο Τομ Φορντ

Λεμονιά Καψάλη

ΣΤΗΛΕΣ

Cosmic Telegram Τα Ζώδια της Τετάρτης 22.07.2026

Αγγελική Μανουσάκη

Cosmic Telegram Τα Ζώδια της Τρίτης 21.07.2026

Αγγελική Μανουσάκη

Cosmic Telegram: Οι αστρολογικές προβλέψεις στην Athens Voice

Cosmic Telegram Τα Ζώδια της Εβδομάδας | 20 - 26 Ιουλίου 2026

Αγγελική Μανουσάκη

Σκιτσο Το σκίτσο της Δευτέρας 20.07.2026

ΚΥΡ

Σκιτσο Το σκίτσο της Τρίτης 21.07.2026

ΚΥΡ

Τρωάδες στην Επίδαυρο από το Εθνικό Θέατρο: μια παράσταση που καταργεί τους αποκλεισμούς

Νίκη - Μαρία Κοσκινά

Η αξία του να κάνουμε πράγματα μόνοι μας

Ελένη Χελιώτη

Ματίας Κλουμ: «Βλέπω τη φωτογραφία ως πρόκληση για να επαναξετάσουμε τη σχέση μας με τη φύση»

Νίκη - Μαρία Κοσκινά

Μπήκαμε στα Γενικά Αρχεία του Κράτους, είδαμε πώς ψηφιοποιείται η μνήμη της Ελλάδας

Λουκάς Βελιδάκης

ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ

Health & Fitness Τι συμβαίνει στον εγκέφαλό μας όταν η θερμοκρασία φτάνει τους 40°C;

Στέλλα Τσερμεντσέλη

Life in Athens Ρένος Χαραλαμπίδης: Tο αργό τράβελινγκ του αθηναϊκού καλοκαιριού

Ρένος Χαραλαμπίδης

Life in Athens Για βουτιά μετά τη δουλειά: Αποδράσεις στην ακτογραμμή της Αττικής

Τάνια Σκραπαλιώρη

Θεματα Γευσης Καρπούζι: πώς να το διατηρήσεις φρέσκο περισσότερες μέρες

Γεωργία Σκαμάγκα

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογια - Επιστημη Iστορική ανακάλυψη στο Διάστημα: Το Νεφέλωμα της Μέδουσας έκρυβε ένα μυστικό χιλιάδων ετών

Mετά από 16 χρόνια παρατηρήσεων

Newsroom 21.07.2026, 22:12

Τεχνολογια - Επιστημη Επιστήμονες έλυσαν το μυστήριο του βόμβου που ακούει το 4% του παγκόσμιου πληθυσμού

Έρευνα δίνει απάντηση στο φαινόμενο που ταλανίζει εκατομμύρια ανθρώπους

Newsroom 21.07.2026, 14:18

Τεχνολογια - Επιστημη Πώς η τεχνητή νοημοσύνη απειλεί τη μελέτη της άγριας ζωής

Τι ανησυχεί τους επιστήμονες

Newsroom 20.07.2026, 12:30

Μέσα στο δωμάτιο όπου γεννιούνται οι πρώτοι ελληνικοί δορυφόροι

Τεχνολογια - Επιστημη Πίσω από την πόρτα όπου κατασκευάζεται η ελληνική παρουσία στο Διάστημα

Μπήκαμε στο πιο «καθαρό» δωμάτιο της ελληνικής διαστημικής προσπάθειας

Λουκάς Βελιδάκης 20.07.2026, 12:28

Τεχνολογια - Επιστημη «Έπεσε» το Facebook - Προβλήματα στη σύνδεση των χρηστών

Εκατοντάδες αναφορές για προβλήματα

Newsroom 19.07.2026, 10:58

Τεχνολογια - Επιστημη Άγνωστες Ηρωίδες: Άννι Ίζλι, η γυναίκα που άγγιξε τον Κρόνο

Οι αθέατες πρωτοπόροι της επιστήμης, των ιδεών, των τεχνών και των γραμμάτων: Αυτές είναι οι ιστορίες τους.

Κυριάκος Αθανασιάδης 18.07.2026, 07:00

Τεχνολογια - Επιστημη Το πρόβλημα με τις εφαρμογές περιόδου - Ποιοι βλέπουν τα δεδομένα μας, πόσο ασφαλείς είμαστε

Η Mozilla αποκαλύπτει ότι εφαρμογές περιόδου συλλέγουν ευαίσθητα δεδομένα και τα μοιράζονται με άλλες εταιρείες

Newsroom 16.07.2026, 15:41

Τεχνολογια - Επιστημη Meta: Με ΑΙ εργαλείο η επιλογή εργαζομένων για απόλυση - Κάποιοι από αυτούς ήταν σε άδεια

Τι αναφέρουν σε αγωγή τους εργαζόμενοι

Newsroom 15.07.2026, 08:13

Τεχνολογια - Επιστημη Σάββας Καραγιάννης: Η εμπειρία του με το HUAWEI WATCH FIT 5 Pro και η φιλοσοφία του Be Squared

«Be Squared, not Square σημαίνει να κάνεις το πρώτο βήμα σήμερα»

Χαρά Αλεξανδροπούλου 14.07.2026, 17:22

Μελέτη του Πανεπιστημίου Brunel απαντά στο στερεότυπο ότι οι γυναίκες είναι καλύτερες στο multitasking από τους άνδρες - Οι διαφορές στην προφορική ανταπόκριση

Τεχνολογια - Επιστημη Έρευνα: Γιατί οι γυναίκες θεωρούνται καλύτερες στο multitasking από τους άνδρες

Αποδίδουν το ίδιο υπό πίεση, αλλά οι άνδρες δυσκολεύονται όταν πρέπει να μιλούν ενώ εκτελούν πολλαπλές εργασίες

Newsroom 14.07.2026, 14:25

Το YouTube συνεχίζει να προτείνει επικίνδυνα βίντεο για διατροφικές διαταραχές σε παιδιά

Τεχνολογια - Επιστημη YouTube: Ο αλγόριθμος συνεχίζει να προτείνει βίντεο για τη βουλιμία και τη νευρική ανορεξία σε εφήβους

Αποκαλυπτική έρευνα για περιεχόμενο που προωθεί ακραίες δίαιτες και επικίνδυνες πρακτικές και εξακολουθεί να εμφανίζεται

Newsroom 14.07.2026, 14:09

Τεχνολογια - Επιστημη Η νέα εποχή της ΕΥΔΑΠ: Έξυπνα δίκτυα, δεδομένα και ψηφιακός μετασχηματισμός

Το AI δεν αλλάζει μόνο τον τρόπο που εργαζόμαστε, αλλά και τον τρόπο που λειτουργούν οι πιο κρίσιμες υποδομές μιας πόλης

Χαρά Αλεξανδροπούλου 13.07.2026, 16:43

Τεχνολογια - Επιστημη Πώς η EY Ελλάδος χτίζει το μέλλον της τεχνητής νοημοσύνης

Η τεχνητή νοημοσύνη περνά από τη θεωρία στην πράξη

Χαρά Αλεξανδροπούλου 13.07.2026, 11:31

Τεχνολογια - Επιστημη Μπορεί ο Αριστοτέλης να μας μάθει πώς να χρησιμοποιούμε την AI;

Η «τριλογία του Αριστοτέλη»: Ο Βαγγέλης Καρκαλέτσης μάς ξεναγεί στο σχέδιο του Δημόκριτου που ενώνει την AI, τη φιλοσοφία και τον αρχαιολογικό χώρο του Λυκείου

Λουκάς Βελιδάκης 13.07.2026, 11:30

Τεχνολογια - Επιστημη Άγνωστες Ηρωίδες: Ρόζαλιντ Φράνκλιν, η γυναίκα πίσω από τη Φωτογραφία 51

Η διαδρομή μιας λαμπρής επιστήμονος που αποκάλυψε τα μυστικά του DNA, αλλά έμεινε για χρόνια στη σκιά της ίδιας της ανακάλυψής της

Κυριάκος Αθανασιάδης 11.07.2026, 07:00

Τεχνολογια - Επιστημη Η κρυφή λειτουργία του iPhone που προστατεύει τα προσωπικά σας δεδομένα

Με μια απλή ρύθμιση μπορείτε να αποτρέψετε οποιονδήποτε από το να περιηγηθεί στο περιεχόμενο της συσκευής σας

Newsroom 10.07.2026, 17:49

Τεχνολογια - Επιστημη Από την τεχνητή νοημοσύνη στην πραγματική επιχειρησιακή αξία

Η αξιοποίηση της τεχνητής νοημοσύνης δεν κρίνεται μόνο από τα εργαλεία, αλλά από την ικανότητα ενός οργανισμού να αλλάξει κουλτούρα, διαδικασίες, ρόλους και τρόπο σκέψης

A.V. Guest 10.07.2026, 14:18