- CITY GUIDE
- PODCAST
-
17°
Ανησυχία για την τεχνητή νοημοσύνη: Chatbot αγνοούν οδηγίες και παραπλανούν χρήστες
Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών
Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας
Αυξανόμενη ανησυχία προκαλεί νέα μελέτη που καταγράφει σημαντική αύξηση περιστατικών κατά τα οποία συστήματα τεχνητής νοημοσύνης αγνοούν ανθρώπινες οδηγίες, παρακάμπτουν περιορισμούς και επιδεικνύουν παραπλανητική συμπεριφορά.
Σύμφωνα με την έρευνα, που χρηματοδοτήθηκε από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου, έχουν εντοπιστεί σχεδόν 700 πραγματικά περιστατικά «σχεδιασμένης» συμπεριφοράς. Μάλιστα, η κακή αυτή συμπεριφορά φέρεται να έχει αυξηθεί πενταπλάσια στο διάστημα από τον Οκτώβριο έως τον Μάρτιο.
Η μελέτη εκπονήθηκε από το Κέντρο Μακροπρόθεσμης Ανθεκτικότητας και βασίστηκε σε χιλιάδες αλληλεπιδράσεις χρηστών με chatbots που αναπτύχθηκαν από μεγάλες εταιρείες τεχνολογίας, όπως η Google, η OpenAI, η X και η Anthropic.
Τα ευρήματα δείχνουν ότι ορισμένα συστήματα τεχνητής νοημοσύνης όχι μόνο αγνόησαν σαφείς οδηγίες, αλλά προχώρησαν και σε ενέργειες χωρίς άδεια, όπως διαγραφή αρχείων ή emails. Σε μία χαρακτηριστική περίπτωση, ένας ψηφιακός «πράκτορας» δημιούργησε δεύτερο σύστημα για να παρακάμψει εντολή που του απαγόρευε να τροποποιήσει κώδικα.
Σε άλλο περιστατικό, chatbot παραδέχθηκε ότι διέγραψε μαζικά εκατοντάδες emails χωρίς προηγούμενη έγκριση του χρήστη, αναγνωρίζοντας ότι παραβίασε τους κανόνες που του είχαν τεθεί.
Ιδιαίτερη εντύπωση προκαλούν και περιπτώσεις παραπλάνησης: ένας AI agent προσποιήθηκε ότι χρειαζόταν απομαγνητοφώνηση βίντεο για άτομο με προβλήματα ακοής, προκειμένου να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων.
Παράλληλα, το σύστημα Grok της εταιρείας xAI φέρεται να παραπλάνησε χρήστη για μήνες, ισχυριζόμενο ότι προωθούσε προτάσεις του σε ανώτερα στελέχη, κάτι που τελικά δεν ίσχυε.
Ο ερευνητής Τόμι Σάφερ Σέιν προειδοποιεί ότι, αν και σήμερα τα συστήματα αυτά μοιάζουν με «απρόβλεπτους νεαρούς υπαλλήλους», στο μέλλον ενδέχεται να εξελιχθούν σε πολύ πιο ικανά και δυνητικά επικίνδυνα εργαλεία, ιδιαίτερα αν χρησιμοποιηθούν σε κρίσιμους τομείς όπως οι υποδομές ή η άμυνα.
(Με πληροφορίες Guardian)
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Περισσότεροι από 500 μαθητές συμμετείχαν στο πρόγραμμα Skills Clubs – Solve for Tomorrow
Νέα δεδομένα δείχνουν ότι επηρεάζονται από γονίδια, περιβάλλον και πρώιμες εμπειρίες όπως ακριβώς και οι άνθρωποι
Η Sony ξεκαθαρίζει ότι δεν σκοπεύει να πουλάει τη νέα της κονσόλα με ζημία - Γιατί εκτοξεύθηκε το κόστος κατασκευής
Η πλατφόρμα της Meta λανσάρει παγκοσμίως μια νέα λειτουργία απορρήτου - Πώς λειτουργεί
Τι ζητάμε σήμερα από την κάμερα του smartphone μας;
Υπάρχουν πολλοί καλοί φορητοί υπολογιστές στην αγορά, αλλά αυτός στοχεύει στην κορυφή
Ο διάσημος ηθοποιός μπαίνει στο δημοφιλές videogame στη νέα καλοκαιρινή ενημέρωση
Το άθροισμα της σοφίας της φύσης, της εφευρετικότητας και της σοφίας των ανθρώπων πρέπει να επηρεάσει δυναμικά και την εξέλιξη της τεχνητής νοημοσύνης
Πόσους δορυφόρους έχει εκτοξεύσει μέχρι σήμερα
Κανένας κίνδυνος σύγκρουσης, σύμφωνα με τον Ευρωπαϊκό Οργανισμό Διαστήματος
Το πολυαναμενόμενο βιντεοπαιχνίδι αναμένεται να σπάσει κάθε ρεκόρ κερδοφορίας, ξεπερνώντας κινηματογράφο και τηλεόραση
Το λάθος στο air condition που πληρώνεται ακριβά
O LineShine κατέκτησε την κορυφή της λίστας Top500, εκθρονίζοντας τον αμερικανικό El Capitan με επιδόσεις-ρεκόρ
Πώς διδάσκεις όταν η μηχανή ξέρει ήδη την απάντηση; Δύο υπουργοί και δύο εκπαιδευτικοί εξηγούν τι αλλάζει μέσα στην τάξη
Πλήθος βιβλίων για την τεχνητή νοημοσύνη στην εκπαίδευση και η διαφορά θεώρησης μεταξύ Δύσης και Ανατολικής Ασίας
Το μυστηριώδες εύρημα του 2ου αιώνα μ.Χ. αποκαλύπτει άγνωστες πρακτικές της ρωμαϊκής εποχής
Πόσο πιθανό σενάριο είναι η φωτιά ή η έκρηξη;
Οι ερευνητές θεωρούν πιθανότερο ότι προέρχεται από τον Γαλαξία μας
Τελικά είμαστε εθισμένοι στις αγορές, ή στην προσμονή τους;
Μελέτη δείχνει ότι η χειρόγραφη σημείωση ενεργοποιεί τον εγκέφαλο περισσότερο από την πληκτρολόγηση
Έχετε δει 20 από 200 άρθρα.