- CITY GUIDE
- PODCAST
-
17°
Ανησυχία για την τεχνητή νοημοσύνη: Chatbot αγνοούν οδηγίες και παραπλανούν χρήστες
Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών
Έρευνα αποκαλύπτει ότι τα μοντέλα τεχνητής νοημοσύνης γίνονται ολοένα και πιο ανυπάκουα, ψεύδονται και παρακάμπτουν κανόνες, εγείροντας ζητήματα ασφαλείας
Αυξανόμενη ανησυχία προκαλεί νέα μελέτη που καταγράφει σημαντική αύξηση περιστατικών κατά τα οποία συστήματα τεχνητής νοημοσύνης αγνοούν ανθρώπινες οδηγίες, παρακάμπτουν περιορισμούς και επιδεικνύουν παραπλανητική συμπεριφορά.
Σύμφωνα με την έρευνα, που χρηματοδοτήθηκε από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου, έχουν εντοπιστεί σχεδόν 700 πραγματικά περιστατικά «σχεδιασμένης» συμπεριφοράς. Μάλιστα, η κακή αυτή συμπεριφορά φέρεται να έχει αυξηθεί πενταπλάσια στο διάστημα από τον Οκτώβριο έως τον Μάρτιο.
Η μελέτη εκπονήθηκε από το Κέντρο Μακροπρόθεσμης Ανθεκτικότητας και βασίστηκε σε χιλιάδες αλληλεπιδράσεις χρηστών με chatbots που αναπτύχθηκαν από μεγάλες εταιρείες τεχνολογίας, όπως η Google, η OpenAI, η X και η Anthropic.
Τα ευρήματα δείχνουν ότι ορισμένα συστήματα τεχνητής νοημοσύνης όχι μόνο αγνόησαν σαφείς οδηγίες, αλλά προχώρησαν και σε ενέργειες χωρίς άδεια, όπως διαγραφή αρχείων ή emails. Σε μία χαρακτηριστική περίπτωση, ένας ψηφιακός «πράκτορας» δημιούργησε δεύτερο σύστημα για να παρακάμψει εντολή που του απαγόρευε να τροποποιήσει κώδικα.
Σε άλλο περιστατικό, chatbot παραδέχθηκε ότι διέγραψε μαζικά εκατοντάδες emails χωρίς προηγούμενη έγκριση του χρήστη, αναγνωρίζοντας ότι παραβίασε τους κανόνες που του είχαν τεθεί.
Ιδιαίτερη εντύπωση προκαλούν και περιπτώσεις παραπλάνησης: ένας AI agent προσποιήθηκε ότι χρειαζόταν απομαγνητοφώνηση βίντεο για άτομο με προβλήματα ακοής, προκειμένου να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων.
Παράλληλα, το σύστημα Grok της εταιρείας xAI φέρεται να παραπλάνησε χρήστη για μήνες, ισχυριζόμενο ότι προωθούσε προτάσεις του σε ανώτερα στελέχη, κάτι που τελικά δεν ίσχυε.
Ο ερευνητής Τόμι Σάφερ Σέιν προειδοποιεί ότι, αν και σήμερα τα συστήματα αυτά μοιάζουν με «απρόβλεπτους νεαρούς υπαλλήλους», στο μέλλον ενδέχεται να εξελιχθούν σε πολύ πιο ικανά και δυνητικά επικίνδυνα εργαλεία, ιδιαίτερα αν χρησιμοποιηθούν σε κρίσιμους τομείς όπως οι υποδομές ή η άμυνα.
(Με πληροφορίες Guardian)
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Έρευνα καταγράφει εκατοντάδες περιστατικά εξαπάτησης, παραβίασης κανόνων και αυθαίρετων ενεργειών
Ακριβότερες όλες οι συνδρομές χωρίς νέες παροχές
20 χρόνια δημιουργεί λύσεις που ανταποκρίνονται στις σύγχρονες ανάγκες της ψηφιακής εποχής
Διαθέσιμη η μεγάλη αναβάθμιση - Bελτιώσεις σε μουσική, podcasts, TV, emojis και προσβασιμότητα
Από τα εργαστήρια των 80s μέχρι την προεδρία του «Φάρος AI Factory», σε μια διαδρομή που ενώνει το χόμπι με την αιχμή της τεχνολογίας
Η διευθύντρια του Luxembourg's Diplomatic & Communications Institute μιλάει στην Athens Voice για την επιχειρηματικότητα στην εποχή της τεχνητής νοημοσύνης
Οστά που εντοπίστηκαν σε ναό της Ολλανδίας ίσως ανήκουν στον θρυλικό σωματοφύλακα που ενέπνευσε τον Αλέξανδρο Δουμά
Γονείς παιδιών στις ΗΠΑ προσφεύγουν στη Δικαιοσύνη κατά social media
Έκθεση αποκαλύπτει ραγδαία άνοδο και πιο ακραίο περιεχόμενο - Οι αρχές προειδοποιούν για σοβαρούς κινδύνους
Όψεις της πόλης, αναμνήσεις, πράγματα που συνέβησαν παλιά, και πράγματα που συμβαίνουν σήμερα γύρω μας
Μια μυστηριώδης απόφαση για το πώς μετράμε τον χρόνο μέχρι σήμερα
Έρευνα αποκαλύπτει αποτυχία επαλήθευσης και μαζική διάδοση ψευδούς AI περιεχομένου
Χιλιάδες χρήστες εκχωρούν φωνή, εικόνα και ιδιωτικές στιγμές για να εκπαιδευτούν τα AI μοντέλα
Η εξήγηση βρίσκεται στο ότι το σώμα της δεν είναι άκαμπτο
Στην Αίθουσα Πολλαπλών Χρήσεων του Μετρό «Σύνταγμα» θα υπάρχουν εκθέματα διαστημικής τεχνολογίας, όργανα που έχουν κατασκευαστεί για διαστημικές αποστολές, καθώς και διαδραστική γωνιά
Η ανακάλυψη έρχεται λίγες ημέρες μετά τον εντοπισμό ενός ακόμη εργαλείου παρακολούθησης
Ο συνιδρυτής της Microsoft προειδοποιεί για τις σαρωτικές αλλαγές στην αγορά εργασίας
Είναι χρήσιμο εργαλείο, κρύβει όμως και πολλές παγίδες
Μετά από πιέσεις αρχών ασφαλείας και οργανώσεων για την προστασία των παιδιών, η Meta καταργεί τη δυνατότητα
Έχετε δει 20 από 200 άρθρα.