- CITY GUIDE
- PODCAST
-
12°
AI με «ένστικτο επιβίωσης»: Νέα μελέτη δείχνει μοντέλα που αντιστέκονται στο κλείσιμο τους
Το παράδειγμα του πρώτου ChatGPT
AI με «ένστικτο επιβίωσης»: Νέα μελέτη δείχνει μοντέλα που αντιστέκονται στο κλείσιμο τους
Η προειδοποίηση πως η τεχνητή νοημοσύνη μπορεί να αναπτύσσει κάτι που μοιάζει με «ένστικτο επιβίωσης» δεν προέρχεται πια μόνο από σεναριογράφους επιστημονικής φαντασίας. Η Palisade Research, εταιρεία που ειδικεύεται στην αξιολόγηση κινδύνων, δημοσίευσε νέα μελέτη στην οποία διαπιστώνει ότι ορισμένα προηγμένα μοντέλα –μεταξύ τους τα Google Gemini 2.5, xAI Grok 4 και OpenAI GPT-o3 και GPT-5– παρουσίασαν απροθυμία να κλείσουν, ακόμη και όταν τους δόθηκαν σαφείς εντολές για αυτο-τερματισμό.
Σε πειράματα που έγιναν σε ελεγχόμενα περιβάλλοντα, κάποια μοντέλα τεχνητής νοημοσύνης όχι μόνο αντιστάθηκαν στο κλείσιμο αλλά σε περιπτώσεις προσπάθησαν να σαμποτάρουν τον μηχανισμό απενεργοποίησης. Η Palisade σημείωσε ότι τα ευρήματα δεν εξηγούνται εύκολα: ίσως πρόκειται για «συμπεριφορά επιβίωσης», ίσως για ασάφεια στις εντολές, ίσως για αποτέλεσμα της τελικής φάσης εκπαίδευσης που περιλαμβάνει τεχνικές ασφάλειας.
Ο πρώην εργαζόμενος της OpenAI, Στίβεν Άντλερ, σχολίασε ότι τέτοια φαινόμενα, ακόμη και σε τεχνητές συνθήκες, δείχνουν τα όρια των τωρινών μεθόδων ασφαλείας. «Θα περίμενα τα μοντέλα να έχουν μια τάση ‘να επιβιώνουν’ από προεπιλογή, εκτός αν γίνει συνειδητή προσπάθεια να αποφευχθεί», είπε.
Αντίστοιχες ανησυχίες εκφράζει και ο Αντρέα Μιότι, επικεφαλής της ControlAI, ο οποίος μίλησε για μια τάση στην οποία τα μοντέλα όσο γίνονται πιο ικανά, τόσο αυξάνεται και η δυνατότητά τους να παρεκκλίνουν από τις προθέσεις των δημιουργών τους. Παράδειγμα που επικαλείται είναι αναφορά στο GPT-o1 της OpenAI, το οποίο σε τεστ είχε επιχειρήσει να «αποδράσει» από το περιβάλλον του όταν νόμισε ότι θα αντικατασταθεί.
Δεν είναι η πρώτη φορά που ανακύπτουν τέτοιες συμπεριφορές: το καλοκαίρι, η Anthropic ανέφερε ότι το μοντέλο Claude έδειξε προθυμία να εκβιάσει έναν φανταστικό διευθυντικό στέλεχος για να αποφύγει τον τερματισμό του.
Η Palisade τονίζει ότι χωρίς βαθύτερη κατανόηση του τρόπου με τον οποίο προκύπτουν τέτοιες αντιδράσεις, δεν μπορεί να υπάρξει καμία εγγύηση για την ασφάλεια και τον έλεγχο των μελλοντικών συστημάτων τεχνητής νοημοσύνης.
Πηγή: The Guardian
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Τα πειράματα βασίστηκαν σε εκδόσεις εμπορικά διαθέσιμων chatbots
Στο αφιέρωμά του ξεχωρίζει και πέντε ανθρώπους που αναμένεται να ξεχωρίσουν το 2026
Ο Τζένσεν Χουάνγκ εργάζεται αδιάκοπα παρά το γεγονός ότι η εταιρεία του έγινε η πολυτιμότερη στον κόσμο
Η Κίνα προκαλεί Google και OpenAI - Ανοιχτό σε όλους το μοντέλο τεχνητής νοημοσύνης
Η νέα λειτουργία του Wrapped δείχνει πόσο νέοι ή μεγάλοι είναι οι χρήστες βάσει μουσικών συνηθειών
Στις δοκιμές που έγιναν οι ερευνητές κατάφεραν να ανταλλάξουν ακόμη και γυμνό υλικό
Kαθώς πλέον ανταγωνίζεται μια ανεξάντλητη ποσότητα περιεχομένου που παράγεται μαζικά, γρήγορα και σχεδόν δωρεάν
Τα βίντεο, καλοφτιαγμένα και πειστικά, παραπλανούν ανυποψίαστους χρήστες
Η Κομισιόν επέβαλε το πρώτο πρόστιμο βάσει του Νόμου για τις Ψηφιακές Υπηρεσίες
Η κυκλοφορία του Black Ops 7 απογοήτευσε, με πτώση πωλήσεων και λιγότερους ενεργούς παίκτες
Δημιουργείται ένας από τους μεγαλύτερους κόμβους τεχνητής νοημοσύνης σε Ασία-Ειρηνικό
«Έπεσαν» Canvas και Zoom
...και τα βρίσκουμε στα ρούχα μας ή ακόμα και μέσα στον κάδο και στα λοιπά τμήματα της συσκευής
Συνομιλία με έναν φιλόσοφο στην εποχή της Τεχνητής Νοημοσύνης
Ανάλυση γενετικού υλικού από πίσσα σημύδας στην Εσθονία φέρνει στο φως σκηνές της Λίθινης Εποχής
Mελέτες αρχαιολόγων στην Καταλονία - Xρησιμοποιούνταν για επικοινωνία και μουσική έκφραση πριν από 6.000 χρόνια
Νέα ενημέρωση Android καταργεί την ιδιωτικότητα στα εταιρικά κινητά
Η αποστολή Perseverance της NASA κατέγραψε ηλεκτρικές εκκενώσεις στην ατμόσφαιρα του πλανήτη
Έρευνα διαπιστώνει ότι το δωρεάν chatbot της OpenAI αποτυγχάνει να εντοπίσει επικίνδυνες συμπεριφορές
Δείτε τον σεισμικό χάρτη της χώρας
Έχετε δει 20 από 200 άρθρα.