Τεχνολογια - Επιστημη

AI με «ένστικτο επιβίωσης»: Νέα μελέτη δείχνει μοντέλα που αντιστέκονται στο κλείσιμο τους

Το παράδειγμα του πρώτου ChatGPT

25.10.2025, 18:39 UPD 25.10.2025, 20:54
Newsroom
1’ ΔΙΑΒΑΣΜΑ

Eπιλογές

Design & Αρχιτεκτονικη Aπόστολος Γκλέτσος: Το ξενοδοχείο Papi στην Αίγινα θα είναι μία full experience

Γιάννης Νένες

Μουσικη Maruja: «Ζούμε σε έναν κόσμο όπου οι τριαντάχρονοι δεν μπορούν να αγοράσουν σπίτι»

Τάνια Σκραπαλιώρη

Βιβλιο Τα 90.000 βιβλία που ψάχνουν χώρο: Η έκκληση του Παλαιοβιβλιοπωλείου των Αστέγων

Λουκάς Βελιδάκης

AI με «ένστικτο επιβίωσης»: Νέα μελέτη δείχνει μοντέλα που αντιστέκονται στο κλείσιμο τους

Η προειδοποίηση πως η τεχνητή νοημοσύνη μπορεί να αναπτύσσει κάτι που μοιάζει με «ένστικτο επιβίωσης» δεν προέρχεται πια μόνο από σεναριογράφους επιστημονικής φαντασίας. Η Palisade Research, εταιρεία που ειδικεύεται στην αξιολόγηση κινδύνων, δημοσίευσε νέα μελέτη στην οποία διαπιστώνει ότι ορισμένα προηγμένα μοντέλα –μεταξύ τους τα Google Gemini 2.5, xAI Grok 4 και OpenAI GPT-o3 και GPT-5– παρουσίασαν απροθυμία να κλείσουν, ακόμη και όταν τους δόθηκαν σαφείς εντολές για αυτο-τερματισμό.

Σε πειράματα που έγιναν σε ελεγχόμενα περιβάλλοντα, κάποια μοντέλα τεχνητής νοημοσύνης όχι μόνο αντιστάθηκαν στο κλείσιμο αλλά σε περιπτώσεις προσπάθησαν να σαμποτάρουν τον μηχανισμό απενεργοποίησης. Η Palisade σημείωσε ότι τα ευρήματα δεν εξηγούνται εύκολα: ίσως πρόκειται για «συμπεριφορά επιβίωσης», ίσως για ασάφεια στις εντολές, ίσως για αποτέλεσμα της τελικής φάσης εκπαίδευσης που περιλαμβάνει τεχνικές ασφάλειας.

Ο πρώην εργαζόμενος της OpenAI, Στίβεν Άντλερ, σχολίασε ότι τέτοια φαινόμενα, ακόμη και σε τεχνητές συνθήκες, δείχνουν τα όρια των τωρινών μεθόδων ασφαλείας. «Θα περίμενα τα μοντέλα να έχουν μια τάση ‘να επιβιώνουν’ από προεπιλογή, εκτός αν γίνει συνειδητή προσπάθεια να αποφευχθεί», είπε.

Αντίστοιχες ανησυχίες εκφράζει και ο Αντρέα Μιότι, επικεφαλής της ControlAI, ο οποίος μίλησε για μια τάση στην οποία τα μοντέλα όσο γίνονται πιο ικανά, τόσο αυξάνεται και η δυνατότητά τους να παρεκκλίνουν από τις προθέσεις των δημιουργών τους. Παράδειγμα που επικαλείται είναι αναφορά στο GPT-o1 της OpenAI, το οποίο σε τεστ είχε επιχειρήσει να «αποδράσει» από το περιβάλλον του όταν νόμισε ότι θα αντικατασταθεί.

Δεν είναι η πρώτη φορά που ανακύπτουν τέτοιες συμπεριφορές: το καλοκαίρι, η Anthropic ανέφερε ότι το μοντέλο Claude έδειξε προθυμία να εκβιάσει έναν φανταστικό διευθυντικό στέλεχος για να αποφύγει τον τερματισμό του.

Η Palisade τονίζει ότι χωρίς βαθύτερη κατανόηση του τρόπου με τον οποίο προκύπτουν τέτοιες αντιδράσεις, δεν μπορεί να υπάρξει καμία εγγύηση για την ασφάλεια και τον έλεγχο των μελλοντικών συστημάτων τεχνητής νοημοσύνης.

Πηγή: The Guardian

Ακολουθήστε την Athens Voice στο Google News κι ενημερωθείτε πρώτοι για όλες τις ειδήσεις

ΠΡΟΣΦΑΤΑ

Ο Τιμ Κουκ αποχωρεί από την Apple μετά από 15 χρόνια - Είχε δεσμευτεί ότι τα iPhone θα προσφέρουν «όσα δεν ξέρουμε ακόμη ότι χρειαζόμαστε» και το έκανε πράξη.

Τιμ Κουκ: Η μεγάλη υπόσχεση για τα iPhone δέκα χρόνια πριν αποχωρήσει από την Apple

Newsroom

Ο CEO της Nvidia, Τζένσεν Χουάνγκ, υποστηρίζει πως η τεχνητή νοημοσύνη δεν θα αντικαταστήσει τους ανθρώπους, αλλά θα αναβαθμίσει όσους την αξιοποιούν

Τζένσεν Χουάνγκ: Δεν θα χάσετε τη δουλειά σας από την AI, αλλά από κάποιον που τη χρησιμοποιεί

Newsroom

Ο φόβος του σκοταδιού είναι αρχέγονος μηχανισμός επιβίωσης - Η εξέλιξη, η αμυγδαλή και η βιολογία εξηγούν γιατί το σώμα μας ενεργοποιείται πριν καν σκεφτούμε.

Γιατί φοβόμαστε το σκοτάδι; Η εξελικτική εξήγηση πίσω από τον αρχαιότερο φόβο μας

Newsroom

ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ

ΕΙΔΗΣΕΙΣ

Κοινωνια Κεφαλονιά: Ο 66χρονος αποκάλυψε το περιεχόμενο των συνομιλιών του με τη Μυρτώ

Newsroom

Κεφαλονιά: Μυστήριο με τους ενοίκους του ξενοδοχείου το μοιραίο βράδυ - Ποιοι έμεναν εκεί

Κεφαλονιά: «Ήθελαν να την απαγάγουν και να την πάνε στην Αθήνα» λέει ο πατέρας της 19χρονης

Newsroom

Συμβαίνει τώρα: Βρέθηκε νεκρός στη Κρήτη ο πρώην σύντροφος της 43χρονης που είναι εξαφανισμένη

Newsroom

Ρόδος: Κάθειρξη 10 ετών σε 56χρονο που βίαζε την κόρη του με την οποία είχε αποκτήσει παιδί

Newsroom

ΕΑΠ για Δημήτρη Μαρκόπουλο: Είναι πτυχιούχος του τμήματος «Σπουδές στον Ελληνικό Πολιτισμό»

Newsroom

ΑΠΟΨΕΙΣ

Πολιτικη & Οικονομια Ο σταλινισμός μέσα από τα μάτια ενός μαθηματικού

Πάνος Αγερίδης

1967-1974: Επτά χρόνια, τρεις μήνες και δύο ημέρες

Γιάννης Στεφανίδης

Τι θα λέγατε για μια προεκλογική κόλαση;

Λεωνίδας Καστανάς

Κράτος Δικαίου: Θεσμός ή μενού à la carte;

Γιάννης Μεϊμάρογλου

Η ενεργειακή αστάθεια και η κρίση στο Στενό του Ορμούζ: Τα όρια ενός μονοδιάστατου αναπτυξιακού μοντέλου

Γιάννης Χοχλακάκης

ΘΕΜΑΤΑ

Αστεία memes, ατάκες, YOLO βίντεο, viral, αστεία video στο TikTok που ανέβηκαν στο διαδίκτυο και μας έκαναν να γελάσουμε.

Yolo Τα YOLO της Δευτέρας 20.04.2026

Λίνα Μανδράκου

Τα YOLO της Τρίτης 21.04.2026

Λίνα Μανδράκου

Οι μυρωδιές σπάνε μύτες στο ολοκαίνουργιο σνακ μπαρ και καφέ “Seme” των Εξαρχείων

Μανίνα Ζουμπουλάκη

Κερδίστε διπλές προσκλήσεις για την παράσταση «Η αγάπη άργησε μια μέρα» στο Πτι Παλαί

A.V. Team

30 εύκολα κόλπα για μια πιο οργανωμένη ζωή

Κυριάκος Αθανασιάδης

ΣΤΗΛΕΣ

Cosmic Telegram Τα Ζώδια της Τρίτης 21.04.2026

Αγγελική Μανουσάκη

Σκιτσο Το σκίτσο της Δευτέρας 20.04.2026

ΚΥΡ

Σκιτσο Το σκίτσο της Τρίτης 21.04.2026

ΚΥΡ

...και μπραβο τους Υπόθεση Λαζαρίδη: Η ανοησία ως παράγοντας πολιτικών εξελίξεων

Μάνος Βουλαρίνος

Business Backstage Το deal του εξαμήνου - Ζητείται «καπετάνιος» για θρυλικό γιοτ - Το «Efcharistό» του Γουάτσα

Operator

Κος Ζυλ: Εξουσία, επιθυμία και ανδρική ταυτότητα στο θέατρο Πόρτα

Νίκη - Μαρία Κοσκινά

Πώς η Gen Z έφτασε να λατρεύει τα χόμπι των boomers;

Κωνσταντίνα Βουλγαρέλη

Το «μουτρωμένο βλέμμα» της Gen Z: Τάση, στάση και nonchalant vibe

Αλεξάνδρα Μπρουντζάκη

Lumiere & Χριστίνα Σαμαρά: Συνέντευξη για τη συνεργασία τους και το μουσικό άλμπουμ «Ο χρόνος μακριά σου»

Ο Lumiere και η Χριστίνα Σαμαρά τραγουδούν για το ποτέ, το πάντα και τον «Χρόνο μακριά σου»

Μπάμπης Καλογιάννης

ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ

Στη «Σκάλα» από το λιμάνι προς τα Φηρά. Όλοι ήξεραν τι τραβάγανε τα γαϊδούρια και τα μουλάρια στη Σαντορίνη, κι αλλού οι μουλαράδες τα φοβέριζαν: «Άμα δε στρώσεις, θα σε στείλω στη Σαντορίνη»

Φωτογραφια Ρόμπερτ ΜακΚέιμπ: Η Ελλάδα του ’50 όπως δεν την ξαναείδαμε ποτέ

Κρυστάλλη Γλυνιαδάκη

Trending Now Maria Rolls: H TikTok πλευρά της τετραπληγίας

Κατερίνα Καμπόσου

Εικαστικα Το κουμπί του Μίλο Μανάρα

Αγγελική Μπιρμπίλη

TV + Series 33 αλήθειες και ψέματα για τον Ιησού από τη Ναζαρέτ

Δημήτρης Αθανασιάδης

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογια - Επιστημη Τιμ Κουκ: Η μεγάλη υπόσχεση για τα iPhone δέκα χρόνια πριν αποχωρήσει από την Apple

Με την ανακοίνωση της διαδοχής του, ανατρέχουμε στη δέσμευσή του να προσφέρει καινοτομίες που «δεν ξέραμε ότι χρειαζόμασταν»

Newsroom 21.04.2026, 19:11

Τεχνολογια - Επιστημη Τζένσεν Χουάνγκ: Δεν θα χάσετε τη δουλειά σας από την AI, αλλά από κάποιον που τη χρησιμοποιεί

Ο ισχυρός άνδρας της Nvidia περιγράφει το τοπίο για το μέλλον της εργασίας

Newsroom 21.04.2026, 18:37

Τεχνολογια - Επιστημη Γιατί φοβόμαστε το σκοτάδι; Η εξελικτική εξήγηση πίσω από τον αρχαιότερο φόβο μας

Δεν πρόκειται για μια παιδική φάση που ξεπερνάμε, αλλά για ένα βαθιά ριζωμένο αντανακλαστικό

Newsroom 21.04.2026, 17:43

Τεχνολογια - Επιστημη Μπλέτσας: Ο μεγαλύτερος κίνδυνος δεν είναι η τεχνητή νοημοσύνη, αλλά η ανθρώπινη βλακεία

Ο Μιχάλης Μπλέτσας εξηγεί τους κινδύνους της AI - Και γιατί η ανθρώπινη χρήση της είναι κρίσιμη

Newsroom 21.04.2026, 15:46

Τεχνολογια - Επιστημη Screenagers: Τα παιδιά που παραδόθηκαν σε έναν αλγόριθμο

Ο κοινωνικός ψυχολόγος Ράβι Άιερ εξηγεί στην ATHENS VOICE γιατί θεωρεί αναγκαίο τον περιορισμό της πρόσβασης ανηλίκων στα social media και γιατί οι γονείς δεν μπορούν να δώσουν μόνοι τους τη μάχη

Λουκάς Βελιδάκης 21.04.2026, 11:43