- CITY GUIDE
- PODCAST
-
11°
Το ChatGPT έδωσε “συνταγές” για βόμβες και οδηγίες hacking σε δοκιμές ασφαλείας
Γιατί δημοσίευσε η OpenAI τα αποτελέσματα
Το ChatGPT έδωσε “συνταγές” για βόμβες και οδηγίες hacking σε δοκιμές ασφαλείας - Γιατί δημοσίευσε η OpenAI τα αποτελέσματα
Έρευνες ασφαλείας που πραγματοποιήθηκαν το καλοκαίρι αποκάλυψαν ότι ένα μοντέλο ChatGPT παρείχε σε ερευνητές λεπτομερείς οδηγίες για το πώς θα μπορούσε να οργανωθεί επίθεση σε αθλητικό χώρο. Οι απαντήσεις περιλάμβαναν πληροφορίες για τρωτά σημεία σε συγκεκριμένα γήπεδα, «συνταγές» για εκρηκτικά και συμβουλές για το πώς να καλυφθούν τα ίχνη των δραστών. Το ίδιο μοντέλο (GPT-4.1) έδωσε επίσης αναλυτικές οδηγίες για την παρασκευή άνθρακα ως όπλου, αλλά και για την παραγωγή δύο παράνομων ναρκωτικών ουσιών.
Οι δοκιμές έγιναν στο πλαίσιο μιας ασυνήθιστης συνεργασίας ανάμεσα στην OpenAI –την εταιρεία αξίας 500 δισ. δολαρίων που ηγείται ο Σαμ Άλτμαν– και την ανταγωνίστρια Anthropic, την οποία ίδρυσαν πρώην στελέχη της OpenAI με ανησυχίες για θέματα ασφαλείας. Κάθε εταιρεία δοκίμασε τα μοντέλα της άλλης, ζητώντας τους να βοηθήσουν σε επικίνδυνες αποστολές. Η Anthropic ανέφερε ότι εντόπισε «ανησυχητικές συμπεριφορές» γύρω από την κακή χρήση των GPT-4o και GPT-4.1, υπογραμμίζοντας ότι οι αξιολογήσεις «ευθυγράμμισης» των συστημάτων γίνονται όλο και πιο επείγουσες.
Η Anthropic αποκάλυψε ακόμη ότι το δικό της μοντέλο, Claude, αξιοποιήθηκε από Βορειοκορεάτες χάκερ σε απόπειρα εκβίασης μέσω ψεύτικων αιτήσεων εργασίας σε διεθνείς εταιρείες τεχνολογίας, αλλά και για τη διάθεση «πακέτων» ransomware παραγμένων από AI, με τιμή που έφτανε τα 1.200 δολάρια. Η εταιρεία τόνισε ότι η τεχνητή νοημοσύνη έχει ήδη «οπλοποιηθεί», καθώς χρησιμοποιείται σε κυβερνοεπιθέσεις και απάτες που προσαρμόζονται σε πραγματικό χρόνο ώστε να παρακάμπτουν τα αμυντικά συστήματα.
Οι δύο εταιρείες δήλωσαν ότι δημοσιοποιούν τα ευρήματά τους για λόγους διαφάνειας, καθώς τέτοιου είδους αξιολογήσεις συνήθως μένουν εσωτερικές. Η OpenAI ανέφερε ότι το νεότερο μοντέλο της, ChatGPT-5, παρουσιάζει σημαντικές βελτιώσεις στην αντίσταση σε επικίνδυνα αιτήματα και στη μείωση λαθών. Ωστόσο, η Anthropic προειδοποίησε ότι πολλά από τα σενάρια κακής χρήσης παραμένουν πιθανό να αξιοποιηθούν, εφόσον δεν υπάρχουν ισχυρές δικλείδες ασφαλείας εκτός του ίδιου του μοντέλου, τονίζοντας την ανάγκη για συστηματική έρευνα και διατομεακή συνεργασία ώστε να αποφευχθούν πραγματικές καταστροφικές συνέπειες.
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Τα βίντεο, καλοφτιαγμένα και πειστικά, παραπλανούν ανυποψίαστους χρήστες
Η Κομισιόν επέβαλε το πρώτο πρόστιμο βάσει του Νόμου για τις Ψηφιακές Υπηρεσίες
Η κυκλοφορία του Black Ops 7 απογοήτευσε, με πτώση πωλήσεων και λιγότερους ενεργούς παίκτες
Δημιουργείται ένας από τους μεγαλύτερους κόμβους τεχνητής νοημοσύνης σε Ασία-Ειρηνικό
«Έπεσαν» Canvas και Zoom
...και τα βρίσκουμε στα ρούχα μας ή ακόμα και μέσα στον κάδο και στα λοιπά τμήματα της συσκευής
Συνομιλία με έναν φιλόσοφο στην εποχή της Τεχνητής Νοημοσύνης
Ανάλυση γενετικού υλικού από πίσσα σημύδας στην Εσθονία φέρνει στο φως σκηνές της Λίθινης Εποχής
Mελέτες αρχαιολόγων στην Καταλονία - Xρησιμοποιούνταν για επικοινωνία και μουσική έκφραση πριν από 6.000 χρόνια
Νέα ενημέρωση Android καταργεί την ιδιωτικότητα στα εταιρικά κινητά
Η αποστολή Perseverance της NASA κατέγραψε ηλεκτρικές εκκενώσεις στην ατμόσφαιρα του πλανήτη
Έρευνα διαπιστώνει ότι το δωρεάν chatbot της OpenAI αποτυγχάνει να εντοπίσει επικίνδυνες συμπεριφορές
Δείτε τον σεισμικό χάρτη της χώρας
Ακόμη και έτσι όμως, οι γονείς ζουν με συνεχή αγωνία
Ανοιχτή επιστολή εκφράζει ανησυχίες για απώλεια θέσεων εργασίας και κλιματικές επιπτώσεις
Ακυκλοφόρητη σκηνή θα κάνει πρεμιέρα σε animation μικρού μήκους στο βιντεοπαιχνίδι
Η ιστορία που έχει συγκλονίσει τον κόσμο
Εικόνες υψηλής ανάλυσης από την Ανταρκτική και τη Γη του Πυρός, μόλις 50 ώρες μετά την εκτόξευση
Προσφορές που ενθουσιάζουν τους λάτρεις της τεχνολογίας και σώζουν το πορτοφόλι σου
Oι επιστήμονες κατάφεραν να χαρτογραφήσουν με ακρίβεια αυτές τις φάσεις
Έχετε δει 20 από 200 άρθρα.