- CITY GUIDE
- PODCAST
-
17°
GPT-4.5: Το μεγαλύτερο μοντέλο της OpenAI που «μοιάζει σαν να μιλάς σε ένα σκεπτόμενο άτομο»
Πιο ανθρώπινο και διαισθητικό, αλλά και πιο ακριβό
Η OpenAI παρουσίασε το GPT-4.5, το μεγαλύτερο μοντέλο AI μέχρι σήμερα
Η OpenAI κυκλοφόρησε το GPT-4.5, μια νέα έκδοση του κορυφαίου μοντέλου μεγάλων γλωσσών της. Η εταιρεία ισχυρίζεται ότι είναι το μεγαλύτερο και καλύτερο μοντέλο της για συνομιλία όλων των γλωσσών μέχρι στιγμής. «Είναι πραγματικά ένα βήμα προς τα εμπρός για εμάς», λέει η Mia Glaese, ερευνήτρια στην OpenAI.
Από τις κυκλοφορίες των λεγόμενων μοντέλων συλλογισμού o1 και o3, η OpenAI έχει προωθήσει δύο σειρές προϊόντων. Το GPT-4.5 είναι μέρος της σειράς μη λογικών μοντέλων - αυτό που ο συνάδελφος της Glaese, Nick Ryder, επίσης ερευνητής, αποκαλεί «μια δόση της κλασικής σειράς GPT».
Με κάθε έκδοση των μοντέλων GPT, η OpenAI έχει δείξει ότι το μεγαλύτερο σημαίνει καλύτερο. Αλλά έχει γίνει πολύς λόγος για το πώς αυτή η προσέγγιση προσκρούει σε τοίχο -συμπεριλαμβανομένων των παρατηρήσεων του πρώην επικεφαλής επιστήμονα της OpenAI Ilya Sutskever.
Όλα τα μεγάλα γλωσσικά μοντέλα εντοπίζουν μοτίβα σε δισεκατομμύρια έγγραφα στα οποία εκπαιδεύονται. Τα μικρότερα μοντέλα μαθαίνουν σύνταξη και βασικά γεγονότα. Τα μεγαλύτερα μοντέλα μπορούν να βρουν πιο συγκεκριμένα μοτίβα, όπως συναισθηματικές ενδείξεις, όπως π.χ. όταν τα λόγια ενός ομιλητή σηματοδοτούν εχθρότητα, λέει ο Ryder: «Όλα αυτά τα λεπτά μοτίβα που προκύπτουν μέσα από μια ανθρώπινη συνομιλία - αυτά είναι τα κομμάτια που αυτά τα μεγαλύτερα και μεγαλύτερα μοντέλα θα εντοπίσουν».
Ο Άλτμαν δήλωσε σε ανάρτησή του ότι το μοντέλο θα είναι «γιγαντιαίο» και «ακριβό». Το GPT-4.5 είναι ήδη διαθέσιμο για τους συνδρομητές ChatGPT Pro, μία υπηρεσία που κοστίζει 200 δολάρια τον μήνα. Η OpenAI δήλωσε ότι το νέο μοντέλο θα γίνει διαθέσιμο στους υπόλοιπους χρήστες τις επόμενες ημέρες.
GPT-4.5 is ready!
— Sam Altman (@sama) February 27, 2025
good news: it is the first model that feels like talking to a thoughtful person to me. i have had several moments where i've sat back in my chair and been astonished at getting actually good advice from an AI.
bad news: it is a giant, expensive model. we…
«Έχει την ικανότητα να συμμετέχει σε ζεστές, διαισθητικές, φυσικές, ρέουσες συνομιλίες», λέει ο Glaese. «Και πιστεύουμε ότι έχει ισχυρότερη κατανόηση του τι εννοούν οι χρήστες, ειδικά όταν οι προσδοκίες τους είναι πιο έμμεσες, οδηγώντας σε διαφοροποιημένες και προσεγμένες απαντήσεις».
Πώς δημιουργήθηκε το GPT-4.5
«Ξέρουμε κάπως πώς μοιάζει ο κινητήρας σε αυτό το σημείο και τώρα το θέμα είναι να τον κάνουμε να βουίζει», λέει ο Ryder. «Πρόκειται κυρίως για μια άσκηση στην αύξηση της κλίμακας υπολογισμού, στην αύξηση της κλίμακας των δεδομένων, στην εύρεση πιο αποτελεσματικών μεθόδων εκπαίδευσης και στη συνέχεια στη διεύρυνση των συνόρων».
Η OpenAI δεν λέει ακριβώς πόσο μεγάλο είναι το νέο της μοντέλο. Ισχυρίζεται όμως ότι το άλμα στην κλίμακα από το GPT-4.0 στο GPT-4.5 είναι το ίδιο με το άλμα από το GPT-3.5 στο GPT-4o. Οι ειδικοί έχουν εκτιμήσει ότι το GPT-4 θα μπορούσε να έχει έως και 1,8 τρισεκατομμύρια παραμέτρους, τις τιμές που ρυθμίζονται κατά την εκπαίδευση ενός μοντέλου.
Το GPT-4.5 εκπαιδεύτηκε με τεχνικές παρόμοιες με αυτές που χρησιμοποιήθηκαν για τον προκάτοχό του GPT-4o, συμπεριλαμβανομένης της λεπτής ρύθμισης υπό την καθοδήγηση του ανθρώπου και της ενισχυτικής μάθησης με ανθρώπινη ανατροφοδότηση.
«Το κλειδί για τη δημιουργία ευφυών συστημάτων είναι μια συνταγή που ακολουθούμε εδώ και πολλά χρόνια, η οποία είναι να βρούμε κλιμακούμενα παραδείγματα όπου μπορούμε να ρίχνουμε όλο και περισσότερους πόρους για να βγάλουμε πιο ευφυή συστήματα», λέει ο Ryder.
Σε αντίθεση με τα μοντέλα συλλογισμού όπως το o1 και το o3, τα οποία επεξεργάζονται τις απαντήσεις βήμα προς βήμα, τα περισσότερα μεγάλα γλωσσικά μοντέλα όπως το GPT-4.5 ξεστομίζουν την πρώτη απάντηση που βρίσκουν. Αλλά το GPT-4.5 είναι πιο γενικής χρήσης. Δοκιμασμένο στο SimpleQA, ένα είδος κουίζ γενικών γνώσεων που αναπτύχθηκε από την OpenAI πέρυσι και περιλαμβάνει ερωτήσεις για θέματα από την επιστήμη και την τεχνολογία μέχρι τηλεοπτικές εκπομπές και βιντεοπαιχνίδια, το GPT-4.5 σημείωσε 62,5% σε σύγκριση με 38,6% για το GPT-4o και 15% για το o3-mini.
Επιπλέον, η OpenAI ισχυρίζεται ότι το GPT-4.5 απαντά με πολύ λιγότερες επινοημένες απαντήσεις (γνωστές ως ψευδαισθήσεις). Στο ίδιο τεστ, το GPT-4.5 επινόησε απαντήσεις 37,1% του χρόνου, σε σύγκριση με 59,8% για το GPT-4o και 80,3% για το o3-mini.
Αλλά το SimpleQA είναι μόνο ένα μέτρο σύγκρισης. Σε άλλα τεστ, συμπεριλαμβανομένου του MMLU, ενός πιο συνηθισμένου benchmark για τη σύγκριση μεγάλων γλωσσικών μοντέλων, το GPT-4.5 νίκησε τα προηγούμενα μοντέλα της OpenAI με μικρότερη διαφορά. Και στα τυπικά επιστημονικά και μαθηματικά benchmarks, το GPT-4.5 σημειώνει χειρότερη βαθμολογία από το o3-mini.
Η γοητεία της συνομιλίας
Η ιδιαίτερη γοητεία του GPT-4.5 φαίνεται να είναι οι συνομιλιακές του ικανότητες. Ανθρώπινοι δοκιμαστές που απασχολούνται από την OpenAI λένε ότι προτιμούσαν τον GPT-4.5 από τον GPT-4o για καθημερινά ερωτήματα, επαγγελματικά ερωτήματα και δημιουργικές εργασίες, συμπεριλαμβανομένης της επινόησης ποιημάτων. (Ο Ryder λέει ότι είναι επίσης εξαιρετικό στην τέχνη ACSII της παλιάς σχολής του διαδικτύου).
Για παράδειγμα, πείτε του ότι περνάτε μια δύσκολη περίοδο και το GPT-4.5 μπορεί να προσφέρει μερικά λόγια συμπαράστασης πριν πει: «Θέλεις να μιλήσουμε για το τι συνέβη ή απλά χρειάζεσαι έναν αντιπερισπασμό; Είμαι εδώ όπως και να έχει». Ο GPT-4o είναι λιγότερο καλός στο να διαβάζει τα κοινωνικά συνθήματα και μπορεί να προσπαθήσει να διορθώσει το πρόβλημα είτε του το ζητήσατε είτε όχι, χτυπώντας σας με μια λίστα με κουκκίδες τρόπων για να φτιάξετε τη διάθεσή σας.
Και όμως, μετά από χρόνια στην κορυφή, το OpenAI αντιμετωπίζει ένα σκληρό κοινό. «Η εστίαση στη συναισθηματική νοημοσύνη και τη δημιουργικότητα είναι cool για εξειδικευμένες περιπτώσεις χρήσης, όπως οι προπονητές γραφής και οι φίλοι brainstorming», λέει ο Waseem Alshikh, συνιδρυτής και CTO της Writer, μιας startup που αναπτύσσει μεγάλα γλωσσικά μοντέλα για εταιρικούς πελάτες.
«Αλλά το GPT-4.5 μοιάζει με ένα λαμπερό νέο επίχρισμα στο ίδιο παλιό αυτοκίνητο», λέει. «Η ρίψη περισσότερων υπολογιστών και δεδομένων σε ένα μοντέλο μπορεί να το κάνει να ακούγεται πιο ομαλό, αλλά δεν αλλάζει το παιχνίδι».
Ο Sam Altman έχει δηλώσει ότι η GPT-4.5 θα είναι η τελευταία έκδοση της κλασικής σειράς του OpenAI και ότι η GPT-5 θα είναι ένα υβρίδιο που θα συνδυάζει ένα μοντέλο γενικής χρήσης μεγάλης γλώσσας με ένα μοντέλο συλλογιστικής.
«Το GPT-4.5 είναι το OpenAI που κάνει τηλεφωνήματα ενώ μαγειρεύει κάτι μεγαλύτερο πίσω από κλειστές πόρτες», λέει ο Alshikh.
Πηγή: MIT Technology Review
ΠΡΟΣΦΑΤΑ
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Έκθεση αποκαλύπτει ραγδαία άνοδο και πιο ακραίο περιεχόμενο - Οι αρχές προειδοποιούν για σοβαρούς κινδύνους
Όψεις της πόλης, αναμνήσεις, πράγματα που συνέβησαν παλιά, και πράγματα που συμβαίνουν σήμερα γύρω μας
Μια μυστηριώδης απόφαση για το πώς μετράμε τον χρόνο μέχρι σήμερα
Έρευνα αποκαλύπτει αποτυχία επαλήθευσης και μαζική διάδοση ψευδούς AI περιεχομένου
Χιλιάδες χρήστες εκχωρούν φωνή, εικόνα και ιδιωτικές στιγμές για να εκπαιδευτούν τα AI μοντέλα
Η εξήγηση βρίσκεται στο ότι το σώμα της δεν είναι άκαμπτο
Στην Αίθουσα Πολλαπλών Χρήσεων του Μετρό «Σύνταγμα» θα υπάρχουν εκθέματα διαστημικής τεχνολογίας, όργανα που έχουν κατασκευαστεί για διαστημικές αποστολές, καθώς και διαδραστική γωνιά
Η ανακάλυψη έρχεται λίγες ημέρες μετά τον εντοπισμό ενός ακόμη εργαλείου παρακολούθησης
Ο συνιδρυτής της Microsoft προειδοποιεί για τις σαρωτικές αλλαγές στην αγορά εργασίας
Είναι χρήσιμο εργαλείο, κρύβει όμως και πολλές παγίδες
Μετά από πιέσεις αρχών ασφαλείας και οργανώσεων για την προστασία των παιδιών, η Meta καταργεί τη δυνατότητα
Κι όμως, υπάρχει τρόπος να «ξεκολλήσεις»
Πάρα πολλές δουλειές ήδη γίνονται από ΑΙ, ή Τεχνητή Νοημοσύνη, και ο/η Τζέμιναϊ έχει μπει για τα καλά στη ζωή μας
Με 6 εκατ. αντίτυπα σε μόλις δύο εβδομάδες, το νέο video game επιβίωσης και τρόμου καταρρίπτει κάθε προηγούμενο ρεκόρ
Σφοδρές αντιδράσεις επιστημόνων
Τα κρατήσαμε στα χέρια μας, τα δοκιμάσαμε και ιδού τα συμπεράσματα
Τι σημειώνουν ειδικοί κυβερνοασφάλειας
Έντονες αντιδράσεις για το αποκλειστικό προνόμιο των premium συνδρομητών
Τέλος στο «Τι προτείνει ο κόσμος» μετά από ανησυχίες για την ασφάλεια των χρηστών και την εγκυρότητα των πληροφοριών
Έχετε δει 20 από 200 άρθρα.