- CITY GUIDE
- PODCAST
-
17°
«Sora», το επαναστατικό «text-to-video» εργαλείο της OpenAI
Πώς λειτουργεί ακριβώς
OpenAI: Επανήλθε με νέο επαναστατικό εργαλείο - Το «Sora» δημιουργεί βίντεο από κείμενα
Η OpenAI, δημιουργός του ChatGPT και του δημιουργού εικόνων DALL-E, παρουσίασε ένα νέο εργαλείο με την ονομασία «Sora», το οποίο είναι ικανό να δημιουργεί, με την απλή εισαγωγή ενός κειμένου, ρεαλιστικά βίντεο που μπορούν να διαρκέσουν μέχρι ένα λεπτό - μια τεράστια καινοτομία στον τομέα της τεχνητής νοημοσύνης.
Βασισμένη στις προηγούμενες έρευνες για τα προγράμματα DALL-E και GPT, αυτή η νέα πλατφόρμα είναι ακόμη υπό δοκιμή, διευκρίνισε η καλιφορνέζικη νεοφυής σύμμαχος της Microsoft, η οποία παρουσίασε πάντως μερικά βίντεο και τον τρόπο που δημιουργήθηκαν.
OpenAI: Τι μπορεί να κάνει το «Sora»
Το πρόγραμμα μπορεί να δημιουργήσει βίντεο μέγιστης διάρκειας ενός λεπτού «διατηρώντας οπτική ποιότητα και σεβόμενο το αίτημα του χρήστη», ανέφερε στον ιστότοπό της η OpenAI.
Το Sora μπορεί «να δημιουργεί πολύπλοκες σκηνές με πολλά πρόσωπα, συγκεκριμένους τύπους κινήσεων και ακριβείς λεπτομέρειες», αναφέρει στον ιστότοπό της η start-up.
Το Sora επιτρέπει επίσης να δημιουργηθεί βίντεο από μια σταθερή εικόνα, διαβεβαιώνει ο γίγαντας της τεχνητής νοημοσύνης ή και να επιμηκυνθούν υφιστάμενα βίντεο.
Ο Σαμ Άλτμαν, ο επικεφαλής της OpenAI, δήλωσε στο μέσο κοινωνικής δικτύωσης X πως η εταιρεία του «θα προσφέρει σε περιορισμένο αριθμό δημιουργών την πρόσβαση» σ' αυτό το νέο εργαλείο, στο πλαίσιο μιας πειραματικής φάσης.
Ο ίδιος κάλεσε επίσης τους χρήστες να κάνουν προτάσεις για τη δημιουργία βίντεο και μερικά λεπτά αργότερα ανέβασε στην πλατφόρμα τα πιο επιτυχημένα απ' αυτά.
Ανάμεσα σ' αυτά τα βίντεο βλέπει κανείς δύο σκύλους να παίζουν στο χιόνι σε βουνό. Ένα άλλο βίντεο δείχνει την πτήση ενός φανταστικού ζώου, μισό πάπια μισό δράκος, μπροστά σε ένα υπέροχο ηλιοβασίλεμα, έχοντας στην πλάτη του ένα χάμστερ με εκδρομική περιβολή.
Το Sora χρησιμεύει ως βάση για «προγράμματα ικανά να καταλάβουν και να προσομοιώσουν τον πραγματικό κόσμο», εξηγεί η νεοφυής, η οποία ελπίζει ότι «θα αποτελέσει ένα σημαντικό σταθμό στην πραγματοποίηση της AGI», της Γενικής Τεχνητής Νοημοσύνης, ενός πολύ αυτόνομου συστήματος που φέρεται ότι θα ξεπεράσει τους ανθρωπους στις περισσότερες από τις οικονομικά αποδοτικές δουλειές.
Η OpenAI προειδοποίησε ότι το «σημερινό μοντέλο» της πλατφόρμας παρουσιάζει «ελαττώματα», καθώς συγχέει το αριστερά με το δεξιά και εμφανίζει αδυναμία να διατηρήσει μια οπτική συνέχεια σε ολόκληρο το βίντεο.
«Για παράδειγμα, ένα πρόσωπο μπορεί να δαγκώσει ένα μπισκότο, όμως μετά το μπισκότο μπορεί να μην έχει ίχνη από το δάγκωμα», εξηγεί η εταιρεία.
Παρουσιάζοντας αυτό το νέο εργαλείο, η OpenAI ανέφερε πως το ζήτημα της ασφάλειας αποτελεί ουσιώδες διακύβευμα και ότι προσομοιώσεις θα οργανωθούν με χρήστες από τους οποίους θα ζητηθεί να παραγάγουν δυσλειτουργίες ή να δημιουργήσουν ανάρμοστα περιεχόμενα, ώστε να καθορισθούν καλύτερα τα όρια της πλατφόρμας.
«Θα καλέσουμε πρόσωπα που λαμβάνουν πολιτικές αποφάσεις, εκπαιδευτικούς και καλλιτέχνες απ' όλο τον κόσμο για να κατανοήσουμε τις ανησυχίες τους και να εντοπίσουμε τις θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας», ανέφερε η OpenAI. Οι Meta, Google και Runway AI, οι οποίες εργάζονται σε παρόμοιες εφαρμογές μετατροπής κειμένου σε βίντεο, τις λεγόμενες «text-to-video» («από κείμενο σε βίντεο»), έχουν ήδη παρουσιάσει δείγματα.
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Η πλατφόρμα δίνει τη δυνατότητα στους χρήστες να απενεργοποιούν τα βίντεο, εξοικονομώντας δεδομένα
Τι αποκαλύπτουν οι καθημερινές μουσικές σας συνήθειες για το πώς σκέφτεστε και επεξεργάζεστε πληροφορίες
Προσθαλάσσωση στον Ειρηνικό Ωκεανό για το πλήρωμα της NASA - «Η αρχή μιας νέας εποχής»
Νέα έρευνα αποδεικνύει ότι η απλή ακρόαση μουσικής αρκεί για να εκπαιδεύσει το μυαλό μας να αναγνωρίζει μοτίβα
Οι γιατροί της έλεγαν ότι έχει επιληψία, μετά πάρεση του Todd αλλά και άγχος - Τίποτα από αυτά δεν ήταν σωστό
Γιατί η εξερεύνηση του διαστήματος είναι σημαντική για την ανθρωπότητα και γιατί κάποιοι αμφισβητούν την αναγκαιότητα και τη σημασία αυτών των αποστολών
Εκατομμύρια συσκευές μένουν εκτός ηλεκτρονικού βιβλιοπωλείου - Οργή των χρηστών
Επιστήμονες κρούουν τον κώδωνα του κινδύνου - Οι επιπτώσεις στην υγεία του εγκεφάλου
Μετά την ιστορική αποστολή στη Σελήνη, το πλήρωμα ετοιμάζεται για τις σωματικές προκλήσεις που ακολουθούν
Η ικανότητά του να αποκαλύπτει κρυφές αδυναμίες λογισμικού οδηγεί σε πρωτοφανή μέτρα ασφαλείας
Η μεγαλύτερη άνοδος καταγράφεται σε αναδυόμενες οικονομίες
Μέσω ανάρτησης, παρουσιάζει το πρώτο βήμα προς την προσωπική υπερνοημοσύνη για όλους
Αστροναύτες κατέγραψαν έξι προσκρούσεις – Σπάνιο φαινόμενο με λάμψεις στη σεληνιακή επιφάνεια
Ο επιστήμονας Ρόμαν Γιαμπόλσκι εξηγεί γιατί η ραγδαία εξέλιξη της τεχνολογίας ενισχύει τη θεωρία
Η ΑΙ θα αναπτυχθεί και δεν θα υπάρξουν μόνο θετικές συνέπειες
Ο CEO του LinkedIn εξηγεί γιατί αυτές είναι το ισχυρότερο επαγγελματικό πλεονέκτημα
Ποινική έρευνα για παραβίαση προσωπικών δεδομένων - Σχεδίασε ειδικό λογισμικό
Και ποια είναι η επόμενη, μεγάλη δοκιμασία;
Η εταιρεία καλεί τις επιχειρήσεις να δοκιμάσουν νέα μοντέλα εργασίας
Τι πραγματικά σημαίνει να χάνεις τη δουλειά σου από την AI
Έχετε δει 20 από 200 άρθρα.