- CITY GUIDE
- PODCAST
-
17°
Google Translate: Όχι πια χαμένοι στη μετάφραση
Το επόμενο project της Google, «Translatotron», αναβαθμίζει τη μετάφραση ομιλίας
Τα οφέλη και οι αστοχίες του Google Translate και το επόμενο βήμα της εταιρείας για ακριβέστερη μετάφραση της ομιλίας
Η ικανότητα της άμεσης κατανόησης και ικανότητας ομιλίας οποιασδήποτε γλώσσας ήταν κάποτε ένα από τα πρωτογενή υλικά της επιστημονικής φαντασίας. Το ρομπότ C-3PO του Star Wars μιλάει άπταιστα 6 εκατομμύρια γλώσσες. Ο Arthur Dent, ο ήρωας του «Γυρίστε το Γαλαξία με ΏτοΣτοπ», είχε στο αυτί του μια μικρή συσκευή που του επέτρεπε να κατανοεί και να συνομιλεί αβίαστα με διάφορους εξωγήινους. Η σημερινή τεχνολογία όμως έχει σιγά-σιγά κάνει τη φαντασία πραγματικότητα. Οι φορητοί ηλεκτρονικοί μεταφραστές και οι αντίστοιχες εφαρμογές είναι δημοφιλείς στην Ασία εδώ και δεκαετίες, ωστόσο η πραγματική επανάσταση ξεκίνησε με την εμφάνιση του Google Translate το 2006 και σήμερα το εργαλείο έχει πάνω από 500 εκατομμύρια χρήστες. Η κυκλοφορία της εφαρμογής για Android του Google Translate το 2010 (και για το iOS ένα χρόνο αργότερα) συνέπεσε με τη μεγάλη αύξηση του παγκόσμιου τουρισμού. Το πολύτιμο εργαλείο μάς βοήθησε να διαβάζουμε κινέζικα άρθρα, χρησιμοποιήθηκε από τους αθλητές Ολυμπιακών Αγώνων και του Παγκοσμίου Κυπέλλου ποδοσφαίρου για να δημιουργήσουν φιλίες, επέτρεψε στους εργαζόμενους σε νευραλγικές θέσεις να συνομιλήσουν με μετανάστες και πρόσφυγες αλλά οδήγησε και σε προβλήματα κάποιες φορές λόγω αστοχιών. Οι σεφ της νορβηγικής ομάδας των Χειμερινών Ολυμπιακών του 2018 παρήγγειλαν κατά λάθος 15.000 αυγά αντί για 1.500. Στην Ουκρανία, μετέφρασε τους Ρώσους ως «κακοποιούς» και το όνομα του υπουργού Εξωτερικών της Ρωσίας Σεργκέι Λαβρόφ σε «λυπημένο μικρό άλογο».
143 δισεκατομμύρια: Οι λέξεις που μεταφράζει το Google Translate κάθε ημέρα
7.099: Οι διακριτές γλώσσες παγκοσμίως το 2017
103: Οι γλώσσες που υποστηρίζει το Google Translate
12: Οι γλώσσες στις οποίες είναι φυσικοί ομιλητές το 63% του παγκόσμιου πληθυσμού (αραβικά, όλες τις διαλέκτους των κινέζικων και των ινδικών, αγγλικά, γαλλικά, γερμανικά, ιταλικά, ιαπωνικά, πορτογαλικά, ρωσικά και ισπανικά)
522: Οι μεταφράσεις της Οικουμενικής Διακήρυξης των Ανθρωπίνων Δικαιωμάτων, το πιο μεταφρασμένο έγγραφο στον κόσμο
25.000%: Το ποσοστό αύξησης της μετάφρασης του όρου «purple rain» την εβδομάδα του θανάτου του Prince
Το Google Translate για να λειτουργήσει αρχικά χρησιμοποίησε την απλή στατιστική. Έκανε τη μετάφραση της φράσης στα αγγλικά και στη συνέχεια προχωρούσε σε σύγκριση με φράσεις εκατομμυρίων κειμένων που βρίσκονται στις βάσεις δεδομένων των Ηνωμένων Εθνών και του Ευρωπαϊκού Κοινοβουλίου. Επίσης, έψαχνε στο διαδίκτυο για τις μη αγγλικές μεταφράσεις, συμπεριλαμβανομένου του Google Books, της τεράστιας βάσης δεδομένων βιβλίων και περιοδικών που έχει σαρώσει η Google με τη χρήση οπτικής αναγνώρισης χαρακτήρων.
Αυτός ο τρόπος μετάφρασης, φράση-φράση, δεν είχε και τα καλύτερα αποτελέσματα. Το 2016, η Google έκανε τη μετάβαση στη χρήση νευρωνικών δικτύων (αυτό που κάνει και η τεχνητή νοημοσύνη δηλαδή) υποστηρίζοντας ότι έτσι θα μειώσει τα ποσοστά σφάλματος κατά 60%. Με αυτό τον τρόπο κωδικοποιεί τις γλώσσες με τέτοιο τρόπο που χειρίζεται ολόκληρες προτάσεις ταυτόχρονα δημιουργώντας πιο φυσικές μεταφράσεις. Σύμφωνα με το Wired, η χρήση από τη Google του νευρωνικού δικτύου γνωστού ως LSTM (long-short-term memory) λειτουργεί σαν την ανθρώπινη μνήμη, ο ψηφιακός μεταφραστής θυμάται έτσι την αρχή των προτάσεων καθώς φτάνει στο τέλος.
Το επόμενο βήμα ήταν η μετάφραση ομιλίας. Το 2017, η εταιρεία μας έδωσε μετάφραση φωνής live με τα ακουστικά Pixel. Τα αποτελέσματα δεν ήταν ακριβώς σε πραγματικό χρόνο και, εκτός από τις βασικές φράσεις, συχνά ανακριβή. Η ομιλία βέβαια είναι πολύ πιο δύσκολη, όχι μόνο εξαιτίας των πιο ευέλικτων κανόνων αλλά και επειδή η ποιότητα του κάθε ήχου είναι ένα τεράστιο εμπόδιο που δεν υπάρχει με το κείμενο. Η ομιλία επίσης αφορά πολύ περισσότερα ψηφιακά δεδομένα από το κείμενο και το πήγαινε-έλα στους υπολογιστές της Google σημαίνει καθυστέρηση. Τι ετοιμάζει η Google; Η εταιρεία εργάζεται στο πρότζεκτ «Translatotron», το οποίο μεταφράζει την ομιλία χωρίς το ενδιάμεσο βήμα της μετατροπής του σε κείμενο - και το εξάγει σε κάτι που μοιάζει με τη φωνή του ομιλητή.
Με πληροφορίες από: https://qz.com/emails/quartz-obsession/1781599/
ΠΡΟΣΦΑΤΑ
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Αμερικανικές πολιτείες έχουν υποβάλει αίτημα στην εταιρεία τεχνητής νοημοσύνης για παροχή πληροφοριών
Οι χρήστες αδυνατούσαν να συνδεθούν για περίπου μιάμιση ώρα
Σοβαρά προβλήματα λειτουργίας - Οι χρήστες αδυνατούν να συνδεθούν
Αναφορές από χρήστες ότι δε μπορούν να μπουν στις πλατφόρμες
Η εξαπάτηση δεν είναι ανθρώπινη εφεύρεση, αλλά εξελικτική στρατηγική που διαμόρφωσε τον ανθρώπινο εγκέφαλο
Εντοπίστηκαν απολιθώματα σε βάθος άνω των 7 χλμ., με ευρήματα που χρονολογούνται πριν από 5,3 εκατομμύρια χρόνια
Ποιοι αντιμετωπίζουν ολοένα και πιο περιορισμένη πρόσβαση στην αγορά εργασίας
Βασίζεται σε αρχαία νευροβιολογικά συστήματα - Πώς εξελίχθηκε ως στρατηγική επιβίωσης
Η Anthropic διαθέτει το Claude Fable 5 παρά τις ανησυχίες για την κυβερνοασφάλεια
Πρώτη φορά που αστροναύτης της Ευρωπαϊκής Διαστημικής Υπηρεσίας εντάσσεται σε αποστολή του προγράμματος Artemis
Από το gov.gr στην εποχή της προσωποποιημένης εξυπηρέτησης
Η Sega επιβεβαίωσε την ψηφιακή αναβίωση του θρυλικού ράπερ στο «Stranger Than Heaven»
Η νεαρή φιλόσοφος είναι η ψυχή του Claude της Anthropic και οι προβληματισμοί έχουν σημασία
Ο Γιάννης Ασσαέλ μιλά για τον οδηγό «Τεχνητή Νοημοσύνη για Όλους», τον οποίο χαρακτηρίζει «παγκόσμια πρωτοπορία»
Οι ερευνητές εκτιμούν ότι ο άνεμος είναι ενεργός για τουλάχιστον 20.000 χρόνια
Η νέα συνεργασία-μεγαθήριο φέρνει τον Πίκατσου στη ζωή, χρησιμοποιώντας ειδικούς αισθητήρες κίνησης, ήχους και φώτα
Ερευνητές του Πανεπιστημίου του Κέιμπριτζ δημιούργησαν ένα «υπερ-αντιγόνο» ικανό να προστατεύσει από μελλοντικές πανδημίες
Η στροφή των χρηστών από τα κινητά στις τηλεοράσεις αλλάζει τις ισορροπίες στην παγκόσμια αγορά της ψυχαγωγίας
Οι εκτιμήσεις σοκ έκθεσης του ΟΗΕ
Το ΑΙ γράφει πια τα πάντα και τα γράφει με τη δική του, χαρακτηριστική φωνή – μόνο εμένα μου φαίνεται κάπως εκνευριστική;
Έχετε δει 20 από 200 άρθρα.