- CITY GUIDE
- PODCAST
-
17°
Tι είναι η μηχανική όραση και ποιες είναι οι εφαρμογές της
Συστήματα τεχνητής νοημοσύνης βλέπουν και αναγνωρίζουν εικόνες
Μηχανική Όραση: Όταν ρομπότ και ηλκετρονικοί υπολογιστές αποκτούν την αίσθηση της όρασης με την τεχνητή νοημοσύνη
Η μηχανική όραση, υπολογιστική όραση ή τεχνητή όραση είναι ένα πεδίο της τεχνητής νοημοσύνης όπου επιχειρείται η αλγοριθμική δημιουργία της αίσθησης της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή σε ρομπότ. Η μηχανική όραση προκύπτει από τη θεωρία και την τεχνολογία με την οποία σχεδιάζονται και κατασκευάζονται συστήματα που με το κατάλληλο input πληροφοριών, αναλύουν δεδομένα από ψηφιακές εικόνες. Τα δεδομένα είναι φωτογραφίες, βίντεο, πλάνα από πολλαπλές κάμερες ή πολυδιάστατες εικόνες από σαρωτές. Με λίγα λόγια, η τεχνολογία της μηχανικής όρασης φτιάχνει συστήματα με «όραση»: βιομηχανικά ρομπότ, αυτόνομα οχήματα, κάμερες επιτήρησης. Με τέτοια συστήματα μπορούν να αναλυθούν εικόνες, να γίνουν τοπογραφικές εξομοιώσεις, να οργανωθούν πληροφορίες (π.χ. με ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων) —προπάντων μπορεί να ερευνηθεί η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών.
Η μηχανική όραση χρονολογείται από τη δεκαετία του 1980 ως μια επέκταση του πεδίου της πληροφορικής το οποίο καλείται ψηφιακή επεξεργασία εικόνας σε αλγορίθμους ανάλυσης και κατανόησης εικόνων. Είχαν προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης, αρχικά σε ένα βασικό επίπεδο, και οι πρώτες προσπάθειες για αναπαραγωγή της αίσθησης της όρασης σε αυτόνομα ρομπότ. Ως τότε, ο όρος «μηχανική όραση» σχετιζόταν με την ηλεκτρολογία και τη ρομποτική, συνήθως στον τομέα της βιομηχανίας. Στη δεκαετία του 1980, έγινε διακριτός τομέας της τεχνητής νοημοσύνης με εφαρμογές όχι μόνο στη ρομποτική αλλά και σε πολλούς ακόμα κλάδους. Από τη δεκαετία του 1990 η μηχανική όραση σημείωση αλματώδη ανάπτυξη, συνδέθηκε με το γνωστικό πεδίο της μηχανικής μάθησης και έδωσε πολύ συγκεκριμένα αποτελέσματα, με αλγορίθμους όρασης πραγματικού χρόνου να υλοποιούνται ακόμα και σε φτηνά κινητά τηλέφωνα εξοπλισμένα με κάμερα.
Με τη διάδοση του Kinect, ενός καινοτόμου περιφερειακού διασύνδεσης μεταξύ χρηστών και υπολογιστικών συστημάτων, και τη σχετική ανάπτυξη του τρισδιάστατου (στερεοσκοπικού) οπτικού περιεχομένου ύστερα από τη μεγάλη επιτυχία της κινηματογραφικής ταινίας «Άβαταρ» το 2009, η μηχανική όραση έχει εμβαθύνει στην αξιοποίηση δεδομένων βάθους (π.χ. από στερεοσκοπική κάμερα ή ξεχωριστούς αισθητήρες βάθους) για την επίτευξη των στόχων της. Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ανίχνευση συμβάντων και ανίχνευση κίνησης, την αναγνώριση αντικειμένων, την ευρετηριοποίηση, την τρισδιάστατη ανακατασκευή (παραγωγή τρισδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο).
Σε σχέση με άλλα, παρεμφερή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
- Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν output εικόνες / βίντεο.
- Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται iput συμβολικές περιγραφές οπτικών σκηνών και παράγουν output εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
- Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών εικόνων.
- Η μηχανική μάθηση εξετάζει αλγορίθμους οι οποίοι δέχονται input δεδομένα κάθε τύπου και τα ταξινομούν ή κατηγοριοποιούν σε ομάδες. Ένα σημαντικό μέρος της μηχανικής όρασης είναι h εφαρμογή της μηχανικής μάθησης σε ψηφιακά οπτικά δεδομένα.
ΠΡΟΣΦΑΤΑ
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Ο Γιάννης Ασσαέλ μιλά για τον οδηγό «Τεχνητή Νοημοσύνη για Όλους», τον οποίο χαρακτηρίζει «παγκόσμια πρωτοπορία»
Οι ερευνητές εκτιμούν ότι ο άνεμος είναι ενεργός για τουλάχιστον 20.000 χρόνια
Η νέα συνεργασία-μεγαθήριο φέρνει τον Πίκατσου στη ζωή, χρησιμοποιώντας ειδικούς αισθητήρες κίνησης, ήχους και φώτα
Ερευνητές του Πανεπιστημίου του Κέιμπριτζ δημιούργησαν ένα «υπερ-αντιγόνο» ικανό να προστατεύσει από μελλοντικές πανδημίες
Η στροφή των χρηστών από τα κινητά στις τηλεοράσεις αλλάζει τις ισορροπίες στην παγκόσμια αγορά της ψυχαγωγίας
Οι εκτιμήσεις σοκ έκθεσης του ΟΗΕ
Το ΑΙ γράφει πια τα πάντα και τα γράφει με τη δική του, χαρακτηριστική φωνή – μόνο εμένα μου φαίνεται κάπως εκνευριστική;
Η Sydney Morning Herald απέσυρε το κείμενο της καθηγήτριας Κάθριν Έλις ως «απαράδεκτο»
H εταιρεία στοχεύει να διαθέτει έως το 2029 μια κβαντική μηχανή ικανή να επιλύει πραγματικά προβλήματα για επιχειρήσεις και βιομηχανίες
Η μητρική εταιρεία της Google προχωρά σε μία από τις μεγαλύτερες χρηματοδοτήσεις στην ιστορία
Ο Ελληνοολανδός γιατρός που προετοιμάζει τα χειρουργεία του διαστήματος
«Η Ευρώπη δεν έχει χάσει τη μάχη της AI, αλλά κινδυνεύει να αυτοϋπονομευθεί», λέει ο CEO του 28 DIGITAL
Βιολόγοι εξηγούν πώς η εξέλιξη και η ανατομία δημιούργησαν τη μοναδικότητα της ανθρώπινης φωνής
Η κλινική δοκιμή περιέλαβε περίπου 900 νεοδιαγνωσθέντες ασθενείς,
Η κλινική δοκιμή περιέλαβε περισσότερους από 4.400 ασθενείς
Νέα έρευνα δείχνει ότι οι επιχειρήσεις σχεδιάζουν μαζικές αλλαγές και λιγότερους εργαζόμενους
Ο 48χρονος προγραμματιστής και μουσικός με οπτική αναπηρία μιλά για τη ζωή σε μια αφιλόξενη Ελλάδα, την AI και τη μάχη να αντιμετωπίζεται ως άνθρωπος
Η πλατφόρμα δημιουργεί το Pornhub Sapphic, με περιεχόμενο εστιασμένο στη γυναικεία απόλαυση
Πρόκειται περί αληθινής αγγελίας – Τα προσόνα που πρέπει να έχουν οι ενδιαφερόμενοι
Βίντεο δείχνει τον πύραυλο να τυλίγεται στις φλόγες
Έχετε δει 20 από 200 άρθρα.