- CITY GUIDE
- PODCAST
-
17°
Tι είναι η μηχανική όραση και ποιες είναι οι εφαρμογές της
Συστήματα τεχνητής νοημοσύνης βλέπουν και αναγνωρίζουν εικόνες
Μηχανική Όραση: Όταν ρομπότ και ηλκετρονικοί υπολογιστές αποκτούν την αίσθηση της όρασης με την τεχνητή νοημοσύνη
Η μηχανική όραση, υπολογιστική όραση ή τεχνητή όραση είναι ένα πεδίο της τεχνητής νοημοσύνης όπου επιχειρείται η αλγοριθμική δημιουργία της αίσθησης της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή σε ρομπότ. Η μηχανική όραση προκύπτει από τη θεωρία και την τεχνολογία με την οποία σχεδιάζονται και κατασκευάζονται συστήματα που με το κατάλληλο input πληροφοριών, αναλύουν δεδομένα από ψηφιακές εικόνες. Τα δεδομένα είναι φωτογραφίες, βίντεο, πλάνα από πολλαπλές κάμερες ή πολυδιάστατες εικόνες από σαρωτές. Με λίγα λόγια, η τεχνολογία της μηχανικής όρασης φτιάχνει συστήματα με «όραση»: βιομηχανικά ρομπότ, αυτόνομα οχήματα, κάμερες επιτήρησης. Με τέτοια συστήματα μπορούν να αναλυθούν εικόνες, να γίνουν τοπογραφικές εξομοιώσεις, να οργανωθούν πληροφορίες (π.χ. με ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων) —προπάντων μπορεί να ερευνηθεί η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών.
Η μηχανική όραση χρονολογείται από τη δεκαετία του 1980 ως μια επέκταση του πεδίου της πληροφορικής το οποίο καλείται ψηφιακή επεξεργασία εικόνας σε αλγορίθμους ανάλυσης και κατανόησης εικόνων. Είχαν προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης, αρχικά σε ένα βασικό επίπεδο, και οι πρώτες προσπάθειες για αναπαραγωγή της αίσθησης της όρασης σε αυτόνομα ρομπότ. Ως τότε, ο όρος «μηχανική όραση» σχετιζόταν με την ηλεκτρολογία και τη ρομποτική, συνήθως στον τομέα της βιομηχανίας. Στη δεκαετία του 1980, έγινε διακριτός τομέας της τεχνητής νοημοσύνης με εφαρμογές όχι μόνο στη ρομποτική αλλά και σε πολλούς ακόμα κλάδους. Από τη δεκαετία του 1990 η μηχανική όραση σημείωση αλματώδη ανάπτυξη, συνδέθηκε με το γνωστικό πεδίο της μηχανικής μάθησης και έδωσε πολύ συγκεκριμένα αποτελέσματα, με αλγορίθμους όρασης πραγματικού χρόνου να υλοποιούνται ακόμα και σε φτηνά κινητά τηλέφωνα εξοπλισμένα με κάμερα.
Με τη διάδοση του Kinect, ενός καινοτόμου περιφερειακού διασύνδεσης μεταξύ χρηστών και υπολογιστικών συστημάτων, και τη σχετική ανάπτυξη του τρισδιάστατου (στερεοσκοπικού) οπτικού περιεχομένου ύστερα από τη μεγάλη επιτυχία της κινηματογραφικής ταινίας «Άβαταρ» το 2009, η μηχανική όραση έχει εμβαθύνει στην αξιοποίηση δεδομένων βάθους (π.χ. από στερεοσκοπική κάμερα ή ξεχωριστούς αισθητήρες βάθους) για την επίτευξη των στόχων της. Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ανίχνευση συμβάντων και ανίχνευση κίνησης, την αναγνώριση αντικειμένων, την ευρετηριοποίηση, την τρισδιάστατη ανακατασκευή (παραγωγή τρισδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο).
Σε σχέση με άλλα, παρεμφερή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
- Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν output εικόνες / βίντεο.
- Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται iput συμβολικές περιγραφές οπτικών σκηνών και παράγουν output εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
- Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών εικόνων.
- Η μηχανική μάθηση εξετάζει αλγορίθμους οι οποίοι δέχονται input δεδομένα κάθε τύπου και τα ταξινομούν ή κατηγοριοποιούν σε ομάδες. Ένα σημαντικό μέρος της μηχανικής όρασης είναι h εφαρμογή της μηχανικής μάθησης σε ψηφιακά οπτικά δεδομένα.
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Τι είναι το «juice jacking» και πώς μια απλή αλλαγή στις ρυθμίσεις USB μπορεί να θωρακίσει τα δεδομένα σας
Το φαράγγι μήκους περίπου 450 χιλιομέτρων και βάθους που ξεπερνά το 1,8 χιλιόμετρο
Όταν ο φωτογράφος και ο σκηνοθέτης δίνουν τη θέση τους στον αλγόριθμο
Ένας φιλόσοφος του νου και της ηθικής στην επιχείρηση Τεχνητής Νοημοσύνης
«Τα παιδιά δεν χρειάζονται πανικό, αλλά εκπαίδευση»
Η ανάλυση βασίστηκε σε 17 μελέτες με περισσότερους από 20.000 ασθενείς
Επιτέλους, η πόλη στα μέτρα σου
Μια αόρατη εργατική δύναμη που τροφοδοτεί με πληροφορίες την ΑΙ
Τέλος στο «back button hijacking» - Αυστηρά μέτρα κατά της παραπλανητικής πρακτικής
Νέα μελέτη δείχνει ότι η χρήση chatbot μειώνει τη μακροπρόθεσμη μάθηση και δημιουργεί την «ψευδαίσθηση της γνώσης»
Αόρατα γενετικά ίχνη αποκαλύπτουν οικοσυστήματα, απειλές και βιοποικιλότητα σε πραγματικό χρόνο
Όταν η τεχνητή νοημοσύνη γίνεται εργαλείο επίθεσης και μετατρέπει την κυβερνοασφάλεια σε μαζική απειλή
Δες αν το χρησιμοποιείς σωστά...
Το υλικό περιλαμβάνει σπάνιες λήψεις της Γης να εμφανίζεται πίσω από τον ορίζοντα της Σελήνης
Το επόμενο εγχείρημα της Meta και η συνεργασία με τους υπαλλήλους
Η πλατφόρμα δίνει τη δυνατότητα στους χρήστες να απενεργοποιούν τα βίντεο, εξοικονομώντας δεδομένα
Τι αποκαλύπτουν οι καθημερινές μουσικές σας συνήθειες για το πώς σκέφτεστε και επεξεργάζεστε πληροφορίες
Προσθαλάσσωση στον Ειρηνικό Ωκεανό για το πλήρωμα της NASA - «Η αρχή μιας νέας εποχής»
Νέα έρευνα αποδεικνύει ότι η απλή ακρόαση μουσικής αρκεί για να εκπαιδεύσει το μυαλό μας να αναγνωρίζει μοτίβα
Οι γιατροί της έλεγαν ότι έχει επιληψία, μετά πάρεση του Todd αλλά και άγχος - Τίποτα από αυτά δεν ήταν σωστό
Έχετε δει 20 από 200 άρθρα.