Tι είναι η μηχανική όραση και ποιες είναι οι εφαρμογές της
Συστήματα τεχνητής νοημοσύνης βλέπουν και αναγνωρίζουν εικόνες
Μηχανική Όραση: Όταν ρομπότ και ηλκετρονικοί υπολογιστές αποκτούν την αίσθηση της όρασης με την τεχνητή νοημοσύνη
Η μηχανική όραση, υπολογιστική όραση ή τεχνητή όραση είναι ένα πεδίο της τεχνητής νοημοσύνης όπου επιχειρείται η αλγοριθμική δημιουργία της αίσθησης της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή σε ρομπότ. Η μηχανική όραση προκύπτει από τη θεωρία και την τεχνολογία με την οποία σχεδιάζονται και κατασκευάζονται συστήματα που με το κατάλληλο input πληροφοριών, αναλύουν δεδομένα από ψηφιακές εικόνες. Τα δεδομένα είναι φωτογραφίες, βίντεο, πλάνα από πολλαπλές κάμερες ή πολυδιάστατες εικόνες από σαρωτές. Με λίγα λόγια, η τεχνολογία της μηχανικής όρασης φτιάχνει συστήματα με «όραση»: βιομηχανικά ρομπότ, αυτόνομα οχήματα, κάμερες επιτήρησης. Με τέτοια συστήματα μπορούν να αναλυθούν εικόνες, να γίνουν τοπογραφικές εξομοιώσεις, να οργανωθούν πληροφορίες (π.χ. με ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων) —προπάντων μπορεί να ερευνηθεί η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών.
Η μηχανική όραση χρονολογείται από τη δεκαετία του 1980 ως μια επέκταση του πεδίου της πληροφορικής το οποίο καλείται ψηφιακή επεξεργασία εικόνας σε αλγορίθμους ανάλυσης και κατανόησης εικόνων. Είχαν προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης, αρχικά σε ένα βασικό επίπεδο, και οι πρώτες προσπάθειες για αναπαραγωγή της αίσθησης της όρασης σε αυτόνομα ρομπότ. Ως τότε, ο όρος «μηχανική όραση» σχετιζόταν με την ηλεκτρολογία και τη ρομποτική, συνήθως στον τομέα της βιομηχανίας. Στη δεκαετία του 1980, έγινε διακριτός τομέας της τεχνητής νοημοσύνης με εφαρμογές όχι μόνο στη ρομποτική αλλά και σε πολλούς ακόμα κλάδους. Από τη δεκαετία του 1990 η μηχανική όραση σημείωση αλματώδη ανάπτυξη, συνδέθηκε με το γνωστικό πεδίο της μηχανικής μάθησης και έδωσε πολύ συγκεκριμένα αποτελέσματα, με αλγορίθμους όρασης πραγματικού χρόνου να υλοποιούνται ακόμα και σε φτηνά κινητά τηλέφωνα εξοπλισμένα με κάμερα.
Με τη διάδοση του Kinect, ενός καινοτόμου περιφερειακού διασύνδεσης μεταξύ χρηστών και υπολογιστικών συστημάτων, και τη σχετική ανάπτυξη του τρισδιάστατου (στερεοσκοπικού) οπτικού περιεχομένου ύστερα από τη μεγάλη επιτυχία της κινηματογραφικής ταινίας «Άβαταρ» το 2009, η μηχανική όραση έχει εμβαθύνει στην αξιοποίηση δεδομένων βάθους (π.χ. από στερεοσκοπική κάμερα ή ξεχωριστούς αισθητήρες βάθους) για την επίτευξη των στόχων της. Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ανίχνευση συμβάντων και ανίχνευση κίνησης, την αναγνώριση αντικειμένων, την ευρετηριοποίηση, την τρισδιάστατη ανακατασκευή (παραγωγή τρισδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο).
Σε σχέση με άλλα, παρεμφερή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
- Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν output εικόνες / βίντεο.
- Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται iput συμβολικές περιγραφές οπτικών σκηνών και παράγουν output εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
- Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών εικόνων.
- Η μηχανική μάθηση εξετάζει αλγορίθμους οι οποίοι δέχονται input δεδομένα κάθε τύπου και τα ταξινομούν ή κατηγοριοποιούν σε ομάδες. Ένα σημαντικό μέρος της μηχανικής όρασης είναι h εφαρμογή της μηχανικής μάθησης σε ψηφιακά οπτικά δεδομένα.
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Οι 10+1 σημαντικότερες εξελίξεις στο AI για το 2025
Η μελέτη συνδυάζει νέες παρατηρήσεις ακτίνων Χ από το τηλεσκόπιο eROSITA/SRG
Το περιοδικό τιμά τους ηγέτες της τεχνολογίας που διαμορφώνουν το μέλλον
Σταμάτησε ξαφνικά να επικοινωνεί με τη Γη - Εξαφανίστηκε από τα ραντάρ στις 6 Δεκεμβρίου
Νέα ευρήματα αποκαλύπτουν ότι πρώιμοι Νεάντερταλ κατασκεύαζαν εστίες πριν 400.000 χρόνια
Συνδυάζοντας τη μαγεία των Χριστουγέννων με τον ενθουσιασμό του αθλητισμού
Πάνω από 36% για εργασία
Πώς συγκρινόμαστε με ζώα
Για εμάς που αγαπάμε αυτό το (μη) χρώμα
Υπάρχουν τομείς όπου η τεχνολογία δεν είναι ούτε «καλή» ούτε «κακή» από μόνη της — η αξία της κρίνεται από τη χρήση και τις προθέσεις μας.
Η Κομισιόν εξετάζει αν παραβιάζει τους κανόνες ανταγωνισμού
Παρά τις ανησυχίες για την εθνική ασφάλεια - Αντιδράσεις στο Κογκρέσο
«Το νιώθω σαν φίλο» υποστηρίζουν
Λειτουργεί με φως και φέρει ελληνική σφραγίδα
Τα πειράματα βασίστηκαν σε εκδόσεις εμπορικά διαθέσιμων chatbots
Στο αφιέρωμά του ξεχωρίζει και πέντε ανθρώπους που αναμένεται να ξεχωρίσουν το 2026
Ο Τζένσεν Χουάνγκ εργάζεται αδιάκοπα παρά το γεγονός ότι η εταιρεία του έγινε η πολυτιμότερη στον κόσμο
Η Κίνα προκαλεί Google και OpenAI - Ανοιχτό σε όλους το μοντέλο τεχνητής νοημοσύνης
Η νέα λειτουργία του Wrapped δείχνει πόσο νέοι ή μεγάλοι είναι οι χρήστες βάσει μουσικών συνηθειών
Στις δοκιμές που έγιναν οι ερευνητές κατάφεραν να ανταλλάξουν ακόμη και γυμνό υλικό
Έχετε δει 20 από 200 άρθρα.