Επιστήμες, Τέχνες & Πολιτισμός

Νέο λογισμικό αναγνωρίζει και βάζει μόνο του λεζάντες σε φωτογραφίες και βίντεο

28 Νοεμβρίου 2014

Νέο λογισμικό αναγνωρίζει και βάζει μόνο του λεζάντες σε φωτογραφίες και βίντεο

finger pressing keyboardΜΕ ΜΕΓΑΛΥΤΕΡΗ ΑΚΡΙΒΕΙΑ ΑΠΟ ΠΟΤΕ

Δύο ερευνητικές ομάδες στις ΗΠΑ, μία της Google και μία του Πανεπιστημίου Στάνφορντ της Καλιφόρνιας, εργαζόμενες ανεξάρτητα, ανέπτυξαν λογισμικό τεχνητής νοημοσύνης, το οποίο είναι ικανό να αναγνωρίζει, με μεγαλύτερη ακρίβεια από ποτέ, το περιεχόμενο φωτογραφιών και βίντεο και να βάζει μόνο του τις κατάλληλες λεζάντες, μιμούμενο πολύ πετυχημένα αυτό που θα έκανε ένας άνθρωπος.

Μέχρι σήμερα η λεγόμενη «υπολογιστική όραση» έχει σε μεγάλο βαθμό περιοριστεί στην αναγνώριση μεμονωμένων αντικειμένων. Το νέο λογισμικό όμως, σύμφωνα με τους «Τάιμς της Νέας Υόρκης», χάρη στη «νοημοσύνη» του, μαθαίνει μόνο του να αναγνωρίζει ολόκληρες σκηνές, π.χ. μία ομάδα παιδιών να παίζει μπάλα, και μετά είναι σε θέση να γράφει την κατάλληλη λεζάντα που περιγράφει το περιεχόμενο της εικόνας.

Η εξέλιξη αυτή δίνει τη δυνατότητα να γίνεται πολύ καλύτερη αναζήτηση και ταξινόμηση δισεκατομμυρίων εικόνων και ατελείωτων ωρών βίντεο που βρίσκονται στο διαδίκτυο. Σήμερα, ακόμη και η πιο ισχυρή μηχανή αναζήτησης, όπως αυτή της Google, βασίζεται σε μεγάλο βαθμό στο γραπτό κείμενο που συνοδεύει μια εικόνα ή ένα βίντεο, προκειμένου να αναγνωρίσει το περιεχόμενό του.

«Θεωρώ ότι τα εικονοστοιχεία (πίξελ) των εικόνων και των βίντεο είναι η σκοτεινή ύλη του Ίντερνετ. Μόλις τώρα αρχίζουμε να τη φωτίζουμε», δήλωσε ο Φέι – Φέι Λι, διευθυντής του Εργαστηρίου Τεχνητής Νοημοσύνης του Στάνφορντ, επικεφαλής της μίας ερευνητικής ομάδας. Η άλλη ομάδα αποτελείτο από ερευνητές του Προγράμματος για τον Εγκέφαλο της Google με επικεφαλής τον Οριόλ Βίνιαλς.

Εν καιρώ, το νέο λογισμικό, μεταξύ άλλων, μπορεί να οδηγήσει σε μια τεχνολογία που θα βοηθά τους τυφλούς, αλλά και τα ρομπότ, να πλοηγούνται στο φυσικό περιβάλλον. Από την άλλη όμως ανοίγουν νέες δυνατότητες -όχι κατ’ ανάγκη επιθυμητές- για την παρακολούθηση των πολιτών και την παραβίαση των προσωπικών δεδομένων του καθενός. Ένα τέτοιο λογισμικό «φορτωμένο» σε κάμερες, τόσο σε δημόσιους όσο και σε ιδιωτικούς χώρους, θα μπορούσε όχι μόνο να εντοπίζει γρήγορα συγκεκριμένα άτομα, αλλά επίσης να «πιάνει» συγκεκριμένες συμπεριφορές τους, ειδοποιώντας έγκαιρα τις αρχές.

Προγράμματα τεχνητής νοημοσύνης σε σύγχρονα αυτοκίνητα, που διαθέτουν κάμερες στο μπροστινό τμήμα τους, ήδη είναι σε θέση να αναγνωρίζουν πεζούς και ποδηλάτες και να σταματούν αυτόματα το όχημα, σε περίπτωση που ο οδηγός καθυστερεί να φρενάρει.

Οι ομάδες του Στάνφορντ και της Google δήλωσαν ότι είναι θέμα χρόνου το λογισμικό τους να βελτιωθεί περαιτέρω και να «εκπαιδευθεί», έτσι ώστε μελλοντικά να έχει πολύ μεγαλύτερη ακρίβεια αναγνώρισης του περιεχομένου των εικόνων και των βίντεο.

Πηγή: imerisia.gr