Teaching machines to see

Μια ομάδα ερευνητών του Πανεπιστημίου του Cambridge δημιούργησαν ένα σύστημα, το SegNet όπως το ονομάζουν, το οποίο κάνει χρήση της κάμερα ενός smartphone και έχει ως στόχο να ενσωματωθεί σε αυτόνομα αυτοκίνητα, επιτρέποντας τους την αναγνώριση αντικειμένων στο περιβάλλον όπου κινούνται.

Το λογισμικό που έχει δημιουργήσει η ομάδα μπορεί να ελέγξει μια εικόνα σε πραγματικό χρόνο, κατηγοριοποιώντας τα αντικείμενα που αυτή περιλαμβάνει, σε 12 διαφορετικές κατηγορίες, όπως δρόμους, πινακίδες, κολόνες, πεζούς, ποδηλάτες και κτίρια, ενώ έχει την ικανότητα να διακρίνει μεταξύ ημέρας και νύχτας, καθώς και να ξεχωρίζει τις σκιές από τα υπόλοιπα αντικείμενα. Το σύστημα σήμερα είναι σε θέση να αναγνωρίσει με επιτυχία το 90% των pixel που εξετάζει, με τους ερευνητές του να δηλώνουν πως το SegNet δεν μπορεί να περάσει σήμερα στη παραγωγή. Σήμερα, θα μπορούσε να χρησιμοποιηθεί ως βοηθητικό σύστημα προειδοποίησης του οδηγού, έχοντας εφάμιλλη λειτουργία με αυτή των συστημάτων αποφυγής συγκρούσεων. Ο καθηγητής Roberto Cipolla, επικεφαλής της ομάδας δήλωσε:

Η όραση είναι η ισχυρότερη αίσθηση των ανθρώπων και τα αυτόνομα αυτοκίνητα πρέπει να καταστούν ικανά να βλέπουν. Αλλά το να διδάξεις μια μηχανή πως να βλέπει, είναι πολύ πιο δύσκολο απ’ όσο ακούγεται.

Μπαίνοντας εδώ, μπορείς να δοκιμάσεις και εσύ τις δυνατότητες του λογισμικού, ανεβάζοντας μια φωτογραφία στην σχετική εφαρμογή που έχει δημιουργήσει η ομάδα των ερευνητών.

Παράλληλα η ομάδα έχει αναπτύξει και ένα δεύτερο σύστημα το οποίο επιτρέπει στο smartphone -και τα αυτόνομα αυτοκίνητα στο μέλλον, χρησιμοποιώντας τη γεωμετρία των κτιρίων και των χαρακτηριστικών των δρόμων, να μπορεί να διακρίνει την τοποθεσία του, χωρίς να κάνει χρήση GPS. Το σύστημα μέχρι στιγμής έχει δοκιμαστεί στο κέντρο του Cambridge, όπου σύμφωνα με τους μηχανικούς, έχει αποδειχθεί ότι είναι “πολύ πιο ακριβές από το GPS.”