Στο
κατά πόσο ένα πρόγραμμα υπολογιστή μπορεί να αναγνωρίσει ανθρώπινες φιγούρες σε
πίνακες ζωγραφικής που εντάσσονται στο κίνημα του κυβισμού προσπάθησαν να
απαντήσουν ορισμένοι επιστήμονες του πανεπιστημίου του Μπέρκλι στην Καλιφόρνια
των ΗΠΑ. Humans still rule when it comes to recognising people in Picasso’s paintings.
But the way machine vision algorithms fail hints at how humans do this task,
say computer scientists.
Η
ανθρώπινη όραση έχει εξελιχθεί ώστε να αναγνωρίζει ανθρώπινες φιγούρες σε όλες
τις διαφορετικές περιπτώσεις είτε πρόκειται για τον πραγματικό κόσμο, είτε για
τέχνη μέσω αναπαραστάσεων.
Pablo Picasso, Portrait d'Ambroise Vollard, 1910. Huile
sur Toile, 93x66 cm.
Η
κατάσταση γίνεται λίγο πιο περίπλοκη όταν εμπλέκονται πιο αφηρημένες μορφές
τέχνης όπως ο κυβισμός ή ο υπερρεαλισμός στις οποίες τα σχήματα αλλοιώνονται,
δυσχεραίνοντας πολλές φορές την αναγνώρισή τους. Εάν μάλιστα οι άνθρωποι έχουν
αποδείξει πως δε δυσκολεύονται ιδιαίτερα να αναγνωρίσουν έναν άνθρωπο σε ένα
πίνακα του Πικάσο, για τους υπολογιστές τα πράγματα δεν φαίνονται να είναι τόσο
απλά.
Στο
ερώτημα αυτό, στο κατά πόσο δηλαδή ένα πρόγραμμα υπολογιστή μπορεί να
αναγνωρίσει ανθρώπινες φιγούρες σε πίνακες ζωγραφικής που εντάσσονται στο
κίνημα του κυβισμού προσπάθησαν να απαντήσουν ορισμένοι επιστήμονες του
πανεπιστημίου του Μπέρκλι στην Καλιφόρνια των ΗΠΑ στη μελέτη τους «Αναγνωρίζοντας
ανθρώπους στον κυβισμό».
Pablo Picasso, Femme
aux poires, Fernande, Woman with pears, Fernande, 1909. Huile sur Toile
92x73 cm.
O
κυβισμός ήταν ένα από τα κινήματα στη ζωγραφική του 20ού αιώνα με τη μεγαλύτερη
επιρροή ανάμεσα στους καλλιτέχνες, με πρωτεργάτες ζωγράφους όπως τον Ζόρζ Μπρακ
και τον Πάμπλο Πικάσο. Στις εικόνες των αντίστοιχων πινάκων οι μορφές
παρουσιάζονται τεθλασμένες, σα να ενώνονται οι οπτικές που θα είχαν παρατηρητές
από διαφορετικές γωνίες. Ως αποτέλεσμα, ένας πίνακας κυβισμού περιέχει πολλά
θραύσματα της αντίληψης του ζωγράφου για το ίδιο αντικείμενο.
Η
μέθοδος που ακολούθησαν οι ερευνητές στην εργασία τους ήταν να επιλέξουν μία
λίστα από 218 πίνακες κυβισμού με τίτλους που υποδείκνυαν πως περιείχαν
ανθρώπινες φιγούρες. Στη συνέχεια ρώτησαν 18 συμμετέχοντες τα βαθμολογήσουν το
βαθμό της αφαίρεσης σε κάθε εικόνα, σε μία κλίμακα από το 1 εώς το 5 και να
σχηματίσουν ένα παραλληλόγραμμο γύρω από κάθε άνθρωπο.
Έπειτα
στράφηκαν στους υπολογιστές τους, προσπαθώντας να αναπαράγουν τα αποτελέσματα.
Για το σκοπό αυτό χρησιμοποίησαν αλγορίθμους που βασίζονται στα νευρωνικά
δίκτυα, μία τεχνική που τα τελευταία χρόνια έχει φέρει επανάσταση στον τομέα
της αναγνώρισης προσώπου καθώς χρησιμοποιεί υπάρχοντα δεδομένα για να
εκπαιδευθεί και να βελτιώσει την απόδοσή της. Εκπαιδεύοντας αρχικά το σύστημά
τους με φωτογραφίες ανθρώπων, το τροφοδότησαν στη συνέχεια με τη βάση δεδομένων
των 218 πινάκων που είχαν παρουσιάσει στους συμμετέχοντες στην έρευνα, με την
ίδια απαίτηση να τοποθετήσουν ένα περίγραμμα γύρω από κάθε άνθρωπο.
Having trained all
of these algorithms using a dataset of natural images of human figures, Ginosar
and co then gave each algorithm the set Cubist images to study. The goal for
each algorithm was to draw a box around the area of the picture containing the
human figure, just as the human participants had done. The results provide a
fascinating insight into the capabilities of computer vision algorithms but
also into the nature of human perception.
Τα
αποτελέσματα δίνουν μία πολύ χρήσιμη ματιά στο πως λειτουργούν οι αλγόριθμοι
υπολογιστικής όρασης ενώ είναι αποκαλυπτικά και για την ανθρώπινη αντίληψη.
Δίχως να αποτελεί έκπληξη, οι άνθρωποι τα πηγαίνουν καλύτερα στην εκτίμηση του
κυβισμού, συγκεντρώνοντας διπλάσιο βαθμό στη σχετική αξιολόγηση, σε σχέση με
τους υπολογιστές. Καθώς μάλιστα η αφαίρεση στον πίνακα αυξάνεται, τα
αποτελέσματα για τον αλγόριθμό γίνονται ολοένα και πιο καταστροφικά, αντίθετα
με τους ανθρώπους οι οποίοι δε φαίνονται να επηρεάζονται τόσο. Η παρατήρηση
αυτή αντίκειται σε μία διαδεδομένη αντίληψη των νευρολόγων πως οι άνθρωποι
αντιλαμβάνονται τα αντικείμενα αναλύοντας τα επιμέρους τμήματά τους.
Georges Braque, Woman with mandolin, 1910.
Φαίνεται
πάντως πως αν η υπολογιστική όραση μπορεί να ανταγωνιστεί την ανθρώπινη και
ακόμη και να την ξεπεράσει σε φυσιολογικές συνθήκες, οι αφηρημένες συνθήκες που
τους υποβάλλει η τέχνη δείχνει πως η ανθρώπινη αντίληψη είναι πολύ πιο ευέλικτη
και αξιόπιστη. Τα αποτελέσματα πάντως της συγκεκριμένης έρευνας θα αξιοποιηθούν
για τη βελτιστοποίηση της όρασης των υπολογιστών, οι οποίοι μία μέρα όχι πολύ
μακριά από σήμερα, μπορεί να βρεθούν σε θέση να εκτιμήσουν καλύτερα ένα πίνακα
μοντέρνας τέχνης.
Πηγές:
naftemporiki.gr – medium.com
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου