Nέο
σύστημα τεχνητής νοημοσύνης κάνει τις ανθρώπινες φιγούρες στα κινούμενα σχέδια
και στα βίντεο γκέιμ να κινούνται και να χορεύουν με εκπληκτική φυσικότητα. University
of California, Berkeley researchers have made a major advance in realistic
computer animation, using deep reinforcement learning to recreate natural
motions, even for acrobatic feats like break dancing and martial arts.
Το
animation έχει κάνει τεράστια άλματα στην εποχή των ηλεκτρονικών υπολογιστών κα
η κίνηση των χαρακτήρων που βλέπουμε στα κινούμενα σχέδια και τα βίντεο γκέιμ
έχει βελτιωθεί θεαματικά. Παρ' όλα αυτά απέχει ακόμη από το να είναι απολύτως
ρεαλιστική. Αυτό ίσως σύντομα αλλάξει χάρη σε έναν αλγόριθμο που ανέπτυξαν
επιστήμονες από τις Ηνωμένες Πολιτείες. Το νέο σύστημα τεχνητής νοημοσύνης
θεωρείται ότι αποτελεί ένα τεράστιο άλμα στον τομέα καθώς προσομοιώνει με
εντυπωσιακό ρεαλισμό την κίνηση ανθρώπων και ζώων κάνοντας τις φιγούρες να
εκτελούν με φυσικότητα ακόμη και «δύσκολες» κινήσεις, όπως π.χ. να σκοντάφτουν
και να σηκώνονται ή να κάνουν ανάποδο σάλτο.
Δύο
βασικά στοιχεία τα οποία λείπουν από τους χαρακτήρες των κινουμένων σχεδίων και
των βιντεοπαιχνιδιών κάνοντας τις κινήσεις τους να φαίνονται αδέξιες είναι η
συνέχεια και ο ρυθμός. Αυτά θέλησαν να βελτιώσουν οι ερευνητές από το
Πανεπιστήμιο του Μπέρκλεϊ στην Καλιφόρνια χρησιμοποιώντας τεχνικές ενισχυτικής
μάθησης για να αναπτύξουν έναν αλγόριθμο ο οποίος μπορούσε να μαθαίνει να
αναπαράγει τις φυσικές κινήσεις που «έβλεπε» να κάνουν άνθρωποι όχι μόνο καθώς
περπατούσαν αλλά και ενώ επιδίδονταν σε πολεμικές τέχνες ή ενώ χόρευαν break
dance.
Το
παλιό με το καινούργιο
UC Berkeley
researchers created a virtual stuntman that could make computer-animated
characters more lifelike. (UC Berkeley video by Roxanne Makasdjian and Stephen
McNally, with simulation footage by Jason Peng)
Οι
παραδοσιακές τεχνικές του animation συνήθως απαιτούν τον σχεδιασμό ελεγκτών για
κάθε δεξιότητα: έναν ελεγκτή π.χ. για το περπάτημα, άλλον για το τρέξιμο, άλλον
για τα άλματα και ούτω καθεξής. Από την άλλη πλευρά οι πιο εξελιγμένες μέθοδοι
ενισχυτικής μάθησης μπορούν να χειριστούν πολλές διαφορετικές δεξιότητες με
έναν μόνο αλγόριθμο, όμως τα αποτελέσματά τους τις περισσότερες φορές δεν είναι
καθόλου φυσικά. Οι επιστήμονες από το Μπέρκλεϊ σκέφτηκαν να συνδυάσουν τις δύο
φιλοσοφίες.
Για
να το επιτύχουν χρησιμοποίησαν δεδομένα αναφοράς από βίντεο καταγραφής κίνησης
(motion-capture ή mocap) τα οποία έδειχναν ανθρώπους να εκτελούν περισσότερα
από 25 διαφορετικά ακροβατικά, όπως ανάποδο σάλτο, ρόδα, kick up, γέφυρα, καθώς
και απλές κινήσεις, όπως τρέξιμο, ρίψεις και άλματα. Αφού τροφοδότησαν με τα
δεδομένα του mocap τον υπολογιστή, οι επιστήμονες άφησαν το σύστημα - το οποίο
ονόμασαν «DeepMimic» - να «εξασκηθεί» σε κάθε δεξιότητα επί περίπου έναν μήνα
προσομοιωμένου χρόνου, χρονικό διάστημα λίγο μεγαλύτερο από αυτό που θα
χρειαζόταν ένας άνθρωπος για να μάθει την ίδια δεξιότητα.
Εξάσκηση
και αυτοδιόρθωση
Simulated humanoid
performing a variety of highly dynamic and acrobatic skills.
Ο
υπολογιστής έκανε εξάσκηση επί 24 ώρες το εικοσιτετράωρο χωρίς διακοπή,
κάνοντας εκατομμύρια δοκιμές προκειμένου να μάθει πώς να προσομοιώνει
ρεαλιστικά την κάθε δεξιότητα. Η μάθηση επετεύχθη μέσα από τις δοκιμές και τα
λάθη, με τον αλγόριθμο να συγκρίνει ύστερα από κάθε δοκιμή τις επιδόσεις του με
τα δεδομένα αναφοράς του mocap και να προσαρμόζει ανάλογα τη συμπεριφορά του
ώστε να πλησιάζει περισσότερο την ανθρώπινη κίνηση. Το εκπληκτικό ήταν ότι από
τη στιγμή που εκπαιδεύθηκε, οι προσομοιωμένοι χαρακτήρες που «κινούσε»
μπορούσαν να αντιμετωπίσουν με φυσικότητα καταστάσεις τις οποίες το σύστημα
τεχνητής νοημοσύνης δεν είχε «δει» στο παρελθόν, όπως το να τρέχουν σε ανώμαλο
έδαφος ή να κάνουν περιστροφικά λακτίσματα για να αποκρούσουν αντικείμενα που
έρχονται καταπάνω τους.
«Πρόκειται πραγματικά για ένα μεγάλο άλμα σε
σχέση με τα όσα έχουν γίνει ως τώρα με τα συστήματα ενισχυτικής μάθησης και το
animation» δήλωσε σε δελτίο Τύπου του Πανεπιστημίου ο Σούε Μπινγκ «Τζέισον»
Πενγκ, μέλος της ερευνητικής ομάδας. «Στο
παρελθόν έχει γίνει πολλή δουλειά με στόχο την προσομοίωση των φυσικών
κινήσεων, όμως οι μέθοδοι που χρησιμοποιούνταν βασίζονταν κυρίως στη Φυσική και
ήταν πολύ εξειδικευμένες, δεν ήταν γενικευμένες ώστε να μπορούν να χειρίζονται
μεγάλη ποικιλία δεξιοτήτων». Το σύστημα που ανέπτυξαν ο ίδιος και η ομάδα
του, όπως λέει, είναι πιο ικανό και μπορεί να συμπεριφερθεί με φυσικό τρόπο. «Αν συγκρίνετε τα αποτελέσματά μας με βίντεο
καταγραφής της κίνησης ανθρώπων πλησιάζουμε στο σημείο όπου είναι πολύ δύσκολο
να ξεχωρίσει κάποιος ανάμεσα στα δύο. Πλησιάζουμε στη δημιουργία ενός εικονικού
στάντμαν».