Τεχνολογία

Τα νευρικά δίκτυα έχουν διδάξει να μετατρέψουν τις εικόνες των εικονοστοιχείων σε φωτορεαλιστικές

Πρόσφατα μας παρουσιάστηκε ένα "remake" ενός κλασικού1997 shooter σεισμού II, όπου η κύρια εργασία για τη βελτίωση περιορίστηκε στην ενσωμάτωση της τεχνολογίας ανίχνευσης ακτίνων, αλλά αυτή τη φορά εμφανίστηκε κάτι πιο ενδιαφέρον στον Ιστό. Τέλος, το HD remake που όλοι περίμεναμε! Ένας από τους χρήστες του Reddit, χρησιμοποιώντας ένα σύνολο από διάφορα νευρικά δίκτυα, κατάφερε να μετατρέψει την pixelated εικόνα του προσώπου του πεζικού από τον κλασικό σκοπευτή του 1993, Doom, σε μια σχεδόν φωτορεαλιστική εικόνα.

Όπως αναφέρθηκε από την πύλη Futurism, ως αποτέλεσμα, μετά από όλους τους χειρισμούς, το πρόσωπο του διάσημου "Doom guy" άρχισε να μοιάζει με μια μυϊκή εκδοχή του ηθοποιού Nathan Fillion.

Το τελικό αποτέλεσμα το δείχνει όμορφαότι οι σύγχρονοι αλγόριθμοι τεχνητής νοημοσύνης είναι ικανοί να προσαρμοστούν για την αναδημιουργία εικόνων βασισμένων σε πηγές πρώτης ύλης πολύ κακής ποιότητας.

Δημιουργία φωτορεαλιστικής εικόνας

Όπως εξηγείται από την πηγή, το τελικό αποτέλεσμαείναι προϊόν του έργου πολλών γενετικών δικτύων αντιπάλων (GAN). Αυτοί είναι αλγόριθμοι μηχανικής μάθησης που βασίζονται σε συνδυασμό δύο νευρωνικών δικτύων, ένας από τους οποίους παράγει δείγματα και ο άλλος προσπαθεί να διακρίνει τα σωστά ("αυθεντικά") δείγματα από τα λάθος. Υπάρχουν πολλές προοπτικές σε αυτήν την τεχνολογία, την οποία γράψαμε σε ένα από τα προηγούμενα άρθρα μας.

Ο ενθουσιώδης που δημιούργησε αυτές τις εικόνες πρώταέχασε το πρόσωπό του του Doom Guy μέσω διαφόρων προγραμμάτων επεξεργασίας φωτογραφιών (FaceApp, Waifu2x και GIMP). Το αποτέλεσμα, παρόλο που αποδείχθηκε ότι ήταν σημαντικά καλύτερο από την αρχική εικόνα, ήταν ακόμα πολύ pixelated.

Μεταβατικό αποτέλεσμα. Η εικόνα του προσώπου έχει αλλάξει αισθητά, αλλά εξακολουθεί να είναι εξωπραγματική

Περαιτέρω εργασίες πραγματοποιήθηκαν χρησιμοποιώνταςΤο ανταγωνιστικό δίκτυο Generation-Competitive StyleGAN της NVIDIA. Είναι σε θέση να παράγει πρόσωπα (όχι μόνο πρόσωπα, αλλά και άψυχα αντικείμενα) που δεν υπήρξαν ποτέ και αυτή τη στιγμή είναι ένα από τα ισχυρότερα μοντέλα του γενετικά-αντιφατικού νευρικού δικτύου, το οποίο παρουσιάζει εντυπωσιακά ορατά αποτελέσματα. Για να εδραιώσει τα αποτελέσματα, έχασε και πάλι το προκύπτον πρόσωπο μέσω του StyleGAN. Δεδομένου ότι η αρχική εικόνα του προσώπου είχε μη ρεαλιστικές διαστάσεις, οι τελικές πινελιές και η «εξομάλυνση των γωνιών» έπρεπε να γίνουν με το χέρι.

Μετά την επεξεργασία με την τεχνολογία GAN, αλλά πριν από την επεξεργασία με το χέρι

Τελικό αποτέλεσμα

Σύγκριση των αρχικών εικόνων του sprite και επεξεργασία

Μπορείτε να συζητήσετε τα νέα στην Τηλεδιάσκεψη μας.