Γενικά

Το συνειδητοποιείτε αμέσως πριν προλάβετε πορνό. Κατανοεί ο υπολογιστής;

Στις αρχές του περασμένου μήνα, ο Tumblr το ανακοίνωσεθα απαγορεύσει το πορνό. Όταν τέθηκε σε ισχύ η νέα πολιτική περιεχομένου, μετά από περίπου δύο εβδομάδες - 17 Δεκεμβρίου - κατέστη προφανές ότι θα υπάρξουν προβλήματα. Μετά την ανάπτυξη ενός συστήματος τεχνητής νοημοσύνης, το οποίο έπρεπε να απαλλαγεί από την πορνογραφία στο site, λανθασμένα τοποθετούσε αόρατες θέσεις σε 455,4 εκατομμύρια ιστολόγια στην περιοχή μεταξύ 168,2 δισεκατομμυρίων θέσεων: αγγεία, μάγισσες, ψάρια κ.ο.κ.

Πορνογραφία για τεχνητή νοημοσύνη

Αν και δεν είναι σαφές ποιο αυτόματο φίλτροχρησιμοποίησε το Tumblr ή δημιούργησε το δικό του - η εταιρεία δεν ανταποκρίθηκε σε αιτήματα σχετικά με αυτό το θέμα - είναι προφανές ότι το κοινωνικό δίκτυο είναι κολλημένο μεταξύ των πολιτικών και των τεχνολογιών του. Για παράδειγμα, η ασυνεπής θέση του site σχετικά με τις "γυναίκες που δείχνουν θηλές" και το καλλιτεχνικό γυμνό, για παράδειγμα, οδήγησε σε αποφάσεις συμφραζομένων που αποδεικνύουν ότι ακόμη και ο Tumblr δεν ξέρει τι να απαγορεύσει στην πλατφόρμα. Πώς μια ιδιωτική εταιρεία καθορίζει τι θεωρεί άσεμνο;

Πρώτον, αποκλείστε το επικίνδυνο περιεχόμενοδύσκολο, διότι αρχικά είναι δύσκολο να καθοριστεί τι είναι. Ο ορισμός της αισχρολογίας είναι μια παγίδα αρκούδας, η οποία είναι πάνω από εκατό χρόνια, πίσω στο 1896, οι Ηνωμένες Πολιτείες ψήφισαν για πρώτη φορά τους νόμους που ρυθμίζουν την αισχρότητα. Το 1964, στην υπόθεση Jacobellis v. Ohio, σχετικά με το αν το Οχάιο μπορεί να απαγορεύσει την προβολή μιας ταινίας από τον Louis Malle, το Ανώτατο Δικαστήριο έχει δώσει πιθανώς τον πιο διάσημο ορισμό της σκληρής πορνογραφίας σήμερα: όπως το καταλαβαίνω, θα συμπεριληφθεί στην περιγραφή στενογραφίας. και ίσως δεν μπορώ ποτέ να το καταστήσω κατανοητό ", δήλωσε ο δικαστής Potter Stewart. "Αλλά ξέρω τι είναι όταν το βλέπω και η ταινία που σχετίζεται με αυτή την υπόθεση δεν είναι αυτή."

Οι αλγόριθμοι εκμάθησης μηχανών έχουν το ίδιο πρόβλημα. Το πρόβλημα αυτό προσπαθεί να λύσει τον Brian Delorge, Διευθύνοντα Σύμβουλο της Picnix, μια εταιρεία που πωλεί εξειδικευμένη τεχνολογία τεχνητής νοημοσύνης. Ένα από τα προϊόντα τους, το Iris, είναι μια εφαρμογή πελάτη που εντοπίζει την πορνογραφία για να "βοηθήσει τους ανθρώπους", όπως λέει ο Delorge, "που δεν θέλουν πορνό στη ζωή τους". Σημειώνει ότι ένα ξεχωριστό πρόβλημα πορνό είναι ότι μπορεί να υπάρχει τίποτα, μια δέσμη διαφορετικών πραγμάτων - και εικόνες που δεν είναι πορνογραφικές μπορούν να έχουν παρόμοια στοιχεία. Η εικόνα ενός πάρτι στην παραλία μπορεί να αποκλειστεί, όχι επειδή έχει περισσότερο δέρμα από ό, τι στη φωτογραφία στο γραφείο, αλλά επειδή είναι στα πρόθυρα. "Γι 'αυτό είναι πολύ δύσκολο να εκπαιδεύσετε έναν αλγόριθμο αναγνώρισης εικόνων ταυτόχρονα", λέει ο Delorge. "Όταν ο ορισμός καθίσταται δύσκολος για τους ανθρώπους, ο υπολογιστής αντιμετωπίζει επίσης δυσκολίες." Αν οι άνθρωποι δεν μπορούν να συμφωνήσουν σε ποιο πορνό είναι και τι δεν είναι, μπορεί κάποιος υπολογιστής να ελπίζει ακόμη και να γνωρίζει τη διαφορά;

Προκειμένου να διδάξει το AI να ανιχνεύσει πορνό,το πρώτο πράγμα που πρέπει να κάνετε είναι να το τροφοδοτήσετε πορνό. Πολλή πορνογραφία. Πού να το πάρετε; Λοιπόν, το πρώτο πράγμα που κάνει ο κόσμος είναι να κατεβάσει μια δέσμη vidos από Pornhub, XVideos, λέει ο Dan Shapiro, συνιδρυτής της εκκίνησης Lemay.ai, ο οποίος δημιουργεί φίλτρα AI για τους πελάτες του. "Αυτή είναι μία από αυτές τις γκρίζες περιοχές νομικής φύσης - για παράδειγμα, αν μαθαίνεις από το περιεχόμενο άλλων ανθρώπων, αν σου ανήκει;"

Αφού οι προγραμματιστές κατεβάσουν τόνουςπορνό, έκοψαν από τα πλαίσια βίντεο, τα οποία δεν είναι πορνογραφικά, για να βεβαιωθούμε ότι τα πλαίσια που χρησιμοποιούνται δεν οδηγούν στο κλείδωμα των εμπόρων πίτσας. Οι πλατφόρμες πληρώνουν άτομα, ως επί το πλείστον εκτός των ΗΠΑ, για την επισήμανση τέτοιου περιεχομένου. η δουλειά είναι χαμηλής αμοιβής και βαρετή, σαν να εισάγεται "captcha". Απλώς κάθονται και λένε: αυτό είναι πορνό, αυτό είναι αυτό. Το φίλτρο έχει λίγο, επειδή όλα τα πορνό έρχεται με μια ετικέτα. Η κατάρτιση είναι καλύτερη αν χρησιμοποιείτε όχι μόνο φωτογραφίες αλλά και μεγάλα δείγματα δεδομένων.

"Συχνά δεν είναι μόνο το φιλτράρισμα πορνό,αλλά ένα συνοδευτικό υλικό ", λέει ο Shapiro. "Όπως ψεύτικα προφίλ με μια φωτογραφία ενός κοριτσιού και ενός τηλεφώνου." Σημαίνει εργαζόμενους σε σεξ που αναζητούν πελάτες, αλλά θα μπορούσε να είναι οτιδήποτε, όχι εξ ολοκλήρου νόμιμο. "Αυτό δεν είναι πορνό, αλλά δεν θέλετε να παρακολουθήσετε τέτοιου είδους πράγματα στην πλατφόρμα σας, έτσι;" Ένας καλός αυτοματοποιημένος συντονιστής μαθαίνει εκατομμύρια - αν όχι δεκάδες εκατομμύρια - παραδείγματα περιεχομένου, πράγμα που σημαίνει ότι μπορεί να εξοικονομήσει πολλές ανθρώπινες ώρες.

"Μπορείτε να συγκρίνετε αυτό με τη διαφορά μεταξύ ενός παιδιού και ενός παιδιούενήλικες ", λέει ο Matt Zeiler, Διευθύνων Σύμβουλος και ιδρυτής της Clarifai, μια εκκίνηση στον τομέα της ηλεκτρονικής όρασης που κάνει αυτό το είδος φιλτραρίσματος εικόνας για εταιρικούς πελάτες. "Μπορώ να σας πω σίγουρα - πριν από μερικούς μήνες είχαμε ένα παιδί. Δεν γνωρίζουν τίποτα για τον κόσμο, όλα είναι καινούργια γι 'αυτούς. " Πρέπει να δείξουμε στο παιδί (αλγόριθμος) πολλά πράγματα για να το ξεκαθαρίσουμε. "Εκατομμύρια και εκατομμύρια παραδείγματα. Όμως, ως ενήλικες, όταν δημιουργήσαμε τόσα πολλά για τον κόσμο και κατανοήσαμε πώς λειτουργεί, μπορούμε να μάθουμε κάτι νέο από μερικά μόνο παραδείγματα. " (Ναι, η διδασκαλία του AI για φιλτράρισμα περιεχομένου για ενήλικες είναι σαν να δείχνει πολλή πορνογραφία σε ένα παιδί). Εταιρείες όπως η Clarifai αναπτύσσονται γρήγορα σήμερα. Έχουν μια καλή βάση δεδομένων του κόσμου, μπορούν να διακρίνουν σκύλους από γάτες ντυμένες από γυμνό. Η εταιρεία Zeiler χρησιμοποιεί τα μοντέλα της για να εκπαιδεύσει νέους αλγορίθμους για τους πελάτες της - δεδομένου ότι το αρχικό μοντέλο έχει επεξεργαστεί πολλά δεδομένα, οι προσωπικές εκδόσεις θα απαιτήσουν μόνο νέα σύνολα δεδομένων για εργασία.

Ωστόσο, ο αλγόριθμος είναι δύσκολο να κάνει τα πάνταείναι σωστό. Με περιεχόμενο που είναι προφανώς πορνογραφικό, το κάνει καλά. αλλά ο ταξινομητής μπορεί να σημάνει εσφαλμένα τη διαφήμιση εσωρούχων ως απαγορευμένη, επειδή η εικόνα έχει περισσότερο δέρμα από, ας πούμε, στο γραφείο. (Με μπικίνι και εσώρουχα, σύμφωνα με τον Zeiler, είναι πολύ δύσκολο). Αυτό σημαίνει ότι η σήμανση των ανθρώπων πρέπει να επικεντρωθεί σε αυτές τις ακραίες περιπτώσεις στο έργο τους, δίδοντας προτεραιότητα στο γεγονός ότι είναι δύσκολο να ταξινομηθούν μοντέλα.

Και τι είναι το πιο δύσκολο πράγμα;

"Anime porn", λέει ο Zayler. "Η πρώτη έκδοση του ανιχνευτή γυμνότητας μας δεν χρησιμοποίησε πορνογραφία γελοιογραφίας για εκπαίδευση". Πολλές φορές ο AI υπολόγισε λάθος επειδή δεν αναγνώριζε τον hentai. "Έχοντας εργαστεί σε αυτό για τον πελάτη, εισήγαμε ένα σωρό από τα δεδομένα του στο μοντέλο και βελτίωσε σημαντικά την ακρίβεια του φίλτρου κινούμενων εικόνων, διατηρώντας παράλληλα την ακρίβεια των πραγματικών φωτογραφιών", λέει ο Zayler.

Τεχνολογία που διδάσκεται να αποπνέει πορνό,μπορεί να χρησιμοποιηθεί σε άλλα πράγματα. Οι τεχνολογίες που διέπουν αυτό το σύστημα είναι εκπληκτικά ευέλικτες. Αυτό είναι κάτι περισσότερο από τα anime βυζιά. Το παζλ αλφάβητου, για παράδειγμα, χρησιμοποιείται ευρέως ως αυτόματος συντονιστής σχολίων σε μια εφημερίδα. Αυτό το λογισμικό λειτουργεί παρόμοια με τους ταξινομητές εικόνων, εκτός από το ότι ταξινομεί με τοξικότητα, όχι γυμνό. (Η τοξικότητα των σχολίων κειμένου είναι εξίσου δύσκολο να προσδιοριστεί όπως η πορνογραφία στις εικόνες). Το Facebook χρησιμοποιεί παρόμοιο αυτόματο φιλτράρισμα για την ανίχνευση μηνυμάτων αυτοκτονίας και περιεχομένου σχετικά με την τρομοκρατία και προσπάθησε να χρησιμοποιήσει αυτήν την τεχνολογία για να ανιχνεύσει ψεύτικα νέα στη μαζική πλατφόρμα του.

Όλα εξαρτώνται από τον άνθρωποεποπτεία · Αντιμετωπίζουμε καλύτερα την ασάφεια και το διφορούμενο πλαίσιο. Ο Zeiler λέει ότι δεν πιστεύει ότι το προϊόν του έχει στερήσει κάποιον από την εργασία. Λύνει το πρόβλημα κλιμάκωσης του Internet. Οι άνθρωποι θα συνεχίσουν να διδάσκουν το AI, να ταξινομούν και να επισημαίνουν το περιεχόμενο έτσι ώστε το AI να το διακρίνει.

Αυτό είναι το μέλλον της μετριοπάθειας: ατομικές, έτοιμες λύσεις που παρέχονται από εταιρείες που κάνουν όλη την επιχείρησή τους να εκπαιδεύσουν ολοένα και πιο προηγμένους ταξινομητές για περισσότερα δεδομένα. Με τον ίδιο τρόπο που οι Stripe και Square προσφέρουν έτοιμες λύσεις πληρωμών για επιχειρήσεις που δεν θέλουν να τις επεξεργάζονται από μόνοι τους, οι νεωτερισμοί όπως Clarifai, Picnix και Lemay.ai θα εφαρμόσουν σε απευθείας σύνδεση μετριοπάθεια.

Ο Dan Shapiro από το Lemay.ai είναι γεμάτος ελπίδα. "Όπως και με οποιαδήποτε άλλη τεχνολογία, βρίσκεται ακόμα στη διαδικασία της εφεύρεσης. Επομένως, δεν νομίζω ότι θα αποδώσουμε σε περίπτωση αποτυχίας. " Αλλά μπορεί το AI να ενεργήσει ποτέ αυτόνομα χωρίς ανθρώπινη επίβλεψη; Δεν είναι σαφές "Δεν υπάρχει μικρός άνθρωπος σε ένα κιβώτιο ταμπάκων που φιλτράρει κάθε εικόνα", λέει. "Πρέπει να έχουμε δεδομένα από παντού για να εκπαιδεύσουμε τον αλγόριθμο πάνω τους".

Zeiler, από την άλλη πλευρά, πιστεύει ότι μια φοράη τεχνητή νοημοσύνη θα μετριάσει τα πάντα από μόνα τους. Τελικά, ο αριθμός των παρεμβάσεων εκ μέρους των ανθρώπων θα μειωθεί στο μηδέν ή σε ασήμαντες προσπάθειες. Σταδιακά, οι προσπάθειες του ατόμου θα μετατραπούν σε αυτό που δεν μπορεί να κάνει το AI τώρα, όπως η λογική υψηλού επιπέδου, η αυτογνωσία - ό, τι έχουν οι άνθρωποι.

Η αναγνώριση της πορνογραφίας αποτελεί μέρος αυτής. Η αναγνώριση είναι μια σχετικά ασήμαντη εργασία για τους ανθρώπους, αλλά είναι πολύ πιο δύσκολο να εκπαιδευτεί ένας αλγόριθμος για να αναγνωρίσει τις αποχρώσεις. Ο καθορισμός του ορίου όταν ένα φίλτρο σηματοδοτεί μια εικόνα ως πορνογραφικό ή μη πορνογραφικό είναι επίσης ένα δύσκολο έργο, εν μέρει μαθηματικό.

Η τεχνητή νοημοσύνη είναι ατελής.τον καθρέφτη του πώς βλέπουμε τον κόσμο, ακριβώς όπως η πορνογραφία είναι μια αντανάκλαση του τι συμβαίνει μεταξύ των ανθρώπων όταν είναι μόνοι. Υπάρχει κάποια αλήθεια σε αυτό, αλλά η πλήρης εικόνα δεν είναι.

Μην ξεχάσετε να εγγραφείτε στο news feed μας.