általános

Rögtön rájössz, hogy a pornó előtted. Megérti a számítógépet?

A múlt hónap elején Tumblr bejelentettemegtiltja a pornó. Amikor az új tartalompolitika hatályba lépett, kb. Két hét múlva - december 17-én - nyilvánvalóvá vált, hogy problémák lesznek. Miután telepített egy mesterséges intelligencia rendszert, melynek célja az összes pornográfia elhagyása a helyszínen, tévesen jelölte meg az ártatlan állásokat 455,4 millió blogban a helyszínen 168,2 milliárd hozzászólás között: vázák, boszorkányok, halak stb.

Pornográfia mesterséges intelligencia számára

Bár nem világos, hogy melyik automatikus szűrőhasználta a Tumblr-t, vagy létrehozta a sajátját - a vállalat nem válaszolt erre a kérdésre - nyilvánvaló, hogy a szociális hálózat megakad a saját politikái és technológiái között. Például, a webhely következetlen álláspontja a „mellbimbó nők” és a művészi meztelenség tekintetében például olyan kontextusos döntésekhez vezetett, amelyek bizonyítják, hogy még a Tumblr sem tudja, mit tiltson a platformon. Hogyan határozza meg egy magánvállalat, hogy mit tart az obszcénnek?

Először blokkolja a kockázatos tartalmatnehéz, mert kezdetben nehéz meghatározni, hogy mi az. Az obszcénitás definíciója egy medve csapda, amely több mint száz éves, 1896-ban az Egyesült Államok először az obszcénitást szabályozó törvényeket fogadott el. 1964-ben, Jacobellis kontra Ohio ügyben, arról, hogy Ohio megtilthatja-e Louis Malle filmjének bemutatását, a Legfelsőbb Bíróság talán ma a leghíresebb kemény pornográfia definícióját adta: „Ma nem próbálom meg tovább meghatározni ezt a fajta anyagot, ahogyan én megértem, a rövid leírásban szerepel; és talán soha nem érthetem érthetővé ”- mondta Poter Stewart bíró. - De tudom, hogy mi az, amikor látom, és az ehhez kapcsolódó film nem így van.

A gépi tanulási algoritmusoknak ugyanaz a problémája. Ez a probléma megpróbálja megoldani Brian Delorge-t, a Picnix vezérigazgatóját, a mesterséges intelligencia speciális technológiáját értékesítő céget. Az egyik termékük, Iris, egy olyan ügyféloldali alkalmazás, amely a pornográfiát „segíti az embereknek”, ahogy Delorge azt mondja: „ki nem akarja pornót az életükben.” Megjegyzi, hogy a pornóval kapcsolatos külön probléma az, hogy bármi lehet, egy csomó különböző dolog - és a nem pornográfos képek hasonló elemekkel rendelkezhetnek. Egy parti kép a strandon blokkolható, nem azért, mert több bőre van, mint az irodában lévő fotón, hanem azért, mert a szélén van. „Ezért nehéz egyszerre képezni egy képfelismerő algoritmust” - mondja Delorge. "Ha a definíció nehéz lesz az emberek számára, a számítógép nehézségekbe ütközik." Ha az emberek nem tudnak egyetérteni abban, hogy mi a pornó és mi nem, akkor a számítógép is reméli, hogy tudja a különbséget?

Annak érdekében, hogy az AI-t a pornóaz első dolog, amit meg kell tenned, hogy pornót etetsz. Sok pornográfia. Hol kapja meg? Nos, az első dolog, amit az emberek csinálnak, letölt egy csomó vidot a Pornhubból, XVideosból, mondja Dan Shapiro, a Lemay.ai indulója, aki az AI szűrőket hozza létre ügyfelei számára. "Ez egyike azoknak a szürke jellegű területeknek, amelyek jogi jellegűek - például ha más emberek tartalmából tanul, nem tartozik Önhöz?"

A programozók letöltése után tonnapornó, kivágták a videorekeszekből, amelyek nem pornográfia, hogy megbizonyosodjanak róla, hogy a felhasznált keretek nem vezetnek a pizzák elzárásához. Az ilyen tartalmak címkézéséért a platformok többnyire az Egyesült Államokon kívül fizetik az embereket; a munka alacsony fizetésű és unalmas, mintha a "captcha" -t bevezette volna. Csak ülnek és mondanak: ez pornó, ez az. A szűrő egy kicsit, mert minden pornó címkével van ellátva. A képzés jobb, ha nem csak fényképeket, hanem nagy adatmintákat használ.

"Gyakran nem csak a pornó szűrése,de inkább társanyagot ”- mondja Shapiro. "Mint egy hamis profilok egy lány és egy telefon fotójával." Szexmunkát keres ügyfeleket keresni, de bármi lehet, nem teljesen törvényes. - Ez nem pornó, de nem akarod nézni ezeket a dolgokat a platformodon, ugye? Egy jó automatizált moderátor megtanul több millió - ha nem több tízmillió - példát a tartalomra, ami azt jelenti, hogy sok ember órát takaríthat meg.

"Ezt összehasonlíthatja a gyermek és a különbség között."felnőttek ”- mondja Matt Zeiler, a Clarifai vezérigazgatója és alapítója, aki a vállalati ügyfelek számára ilyen képszűrést végez. - Biztosan elmondhatom - pár hónappal ezelőtt volt egy gyermekünk. Nem tudnak semmit a világról, minden új számukra. Számos dolgot kell mutatnunk a gyermeknek (algoritmusnak), hogy világos legyen. - Milliók és több millió példa. De mint felnőttek, amikor oly sok kontextust hoztunk létre a világról, és megértettük, hogyan működik, csak néhány példából tanulhatunk valamit. (Igen, az AI tanítása felnőtt tartalmak szűrésére olyan, mintha sok pornót mutatna a gyermeknek). A Clarifai-hoz hasonló cégek gyorsan nőnek. Jó adatbázisuk van a világról, megkülönböztethetik a meztelenül öltözött macskákat. A Zeiler cége modelljeit új algoritmusok kiképzésére használja ügyfelei számára - mivel az eredeti modell sok adatot dolgozott fel, a személyes verziók csak új adatkészleteket igényelnek.

Az algoritmus azonban nehéz mindent megtennihelyes. A tartalom, amely nyilvánvalóan pornográf, jól működik; de az osztályozó helytelenül jelezheti a fehérnemű hirdetést tiltottnak, mert a képen több bőr van, mint mondjuk az irodában. (Bikini és fehérnemű szerint Zeiler szerint nagyon nehéz). Ez azt jelenti, hogy az emberek kijelölése a munkájuk során ezekre a szélsőséges esetekre kell összpontosítania, elsőbbséget biztosítva arra, hogy nehéz modelleket osztályozni.

És mi a legnehezebb dolog?

- Anime porn - mondta Zayler. "A meztelenségérzékelő első változata nem használta a rajzfilm pornográfiát a képzéshez." Az AI sokszor hibásan számolt, mert a hentai nem ismerte fel. „Miután dolgoztunk ezzel az ügyfélnél, bemutattunk egy csomó adatot a modellbe, és jelentősen javítottuk az animált képek szűrőjének pontosságát, miközben megőrizte a valódi fényképek pontosságát” - mondja Zayler.

Technológia, amelyet tanítanak a pornó szippantásáramás dolgokra is használható. A rendszer alapját képező technológiák meglepően rugalmasak. Ez több, mint anime mellek. Például az ábécé-kirakós játékot széles körben használják egy automatikus megjegyzés moderátorként egy újságban. Ez a szoftver hasonlít a képosztályozókhoz, kivéve, hogy a toxicitás, nem meztelenség szerint válik. (A szöveges megjegyzések toxicitása olyan nehéz meghatározni, mint a pornográfia a képekben). A Facebook hasonló automatikus szűrést használ az öngyilkos üzenetek és a terrorizmussal kapcsolatos tartalom észlelésére, és megpróbálta ezt a technológiát használni a hamis hírek észlelésére a hatalmas platformján.

Mindez még mindig az embertől függfelügyelet jobban kezeljük a kétértelműséget és a kétértelmű kontextust. Zeiler azt mondja, nem hiszi, hogy terméke megfosztott volna valakitől. Megoldja az internet méretezésének problémáját. Az emberek még mindig tanítják az AI-t, a tartalmat válogatják és címkézik úgy, hogy az AI megkülönböztesse.

Ez a mérséklés jövője: az egyéni, kész megoldások, amelyeket olyan vállalatok nyújtanak, amelyek teljes üzleti tevékenységüket egyre több fejlett osztályozó számára továbbadják. Ugyanúgy, mint a Stripe és a Square kínál olyan készpénzfizetési megoldásokat azoknak a vállalkozásoknak, amelyek nem akarják magukat feldolgozni, például a Clarifai, a Picnix és a Lemay.ai, mint például az online moderálás.

Dan Shapiro Lemay.aiból tele van reménységgel. „Mint minden más technológia esetében, a találmány még folyamatban van. Ezért nem hiszem, hogy meghibásodás esetén hoznánk el. ” De vajon az AI bármikor önállóan képes-e emberi felügyelet nélkül? Nem világos "Nincs olyan kis ember, aki szuszpenziós dobozban szűri az összes képet" - mondja. "Mindenhonnan be kell szereznünk adatokat az algoritmus kiképzésére."

Zeiler viszont azt hiszi, hogy egyszera mesterséges intelligencia önmagában mérsékel mindent. Végül az emberek beavatkozásainak száma nullára csökken, vagy jelentéktelen erőfeszítésekre. Fokozatosan az ember erőfeszítései arra fognak fordulni, amit az AI nem tud most tenni, mint a magas szintű érvelés, az önismeret - mindaz, amit az embereknek megvan.

A pornográfia felismerése ennek része. Az azonosítás viszonylag triviális feladat az emberek számára, de sokkal nehezebb egy algoritmust kiképezni az árnyalatok felismerésére. A küszöb meghatározása akkor is, ha a szűrő egy pornográf vagy nem pornográf jellegű képet jelez, szintén nehéz feladat, részben matematikai.

A mesterséges intelligencia tökéletlen.a tükör, ahogyan látjuk a világot, éppen úgy, ahogy a pornográfia tükrözi, hogy mi történik az emberek között, amikor egyedül vannak. Van benne igazság, de a teljes kép nem.

Ne felejtse el feliratkozni hírcsatornánkra.