全般

あなたはすぐにあなたがポルノの前にそれに気づく。コンピュータは理解しますか?

先月の初めに、Tumblrはそれを発表しましたポルノを禁止します。新しいコンテンツポリシーが施行されたとき、約2週間後(12月17日)には、問題があることが明らかになりました。サイト上のすべてのポルノを追放することになっていた人工知能システムを配備した後、彼女は誤ってそのサイト上の4億5,540万のブログの中の無実の投稿にタグ付けした。

人工知能のためのポルノ

どの自動フィルターが明確でないかTumblrを使ったか独自に作成した - 同社はこのトピックに関する要求に答えていない - ソーシャルネットワークが独自のポリシーと技術の間で行き詰まっていることは明らかです。たとえば、「乳首を見せている女性」や芸術的なヌードに関するサイトの位置の不一致などにより、Tumblrでもプラットフォーム上で何を禁止するのかわからないことを示す文脈上の決定が導かれました。民間企業は、わいせつと見なすものをどのように判断しますか。

まず、危険なコンテンツをブロックする最初はそれが何であるかを判断するのが難しいので難しいです。猥褻さを定義することは、1896年に百年以上前の罠です。アメリカは、猥褻さを規制する法律を初めて可決しました。 1964年、Jacobellis v。Ohioの場合、オハイオ州がルイ・マルによる映画の上映を禁止することができるかどうかに関して、最高裁は今日、おそらく最も有名なハードポルノの定義を次のように述べた。私が理解しているように、それは簡略説明に含まれるでしょう。 Potter Stewart裁判官は、次のように述べています。 「しかし、私がそれを見たときにそれが何であるかを知っています、そしてこの事件に関連した映画はそれではありません。」

機械学習アルゴリズムにも同じ問題があります。 この問題は、人工知能の専門技術を販売しているPicnixのCEOであるBrian Delorgeを解決しようとしています。 Delorgeが言っているように、彼らの製品の1つであるIrisは、ポルノを検出して「人々を助ける」ためのクライアント側アプリケーションです。彼は、別のポルノの問題は何か、さまざまなものがあるということだ - そしてポルノではない画像も同様の要素を持つことができるということだと彼は指摘している。ビーチでのパーティーのイメージは、オフィスの写真よりも肌の色が濃いためではなく、すぐにブロックされることがあります。 「だからこそ、一度に画像認識アルゴリズムをトレーニングするのは非常に難しいのです」とデロージ氏は言います。 「定義が人々にとって困難になると、コンピュータもまた困難に直面する」ポルノとは違い、人々が同意できないとしたら、コンピュータはその違いを知りたがることさえできますか?

ポルノを検出するようにAIに教えるためには、あなたがする必要がある最初の事は彼にポルノを与えることです。ポルノがたくさん。どこで入手できますか?さて、人々が最初にすることはPornhub、XVideosからビデオの束をダウンロードすることだ、と彼のクライアントのためにAIフィルターを作成するスタートアップLemay.aiの共同創設者、Dan Shapiroは言う。 「これは法的性質の灰色の領域の1つです。たとえば、他の人のコンテンツから学んでいる場合、それはあなたのものですか?」

プログラマーがトンをダウンロードした後ポルノ、彼らは使用されているフレームがピザの行商人のブロックにつながらないことを確認するために、ポルノではないビデオフレームから切り出しました。プラットフォームは、そのようなコンテンツにタグを付けることで、大部分が米国外の人々に支払います。 「キャプチャ」を導入するかのように、仕事は低賃金で退屈です。彼らはただ座って言うだけです:これはポルノです、これはこれです。すべてのポルノにはラベルが付いているので、フィルタには少し違いがあります。写真だけではなく、大量のデータサンプルを使用する場合は、トレーニングが適しています。

「多くの場合、ポルノをフィルタ処理するだけでは足りません。Shapiroは言います。 「女の子と電話の写真で偽のプロフィールが好き」彼はクライアントを探しているセックスワーカーを意味しますが、それは完全に合法ではない、何かであるかもしれません。 「これはポルノではありませんが、あなたは自分のプラットフォームでこのようなことを見たくはないでしょう。」優れた自動モデレータは、数千万(たとえ数千万ではないにしても)のコンテンツの例を学習します。つまり、大幅な工数を節約できます。

「あなたはそれを子供との違いと比較することができますこのような画像フィルタリングを企業のクライアントに提供するコンピュータビジョンのスタートアップ、ClarifaiのCEO兼創設者であるMatt Zeilerは、次のように述べています。 「私は確かにあなたに言うことができます - 数ヶ月前に私達は子供をもうけました。彼らは世界について何も知りません、すべてが彼らにとって新しいものです。」明確にするために、私たちは子供(アルゴリズム)に多くのことを見せなければなりません。 「何百万という例があります。しかし大人として、私たちが世界について多くの文脈を作り出し、それがどのように機能するかを理解したとき、私たちはほんの2、3の例から新しいことを学ぶことができます。 (はい、成人向けコンテンツをフィルタリングするようにAIに教えることは、子供に大量のポルノを見せることに似ています)。 Clarifaiのような会社は今日急成長しています。彼らは世界の良いデータベースを持っています、彼らは裸のものから服を着た猫と犬を区別することができます。 Zeilerの会社は、そのモデルを使用して顧客向けの新しいアルゴリズムをトレーニングしています。元のモデルは大量のデータを処理しているため、個人用バージョンでは新しいデータセットのみが必要です。

しかし、このアルゴリズムですべてを実行するのは困難です。正しいです。明らかにポルノである内容で、彼はうまくいきます。しかし、写真は、オフィスでの写真よりも肌の色が濃いため、分類子が誤って下着の広告に禁止のマークを付けることがあります。 (ビキニと下着で、Zeilerによると、それは非常に難しいです)。これは、マーキングする人々は自分たちの仕事の中でこれらの極端なケースに焦点を当てるべきであることを意味し、モデルを分類することは難しいという事実を優先します。

そして最も難しいのは何ですか?

「アニメポルノ」とZeilerは言います。 「私たちのヌード探知機の最初のバージョンは、訓練のために漫画ポルノを使用していませんでした。」ヘンタイが認識していなかったために何度もAIが誤算しました。 「クライアントのためにこれに取り組んできたので、私たちは彼の大量のデータをモデルに導入し、実際の写真の精度を維持しながらアニメーション画像のフィルタの精度を大幅に向上させました」とZaylerは言います。

ポルノを盗聴するように教えられた技術、他のものにも使用できます。このシステムの基礎となる技術は驚くほど柔軟です。これはアニメのおっぱい以上のものです。たとえば、アルファベットのジグソーパズルは新聞の自動コメントモデレータとして広く使われています。このソフトウェアは、それがヌードではなく毒性によって分類されることを除いて、画像分類器と同様に機能します。 (テキストコメントの中の毒性は、写真の中のポルノと同じくらい判断するのが難しい)。 Facebookは自殺メッセージとテロ関連コンテンツを検出するために同様の自動フィルタリングを使用し、彼は彼の巨大なプラットフォーム上で偽のニュースを検出するためにこの技術を使用しようとしました。

それはすべてまだ人間に依存しています監督あいまいさとあいまいな文脈によりうまく対処します。 Zeilerは、彼の製品が誰かの仕事を奪ったとは考えていないと言います。それはインターネットを拡大縮小する問題を解決します。 AIが区別できるように、人々はAIを教えることで、コンテンツをソートしてラベルを付けることができます。

これがモデレートの未来です。 より多くのデータのためのますます高度な分類器を訓練するために彼らのビジネス全体を作る会社によって提供される個々の、既製の解決策。 Stripe and Squareが自社で処理したくない企業向けに既製の支払いソリューションを提供するのと同様に、Clarifai、Picnix、Lemay.aiなどの新興企業はオンラインモデレーションを実装する予定です。

Lemay.aiのDan Shapiroは希望に満ちています。 「他の技術と同様に、まだ発明の過程にあります。したがって、失敗した場合に私たちが道を譲るとは思わない。」しかし、AIは人間の監督なしに自律的に行​​動することができますか?はっきりしない「すべての写真をフィルタリングするスナッフボックスには、小さな人はいません」と彼は言います。 「アルゴリズムをトレーニングするためには、どこからでもデータを取得する必要があります。」

Zeilerは、その一方で、それを考えています人工知能はすべてを自分で調整します。結局、人々による介入の数はゼロに、あるいはわずかな努力で減少するでしょう。次第に、その人の努力は、高水準の推論、自己認識といった人々が持っているすべてのことなど、現在AIができないことに変わります。

ポルノを認識することはそれの一部です。 識別は人々にとって比較的些細な仕事ですが、ニュアンスを認識するようにアルゴリズムを訓練することははるかに困難です。フィルタが画像をポルノ画像または非ポルノ画像としてマークするときのしきい値の定義も、部分的に数学的な困難な作業です。

人工知能は不完全です。ポルノが人が一人でいるときに人の間で起こることの反映であるように、私たちが世界をどのように見るかの鏡。それにはいくつかの真実がありますが、全体像はそうではありません。

私たちのニュースフィードを購読することを忘れないでください。