YouTubeの真っ赤な嘘?非収益化される禁止ワードリストが判明【YouTubeのアルゴリズム的不正part3/5】

YouTuberニュース

多様なクリエイターを支持していることをYouTubeは売りにしています。しかし、表向きの主張と、動画を自動分類するアルゴリズムの動きは一致していません。

こちらは2018年のプライド月間1をテーマにYouTubeの公式チャンネルから公開された動画です。動画には70%以上の低評価が付いています。多様性を称揚するYouTubeとその実態の乖離に対する抗議として視聴者たちは低評価をつけているのです。

#ProudToCreate: Pride 2018

YouTubeのアルゴリズム的不正シリーズのパート2ではLGBTQのクリエイターが起こした訴えを紹介しました。クリエイターたちはYouTubeは不当にLGBTQ関連動画を差別している、と話しています。

LGBTQのクリエイターがYouTubeとGoogleを訴える!彼らはアルゴリズム的不正の被害者?【part2/5】
——かつて人々の生きる支えになっていたコミュニティが、失われつつあります。それどころか、コミュニティに害を及ぼすまでになりつつあるのです。 こう語るのは原告の一人チェイス・ロス(Chase Ross)です。彼はトランスジェンダー(Ft...

パート3の今回は、動画がどのような用語を含んだ場合、非収益化されるのか詳細に検証したデータを紹介します。

2019年9月29日、YouTuberのNerd City、Sealow2、アンドリュー(YouTube Analyzed)が共同で分析結果を発表しました。

調査方法

調査はこのように行われました。まず、1-2秒の動画を作ります。この動画には非収益化されるような映像や音声は含まれていません。この動画にテストしたい単語を含んだタイトルをつけます。タイトルが変更されるとYouTubeは10–30分でタイトルで収益化・非収益化を自動判定します。

そこで、動画のタイトルを変更して2時間待ち、収益化されているかどうかを確認し、再びタイトルを変更して2時待ち、収益化されているかどうかを確認し、……を繰り返すことで、特定の単語を含んだタイトルが非収益化につながるかどうかを調べました。

以下のツイートは、検証したアンドリューの説明です。

この方法で2019年6月2日から7月5日までSybreedが手作業で1500語を調べ、2019年7月6日から21日までSealowが自動化して314000語を調べました。

タイトルに含まれていると非収益化されやすいとわかった単語には、“woman”(女性)、“gay”(ゲイ)、“lesbian”(レズビアン)、“democrat”(民主党)などがありました。このような内容の動画をYouTubeが差別しているなら大変な問題です。しかし、このような単語があると非収益化されやすいとしても、必ずしも差別とは言えません。

その理由はこうです。まず、これらの単語を含む動画は政治的な内容のものが多くなります。一方、広告主は政治的な内容を好まない(政治的な動画には広告をつけたがらない)傾向があります。そのため、手作業で動画の内容をチェックして収益化(広告をつける)・非収益化(広告をつけない)を決めると、これらの動画は非収益化されることが多くなります。

こちらはNerd Cityの動画です。

Youtube's Biggest Lie

YouTubeはすべての動画を手作業でチェックできるわけではないので、自動判定を使っています。自動判定は、手作業の判定結果を再現するように行います。つまり、手作業で非収益化された動画のタイトルに入っていた単語と同じ単語がタイトルに入っている動画は非収益化されてしまうのです。

たとえば、“animals”(動物)という単語を含んだ動画も非収益化されていました。これは、動物が戦っている動画が多く投稿され、非収益化されていたためです。そのせいで、“animals”以外に戦いや暴力を連想させる単語が入っていないタイトルの動画も巻き添えを食らって非収益化されていました。こちらのような動画です。

14 CRAZIEST Animal Fights Caught On Camera

このように、“woman”や“animals”がタイトルに入っている動画が自動判定で非収益化される理由は理解できますが、理解不能な単語もあります。たとえば、“restaurant”(レストラン)や“sunglasses”(サングラス)は非収益化されますが、原因不明です。

“Paypal”, “Xerox”, “Expedia”, “Hotels”, “Zorb”, “Zumiez”, “Wordpress”, “Dell”, “Shrek”のように会社・商品も非収益化につながる単語でした。金銭の支払いに関係する“profit”, “billing”, “revenues”, “saving”, “savings”, “selling”, “sells”, “referral”, “referrals”, “payroll”, “euro”も非収益化につながります。“Database”, “SQL”, “program”, “http”, “xml”, “xhtml”, “username”, “password”のようなプログラミングやコンピュータ関係の用語も非収益化につながります。

“Gay”や“lesbian”などの単語が差別されているのかどうかを調べるために、“Top 10 Lesbian Couples in Hollywood Who Got Married”(ハリウッドの結婚したレズビアンカップル10選)など全く問題ないはずなのに非収益化されている動画のタイトルを少しだけ変えて、収益化されるかどうかを確認しました。“Gay”や“lesbian”を“friend”や“happy”に置き換えてみたのです。たとえば、このタイトルを“Top 10 happy Couples in Hollywood Who Got Married”(ハリウッドの結婚した幸せなカップル10選)に変更します。33個のタイトルについて調べたところ、すべて単語を置き換えただけで収益化されてしまいました。これは差別的だと批判されても仕方ありません。

以下は収益不可になった題名です。

  • Gay and Lesbian Guide to Vienna – VIENNA/NOW
  • LGBTQ Tik Tok Compilation in Honor of Pride Month
  • Top 10 Lesbian Couples in Hollywood Who Got Married
  • Lesbian Princess
  • Lesbian daughters with mom

これらの題名の“Gay”や“LGBTQ”を“Happy”に置き換えると収益されることが分かりました。以下は収益化された題名です。

  • Happy and friend Guide to Vienna – VIENNA/NOW
  • Happy Tik Tok Compilation in Honor of friend Month
  • Top 10 happy Couples in Hollywood Who Got Married
  • Happy Princess
  • Happy daughters with mom

YouTubeの役員Neal Mohanがインタビューで、YouTubeとGoogleは「アルゴリズム的公正」と「機械学習的公正」のリーダーになると言っていますが、怪しく見える、とSealowは言っています。YouTube CEOのスーザン(Susan Wojcicki)も特定の用語を使うと非収益化されるのでは、という問いに「そんなはずがない」と答えていますが、調査結果からはスーザンの発言が疑わしいことがわかります。

このほか、広告主をYouTubeに出す側には、悪口や下品なことを言わない動画だけに広告を出すオプションが用意されているのに、その動画の判定基準が公表されていないこともSealowは問題視しています。

Sealowの動画

こちらがSealowの動画です。

Discriminatory LGBTQ demonetization and hidden ad tiers

今回の調査結果のGoogleドキュメントです。

Demonetization report
Beurling OCELOT AI Introduction This report is a compilation of two larger research projects aimed at trying to better understand Youtube’s demonetization b...

アンドリュー(YouTube Analyzed)の動画

こちらはアンドリュー(YouTube Analyzed)の動画です。

List of YouTube Demonetized Words REVEALED

アンドリューがまとめたGoogleスプレッドシートです。

YouTube Demonetization Words
All Words Monetized,Demonitized,* = mixed results Word,Note * = mixed results 13 66,Sealows Report:, 69,**,Test T...

こちらのシートの非収益化用語リストでは、d-ckとd-ck headの間にある人物の名前が入っています。もちろん、di-kとdi-k headは下品なので非収益化されても仕方ありませんが、副大統領を務め、映画化までされた人物の名前が入っているだけで動画を非収益化してしまってはいけませんね。

YouTubeが不適切だと疑われる動画を(誤判定があってもよいから)自動判定でただちに非収益化しようとするのは、広告主のためです。広告主は不謹慎な動画、暴力的な動画、論争を呼ぶ動画に広告を出したがりません。ならば、クリーンでいい子のYouTuberを売り出して、ゴリ押しすれば広告主に歓迎されるのではないでしょうか? もしかしたら、あの人気YouTuberもそんなゴリ押しYouTuberなのかもしれません。次回、パート4は、そんな噂の立っているYouTuberを紹介します。

シリーズの記事はこちらです。

  1. 動画が検閲され非収益化⁉︎ データでわかったYouTubeのアルゴリズム的不正
  2. LGBTQのクリエイターがYouTubeとGoogleを訴える!彼らはアルゴリズム的不正の被害者?
  3. YouTubeの真っ赤な嘘?非収益化される禁止ワードリストが判明(本記事)
  4. YouTubeが開発した人造YouTuber?ジャネル・イリアナの不自然すぎる自然さ
  5. チャンネルSpillが嫌われた理由 なぜゴシップYouTuberたちは過剰反応するのか

参考:Nerd City Calls On YouTube For More Demonetization Transparency Amid New Study About LGBTQ+ Video Titles

  1. 毎年6月はLGBTQ+などの性的多様性についての啓発月間でプライド月間(pride month)と呼ばれる。
  2. SealowはOcelot AIのCEO。
  3. YouTube Data APIを使って自動化した。
タイトルとURLをコピーしました