大学院卒ニート、しやわせになりたい。

働かないで、アフィリエイトとか、ユーチューバーで幸せになりたいです。

スポンサーリンク

GoogleアドセンスはアダルトNGワードのリストをどのような方法で更新し、ネットスラングなどの固有名詞・新語を追加しているのだろう?

先日、以下のようなエントリを書いてました。

yarukimedesu.hatenablog.com


その続きです。そもそもこのエントリは、以下の私のブコメが発端でした。

マジレスすると、かなりの確率でGoogle規約に引っかかると思う。そして、「出会い」とかに関わる内容は、ペナルティもヤバいと思う。

ここでブコメ引用機能を使わないのは、元エントリのヒトデさん(人間)にIDコールが飛ぶけど、元々のお題とは違うから、控えました。

このブコメの連携ツイートから以下のような反応がありました。

相手は、らくからちゃ (id:lacucaracha)さんという人みたいで、ブログを確認すると、ITやアフィリエイトに強そうな印象でしたが、件のエントリに関しては、このような認識なんだな…と。しかし、私も例の単語や内容が、Googleがどのように認識するのか?という部分には興味があったので、いろいろと想像してみました。

GoogleアドセンスのアダルトNGワードのリスト。

これは間違いなく存在しているのだと思う。Googleアドセンスやっている人あるあるだと思うけど、記事を更新した直後に広告が配信されてなくて、あせって本文を修正した思い出。NGワードの出現頻度で、最初から広告を配信しない基準が何かしらあるのだと思う。

思い出深いのは、私はアドセンスも10年使ってますが、当初は『ヤクザ』という言葉すらNGになってました(たぶん)。アメリカ発のサービスなんで、英語でのNGワードのリストを翻訳したら、日本語のそれとして引っかかったのかもしれない。

(マンガの『暗殺教室』とかすれすれのタイトルだと当初思った)

映画 暗殺教室 DVD スタンダード・エディション

リストをどのような方法で更新しているのか?

実際のところ成人向きコンテンツなどを示唆する言葉は、日進月歩で増えていると思うのです。私が度々禁止コンテンツとして警告を受けたのは、成人向きアダルトグッズを(商品紹介抜きに)言及した記事でした。

アメトーークを見ていると時々名前が出てきて、福山雅治さんも好きだというアレです。

システムソフト・アルファー 天下統一III セレクション2000

調べてみると2005年に製品として生まれたみたいで、それ以前はアダルトな単語としてはネット上にも存在してなかったはずで、それが手動であれ、自動であれ、更新されていると思うのです。更新されてなかったら「アダルトページには表示しない」という広告品質が守れないと思うので…。

ネットスラングなどの固有名詞・新語を追加しているのだろう?

検索して調べれば、Googleがどのようにして新しい単語を発見して、そして、自身の辞書リストに登録しているのか?が解説されているだろうと思ったのですが、出てきませんでした。だから、想像します。

  1. 多くの人が検索する言葉は単語として認識。それがリストになかった時は新語と認識される。
  2. 新語の属性を調べる。その言葉が使われているページの共起語(同じ文脈でよく使われる単語)や、ページ属性を調べ、属性を決定する。
  3. 新語の属性が決定される。※前提として、同じ言葉が急に別の意味に転ずる可能性は少ないという考えはありそう。
  4. 新語がアダルト属性であれば、アドセンスのNGワードとして登録される。
  5. 手動登録も同時に行われている。

こんな感じです。実際のところ、作品名などは、日々生まれていると思います。例えば、以下の作品。

パコと魔法の絵本 [Blu-ray]

「パコと魔法の絵本」は、もろちんアダルト作品じゃあないです。また「パコ」という言葉は単体では、そういう言葉ではないですが、いろいろ足すといやらしい言葉になります。

Googleは広告品質を高めているはず。

では、ネットスラングや隠語を使いまくって、いやらしい内容を書いたら、Googleの目を欺けるのか?と言えば、そんなに甘くないでしょう。仮にエントリに広告が表示されていても、忘れた頃に警告が来ることは、よくあります。

ぶっちゃけ、そもそものエントリは、Googleアドセンスやっている人間は普通は取り扱わない題材で、しかも、バズりまくっているっているので、件のエントリでGoogleがNGワードとして認識した可能性もありそうです。

あと、これは想像ですが、アクセスが集まっている記事や、収益性の高いブログはコンテンツチェックが入る可能性が高いと思います。なのでヒトデさん(ジョジョ好き)のエントリは、高確率で警告が来ると信じているのですが、もしも、スルーされるのであれば、ネットスラングなどにGoogleが追いついていないのだと思います。

しかし、きっといつか追いつくと思うので、リスクを増やしたんだなーと思います。

おわりに。

今のところ、大元のエントリGoogleからの警告などは発生してないみたいですが、発生しないことが不思議でたまらないのですが、それはGoogleの中の人が判断することなので、別に警告が発生しなかったら、それで良いと思います。

「通報」してみるのが一番てっとり早いのですが、それをやっちゃうとカルマ値が一気にMAXに跳ね上がります。だから、言及エントリで「通報」のことは触れなかったのですが、エントリ冒頭のツイートの関連リアクションを見てみたら、本人たちが「通報」を話題にしていた(´;ω;`)。

Googleアドセンスをやっている人が知っておきたいのは、実数こそ分からないですが、通報は、そこそこ行われているという事実です。通報は行われない。Googleの中の人は目視判定をしていない。そう思い込むのは、慢心に繋がります。

ただ、Gooleなんて知らねえ!オレは好きなことを書く!という意気込みは、とても大事なものだと思います。だとしたら、もっと相応しい方法もあるはず…。