サイトのリンク構造から有害コンテンツを判定

 東京大学トレンドマイクロは28日、情報セキュリティ分野の共同研究成果として「Webリンク構造の解析結果」を発表した。これは、Webサイトのリンク構造を把握することで、有害サイトの特定および未知サイトのカテゴライズ精度の向上を図るもの。研究は2007年6月から2008年1月にかけて行なわれた。

サイトのリンク構造から有害コンテンツを判定、東大とトレンドマイクロ

有害とは何ぞやというところには踏み込んではいないものの、1つのアプローチとしては興味深いね。

 また、安全なカテゴリのページからであっても、リンクを辿ることによって、有害サイトに到達する可能性が高まることが判明した。例えば、アダルトカテゴリに到達する率は、安全なカテゴリ(アート・エンターテイメント、スポーツ、旅行など)から出発し、1ジャンプ先では平均0.27%だが、2〜3ジャンプ先では平均2.69%まで高まった。特に、ユーザーがリンクを貼るCGMコンテンツは他のカテゴリに結び付く可能性が高くなり、結果的に有害サイトへ行き着きやすい傾向であることがわかった。

まぁ、これは自分自身が貼り付けたわけじゃなくても、そうなっちゃうから怖いよね。

といっても、私のブログはBitTorrentサイトなんかにリンクを貼り付けることも多いので、有害サイト認定されるんだろうね。