一人歩きする数字:ネットエージェントの調査は非実在青少年まで児童ポルノ扱いしてはいないか?

ネットエージェントが、Shareで児童ポルノを収拾するユーザ数(ネットエージェント曰く児童ポルノコレクターというらしい)について調査結果を公表し、ネットメディアもそれについて報じている。

調査の結果、Share の利用者のうち2万人以上が、児童ポルノを収集するために利用しているという実態が分かった。
全体の Share の利用者数が約10万人規模であることから、2割以上の利用者がこうした児童ポルノのコレクターであることを示している。

ネットエージェント、Share 児童ポルノコレクター数を調査 - japan.internet.com

ネットエージェントの公表した調査結果のグラフを見ても、9月21日から10月3日までの調査期間、20,485人から27,697人の間で児童ポルノコレクター数が推移していることがわかる。

Share児童ポルノコレクター数調査 【NetAgent Co., Ltd.】

最初にこの報道を見たときにはかなり驚いたのだが、よくよく調査手法について調べてみると、この調査において「児童ポルノコレクター」とされたユーザが、本当に児童ポルノを収集しているのか、どうも眉唾に思えてきた。

以下、だいぶ長くなってしまったので要約。クラスタワード使って児ポユーザをカウントしてるけど、誤爆上等で非実在青少年とか疑似ロリ物とか引っかかるようなワード使ってたら、『児童ポルノコレクター』数もすごい数になるんじゃないの?でもそんな疑念はどこ吹く風で、数字だけが一人歩きして報道されてるし、いずれは規制論者のダシにされちゃうんじゃないの?といったところ。

児童ポルノコレクター数の測定

児童ポルノを収拾しているユーザの数を算出するにしても、まぁ物事は順序立てて考えないと始まらない。

児童ポルノの定義

まずは児童ポルノとは何かを定義するところから始めよう。ネットエージェントのプレスリリースによると、児童ポルノとは「18歳未満の児童を被写体としたポルノ」とされる。一号、二号、三号と細かい区分も可能ではあるが、少なくともこの調査ではこれらをひっくるめたものを児童ポルノとして、それを収集しているユーザ数をカウントすることを目的にした、と。

ユーザ数の指標

次に、どうやってカウントするか。ネットワーク上のユーザを目視で勘定するわけにはいかないので、児童ポルノを収拾するユーザの数を示す指標が必要になる。この調査では、そのノード数がユーザ数の指標として用いられた。

児童ポルノコレクターの同定

では、Shareノード全体から児童ポルノを収拾するノードを弁別する基準は何か。理想的には、実際に児童ポルノ画像や動画のデータを受信しているか否かによって弁別されることが望ましい。ただ、そうなるとネットワーク上に流通する全ての児童ポルノ画像や動画を特定しなければならなくなり、非常に手間がかかる。

ネットエージェントは、児童ポルノに関連したクラスタワードを使用しているノードを児童ポルノを収集しているノードであると判定するという手法を採用している。

Shareネットワーク内では、同じような趣向を持ったノードが集まるようになっていて、それをクラスタという。たとえるなら、学校のクラスで仲良し同士がグループを作るようなもの。同じような趣向を持ったノード同士が密に繋がることで、データの流通を効率的にしている。このクラスタに効率的に参加するために、Shareユーザは「クラスタワード」という自らの趣向を表す言葉を登録することになる。

ネットエージェントは、このクラスタワードに、児童ポルノ用語を使用しているノードこそ、児童ポルノを収集しているノードだという前提を置いて、児童ポルノコレクターとしてカウントした。

児童ポルノコレクターのキーワード

では、どのようなクラスタワードを使用していれば、児童ポルノコレクターだと言えるのか。ここが最も重要だ。適切なワードを選ばなければ、児童ポルノコレクターを見逃してしまうかもしれないし、児童ポルノコレクターではない人を児童ポルノコレクターとしてカウントしてしまうかもしれない。

しかし、ネットエージェントは、具体的にどういったクラスタワードを使用したのか、については言及していない。

児童ポルノのコレクターとみなした利用者は、児童ポルノを収集するために趣向の似ている利用者同士がお互いにファイルを共有しやすくするために設定する「クラスタ」に児童ポルノ関連の用語を設定している利用者をコレクターとしてカウントを行いました。

Share児童ポルノコレクター数調査 【NetAgent Co., Ltd.】

児童ポルノ関連の用語」とのみ説明されている。InternetWatchの報道では、独自に取材したためか、もう少し詳細が見えてくる。

児童ポルノ画像の流通によく用いられるピンポイント的な“特殊クラスタワード”のほか、一般的に児童ポルノを示すと考えられる用語を計25種類ほどリストアップ。

Shareユーザーの2割・2万人以上が児童ポルノコレクターとの調査結果 -INTERNET Watch

『特殊クラスタワード』というのは、クラスタの中でも特定の細かいジャンルを指定したい場合に使用するクラスタワードのこと。たとえば、X-FILES専用の特殊クラスタワードとして、「妹がキャトルミューテーションされた!」というものがあるが、こんな風に一般的にはまず被りようのない用語を指定し、ユーザ同士が使用することで、「モルダー、あなた疲れてるのよ」という動画ファイルを収集するノードのクラスタが形成される。多くのユーザは接続優先度を上げ、早くファイルをダウンロードしたいがために指定している。

こうした特殊クラスタワードは、一般的に、各ジャンル1つか2つ程度、多くとも3つくらいとユーザの間でボンヤリと決まっている。そもそもが被らないような『特殊な』ワーディングなので、それほどたくさん用意する必要はない、ということだろう。

児童ポルノジャンルにも、この特殊クラスタワードが存在しており、ネットエージェントがそれを使用したというのは理解できる。しかし、上述したように、特殊クラスタワードは一ジャンルにつき、2,3くらいしかなく、児童ポルノに近接する援交ジャンルを含めたとしても、20弱のワードが残ることになる。それが、『一般的に児童ポルノを示すと考えられる用語』ということになるのだろう。

しかし、『一般的に児童ポルノを示すと考えられる用語』とはなんだろう。正直なところ、あまり思いつかないのだが、「ロリ」や「ロリータ」なども含まれるのだろうか。いや、確かに『一般的に児童ポルノを示すと考えられる』けれども、じゃあゴスロリ・ファッションは、ゴス「児童ポルノ」ファッションとはならないわけで、「ロリ」という言葉であっても、多様な記号を持っている。

こうした調査には、適切なワーディングが必要になる。「一般的に児童ポルノを示す」ことも重要だが、それと同時に「児童ポルノ以外を含まない」という条件も満たさなければならない。

「ロリ」が使われていたのだとしたら…

「ロリ」をクラスタワードとしてShareネットワーク上でファイルを収集する人たちは、どういったファイルを求めているのだろうか。Sharedb.infoにて「ロリ」をキーワードに検索をかけてみることにした。Sharedbは、2ちゃんねるダウンロードソフト板の全てのスレッドから、投稿されたハッシュ情報を収集しているので、必ずしもShareネットワークにて流通しているファイルを示すものではないが、どういった物が流通しているのかの参考にはなるだろう*1

検索の結果は、ご自身の目で確認されたし、というところなのだが、ざっと眺めてみると、あきらかに児童ポルノというものもいくつかある一方で、それ以上に「ロリ」というキーワードを含む同人ゲーム、同人誌、商業誌、商業ゲーム、イメージビデオ*2が並んでいる*3

もちろん、ダウソ板に書き込まれたものがデータベース化されているだけなので、Shareネットワークでは児童ポルノよりも二次ロリ、児童だけどポルノじゃないものの方が多いんだ!と言えるわけではないのだけれど*4、少なくとも、児童ポルノとは言えないものであっても、(誰かが)『一般的に児童ポルノを示すと考えられる用語』をクラスタワードとして使用した方が、効率的に収集できそうなファイルは、数多く存在するということは言えるだろう。

実際、この調査で「ロリ」という言葉が使用しされたのかどうかはわからないが、これはネットエージェントが公表しない以上、わかりようがない。また、ネットエージェントはプレスリリースの中で、以下のような但し書きを掲載している。

今回の調査では実際に実在する人物のものか、もしくは架空の人物のイラスト等なのかなどといった実際のファイル自体の調査は行っておりませんので、予めご了承下さい。

Share児童ポルノコレクター数調査 【NetAgent Co., Ltd.】

10万のShareユーザのうち、2万人が児童ポルノ収集目的で使用している、という調査結果は、確かに目を引く話題になるだろうが、それがどの程度確からしいのか、という査定こそ重要だ。しかし、この調査報告では、それがまったくできない。「架空の人物のイラスト」まで児童ポルノと含みうる調査を鵜呑みにできますかってーの。

しかし数字は一人歩きする

この調査について、NHKは「児童ポルノ交換 PC2万台超」という見出しで報じている。以下に引用する(強調は引用者heatwave_p2pによる)。

調査は、主に国内で利用されているファイル交換ソフトの「Share」について、今年9月から先月にかけてのおよそ2週間で、児童ポルノをやりとりしているパソコンがどれくらいあるかを調べたものです。その結果、「Share」に接続しているパソコンは全体で10万台余りとみられ、このうち児童ポルノの写真や映像のやりとりに使われているパソコンは2万台以上に上るとみられることがわかりました。

児童ポルノ交換 PC2万台超 NHKニュース

この調査についての言及はこれだけ。調査手法を考えれば様々な疑念が湧いてくるとしても、詳細は削られ、単に数字だけが伝えられてしまうのだ。

その結果は…、皆さんおわかりのように、規制論者にとっての「鬼の首」として使われることになる。

*1:なお、Sharedb.infoはあくまでもダウソ板に書き込まれたハッシュのデータベースであり、人気ジャンルほど多くの書き込みがあると思われるし、ダウソ板住民があまり興味を示さないものについては、あまり書き込まれないと思われる。

*2:IV: これも問題あるけど、少なくとも児童ポルノと『断言』できる代物ではないだろう。私は嫌いだが。

*3:勝手に流しているものだろうから、ほめられたものでもないんだが

*4:もちろん、逆も然り