日本レコード協会の違法等ダウンロード数概算がひどい件/ネット調査は信用できるか?

今回は2部構成でお届けします。初めに、RIAJの「音楽メディアユーザー実態調査」がインターネットアンケート調査になっちゃったけど、これって本当に信用できるの?というお話。後半は、RIAJの「違法配信に関する利用実態調査」で、違法ダウンロード数が年間43.6億曲だみたいなこと言われてるけど、実際はどうなの?というお話。後半だけ読みたい方は「何この計算」って見出しまで飛ばしてくださいな。

ネット調査から読み取れること

しばしば私のエントリなどに有意義なコメントをくれるid:ripple_zzzさんが『ネット調査の持つ課題点』と題したエントリにて、日本レコード協会が公表した「音楽メディアユーザー実態調査」の調査手法についての疑問点を挙げている。

去年からRIAJは調査手法としてインターネットアンケートを用いています。報告書ではどのような調査をしたのかは触れられていても、どのように計画&実施したのかが触れられていないので、邪推的にならざるを得ないのだけど、おそらくはRIAJに限らず多くのネット調査がそうであるように、インターネットリサーチ会社に委託して実施されたものであろうと考えられます。昨今ではこのような形式を用いた調査は大変多くなっています。これまでにあった街頭調査や郵送調査に比べると、ネットを用いることで色々コストは軽減できますし、電話調査に比べて詳細な調査が可能、そして集計や整理も楽ですから、利用メリットは多くあります。

ネット調査の持つ課題点 - ripple_zzzの自由帳

この指摘の通り、「音楽メディアユーザー実態調査」は2009年度調査よりインターネットアンケート調査として行われている。おそらく、RIAJから調査委託されたインターネットリサーチ会社の会員の中から抽出されていると思われる。

それ以前は、東京30km圏からエリアサンプリング法により調査対象者を抽出、質問紙による面接留め置き自記入式のアンケートだった。わかりやすくいうと、調査会社が東京近郊からランダムに世帯をピックアップして訪問、調査に協力してくれる人に調査や回答の仕方等の説明を行い、質問用紙を手渡し、一定期間後、回答済みの用紙を回収しに再度訪問する、と。

id:ripple_zzzさんは、この調査手法の違いが調査結果に影響を及ぼしうると指摘する。

しかし記事タイトルにも書いたように、この形式には大きな問題点があります。調査をする上では母集団の質はとても大事になってきます。今回のRIAJが行った調査は、「人々がどのように、更にどの程度、音楽と接し利用しているか」というものです。この際に対象とすべきターゲットは「全ての人々」になります。国勢調査のように大規模な調査をするのは非現実なのでサンプル数はどうしても少なくなってしまいますが、とは言えそこにはあらゆる人々が含まれていなくてはなりません。しかしネット調査の場合、「インターネットユーザー」という前提が既に「ふるい」として影響を及ぼしてしまいます。今回のRIAJの調査で考えてみると、インターネットユーザーからの結果であればYouTubeニコニコ動画を利用する人は当然割合として高くなってきますし、音楽配信やCDとの関係も変わっていくでしょう。他にも挙げようと思えば挙げられるはずです。

ネット調査の持つ課題点 - ripple_zzzの自由帳

これはほとんどのすべての調査に言えることなんだけれども、その調査で抽出されたサンプルは、その調査が想定している母集団をどれだけ反映しているのか、ということを考えなければならない。

たとえば、RIAJの調査でインターネットリサーチ会社によって抽出された「高校生男子」は、すべての『高校生男子』を代表するものだろうか。答えはNO。なぜなら、全世界の『高校生男子』を代表してはいないから。当たり前だと思われるかもしれないが、それはあなたが「この調査は日本人を対象にしたものなのだから、日本の高校生男子に限られるのは当然だ」と思っているためだろう。日本人から抽出したという前提が想定される母集団に制約をかけるように、インターネットユーザから抽出したという前提も想定される母集団に制約をかける。

さらにid:ripple_zzzさんは、こうしたインターネットアンケートに協力する人たちは、たとえば協力することによって報酬が得られるなどの動機によって参加しているとも指摘している。果たしてそうしたユーザは「一般的なインターネットユーザ」の代表といえるのか。それも制約の1つだ。もちろん、面接留め置き式でも報酬はあるのだろうが、自発的に登録していたのとたまたま選ばれたのとでは、おそらく性質は異なる。

とはいえ、RIAJも調査結果を歪ませるために調査手法を変更したわけではないのだろう。以前の調査手法では、対象は東京圏に限られていたため、地方の音楽ユーザの傾向をつかむことはできなかったことや、年代*1×性別では各群75名では複数回答をクロスして分析することが難しいなどの問題もあった*2。以前の方法で、全国5地域に拡大してサンプル数を増やすことも選択肢の1つではあるのだろうけれども、単純計算で5倍の予算が必要になる。

一方、インターネットアンケート調査に変更したことで、調査対象者を増やし、年代、性別に加え、地域*3での区分けが可能になり、また複数回答をクロスさせた分析が、少なくとも以前に比べればやりやすくなったともいえる。

ただ、どんなに多くの「ふるい」をかけたところで、かける前と結果が変わらないという可能性は勿論あります。しかしある程度の「考慮」を用いてみることは必要なのではないかと考えますよ。そして何よりRIAJの様に大きな団体が行う実態調査なのであれば、ネット調査だけに依存するのではなく旧来の調査も取り入れて母集団に一般性をより持たせる努力を行ってもらいたいですねー。

ネット調査の持つ課題点 - ripple_zzzの自由帳

そう、データを解釈、理解するためには、そのデータに含まれる制約を考慮しなくてはならない。

理想的には、同一母集団を想定している調査は相互に比較できてしかるべきなのだけれども、調査手法が異なる場合などは現実的には難しいことも多い。結局、それぞれの調査でのサンプルに何らかの偏りが生じてしまうか、偏りが生じていないとは言い切れない場合がほとんどだからね。

じゃあ、そんな調査結果には何の意味もないのか、というとそんなことはない。2008年度調査(面接留め置き)との2009年度調査(インターネットアンケート)のCD購入率、平均購入枚数のスライドを見てみよう。

2009年度調査(インターネットアンケート)

全体の購入率を眺めてみると、だいたい連続した数値が並んでいるように思える。ただ、性年代別の数値や平均枚数では、若干の違いがあるようにも思える*4

ただ、数値は違えども結果のパターン、傾向に大きな違いはないようにも見える。たとえ、回答者の属性(たとえばインターネットユーザー)がある項目の結果に影響を与えていようとも、回答者全体に同じバイアスがかかっているのであれば、回答者間の別の要因との交互作用*5がない限り、パターンとしてはだいたい同じになるんじゃないのかな。インターネットユーザって属性が結果に影響を与えうる要因である一方で、性別や年代も結果に影響を与える強力な要因なのだし。

もちろん、id:ripple_zzzさんが指摘するように、「インターネットユーザーからの結果であればYouTubeニコニコ動画を利用する人は当然割合として高くなってきますし、音楽配信やCDとの関係も変わっていく」可能性についても、きちんと考慮ないし留保しなくてはならない。上記の結果を見ると、2008年度調査(面接留め置き)の平均購入枚数と、2009年度調査(インターネット調査)の平均購入枚数とでは、大きな違いが見られる。2008年調査に比べて2009年調査では、シングル全般の購入枚数や中古CDの購入枚数が多いことが見て取れる。時間(環境)の推移による変化とも解釈できるが*6、おそらくは調査手法の変更による属性の違いが反映されたものと解釈した方がベターじゃないかな。

2009年度調査(インターネットアンケート)

ここら辺も、インターネット調査への移行によって数値に変化が見て取れる。特にネット配信の利用率が大きく上昇してるところなんかはね。ただCD、レンタル、配信と重複する範囲等、全体としてのパターンを全体として俯瞰するくらいはできるんじゃないかなと。もちろん、インターネットユーザを対象にした調査であることを考えれば、ネット配信辺りの調査結果についてはかなり慎重に見ないといけないんだろうね。

設定された母集団と、抽出したサンプルとに齟齬があることはままあるけれど、その違いがどのように結果に現れるかはさまざまで、単純に設定された母集団を代表していないのだからこの結果には意味がない、とは言えないと思っている。そういう意味で1つの調査結果を絶対のものとすることは危険ではあるけれども、類似する複数の調査結果をメタ分析的に比較し、その中でわかることもある。得られた数値に違いはあっても、その傾向、パターンの類似性を見いだすこともできる。

調査によって与えられたデータは、いくつかの制約の中で出るべくして出た結果。それを正しく読み取ることで、見えてくるものもあるんじゃないかな。ネット調査は信用できるか否かという問いは、イエスでもありノーでもあると思う。きちんとデータの制約を把握しつつ、常に別のデータとの整合性を確かめるように心がければ、イエスなんじゃないのかな。

だが、「違法配信に関する利用実態調査」、てめーはダメだ。

何この計算

違法ファイルの推定ダウンロード数は、「日本の人口」(平成17年国勢調査)に対して、今回の調査でわかった「ダウンロード利用率」および「平均ファイル数」を乗じて算出した。

音楽の違法ダウンロードは年間43億件、正規配信換算で6683億円に相当 -INTERNET Watch

単純計算で出てきた数字が43.6億ダウンロードである、と。

設問については、「日本レコード協会のアンケート調査集計がひど過ぎる件」でも言われているので、ここでは割愛するとして。

インターネットユーザへの調査を、そのまま「(裏付けが甘いまま)設定した母集団」全体(日本人全体)に適応するというのは、あまりに乱暴だよねぇ。

あと、計算式の「平均ファイル数」というのもダウンローダーの平均ダウンロードファイル数の代表値として適切なのかどうかも正直疑問。

楽曲ファイルのダウンロード数項目の内訳を見てみると、平均ファイル数を下回るダウンローダーはだいたい全体の95%くらい。要は、5%程度のごく少数のダウンローダーが平均をつり上げているってこと。注意が必要なのは、ユーザ全体の5%ではなくて、P2Pファイル共有ソフトや動画配信サイト、掲示板等から落としているダウンローダーの5%程度ってこと。

月に1ファイル以下がだいたいダウンローダー全体の5割程度、月に2〜5ファイル以下まで広げると全体の8割程度、月に6〜10ファイル以下までだと項目によって多少ばらつくが全体の9割から9割5分。かなり偏ったデータなので、単純平均を出すのは慎重になった方が良いと思うんだけどね。

結局、年間43.6億ファイルが違法のダウンロード数だとかいってるけど、結局はほとんどがごくわずかなヘヴィダウンローダーのダウンロードなんですね、というより他ない。

私が今まで月にアルバムを3枚購入していたのに、違法ダウンロードのせいで1枚になった/買わなくなった、だから苦しくなるんだというのは納得できるんだけど、月に100曲違法ダウンロードしていたところを、月に1万曲に増やした、だから苦しくなるんだ、というのは、「え?」と聞き返したくなる。

月に百曲も千曲も正規でないダウンロードをしているごく少数のダウンローダーよりも、月に1〜10曲程度ダウンロードしている多数のダウンローダーの方が、レコード産業にとっては重要だし、克服すべき課題が見えてくるんじゃないのかな。

数字の一人歩き

敢えてこうした意味のない数字をデデーンと前面に押し出すのは、刺激的な数字を出すことで耳目を集めるためってのもあるし、この数字を公式の場で出すときは、その算出方法や制約についてほとんど注意が向かないから、多少批判を浴びても気にしないってためでもある。

これは記者懇談会での発言になるんだけど、RIAJ違法着うた調査の結果がこんな風に出されると。もちろん、ルールメイキングの場でも、私たちはこれだけ困っているんですよ、法規制が必要ですよ、という主張をバックアップするためにも使われる。まぁ、一度結果として残せば、そのときには批判を浴びたとしても撤回しなければならないという事態にはならず、ときが経てばあたかも一般化された事実として提示することができる、と。

今回の年間43.6億ファイルも、いつの間にか「日本における違法音楽ダウンロードの実態」を現す数字としてかかげられることになるんじゃないのかな。

余談

しっかし、違法"等"ダウンロードってのも味わい深い言葉。正規ストリーミングコンテンツのダウンロードは違法ダウンロードじゃないけど、カウントしたかったってのもあるのかもね*7

「オリジナル曲」とか「歌ってみた」が盛んなニコ動辺りだと、動画から音声を抜くユーザも多そうだね。当たり前ではあるけれど、調査や調査結果だけでは読み取れない背景も含めて、データを解釈するのも重要だね。

*1:中学生・高校生・大学生・20代・30代・40代・50代・60代

*2:単一項目でも、年度ごとに大きくぶれたデータが得られたりして、さらにもうちょっと細かい話になると、面接留め置き法で一戸一戸訪問するとして、本当にランダムになっているのか、って問題もあって。たとえば平日の午前から夕方の時間帯に訪問した場合、日中家人が不在の世帯(共働きの夫婦やひとり暮らしの社会人など)が対象から外れる可能性もある。やり方次第ではあるが結構大変。もちろん、このRIAJの調査がそうだってわけじゃなくてね。

*3:実際、インターネット調査になった2009年度調査では「地域間の音楽消費の特性」をメインテーマとしている。

*4:2008年度調査では、性年代別の結果が2009年度調査に比べてデコボコしてたり。この辺は、2009年度調査で人数を増やしたことである程度ならすことができたのかなと。

*5:たとえば、CDの購入率において、インターネットユーザであることが、男性と女性とで/年代ごとに異なる影響を及ぼす、とか。実際にそうなのかどうかはわからないけど。

*6:調査と調査の間に、その変化を引き起こしうるドラスティックな変化があれば、の話だけど。CDシングル生産枚数が減少している中で、シングルが伸びているわけもなく。

*7:正直なところ、設問からはその辺の判断は明確にはできないと思った。