視聴率の比較の仕方 決定版(?)

相当いまさらですが
http://d.hatena.ne.jp/lutalivre/20081209#1228774799
で、16.1%と14.7%には統計的に差があるかどうかというお話。
晦日の番組などでも視聴率が話題になるかと思いますので
視聴率をどう比較すべきなのか、まとめてみます。


ビデオリサーチ社の視聴率は、世論調査と違い
統計的に評価するのが結構、難しいのですが
なぜかと言いますと
そのサンプリングの方法に原因があります。
http://www.videor.co.jp/rating/wh/06.htm
サンプル数は600なのですが
毎月、25世帯ずつ入れ替えて、2年でやっと全て入れ替わる方法なので
2つの平均値を比較するときに、「独立(相関がない)」という仮定が
使えない場合が多くなってしまいます。


毎回、無作為抽出を行っている世論調査
独立という仮定を置けるので、簡単な計算で差の検定が可能です。
一方、独立ではない場合、二つの平均値の間にどのような関係があるのか
(正の相関があるのか、負の相関があるのか)
そしてその相関の程度はどの程度なのかが明らかになっていないと
平均値の差の検定はできません。


なので、厳密には、相関の値を公表していない
ビデオリサーチ社の視聴率のデータでは差の比較はできないのですが
ただ、相関が正か負か、ということはある程度予想できます。
例えば、大相撲の初場所を見る視聴者は、春場所も見るだろう
逆に、K-1を見る人は、あまり俳句王国を見ないだろう
といった具合です。もちろん、前者が正の相関、後者が負の相関になります。


このことを踏まえて、ケースごとに視聴率の差をどう評価すべきかを示します。


同時間帯の番組の比較
これは、当然、最も負の相関が高いケースとなります。
基本的には、同じ時間帯であれば、どちらかしか見ないことになるわけで。
この場合、「対応のある場合の平均値の差の検定」を使うことになるのですが
http://aoki2.si.gunma-u.ac.jp/lecture/Average/paired-t-test.html
負の相関の場合は、値の上で結構差があっても
統計上は差があるとはいえなくなってしまいます。
16.1%と14.7%の差程度では、まったく有意に差があるとはいえないです。
ちなみに、完全なる負の相関を仮定した場合(両方見る人がまったくいない場合)
20%と15.3%でも、一般的な95%両側検定では差があるとはいえません。
20%と15.2%なら差があると言えます。


同じ月に放送された似たような番組の比較
例えば、篤姫の最終回とその一話前との視聴率比較をしたい、といったケースですね。
同じ月に放映された、PRIDEとHERO'Sの比較をしたい場合もこのケースでしょうか。
この場合、正の相関があると言えますが
正の相関の場合は、平均値だけで見るとちょっとしか差がなくても
統計的には差があると言えちゃいます。
なので、16.1%と14.7%はかなり高い確率で差があることが予想されます。
ちなみに、完全なる正の相関を仮定した場合(負の相関の逆パターン)
20%と19.2%でも、95%両側検定で差があると言えます。


放映時期が2年以上離れている番組の比較
この場合は、番組の類似度にはまったく関係なく
どの番組同士を比較するにしても、独立だという仮定を置けます。
独立な場合は、次の平均値の差の検定が使えます。
統計ソフトなどで使える、一番シンプルな検定がこれです。
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html
この場合、16.1%と14.7%では、ぎりぎりのところなのですが
統計的には差がないという検定結果となります。


違う月だが2年以内に放映された似たような番組の比較
この場合は、弱い正の相関があると予想できます。
冒頭のリンク先での16.1%と14.7%との比較は本来、このケースに該当します。
1年、すなわち600のサンプルのうち300が入れ替わっているわけなのですが
完全に独立な場合だと、ぎりぎりで差がないという統計分析の結果が得られたので
正の相関があると思われる今回のケースでは、おそらく統計的に差があると
言えるのではないでしょうか。


簡単にまとめると
負の相関の場合、統計的に差があるという結果が得られにくく
正の相関は得られやすい
ということになります。
そして、相関がないものはその間ということで。