経験とは統計である

世間一般の人の”難解”な現象に対しどのように”納得”するか

というテーマで、2つほどキーワードを提示して
日曜にエントリーを書くつもりだったのですが
上記の右鞭事件のショックでうっかり忘れてしまいました(嘘


それでは、「因果関係と共起関係」のお話を。
統計の分野でよく用いられる単語である「相関係数」。
−1から1の値をとるこの数値は出来事の因果関係の有無を調べるために使われることが多い。
しかし、実際に因果関係はないのに相関はある、というとんでもない結果が出ることが
実は少なからずあるのです。


統計ソフトなどで「相関係数が0かどうか(すなわち相関がないかどうか)」を検定するとき
通常、t検定というものが使われています。
しかし、このt検定はちょっと厄介な性質があり
標本数が多いと、因果関係なんぞまったくなくても「相関がある」という結論が出てきてしまうんですよ。


試しに、Excelでランダムで独立な2つの乱数列を発生させ、その相関係数とt検定の結果を測って見ると
標本数1000のデータの場合、相関係数は0.1〜0.005あたりの値を取り
t検定の結果では、けっこう頻繁に「0ではない(相関がある)」という方の仮説を支持することが可能な結果が得られます。
ランダムだから関係はあるわけないのに。
厳密には、t検定の結果から相関があるかどうかを結論付ける際に、有意水準という判断の基準値を調査者が自分で決めるため
有意水準の取り方如何では、相関があるのかないのか好きなように解釈することが可能なのですが
上記のやり方で、学術研究で一般的な「有意水準両側5%」という基準をクリアすることですら不可能ではありません。
はっきりいって、社会科学系の論文だったら(統計ソフトを過信するあまり)
実はまったく関係ないのに「相関がある」と断じてしまっているものもあって不思議はありません。
社会科学者は一般に、統計にそれほど聡くないですからね。


そして、ヒトの「経験」に基づく判断、においても
このt検定の検定結果と同じようなことが起こっている、ということは少なからずあると思います。
2つの出来事に対し、「これは関係あるのか?」と考えたとき
過去の経験データベースからデータを取り出してきて、検証すると
考えれば考えるほど、連想によって多くのデータが脳から引き出され標本数は増大。
その内、100件に1件ぐらいは関係がありそうと思わせるデータが照合される。
その1件に引っ張られて、「関係がありそうだ!」と結論付ける、なんてことはザラでしょう。
統計の場合は、t検定の性質を正しく理解していれば避けられる問題ですが
人間の場合は、なかなか難しい。
なにか論理的でない判断を下さなければ成らないときは(人生ほとんどそうだと思いますが)
考え過ぎて、思考がドツボにはまっていないかに気を配り
気分転換などで頭をリセットするのが大事、ということになりますでしょうか。