目次へ

どっちがどっちに影響?

統計学の相関係数にまつわる注意点が1つあります。それは、統計学の相関係数は、あくまで大小関係の「傾向」を表しているに過ぎないということです。


「Aが大きいとBも大きい傾向がある」などと聞くと、AがBに影響を与えているような気がしてきます。 確かに、「日照時間とみかんの甘さに正の相関がある」とすれば、それは太陽の光がみかんを甘くしてくれるからでしょう。しかし「警察官の数と犯罪率に正の相関がある」からと言って、「警察官を増やすと犯罪が増える」ということにはなりません。逆に、犯罪率の高い州が積極的に警察官を採用している、という方が信憑性があります。


「AとBの間に相関がある」と言っても、実際には

1) AがBに影響を与えている
2) BがAに影響を与えている
3) AとBが互いに影響を与え合っている
4) まったく別の第三の要因が、AとBの両方に影響を与えている

という4つの可能性が考えられます。


自然科学では容易に実験ができます。日光の量が植物の生育に影響を与えるかどうかを調べたければ、水の量や温度は一定に保って、光の量だけ人工的に変えて、植物の生育を調べる実験をすればいいのです。

しかし、社会的な実験はしばしば困難です。たとえば、「暴力的なゲームにたくさん時間を費やす子供は、暴力的な犯罪を犯す可能性がふつうより高くなる」ということを主張するにはどうしたらいいでしょうか。同じ境遇の子供を200人集めてきて、そのうちランダムに選んだ100人には1日2時間、暴力的なゲームをすることを強制し、残りの100人にはその間スーパーマリオをやってもらうということを1年間続け、その後犯罪を犯す子供の数が、2つのグループで異なるかどうか、追跡調査すればいいのですが、もちろん、そんな実験は現実的ではありません。


だから実際には、東京に住む5000人の子供について、暴力的なゲームが好きかどうか、暴力事件を起こしたことがあるかどうか、データを集めたりします。ところが、もしそこで、「暴力的なゲームが好きか」と「暴力事件を起こすか」に相関関係が認められたとしても、それが即座に「暴力的なゲームは、子供を暴力的な性格にする」という主張の証明にはなりません。ひょっとすると、元々暴力的な性格の子供が、暴力的なゲームが好きというだけかもしれないからです。相関関係だけでは、因果関係の方向までは明らかではないのです。


犯罪が多ければ警察は増え、警察が多ければ犯罪は減る。このように双方向に影響し合っている場合は、影響の一方向だけを取り出すのは至難の技です。警察官を1割増やすと、犯罪率はどれくらい下げられるのでしょうか。「ランダムに選んだ半分の県だけ、警察官の数を1割増やしてみる」というような実験は難しいですね。実験をすることなしに、実際のデータだけからそれを知るには、もっと高度な統計のテクニックが必要になります。


そのようなテクニックの話はまたの機会にすることにして、次回は「相関関係」を解釈するときの2つ目の注意点を説明したいと思います。

>> 相関係数を知ろう(6)第三の要因