相関係数とは
標準偏差の次に学ぶべき統計学用語は「相関(そうかん)」です。 日常会話でも「性格の真面目さと字の丁寧さには相関がある」とか、「日照時間とみかんの甘さには相関がある」などと言うことがあります。基本的には「2つの間に関係がある」という意味ですが、統計学では相関という言葉をもう少し限定的な意味で使います。
統計学では「Aが大きいときBも大きく、Aが小さいときにはBも小さい傾向がある」とき 「AとBには正の相関がある」と言います。
反対に「Aが大きいときBは小さく、Aが小さいときにはBは大きい」という逆方向の傾向があるとき、「AとBには負の相関がある」と言います。
例えば、ある国では「人口1,000人当たりの警察官の数が多い州ほど、人口1,000人あたりの犯罪件数も多い」というデータがあったとします。このとき統計学では、「警察官の数と犯罪率には正の相関がある」と言います。
また別の国の調査では、「家庭でカップラーメンやファーストフードなどをたくさん消費している小中学生ほど、学校の成績が低い」という結果を示していたとします。このときは、「ジャンクフードの消費量と勉強の成績には負の相関がある」という言い方をするのです。
統計学ではこの「相関」を、公式を使って1からの間の数値で表します。この数値は「相関係数(そうかんけいすう)」と呼ばれます。相関係数の計算の仕方はあとで説明しますが、この相関係数が1に近いと「強い正の相関」、0に近いと「相関なし」、に近いと「強い負の相関」と言います。データを眺めているだけで正の相関があるな、と気づくようなときは、だいたい0.8とか0.9くらいの相関係数です。相関係数の値が0.6, 0.5, 0.4と下がって来ると、データを眺めているだけでは気づかない、微妙な相関ということになります。
それでは相関係数について大事な話をする前に、まずは計算のしかたを勉強することにしましょう。
>> 相関係数(2)計算のしかた