kotaの雑記帳

日々気になったことの忘備録として記していきます。



ビッグデータと、因果関係と相関関係

ビッグデータの正体 情報の産業革命が世界のすべてを変える」は言う。

ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。「結論」さえわかれば、「理由」はいらないのである。

因果関係から相関関係へ」とも言われる。

 これは、素敵な言い方だけど、統計を勉強した人は「?」と思うに違いない。相関関係と因果関係という言葉の意味が少し違って使われているからだ。
 相関関係とは、二つの変数があったときに片方が増えればもう一方も増えるという関係があることである。例えば、オーストラリアは夏に山火事が多く発生するが、同時にアイスクリームの売り上げも増える。つまり、山火事の発生件数とアイスクリームの消費量との間には相関関係がある、といえる。
 一方、因果関係とは、二つの変数があるときに、片方の変数の値が、もう一方の変数の値に影響を与える関係があることである。例えば、オーストラリアは夏になると気温が上がり山火事が増える。気温と山火事の件数との間には因果関係がある。
 こう考えると、相関関係が分かっても「結論」にたどり着けないことが分かる。「結論」が分かるためには因果関係が分かることが必要である。上記の本が言っているのは、因果関係のある変数の背後にある明確なメカニズム(「理由」)が分からなくても、因果関係(「結論」)を確認できれば良い、ということだろう。 それを「因果関係から相関関係へ」と表現するのは、言い過ぎだと思う。