kotaの雑記帳

日々気になったことの忘備録として記していきます。



ビッグデータと相関関係と因果関係

 「「ビッグデータ」がもたらす「因果関係」から「相関関係」へのシフト—理由なんてどうでもいいんです」というエントリにブックマークが多くついている。読んでみると、良くわからない内容だ。

ビッグデータの時代には、暮らし方から世界との付き合い方まで問われることになる。特に顕著なのは、相関関係が単純になる結果、社会が因果関係を求めなくなる点だ。「結論」さえわかれば、「理由」はいらないのである。

 なんとなく、「理由」・「因果関係」・「相関関係」という言葉の意味を、捻じ曲げている気がする。ビッグデータ処理により「相関関係」が分かるので、ビッグデータはすごいというために「相関関係」が分かるありがたみを大きく言おうとして、捻じ曲がったのだろう。
 「相関関係」とは、例えば冬という季節では温度が低いことが多いという二つの事象が同時に現れるときに使われる言葉だ。冬だから寒いのか、寒いから冬なのか どっちが原因なのかまでは踏み込まない。
 別の例でいえば、大気中の二酸化炭素の濃度と海水の温度の間には相関関係があることが知られている。ただし、二酸化炭素が増加すると地球規模での気温が上がり、気温が上がったので海水の温度が上がったという、大気中の二酸化炭素と海水の温度に「因果関係」があるのか、長い時間で見ると地球はもともと氷河期と温暖期を繰り返しており温暖期に入って海水温が上がったので、海水に含まれる二酸化炭素が大気中に放出されて大気中の二酸化炭素濃度が上がったのかは分からない。
 「相関関係」が分かっても役に立たない場合が多い。例えば、夏場の電力使用量と気温との間には相関関係があるが、電力使用量を下げても気温が下がったりはしない*1。つまり、気温が35度の日に、気温が25度の時の電力使用量まで節電しても、気温が25度になったりしない。つまり、気温と電力使用量との間の「因果関係」が分かっていないと、役に立たないということだ。
 ビッグデータ処理により思わぬ「相関関係」が分かり、それによって何か思わぬ「因果関係」が見つかることもあるとは思うが、「因果関係」も大切だ。

*1:エアコンの排熱が減って気温が下がるというのはあるが、ここではそういう話をしているのではない。