% 相関

\documentclass[dvipdfmx]{jsarticle}
\pagestyle{myheadings}
\markright{tmt's math page}
\def\baselinestretch{1.33}

\usepackage{tikz}

\begin{document}

\noindent\textbf{相関}

物ごとの傾向を調べるときに相関図を使うことがある。もっとも多く利用されるのが、XとYの二つにどのような関連があるかというものだ。この場合は、Xが$x_1$のときYは$y_1$という値をとる、Xが$x_2$のときYは$y_2$という値をとる、$\dots$という具合に数多くのデータを調べる。その結果、XとYの数値の組がたくさん出来上がる。これらの数値の組は$(x_1,~y_1)$, $(x_2,~y_2)$, $\dots$のように表せるので、横軸X、縦軸Yのグラフ上に点として打つことができる。打たれた点の様子からXとYの関連を見いだそうということだ。

\begin{tikzpicture}
\begin{scope}[shift={(-3, 0)}]
\draw (4, 0) node[below] {X} -- (0, 0) -- (0, 4) node[left] {Y};
\draw[dashed] (2, 2) circle[x radius=2, y radius=1, rotate=45];
\end{scope}
%
\begin{scope}[shift={(3, 0)}]
\draw (4, 0) node[below] {X} -- (0, 0) -- (0, 4) node[left] {Y};
\draw[dashed] (2, 2) circle[x radius=2, y radius=1, rotate=-45];
\end{scope}
\end{tikzpicture}

点が左のような領域に分布していると\textbf{正の相関}、右のような領域に分布していると\textbf{負の相関}という。分布がもっと細長くなれば、さらに強い相関があるということで、その極みが直線状に分布する比例である。

正の相関になる具体例は、Xが体重でYが身長というものだ。おおむねXの値が大きいほどYの値も大きくなる。そういう例は、Xが勉強時間でYが成績の場合にも当てはまるかもしれない。負の相関になる具体例は、Xが漁獲高でYが値段というものだ。おおむねXの値が大きいほどYの値は小さくなる。

問題は、相関があるとXとYの間に何らかの「因果関係」があるのではないかと思えることだ。漁獲高と値段には、多分に因果関係があると考えてよい。なぜなら魚の値段というのは、供給と需要をにらみながら人がつけるものだからだ。ある魚は今年は不漁だった``から''値段が高い、というように値段が高い原因を不漁に求めることができる。

しかし、体重と身長の間には相関はあっても、因果関係はない。なぜなら、体重が増えた``から''身長が伸びたわけではないからだ。試しに、食べて食べて体重を増やしてみよう。身長は伸びたかな? 正しくは、発育する``から''体重と身長が増加するのだ。体重と身長が増加することを発育と呼ぶ、と言ってしまえばそうなんだけど、発育によって体重と身長が同程度に変わるので、そこには強い相関がある。決して、体重の増加が身長の伸長を促しているわけじゃないから、それは因果関係とは言わないだろう。だから、身長を伸ばしたい人が、相関が強いという理由で体重を増やすことは意味がないのだ。

同じことは、勉強時間---これはスポーツにおける練習時間と読み替えてもよい---と成績にも当てはまる。総じて成績の良い者は勉強時間が長いので、そこには相関があると考えてよい。でも、長い勉強時間が成績の上昇を促す、というような因果関係はない。つまり、勉強時間を長くしただけでは成績はよくならないんだよ。これは体重と身長の関係と同じだ。因果関係があるとすれば、おそらく集中の持続時間と成績だろう。要するに、集中の持続時間が長い$\to$勉強時間が長くなる$\to$成績がよくなる、という関係だ。集中の持続時間が、勉強時間と成績の両方を押し上げている構図になっている。しかし、集中の持続時間は外からは見えにくい。見えるのは勉強時間の方である。そこで人々は、長い勉強時間が成績の上昇を促すと勘違いする。その結果、勉強時間を長くするための方策、たとえば宿題を課す、学習塾に通う、家庭教師をつける、などなどがはびこって、結局、集中しないで机に向かっている時間が長い状況だけが作られる。集中の持続時間を長くする方策を考えなくちゃ。

相関を見つけるだけでなく、因果関係を把握しよう。相関は、そう$\dots$``相(あい)関する関係''でしかない。``原因と結果の関係''じゃないんだよ。せっかく数学的にデータを処理し、正しく関係をつかめても、「相関関係」と「因果関係」を見誤っては意味がない。

\end{document}