% 平均

\documentclass[a4j]{jsarticle}
\pagestyle{myheadings}
\markright{\sf tmt's math page}
\def\baselinestretch{1.33}

\begin{document}

\noindent{\bf 平均(average)}

日常的に使われている平均値とは、データの合計をデータ数で割った値のことである。平均年令、平均点、平均収入、平均入場者数、平均タイム等々いくらでも例はある。平均を計算しておくことは、その集団(または個人)のおよその傾向を簡単に知ることができるので大変便利なものだ。だからといってむやみに平均を目安にしてよいわけではない。

テストの点でも品物の販売実績でもかまわないが、かりに自分の成績が$55$であったとしよう。そして自分が所属する集団の平均が$50$だったと聞かされたとする。ふつうの感覚なら「平均よりはちょっとましだったか」と思い、もう少し上位の成績を得られなかったことを悔やむと同時に、「まん中より上だからよしとするか」などとなぐさめるだろう。もちろん私だってそう考える。

ところがそのときの全員の成績が以下のようになっていることだって往々にしてあるものだ。

\begin{enumerate}
\item[]
90, 80, 75, 75, 70, 70, 70, 70, 70, 65, 65, 65, 65, 65, 65, 65, 65, 60, 60, 60, 60, 55, 55, 50, 25, 25, 20, 20, 20, 15, 15, 10, 10, 0, 0
\end{enumerate}

この$35$人分のデータの平均を求めればたしかに$50$である。しかし$55$という値は上から数えて$22$番目にあたる。そして$90$から$0$までまんべんなくデータが分布しているようで、その実$50$と$25$の間には明らかな差の広がりがある。考えようによっては$25$以下の者は「お客さん」だ。そう考えてしまえば$55$はお客さんではないものの、悪い部類の成績と考えてよい。まん中より上なんてとんでもない。

このデータを別の観点から見てみよう。$35$個あるデータでもっとも多い値は$65$である。このように一番多く現れる値を「最頻値(モード)」と呼んでその集団を代表する値とすることがある。また$35$人中ちょうどまん中の順位(すなわち第$18$位)の人の値は$60$である。そこでこのようにまん中の順位の値を「中央値(メディアン)」と呼んでその集団を代表する値とすることもある。それに対してさっき求めた平均は「算術平均」と呼ばれている。

今の例では算術平均より、最頻値か中央値のほうが集団の実体を表しているといえよう。そうなれば$55$という結果は残念ながら平均的な成績よりも劣っていると言わなければならない。

\end{document}