% ドレミの調和はちょっとデキすぎ?

\documentclass[dvipdfmx]{jsarticle}
\pagestyle{myheadings}
\markright{tmt's math page}
\def\baselinestretch{1.33}

\usepackage{tikz}

\begin{document}

\section*{◆ドレミの調和はちょっとデキすぎ?◆}

\subsection*{弦の音}

「ドレミファソラシド」といえば、音楽で決して欠くことのできない音階を表しています。音階は人の耳を頼りに創られ、かつ数学的理屈を頼りに作られているのです。ここでは数学的な思考を基準に話を進めます。

たとえば適当な長さの弦をはじくと音が出るでしょう。そして、弦を短いものに換えるとより高い音になり、長いものに換えるとより低い音になります。このことは遥か古代から知られていたことです。そのため、様々な長さの弦を用意すれば様々な音階の音を出すことができ、音楽が創られることになるのです。けれど、無遠慮にたくさんの長さの弦があっても、そこに何らかの調和がなければできあがる音楽は統一性を欠いてしまうでしょう。そんなことから、耳に心地よい「ドレミファソラシド」の音階が選ばれたと言えるのです。

それでは音階を作るために基準となる長さ$1$の弦を用意しましょう。いまは数学的に話を進めているので、長さの単位をつけないでおきます\footnote{現在では、周波数$440$Hzの音---これは「ラ」の音---が基準です。}。すると、この基準の音より高い音や低い音に対しては、どれほどの長さの弦を使えばよいのでしょうか。それは、高い音には$\displaystyle \frac{1}{2}$の長さの弦、低い音には$2$の長さの弦を使うのがよいのです。その理由は、$1$の長さの弦が出す音と見事に調和するからです。

\begin{center}
\begin{tikzpicture}[x=0.15mm, y=1mm]
\draw[domain=0:720, samples=200, thick] plot (\x, {6*sin(\x)});
\draw[dashed, thick] (0, 0) -- (0, 13); \draw[dashed, thick] (180, 0) -- (180, 13);
\draw[<->, thick] (0, 10) -- (180, 10) node[midway, above] {$1$};
%
\draw[domain=0:720, samples=200] plot (\x, {3*sin(2*\x)});
\draw[dashed] (0, 0) -- (0, -8); \draw[dashed] (90, 0) -- (90, -8);
\draw[<->] (0, -6) -- (90, -6) node[midway, below] {$\frac{1}{2}$};
\end{tikzpicture}
\end{center}

見事に調和する理由は簡単です。それは、長さ$1$の弦の音は波長$2$の波を作り、長さ$\displaystyle \frac{1}{2}$の弦の音は波長$1$の波を作るからです。そのため、これらの音を合わせても波に乱れが生じません。これがもし、長さ$1$の弦の音と長さ$\displaystyle \frac{1}{\sqrt{2}}$の弦の音だったら、波が乱れてしまうのです。

\begin{center}
\begin{tikzpicture}[x=0.15mm, y=1mm]
\draw[domain=0:720, samples=200, thick] plot (\x, {6*sin(\x)});
\draw[dashed, thick] (0, 0) -- (0, 13); \draw[dashed, thick] (180, 0) -- (180, 13);
\draw[<->, thick] (0, 10) -- (180, 10) node[midway, above] {$1$};
%
\draw[domain=0:763, samples=200] plot (\x, {4.24*sin(1.414*\x)});
\draw[dashed] (0, 0) -- (0, -8); \draw[dashed] (127, 0) -- (127, -8);
\draw[<->] (0, -6) -- (127, -6) node[midway, below] {$\frac{1}{\sqrt{2}}$};
\end{tikzpicture}
\end{center}

したがって音階の幅は、$1$の長さの弦が出す音と$\displaystyle \frac{1}{2}$の長さの弦が出す音を基準にするとよいでしょう。もちろん$1$の長さの弦と$2$の長さの弦でも同じことです。この幅が$1$オクターブの音程というわけです。

\subsection*{不調和な音}

長さ$1$の弦を基準にして$\displaystyle \frac{1}{2}$や$2$の長さの弦を作ったことで、弦の長さをさらに$\displaystyle \frac{1}{4}$, $\displaystyle \frac{1}{8}$, $\displaystyle \frac{1}{16}$, \ldots とすればより高い音が、$4$, $8$, $16$, \ldots とすればより低い音が作られていきます。しかしこれでは、たくさんの音を作れても、すべて同じ``種類''の音でしかありません。音に彩りを添えるためにも$1$オクターブの音程幅をいくつかに分割したほうがよさそうです。

そうはいっても、弦の長さを均等に分割してもうまくいかないのです。例として、$1$, $\displaystyle \frac{1}{2}$, $\displaystyle \frac{1}{4}$の弦の間に長さが均等に違う弦を$5$本ずつはさんでみましょう。

\begin{center}
\begin{tikzpicture}[x=8mm, y=14mm]
\draw[thick] ( 0, 1) -- ( 0, 0) node[below] {$1$};
\draw[thick] ( 6, 1/2) -- ( 6, 0) node[below] {$\frac{1}{2}$};
\draw[thick] (12, 1/4) -- (12, 0) node[below] {$\frac{1}{4}$};
\foreach \x / \y in {1/11, 2/10, 3/9, 4/8, 5/7} \draw (\x, \y/12) -- (\x, 0) node[below] {$\frac{\y}{12}$};
\foreach \x / \y in {7/11, 8/10, 9/9, 10/8, 11/7} \draw (\x, \y/24) -- (\x, 0) node[below] {$\frac{\y}{24}$};
\end{tikzpicture}
\end{center}

図では$2$オクターブ分の弦が示されていることになり、音の種類が$6$つになったことが分かります。そして$6$本離れた弦どうしが$1$オクターブの差---つまり弦の長さの比が$1:2$---になっているので、これが同じ種類の音ということです。なかなかきれいな音が奏でられそうな気がしますね。たしかに弦の長さが規則的に短くなってはいるのですが、惜しいかな$\displaystyle \frac{1}{2}$の長さの弦の前後で短くなる量が、$\displaystyle \frac{1}{12}$から$\displaystyle \frac{1}{24}$にずれています。ということは、このような音階では調和のとれた音が望めないのです。

\subsection*{長い弦の音}

それでは$1$オクターブの間に、どのように異なる長さの弦をはさんでいけば、調和のとれた音が期待できるのでしょうか。先ほど、$1$の長さの弦の出す音と$\displaystyle \frac{1}{2}$の長さの弦の出す音を合わせても、波に乱れが生じないと言ったことを覚えていますね。乱れが生じない理由は波長が一致するからです。だから$1$, $\displaystyle \frac{1}{2}$, $\displaystyle \frac{1}{4}$, $\displaystyle \frac{1}{8}$, \ldots の長さの弦は相性がよいのです。

では、$\displaystyle \frac{1}{3}$の長さの弦ではどうでしょう。もちろんこの場合でも波に乱れが生じません。しかし、$\displaystyle \frac{1}{3}$の長さの弦では$\displaystyle \frac{1}{2}$の弦より短いため$1$と$\displaystyle \frac{1}{2}$の弦の間にはさむことができません。そこで、それを$2$倍して$\displaystyle \frac{2}{3}$の長さの弦を用意することにします。この弦は$\displaystyle \frac{1}{3}$の弦と同じ音階で$1$オクターブ低い音を出すものです。そして$1$と$\displaystyle \frac{1}{2}$の間に収まる長さでもあるのです。つまり、弦の長さを$\displaystyle \frac{2}{3}$倍すれば別の音階が作れ、なおかつ元の音との相性も抜群であることになるのです。

\begin{center}
\begin{tikzpicture}[x=0.15mm, y=1mm]
\draw[domain=0:720, samples=200, thick] plot (\x, {6*sin(\x)});
\draw[dashed, thick] (0, 0) -- (0, 13); \draw[dashed, thick] (180, 0) -- (180, 13);
\draw[<->, thick] (0, 10) -- (180, 10) node[midway, above] {$1$};
%
\draw[domain=0:720, samples=200] plot (\x, {4*sin(3/2*\x)});
\draw[dashed] (0, 0) -- (0, -8); \draw[dashed] (120, 0) -- (120, -8);
\draw[<->] (0, -6) -- (120, -6) node[midway, below] {$\frac{2}{3}$};
\end{tikzpicture}
\end{center}

そうすると弦を$\displaystyle \frac{2}{3}$倍ずつすれば新たな音階が次々にできますね。そして$\displaystyle \frac{2}{3}$倍した弦の長さが$\displaystyle \frac{1}{2}$より短くなってしまったら、その弦を$2$倍すれば$1$オクターブ低い弦になるので、常に$1$と$\displaystyle \frac{1}{2}$の弦の間にはさむことができます。

次の表は、$1$の長さの弦$\ell_1$を次々$\displaystyle \frac{2}{3}$倍して(それが$\displaystyle \frac{1}{2}$の長さより短くなったら$2$倍して、弦の長さが$1$と$\displaystyle \frac{1}{2}$の範囲に収まるようにし)、順次新しい音階を作る様子を示したものです。$(~)$内の弦の長さが純粋に$\displaystyle \frac{2}{3}$倍の弦ですが、$\displaystyle \frac{1}{2}$より短いので右横に$1$オクターブ下の$2$倍の長さの弦を書き直しています。

\begin{center}
\begin{tabular}{c|cccccccccc}
音階 & $\ell_1$ & $\ell_2$ & $\ell_3$ & $\ell_4$ & $\ell_5$ & $\ell_6$ & $\ell_7$ & $\ell_8$ & $\ell_9$ & $\cdots$\\ \hline
弦の長さ & $1$ & $\frac{2}{3}$ & $(\frac{4}{9})\frac{8}{9}$ & $\frac{16}{27}$ & $(\frac{32}{81})\frac{64}{81}$ & $\frac{128}{243}$ & $(\frac{256}{729})\frac{512}{729}$ & $(\frac{1024}{2187})\frac{2048}{2187}$ & $\frac{4096}{6561}$ & $\cdots$\\
小数表記 & \small$1.00$ & \small$0.67$ & \small$0.89$ & \small$0.59$ & \small$0.79$ & \small$0.53$ & \small$0.70$ & \small$0.94$ & \small$0.62$ & $\cdots$\\
\end{tabular}
\end{center}

一応$9$番目の音階$\ell_9$までを示したものの、この先はいくらでも計算が可能なので、無数の音階が生成されてしまいます。しかし、もう少し先を続けると、$13$番目の音階$\ell_{13}$の弦の長さが$\displaystyle \frac{524288}{531441}\approx 0.99$となることが分かります。私たちは長さにしてわずか $1$\%の差しかない$2$本の弦が出す、$\ell_1$の音と$\ell_{13}$の音を聞き分けられるでしょうか? おそらく聞き分けることはできないでしょう。であれば、$\ell_1$の音と$\ell_{13}$の音は同じであると考えてよいでしょう。このことは$\ell_{13}$以降の音階を生成する意味がないことを示しています。なぜなら、$\ell_{14}$の音も同様に$\ell_2$とほぼ同じ音階になってしまうのですから。

\subsection*{短い弦の音}

以上で$12$種類の音階を作ることができました。でも、ちょっと待って。本当にこれで完璧と言えますか?

というのは$\displaystyle \frac{2}{3}$の長さの弦は、あくまでも$1$の弦に対して$\displaystyle \frac{2}{3}$倍のはずです。$1$オクターブの範囲が$\displaystyle \frac{1}{2}$の弦まであることを考慮すれば、$\displaystyle \frac{1}{2}$の長さの弦は$\displaystyle \frac{2}{3}$の弦に対して$3/4$倍なのです。つまり$\displaystyle \frac{2}{3}$の弦を作ることは、同時に$\displaystyle \frac{3}{4}$の弦も作ったことになるのです。

\begin{center}
\begin{tikzpicture}
\draw (0, 0) -- (6, 0);
\draw (0, 0.1) -- (0, -0.1) node[below] {$1$}; \draw (4, 0.1) -- (4, -0.1) node[below] {$\frac{2}{3}$}; \draw (6, 0.1) -- (6, -0.1) node[below] {$\frac{1}{2}$};
\draw[thick, ->] (0, 0.5) -- (4, 0.5) node[midway, above] {$\frac{2}{3}倍$};
\draw[thick, ->] (4, 0.5) -- (6, 0.5) node[midway, above] {$\frac{3}{4}倍$};
\end{tikzpicture}
\end{center}

そこで次の表は、$1$の長さの弦を次々$\displaystyle \frac{3}{4}$倍して(それが$\displaystyle \frac{1}{2}$の長さより短くなったら$2$倍して、弦の長さが$1$と$\displaystyle \frac{1}{2}$の範囲に収まるようにして)、順次新しい音階を作る様子を示したものです。

\begin{center}
\tabcolsep=5pt
\begin{tabular}{c|cccccccccc}
音階 & $s_1$ & $s_2$ & $s_3$ & $s_4$ & $s_5$ & $s_6$ & $s_7$ & $s_8$ & $s_9$ & $\cdots$\\ \hline
弦の長さ & $1$ & $\frac{3}{4}$ & $\frac{9}{16}$ & $(\frac{27}{64})\frac{54}{64}$ & $\frac{162}{256}$ & $(\frac{486}{1024})\frac{972}{1024}$ & $\frac{2916}{4096}$ & $\frac{8748}{16384}$ & $(\frac{26244}{65536})\frac{52488}{65536}$ & $\cdots$\\
小数表記 & \small$1.00$ & \small$0.75$ & \small$0.56$ & \small$0.84$ & \small$0.63$ & \small$0.95$ & \small$0.71$ & \small$0.53$ & \small$0.80$ & $\cdots$\\ \end{tabular}
\end{center}

もちろんこの表もさっき同様ずっと続ける意味はありません。実際、もう少し先を続けると、$13$番目の音階$s_{13}$の弦の長さが$0.51$となることが分かります。これは$\displaystyle \frac{1}{2}$の弦とほとんど同じですから、$s_{13}$以降の音階を生成する意味はありません。

さらに、もう少し注意深く表を見ましょう。さっきの$\displaystyle \frac{2}{3}$倍ずつした$\ell$の表と見比べてください。すると$s_7$以降の弦の長さは、$0.01$違いで$\ell$の表中に登場しています。また、逆に$\ell_7$以降の弦の長さも、$0.01$違いで一足先に$s$の表に登場しています。$0.01$の差なら同じ弦と見なしてよいでしょう。このように$7$番目以降の弦の長さが相互に現れるのは、$\ell_7$と$s_7$の長さがほぼ同じであることと、$\displaystyle \frac{2}{3}$倍と$\displaystyle \frac{3}{4}$倍が本質的に同じ弦を作るからなのです。生成の順番を考えると$\ell_1$から始まった弦の長さが$s_7$で完結しているような感じです。結局、重複していない音階としては、$\ell_2$〜$\ell_6$と$s_2$〜$s_6$までということになります。

$\ell$の音階を作る弦は$s$の音階を作る弦より長いので、$\ell$の音階を``長音''、$s$の音階を``短音''と呼ぶことにします。次の表はそれぞれの音を低い順に並べたものです。

\begin{center}
\tabcolsep=5pt
\begin{tabular}{c|ccccccccccccc}
長音 & $\ell_1$ & & $\ell_3$ & & $\ell_5$ & & $\ell_7$ & $\ell_2$ & & $\ell_4$ & & $\ell_6$ & $(\ell_1)$\\
短音 & $s_1$ & $s_6$ & & $s_4$ & & $s_2$ & $s_7$ & & $s_5$ & & $s_3$ & & $(s_1)$\\ \hline
弦の長さ & \small$1.00$ & \small$0.95$ & \small$0.89$ & \small$0.84$ & \small$0.79$ & \small$0.75$ & \small$0.71$ & \small$0.67$ & \small$0.63$ & \small$0.59$ & \small$0.56$ & \small$0.53$ & \small$0.50$ \\
\end{tabular}
\end{center}

\subsection*{ピタゴラス音階}

さあ、これで$1$オクターブ中の音階をうまく分割できました。全部で$12$種類の音階ができあがったことになるのですが、これらは本当にバランスがとれているのでしょうか? 確かめてみましょう。

音階の基本は$1$の弦を$\displaystyle \frac{1}{2}$倍したことから分かるように、比が基準となっています。$1$オクターブの高低比が常に$\displaystyle \frac{1}{2}$であるように、$12$種類の音程間の比は一定なのでしょうか。これはちょっと計算するだけで分かります。やってみると、どの隣り合う音階で調べても比は $0.95$〜$0.94$とほぼ一定していることが分かるはずです。$\displaystyle \frac{2}{3}$倍や$\displaystyle \frac{3}{4}$倍を繰り返して作った割には、微妙に調和のとれた音階ができあがるのは不思議なものです。

この音階はピアノを見ると分かるように、長音に白鍵が、短音に黒鍵が割り当てられています。ただし、短音として生成された$s_2$だけは白鍵に割り当てられています。$s_2$の音は$\displaystyle \frac{3}{4}$の長さの弦から出るので、$\displaystyle \frac{1}{2}$と$\displaystyle \frac{2}{3}$の長さの弦に次いで最もよく$1$の長さの弦と調和します。耳を頼りに音を聞けば、この音が長音の響きを持つと考えても不思議ではないのです。

\begin{center}
\begin{tabular}{c|ccccccccccccc}
白鍵 & $\ell_1$ & & $\ell_3$ & & $\ell_5$ & $s_2$ & & $\ell_2$ & & $\ell_4$ & & $\ell_6$ & $(\ell_1)$\\
黒鍵 & & $s_6$ & & $s_4$ & & & $s_7$ & & $s_5$ & & $s_3$ & & \\ \hline
音階 & ド & ド$^\#$ & レ & レ$^\#$ & ミ & ファ & ファ$^\#$ & ソ & ソ$^\#$ & ラ & ラ$^\#$ & シ & (ド) \\
\end{tabular}
\end{center}

このようにしてできた音階は、現在では「ピタゴラス音階」と呼ぶようです。ピタゴラス音階は、簡単な整数比の組み合わせなので、弦から出る音の波長も簡単な整数比になっています。そのために波がうまく融合し、「和音」が実に調和的に聞こえるのです。しかし不便な点があるのも事実です。それは、$1$の弦と$\displaystyle \frac{1}{2}$の弦が作る$1$オクターブ分の音階と、$\displaystyle \frac{1}{2}$の弦と$\displaystyle \frac{1}{4}$の弦が作る$1$オクターブ分の音階では、整数比にかすかなズレが生じます。$\ell$の音階と$s$の音階で$0.01$の差となって現れたのは、そんなことも原因のひとつになっています。そこで、その不具合を調整するために考えられたのが「平均音階」なのです。

\subsection*{平均音階}

ピタゴラス音階において、$12$の音階のうち隣り合う音階の弦の比は$0.95$〜$0.94$でした。まあ、$0.01$程度の差であれば放っておいてもかまわないのですが、厳密に同じ比であるほうが調律の際の整合性が保てます。そこで、どの隣り合う音階でも同じ比$r$であると仮定すると、$12$音上の弦がはじめの$\displaystyle \frac{1}{2}$になることから
\[
r^{12} = \frac{1}{2}
\]
が成り立ちます。これを満たす$r$は$\displaystyle r = \sqrt[12]{\frac{1}{2}} \approx 0.944$です。この比で構成した音階が平均音階なのです。弦の長さについてピタゴラス音階と平均音階を比べてみましょう。

\begin{center}
\tabcolsep=5pt \footnotesize
\begin{tabular}{c|cccccccccccc}
音階 & ド & ド$^\#$ & レ & レ$^\#$ & ミ & ファ & ファ$^\#$ & ソ & ソ$^\#$ & ラ & ラ$^\#$ & シ \\ \hline
ピタゴラス音階の弦 & $1.000$ & $0.949$ & $0.889$ & $0.844$ & $0.790$ & $0.750$ & $0.712$ & $0.667$ & $0.633$ & $0.593$ & $0.563$ & $0.527$ \\
平均音階の弦 & $1.000$ & $0.944$ & $0.891$ & $0.841$ & $0.794$ & $0.749$ & $0.707$ & $0.667$ & $0.630$ & $0.595$ & $0.561$ & $0.530$ \\
\end{tabular}
\end{center}

表からは、小数第$3$位まで比較しないと差が浮かんでこないことが分かります\footnote{「ソ」の音はピタゴラス音階$0.6667$に対して、平均音階$0.6674$です。}。このことから、音階を作るなら平均音階にするほうが簡便で合理的です。しかし、合理的にすれば何でもかんでも良くなるわけではありません。たとえば「ド・ファ」の波を、ピタゴラス音階と平均音階で比べてみましょう。ピタゴラス音階は寸分のズレもないのに、平均音階にはかすかなズレが生じるのです。

\begin{center}
\begin{tikzpicture}[x=0.12mm, y=0.8mm]
\draw[domain=0:1080, samples=200] plot (\x, {6*sin(\x)});
\draw[dashed] (0, 0) -- (0, 13); \draw[dashed] (180, 0) -- (180, 13);
\draw[<->] (0, 10) -- (180, 10) node[midway, above] {$1$};
%
\draw[domain=0:1080, samples=200] plot (\x, {4.5*sin(4/3*\x)});
\draw[dashed] (0, 0) -- (0, -8); \draw[dashed] (135, 0) -- (135, -8);
\draw[<->] (0, -6) -- (135, -6) node[midway, below] {$\frac{3}{4}$};
\end{tikzpicture}
\end{center}
%
\begin{center}
\begin{tikzpicture}[x=0.12mm, y=0.8mm]
\draw[domain=0:1080, samples=200] plot (\x, {6*sin(\x)});
\draw[dashed] (0, 0) -- (0, 13); \draw[dashed] (180, 0) -- (180, 13);
\draw[<->] (0, 10) -- (180, 10) node[midway, above] {$1$};
%
\draw[domain=0:1080, samples=200] plot (\x, {4.5*sin(\x/0.749)});
\draw[dashed] (0, 0) -- (0, -8); \draw[dashed] (134.8, 0) -- (134.8, -8);
\draw[<->] (0, -6) -- (134.8, -6) node[midway, below] {$0.749$};
%
\draw[dashed, thin] (1080, 0) circle[x radius=40, y radius=6];
\end{tikzpicture}
\end{center}

図では円で囲まれた所を注意深く見て、ようやく分かる程度のズレかもしれません\footnote{長さにして$0.0068$程度のズレです。}。しかし、波が遠くまで伝わるほど、また音が長い時間出ているほどズレが広がるのです。さらに、$2$つの音を同時に出せば波が増幅されます。そのため、波のブレがより顕著になるでしょう。耳のよい人であれば、きっとこのブレが気に障るでしょう。

ここで、前に$1$の長さの弦の音と$0.99$の長さの弦の音を同じとみなしたのに、これより小さいズレのほうを問題視していることをいぶかるかもしれません。しかし、実際に問題なのです。弦を単独ではじくのであれば、時間の経過によって波形が変化することはありません。でも、$2$つの波形を合成するとなれば話は別です。

いま提示した図の波をかりに$1$サイクルと呼ぶことにします。時間の経過によってこの波のサイクルが右へ伸びるのですが、ピタゴラス音階では$100$サイクル先も$2$つの波はこの図と同じ位置関係にあります。一方平均音階では、$100$サイクル先で長さにして$0.68$ほどのズレを生じるのです。音は$2$つの波を合成して聞くわけですから、当然はじめの合成波形と違う音を聞くことになります。そして、$300$サイクルあたりで長さにしてちょうど$2$のズレを生じ、結果的に始めの位置関係と同じ波形に戻ることになります。このような不安定な波形合成が、いわゆる``うなり''となって聞こえるのです。

もっとも、ピタゴラス音階に合わせた弦の長さで実際に音を鳴らしても、うなりを完璧になくすのは無理な注文には違いないのですが。

\end{document}