フォルマントの山と谷
仮に、基本周波数100Hzで作られた「ɔ」に相当する合成母音を発生させたとする。
その音声スペクトラムは、100の整数倍に高次パルスがヒゲのように立ち並ぶ。
そのパルスの頂点をなだらかに結んでいくと、大きな山と谷が現れる。
この山がフォルマントである。
「ɔ」の場合、500Hzと1500Hz辺りに大きな山が存在し、その間は谷となる。
P・ラディフォギッドの「音響音声学入門」によると、
この「ɔ」の基本周波数を120Hzや150Hzに上げたとしても、
ピークはやはり500Hzと1500Hzに現れるという。
つまり、音程が高くなっても、「ɔ」の母音が「ɔ」として聞こえるのは、
その母音に対するフォルマント形状が決まっているからだと言う。
彼はそれを、”各母音に対応してそれぞれの母音を特徴づけるコード(和音)が存在する”
と言うように書いている。
つまり、母音というのは、ピアノで特定の和音を連打しているようなことだと言える。
さらにその本では、
”フォルマントは、声道内の空気の減衰振動の基本周波数に対応するものである”
”波形のスペクトルは、声道のフィルター特性によって決定される領域にピークを持つ”
と書かれている。
つまり、声道内の減衰特性によって谷を削り出し、結果的に残ったものが山(フォルマント)だということになる。
実際、減衰作用だけで山が削り出されたのか、それとも山を盛り上げる(共鳴現象)なのかは、私には分からない。
ただ、鋭いピークを持つ波形は共鳴現象の特徴ではあることから、その両方が起きているのではないかと思う。
フォルマントが急峻で鋭く尖った形状をしているときの音は、消失速度が遅いとラディフォギッドは書いている。
音叉のような純音は、数秒間にわたって音を持続できるが、
なだらかで広い周波数帯域に伸びるフォルマントを持つ音は、一瞬にして消えてしまうという規則があるらしい。
人間の声は、純音ではない複合音のため、すぐに音は減衰して消えてしまう。
ノイズを含んだ声がガサガサして聞こえるのは、音の継続時間が短いせいだろうか?
純音に近い声は、密度の濃い声になるのだろうか?
そんな推測が成り立つ。
私は、声が響くという言葉をあまり信じていない。
それは、「もっと声を響かせて」と指摘されても、上手く響いてくれないからだ。
そうなると、本当に声は響くのか?という疑いを持つ。
「響く」という言葉には、特に何もしなくても、エネルギーを加えなくても、勝手に音が大きくなるようなイメージがある。
そんなことが、可能ならこんな都合のいいことはない。
菅の共鳴原理は、声帯から出ていく方向の音波と、口から放射されるとき、
逆方向に戻って来る音波が合成されることを繰り返して、音量は増大する。
ただ、このとき合成されて大きくなる波形とは、声帯から口までの気道の長さに応じた周波数を持つ
音域に限られる。
それ以外の音は打ち消し合うことで音は消滅する。
このようなフィルター特性によってフォルマントは形成される。
とかとにかく、「響く」というのは、
「どこかの音域を犠牲にして、どこかの音域を生かすこと」と考えた方が理解しやすい。
「響いていない」というのは、減衰フィルターが効きすぎていること。
そのためにも、自分の声を聴き分ける努力が必要になるだろう。
その補助として音声スペクトラムを使ってみる。