初稿:2008年3月16日
改訂 16: 2008年7月27日
推測だけでは埒があかないので、実際に音声を録音して特性を眺めてみました。母音「あ」と、子音「や」「な」、意図的に「ぃや」風に発音した「や」、今回の検証で利用したデータのパート(4)風な「や〜だよ」を録音して特性を見ました。
着目したこと。
使用したデータは、「あ」の3音声、母音「あ」を持つ「や」の3音声、発音する際に「ぃや」と言うようなイメージで発音した「や」の1音声、同じく母音「あ」を持つ「な」の2音声、例のパート(4)の感じで「や〜だよ」の1音声です。
※録音に関して:
会議録音用マイク(SONY ECM-850)をノートPCのマイク端子(モノラル)につないで録音したのですが、電源周波数に起因すると思われる50Hzおよび100Hz辺りのビート音が入ってしまったので、200Hz以下の低域をカットするなどの加工を施してあります(それでも解析図を見ると100Hz以下に残留暗雑音が見えます)。加工前後の音声で、スペクトログラムを見ても、1kHz近辺の特性には大きな影響がないので、まぁ善しとしました。
一目見て分かることは母音の「あ」「や」「な」を数回発声した場合、その度に波形は異なるということ。発声時の喉の調子などによる声のかすれなども影響するのでしょう。それでもフォルマントの観点で見るとどれも似ているということ。多少、一部の周波数でのパワーが強くなっていたり、弱くなっていたり、かすれていたりする違いとして出るようですが。大雑把な周波数分布は同じとみなせるようです。「な」の場合、出始めの特性がちょっと違って見えていたりもして、特性図だけで、あまりに細かい点にこだわると、なんでも「同一でない」ことになってしまう恐れがあることが分かります(未検証ですが、「な」の出始めの違いは、鼻に抜ける「ん」音が長いか短いかの差なのかも知れません)。
「仮定」「予想」通り、母音に「あ」を持つ「や」「な」は、発声の後半のスペクトルが「あ」に似ていました。但し、「あ」そのものに比べてパワーは弱めであるということが分かります。
検証データの「やだや〜だ」で「あ」の第1フォルマントよりもかなり低い300〜400Hz付近のパワーが強く出ていた件で「い」などの特性が出ているのか?と疑問を持った件ですが、「や」の場合は推測どおり口の開き方が若干「い」に近づくためか、発声の開始時の周波数が350〜400Hzから始まるのが見られます。但し、検証データのように継続してその周波数が出るのではなさそうだということも分かります(もちろん検証データの発声者と今回の発声者は全くの別人ですけども)。※Page.1, Page.2で継続して見えている350〜400Hz付近の成分は伴奏成分と考えられるので無視することにしました)。それでも、今回の声の場合には「あ」「や」「な」のいずれでも600Hz〜1kHzにかけても4本くらいのピークが見られますし、400Hz付近もパワーが弱いながら出ているのが分かりました(以下には示していませんが、Spectrogram 4.1.2で解析した場合に見えます)。
また、「や」を「ぃや」と意識して発声した場合の特性ですが、意外と差がみられず、ほとんど同じように見えました。つまり意識してなくても300〜400Hz付近のスペクトルが発声開始時には出るようです。
単独発声でなく「や〜だよ」と発声した場合でも、単独の「や」と同じ特性が見られました。
なお「や〜だよ」の特性を見ると、「だ」に移行した際にかすかにパワーに変化が出る程度で、それほどの違いがないのが興味深いです。「だ」も母音に「あ」を含むわけで、口の開き方が似ているからかもしれません(もちろん発声開始時には破裂音が出るハズですけど)。
ちなみに「や〜だよ」の「や〜」と「だよ」の途中のスペクトルが欠落してブランクになっていますが、これはノイズ除去のためにノイズゲートを利用して敷居値以下の音を低減させた影響でほぼ無音になっているからです。
以下に図を示します。大まかな特性をつかむことが目的なので、縮小した画像を並べています。また、作業の手間を考慮して時間幅は敢えて揃えていません。
「や」の音に関して、別のサンプルも利用して、もう少し概略の特性を見てみました。利用したのは、牧野由依の「スピラーレ」のPVです(今はもう見当たらないようですが、少し前にJVCの牧野由依ページで配信されていたフルコーラスPV (WMV))。その1分07秒付近(アルバム「マキノユイ。」のスピラーレならば1分01秒付近)から始まる「あ〜ざ〜や〜か〜に〜」をサンプルとして使用しました。なお、直前の歌詞「スピラーレー」の「レー」の音声がオーバーラップしているため、母音「え」に近い成分も見えてしまう事に注意が必要です。但し、「あ〜ざ〜や〜か〜に〜」の「や〜」以降への重なりは、かなり無視できるレベルです。当然ながら、その他にも伴奏音の成分も見える点も考慮が必要です。
| ・RH1FFTで解析した結果一覧 (クリックで図だけ表示) ※時間幅は揃えてありません。 | |
|---|---|
「あ」: 「あ〜ざ〜や〜か〜に〜」![]() |
「や」: 「あ〜ざ〜や〜か〜に〜」 ※「や」が「ぃや〜」のように始まる ![]() |
| ・WaveSurferで解析した結果一覧 (縮小図;クリックで図だけ本来のサイズで表示) ※時間幅は揃えてありません。 | |
「あ」: 「あ〜ざ〜や〜か〜に〜」![]() |
|
「や」: 「あ〜ざ〜や〜か〜に〜」![]() |
|
Page.1でのパート(3)(4)のサンプル「や」と、自分で録音したサンプル「や」と、今回の「や」の特性をまとめて眺めることで、「や」は概ね以下のような、発声のし始めが広がっていて徐々に絞られるいわゆるラッパのような形の特性であるという認識にいたりました。もちろん細かい部分はいろいろ違うのですけど。
※サウンド・スペクトログラム( Sound Spectrogram )への応用ページにある「や」「ま」「の」「て」のサウンド・スペクトログラムからも、「や」のスペクトログラムは、これまでに調べたのと同じような(左開きのラッパ型の形状)であることが分かります。

ちなみに本筋ではありませんが、データを取ったついでで牧野由依の歌声の特性を観察してみると、「や」の出始めでは約1kHz、2kHz、4.5kHz付近から始まるラインが、約1kHzは約400Hzや800Hzなどの成分に分岐しつつ(多分「い」の影響)、1kHzが弱まりながら継続。更に「や」(または母音の「あ」)としての基音と思われる600Hz付近が強く出現し、「や」の発声中はずっと出ています。(600Hz付近は伴奏成分の影響も考えられるので注意が必要)。約2kHzと約4.5kHzがそれぞれ3.5kHz付近に近寄って再度分離するライン、特に約2kHzから始まるラインは約100msで上昇し約100msで下降するアーチを描いて再び2kHzへと遷移する面白い形として見えます(次の「か」に移る部分でもアーチ状の模様が見えます)。なおアーチの途中に弱く2.2〜2.4kHz成分も弱く出ています。
一般に日本語の母音「あ」の第1フォルマントは約780Hzなのですが、牧野由依の場合は、RH1FFTの結果からみると890Hz付近です。RH1FFTで見る限り「や」ではその890Hz成分が弱く見えますが、WaveSurferの結果には890Hz、1kHz、1.8kHz付近が「あ」よりは若干弱いとはいえ、出ています(「あ」のデータの440Hz辺りの成分、「や」のデータの590〜660Hz付近の成分が強く出ていますが、声なのか伴奏音なのか判断できないので保留します)。
※「スピラーレ」に関して言えば、前奏部分の特性などから判断する限り、約800Hz以下は伴奏成分の影響が非常に大きく、声に関してはそれより高い周波数だけで評価しないとダメそうです。(伴奏の倍音に関しては除去できないので判断ミスの原因にもなりかねませんが…)
なお、「あ」では1.8kHz付近と2.5kHz付近の成分があるようですが、「や」でははっきりとしていません。「や」が「あ」を母音としつつも、第1フォルマント以外は意外と違う特性になるのか、「あ」の部分は「や」よりオーバーラップしている「レー」の影響が出てしまっているのか判然としないので、追求できません。