初稿:2008年3月16日
改訂 16: 2008年7月27日
同一人物が、別の声質を演じた場合でも見分けがつくのだろうか?という疑問の検証をしてみます。ここでは、もともとの検証データで歌っている2人の声優とは別の声優、茅原実里が演じる鷹花スミレ「ヴィーナス ヴァーサス ヴァイアラス」と南千秋「みなみけ〜おかわり〜」とで比較をしました。使用した音声データは以下の通りです(伴奏付きの声に懲りたので、なるべくBGMや効果音のない場所を選びました)。
※ソースは、Page.1〜3と同様にTV映像をMPEG-2で録画した後にWMV(音声部:48kbps, 44kHz, stereo)に変換したファイルから再度抜き出したWAV音声(mono)であるため、周波数の上限が12kHz程度まで、且つMPEGとWMAとしての不可逆圧縮を経ている点で、品質に問題があることをお断りします。
また、解析時にはWAVを使用しましたが、本説明ページで掲載している音声ファイルは、容量の都合で再度mp3に変換してあります(※抜き出したWAVファイルと再変換したmp3ファイルの解析結果の比較では、取り立てて違いが見当たりませんでした)。
| No. | 単音韻 | フレーズ | ||||
|---|---|---|---|---|---|---|
| 「な」 | (1-1) | 「な」 | (0.19秒, MP3) | 「なんだこれは?」 (千秋) | (1.40秒, MP3) | |
| (1-2) | 「な」 | (0.14秒, MP3) | 「なぜ教室にいるかということだ」 (千秋) | (2.14秒, MP3) | ||
| (1-3) | 「な」1番目 | (0.18秒, MP3) | 「別になんでもないんだけどね」 (スミレ) | (1.91秒, MP3) | ||
| (1-4) | 「な」2番目 | (0.07秒, MP3) | ||||
| (1-5) | 「な」 | (0.13秒, MP3) | 「そっかぁもっと前のような気がした」 (スミレ) | (3.08秒, MP3) | ||
| (1-6) | 「なぁ」 | (0.55秒, MP3) | 「ここが一番落ち着くなぁ」(スミレ) | (2.24秒, MP3) | ||
| 「こ」 | (2-1) | 「こ」 | (0.12秒, MP3) | 「なんだこれは?」 (千秋) | (1.40秒, MP3) | |
| (2-2) | 「こ」 | (0.10秒, MP3) | 「なぜ教室にいるかということだ」 (千秋) | (2.14秒, MP3) | ||
| (2-3,4) | 「ここ」 | (0.37秒, MP3) | 「ここが一番落ち着くなぁ」 (スミレ) | (2.24秒, MP3) | ||
とりあえず図を示します。今回はRH1FFT(波形/スペクトログラム)とWaveSurferを使います(波形/スペクトログラム/ピッチが表示されています)。いずれも縮小して表示しています。クリックで本来のサイズ(の75%)が見られます。
| 全体の特性 RH1FFT (時間幅は揃えてありません) |
|---|
![]() |
| 「な」の比較 RH1FFT (時間幅は揃えてありません) |
![]() |
| 「な」の比較 WaveSurfer (1-6だけ時間幅が狭い点に注意) |
![]() |
| 「こ」の比較 RH1FFT (時間幅は揃えてありません) |
![]() |
| 「こ」の比較 WaveSurfer |
![]() |
千秋役の2つの「な」は(同じシーン内ということもあるでしょうけど)相互に良く似ており、1k〜2kHz付近と4k〜4.5kHz付近と6k〜7kHz付近の分布として現れています(良く見ると200〜300Hz近辺の低い周波数成分もあります)。対するスミレ役の「な」は(相互に同じシーン内なのに)4つの音声のいずれも分布が異なり、1k〜7kHz全域に成分が出ています(千秋役では約3kHzと約5kHzの成分が抜け落ちているのに対して、スミレ役では出ています。また200〜300Hz付近の成分があまり出ていません)。
千秋が低めの声、スミレが高めの声ということで、基音の周波数が異なっていることが影響していると思われます。
千秋役の「な」は単音でも「な」と感じますが、スミレ役の「な」は1フレーズでなら「な」に聞こえるのに、単音で聴くと「な」とは思えないような発音をしていることが原因かもしれません。(1-3),(1-5),(1-6)は、まぁ「な」と思えるとしても、(1-4)は何なのか分からない声です(多数の音韻を一気に繋げて話す場合には、単音で発生する場合に比べて前後の音韻との繋がりの影響で、口のあけ方が明確でなくなることも影響していると考えられます)。(1-6)だけは、千秋役の分布に若干似ているといえなくもないですが、微妙なところです。
千秋役の2つの「こ」は「な」と同様に相互に良く似ており、基音が210Hz前後、約210Hz〜1.8kHz付近、4k〜5kHz付近、6k〜8kHz付近にフォルマントが出ています。対するスミレ役の2つの「こ」は、バックに効果音が混入している点を考慮しても、基音が350Hz前後、且つ約350Hz〜1.5kHz付近は弱め、2kHzや4k〜5kHz、6kHzが強めに出ていて千秋役と分布が異なります。それだけでなく、連続して発せられた「こ」なのに、相互に聴感上もスペクトログラム上も異なります。
千秋役の「こ」は単音でも「こ」に聞こえますが、スミレ役の「こ」は、「な」と同様に、1フレーズでなら「こ」に聞こえる(というより文脈から「こ」であると判断できるレベル)のに、単音では「こ」ではなく、「く」のように聞こえます。歪められて発声されているから特性が違うのもしれません。
同一人物の声であっても、意図的に歪められて発声された場合には、聴感上もスペクトログラム上もかなり違った印象になってしまう事が分かります。また声を低め・高めに発することで、当然ながら基音&倍音の周波数が変動してしまう事も分かります。専門家なら何か同一視できる方法があるのかもしれませんが、素人の私にとっては同じようには思えません。
但し、低めに発声されているものの割と素直に発声されている千秋役の声同士でなら良く似た特性が見られるため、明瞭に発声されている声での比較なら、同一人物(役)を見分けられそうな気がする事も分かりました。この件に関して追加考察します。