Su-metalの音声周波数分析ー真似事としてやってみました
(2017/2/19、一部訂正とソースなど補足)、(3/4追記 Su-metalの音声周波数分析(2))、redditでの反応 → ページ
この数年、私はBABYMETALのボーカル、SU-METALの声にずっと魅了されてきたのだが、その理由が自分でもよくわからなかった。何か惹きつける声なのだが、それが何なのかを知りたいと思った。
周波数分析など、知識はないのだが、ネット上にそのソフトがあったので、極く簡単に利用させてもらい、とりあえずやってみた。
ソフトは、WaveSurfer,ソフトのアドレス
音声についての参考となるのは、こちらのyoutube
こちらで話されているのは、声の倍音について。どんな声でも楽器でも、その音(基音)だけがなる事はなく、それの倍音がなっている。そして、その倍音には2種類あり、整数倍音と、非整数倍音である。整数倍音は、基音の2倍、3倍といった整数倍の周波数を持っていて、はっきり通る声、非整数倍音は、基音の1/2、1/3などの音で、ハスキーボイス、しゃがれ声、親しい相手と話す時の声らしい。これは人はある程度は使い分けてるらしい。上の映像では例として、田中角栄が、演説する時は整数倍音で通る声で話し、親しみを表す時は非整数倍音を出していたと説明されている。
整数倍音では、周波数分布はギザギザ、あるいは飛び飛びに整数倍の周波数部分が強くでる。非整数倍音は、その間の周波数が全体として山なりに出る、ということらしい。で、このソフトを使って、チェックしたところ、ほんとにそのとおりの結果となり驚嘆した。当然と言えば当然なのだが(笑)。
使ったのは、SU-METALのアカペラ「紅月」、夏川りみの「花」、明石家さんまと森進一の対談、フラグスタートのワーグナー「さまよえるオランダ人」の独唱「ゼンタのバラッド」、マリア・カラス「ある晴れた日に」で、声以外の音声が入ってない部分を使っている。曲や話の一瞬を切り取っただけだが、なるべく特徴的な部分でとった。ま、人の声を勝手に分析するのも失礼な話ではあるが、代表的な声として選んだので認めて欲しい。ソースは全てYOUTUBEのもの。録音条件が違うので同列には論じられない、というのが前提ではあるが。
まず、SU-METAL → youtubeより

まるで絵に描いたような波型、しかもかなり上、1万6千ヘルツ辺りまで出ている。整数倍音の特徴がよく出てて感心。(前のとは差し替え、18秒辺り「体が滅びるまでー」と伸ばしてる部分で、音はD♭、周波数は約554Hzで、それの整数倍は、1109、1663、2217、などとなり、その辺りでグラフがピークになっている。谷との落差は、30~60dbあり、-20dbで0.1倍、-40dbで0.01倍、-60dbで0.001倍となるから、ほとんど出ていないということになる)
次に夏川りみ、「花」 → youtube

これも綺麗な波型。1分5秒辺り(2017/2/19前のとは差し替え。前のjはホールや録音環境であまり音声特性が良くなかったようなので)。SU-METALとほぼ同様だが、やや発声が不安定で場所による変動が多めだった。音色を意図的に変えてるのかもしれないが。あと、谷の深さがやや浅い。特に高域で。ただしこれは一例なので断定はできない。
次にフラグスタート → youtube、42秒辺り

やはり波型、かなり上まで安定して伸びている。上のビデオで、クラシックの歌手は、基音部分を中心として出す、といった説明があったが、確かに倍音部分は、上二人に比べると低めに出ている。49年録音なので、録音環境の関係で高域が低めなのかもしれないが。
マリア・カラス → youtube 3分11秒辺り

うひゃ、2万近くまで行ってる。録音されたのは、60年頃かな。決して録音環境は良くなかったと思うけど。なんだか笑ってしまうな。ただし、これもやはり、基音部分が大きく倍音成分は少なめ。
2017/2/19追記、データを取った場所を探すために聞き直していたが、さすがにうまいもんです。表情の変化が凄い。
次に逆に、非整数的倍音の声、森進一 (さんまのまんま、森進一がゲストの回だが、今探しても見当たらず)

はっきりした波やギザギザは見られず、固まっている。話声のせいかもしれないが、大体の印象は同じなので歌もこんなだろうと思う。
明石家さんま

若干、波が見られるが全体として固まってる印象。さんまの声は割りと通る声のようではある。
もう少し資料が欲しいところだが、声だけの部分を抜き出すのが難しい。
まあ、しかし、SU-METALの声が特徴的なのは事実のように見える。
以上、あくまで素人としての感想です。
(5/3追記)
前から気になっていたのだが、民謡歌手の発声に少し似てる気がするので、こちらもとってみた。日本民謡フェスティバル 2014ダイジェスト→ YOUTUBE
楽器の途切れたところの、25秒あたり

それから、45秒辺り

どちらも綺麗な整数倍音で、どの音域も万遍なくでいてるが、最高音域はSU-METALの方が高いようだ。また、やはり谷の深さがSU-METALは大きい方、というのは言えるだろう。
(以前の美空ひばりのは音声の条件が悪かったので差し換え)
美空ひばりの「佐渡情話」、27秒辺り。

これも波型。16000まで出てる。
おなじくひばりで、「リンゴ追分」の1分7秒辺り、わずかに楽器音が聞こえるが。

ほぼおなじ場所で、森昌子の「リンゴ追分」、48秒辺り

森昌子の方が波の形がはっきりしている。これは耳で聞いた印象と同じ。
ひばりも森昌子もかなり高域まで倍音が伸びてるが、あまり谷は深くない。という事は、非整数倍音がかなりあったということだろう。SU-METALは谷が深く、より純粋な音が出てるのだろう。SU-METALの声が突き刺さるように聞こえ、バンドの轟音や会場の騒音を通って聞こえてくるのも、そのせいだろうと思う。耳に残ってしまうのもそのせいか(笑)。
私は以前、「ベビーメタルとはなんなのか」というページで、SU-METALの声は、子供が大騒ぎしてる時の開放された声を思わせる、と書いたのだが、そういう動画、これの53秒辺りが似てる。

ざっとまとめると、事前の想定以上の結果が出た。
まず、子供の声や民謡歌手の声との相似性。これは予想通りだった。というか予想以上に似てたが。
次にクラシック歌手との違い。声の印象が明らかに違うので、グラフも違うだろうと予想はしていたが、これほど違うとは思わなかった。ほんとに驚いた。まるで方向性が違う。上に挙げたもの以外にも調べたが、大体は同じだった。要は、基音の2倍、3倍辺りまでの倍音は出てるのだが、それ以上になるとかなり低下する。出てることは出てるのだが。おそらく、鼻腔辺りで特定音だけを共鳴させて増幅するのだろう。それで、他の音が相対的に小さくなるという事か。そういった訓練の仕方が同じなので、どの歌手も似た傾向の分布になる。これはカウンターテナーなどでも同じ傾向だった。
子どもや民謡歌手はそういった訓練は受けていないのだから違ってくる。勿論SU-METALも。おそらく元の生まれた時の声質を留めてるのだろう。高域まで出てるし、声帯が多分、非常に柔らかいのだと思う。
ここで、生後4ヶ月の本物の赤ちゃんの声、これの19秒辺り → youtube

よく似てると思う。SU-METALのグラフを再掲

SU-METALの声に惹かれるのは、それが赤ん坊の声を思わせるからではないだろうか。
結論:BABYMETALは本当にBABYだった(笑)
(追記5/9)
話し声も追加、インタビュー動画、58秒辺り

もちろんこれは一例であって、取る場所によって、また時によっても、心理によっても変わる。しかし、基本的な周波数特性などは同じだろう。周波数の範囲、倍音の出方、出力の比など。だから、人の声を聞き分けられる。その具体的なメカニズムは知らないが。
普通、日常生活でも、知り合いから電話があれば、一声聞いただけでも相手が分かるし、歌手の声もファンなら大体はわかるだろう。特性は一定してる。また中学生の頃の同級生などは、何十年経っても声はあまり変わらない。顔や体型よりは変化は少ないのではないだろうか。変声期をすぎればあまり変わらないように思える。
しかし、話声でやっと、美空ひばりや森昌子の歌声レベルに非整数倍音がはいってくる。不思議な声だ。上のような発声では歌謡曲は無理かもしれない。ある程度は柔らかさが必要だろうし。メタル風な曲にしたのは正解だったか。まあ曲によって変えるのかもしれないが。
(補足5/20)
日本の男性の代表的ハイトーンボイス、クリスタルキングの田中 昌之「大都会」の2:56秒辺り

かなり綺麗な波形。地声で上のCまで出てる。ロバート・プラントは移民の歌でEだったか(訂正5/22)
(追記5/24)
ヨーデルの声。確かヨーデルの声で宇宙人を撃退するSFがあったと思うが(笑)、私も好きではないが調べてみた。
こちらの、2分5秒辺り。

声自体は割りと日本の民謡歌手の発声に似てる。あれの特徴は節回しにあるんだろうなあ。
(追記5/25)
ひばりの十代の頃のいい音源が欲しいのだが、なかなかない。これはSP盤を再生したのを録音したもの。58秒辺り、最高音はE、約660HZ辺りだと思う。

(8/12追記)
グラフを見ていて気付いたのだが、ひばりの声は若干クラシックの歌手に似ている。基音部分周辺の値が高く、上の方の倍音は低めになる。
実はこれは聞いた印象もそう。要は鼻に掛かっているってこと。鼻腔での共鳴がかなりあるのだろう。ひばりは鼻音風の声をよく出てた。上の佐渡情話のこの辺りとか、歌詞にないのに出してるし。→ youtube
クラシックの歌手の声も鼻に掛かってるように聞こえる。マリア・カラスやディスカウなんか特にそう。ま、私はそういうのはあまり好きではない。ひばりの場合は当たりを柔らかくする効果があるので、拒否感はないが。マリアカラスのは強く圧迫感のある声だ。
で、SU-METALの声はその反対で生の声である。ただし、それでは喉の負担が大きくなるのは確かだろう。で、1年辺り前からボイストレーナーが付いて若干修正されてるような気がする。その為に高域が楽に出せるようになってる。KARATEではEを出してるし、APMA授賞式でのロブ・ハルフォードとの共演では、その時だけということで、もっと高音を出しているようだ。
上の「紅月」の頃は、まさに生の声だろう。 → youtube
この数年、私はBABYMETALのボーカル、SU-METALの声にずっと魅了されてきたのだが、その理由が自分でもよくわからなかった。何か惹きつける声なのだが、それが何なのかを知りたいと思った。
周波数分析など、知識はないのだが、ネット上にそのソフトがあったので、極く簡単に利用させてもらい、とりあえずやってみた。
ソフトは、WaveSurfer,ソフトのアドレス
音声についての参考となるのは、こちらのyoutube
こちらで話されているのは、声の倍音について。どんな声でも楽器でも、その音(基音)だけがなる事はなく、それの倍音がなっている。そして、その倍音には2種類あり、整数倍音と、非整数倍音である。整数倍音は、基音の2倍、3倍といった整数倍の周波数を持っていて、はっきり通る声、非整数倍音は、基音の1/2、1/3などの音で、ハスキーボイス、しゃがれ声、親しい相手と話す時の声らしい。これは人はある程度は使い分けてるらしい。上の映像では例として、田中角栄が、演説する時は整数倍音で通る声で話し、親しみを表す時は非整数倍音を出していたと説明されている。
整数倍音では、周波数分布はギザギザ、あるいは飛び飛びに整数倍の周波数部分が強くでる。非整数倍音は、その間の周波数が全体として山なりに出る、ということらしい。で、このソフトを使って、チェックしたところ、ほんとにそのとおりの結果となり驚嘆した。当然と言えば当然なのだが(笑)。
使ったのは、SU-METALのアカペラ「紅月」、夏川りみの「花」、明石家さんまと森進一の対談、フラグスタートのワーグナー「さまよえるオランダ人」の独唱「ゼンタのバラッド」、マリア・カラス「ある晴れた日に」で、声以外の音声が入ってない部分を使っている。曲や話の一瞬を切り取っただけだが、なるべく特徴的な部分でとった。ま、人の声を勝手に分析するのも失礼な話ではあるが、代表的な声として選んだので認めて欲しい。ソースは全てYOUTUBEのもの。録音条件が違うので同列には論じられない、というのが前提ではあるが。
まず、SU-METAL → youtubeより

まるで絵に描いたような波型、しかもかなり上、1万6千ヘルツ辺りまで出ている。整数倍音の特徴がよく出てて感心。(前のとは差し替え、18秒辺り「体が滅びるまでー」と伸ばしてる部分で、音はD♭、周波数は約554Hzで、それの整数倍は、1109、1663、2217、などとなり、その辺りでグラフがピークになっている。谷との落差は、30~60dbあり、-20dbで0.1倍、-40dbで0.01倍、-60dbで0.001倍となるから、ほとんど出ていないということになる)
次に夏川りみ、「花」 → youtube

これも綺麗な波型。1分5秒辺り(2017/2/19前のとは差し替え。前のjはホールや録音環境であまり音声特性が良くなかったようなので)。SU-METALとほぼ同様だが、やや発声が不安定で場所による変動が多めだった。音色を意図的に変えてるのかもしれないが。あと、谷の深さがやや浅い。特に高域で。ただしこれは一例なので断定はできない。
次にフラグスタート → youtube、42秒辺り

やはり波型、かなり上まで安定して伸びている。上のビデオで、クラシックの歌手は、基音部分を中心として出す、といった説明があったが、確かに倍音部分は、上二人に比べると低めに出ている。49年録音なので、録音環境の関係で高域が低めなのかもしれないが。
マリア・カラス → youtube 3分11秒辺り

うひゃ、2万近くまで行ってる。録音されたのは、60年頃かな。決して録音環境は良くなかったと思うけど。なんだか笑ってしまうな。ただし、これもやはり、基音部分が大きく倍音成分は少なめ。
2017/2/19追記、データを取った場所を探すために聞き直していたが、さすがにうまいもんです。表情の変化が凄い。
次に逆に、非整数的倍音の声、森進一 (さんまのまんま、森進一がゲストの回だが、今探しても見当たらず)

はっきりした波やギザギザは見られず、固まっている。話声のせいかもしれないが、大体の印象は同じなので歌もこんなだろうと思う。
明石家さんま

若干、波が見られるが全体として固まってる印象。さんまの声は割りと通る声のようではある。
もう少し資料が欲しいところだが、声だけの部分を抜き出すのが難しい。
まあ、しかし、SU-METALの声が特徴的なのは事実のように見える。
以上、あくまで素人としての感想です。
(5/3追記)
前から気になっていたのだが、民謡歌手の発声に少し似てる気がするので、こちらもとってみた。日本民謡フェスティバル 2014ダイジェスト→ YOUTUBE
楽器の途切れたところの、25秒あたり

それから、45秒辺り

どちらも綺麗な整数倍音で、どの音域も万遍なくでいてるが、最高音域はSU-METALの方が高いようだ。また、やはり谷の深さがSU-METALは大きい方、というのは言えるだろう。
(以前の美空ひばりのは音声の条件が悪かったので差し換え)
美空ひばりの「佐渡情話」、27秒辺り。

これも波型。16000まで出てる。
おなじくひばりで、「リンゴ追分」の1分7秒辺り、わずかに楽器音が聞こえるが。

ほぼおなじ場所で、森昌子の「リンゴ追分」、48秒辺り

森昌子の方が波の形がはっきりしている。これは耳で聞いた印象と同じ。
ひばりも森昌子もかなり高域まで倍音が伸びてるが、あまり谷は深くない。という事は、非整数倍音がかなりあったということだろう。SU-METALは谷が深く、より純粋な音が出てるのだろう。SU-METALの声が突き刺さるように聞こえ、バンドの轟音や会場の騒音を通って聞こえてくるのも、そのせいだろうと思う。耳に残ってしまうのもそのせいか(笑)。
私は以前、「ベビーメタルとはなんなのか」というページで、SU-METALの声は、子供が大騒ぎしてる時の開放された声を思わせる、と書いたのだが、そういう動画、これの53秒辺りが似てる。

ざっとまとめると、事前の想定以上の結果が出た。
まず、子供の声や民謡歌手の声との相似性。これは予想通りだった。というか予想以上に似てたが。
次にクラシック歌手との違い。声の印象が明らかに違うので、グラフも違うだろうと予想はしていたが、これほど違うとは思わなかった。ほんとに驚いた。まるで方向性が違う。上に挙げたもの以外にも調べたが、大体は同じだった。要は、基音の2倍、3倍辺りまでの倍音は出てるのだが、それ以上になるとかなり低下する。出てることは出てるのだが。おそらく、鼻腔辺りで特定音だけを共鳴させて増幅するのだろう。それで、他の音が相対的に小さくなるという事か。そういった訓練の仕方が同じなので、どの歌手も似た傾向の分布になる。これはカウンターテナーなどでも同じ傾向だった。
子どもや民謡歌手はそういった訓練は受けていないのだから違ってくる。勿論SU-METALも。おそらく元の生まれた時の声質を留めてるのだろう。高域まで出てるし、声帯が多分、非常に柔らかいのだと思う。
ここで、生後4ヶ月の本物の赤ちゃんの声、これの19秒辺り → youtube

よく似てると思う。SU-METALのグラフを再掲

SU-METALの声に惹かれるのは、それが赤ん坊の声を思わせるからではないだろうか。
結論:BABYMETALは本当にBABYだった(笑)
(追記5/9)
話し声も追加、インタビュー動画、58秒辺り

もちろんこれは一例であって、取る場所によって、また時によっても、心理によっても変わる。しかし、基本的な周波数特性などは同じだろう。周波数の範囲、倍音の出方、出力の比など。だから、人の声を聞き分けられる。その具体的なメカニズムは知らないが。
普通、日常生活でも、知り合いから電話があれば、一声聞いただけでも相手が分かるし、歌手の声もファンなら大体はわかるだろう。特性は一定してる。また中学生の頃の同級生などは、何十年経っても声はあまり変わらない。顔や体型よりは変化は少ないのではないだろうか。変声期をすぎればあまり変わらないように思える。
しかし、話声でやっと、美空ひばりや森昌子の歌声レベルに非整数倍音がはいってくる。不思議な声だ。上のような発声では歌謡曲は無理かもしれない。ある程度は柔らかさが必要だろうし。メタル風な曲にしたのは正解だったか。まあ曲によって変えるのかもしれないが。
(補足5/20)
日本の男性の代表的ハイトーンボイス、クリスタルキングの田中 昌之「大都会」の2:56秒辺り

かなり綺麗な波形。地声で上のCまで出てる。ロバート・プラントは移民の歌でEだったか(訂正5/22)
(追記5/24)
ヨーデルの声。確かヨーデルの声で宇宙人を撃退するSFがあったと思うが(笑)、私も好きではないが調べてみた。
こちらの、2分5秒辺り。

声自体は割りと日本の民謡歌手の発声に似てる。あれの特徴は節回しにあるんだろうなあ。
(追記5/25)
ひばりの十代の頃のいい音源が欲しいのだが、なかなかない。これはSP盤を再生したのを録音したもの。58秒辺り、最高音はE、約660HZ辺りだと思う。

(8/12追記)
グラフを見ていて気付いたのだが、ひばりの声は若干クラシックの歌手に似ている。基音部分周辺の値が高く、上の方の倍音は低めになる。
実はこれは聞いた印象もそう。要は鼻に掛かっているってこと。鼻腔での共鳴がかなりあるのだろう。ひばりは鼻音風の声をよく出てた。上の佐渡情話のこの辺りとか、歌詞にないのに出してるし。→ youtube
クラシックの歌手の声も鼻に掛かってるように聞こえる。マリア・カラスやディスカウなんか特にそう。ま、私はそういうのはあまり好きではない。ひばりの場合は当たりを柔らかくする効果があるので、拒否感はないが。マリアカラスのは強く圧迫感のある声だ。
で、SU-METALの声はその反対で生の声である。ただし、それでは喉の負担が大きくなるのは確かだろう。で、1年辺り前からボイストレーナーが付いて若干修正されてるような気がする。その為に高域が楽に出せるようになってる。KARATEではEを出してるし、APMA授賞式でのロブ・ハルフォードとの共演では、その時だけということで、もっと高音を出しているようだ。
上の「紅月」の頃は、まさに生の声だろう。 → youtube
スポンサーサイト