こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

声に含まれるノイズは何個のサイン波で構成されてる?

https://sp.okwave.jp/qa/q9584940.html

↑上記の質問回答にて

>実際の人の声は声帯の振動と同時に口の中で共鳴したり歯の間で空気が出る時のサシスセソのようなホワイトノイズに近い音が混ざります。

と書かれており、さらに別の回答では

>ノイズも、無限個のサイン波の和で表すことができます。

と書かれておりますが、そのノイズ(ホワイトノイズ・ピンクノイズ・ブラウンノイズ)は何個ぐらいのサイン波で構成されているのでしょうか?

大体100個ぐらいのサイン波で構成されているのでしょうか?それとももっとあるのでしょうか?

最新のパソコンに搭載されているCPU(core i9等)・GPU(GTX 1660 Ti等)でも分解・再現することができないのでしょうか?

(15個のサイン波による歌声の分析合成(その1)Naofumi Aoki 
https://m.youtube.com/watch?v=W23_bYBvqw8 )

上記の動画を見ると、15個以上のサイン波で合成されて違和感があまりないぐらいに声の再現ができているのですが、実際には「15個程度」のサイン波でノイズとかも再現できるのでしょうか?

回答のほうよろしくお願いいたします。

投稿日時 - 2019-03-02 19:52:05

QNo.9592939

すぐに回答ほしいです

質問者が選んだベストアンサー

ノイズ(ホワイトノイズ・ピンクノイズ・ブラウンノイズ)は最低でも20~20kHzで1000個のサイン波で構成されているのではなくて20.1Hzとか端数周波数があると考えると無限大の周波数があるのでは?と思います。
最新のパソコンでも厳密には分解・再現することができないのでは?
サイン波による歌声の分析合成の動画は15個以上の倍音列サイン波の音圧をフォルマントごとに編集して母音を合成しているのかな?と思います。
1音だけの倍音をきっちり2倍3倍・・と機械的設定するのは出来ると思いますが、破裂音などのノイズ成分も入れないと人間の声を再現するのは困難です。
昔にYAMAHAのSGと言うフォルマントソフトを使ってDTMしていましたが、どうしても動画のような発音も機械的声になって苦労しました。
音声を探究してもらえると技術の進歩に貢献できると思いますのでお願いしたいです。
添付図は動画をAudacityで録音して一部のスペクトラムを見たものです、20kHzは1秒間に2万回も振幅しているように音の波形は複雑怪奇であって、研究すべきことが山ほどあります。
聴くだけでは分かりにくいのでパソコンで測定することをお勧めします。

投稿日時 - 2019-03-02 20:30:43

ANo.1

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

-広告-
-広告-

回答(3)

ANo.3

瞬間的に立ち上がる(または立ち下がる)波形では無限のサイン波が含まれます。
例えば理論上は、懐中電灯のスイッチを入れるだけで無限のサイン波によって構成されるノイズが発生します。(実際には立ち上がりに僅かな時間がかかるので無限とは言えませんが)

投稿日時 - 2019-03-03 10:56:51

ANo.2

何個のサイン波と聞かれても人によってまた語によって大きく違いますから難しい。
また同じ音が続くわけではなく短時間でどんどん変化しますから何百のサイン波を時間と共に変えながら加算すればできないことはないでしょう。
しかしながら膨大な分析とデータが必要ですから、現在では人の声をコンピューターで作ることはやめて、実際の人の美声を使って繋いで音声を流すようになりました。
この方が遥かに安上がりで綺麗な聞き易い言葉となります。
とてもじゃないけど個人でどうこうしてまともな人の声を出すなんてことは無理のようです。
色んな楽器の音を出す高額コンピューター演奏楽器があり、1度演奏会を聞きに行った事がありますが生楽器の音と似ているとは言え相当違いがっかりしました。
それに楽器は演奏家が高度な技術によって音色を自由に変えて演奏しますから同じ音色を出すコンピューターでは高い音楽性表現ができません。
同じように人の声もコンピューターでは感情表現ができないでしょう。

投稿日時 - 2019-03-03 09:05:34

-広告-
-広告-

あなたにオススメの質問

-広告-
-広告-