周波数領域の振幅について ― 2007年06月21日 22:23
今までも何度か書いてきましたが、音声を周波数領域のデータに変換した場合にその振幅が何を表すかというのはなかなか表現するのは難しいです。
簡単にいうと特定の周波数の正弦波の振幅の大きさを表しているといえます。 従って、100Hzで振幅1.0の正弦波を周波数領域にすると100Hzのデータのみが1.0となり、他の周波数が0.0となるデータになるはずです(理想的には) しかしながらこれにはいくつかの前提条件があります。 例えば、解析の最初と最後にずれがしょうじる漏れ誤差がないこと、 また、窓関数を方形窓にしていること(これは漏れ誤差にききますが、その代わりにデータがなまります) これらのことを完全に実行するには正確にトリガーをかける必要があったりするので現実の音声を録音して行うことは不可能です。 また、複数の周波数がまじっていても話は難しくなりますが、またの機会に説明します
最近のコメント