音声認識、応用音響学 ― 2007年11月02日 21:17
音声認識というのは、音データから人間の声を認識する技術です。
http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E8%AA%8D%E8%AD%98
音声認識を RH1FFT で実装する予定はないのですが、音声認識とまではいかなくても、何か特定の音を検出できる機能があれば便利です。
大きさがあるレベル以上とか、ある周波数帯のパワーがある値以上とか、その程度なら簡単なのですが、それだけでは対応できないこともあります。
何か役に立つことがあるかと思って音声認識について少し調べていますが、まだあまり良く分かっていません。
キーワードは、ケプストラム、フォルマント、HMM, パターン認識のあたりだと思います。
ただ、人間の音声以外でこれらが使えるかどうかは不明です。
とりあえず、かなりそれらしき資料は見つかりました。
分野としては、応用音響学と呼ばれているようです。
http://ocw.u-tokyo.ac.jp/course-list/engineering/applied-acoustics-2005/lecture-notes.html
たとえこれを理解できても、そこから実際のプログラムにするのは、また遠い道のりなのですが。
http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E8%AA%8D%E8%AD%98
音声認識を RH1FFT で実装する予定はないのですが、音声認識とまではいかなくても、何か特定の音を検出できる機能があれば便利です。
大きさがあるレベル以上とか、ある周波数帯のパワーがある値以上とか、その程度なら簡単なのですが、それだけでは対応できないこともあります。
何か役に立つことがあるかと思って音声認識について少し調べていますが、まだあまり良く分かっていません。
キーワードは、ケプストラム、フォルマント、HMM, パターン認識のあたりだと思います。
ただ、人間の音声以外でこれらが使えるかどうかは不明です。
とりあえず、かなりそれらしき資料は見つかりました。
分野としては、応用音響学と呼ばれているようです。
http://ocw.u-tokyo.ac.jp/course-list/engineering/applied-acoustics-2005/lecture-notes.html
たとえこれを理解できても、そこから実際のプログラムにするのは、また遠い道のりなのですが。
コメント
_ cessna373 ― 2007年11月03日 21:32
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。
トラックバック
このエントリのトラックバックURL: http://cessna373.asablo.jp/blog/2007/11/02/1886084/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。
1.特定の周波数範囲の和があるレベルを超える
2.特定の周波数範囲の和が別の周波数レベルの和より大きいあるいは何倍になる
3.全体における特定の周波数の和の割合があるレベルを超える
などやその組み合わせです。
特に理論的に推測しているわけではないので、現場で起きていることを測定し、場当たり的に設定することが多いです。