2008-06-04: RH1FFT blog

音声合成 (Text-to-Speech : TTS) ― 2008年06月04日 21:30

音声合成というのは、一言で言うとテキストを読み上げてくれる機能のことです。
"TTS speech" などで検索すると、いろいろと出てきます。
　http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90
ちなみに音声認識というのはこの逆で、音声をテキストに変換してくれるものです。
　http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E8%AA%8D%E8%AD%98

Microsoft の Speech API (SAPI) というものを使うと、いずれも簡単に実現できます。品質はそれなりですが。
　http://ja.wikipedia.org/wiki/Speech_Application_Programming_Interface
それを使って、RH1FFT に [録音データ作成] と同様な [音声データ作成] の機能をつけることはできそうです。

しかし、実際にはそんなに必要な機能ではないし、もし必要なら既存の音声合成ソフトウェアを使って、RH1FFT で録音した方が早いですね。
気が向いたら遊びで付けることはあるかもしれません。

FFT ブロックサイズと解析間隔 ― 2008年06月04日 22:45

$ブロックサイズと解析間隔\ブロックサイズと解析間隔$

ブロックサイズと解析間隔については、今までも何回か話題に出てきました。
　http://cessna373.asablo.jp/blog/2006/01/27/228287
　http://cessna373.asablo.jp/blog/2006/02/05/241826
　http://cessna373.asablo.jp/blog/2006/02/05/241844
　http://cessna373.asablo.jp/blog/2006/02/08/246067
　http://cessna373.asablo.jp/blog/2006/08/20/492817
　http://cessna373.asablo.jp/blog/2007/05/10/1499595
一般的に使われているであろう FFT のライン数(点数)とオーバーラップ率と、本質的には同じものです。

これで分かる人には分かるのでしょうが、もっと簡単に表現できないかと考えてみました。
　「ブロックサイズを大きくすると、ソノグラフが縦方向に細かくなる」
　「解析間隔を小さくすると、ソノグラフが横方向に細かくなる」
正確な表現ではありませんが、ソノグラフを見て「もっとこうしたい」と思ったときの指針にはなるでしょう。

図はある音声データによる例です。
ブロックサイズと解析間隔の関係は、以下のようになっています。
　左上　　　　　　　　　　　　　　　右上
　　ブロックサイズ 23ms(小)　　　ブロックサイズ 23ms(小)
　　解析間隔 23ms(大)　　　　　　解析間隔 11ms(小)

　左下　　　　　　　　　　　　　　　右下
　　ブロックサイズ 46ms(大)　　　ブロックサイズ 46ms(大)
　　解析間隔 23ms(大)　　　　　　解析間隔 11ms(小)

解析事例２ ― 2008年06月04日 22:50

今回はさらに英語の発音ネタでwrongとlongです。
今回もlとrの違いでやってみました。
解析条件は同じですが、グラフは前回20Hzからでしたが、100Hz以下はほとんど情報がないので（原因は追求しませんが）100Hz以上4000Hz以下の表示に変更しました
後、２，３この比較を行って特徴の抽出を行いたいと思います。

RH1FFT blog

音声合成 (Text-to-Speech : TTS) ― 2008年06月04日 21:30

FFT ブロックサイズと解析間隔 ― 2008年06月04日 22:45

解析事例２ ― 2008年06月04日 22:50

カテゴリ一覧

最近の記事

最近のコメント

バックナンバー

アクセスバー

RSS

<< 2008/06 >>
日	月	火	水	木	金	土
01	02	03	04	05	06	07
08	09	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

RH1FFT blog

音声合成 (Text-to-Speech : TTS) ― 2008年06月04日 21:30

FFT ブロックサイズと解析間隔 ― 2008年06月04日 22:45

解析事例２ ― 2008年06月04日 22:50

カテゴリ一覧

最近の記事

最近のコメント

バックナンバー

アクセスバー

RSS

ログイン