駐車場の出入り口とか自動販売機だとか、よくおしゃべりする機器が増えましたよね。
仕事でも料金精算機やったことありますが、音声ガイドはMP3あたりで用意されていました。
映像や音楽はともかく、周波数を無視した『言葉』ってのはテキストで表現できるんじゃないかな、って漠然と思い続けていました。
文字列を与えると、スピーカーから言葉が出てくるようにすりゃいいんです。
声の質は、機械側で男の声にも女の声にもできるだろうし。
日本語の場合、ローマ字というヤツがとっても便利なんですが、アクセントを表現できないし、外来語も正しく表現できませんね。
発音記号ってのがありますが、あれって文字コードにできにくいですよねぇ。
しかも、アクセントを表現しようとすると、テキスト表現だと2行になってソフトウェアで解析するのには、ちょっと都合が悪そうです。
単語間の時間的な空白も言葉によってまちまちです。
そんなこんなを考えながらWEBを検索すると、同じようなことやってる人がどっかにいるんですねぇw
CMUdict
https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk/cmudict/cmudict.0.7a
んー。これで、日常の言葉を正しく表現できるのかなぁ・・・
SAMPA
http://www.phon.ucl.ac.uk/home/sampa/
おっと、こいつはコンピュータでの表現に適しているような気がする・・・
X-SAMPA
http://www.phon.ucl.ac.uk/home/sampa/x-sampa.htm
さらに拡張版なのかな?こっちには、アクセントも含まれているようです。
ちなみに、英語は斜め読み以下w。たぶんそうなんだろう程度で流してますw
双方向(言葉からテキスト、テキストから言葉)を実現しているライブラリとかないのかな?
けっこう使い道ありそうな気がするけどなぁ。
もしないのなら、来月末までに作ってください(笑)