ホップ・ステップ・εミ(ο_ _)ο ドテッ

プログラミングの風景をちょいとぶつぶつ書きつづってみようというテスト

ホーム 連絡をする 同期する ( RSS 2.0 ) Login
投稿数  98  : 記事  1  : コメント  1221  : トラックバック  9

ニュース

ゆーち

Y.Uchiyama

 福岡県在住
 株式会社シーソフト
 代表取締役
 現役職人です(`^´)
 主にC++を使ってます
リアルマイミク募集中w
 (・∀・)Mixi
フォローよろしくw
 (・∀・)Twitter

記事カテゴリ

書庫

日記カテゴリ

ギャラリ

駐車場の出入り口とか自動販売機だとか、よくおしゃべりする機器が増えましたよね。
仕事でも料金精算機やったことありますが、音声ガイドはMP3あたりで用意されていました。

映像や音楽はともかく、周波数を無視した『言葉』ってのはテキストで表現できるんじゃないかな、って漠然と思い続けていました。

文字列を与えると、スピーカーから言葉が出てくるようにすりゃいいんです。
声の質は、機械側で男の声にも女の声にもできるだろうし。

日本語の場合、ローマ字というヤツがとっても便利なんですが、アクセントを表現できないし、外来語も正しく表現できませんね。

発音記号ってのがありますが、あれって文字コードにできにくいですよねぇ。
しかも、アクセントを表現しようとすると、テキスト表現だと2行になってソフトウェアで解析するのには、ちょっと都合が悪そうです。

単語間の時間的な空白も言葉によってまちまちです。

そんなこんなを考えながらWEBを検索すると、同じようなことやってる人がどっかにいるんですねぇw

CMUdict
https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk/cmudict/cmudict.0.7a
んー。これで、日常の言葉を正しく表現できるのかなぁ・・・

SAMPA
http://www.phon.ucl.ac.uk/home/sampa/
おっと、こいつはコンピュータでの表現に適しているような気がする・・・

X-SAMPA
http://www.phon.ucl.ac.uk/home/sampa/x-sampa.htm
さらに拡張版なのかな?こっちには、アクセントも含まれているようです。

ちなみに、英語は斜め読み以下w。たぶんそうなんだろう程度で流してますw

双方向(言葉からテキスト、テキストから言葉)を実現しているライブラリとかないのかな?
けっこう使い道ありそうな気がするけどなぁ。

もしないのなら、来月末までに作ってください(笑)

投稿日時 : 2008年10月30日 17:16

コメント

# re: 言葉の壁 2008/10/30 23:57 dolan
今のカーナビって音声認識も音声合成も入ってますよね?
どこが作ってるんでしょうね。


# re: 言葉の壁 2008/10/31 1:10 れい
UNICODEにIPAが全部入ってないんですよね。
もうかなりいやになります。

で、SAMPAだと言語ごとに違うので、私はX-SAMPAを使ってます。
まぁX-SAMPAの読み上げツールもまだまだ全然まともに動かないんですが。

有名どころで、日本語対応なのはpentaxですね。
http://voice.pentax.jp


日本語の、しかも標準語のみだったらX-SAMPAでなくてもいけます。
新明解が用いている番号によるアクセント区分があり、これを用いるとデータから発音まで合成できます。まぁソフトは無いわけですが。


# re: 言葉の壁 2008/10/31 2:14 ゆーち
>dolanさん
いやぁ。
勝手な想像ですが、なんか、日本の製品でこんなこと考えてる製品て、なさげな気がします。
これ使っちゃえば映像も音声も出るじゃん、ってなノリ。
まちがってんのかなぁ。。。

と思ったら・・・
>れいさん
いったい何者なんすか?あーたwwww
あちきがたまたま探し出したX-SAMPAを『使ってる』とは。
今夜、ふたたび、ちかっぱ、尊敬しました。

ちょっと、カラみたくなり申した。(謎


# re: 言葉の壁 2008/10/31 2:20 ゆーち
http://voice.pentax.jp
ちょっち、やってみました。w

なるほど。入力だとアクセントは伝えられないもんねぇ。
でも、よくできてるなぁ・・・

二次利用禁止か。
そーだよなぁ・・・


# re: 言葉の壁 2008/10/31 2:21 ゆーち
>dolanさん
あちきの車のナビに音声認識、あります。

ちゃんと自分の声、いっぱい登録してるのに、あの認識率の悪さは天下一品です。

一緒に乗ってる人を笑わせるためにしか使えないです(笑)

# re: 言葉の壁 2008/10/31 3:37 れい
> 勝手な想像ですが、なんか、日本の製品でこんなこと考えてる製品て、なさげな気がします。

自然言語処理で、読み上げは昔からわりとよく出てくる話題です。
特に英語は口文不一致なので。

HALあたりから、しゃべるPCが夢になってるというのもあります。

日本語は読み上げ以前に単語に区切るのすら難しいので、先に形態素解析が流行ったようです。
無料で入手できる辞書でも、ローマ字やカタカナ表記までは変換できます。
たぶんご存知でしょうが、茶筌、MeCab、KAKASIといったソフトがあります。

ただこれらの辞書にはアクセントがありません。
連接時に発音が変わったりするのにも対応できません。

上で述べたPentaxや新明解のデータ以外にも、いくつかデータは売られているようですが、個人や、小さなビジネスには金額的に…

昔は音声を保持するメモリが高かったので、言葉をなるべく小さく区切る需要がありましたが、最近は必要な言葉は連文節単位で録音して保持しておくようになり、
結果としてSAMPAの類はあまり流行ってないようです。

風の噂では、某g○○gleもそのあたり研究してるようで、音声合成な人たちを何人も雇用したそうです。
近いうちにX-SAMPAを読んでくれたり、テキストを読んでくれたりするようなwebサービスが出るのではないかと。

偉大なる初音ミクも産まれましたし。

PCで音声合成の自由を得られる日も近いかと。
(テキスト読み上げより先に歌が自由になるとは思いもしませんでしたが。)

そんなことより。

> 今夜、ふたたび、ちかっぱ、尊敬しました。

ちかっぱ!!
初めて聞きました。
いま出先で辞書を引けないのですが、九州でしょうか?

かわいいっ

# re: 言葉の壁 2008/11/03 14:36 ゆーち
>れいさん

>たぶんご存知でしょうが、茶筌、MeCab、KAKASIといったソフトがあります。
(´・ω・`)まったくしらないですぅ。w

>近いうちにX-SAMPAを読んでくれたり、テキストを読んでくれたりするようなwebサービスが出るのではないかと。
けっこうな使い道がありそうな気がします。
できるもんなら作ってみたいけど・・・ムリポ。w

>いま出先で辞書を引けないのですが、九州でしょうか?
「ちからいっぱい」を口語でくだけた表現です。
九州方面ではわりと使われていますw。
でひ、つかってみてくださいましw

# PkSeueCQJmvDd 2022/04/19 11:12 markus
http://imrdsoacha.gov.co/silvitra-120mg-qrms

# dkmzcd@yahoo.co.jp 2023/07/08 22:15 ロレックス 時計 メンズ 人気
すぐに発送していただき、注文の翌日には届きました。迅速な対応は素晴らしいです。
【送料無料】シャネル ハンドバッグをセール価格で販売中♪シャネル ハンドバッグ ベージュ ブラック キャンバス カーフ 新品 ココマーク シャネル
お安く買えてとても嬉しいです!またぜひ、良い物がありましたら、お買い物させていただきます。大満足しております。
ロレックス 時計 メンズ 人気 https://www.b2kopi.com/product/detail.aspx?id=6042

Post Feedback

タイトル
名前
Url:
コメント