やじゅ@アプリケーション・ラボ わんくま支局

目次

Blog 利用状況

ニュース

プロフィール

MSMVP

オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版

新年に今年こそは英語の勉強をしようと誓いをたてるものの、やはり途中で挫折してしまって同じことを繰り返しています。
今年もすでに8月半ば、グローバル化の時代だし英語くらいなんとかしなきゃ。

わずか2年弱でTOEIC980点。“奇跡の郵便配達員(51歳)”のモチベーションとは
http://wpb.shueisha.co.jp/2011/08/03/6238/

一部で話題になっている「グロービッシュ」で、これは非ネイティブこそが世界の大多数ってことで、必要なのは1500語だけ。
(Global + English = Globish つまり、英語を母国語としない国の人々のための英語です)
http://www.lastday.jp/2010/09/15/non-native-speacker-1500-words-globish
http://adreamgoeson.blogspot.com/2010/09/globish1500.html

米国営放送VOAの『Special English Program』では基本単語1500語のみで戦争やテロなどあらゆる分野のニュースを伝えている。
http://www.yomukiku.com/voa.html

1500語くらいなら短期間で覚える事が可能かなと思ったりして…
現在の学習指導要領の語彙数 中学-900語 + 高校-1,300語 合計2,200語を過去に学んできたはずなんです。
ちなみに、新学習指導要領(2013年4月の予定改定案)では、中学-900語 → 中学1,200語となり、3,000語まで引き上げることになっています。

1500語ってあまりにも少ないんじゃないって、globishの本を見ると、1500 words +3500 children=father 5000 children=派生語
まー、結局は5000~6000語は必要だったりするわけです。
http://blogs.yahoo.co.jp/rain4989benkyousuki/9370076.html

各レベルの語彙数

60,000語 アメリカのインテリの語彙数
30,000語 フツーのアメリカ人の語彙数  同時通訳者の語彙数
25,000語 日本の中学生の語彙数
15,000語 日本の小学校高学年の語彙数
7,000語 日本の小学生低学年の語彙数
6,000語 グロービッシュに必要な語彙数
5,000語 東京大学英語入試に合格する語彙数
2,000語 幼児の語彙数
1,500語 中学校で習う英単語数
※グロービッシュの6000語は日本の小学生低学年より低レベルとなる

なにはともあれ、基本単語である1500語を覚えようと英単語学習ソフト P-Study Systemを現在使い始めています。

英単語学習ソフト P-Study System はご存じでしょうか?
このソフトは英単語学習ソフトで、はてなブックマーク上で2000超えてブックマークされ、一部では神ソフトと言われています。
http://b.hatena.ne.jp/entry/www.takke.jp/

「急がばまわれ式・堅実で一番効率的な英語の勉強法」…単語の習得は、P-Study Systemという無料のソフトウェアが超おすすめ。
http://anond.hatelabo.jp/20091026215137


使い始めてみて違和感があるのが、単語読み上げの音声です。その音声が人工音声であるため、単語によってはやはり聞き取れません。
P-Study System公式サイトで紹介されている英語辞書CDを使えばネイティブの音声で聞けるようです。

P-Study Systemでは、wavファイルかmp3ファイルの指定すれば、人工音声ではなくそちらが優先されます。
そこで考えたのが、オンライン上に英語辞書サイトがあり、中には音声が付いていてダウンロード可能だったりします。
さすがに1単語ずつその作業をやるのは、根性がいりますね。そこで、プログラムを組んで自動化しようと考えました。

goo辞書、Excite辞書、NAVER辞書を3サイトを検討しました。
例 VEGETABLEを検索した場合
goo辞書は、単語の候補一覧が出た後に先頭のリンク先を辿らないと音声が出てきません。しかも、FlashファイルのためDL不可です。
http://dictionary.goo.ne.jp/srch/ej/VEGETABLE/m0u/
Excite辞書は、Goo辞書同様に単語の候補一覧が出た後に先頭のリンク先を辿らないと音声が出てきません。wavファイルでDL可能です。
http://www.excite.co.jp/dictionary/english_japanese/?search=VEGETABLE
NAVER辞書は、単語の候補一覧に音声が既に付いており、mp3ファイルでDL可能です。
http://endic.naver.jp/srch/all/N/vegetable?sm=edi_hty

検討した結果、NAVER辞書がURLの単語キーワードを変えれば簡単に情報が取得出来るのが分かりました。
音声ファイル以外に、ついでに発音記号や品詞や意味も取得してみました。



■ツールの説明

使い方は、「英単語情報取得.vbs」を指定のフォルダ(例 デスクトップ)に置き、各行の先頭が英単語となっているテキスト形式のファイル(拡張子 txt,csv)
または、それを格納しているフォルダをドラッグ&ドロップしてください。(複数ファイル可能です)
一応、P-Study Systemでエクスポートしたcsvファイルにも対応しております。

英単語を取得しますか?の確認画面の後に、音声保存フォルダの指定ダイアログ画面が出ますのでフォルダを選択してください。
すると、英単語ファイル名+"-EN".csvと英単語.mp3が出力されます。「取得完了」のメッセージで終了となります。
私の環境(OS:Windows7、ADSL26M)にて、3300単語だと2時間10分かかりました。30単語程度なら1分くらいです。

英単語情報取得.vbs
追記:相手のサービスに過大な負荷を与えていないか?と言われるとグレーであるため、配布を中止します。
ブログだけ記念に残しておきます。

必要であれば改変してご自由に使用してください。
バグなどあれば、コメント欄にお願いします。

仕様
・発音記号は先頭のみ取得しています。
・単語に音声が付いてない場合、最初に見つけた音声がセットされます。例 accordingは、according to の音声となる。
それが嫌なら、その単語はExcite辞書の音声を使用してください。
・出力されるCSVファイルは、BOM付のUTF-8形式で保存されます。
・音声ファイル名は、Web側のファイル名では分かりにくいため英単語の名称に変更して保存されます。

VBScript版がとりあえず出来たので、次はWeb版に挑戦しようと思っています。

投稿日時 : 2011年8月15日 2:33

コメントを追加

# re: オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版 2011/08/15 10:49 やじゅ

2011/08/15 10:40 修正版UP
発音記号で「è」と「?`」がgif画像となっていたため取得できていなかった。テキストに変換するように修正

# re: オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版 2011/08/15 15:31 Azulean

これって大丈夫?
利用規約に抵触しないか、相手のサービスに過大な負荷を与えていないか、このあたりで大丈夫そうと判断されているのであればよいのですが…。

たとえば、利用規約の第3条(9)に抵触するほどに過負荷にならないかとか、第4条3の「当然に予定している利用態様を超えて」いないかとか。

# re: オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版 2011/08/15 17:22 やじゅ

>Azuleanさん
>利用規約の第3条(9)に抵触するほどに過負荷にならないかとか

コメントありがとうございます。
利用目的は悪くないものの、DDoSアタックと思われてしまうかも知れませんね。

残念ながら配布を停止したいと思います。
既に取得された方は悪用しないことを祈るのみです。

# re: オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版 2011/08/15 21:01 Azulean

1分間に約25単語だと考えて音声DLを含めると約50リクエスト、ペースとしては0.8リクエスト/秒ぐらいでしょうか。
あの図書館事件では1リクエスト/秒でしたが、あれはサーバーが貧弱(バグってた)ことと、今回のサーバーはそこまで弱くないとは思っていますが、確証はありません。
ただ、意図的なウェイトをデフォルトの状態で入れていないのはまずそうですね、そのまま使う人がほとんどだと思いますので対策は入れた方がよいでしょう。

問題はどの程度のウェイトが適正かということですが、正直、この数値ならOKというものは置けないのが、今の時代の怖いところでしょうか…。
(相手の運用状態が見えない&相手が被害を受けたととらえるかわからない&警察・検察のさじ加減がわからない&判例もない)

# re: オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版 2011/08/15 23:38 やじゅ

対策を入れた上で、再度配布する方向でもう少し考えてみます。

# re: オンライン英語辞書から英単語情報(音声)を取得するツール VBScript版 2011/08/16 10:48 ネイバージャパン 金子

こんにちは。NAVERの金子です。

また、機会があれば英語辞書はもちろん、その他のサービスもご活用くださいwいろいろ出してますので~
http://corp.naver.jp/service/service

タイトル  
名前  
URL
コメント