凪瀬 Blog
Programming SHOT BAR

目次

Blog 利用状況
  • 投稿数 - 260
  • 記事 - 0
  • コメント - 47023
  • トラックバック - 192
ニュース
広告
  • Java開発者募集中
  • 経歴不問
  • 腕に自信のある方
  • 富山市内
  • (株)凪瀬アーキテクツ
アクセサリ
  • あわせて読みたい
凪瀬悠輝(なぎせ ゆうき)
  • Java技術者
  • お茶好き。カクテル好き。
  • 所属は(株)凪瀬アーキテクツ
  • Twitter:@nagise

書庫

日記カテゴリ

 

http://seldon.cocolog-nifty.com/petapeta/より。

該当記事でやっているのはパターンマッチング用の元になるフォントの抽出作業なのだけど、 実は、これは別に機械でやる必要がないのです。手作業でも構わない。

先の「はてなのCAPTCHAは簡単に破れる」 では抽出作業をメインに解説しましたが、適当な画像編集ツールで、それこそWindowsのペイントで十分なのですが、 手作業で元フォントを抽出しておけば、あとはマッチングで一致率をみるだけ。

つまり、あの記事の殆どは比較のための下準備の話だったりします。

実際に機械でのマッチング処理をして検証してはいませんが、ココログも抽出した元フォントとの一致率を見れば 相当な高精度でCAPTCHAの文字を認識できることでしょう。

CAPTCHAの基本的な思想とは?

wikipediaの記事には初期のCAPTCHAは、

ブラザー工業のスキャナの取扱説明書には、OCRの結果を改善するためには均質な活字面、無地の背景を用いるよう薦められていた。そこで彼らは取扱説明書に「OCR認識の結果を悪くする」と書いてある条件を真似て最初のCAPTCHAを作り出した。

という発想の元、作られているのです。OCRというのは画像から文字を認識するソフトのことですね。

OCR技術の逆を行くことで機械では読み取りにくい文字にすることができ、それをもって機械をはじこうというのです。

CAPTCHAに込められた思いを汲み取らず、画像の文字を手で入力させるという手法だけを汲み取った プログラマが機械で認識することが難しくないCAPTCHAもどきを作ってしまう…。

プログラミングをするには、対象となる事象への関心を持つことから始めなければなりません。 現実世界をどんどん取材してまわないといけない。 「プログラムのことしか知らない」ようでは「世間知らずなシステム」を作り上げてしまうことになるのです。

投稿日時 : 2007年10月30日 10:39
コメント
  • # re: ココログのCAPTCHAも貧弱らしい
    WFSVI
    Posted @ 2007/10/30 11:08
    殆どのCAPTCHA(画像認証コード)はオープンソースのアルゴリズム、或いは、オープンソースそのまま使っています。とても破られやすい、SPAM対策になれない。
    だから、我々は破られにくい、綺麗な画像認証コードサービスを始めました。
    www.WFSsoft.com
    貴方の「画像認証コード」に対する定義が変わるかもしれない。
  • # re: ココログのCAPTCHAも貧弱らしい
    裏口
    Posted @ 2007/10/30 11:14
    実害(コメントスパム)出てるのかな?

    CAPTCHAは実装が比較的簡単な対策法だっただけに効力もそれなりだろうと納得する部分はあります。

    CAPTCHA作成アルゴリズムに芸がないものはダメですね。
    # MSみたいにイメージ化し変形させる位は必要だろうと。
  • # re: ココログのCAPTCHAも貧弱らしい
    凪瀬
    Posted @ 2007/10/30 11:38
    >WFSsoft
    少なくとも私の「画像認証コード」にたいする定義は変わりませんでした。

    CAPTCHAというのはいわゆる一方向関数のようなもので、
    作るのは簡単だが、読み取るのは難しいところがポイントです。
    ですから、作るアルゴリズムが公開されていても脆弱性にはなりえません。
    「とても破られやすい、SPAM対策になれない。」のくだりは
    根拠のない主張に思えます。


    小一時間で敗れるはてなやココログが論外なだけで、
    多少なりともゆがみを生じているなどされていれば、
    とても破ってみようという気にはならないものですけどね。
  • # re: ココログのCAPTCHAも貧弱らしい
    凪瀬
    Posted @ 2007/10/30 11:40
    防犯設備は、しっかりした防犯設備があるということを誇示するだけで効果があるものです。
    これ見よがしに誇示してある設備が、笑えるほど貧弱だったら抑止力にはなりえません。
  • # re: ココログのCAPTCHAも貧弱らしい
    774RR
    Posted @ 2007/10/30 11:49
    そして視覚障害者を排除するわけですね
  • # re: ココログのCAPTCHAも貧弱らしい
    シャノン
    Posted @ 2007/10/30 12:01
    こればっかりは原理主義で論じるわけにはいかないので、視覚障害者を切り捨てるデメリットとスパムを放置するデメリットを天秤にかければ、視覚障害者を切り捨てる選択肢もアリなのだと思うのですよ。

    もちろん、切り捨てないに越したことは無いですから、Hotmail のように音声を併用すればいいのかもしれませんが…初音ミクのようなのを見る限り(あれは音声解析ではなく音声合成ですが)、凝った画像よりも音声のほうが解析しやすくなってしまう可能性もあるのかもしれない。そうなると本末転倒ですね。

    あとはもう意味を問うしかないです。
    ランダムな問題文(例えば、9たす2の答えを漢字で入力しなさいとか)を解かせる。
    これは対象を日本語理解者に限定してしまうというデメリットがありますが(といっても発信しているメインコンテンツが日本語なら、その時点で限定したも同じですが)、日本語を理解する手動スパマー以外には当面破れないのではないでしょうか(問題のランダム性を十分に工夫すればね)。
  • # re: ココログのCAPTCHAも貧弱らしい
    凪瀬
    Posted @ 2007/10/30 13:04
    CAPTCHAを導入した時点で視覚をもっていないとどうにもならないとは思いますが、
    じゃぁ、CAPTCHAさえ使わなければ画像を見ずに操作できるのか?というと…

    なんか、視覚障害の場合の分かりやすい例としてあげつらわれている感がありますが
    そもそも視覚障害があっても使えるようにページをデザインするだけで
    相当に大変なわけで、それをせずにCAPTCHAがないだけで視覚障害者にも配慮してます!と
    言えるかというと違うわけでしょう?
  • # re: ココログのCAPTCHAも貧弱らしい
    774RR
    Posted @ 2007/10/30 13:18
    ま、そこんところは御意。でも
    Captcha が無い=配慮してます!とは言えなくても
    Captcha が有る=切り捨てます!とは言えると思う。
    俺の個人ページは static HTML ですが視覚障害があっても使えるページにしてますどす。
    ついでに HTMLlint で満点を確認のうえ更新ちう。
    写真と動画のページもあるけど、そこは別の話っつーことで。

    あと防犯設備の話にするなら笑えるほど貧弱でも抑止効果になります。
    ダミーカメラや防犯装置ありステッカーでもコゾーよけには効果あり。
    本気のプロ相手にはそれこそコストパフォーマンス的に見合わない対策が必要だし。
    それならむしろ盗難保険のほうが・・・とか思うわけですだ。
  • # re: ココログのCAPTCHAも貧弱らしい
    かつのり
    Posted @ 2007/10/30 13:47
    Captchaが叩かれてFlashやAjaxが叩かれないのがよくわからない・・・
  • # re: ココログのCAPTCHAも貧弱らしい
    シャノン
    Posted @ 2007/10/30 14:07
    俺んトコも見たってやーw
    寂しいのーw
  • # re: ココログのCAPTCHAも貧弱らしい
    凪瀬
    Posted @ 2007/10/30 14:20
    こっちですね。
    http://blogs.wankuma.com/shannon/archive/2007/10/30/104911.aspx

    > シャノンさん
    機能の爆発的なトラフィックで、普段わんくまblogを見ていない人が沢山来訪されています。
    情報のリーチャビリティを確保しないで見てくれない!と言うのはNGですよ。
    コメント投稿の際のURL欄とかも記入しておくとよいかもしれません。
  • # re: ココログのCAPTCHAも貧弱らしい
    凪瀬
    Posted @ 2007/10/30 14:21
    防犯設備の抑止の件は、カジュアルな犯罪への対処としては笑えるほど貧弱でも効果あるでしょうね。
    ただし、故意犯の場合、「対策した気になっている」相手なんてのは逆にカモに見えるんじゃないでしょうか?
  • # re: ココログのCAPTCHAも貧弱らしい
    <セルダン>
    Posted @ 2007/10/30 16:36
    取り上げて下さって、ありがとうございます。

    >該当記事でやっているのはパターンマッチング用の元になるフォントの抽出作業なのだけど、実は、これは別に機械でやる必要がないのです。手作業でも構わない。

    いぇ、最終的に比較する場合にも、背景やノイズはできるだけ取り除いておかないといけない訳で、
    機械的作業でどれだけクリーンにできるかというのはCAPTCHAの強度を測る上で重要だと思います。

    という事で、てきと~にやってみたら、クッキリ、ハッキリ出てしまったので、
    実際の比較プログラムまで作ってみる意欲が無くなってしまいました(^^;
    ここまでクリーンにできればマッチングできるのは明らかですから。
  • # re: ココログのCAPTCHAも貧弱らしい
    凪瀬
    Posted @ 2007/10/30 17:58
    > 機械的作業でどれだけクリーンにできるかというのはCAPTCHAの強度を測る上で重要だと思います

    どうなんでしょうか。
    マッチングのマスターとなるデータは、当然クリアな方がよい結果が出ると思うのですが、
    人間が判断してペイントツールで作ったほうが良いものが出来るかもしれない。

    手作業の問題としては、サンプリング対象となる文字数が多くなったときに、
    作業量が増えて費用対効果の観点で割に合わなくなることぐらいでしょうか。
    サンプリングなんてのは1回こっきりの作業ですから、機械化による省力化は意外と出ないのかも知れない。
  • # You Sir/Madam are the enemy of conufison everywhere!
    Well
    Posted @ 2012/10/18 4:39
    You Sir/Madam are the enemy of conufison everywhere!
  • # Have you ever considered about including a little bit more than just your articles? I mean, what you say is important and everything. But imagine if you added some great visuals or video clips to give your posts more, "pop"! Your content is ex
    Have you ever considered about including a little
    Posted @ 2022/06/18 22:31
    Have you ever considered about including a little
    bit more than just your articles? I mean, what you say is important and
    everything. But imagine if you added some great visuals or video clips to give your posts more, "pop"!
    Your content is excellent but with images and clips, this
    website could undeniably be one of the very best in its niche.
    Wonderful blog!
タイトル
名前
Url
コメント