結城あすかの毎日電波思考 (あすか日記)

アクセスカウンタ

zoom RSS 画像認証と遊ぼう! 第6回「あの影を断て編」

<<   作成日時 : 2013/05/11 11:39   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

 ……ということで、前回の続きで同じ老舗ブログサイトの別の画像認証を読み込ませてみるにょ。

画像

 見た目には前回の画像と変わらないにょ。まずこれを前回同様に「統計フィルタリング処理(グレイ)」を使って、統計上位2つの領域を抽出するにょ。

画像


 これでどう違うかはっきりしたにょ。前回の画像とは文字と影の立場が入れ替わってるということにょ。つまり、ここの画像認証では文字の領域の大きさと影の領域の大きさの大小が一定でないということにょ。

 ま、こうやって人の目で見ながらやってると一目瞭然なんだけど、これをソフトだけで判断するにはそれなりの手段が必要だにょ。それはここでの目的では無いので割愛するけど、リクエストでもあれば記事に書いてもいいにょ。

 さて、この場合はどうやるかというのが今回の内容だにょ。

 まず、いま抽出した画像を使って、元の素材画像に「二値画像による論理マスク」の処理を実行するにょ。
 本来なら先に二値化しておくものだけど、例によって手抜きにょ。

画像


 ここでもう一度、「統計フィルタリング処理(グレイ)」を使って、統計上位2つの領域を抽出するにょ。

画像

 マスク処理によって最初の画像の上位3位以下の画素が全部白になり最大勢力になってるので、元々2位だった文字色の部分が3位に落ちて、そこだけ白くなってるにょ。

 これを「白黒反転」すればこうなるにょ。

画像


 後は前回同様に、「極小領域削除処理」で点々を除去するにょ。

画像

 そして「膨張処理」にょ。

画像

 最後に「画像パターンの整頓処理」で並べ直すにょ。

画像


 これをOCRに読み込ませればこうなるにょ。

画像

 ……ん? 「669 1」?
 全角スペースが入ってるのはともかく、「8」を「9」と認識されては失敗だにょ。

 実のところ、このブログサイトの画像処理の文字デザインとの相性か、「読取革命Lite」での認識成功率は高くないにょ。
 そこで、次回は「読取革命Lite」等のOCRソフトを使わずに文字認識を行なってみる予定にょ。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
TweetsWind
画像認証と遊ぼう! 第6回「あの影を断て編」 結城あすかの毎日電波思考 (あすか日記)/BIGLOBEウェブリブログ
文字サイズ:       閉じる