結城あすかの毎日電波思考 (あすか日記)

アクセスカウンタ

zoom RSS 画像認証と遊ぼう! 第4回「しがらみを切り離せ編」

<<   作成日時 : 2013/04/29 21:49   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

 今回は前回の処理の続きだにょ。

画像

 前回はここまでやってみたけど、この段階では文字が繋がったりしてるので(この画像では比較的ちゃんと読めてるけど)OCRでは誤認識しやすいところにょ。
 そこで、今回はこれを切り離してみようと思うにょ。

 もちろん、ペイント等を使って手作業でバラせばそれはそれで良いのだけど、ここでは論理的に文字図形の構造と戦うのが目的なので、画像処理技術を用いた手順で行うにょ。

 まず、連結箇所を小さくするため、「収縮処理」を行うにょ。

 今回のパラメータはこんな感じ。何ステップも繰り返すほど収縮はしないけど、最大限に痩せさせる設定だにょ。

画像

 実行すればこうなるにょ。当然ながら、これくらいで連結が無くなったりはしないにょ。

画像


 ここから文字要素の骨組みだけを抽出するために「細線化処理」を行うにょ。

画像

 パラメータはこうにょ。

画像

 実行すればこうなるにょ。文字の連結部分が横線になってるにょ。

画像


 文字要素としてはヒゲのように突き出てる部分が不要なので、「細線先端の短縮処理」を使って除去するにょ。

画像

 パラメータとしてはこんなところにょ。あまり大きな値を入れると、本来の文字の先端部分までごっそりと削られてしまうにょ。

画像

 実行すればこうなるにょ。

画像


 連結部分の横線を除去するために「孤立水平線の削除処理」を使うにょ。

画像

 これは、横方向に一本しか線が伸びてないものは文字の要素としては不要なので除去しようというものにょ。対象が数字の時にしか使えないにょ。
 パラメータはこうにょ。

画像

 実行すればこうなるにょ。文字の連結部分がうまく切れたにょ。

画像

 連結部分の残滓がヒゲのように残ってるので、もう一度「細線先端の短縮処理」を行なっておくにょ。

画像


 このままだと文字の並びがチグハグなので、「連結パターンの分割処理」を行なって整頓するにょ。

画像

 これは画像パターンを与えられた個数に分割し、分割した個々のパターンを並べ直すという処理にょ。あらかじめ個数分に分割されてるものはその分割を利用するけど、分割されてないパターンは、強制的に等間隔で分割してしまうものにょ。

 パラメータは、分割個数とパターンの色にょ。

画像

 実行すればこのようにきれいに並ぶにょ。

画像


 相手が手書き文字を認識できるようなOCRならこのままでもいいけど、活字OCRだと線文字のままでは心許ないので、「膨張処理」を使って肉付けするにょ。

画像

 実行すればこうなるにょ。OCRがゴシック体に対応していたら、このくらいで大丈夫だろうかにょ。

画像

 これをOCRに掛けるとこうなるにょ。

画像

 相変わらず先頭の「7」は「ア」になってるけど、似たような字体の文字がある場合は日本語文字を優先するというのは、日本語OCRのデフォルトの動作としては仕方がないかにょ。
 ちなみに真ん中は英字の「O」のように見えるけど、ちゃんと数字の「0」になってるにょ。

 しかたがないので「読取革命Lite」の設定で認識対象を「数字」「半角文字」に指定して読み込ませてみるにょ。

画像

 このように文字種を指定すればきちんと半角数字で認識してくれるにょ。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
TweetsWind
画像認証と遊ぼう! 第4回「しがらみを切り離せ編」 結城あすかの毎日電波思考 (あすか日記)/BIGLOBEウェブリブログ
文字サイズ:       閉じる