結城あすかの毎日電波思考 (あすか日記)

アクセスカウンタ

zoom RSS 画像認証と遊ぼう! 第3回「傾きを正せ編」

<<   作成日時 : 2013/04/28 19:52   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

 この連載で用いている画像処理の技術検証用ツールはメインサイトの方に置いてあるので、自分でも試してみたいという人はこちらからダウンロードしてくれにょ。

 今回の画像を読み込んで見るにょ。

画像

 これは、とある携帯用掲示板サイトで使われてる画像認証の画像だにょ。
 これをこのままPanasonic製OCRソフト「読取革命Lite」に読み込ませてみるにょ。文字認識以前に対象の文字画像を認識できていないにょ。

画像


 まず、このままだと画像処理の途中で文字イメージが潰れる恐れがあるので、最初に拡大しておくにょ。処理選択で「画像の拡大縮小」を選ぶにょ。

画像

 パラメータを設定するにょ。

画像

 水平方向、垂直方向の拡大率を設定するにょ。言うまでもなく1.0より大きければ拡大され、小さければ縮小されるにょ。ここでは縦横ともに4倍に拡大するにょ。「補間画素を二値化する」というのは二値画像を拡大縮小した場合、補間処理で中間色が割り当てられる画素を二値化するというオプションにょ。今は二値化画像でもないのでオプションは外しておくにょ。
 ちなみに画素補間は(この機能に限らず全般的に)バイキュービック法で行ってるにょ。ソースにはバイリニア法の処理も入ってるけど、いちいちパラメータで選択するとかも煩雑になるので、バイキュービック法で固定してるにょ。

 拡大すればこうなるにょ。

画像


 例によってこれを二値化するにょ。前回使った「分析判別法」の方が楽だし、それで二値化出来ないわけではないけど、今回の画像では閾値の微妙な違いで二値化後の文字の形状が変動するので、ここは「固定閾値」で行うにょ。

画像

 画像のオレンジの部分の輝度値(Y値)が130なので、ここでは閾値として160を設定するにょ。

 実行すればこうなるにょ。

画像


 一般の文字画像とは白黒が逆転してるので、「白黒反転」で反転するにょ。

画像

 パラメータは以下のとおりにょ。

画像

 ここで自動判定のオプションがあるのは、画像上の白黒それぞれの画素の割合から反転の必要性を判定して反転処理を行うというものにょ。今は判別の必要なく無条件に反転したいので、このオプションは外しておいて構わないにょ。
 自動判定を行う場合は、目的とする本来の文字色である黒を指定しておくにょ。ここが白になってると反転処理は行われないにょ。

 実行するとこうなるにょ。

画像

 これをOCRに掛けてみるにょ。

画像

 これではまだ文字認識出来ないにょ。


 どうもOCRソフトでは文字列の画像ではなく、単に斜めに傾いた画像パターンとしか認識されてない様子にょ。
 そこで、この画像の傾きを直すにょ。

 処理選択で「画像パターンの水平化処理」を選ぶにょ。

画像

 パラメータは水平化する図形色の選択にょ。こういう白か黒かという選択のある処理は処理対象として二値化画像を前提にしてるにょ。

画像

 実行すればこうなるにょ。

画像

 これをOCRに掛けてみるにょ。

画像

 どうにか文字認識されるようにはなったけど、先頭の「7」が「ア」になってたりするにょ。

 この段階では文字画像が繋がってたりして、OCRには過酷かと思えるので、次回はここからもう少し処理を進めてみるにょ。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
TweetsWind
画像認証と遊ぼう! 第3回「傾きを正せ編」 結城あすかの毎日電波思考 (あすか日記)/BIGLOBEウェブリブログ
文字サイズ:       閉じる