結城あすかの毎日電波思考 (あすか日記)

アクセスカウンタ

zoom RSS 画像認証と遊ぼう! 第8回「文字で呪え編」

<<   作成日時 : 2013/05/16 11:42   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

 前回は数字の「0」の画像からOCR辞書を作成したところで終わったにょ。
 ここから今回は他の数字を登録していくにょ。

 「0」の時と同様に「1」の画像パターンを作成するにょ。

画像


 次に処理選択から「OCR辞書の追加登録」を選択するにょ。

画像

 パラメーターはこうにょ。

画像

 「処理画像ファイル名」のところには、追加登録先の辞書ファイルのファイル名を入力するにょ。
 「登録文字」は「1」なので「1」と設定するにょ。

 実行すれば、処理結果が「処理の成否」に出るにょ。

画像

 こうやって、残りの「2」〜「9」も登録していくにょ。


 OCR辞書が完成したら、登録内容をチェックしてみるにょ。

 処理選択から「OCR辞書の種類」を選択するにょ。

画像

 辞書のファイル名を指定して実行すれば、右下の「数値結果」のところに「数」と表示されるにょ。

 処理選択から「OCR辞書の登録数」を選択するにょ。

画像

 辞書のファイル名を指定して実行すれば、右下の「数値結果」のところに「10」と表示されるにょ。これが「10」じゃないと、何か登録漏れがあるか、余計に登録してることになるにょ。

 処理選択から「OCR辞書のフォーマット」を選択するにょ。

画像

 辞書のファイル名を指定して実行すれば、登録されてる文字パターンの画像フォーマット情報が表示されるにょ。
 「数値結果」に表示されるのはビットマップのピクセル深度にょ。ここでは画像処理の結果で作られた32bitARGBの画像が登録されてるので、「32」と表示されてるにょ。

 処理選択から「OCR辞書の名前」を選択するにょ。

画像

 辞書のファイル名を指定して実行すれば、右下の「数値結果」のところに新規登録時に設定した名前が表示されるにょ。

 処理選択から「OCR辞書のイメージ」を選択するにょ。

画像

 辞書のファイル名と何番目に登録されてるかのインデックス値を指定して実行すれば、登録されてる画像パターンが表示されるにょ。また、右下の「数値結果」にその画像パターンに対応する文字が表示されるにょ。
(見てわかるように、画像パターンはマッチング精度を上げるために登録時にサイズ領域いっぱいにパターンを拡大して登録されてるにょ)


 辞書の登録内容が確認できたら、いよいよ実際の文字認識を行うにょ。

 まず、前々回『読取革命Lite』で失敗した処理結果画像を読み込んでみるにょ。

画像


 処理選択から「OCR文字列認識」を選択するにょ。

画像

 パラメーターを設定するにょ。

画像

 「処理画像ファイル名」のところには、作成した辞書ファイルを指定するにょ。

 「マッチング閾値」は、マッチング結果がこれ以上の場合はそれが正解だと判断して認識処理を終了する値をパーセントで指定するにょ。これに達するものがない場合はマッチング結果が一番大きかったものを正解とするにょ。
 当然ながら、値が小さいほど処理が軽いけど精度は低く、値が大きければ精度は高いけど認識に時間がかかるにょ。

 「回転単位角度」は傾いた文字を認識するために画像パターンを回転させる単位の角度だにょ。
 「回転ステップ数」は左右にそれぞれ何回まで回転させるかという数にょ。
 単位角度が小さくステップ数が多いほど精度の高いマッチングを行えるけど、処理に時間がかかるにょ。

 実行すれば右下の「数値結果」のところに認識結果が表示されるにょ。

画像

 ここでは正しく「6681」と認識されたにょ。

 ちなみにその前の回の処理結果画像にょ。

画像

 これも正しく「5946」と認識されたにょ。

画像

 ついでに前回「0」を取り出した画像にょ。

画像

 これも正しく「5054」と認識されたにょ。

画像


 このように画像処理ツールで最初からやるのは手間がかかるけど、このツールの開発に用いたライブラリを使って、前々回までの認証画像の加工処理と、この文字認識処理を一括して行うようなソフトを作れば、元の認証画像からダイレクトに文字認識結果を取り出すようなものを作ることも出来るにょ。

 試しにコンソールアプリで作ってみた例にょ。パラメータに未加工の元画像を与えるだけで、画面処理を行うことなく一連の画像加工や文字認識を内部で行い、結果だけを文字列として吐き出してるにょ。

画像


 ここで用いてる認識処理だと英数字以外の複雑な文字を十分扱えるまでにはなっていないけど、そのレベルの範囲内でいろいろと応用的に使うことも出来るだろうにょ。例えば英数字を独自の創作文字のフォントに置き換えて作った暗号文を翻訳するのに使ったりとか……

 とりあえず文字認識処理まで一通りやったので、反応も無いことだし、この連載は今回で終わることにするにょ。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
TweetsWind
画像認証と遊ぼう! 第8回「文字で呪え編」 結城あすかの毎日電波思考 (あすか日記)/BIGLOBEウェブリブログ
文字サイズ:       閉じる