中井技術工房
今なんぼ?
対応数字サンプル
Jan.01,2012 改正
トップ >
今なんぼ? >
ここ
●
対応数字サンプル
正常に数字認識できた数字画像サンプルを示します。なお、判定した数字ゾーンを長方形で画像に追加してあります。
この数字ゾーンだけを判定した、という意味です。
実際には、元画像のカラーを補正してから判定処理に入ります。ここで示す結果画像は元画像とは若干RGBが異なり、判定用に単純化されています。
画像処理にはこのような小細工がいろいろ必要です。
●
標準的なフォントの画像
世の中には実にさまざまな数字フォントがあり、すべてに対応できるわけではありませんが、オーソドックスなものについては、まあ対応できると思います。
次のフォントで検証しています。
- MS Pゴシック
- MS P明朝
- MS ゴシック
- MS 明朝
- HG 創英角ポップ体--ポップ調フォント
●
カンマ、点、コロン付き画像
数字列には、よくカンマ、点、コロン、ハイフンなどがくっついています。標準的なものなら除去して数字認識可です。
●
横線付き画像
アンダーラインが数字列から離れていれば対応可です。数字上に陰影のような線が現れる場合もありますが、薄ければ無視して正常に数字認識できます。
●
左右端にくっついたものは除外
左右端にくっついたものは大きさの如何にかかわらず無視します。ゾーンではとらえますが、数字読み上げ対象からは除外します。ゾーン指定のとき左右はちょっと広めにとってください。
●
多少くっついたものはOK
下図の「489」とかでは、4の右端が次の数字とくっついていることがあります。
これぐらいは対策しています。
●
暗い画像
多少暗すぎる、とか明るすぎる画像も処理できます。明るさを補正してから画像処理するためです。
ただし、明るさ補正によってフォントエッジがこわれるほど暗すぎる、明るすぎると正常に画像処理できません。
下図は、左側が元画像、右側が処理画像です。
●
濃淡のある画像
画像によっては陰影、ハレーションなどにより、薄い濃淡がついている場合があります。薄ければフォントを正しく検出できます。
●
傾いた画像
画像によっては少し傾くことがあります。傾斜角が小さければを正しく数字認識できます。
●
背景色がちょろちょろする画像
下図は大和證券の株価ボードから取り出した画像です。数字変化時に数字ゾーンに黄色い背景が現れてすぐに消えます。
画像の上下端付近に色境界線が現れたりで、数字判定時に障害になっていました。
現在は数学的な処理によって取り除いており、判定遅れはありません。
●
フィルタエッジ後のノイズのある画像
下図の左は相当条件の悪いプレート画像で、右側はフィルタエッジをかけたあとに、本ソフトの数字判定に持ち込んだものです。
ここまで画像がボロですといつもOKとはいきませんが、けっこういけそう!
なおフィルタエッジについては、「画像処理準備楽々」の頁を参照ください。
トップ >
今なんぼ? >
頁トップ