中井技術工房  今なんぼ?
対応数字サンプル  Jan.01,2012 改正


トップ > 今なんぼ? > ここ

対応数字サンプル

正常に数字認識できた数字画像サンプルを示します。なお、判定した数字ゾーンを長方形で画像に追加してあります。
この数字ゾーンだけを判定した、という意味です。
実際には、元画像のカラーを補正してから判定処理に入ります。ここで示す結果画像は元画像とは若干RGBが異なり、判定用に単純化されています。
画像処理にはこのような小細工がいろいろ必要です。


標準的なフォントの画像

世の中には実にさまざまな数字フォントがあり、すべてに対応できるわけではありませんが、オーソドックスなものについては、まあ対応できると思います。
次のフォントで検証しています。





カンマ、点、コロン付き画像

数字列には、よくカンマ、点、コロン、ハイフンなどがくっついています。標準的なものなら除去して数字認識可です。




横線付き画像

アンダーラインが数字列から離れていれば対応可です。数字上に陰影のような線が現れる場合もありますが、薄ければ無視して正常に数字認識できます。




左右端にくっついたものは除外

左右端にくっついたものは大きさの如何にかかわらず無視します。ゾーンではとらえますが、数字読み上げ対象からは除外します。ゾーン指定のとき左右はちょっと広めにとってください。




多少くっついたものはOK

下図の「489」とかでは、4の右端が次の数字とくっついていることがあります。
これぐらいは対策しています。




暗い画像

多少暗すぎる、とか明るすぎる画像も処理できます。明るさを補正してから画像処理するためです。
ただし、明るさ補正によってフォントエッジがこわれるほど暗すぎる、明るすぎると正常に画像処理できません。
下図は、左側が元画像、右側が処理画像です。




濃淡のある画像

画像によっては陰影、ハレーションなどにより、薄い濃淡がついている場合があります。薄ければフォントを正しく検出できます。




傾いた画像

画像によっては少し傾くことがあります。傾斜角が小さければを正しく数字認識できます。



背景色がちょろちょろする画像

下図は大和證券の株価ボードから取り出した画像です。数字変化時に数字ゾーンに黄色い背景が現れてすぐに消えます。
画像の上下端付近に色境界線が現れたりで、数字判定時に障害になっていました。
現在は数学的な処理によって取り除いており、判定遅れはありません。



フィルタエッジ後のノイズのある画像

下図の左は相当条件の悪いプレート画像で、右側はフィルタエッジをかけたあとに、本ソフトの数字判定に持ち込んだものです。
ここまで画像がボロですといつもOKとはいきませんが、けっこういけそう!
なおフィルタエッジについては、「画像処理準備楽々」の頁を参照ください。



トップ > 今なんぼ? > 頁トップ