|
setup diary |
装置の7セグ表示器に表示される数字を、数値データとしてPCに取り込む必要性が生じた。とりあえずwebカメラで表示器を撮影して、ファイルとして保存しておいたのだが、これから数字を読み取ることにした。当初はOCRを使えば簡単にできると思っていたのだが、表示器の数字には対応していないようである。linuxでつかえるgocr、ocrad、tesseract-ocrを試したが、どれもダメだった。
そこで、7セグだけを読み取るプログラムを書くことにした。まずは、imagemagickのconvertを使って、白黒の単純なファイル形式であるpnmに変換した。なお、asciiで保存するために、-compress Noneオプションを付けた。それをrubyで処理することにした。
数字を認識するアルゴリズムをいくつか考えたが、結局以下のようなものになった。まず、周囲の文字が無い部分を取り除き、それぞれの文字に文理し、文字の部分を3*5に分割して、0から9までのパターンとの一致具合をxorで判定して足し合わせる。そして、点数の大小で数字を判定する。それなりに短いプログラムではあるが、まあまあの認識率である。
今後の課題としては、画像の中のどこに表示器があるかを認識することがある。今は表示器の部分を切り出した後でプログラムで処理しているが、切り出しも自動でできるようになれば、少しwebカメラが動いても、そのまま処理できるのだが。