2013年
6月
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30

setup diary

2007|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|06|08|11|
2015|01|02|03|04|05|06|07|08|10|11|12|
2016|01|02|03|04|05|06|07|08|09|10|11|12|
2017|01|02|03|04|05|06|07|08|09|10|11|12|
2018|01|02|03|04|05|06|07|08|09|10|11|12|
2019|01|02|03|04|05|06|07|08|09|10|11|12|
2020|01|02|03|04|05|06|07|08|09|10|11|12|
2021|01|02|03|04|05|06|07|08|09|10|11|12|
2022|01|02|03|04|05|06|07|08|09|10|11|12|
2023|01|02|03|04|05|06|07|08|09|10|11|

2013-06-22 OCRもどきの作成

_ imagemagickとrubyによるデジタル文字の取り込み

装置の7セグ表示器に表示される数字を、数値データとしてPCに取り込む必要性が生じた。とりあえずwebカメラで表示器を撮影して、ファイルとして保存しておいたのだが、これから数字を読み取ることにした。当初はOCRを使えば簡単にできると思っていたのだが、表示器の数字には対応していないようである。linuxでつかえるgocr、ocrad、tesseract-ocrを試したが、どれもダメだった。

そこで、7セグだけを読み取るプログラムを書くことにした。まずは、imagemagickのconvertを使って、白黒の単純なファイル形式であるpnmに変換した。なお、asciiで保存するために、-compress Noneオプションを付けた。それをrubyで処理することにした。

数字を認識するアルゴリズムをいくつか考えたが、結局以下のようなものになった。まず、周囲の文字が無い部分を取り除き、それぞれの文字に文理し、文字の部分を3*5に分割して、0から9までのパターンとの一致具合をxorで判定して足し合わせる。そして、点数の大小で数字を判定する。それなりに短いプログラムではあるが、まあまあの認識率である。

今後の課題としては、画像の中のどこに表示器があるかを認識することがある。今は表示器の部分を切り出した後でプログラムで処理しているが、切り出しも自動でできるようになれば、少しwebカメラが動いても、そのまま処理できるのだが。