いるかのボックス: Raspberry PiでOCRを使う

2017年10月2日月曜日

Raspberry PiでOCRを使う

Tesseract-OCRというオープンソースのOCRエンジンがあって、Raspberry Piでも使える。インストールして使ってみたので、その結果をまとめておく。

環境

Raspberry PiとRaspbian Jessie。

$ cat /etc/issue
Raspbian GNU/Linux 8 \n \l

Tesseract-OCRのインストール

はじめにシステムにインストールされているパッケージを最新にしておく。

$ sudo apt-get update
$ sudo apt-get upgrade

続いてTesseract-OCRと日本語用の学習データをインストール。

$ sudo apt-get install tesseract-ocr tesseract-ocr-jpn

インストールされたバージョンは3.03。

$ tesseract -v
tesseract 3.03
 leptonica-1.71
  libgif 4.1.6(?) : libjpeg 6b : libpng 1.2.50 : libtiff 4.0.3 : zlib 1.2.8 : libwebp 0.4.1 : libopenjp2 2.1.0

使い方は、第一引数にOCRする画像ファイル、第二引数に結果の出力先、言語は「l」オプションで指定（デフォルトは英語）する。結果の出力先をstdoutにすると標準出力になる。

$ tesseract <画像ファイル> <結果の出力先> -l <言語>

OCRを試してみる

ホームページの文章をPCで画面キャプチャした画像をOCRしてみる。

sample.png

$ tesseract sample.png stdout -l jpn
咋年g月に 「費刊少年ラャ〉プ」 (集剣} で神 "年闇
の國を終えた人気嚢董 「Zちら葛薗区亀有公膚前派出所
」 が ー 5 日、 範も不定Mて賃輻することが分ヵ`ったー (

これは厳しい。解像度が低すぎるのか？

sample2.png

$ tesseract sample2.png stdout -l jpn
庸さん、 晴々帰ってくる ! 「こ抱
ー G日儲、 棚踵に

文字の解像度を上げてみるが、これでも実用に耐えるレベルではない。

sample3.png

$ tesseract sample3.png stdout -l jpn
クレ)麦拗リ‡ッ ド , オ丿しビス 剛クチ〕三

漢字なしの文章でもうまくいかない。

sample4.png

$ tesseract sample4.png stdout -l jpn
上野の赤ちゃんパンダ

このくらいまで解像度を上げると大丈夫なようだ。

sample5.png

$ tesseract sample5.png stdout -l jpn
赤ちゃんバンダ、 ー78グラム
生後ー遺闇の山甦ぇたか

と思ったら、2行の文章だとうまくOCRできない。

sample6.png

$ tesseract sample6.png stdout
Install PIL (with jpg supported) and ImageTk on
Raspberry Pi/Raspbian

英語だと日本語より低い解像度でもうまくOCRできそう。

sample7.png

$ tesseract sample7.png stdout -l jpn+eng
Using default language params
Amazon―6‘33
買い物

言語は複数指定できるので日本語と英語混在の文章をOCRしてみるが、ちょっと残念。

結果としては、英語のOCRは使えそうだが、日本語は微妙。日本語のときは1行限定にした方がいいかもしれない。

いるかのボックス

2017年10月2日月曜日

Raspberry PiでOCRを使う

環境

Tesseract-OCRのインストール

OCRを試してみる

0 件のコメント:

コメントを投稿