kgrss's blog

プログラムを中心にいろいろなことを記事にしていきます!

文字認識APIを使ってみた!

こんにちは、こがらしです。

今回は、NTTドコモから開発者向けに提供されている文字認識APIの利用申請が完了したので早速試してみました。
試してみたというよりは、もともとこれを利用するつもりでいたのですが笑


この文字認識APIなんですが前は利用期限が5月までみたいになっていて、
自分が知ったときにはすでに期限が過ぎてて残念と思っていたのですが、この前ふと見てみると期限延長しました。
しかも、とりわけ期限がついていないっぽい?ということで申請をしていた次第です。

APIは非常にシンプルでした。
情景解析の場合は時間がかかるからかAPIが複数段になっていますが、非常に扱いやすいです。
基本的には、発行されたAPIキーと画像のURLを投げればOKといった感じです。

当たり前ちゃ当たり前なんですが、画像のサイズによっては時間が大幅にかかります。
早くても10秒とかなんで、そういう想定で使わないと駄目ですね。
また、文字自体のサイズもある程度の大きさでないと認識できなかったです(公式によると12pt以上らしい)

使った限りだと、カタカナは単純だからだと思いますがしっかり認識してくれました。
漢字は傾向がちょっとわからないですねー。とはいえ、文字の認識に辞書データを利用しているようなのでそこらへんが関係あるのかも知れません。
辞書に登録されていない単語は、一単語としては認識してはくれないご様子でした。

一般的でない単語の抽出に使う場合はちょっと難しいかも知れないですねー。
ざっくりとですが、使ってみた感想でした。

ではでは。