まず、Tesseract OCRをインストールします。利用OSがMacOSの場合は、以下のコマンドを実行してください。 $ brew install tesseract $ brew install tesseract-lang その他のOSに関しては、Apache Tikaのサイトを参照してください。 PDFでOCRを適用する設定 PDFに対してもOCRを適用する ...
今回はオープンソースでマルチプラットフォームのOCRエンジンであるTesseract OCRを使用し、 読み取り精度を確認してみます。 UbuntuでOCR? 「日本語でOCR」 と聞くと、 プロプライエタリの牙城というか、 高価なソフトを購入しないと実用に耐えないという ...