OCR技術紹介セミナー


本資料は2021年1月14日に社内共有資料として展開していたものを

WEBページ向けにリニューアルした内容になります。



■目次

 
  • OCRとは

  • OCRの出力形式

  • OCRの種類

  • 文字の種類

  • OCRのパッケージの紹介



■OCRとは

 
  • OCRは【Optical Character Recognition】の頭文字を取ったもの。

  • 画像データのテキスト部分を認識しテキストデータとして出力する。




■OCRの出力形式

 
OCRの出力形式は大きく分けて2通りある

①出力したテキストと項目の対応はつけない形式 非定型帳票パッケージの出力形式。


②出力したテキストと項目の対応をつける形式(キーバリュー形式。

構造化されたデータともよんでいる) 定型帳票パッケージ、

請求書パッケージ等の出力形式 顧客は②の形式を欲している場合が多い。