はじめに

完了

A screenshot showing bounding boxes around words in an advert.

道路標識、広告、黒板に書かれた文字の画像ファイルがあるとします。 マシンでは、"光学式文字認識" (OCR) (画像内の単語を機械で読み取ることができるテキストに処理する人工知能 (AI) の機能) を使って画像内のテキストを読み取ることができます。

このモジュールでは、OCR テクノロジを使用して画像内のテキストを検出し、テキストベースのデータ形式に変換することに注目します。これにより、さらに処理や解析を行うための入力として保存、印刷、使用できるようになります。

OCR の使用

テキスト処理を自動化すると、手動でデータを入力する必要がなくなり、作業の速度と効率が向上します。 画像内の印刷されたテキストや手書きのテキストを認識する機能は、メモ取り、医療記録や履歴ドキュメントのデジタル化、銀行預金用の小切手のスキャンなどを行う際に役立ちます。