事前構築済みモデルを使用して Microsoft Syntex の領収書から情報を抽出する
Microsoft Syntex の レシート事前構築済みモデル では、売上レシートから重要な情報が分析および抽出されます。 API は、印刷されたレシートと手書きの領収書を認識し、マーチャント名、マーチャント電話番号、取引日、税金、トランザクションの合計などの キーレシート情報を抽出します。 レシートは、印刷や手書きのレシートなど、さまざまな形式と品質にすることができます。
レシート モデルを使用するには、次の手順に従います。
手順 1: レシート モデルを作成する
「Syntex でモデルを作成する」の手順に従って、事前構築済みのレシート モデルを作成します。 次に、次の手順に進み、モデルを完了します。
手順 2: 分析するサンプル ファイルをアップロードする
[ モデル ] ページの [ 分析するファイルの追加] セクションで、[ ファイルの追加] を選択します。
[ モデルを分析するファイル ] ページで、[ 追加 ] を選択して、使用するファイルを見つけます。
[ トレーニング ファイル ライブラリからファイルを追加する] ページで、ファイル を選択し、[ 追加] を選択します。
[ モデルを分析するファイル] ページで 、[ 次へ] を選択します。
手順 3: モデルの抽出器を選択する
[エクストラクターの詳細] ページの右側にドキュメント領域が表示され、左側に [エクストラクター ] パネルが表示されます。 [ 抽出器 ] パネルには、ドキュメントで識別された抽出器の一覧が表示されます。
ドキュメント領域で緑色で強調表示されているエンティティ フィールドは、ファイルを分析したときにモデルによって検出された項目です。 抽出するエンティティを選択すると、強調表示されたフィールドが青に変わります。 後でエンティティを含めないことを決定した場合、強調表示されたフィールドは灰色に変わります。 強調表示により、選択したエクストラクターの現在の状態を簡単に確認できます。
ヒント
マウスのスクロール ホイールまたはドキュメント領域の下部にあるコントロールを使用して、エンティティ フィールドを読み取るために必要に応じて拡大または縮小できます。
抽出エンティティを選択する
好みに応じて、ドキュメント領域または抽出パネルから 抽出器 を選択できます。
ドキュメント領域から抽出器を選択するには、エンティティ フィールドを選択します。
[抽出 器] パネル から抽出器を選択するには、エンティティ名の右側にあるチェック ボックスをオンにします。
抽出器を選択すると、ドキュメント領域に [抽出器の選択] ボックスが表示されます。 ボックスには、抽出元の名前、元の値、および抽出器として選択するオプションが表示されます。 数値や日付などの特定のデータ型の場合、抽出された値も表示されます。
元の値は、ドキュメント内の実際の値です。 抽出された値は、SharePoint の列に書き込まれるものです。 モデルをライブラリに適用する場合は、列の書式設定を使用して、ドキュメント内で表示する方法を指定できます。
引き続き、使用する追加の抽出器を選択します。 他のファイルを追加して、このモデル構成を分析することもできます。
抽出子の名前を変更する
エクストラクターの名前は、モデルのホーム ページまたは [エクストラクター ] パネルから変更できます。 モデルをライブラリに適用すると、これらの名前が列名として使用されるため、選択したエクストラクターの名前を変更することを検討できます。
モデルのホーム ページからエクストラクターの名前を変更するには:
[ Extractors ] セクションで、名前を変更する抽出器を選択し、[ 名前の変更] を選択します。
[ エンティティ抽出の名前の変更 ] パネルで、抽出元の新しい名前を入力し、[ 名前の変更] を選択します。
[エクストラクター] パネルからエクス トラクター の名前を変更するには:
名前を変更する抽出器を選択し、[名前の 変更] を選択します。
[ 抽出元の名前の変更 ] ボックスに、抽出元の新しい名前を入力し、[ 名前の変更] を選択します。
手順 4: モデルを適用する
変更を保存してモデルのホーム ページに戻すには、[ エクストラクター ] パネルで [ 保存して終了] を選択します。
モデルをライブラリに適用する準備ができたら、ドキュメント領域で [ 次へ] を選択します。 [ ライブラリに追加 ] パネルで、モデルを追加するライブラリを選択し、[ 追加] を選択します。