Document Intelligence 給与明細モデル
Document Intelligence 給与明細モデルでは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルの組み合わせにより、給与明細書が分析されて、報酬や収益に関するデータが抽出されます。 API により、給与に関する情報が含まれる文書やファイルを分析し、重要な情報を抽出して、構造化された JSON データ表現を返します。
機能 | version | モデル ID |
---|---|---|
給与明細モデル | • v4.0:2024-07-31 (プレビュー) | prebuilt-payStub.us |
給与明細データの抽出を試行する
給与明細は、従業員に対して雇用主が発行する重要な文書であり、特定の支払い期間における収益、控除、および純支払い額に関する情報が記載されています。 prebuilt-payStub.us
モデルを使用してデータを抽出する方法について説明します。 以下のリソースが必要です。
Azure サブスクリプション — 無料で作成することができます
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (
F0
) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
Document Intelligence Studio
Document Intelligence Studio ホーム ページで、[payStub] を選択します。
サンプルの給与明細を分析したり、ご自身のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:
入力の要件
サポートされているファイル形式:
モデル PDF 画像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML読み込み ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview) 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ カスタム抽出 ✔ ✔ カスタム分類 ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview) 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは
4
MB です。画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約
8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は
1
GB です。カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1
GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは2
GB で、最大 10,000 ページです。
サポートされている言語とロケール
以下を参照して、サポートされている言語の完全なリストについては、 言語サポートの ページ をご覧ください。
フィールドの抽出
名前 | 種類 | 説明 | 標準化された出力 |
---|---|---|---|
EmployeeAddress |
address |
従業員の住所 | 123 Maple Street, Springfield, IL, 62701 |
EmployeeName |
string |
従業員の氏名 | John A. Doe |
EmployeeSSN |
string |
従業員の社会保障番号 | 123-45-6789 |
EmployerAddress |
address |
雇用主の住所 | 456 Oak Avenue, Metropolis, NY, 10101 |
EmployerName |
string |
雇用主の名前一覧 | Contoso Corporation |
PayDate |
date |
給与支払日 | 2020 年 2 月 26 日 |
PayPeriodStartDate |
date |
支払期間の開始日 | 2020 年 2 月 19 日 |
PayPeriodEndDate |
date |
支払期間の終了日 | 2020 年 2 月 25 日 |
CurrentPeriodGrossPay |
number |
当該期間の給与総額 | $744.10 |
YearToDateGrossPay |
number |
当年度累計給与総額 | $2744.10 |
CurrentPeriodTaxes |
number |
当該期間の税額 | $410.10 |
YearToDateTaxes |
number |
当年度累計累計税額 | $855.90 |
CurrentPeriodDeductions |
number |
当該期間の控除額 | $410.10 |
YearToDateDeductions |
number |
当年度累計控除額 | $855.90 |
CurrentPeriodNetPay |
number |
当該期間の純支払額 | $744.10 |
YearToDateNetPay |
number |
当年度累計純支払額 | $2744.10 |
サポート対象のロケール
prebuilt-payStub.us バージョン 2027-07-31-preview では、en-us ロケールがサポートされています。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。