Share via


Document Intelligence クレジット カード モデル

このコンテンツの適用対象: checkmarkv4.0 (プレビュー)checkmark

Document Intelligence クレジット/デビット カード モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、クレジット カードとデビット カードの主要なフィールドを分析して抽出します。 クレジット カードとデビット カードは、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質である可能性があります。 API によってドキュメントのテキストが分析され、カード番号、発行銀行、有効期限などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、英語のドキュメント形式がサポートされています。

カードの自動処理

クレジット/デビット カードの自動処理は、銀行のカードからキー フィールドを抽出するプロセスです。 これまで、銀行カード分析プロセスは手動で行われてきたため、非常に時間がかかっていました。 銀行カードからキー データを正確に抽出することは、通常、契約の自動化プロセスの最初にして最も重要な手順の 1 つです。

開発オプション

Document Intelligence v4.0 (2024-02-29-preview) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
コントラクト モデル ドキュメントインテリジェンススタジオ
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-creditCard

入力の要件

  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML
    既読
    Layout ✔ (2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-02-29-preview)
  • PDF および TIFF の場合、最大 2000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1GB で、最大 10,000 ページです。

クレジット カードのデータ抽出

クレジット/デビット カード サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

Document Intelligence Studio

  1. Document Intelligence Studio ホーム ページで、[クレジット/デビット カード] を選択します。

  2. サンプルの税務書類を分析したり、独自のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

    Document Intelligence Studio の [分析の実行] と [分析オプション] ボタンのスクリーンショット。

サポートされている言語とロケール

以下の参照、サポートされている言語の完全なリストについては、 語サポート—の事前構築済みモデル ページをご覧ください。

フィールドの抽出

JSON 出力応答で契約書から抽出されたフィールドを次に示します。

名前 種類 説明 出力例
CardNumber String カードの一意の識別子 4275 0000 0000 0000
IssuingBank String カードを発行した銀行の名前 Woodgrove Bank
PaymentNetwork String カード取引を処理する支払いネットワーク VISA
CardHolderName String カードの所有者の名前 JOHN SMITH
CardHolderCompanyName String カードが関連付けられている会社の名前 Contoso, Ltd.
ValidDate 有効期間の開始日 01/16
ExpirationDate 有効期限 01/19
CardVerificationValue String セキュリティ コード (CVV) 764
CustomerServicePhoneNumbers Array サポート番号の一覧 +1 (555) 123-4567

抽出された銀行カードのキーと値のペアと項目は、JSON 出力の documentResults セクションにあります。

次のステップ