Microsoft Syntex での事前構築済みドキュメント処理の概要
注:
2025 年 6 月まで、 従量課金制の課金 が設定されている場合は、事前構築済みのドキュメント処理やその他の選択された Syntex サービスを無償で試すことができます。 詳細と制限事項については、「 Microsoft Syntex を試してサービスを調べる」を参照してください。
Microsoft Syntex には、 カスタム モデルに加えて、情報の抽出を自動化するための 事前構築済みモデル が用意されています。
注:
Microsoft は、Syntex でモデルをトレーニングおよび処理するために使用するデータのプライバシーと所有権を尊重します。 組織のデータは、AI モデル、大言語モデル、またはその他のモデルをトレーニングするために Microsoft によって使用または転送されることはありません。 データは、組織のテナント内に安全に残ります。 詳細については、「 Microsoft データ保護とプライバシー」を参照してください。
事前構築済みモデルの概要
事前構築済みドキュメント処理では、事前構成済 みのモデル を使用して、ドキュメントとドキュメント内の構造化情報を認識します。 新しいカスタム モデルをゼロから作成する代わりに、既存の事前トレーニング済みモデルを反復処理して、組織のニーズに合った特定のフィールドを追加できます。
事前構築済みモデルでは、光学式文字認識 (OCR) とディープ ラーニング モデルを組み合わせて使用して、特定のドキュメントの種類に共通する定義済みのテキストフィールドとデータ フィールドを識別および抽出します。 まず、事前構築済みモデルに対してファイルの 1 つを分析します。 次に、目的に適した検出されたフィールドを選択します。 モデルで必要なフィールドが検出されない場合は、別のファイルを使用してもう一度分析できます。
他のモデルと同様に、事前構築済みのモデルは コンテンツ センターで作成および管理されます。 SharePoint ドキュメント ライブラリに適用すると、モデルはコンテンツ タイプに関連付けられます。また、抽出される情報を格納する列があります。
モデルを公開したら、コンテンツセンターを使用して、アクセスできる SharePoint ドキュメントライブラリにモデルを適用します。
使用可能な事前構築済みモデル
現時点では、契約、請求書、領収書、機密情報の 4 つの事前構築済みモデルを使用できます。
契約。 事前構築済みの コントラクト モデル では、コントラクト ドキュメントの重要な情報が分析および抽出されます。 API は、さまざまな形式でコントラクトを分析し、クライアント名と住所、契約期間、更新日などの主要なコントラクト情報を抽出します。
請求 書。 請求書の事前構築済みモデルでは、売上請求書からキー情報が分析および抽出されます。 API は、さまざまな形式で請求書を分析し、顧客名、請求先住所、期日、支払金額などの 主要な請求書情報を抽出 します。
収入。 レシートの事前構築済みモデルでは、売上受領書から重要な情報が分析および抽出されます。 API は、印刷されたレシートと手書きの領収書を分析し、マーチャント名、マーチャント電話番号、取引日、税金、取引合計などの キーレシート情報を抽出 します。
機密情報。 機密情報の事前構築済みモデルは、ドキュメントのキー情報を分析、検出、抽出します。 API は、ドキュメントをさまざまな形式で分析し、個人と財務の識別番号、物理的および電子メール アドレス、電話番号などの 重要な機密情報を検出して抽出します。
追加の事前構築済みモデルは、今後のリリースで利用できるようになります。
要件と制限事項
このモデルを選択するときに考慮すべき要件については、「 Microsoft Syntex のモデルの要件と制限事項」を参照してください。