Microsoft Syntex 中非結構化文件處理的概觀

注意事項

到 2024 年 6 月,如果您已設定隨用隨付 計費 ,您可以免費試用非結構化文件處理和其他選取的 Syntex 服務。 如需相關信息和限制,請參閱試用 Microsoft Syntex 並探索其服務

使用非結構化文件處理模型 (教學方法) 自動分類檔案和擷取資訊。 最適合用於非結構化檔,例如字母或合約。

注意事項

Microsoft 尊重您用來在 Syntex 中定型和處理模型之數據的隱私權和擁有權。 Microsoft 不會使用或傳輸任何組織的數據來訓練 AI 模型、大型語言模型或任何其他模型。 您的數據會安全地保留在組織的租用戶內。 如需詳細資訊,請參閱 Microsoft 數據保護和隱私權

非結構化模型簡介

非結構化文件處理模型 (先前稱為 文件瞭解模型 ,) 使用人工智慧 (AI) 來處理檔。 這些文件必須具有可根據片語或模式識別的文字。 所識別的文字指定了檔案的類型(它的分類)和您想要擷取的內容(它的擷取器)。

注意事項

如需如何使用 Syntex 和案例範例的詳細資訊,請參閱開始推動採用 Microsoft Syntex 和案例,以及 Microsoft Syntex 的使用案例

非結構化文件處理模型是在稱為 內容中心的 SharePoint 網站類型中建立和管理。 當套用至 SharePoint 文件庫時,模型與一個具有存儲所擷取資訊的欄的內容類型相關聯。 您建立的內容類型儲存在 SharePoint 內容類型庫中。 您也可以選擇使用現有內容類型來使用其架構。

注意事項

唯讀或密封的內容類型無法更新,因此無法在模型中使用。

分類器擷取器 新增至非結構化文件處理模型,以執行下列動作:

  • 分類器用來識別和分類上傳至文件庫的文件。 例如,可以「訓練」分類器來識別上傳到文件庫的所有合同續約文件。 合同續約內容類型由您在建立分類器時定義。

  • 擷取器從這些文件中選取資訊。 例如,針對您文檔庫中識別的每個合約續約檔,數據行會顯示每個文件 的服務開始日期客戶 端。

您可以在模型中使用範例檔案來訓練和測試分類器和擷取器。 範例檔案向您的模型範例提供在嘗試從檔案中識別和擷取資料時要查找的內容。 例如,您會以貴公司使用的合同續約文件範例來訓練您的合同續約分類器和擷取器。 您也可以使用範例檔案來測試模型的有效性。

發佈模型之後,請使用內容中心將它套用到您有權存取的任何 SharePoint 文件庫。

需求和限制

如需選擇此模型時要考慮之需求的相關信息,請參閱 Microsoft Syntex 中模型的需求和限制