Microsoft Syntex 中的模型類型概觀

適用於: ✓ 所有自定義模型 |✓ 所有預先建置的模型

Microsoft Syntex 中的內容理解是從文件處理模型開始。 文件處理模型可讓您識別並分類上傳至 SharePoint 文檔庫的檔,然後從每個檔案擷取所需的資訊。

當套用至 SharePoint 文件庫時,模型與一個內容類型相關聯,且具有儲存所擷取資訊的欄標籤。 您建立的內容類型儲存在 SharePoint 內容類型庫中。 您也可以選擇使用現有內容類型來使用其架構。

Syntex 使用 自定義模型預先建置的模型

顯示 Syntex 自定義和預建模型類型的圖表。

模型可以是在內容中心建立的企業模型,或是在本機 SharePoint 網站上建立的本機模型

自訂模型

您選擇的自定義模型類型取決於您使用的檔案類型、檔案的格式和結構,以及您要套用模型的位置。

自訂模型包括:

若要檢視自定義模型中的並存差異,請參閱 比較自定義模型

當您建立自定義模型時,您將選取與模型類型相關聯的訓練方法。 例如,如果您想要建立非結構化文件處理模型,請在建立模型的 [ 模型建立選項 ] 頁面上,選擇 [ 教學方法 ] 選項。 下表顯示與每個自定義模型類型相關聯的訓練方法。


檔處理
多邊形
檔處理
結構化
檔處理
教學方法的磚。 手繪多邊形刪除方法的磚。 版面配置方法的磚。

注意事項

若要讓手繪多邊形選取方法和 Layout 方法選項可供使用者使用,必須先在 Microsoft 365 系統管理中心 中設定它們。

非結構化文件處理

使用非結構化文件處理模型自動分類檔,並從中擷取資訊。 它最適用於非結構化文件,如信件或合约。 這些文件必須具有可根據片語或模式識別的文字。 所識別的文字指定了檔案的類型(它的分類)和您想要擷取的內容(它的擷取器)。

例如,非結構化文件可以是可以用不同方式撰寫的合同續約函。 不過,資訊會一致地存在於每個合約續約檔的本文中,例如文字字串 “Service start date of” 後面接著實際日期。

此模型類型支援最廣泛的檔類型,並支持 超過40種語言

當您建立非結構化文件處理模型時,請使用 Teaching 方法 選項。

如需詳細資訊,請參閱 非結構化文件處理概觀

手繪多邊形文件處理

使用手繪多邊形文件處理模型,從非結構化和手繪多邊形文件自動擷取資訊,例如字母和合約,其中資訊可以出現在檔中的任何位置。

手繪多邊形文件處理模型會使用 Microsoft Power Apps AI Builder 在 Syntex 中建立和定型模型。

注意事項

手繪多邊形文件處理模型尚無法在某些區域中使用。 如需詳細資訊,請參閱 依區域的功能可用性

因為貴組織會從各種來源接收大量信件和檔,例如郵件、傳真和電子郵件,所以處理這些檔並手動將其輸入資料庫可能需要相當長的時間。 藉由使用 AI 從這些檔擷取文字和其他資訊,此模型會將此程式自動化。

當您不需要自動分類檔類型,且支持 超過 40 種語言時,此模型類型是 PDF 或影像檔中檔的最佳選項。

當您建立手繪多邊形文件處理模型時,請使用 手繪多邊形選取方法 選項。

如需詳細資訊,請參閱 結構化和手繪多邊形文件處理概觀

結構化文件處理

使用結構化文件處理模型自動識別欄位和數據表值。 最適合結構化或半結構化的檔,例如表單和發票。

結構化文件處理模型會使用 Microsoft Power Apps AI Builder 檔處理 (先前稱為表單處理) ,以在 Syntex 中建立和定型模型。

此模型類型支援 最廣泛的語言, 並已定型以從範例文件了解表單的版面配置,然後學習尋找從類似位置擷取所需的數據。 表單通常會有更結構化的配置,其中實體位於相同的位置 (例如,稅務窗體上的社會安全號碼) 。

當您建立結構化文件處理模型時,請使用 Layout 方法 選項。

如需詳細資訊,請參閱 結構化和手繪多邊形文件處理概觀

預先建立的模型

如果您不需要建置自定義模型,您可以使用已針對特定結構化檔定型 的預先建置文件處理模型

預先建置的模型包括:

[模型建立選項] 頁面的螢幕快照,其中顯示預先建置的模型選項。

預建模型已預先訓練能識別文件和文件中結構化的資訊。 不必從頭開始建立新自訂模型,您可以重複現有的預先訓練模型,以新增符合組織需求的特定欄位。

合約處理

合約處理模型會分析並擷取合約檔中的重要資訊。 API 會分析各種格式的合約,並擷取密鑰合約資訊,例如用戶端或合作物件名稱、帳單地址、管轄權和到期日。

如需預先建置合約處理模型的詳細資訊,請 參閱使用預先建置的模型從合約擷取資訊

發票處理

發票處理模型會分析並擷取銷售發票中的密鑰資訊。 API 會以各種格式分析發票,並擷取重要的發票資訊,例如客戶名稱、帳單位址、到期日和到期金額。

如需預先建置發票處理模型的詳細資訊,請 參閱使用預先建置的模型從發票擷取資訊

收據處理

預先建置的收據處理模型會分析並擷取銷售收據中的重要資訊。 API 會分析列印和手寫收據,並解壓縮重要收據資訊,例如商家名稱、商家電話號碼、交易日期、稅金和交易總額。

如需預建收據處理模型的詳細資訊,請參閱 使用預建模型從收據擷取資訊