探索文件智慧的功能

2 分鐘

文件智慧依賴機器學習模型，而這些模型經過訓練可以辨識文字中的資料。擷取文字、版面配置和索引鍵/值組的功能稱為文件分析。文件分析可提供頁面上的文字位置 (由周框方塊座標所識別)。

A screenshot of a scanned receipt for the purchase of a Surface Pro and a Surface Pen.

收據 123 Main Street 上的資訊會儲存為 key, address 和 value, 123 Main Street。文件分析可以將欄位值的位置記錄為周框方塊座標 [4.1, 2.2], [4.3, 2.2], [4.3, 2.4], [4.1, 2.4] [4.1, 2.2], [4.3, 2.2], [4.3, 2.4], [4.1, 2.4]。機器學習模型可以解譯文件或表單中的資料，因為它們已經過訓練可以辨識周框方塊座標位置和文字中的模式。

自動執行分析文件程序的一個挑戰在於表單和文件以所有各種不同的格式存在。例如，雖然稅表和駕駛執照文件都包含個人的姓名，但姓名的周框方塊座標則不一樣。需要訓練個別的機器學習模型，才能為不同的表單和文件提供高品質的結果。透過這種方式，有時您也許能夠使用已根據常用的文件格式進行訓練的預先建置的機器學習模型。有時候，您可能需要自訂機器學習模型來辨識唯一的文件格式。

自動執行讀取文字和記錄資料的程序可以加快作業的速度、提供更好的客戶體驗、改善決策制定等等。接下來，您將探索如何使用 Azure AI 服務來實作文件智慧。

繼續

探索文件智慧的功能

意見反映