開始使用 Azure 的收據分析
Azure AI 檔案智慧 是由依模型類型分組的功能所組成:
- 預先建置的模型 - 預先定型的模型,這些模型已建置以處理常見的檔類型,例如發票、名片、標識符檔等等。 這些模型是設計來辨識和擷取每個文件類型很重要的特定字段。
- 自定義模型 - 可以定型,以識別未包含在現有預先定型模型中的特定欄位。
- 檔分析 - 傳回結構化數據表示法的一般檔分析,包括感興趣的區域及其相互關聯性。
預建模型
預先建置的模型會套用進階機器學習服務,以便從表體和檔中準確識別和擷取文字、索引鍵/值組、數據表和結構。 這些功能包括擷取:
- 發票中的客戶和廠商詳細數據
- 收據中的銷售和交易詳細數據
- 身分識別文件的識別和驗證詳細數據
- 醫療保險詳細數據
- 商務聯繫人詳細數據
- 合約和合約的合作對象詳細數據
- 應稅補償、抵押貸款利息、學生貸款詳細數據等
例如,請考慮預先建置的收據模型。 它會處理收據的方式如下:
- 比對功能變數名稱與值
- 識別數據數據表
- 識別特定欄位,例如日期、電話號碼、地址、總計和其他欄位
收據模型已經過定型,以辨識數種不同收據類型的數據,例如熱收據(列印在熱敏感紙上)、酒店收據、煤氣收據、信用卡收據和停車收據。
辨識的欄位包括:
- 商家的名稱、地址和電話號碼
- 購買的日期和時間
- 購買之每個專案的名稱、數量和價格
- 總計、小計和稅務值
每個欄位和數據組都有信賴等級,表示精確度的可能層級。 這可以用來自動識別人員何時需要驗證收據。
根據收據類型,模型已定型以辨識數種不同的語言。 若要在使用預先建置的收據模型時獲得最佳結果,影像應該是:
- JPEG、PNG、BMP、PDF 或 TIFF 格式
- 付費 (S0) 層的檔案大小小於 500 MB,免費 4 MB(F0) 層
- 介於 50 x 50 像素和 10000 x 10000 像素之間
- PDF 文件不得超過 17 英吋 x 17 英吋
- 每份檔一張收據
您可以開始使用 Document Intelligence Studio 中的定型模型、測試檔分析的使用者介面、預先建置的模型,以及建立自定義模型。
Azure AI 檔智能資源
若要使用 Azure AI 檔智慧,請在 Azure 訂用帳戶中建立 Document Intelligence 或 Azure AI 服務 資源。 如果您之前尚未使用文件智慧,請在建立資源時選取免費層。 免費層有一些限制,例如,只有前兩個頁面會針對 PDF 或 TIFF 檔進行處理。
建立資源之後,您可以建立用戶端應用程式,以使用其 密鑰 和 端點 來連接表單進行分析,或使用 Document Intelligence Studio 中的資源。