開始使用 Azure 的收據分析

已完成

Azure AI 檔案智慧 是由依模型類型分組的功能所組成:

  • 預先建置的模型 - 預先定型的模型,這些模型已建置以處理常見的檔類型,例如發票、名片、標識符檔等等。 這些模型是設計來辨識和擷取每個文件類型很重要的特定字段。
  • 自定義模型 - 可以定型,以識別未包含在現有預先定型模型中的特定欄位。
  • 檔分析 - 傳回結構化數據表示法的一般檔分析,包括感興趣的區域及其相互關聯性。

預建模型

預先建置的模型會套用進階機器學習服務,以便從表體和檔中準確識別和擷取文字、索引鍵/值組、數據表和結構。 這些功能包括擷取:

  • 發票中的客戶和廠商詳細數據
  • 收據中的銷售和交易詳細數據
  • 身分識別文件的識別和驗證詳細數據
  • 醫療保險詳細數據
  • 商務聯繫人詳細數據
  • 合約和合約的合作對象詳細數據
  • 應稅補償、抵押貸款利息、學生貸款詳細數據等

例如,請考慮預先建置的收據模型。 它會處理收據的方式如下:

  • 比對功能變數名稱與值
  • 識別數據數據表
  • 識別特定欄位,例如日期、電話號碼、地址、總計和其他欄位

收據模型已經過定型,以辨識數種不同收據類型的數據,例如熱收據(列印在熱敏感紙上)、酒店收據、煤氣收據、信用卡收據和停車收據。

辨識的欄位包括:

  • 商家的名稱、地址和電話號碼
  • 購買的日期和時間
  • 購買之每個專案的名稱、數量和價格
  • 總計、小計和稅務值

每個欄位和數據組都有信賴等級,表示精確度的可能層級。 這可以用來自動識別人員何時需要驗證收據。

根據收據類型,模型已定型以辨識數種不同的語言。 若要在使用預先建置的收據模型時獲得最佳結果,影像應該是:

  • JPEG、PNG、BMP、PDF 或 TIFF 格式
  • 付費 (S0) 層的檔案大小小於 500 MB,免費 4 MB(F0) 層
  • 介於 50 x 50 像素和 10000 x 10000 像素之間
  • PDF 文件不得超過 17 英吋 x 17 英吋
  • 每份檔一張收據

您可以開始使用 Document Intelligence Studio 中的定型模型、測試檔分析的使用者介面、預先建置的模型,以及建立自定義模型。

Azure AI 檔智能資源

若要使用 Azure AI 檔智慧,請在 Azure 訂用帳戶中建立 Document IntelligenceAzure AI 服務 資源。 如果您之前尚未使用文件智慧,請在建立資源時選取免費層。 免費層有一些限制,例如,只有前兩個頁面會針對 PDF 或 TIFF 檔進行處理。

建立資源之後,您可以建立用戶端應用程式,以使用其 密鑰端點 來連接表單進行分析,或使用 Document Intelligence Studio 中的資源。