使用 Azure Document Intelligence Studio

已完成

除了 SDK 和 REST API 之外,Azure Document Intelligence 服務還可以透過名為 Azure Document Intelligence Studio 的使用者介面來存取,這是一種在線工具,可讓您以可視化方式探索、瞭解及整合 Azure Document Intelligence 服務的功能。 Studio 可用來分析表單配置、從預先建置的模型擷取數據,以及定型自定義模型。

Azure Document Intelligence Studio 功能的 Gif。

Azure Document Intelligence Studio 目前支援下列專案:

  • 檔分析模型
    • 閱讀:從文件和影像中擷取印刷和手寫文字行、文字、位置及所偵測的語言。
    • 版面配置:從檔擷取文字、表格、選取標記和結構資訊(PDF 和 TIFF)和影像(JPG、PNG 和 BMP)。
    • 一般文件:從文件中擷取索引鍵/值組、選取標記和實體。
  • 預建模型
  • 自訂模型

建置文件分析模型專案

若要使用檔分析模型擷取文字、數據表、結構、索引鍵/值組和具名實體:

  • 建立 Azure Document Intelligence 或 Foundry Tools 資源
  • 選取 [檔案分析模型] 類別下的 [讀取]、[版面配置] 或 [一般檔]
  • 分析您的文件。 你需要 Azure Document Intelligence 或 Foundry Tools 的端點和金鑰。

建置預先建置的模型專案

若要從具有預先建置模型的通用窗體擷取數據:

  • 建立 Azure 文件智慧或 Foundry 工具資源
  • 選取其中一個「預建模型」,包括 W-2、發票、收據、標識符檔、健康保險、疫苗接種和名片。
  • 分析您的文件。 你需要 Azure Document Intelligence 或 Foundry Tools 的端點和金鑰。

建置自定義模型專案

您可以使用 Azure Document Intelligence Studio 的自定義服務,進行訓練和測試自定義模型的整個過程。

當您使用 Azure Document Intelligence Studio 來建置自定義模型時,會自動在記憶體帳戶中建立和儲存定型所需的 ocr.json 檔案、labels.json 檔案和 fields.json 檔案。

若要定型自定義模型,並用它來擷取自定義模型的數據:

  • 創建 Azure 文件智能或 Foundry 工具資源
  • 收集至少 5-6 個範例表單進行訓練,並將其上傳至您的儲存帳戶容器。
  • 設定跨網域資源分享 (CORS)。 CORS 可讓 Azure Document Intelligence Studio 將已標記的檔案儲存在記憶體容器中。
  • 在 Azure Document Intelligence Studio 中建立自定義模型專案。 你需要提供將儲存容器與 Azure Document Intelligence 或 Foundry Tools 資源連結到專案的設定。
  • 使用 Azure Document Intelligence Studio 將標籤套用至文字。
  • 訓練您的模型。 模型訓練完成後,您會收到模型標識碼及標籤的平均精確度。
  • 藉由分析未用於訓練的新表格來測試模型。