開始使用 Azure 上的 Vision Studio

已完成

從影像擷取文字的能力是由 Azure AI 視覺服務處理。 Azure AI 視覺中的其中一項服務是讀取 API。 您可以將讀取 API 視為 OCR 引擎,其可支援從影像、PDF 和 TIFF 檔案擷取文字。

讀取 API 使用最新的辨識模型,並針對具有大量文字或具有大量視覺雜訊的影像最佳化。 會考量文字行數、包含文字的影像以及手寫內容,自動判斷要使用的適當辨識模型。

Read API 的結果會依下列階層排列:

  • 頁面:每頁文字一頁,包括頁面大小和方向的相關資訊。
  • :頁面上的文字行。
  • 單字 - 文字行中的單字,包括週框方塊座標和文字本身。

每一行和每個字詞都包含周框方塊座標,以指出其在頁面中的位置。

Vision Studio 提供圖形化使用者介面,可讓您試用 Azure AI 視覺服務,而不需要撰寫任何程式碼。

建立 Azure 資源

若要使用 Azure AI 視覺服務,首先您必須在 Azure 訂用帳戶中為其建立資源。 您可使用下列兩種資源類型的任一種:

  • Azure AI 視覺:適用於視覺服務的特定資源。 如果不打算使用任何其他 AI 服務,或若想要分別追蹤 AI 視覺資源的使用量和成本,請使用此資源類型。
  • Azure AI 服務:包含 Azure AI 視覺和其他許多 Azure AI 服務的一般資源,例如 Azure AI 語言、Azure AI 語音等等。 如果打算使用多項 Azure AI 服務,且想要簡化系統管理和開發作業,請使用此資源類型。