探索用來讀取文字的 Azure AI 視覺選項

已完成

Azure AI 提供兩種不同的功能,可從檔和影像讀取文字,一個是 Azure AI 視覺服務,另一個是 Azure AI 檔智慧。 每個服務所提供的內容有重迭,但每個服務都會根據輸入的內容,針對結果進行優化。

  • 影像分析 光學字元辨識 (OCR):
    • 針對包含文字的一般、非結構化檔,或包含文字的影像,使用此功能。
    • 結果會立即從單一 API 呼叫傳回(同步)。
    • 具有分析影像過去的擷取文字的功能,包括物件偵測、描述或分類影像、產生智慧裁剪的縮圖等等。
    • 範例包括:街道標誌、手寫筆記和商店標誌。
  • 檔智慧
    • 使用此服務可從影像和 PDF 檔讀取少量到大量的文字。
    • 此服務會使用檔的內容和結構來改善精確度。
    • 初始函式呼叫會傳回非同步作業識別碼,此識別碼必須在後續呼叫中用來取得結果。
    • 範例包括:收據、發行項和發票。

您可以透過 REST API 或用戶端程式庫來存取這兩種技術。 在本課程模組中,我們將著重于影像分析 中的 OCR 功能。 如果您想要深入瞭解 檔智慧 閱讀本課程模組 將提供良好的簡介。