探索用來讀取文字的 Azure AI 視覺選項

3 分鐘

Azure AI 提供兩種不同的功能，可從檔和影像讀取文字，一個是 Azure AI 視覺服務，另一個是 Azure AI 檔智慧。每個服務所提供的內容有重迭，但每個服務都會根據輸入的內容，針對結果進行優化。

影像分析 光學字元辨識（OCR）：
- 針對包含文字的一般、非結構化檔，或包含文字的影像，使用此功能。
- 結果會立即從單一 API 呼叫傳回（同步）。
- 具有分析影像過去的擷取文字的功能，包括物件偵測、描述或分類影像、產生智慧裁剪的縮圖等等。
- 範例包括：街道標誌、手寫筆記和商店標誌。
檔智慧 ：
- 使用此服務可從影像和 PDF 檔讀取少量到大量的文字。
- 此服務會使用檔的內容和結構來改善精確度。
- 初始函式呼叫會傳回非同步作業識別碼，此識別碼必須在後續呼叫中用來取得結果。
- 範例包括：收據、發行項和發票。

您可以透過 REST API 或用戶端程式庫來存取這兩種技術。在本課程模組中，我們將著重于影像分析中的 OCR 功能。如果您想要深入瞭解 檔智慧 ，閱讀本課程模組將提供良好的簡介。