編輯

共用方式為


Azure 上的影像分類

Azure Blob 儲存體
Azure 電腦視覺
Azure Cosmos DB
Azure Event Grid
Azure Functions

解決方案構想

本文說明解決方案概念。 您的雲端架構設計人員可以使用本指南,協助可視化此架構的一般實作的主要元件。 使用本文作為起點,設計符合您工作負載特定需求的架構良好解決方案。

藉由使用 azure 服務,例如 電腦視覺 API 和 Azure Functions,公司就不需要管理個別伺服器,同時降低成本,並利用Microsoft利用 Azure AI 服務處理影像所開發的專業知識。 此解決方案概念特別解決了影像處理使用案例。 如果您有不同的 AI 需求,請考慮完整的 Azure AI 服務套件

架構

用於影像分類工作的架構圖表。

下載此解決方案構想的 Visio 檔案

資料流程

此案例涵蓋 Web 或行動應用程式的後端元件。 整個案例的資料流程如下所示:

  1. 在 Blob 記憶體中新增檔案(影像上傳)會觸發 Azure 事件方格 中的事件。 上傳程式可以透過 Web 或行動應用程式進行協調。 或者,您可以將映像個別上傳至 Azure Blob 記憶體。
  2. 事件方格會傳送觸發 Azure 函式的通知。
  3. Azure Functions 會呼叫 Azure AI 視覺 API 來分析新上傳的影像。 Azure AI 視覺會透過 Azure Functions 剖析的 Blob URL 來存取影像。
  4. Azure Functions 會在 Azure Cosmos DB 中保存 AI 視覺 API 回應。 此回應包含分析的結果,以及影像元數據。
  5. 結果可以取用並反映在 Web 或行動前端上。 請注意,此方法會擷取分類的結果,但不會擷取上傳的影像。

元件

  • Azure AI 視覺 是 Azure AI 服務套件的一部分,可用來擷取每個映像的相關信息。
  • Azure Functions 提供 Web 應用程式的後端 API。 此平臺也提供上傳影像的事件處理。
  • Azure 事件方格 將新映射上傳至 Blob 記憶體時觸發事件。 接著會使用 Azure Functions 處理映像。
  • Azure Blob 儲存體 會儲存上傳至 Web 應用程式的所有影像檔,以及 Web 應用程式取用的任何靜態檔案。
  • Azure Cosmos DB 會儲存每個上傳映像的相關元數據,包括來自 電腦視覺 API 的處理結果。

替代項目

  • Azure OpenAI GPT-4 Turbo with Vision (預覽版) 。 GPT-4 Turbo with Vision 是一種多模式模型,可分析影像並回答其相關問題。
  • 自訂視覺 服務。 電腦視覺 API 會傳回一組分類法型類別。 如果您需要處理 電腦視覺 API 未傳回的資訊,請考慮 自訂視覺 服務,這可讓您建置自定義映射分類器。
  • Azure AI 搜尋 服務(先前稱為 Azure 搜尋服務)。 如果您的使用案例牽涉到查詢元數據以尋找符合特定準則的影像,請考慮使用 Azure AI 搜尋。 Azure AI 搜尋 可順暢地整合此工作流程。
  • 邏輯應用程式。 如果您不需要在將檔案即時新增至 Blob 時做出反應,您可能會考慮使用 Logic Apps。 邏輯應用程式,可檢查檔案是否已由週期觸發程式或滑動視窗觸發程序啟動
  • 如果您有內嵌在檔中的影像,請使用 Azure AI 檔智慧 來找出這些影像。 透過該資訊,您可以在內嵌影像上擷取並執行進一步的電腦視覺工作。 使用文件智慧收集這些內嵌影像的相關數據,例如頁碼或標題文字,可以連同透過 電腦視覺 API 接收之影像的其他元數據一起儲存。

案例詳細資料

此案例與需要處理映像的企業相關。

潛在的應用程式包括分類時尚網站的影像、分析保險索賠的文字和影像,或從遊戲螢幕快照瞭解遙測數據。 傳統上,公司必須開發機器學習模型的專業知識、定型模型,最後透過其自定義程序執行映像,以將數據從影像中取出。

潛在使用案例

此解決方案適用於零售、遊戲、金融和保險產業。 其他相關的使用案例包括:

  • 分類時尚網站上的影像。 銷售人員可在平臺上上傳產品圖片以供銷售時使用影像分類。 然後,他們可以自動化相關的後續手動標記。 客戶也可以搜尋產品的視覺印象。

  • 從遊戲螢幕快照分類遙測數據。 螢幕快照中的視頻遊戲分類正在演變成社交媒體中的相關問題,再加上計算機視覺。 例如,當 Twitch 串流機連續播放不同的遊戲時,他們可能會略過手動更新其串流資訊。 無法更新串流資訊可能會導致使用者搜尋中的串流分類錯誤,並可能導致內容建立者和串流平臺的潛在查看器遺失。 在引進新遊戲時,自定義模型路線有助於引進從這些遊戲偵測新影像的功能。

  • 分類保險理賠的影像。 影像分類有助於縮短索賠處理和承銷的時間和成本。 它可以説明分析自然災害損壞、車輛損壞,以及識別住宅和商業財產。

下一步

產品文件

如需引導式學習路徑,請參閱:

搭配影像和文字處理使用 AI 擴充