視覺 API 服務的類型
適用於視覺的 Azure 認知服務是認知服務中最廣泛的類別之一。 您可以使用 API 在應用程式中納入視覺功能,例如影像分析、臉部偵測、空間分析和光學字元辨識(OCR),即使您對機器學習知識有限也一樣。
服務
以下是一些廣泛的視覺 API 類別:
- 電腦視覺 提供進階演算法,根據您感興趣的視覺功能來處理影像並傳回資訊。 它提供四項服務:OCR、臉部服務、影像分析和空間分析。 表格辨識器 是 OCR 的進階版本。
- 自訂視覺 是影像辨識服務,可用來建置、部署及改善您自己的映射標識符模型。
- 臉部服務 提供 AI 演算法,可偵測、辨識和分析影像中的人臉。
如何選擇服務
下列流程圖可協助您針對特定使用案例選擇視覺服務:
常見使用案例
電腦視覺
- 描述影像。 分析影像、評估偵測到的物件,併產生描述影像的人類可讀片語或句子。
- 標記視覺功能。 套用以數千個可辨識物件的集合為基礎的標記。
- 分類影像。 根據影像的內容分類影像。
- 實作 OCR。 偵測影像中的列印和手寫文字。
- 偵測影像類型。 例如,識別美工圖案影像或線條繪圖。
- 偵測色彩配置。 識別影像中的主要前景、背景和主要和輔色。
- 產生縮圖。 建立小型版本的映像。
- 仲裁內容。 偵測包含成人內容的影像或描繪古蘭場景。
- 偵測網域特定內容。 使用兩個特製化領域模型:
- 名人。 從體育、娛樂和商業領域識別成千上萬的知名名人。
- 地標。 識別著名的地標,如泰姬陵和自由女神像。
- 偵測物件。 識別通用物件,並傳回周框方塊的座標。
- 偵測品牌。 從現有資料庫中識別數千個全球公認的產品標誌的標誌。
- 偵測臉部。 偵測和分析影像中的人臉。 您可以決定主旨的年齡,並傳回指定臉部位置的周框方塊。 電腦視覺 服務的臉部分析功能是專用臉部服務所提供的臉部分析功能子集。
自訂視覺
- 分類影像。 根據一組稱為特徵的輸入來預測類別或類別。 計算每個可能類別的機率分數,並傳回一個標籤,指出物件最有可能所屬的類別。 若要使用此模型,您需要包含特徵及其標籤的數據。
- 偵測物件。 取得影像中物件的座標。 若要使用此模型,您需要包含特徵及其標籤的數據。
臉部服務
- 偵測臉部。 識別包含人臉的影像區域,通常是傳回周框方塊座標,形成臉部周圍的矩形。
- 分析臉部。 傳回資訊,例如面部地標(鼻子、眼睛、眉毛、嘴唇等等)。 您可以使用這些臉部地標作為特徵來定型機器學習模型,以推斷人員的相關信息,例如他們感知的年齡或情緒狀態。
- 辨識臉部。 定型機器學習模型,以識別臉部特徵中的已知個人。
參與者
本文由 Microsoft 維護。 原始投稿人如下。
主要作者:
- Ashish Chahuan |資深雲端解決方案架構師
- Kruti Mehta |Azure 資深快速追蹤工程師
其他投稿人:
- 米克·阿爾伯特 |技術寫入器
- Brandon Cowen |資深雲端解決方案架構師
- 奧斯卡·希馬布庫羅 |資深雲端解決方案架構師
- Manjit Singh |軟體工程師
- Christina Skarpathiotaki |資深雲端解決方案架構師
- 內森·維德普 |Azure 資深快速追蹤工程師
若要查看非公用LinkedIn配置檔,請登入LinkedIn。
下一步
- 什麼是電腦視覺?
- 視覺 API 部落格文章
- 學習路徑:使用 Azure 認知服務建立 Language Understanding 解決方案
- 學習路徑:布建和管理 Azure 認知服務
- 學習路徑:探索計算機視覺
- 學習路徑:使用 Azure 認知服務建立電腦視覺解決方案
- 學習路徑:使用 Azure IoT Edge 和 Azure 認知服務建立影像辨識解決方案
相關資源
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應