視覺 API 服務的類型

發行項
02/12/2024

適用於視覺的 Azure 認知服務是認知服務中最廣泛的類別之一。您可以使用 API 在應用程式中納入視覺功能，例如影像分析、臉部偵測、空間分析和光學字元辨識（OCR），即使您對機器學習知識有限也一樣。

服務

以下是一些廣泛的視覺 API 類別：

電腦視覺提供進階演算法，根據您感興趣的視覺功能來處理影像並傳回資訊。它提供四項服務：OCR、臉部服務、影像分析和空間分析。表格辨識器是 OCR 的進階版本。
自訂視覺是影像辨識服務，可用來建置、部署及改善您自己的映射標識符模型。
臉部服務提供 AI 演算法，可偵測、辨識和分析影像中的人臉。

如何選擇服務

下列流程圖可協助您針對特定使用案例選擇視覺服務：

常見使用案例

電腦視覺
- 描述影像。 分析影像、評估偵測到的物件，併產生描述影像的人類可讀片語或句子。
- 標記視覺功能。 套用以數千個可辨識物件的集合為基礎的標記。
- 分類影像。 根據影像的內容分類影像。
- 實作 OCR。 偵測影像中的列印和手寫文字。
- 偵測影像類型。 例如，識別美工圖案影像或線條繪圖。
- 偵測色彩配置。 識別影像中的主要前景、背景和主要和輔色。
- 產生縮圖。 建立小型版本的映像。
- 仲裁內容。 偵測包含成人內容的影像或描繪古蘭場景。
- 偵測網域特定內容。 使用兩個特製化領域模型：
  - 名人。 從體育、娛樂和商業領域識別成千上萬的知名名人。
  - 地標。 識別著名的地標，如泰姬陵和自由女神像。
- 偵測物件。 識別通用物件，並傳回周框方塊的座標。
- 偵測品牌。 從現有資料庫中識別數千個全球公認的產品標誌的標誌。
- 偵測臉部。 偵測和分析影像中的人臉。您可以決定主旨的年齡，並傳回指定臉部位置的周框方塊。電腦視覺服務的臉部分析功能是專用臉部服務所提供的臉部分析功能子集。
自訂視覺
- 分類影像。 根據一組稱為特徵的輸入來預測類別或類別。計算每個可能類別的機率分數，並傳回一個標籤，指出物件最有可能所屬的類別。若要使用此模型，您需要包含特徵及其標籤的數據。
- 偵測物件。 取得影像中物件的座標。若要使用此模型，您需要包含特徵及其標籤的數據。
臉部服務
- 偵測臉部。 識別包含人臉的影像區域，通常是傳回周框方塊座標，形成臉部周圍的矩形。
- 分析臉部。 傳回資訊，例如面部地標（鼻子、眼睛、眉毛、嘴唇等等）。您可以使用這些臉部地標作為特徵來定型機器學習模型，以推斷人員的相關信息，例如他們感知的年齡或情緒狀態。
- 辨識臉部。 定型機器學習模型，以識別臉部特徵中的已知個人。

參與者

本文由 Microsoft 維護。原始投稿人如下。

主要作者：

Ashish Chahuan |資深雲端解決方案架構師
Kruti Mehta |Azure 資深快速追蹤工程師

其他投稿人：

米克·阿爾伯特 |技術寫入器
Brandon Cowen |資深雲端解決方案架構師
奧斯卡·希馬布庫羅 |資深雲端解決方案架構師
Manjit Singh |軟體工程師
Christina Skarpathiotaki |資深雲端解決方案架構師
內森·維德普 |Azure 資深快速追蹤工程師

若要查看非公用LinkedIn配置檔，請登入LinkedIn。

共用方式為

視覺 API 服務的類型

服務

如何選擇服務

常見使用案例

參與者

下一步

意見反應

意見反應

其他資源

共用方式為

視覺 API 服務的類型

服務

如何選擇服務

常見使用案例

參與者

下一步

相關資源

意見反應

意見反應

其他資源