共用方式為


視覺 API 服務的類型

適用於視覺的 Azure 認知服務是認知服務中最廣泛的類別之一。 您可以使用 API 在應用程式中納入視覺功能,例如影像分析、臉部偵測、空間分析和光學字元辨識(OCR),即使您對機器學習知識有限也一樣。

服務

以下是一些廣泛的視覺 API 類別:

  • 電腦視覺 提供進階演算法,根據您感興趣的視覺功能來處理影像並傳回資訊。 它提供四項服務:OCR、臉部服務、影像分析和空間分析。 表格辨識器 是 OCR 的進階版本。
  • 自訂視覺 是影像辨識服務,可用來建置、部署及改善您自己的映射標識符模型。
  • 臉部服務 提供 AI 演算法,可偵測、辨識和分析影像中的人臉。

如何選擇服務

下列流程圖可協助您針對特定使用案例選擇視覺服務:

Diagram that shows how to choose a vision service.

常見使用案例

  • 電腦視覺

    • 描述影像。 分析影像、評估偵測到的物件,併產生描述影像的人類可讀片語或句子。
    • 標記視覺功能。 套用以數千個可辨識物件的集合為基礎的標記。
    • 分類影像。 根據影像的內容分類影像。
    • 實作 OCR。 偵測影像中的列印和手寫文字。
    • 偵測影像類型。 例如,識別美工圖案影像或線條繪圖。
    • 偵測色彩配置。 識別影像中的主要前景、背景和主要和輔色。
    • 產生縮圖。 建立小型版本的映像。
    • 仲裁內容。 偵測包含成人內容的影像或描繪古蘭場景。
    • 偵測網域特定內容。 使用兩個特製化領域模型:
      • 名人。 從體育、娛樂和商業領域識別成千上萬的知名名人。
      • 地標。 識別著名的地標,如泰姬陵和自由女神像。
    • 偵測物件。 識別通用物件,並傳回周框方塊的座標。
    • 偵測品牌。 從現有資料庫中識別數千個全球公認的產品標誌的標誌。
    • 偵測臉部。 偵測和分析影像中的人臉。 您可以決定主旨的年齡,並傳回指定臉部位置的周框方塊。 電腦視覺 服務的臉部分析功能是專用臉部服務所提供的臉部分析功能子集。
  • 自訂視覺

    • 分類影像。 根據一組稱為特徵的輸入來預測類別或類別。 計算每個可能類別的機率分數,並傳回一個標籤,指出物件最有可能所屬的類別。 若要使用此模型,您需要包含特徵及其標籤的數據。
    • 偵測物件。 取得影像中物件的座標。 若要使用此模型,您需要包含特徵及其標籤的數據。
  • 臉部服務

    • 偵測臉部。 識別包含人臉的影像區域,通常是傳回周框方塊座標,形成臉部周圍的矩形。
    • 分析臉部。 傳回資訊,例如面部地標(鼻子、眼睛、眉毛、嘴唇等等)。 您可以使用這些臉部地標作為特徵來定型機器學習模型,以推斷人員的相關信息,例如他們感知的年齡或情緒狀態。
    • 辨識臉部。 定型機器學習模型,以識別臉部特徵中的已知個人。

參與者

本文由 Microsoft 維護。 原始投稿人如下。

主要作者:

其他投稿人:

若要查看非公用LinkedIn配置檔,請登入LinkedIn。

下一步