瞭解 Azure AI 視覺影像分析功能
Azure AI 視覺的影像分析功能可以搭配或不自定義使用。 一些不需要自定義的功能包括:
- 使用標題描述影像
- 偵測影像中的常見物件
- 為視覺特徵加上標籤
- 光學字元辨識
使用標題描述影像
Azure AI 視覺能夠分析影像、評估影像中的物件,以及產生人類可讀取的影像描述。 例如,請考慮下圖:
Azure AI Vision 會針對此影像傳回下列標題:
一個人跳上滑板
偵測影像中的常見物件
Azure AI 視覺可以識別影像中的數千個通用物件。 例如,當用來偵測先前討論之滑板影像中的物件時,Azure AI Vision 會傳回下列預測:
- 滑板 (90.40%)
- 人物 (95.5%)
預測包含信賴分數,用於指示模型對其所描述的內容符合影像實際情況的信心程度。
除了偵測到的物件卷標及其機率之外,Azure AI 視覺也會傳回 周框方塊 座標,指出所偵測到物件的上、左、寬度和高度。 您可以使用這些座標來判斷每個物件偵測到影像中的位置,如下所示:
為視覺特徵加上標籤
Azure AI 視覺可以根據影像的內容來建議影像的 標籤 。 標記會與影像建立關聯,做為元數據。 標籤會摘要影像的屬性。 您可以使用標籤為圖像編製索引,並添加一組搜尋解決方案中的關鍵詞。
例如,針對滑板者的影像傳回的標記(和相關的信賴分數)包括:
- 體育 (99.60%)
- 人物 (99.56%)
- 鞋類 (98.05%)
- 滑冰 (96.27%)
- 板類運動(95.58%)
- 滑板設備 (94.43%)
- 服裝 (94.02%)
- 牆 (93.81%)
- 滑板 (93.78%)
- 滑板運動員 (93.25%)
- 個人體育 (92.80%)
- 街頭特技 (90.81%)
- 餘額 (90.81%)
- 跳躍 (89.87%)
- 運動裝備(88.61%)
- 極端運動 (88.35%)
- kickflip (88.18%)
- 特技 (87.27%)
- 滑板 (86.87%)
- 特技表演者(85.83%)
- 膝蓋 (85.30%)
- 體育 (85.24%)
- 長板 (84.61%)
- 長板運動 (84.45%)
- 騎乘 (73.37%)
- 滑冰 (67.27%)
- 空氣 (64.83%)
- 楊 (63.29%)
- 戶外 (61.39%)
光學字元辨識
Azure AI 視覺服務可以使用光學字元辨識 (OCR) 功能來偵測影像中的文字。 例如,請考慮雜貨店中產品營養標籤的下圖:
Azure AI 視覺服務可以分析此影像並擷取下列文字:
Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet
自訂模型訓練
如果 Azure AI 視覺所提供的內建模型不符合您的需求,您可以使用服務來定型自定義模型以進行 影像分類 或 物件偵測。 Azure AI 視覺在預先定型的基礎模型上建置自定義模型,這表示您可以使用相對較少的定型影像來定型複雜的模型。
影像分類
影像分類模型可用來預測影像的類別或 類別 。 例如,您可以定型模型來判斷影像中顯示的水果類型,如下所示:
蘋果 | 香蕉 | 橙 |
---|---|---|
![]() |
![]() |
![]() |
物件偵測
物件偵測模型會偵測並分類影像中的物件,並傳回周框方塊座標來找出每個物件。 除了 Azure AI 視覺中的內建物件偵測功能之外,您還可以使用自己的影像來定型自定義物件偵測模型。 例如,您可以使用水果相片來定型可偵測影像中多個水果的模型,如下所示:
備註
如何使用 Azure AI 視覺來定型自定義模型的詳細數據已超出本課程模組的範圍。 您可以在 Azure AI 視覺檔中找到自訂模型定型的相關信息。
接下來,讓我們看看 Azure AI 視覺臉部服務特有的功能。