物件偵測 (4.0 版)
對象偵測類似於 標記,但 API 會針對影像中找到的每個物件傳回周框方塊座標(以像素為單位)。 例如,如果影像包含狗、貓和人員,對象偵測作業將會列出影像中具有其座標的物件。 您可以使用此功能來處理影像中物件之間的關聯性。 它也可讓您判斷影像中是否有多個相同對象的實例。
物件偵測函式會根據影像中所識別的物件或活體專案套用標記。 標記分類法與物件偵測分類之間沒有正式關聯性。 在概念層級,物件偵測函式只會尋找物件和生活專案,而標籤式也可以包含內容詞彙,例如「室內」,而此詞彙無法以周框方塊當地語系化。
使用 Vision Studio 快速且輕鬆地在瀏覽器中試用物件偵測的功能。
提示
您可以透過 Azure OpenAI 服務使用物件偵測功能。 GPT-4 Turbo with Vision 模型可讓您與可分析您所共用影像的 AI 助理聊天,而視覺增強選項會使用影像分析來提供 AI 協助,並提供影像相關詳細數據(可讀取的文字和物件位置)。 如需詳細資訊,請參閱 GPT-4 Turbo with Vision 快速入門。
對象偵測範例
下列 JSON 回應說明 Analysis 4.0 API 在偵測範例影像中的物件時所傳回的內容。
{
"metadata":
{
"width": 1260,
"height": 473
},
"objectsResult":
{
"values":
[
{
"name": "kitchen appliance",
"confidence": 0.501,
"boundingBox": {"x":730,"y":66,"w":135,"h":85}
},
{
"name": "computer keyboard",
"confidence": 0.51,
"boundingBox": {"x":523,"y":377,"w":185,"h":46}
},
{
"name": "Laptop",
"confidence": 0.85,
"boundingBox": {"x":471,"y":218,"w":289,"h":226}
},
{
"name": "person",
"confidence": 0.855,
"boundingBox": {"x":654,"y":0,"w":584,"h":473}
}
]
}
}
限制
請務必注意對象偵測的限制,以便避免或減輕誤判(遺漏的物件)和有限詳細數據的影響。
- 如果物件很小(小於 5% 的影像),通常不會偵測到它們。
- 如果對象被緊密排列在一起,通常不會偵測到它們(例如,盤子堆棧)。
- 無法依品牌或產品名稱區分物件 (例如貨架上有不同種類的汽水)。 不過,您可以使用品牌偵測功能,從影像取得品牌資訊。
使用 API
對象偵測功能是分析影像 API 的一部分。 您可以使用 REST 呼叫此 API。 包含在Objects
功能查詢參數中。 然後,當您取得完整的 JSON 回應時,剖析區段內容的 "objects"
字串。