圖片說明 (4.0 版)
影像分析 4.0 中的影像標題可透過 Caption 和 Dense Captions 功能取得。
Caption 會為所有影像內容產生一個句子描述。 除了描述整個影像之外,密集標題還提供更多詳細數據,方法是產生最多10個影像區域的一句描述。 密集輔助字幕也會傳回所描述影像區域的週框方塊座標。 這兩項功能都使用以佛羅倫薩為基礎的 AI 模型。
目前只有英文提供影像輔助字幕。
重要
影像分析 4.0 中的影像標題僅適用於特定 Azure 資料中心區域:請參閱 區域可用性。 您必須使用位於其中一個區域的視覺資源,從 Caption 和 Dense Captions 功能取得結果。
如果您必須使用這些區域以外的視覺資源來產生影像標題,請使用 所有 Azure AI 視覺區域中可用的影像分析 3.2 。
使用 Vision Studio 快速且輕鬆地在瀏覽器中試用影像字幕功能。
性別中性字幕
標題預設包含性別詞彙(“man”、“woman”、“boy” 和 “girl”)。 您可以選擇在結果中以「人」取代這些詞彙,並接收性別中性字幕。 若要這樣做,您可以在要求 URL 中將選擇性 API 要求參數 gender-neutral-caption 設定為 true
。
字幕與密集字幕範例
下列 JSON 回應說明在根據視覺功能描述範例影像時,「分析 4.0 API」傳回的內容。
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
使用 API
影像字幕建立功能是分析影像 API 的一部分。 在 features 查詢參數中包含 Caption
。 然後,當您取得完整的 JSON 回應時,請剖析 "captionResult"
區段內容的字串。
下一步
- 了解物件偵測的相關概念。
- 快速入門:影像分析 REST API 或用戶端程式庫
- 呼叫分析影像 API
意見反映
https://aka.ms/ContentUserFeedback。
即將推出:我們會在 2024 年淘汰 GitHub 問題,並以全新的意見反應系統取代並作為內容意見反應的渠道。 如需更多資訊,請參閱:提交及檢視以下的意見反映: