分享方式:


圖片說明 (4.0 版)

影像分析 4.0 中的影像標題可透過 Caption 和 Dense Captions 功能取得。

Caption 會為所有影像內容產生一個句子描述。 除了描述整個影像之外,密集標題還提供更多詳細數據,方法是產生最多10個影像區域的一句描述。 密集輔助字幕也會傳回所描述影像區域的週框方塊座標。 這兩項功能都使用以佛羅倫薩為基礎的 AI 模型。

目前只有英文提供影像輔助字幕。

重要

影像分析 4.0 中的影像標題僅適用於特定 Azure 資料中心區域:請參閱 區域可用性。 您必須使用位於其中一個區域的視覺資源,從 Caption 和 Dense Captions 功能取得結果。

如果您必須使用這些區域以外的視覺資源來產生影像標題,請使用 所有 Azure AI 視覺區域中可用的影像分析 3.2

使用 Vision Studio 快速且輕鬆地在瀏覽器中試用影像字幕功能。

性別中性字幕

標題預設包含性別詞彙(“man”、“woman”、“boy” 和 “girl”)。 您可以選擇在結果中以「人」取代這些詞彙,並接收性別中性字幕。 若要這樣做,您可以在要求 URL 中將選擇性 API 要求參數 gender-neutral-caption 設定為 true

字幕與密集字幕範例

下列 JSON 回應說明在根據視覺功能描述範例影像時,「分析 4.0 API」傳回的內容。

一個指著螢幕的人的照片

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

使用 API

影像字幕建立功能是分析影像 API 的一部分。 在 features 查詢參數中包含 Caption。 然後,當您取得完整的 JSON 回應時,請剖析 "captionResult" 區段內容的字串。

下一步