映射 標題 (4.0 版)

影像分析 4.0 中的影像 標題 可透過 Caption 和 Dense Captions 功能取得。

Caption 會為所有影像內容產生一個句子描述。 除了描述整個影像之外,密集標題還提供更多詳細數據,方法是產生最多10個影像區域的一句描述。 密集輔助字幕也會傳回所描述影像區域的週框方塊座標。 這兩項功能都使用以佛羅倫薩為基礎的 AI 模型。

目前,影像 標題 僅適用於英文版。

重要

影像分析 4.0 中的影像 標題 僅適用於下列 Azure 數據中心區域:美國東部、法國中部、韓國中部、北歐、東南亞、西歐、美國西部、東亞。 您必須使用位於其中一個區域的視覺資源,從 Caption 和 Dense Captions 功能取得結果。

如果您必須使用這些區域以外的視覺資源來產生影像 標題,請使用所有 Azure AI 視覺區域中可用的影像分析 3.2

使用 Vision Studio 快速且輕鬆地在瀏覽器中試用影像 標題 功能。

性別中性 標題

標題預設包含性別詞彙(“man”、“woman”、“boy” 和 “girl”)。 您可以選擇在結果中以「人員」取代這些詞彙,並接收性別中性 標題。 若要這麼做,您可以在要求 URL 中將選擇性 API 要求參數性別中性 標題 設定true為 。

Caption 和 Dense Captions 範例

下列 JSON 回應說明在根據視覺功能描述範例影像時,「分析 4.0 API」傳回的內容。

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

使用 API

影像 標題 功能是分析影像 API 的一部分。 包含在Caption功能查詢參數中。 然後,當您取得完整的 JSON 回應時,剖析區段內容的 "captionResult" 字串。

下一步