映像說明

Azure AI 視覺可以分析影像,並產生人類看得懂的片語,以描述其內容。 該演算法會根據不同的視覺功能傳回多個描述,且每個描述都給予信賴分數。 最後的輸出是從最高到最低信賴分數排序的描述清單。

英文是影像描述目前唯一支援的語言。

使用 Vision Studio 快速且輕鬆地在瀏覽器中試用影像字幕功能。

影像描述範例

下列 JSON 回應說明在根據視覺功能描述範例影像時,「分析 API」傳回的內容。

曼哈頓建築物的黑白照片

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

使用 API

影像描述功能是分析影像 \(英文\) API 的一部分。 您可以透過原生 SDK 或 REST 呼叫來呼叫此 API。 在 visualFeatures 查詢參數中包含 Description。 然後,當您取得完整的 JSON 回應時,剖析 "description" 區段內容的字串。

下一步

了解標記影像分類影像的相關概念。