分析影像

已完成

若要分析影像,您可以將 SDK 中的分析影像 REST 方法或對等方法用於您偏好的程式設計語言,同時指定要包含在分析中的視覺功能 (如果您選取類別,是否要包含名人或地標的詳細資料)。 這個方法會傳回 JSON 文件,其中包含所要求的資訊。

注意

偵測名人需要透過有限存取原則獲得核准。 您可以深入了解將此原則新增至我們的負責任 AI 標準。 某些螢幕擷取畫面中會顯示名人辨識,但實驗室中不包含此名人辨識。

using Azure.AI.Vision.ImageAnalysis;

ImageAnalysisClient client = new ImageAnalysisClient(
    Environment.GetEnvironmentVariable("ENDPOINT"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));

ImageAnalysisResult result = client.Analyze(
    new Uri("<url>"),
    VisualFeatures.Caption | VisualFeatures.Read,
    new ImageAnalysisOptions { GenderNeutralCaption = true });
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential

client = ImageAnalysisClient(
    endpoint=os.environ["ENDPOINT"],
    credential=AzureKeyCredential(os.environ["KEY"])
)

result = client.analyze(
    image_url="<url>",
    visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
    gender_neutral_caption=True,
    language="en",
)

可供使用的視覺效果功能包含在列舉 VisualFeatures 中:

  • VisualFeatures.Tags:識別影像的相關標記,包括對象、風景、設定和動作
  • VisualFeatures.Objects:傳回每個偵測到物件的周框方塊
  • VisualFeatures.Caption:以自然語言產生的影像標題
  • VisualFeatures.DenseCaptions:為偵測到的物件產生更詳細的標題
  • VisualFeatures.People:傳回偵測到人員的周框方塊
  • VisualFeatures.SmartCrops:傳回感興趣區域指定外觀比例的周框方塊
  • VisualFeatures.Read:擷取可讀取的文字
  • VisualFeatures.TAGS:識別影像的相關標記,包括對象、風景、設定和動作
  • VisualFeatures.OBJECTS:傳回每個偵測到物件的周框方塊
  • VisualFeatures.CAPTION:以自然語言產生的影像標題
  • VisualFeatures.DENSE_CAPTIONS:為偵測到的物件產生更詳細的標題
  • VisualFeatures.PEOPLE:傳回偵測到人員的周框方塊
  • VisualFeatures.SMART_CROPS:傳回感興趣區域指定外觀比例的周框方塊
  • VisualFeatures.READ:擷取可讀取的文字

指定您想要在影像中分析的視覺效果功能,決定了回應將包含哪些資訊。 大部分的回應都會包含周框方塊 (如果影像中的位置合理) 或信賴度分數 (例如標記或標題等功能)。

影像分析的 JSON 回應看起來類似此範例,視您所要求的功能而定:

{
  "apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
  "modelVersion": "<version>",
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a house in the woods",
        "confidence": 0.7055229544639587,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 640,
          "h": 640
        }
      },
      {
        "text": "a trailer with a door and windows",
        "confidence": 0.6675070524215698,
        "boundingBox": {
          "x": 214,
          "y": 434,
          "w": 154,
          "h": 108
        }
      }
    ]
  },
  "metadata": {
    "width": 640,
    "height": 640
  }
}