分析影像
若要分析影像,您可以將 SDK 中的分析影像 REST 方法或對等方法用於您偏好的程式設計語言,同時指定要包含在分析中的視覺功能 (如果您選取類別,是否要包含名人或地標的詳細資料)。 這個方法會傳回 JSON 文件,其中包含所要求的資訊。
using Azure.AI.Vision.ImageAnalysis;
ImageAnalysisClient client = new ImageAnalysisClient(
Environment.GetEnvironmentVariable("ENDPOINT"),
new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));
ImageAnalysisResult result = client.Analyze(
new Uri("<url>"),
VisualFeatures.Caption | VisualFeatures.Read,
new ImageAnalysisOptions { GenderNeutralCaption = true });
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential
client = ImageAnalysisClient(
endpoint=os.environ["ENDPOINT"],
credential=AzureKeyCredential(os.environ["KEY"])
)
result = client.analyze(
image_url="<url>",
visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
gender_neutral_caption=True,
language="en",
)
可供使用的視覺效果功能包含在列舉 VisualFeatures
中:
- VisualFeatures.Tags:識別影像的相關標記,包括對象、風景、設定和動作
- VisualFeatures.Objects:傳回每個偵測到物件的周框方塊
- VisualFeatures.Caption:以自然語言產生的影像標題
- VisualFeatures.DenseCaptions:為偵測到的物件產生更詳細的標題
- VisualFeatures.People:傳回偵測到人員的周框方塊
- VisualFeatures.SmartCrops:傳回感興趣區域指定外觀比例的周框方塊
- VisualFeatures.Read:擷取可讀取的文字
- VisualFeatures.TAGS:識別影像的相關標記,包括對象、風景、設定和動作
- VisualFeatures.OBJECTS:傳回每個偵測到物件的周框方塊
- VisualFeatures.CAPTION:以自然語言產生的影像標題
- VisualFeatures.DENSE_CAPTIONS:為偵測到的物件產生更詳細的標題
- VisualFeatures.PEOPLE:傳回偵測到人員的周框方塊
- VisualFeatures.SMART_CROPS:傳回感興趣區域指定外觀比例的周框方塊
- VisualFeatures.READ:擷取可讀取的文字
指定您想要在影像中分析的視覺效果功能,決定了回應將包含哪些資訊。 大部分的回應都會包含周框方塊 (如果影像中的位置合理) 或信賴度分數 (例如標記或標題等功能)。
影像分析的 JSON 回應看起來類似此範例,視您所要求的功能而定:
{
"apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
"modelVersion": "<version>",
"denseCaptionsResult": {
"values": [
{
"text": "a house in the woods",
"confidence": 0.7055229544639587,
"boundingBox": {
"x": 0,
"y": 0,
"w": 640,
"h": 640
}
},
{
"text": "a trailer with a door and windows",
"confidence": 0.6675070524215698,
"boundingBox": {
"x": 214,
"y": 434,
"w": 154,
"h": 108
}
}
]
},
"metadata": {
"width": 640,
"height": 640
}
}