Een afbeelding analyseren
Als u een afbeelding wilt analyseren, kunt u de methode Analyze Image REST of de equivalente methode in de SDK gebruiken voor de programmeertaal van uw voorkeur, waarbij u de visuele functies opgeeft die u wilt opnemen in de analyse (en als u categorieën selecteert, ongeacht of u details van beroemdheden of oriëntatiepunten wilt opnemen). Deze methode retourneert een JSON-document met de aangevraagde informatie.
Notitie
Detectie van beroemdheden vereist goedkeuring via een beleid voor beperkte toegang. U kunt meer lezen over de toevoeging van dit beleid aan onze standaard voor verantwoorde AI. Beroemdheidsherkenning wordt in sommige schermopnamen gezien, maar is niet opgenomen in het lab.
using Azure.AI.Vision.ImageAnalysis;
ImageAnalysisClient client = new ImageAnalysisClient(
Environment.GetEnvironmentVariable("ENDPOINT"),
new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));
ImageAnalysisResult result = client.Analyze(
new Uri("<url>"),
VisualFeatures.Caption | VisualFeatures.Read,
new ImageAnalysisOptions { GenderNeutralCaption = true });
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential
client = ImageAnalysisClient(
endpoint=os.environ["ENDPOINT"],
credential=AzureKeyCredential(os.environ["KEY"])
)
result = client.analyze(
image_url="<url>",
visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
gender_neutral_caption=True,
language="en",
)
Beschikbare visuele functies zijn opgenomen in de VisualFeatures
opsomming:
- VisualFeatures.Tags: Tags identificeert tags over de afbeelding, waaronder objecten, landschappen, instellingen en acties
- VisualFeatures.Objects: retourneert het begrenzingsvak voor elk gedetecteerd object
- VisualFeatures.Caption: genereert een onderschrift van de afbeelding in natuurlijke taal
- VisualFeatures.DenseCaptions: genereert meer gedetailleerde onderschrift s voor de gedetecteerde objecten
- VisualFeatures. Mensen: retourneert het begrenzingsvak voor gedetecteerde personen
- VisualFeatures.SmartCrops: retourneert het begrenzingsvak van de opgegeven hoogte-breedteverhouding voor het interessegebied
- VisualFeatures.Read: Leesbare tekst extraheren
- VisualFeatures.TAGS: Hiermee worden tags over de afbeelding geïdentificeerd, waaronder objecten, landschappen, instellingen en acties
- VisualFeatures.OBJECTS: retourneert het begrenzingsvak voor elk gedetecteerd object
- VisualFeatures.CAPTION: genereert een onderschrift van de afbeelding in natuurlijke taal
- VisualFeatures.DENSE_CAPTIONS: genereert gedetailleerdere onderschrift s voor de gedetecteerde objecten
- VisualFeatures.PEOPLE: retourneert het begrenzingsvak voor gedetecteerde personen
- VisualFeatures.SMART_CROPS: geeft als resultaat het begrenzingsvak van de opgegeven hoogte-breedteverhouding voor het interessegebied
- VisualFeatures.READ: Hiermee wordt leesbare tekst geëxtraheerd
Als u de visuele kenmerken opgeeft die u in de afbeelding wilt analyseren, bepaalt u welke informatie het antwoord bevat. De meeste antwoorden bevatten een begrenzingsvak (als een locatie in de afbeelding redelijk is) of een betrouwbaarheidsscore (voor functies zoals tags of onderschrift s).
Het JSON-antwoord voor afbeeldingsanalyse ziet er ongeveer als in dit voorbeeld uit, afhankelijk van de aangevraagde functies:
{
"apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
"modelVersion": "<version>",
"denseCaptionsResult": {
"values": [
{
"text": "a house in the woods",
"confidence": 0.7055229544639587,
"boundingBox": {
"x": 0,
"y": 0,
"w": 640,
"h": 640
}
},
{
"text": "a trailer with a door and windows",
"confidence": 0.6675070524215698,
"boundingBox": {
"x": 214,
"y": 434,
"w": 154,
"h": 108
}
}
]
},
"metadata": {
"width": 640,
"height": 640
}
}