Een afbeelding analyseren

Voltooid

Als u een afbeelding wilt analyseren, kunt u de methode Analyze Image REST of de equivalente methode in de SDK gebruiken voor de programmeertaal van uw voorkeur, waarbij u de visuele functies opgeeft die u wilt opnemen in de analyse (en als u categorieën selecteert, ongeacht of u details van beroemdheden of oriëntatiepunten wilt opnemen). Deze methode retourneert een JSON-document met de aangevraagde informatie.

Notitie

Detectie van beroemdheden vereist goedkeuring via een beleid voor beperkte toegang. U kunt meer lezen over de toevoeging van dit beleid aan onze standaard voor verantwoorde AI. Beroemdheidsherkenning wordt in sommige schermopnamen gezien, maar is niet opgenomen in het lab.

using Azure.AI.Vision.ImageAnalysis;

ImageAnalysisClient client = new ImageAnalysisClient(
    Environment.GetEnvironmentVariable("ENDPOINT"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));

ImageAnalysisResult result = client.Analyze(
    new Uri("<url>"),
    VisualFeatures.Caption | VisualFeatures.Read,
    new ImageAnalysisOptions { GenderNeutralCaption = true });
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential

client = ImageAnalysisClient(
    endpoint=os.environ["ENDPOINT"],
    credential=AzureKeyCredential(os.environ["KEY"])
)

result = client.analyze(
    image_url="<url>",
    visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
    gender_neutral_caption=True,
    language="en",
)

Beschikbare visuele functies zijn opgenomen in de VisualFeatures opsomming:

  • VisualFeatures.Tags: Tags identificeert tags over de afbeelding, waaronder objecten, landschappen, instellingen en acties
  • VisualFeatures.Objects: retourneert het begrenzingsvak voor elk gedetecteerd object
  • VisualFeatures.Caption: genereert een onderschrift van de afbeelding in natuurlijke taal
  • VisualFeatures.DenseCaptions: genereert meer gedetailleerde onderschrift s voor de gedetecteerde objecten
  • VisualFeatures. Mensen: retourneert het begrenzingsvak voor gedetecteerde personen
  • VisualFeatures.SmartCrops: retourneert het begrenzingsvak van de opgegeven hoogte-breedteverhouding voor het interessegebied
  • VisualFeatures.Read: Leesbare tekst extraheren
  • VisualFeatures.TAGS: Hiermee worden tags over de afbeelding geïdentificeerd, waaronder objecten, landschappen, instellingen en acties
  • VisualFeatures.OBJECTS: retourneert het begrenzingsvak voor elk gedetecteerd object
  • VisualFeatures.CAPTION: genereert een onderschrift van de afbeelding in natuurlijke taal
  • VisualFeatures.DENSE_CAPTIONS: genereert gedetailleerdere onderschrift s voor de gedetecteerde objecten
  • VisualFeatures.PEOPLE: retourneert het begrenzingsvak voor gedetecteerde personen
  • VisualFeatures.SMART_CROPS: geeft als resultaat het begrenzingsvak van de opgegeven hoogte-breedteverhouding voor het interessegebied
  • VisualFeatures.READ: Hiermee wordt leesbare tekst geëxtraheerd

Als u de visuele kenmerken opgeeft die u in de afbeelding wilt analyseren, bepaalt u welke informatie het antwoord bevat. De meeste antwoorden bevatten een begrenzingsvak (als een locatie in de afbeelding redelijk is) of een betrouwbaarheidsscore (voor functies zoals tags of onderschrift s).

Het JSON-antwoord voor afbeeldingsanalyse ziet er ongeveer als in dit voorbeeld uit, afhankelijk van de aangevraagde functies:

{
  "apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
  "modelVersion": "<version>",
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a house in the woods",
        "confidence": 0.7055229544639587,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 640,
          "h": 640
        }
      },
      {
        "text": "a trailer with a door and windows",
        "confidence": 0.6675070524215698,
        "boundingBox": {
          "x": 214,
          "y": 434,
          "w": 154,
          "h": 108
        }
      }
    ]
  },
  "metadata": {
    "width": 640,
    "height": 640
  }
}