Beschrijvingen van afbeeldingen

Azure AI Vision kan een afbeelding analyseren en een door mensen leesbare woordgroep genereren waarin de inhoud wordt beschreven. Het algoritme retourneert verschillende beschrijvingen op basis van verschillende visuele functies en elke beschrijving krijgt een betrouwbaarheidsscore. De uiteindelijke uitvoer is een lijst met beschrijvingen van de hoogste naar de laagste betrouwbaarheid.

Op dit moment is Engels de enige ondersteunde taal voor de beschrijving van afbeeldingen.

Probeer de functies voor bijschriften van afbeeldingen snel en eenvoudig uit in uw browser met behulp van Vision Studio.

Voorbeeld van beschrijving van afbeelding

Het volgende JSON-antwoord illustreert wat de Analyse-API retourneert bij het beschrijven van de voorbeeldafbeelding op basis van de visuele kenmerken.

Een zwart-witbeeld van gebouwen in Manhattan

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

De API gebruiken

De beschrijvingsfunctie voor afbeeldingen maakt deel uit van de Analyze Image-API . U kunt deze API aanroepen via een systeemeigen SDK of via REST-aanroepen. Opnemen Description in de queryparameter visualFeatures . Wanneer u vervolgens het volledige JSON-antwoord krijgt, parseert u de tekenreeks voor de inhoud van de "description" sectie.

Volgende stappen

Meer informatie over de gerelateerde concepten van het taggen van afbeeldingen en het categoriseren van afbeeldingen.