Domeinspecifieke inhoudsdetectie

Naast taggen en categorisatie op hoog niveau ondersteunt Computer Vision ook verdere domeinspecifieke analyse met behulp van modellen die zijn getraind op gespecialiseerde gegevens.

Er zijn twee manieren om de domeinspecifieke modellen te gebruiken: op zichzelf (bereikanalyse) of als een verbetering van de categorisatiefunctie.

Bereikanalyse

U kunt een afbeelding analyseren met alleen het gekozen domeinspecifieke model door de API Modellen/<model>/Analyseren aan te roepen.

Hier volgt een voorbeeld van een JSON-antwoord dat wordt geretourneerd door de API voor modellen/beroemdheden/analyseren voor de opgegeven afbeelding:

Satya Nadella staand, glimlachend

{
  "result": {
    "celebrities": [{
      "faceRectangle": {
        "top": 391,
        "left": 318,
        "width": 184,
        "height": 184
      },
      "name": "Satya Nadella",
      "confidence": 0.99999856948852539
    }]
  },
  "requestId": "8217262a-1a90-4498-a242-68376a4b956b",
  "metadata": {
    "width": 800,
    "height": 1200,
    "format": "Jpeg"
  }
}

Verbeterde categorisatieanalyse

U kunt ook domeinspecifieke modellen gebruiken als aanvulling op algemene afbeeldingsanalyse. U doet dit als onderdeel van categorisatie op hoog niveau door domeinspecifieke modellen op te geven in de parameter details van de Analyse-API-aanroep.

In dit geval wordt eerst de taxonomieclassificatie van 86 categorieën aangeroepen. Als een van de gedetecteerde categorieën een overeenkomend domeinspecifiek model heeft, wordt de afbeelding ook door dat model doorgegeven en worden de resultaten toegevoegd.

Het volgende JSON-antwoord laat zien hoe domeinspecifieke analyse kan worden opgenomen als het detail knooppunt in een bredere categorisatieanalyse.

"categories":[
  {
    "name":"abstract_",
    "score":0.00390625
  },
  {
    "name":"people_",
    "score":0.83984375,
    "detail":{
      "celebrities":[
        {
          "name":"Satya Nadella",
          "faceRectangle":{
            "left":597,
            "top":162,
            "width":248,
            "height":248
          },
          "confidence":0.999028444
        }
      ],
      "landmarks":[
        {
          "name":"Forbidden City",
          "confidence":0.9978346
        }
      ]
    }
  }
]

De domeinspecifieke modellen weergeven

Momenteel ondersteunt Computer Vision de volgende domeinspecifieke modellen:

Naam Beschrijving
Beroemdheden Beroemdheidsherkenning, ondersteund voor afbeeldingen die zijn geclassificeerd in de people_ categorie
Bezienswaardigheden Oriëntatiepuntenherkenning, ondersteund voor afbeeldingen die zijn geclassificeerd in de outdoor_ categorieën of building_

Als u de MODELLEN-API aanroept, wordt deze informatie geretourneerd, samen met de categorieën waarop elk model kan worden toegepast:

{
  "models":[
    {
      "name":"celebrities",
      "categories":[
        "people_",
        "人_",
        "pessoas_",
        "gente_"
      ]
    },
    {
      "name":"landmarks",
      "categories":[
        "outdoor_",
        "户外_",
        "屋外_",
        "aoarlivre_",
        "alairelibre_",
        "building_",
        "建筑_",
        "建物_",
        "edifício_"
      ]
    }
  ]
}

De API gebruiken

Deze functie is beschikbaar via de Analyze Image-API . U kunt deze API aanroepen via een systeemeigen SDK of via REST-aanroepen. Neem Celebrities of Landmarks op in de queryparameter voor details . Wanneer u vervolgens het volledige JSON-antwoord krijgt, parseert u gewoon de tekenreeks voor de inhoud van de "details" sectie.