Detección de contenido específico del dominio

Artículo
01/19/2024

Además del etiquetado y la categorización de alto nivel, Azure AI Vision también admite análisis más específicos del dominio utilizando modelos que han sido entrenados con datos especializados.

Hay dos maneras de utilizar los modelos específicos del dominio: solos (análisis con ámbito) o como una mejora de la característica de categorización.

Análisis con ámbito

Puede analizar una imagen usando solo el modelo específico de dominio elegido mediante una llamada a la API Models/<model>/Analyze.

El siguiente es una muestra de respuesta JSON devuelta por la API models/celebrities/analyze para la imagen especificada:

Satya Nadella standing, smiling

{
  "result": {
    "celebrities": [{
      "faceRectangle": {
        "top": 391,
        "left": 318,
        "width": 184,
        "height": 184
      },
      "name": "Satya Nadella",
      "confidence": 0.99999856948852539
    }]
  },
  "requestId": "8217262a-1a90-4498-a242-68376a4b956b",
  "metadata": {
    "width": 800,
    "height": 1200,
    "format": "Jpeg"
  }
}

Análisis de categorización mejorada

También puede usar modelos específicos del dominio para complementar los análisis de imágenes generales. Esto forma parte de la categorización de alto nivel mediante la especificación de los modelos específicos del dominio en la llamada al parámetro details de la llamada a la API Analyze.

En este caso, se llama primero al clasificador de la taxonomía de las 86 categorías. Si alguna de las categorías detectadas tiene un modelo específico de dominio coincidente, la imagen se pasa por ese modelo y se agregan los resultados.

La siguiente respuesta JSON muestra el modo en que el análisis específico del dominio puede incluirse como el nodo detail en un análisis de categorización más amplio.

"categories":[
  {
    "name":"abstract_",
    "score":0.00390625
  },
  {
    "name":"people_",
    "score":0.83984375,
    "detail":{
      "celebrities":[
        {
          "name":"Satya Nadella",
          "faceRectangle":{
            "left":597,
            "top":162,
            "width":248,
            "height":248
          },
          "confidence":0.999028444
        }
      ],
      "landmarks":[
        {
          "name":"Forbidden City",
          "confidence":0.9978346
        }
      ]
    }
  }
]

Enumeración de modelos específicos de dominio

Actualmente, Azure AI Vision admite los siguientes modelos específicos de dominio:

Nombre	Descripción
celebrities	Reconocimiento de celebridades, compatible con imágenes clasificadas en la categoría `people_`.
landmarks	Reconocimiento de puntos de referencia, compatible con imágenes clasificadas en las categorías `outdoor_` o `building_`.

Una llamada a la API Models devolverá esta información junto con las categorías a las que se puede aplicar cada modelo:

{
  "models":[
    {
      "name":"celebrities",
      "categories":[
        "people_",
        "人_",
        "pessoas_",
        "gente_"
      ]
    },
    {
      "name":"landmarks",
      "categories":[
        "outdoor_",
        "户外_",
        "屋外_",
        "aoarlivre_",
        "alairelibre_",
        "building_",
        "建筑_",
        "建物_",
        "edifício_"
      ]
    }
  ]
}

Uso de la API

Esta característica está disponible mediante la API Analyze Image 3.2. Puede llamar a esta API mediante una SDK nativa o con llamadas a REST. Incluya elementos Celebrities o Landmarks en el parámetro de consulta details. Después, cuando llegue la respuesta JSON completa, simplemente analice la cadena con el contenido de la sección "details".

Inicio rápido: API de REST de Visión o bibliotecas cliente

Detección de contenido específico del dominio

Análisis con ámbito

Análisis de categorización mejorada

Enumeración de modelos específicos de dominio

Uso de la API

Recursos adicionales