Compartir por


Detección de objetos

La detección de objetos es similar al etiquetado, pero la API devuelve las coordenadas del rectángulo (en píxeles) que delimita cada objeto encontrado en la imagen. Por ejemplo, si una imagen contiene un perro, un gato y una persona, la operación de detección de objetos muestra esos objetos con sus coordenadas en la imagen. Puede usar esta funcionalidad para procesar las relaciones entre los objetos de una imagen. También permite determinar si hay varias instancias del mismo objeto en una imagen.

La función de detección de objetos aplica etiquetas basadas en los objetos o seres vivos identificados en la imagen. No hay ninguna relación formal entre la taxonomía de etiquetado y la taxonomía de detección de objetos. A nivel conceptual, la función de detección de objetos solo encuentra objetos y seres vivos, mientras que la función de etiquetas también puede incluir términos contextuales como "interior", que no pueden localizarse con cuadros de límite.

Pruebe las funcionalidades de detección de objetos de forma rápida y sencilla en el explorador mediante Vision Studio.

Ejemplo de detección de objetos

La siguiente respuesta JSON muestra lo que devuelve Analyze Image API al detectar objetos en la imagen de ejemplo.

Una mujer con un dispositivo Microsoft Surface en una cocina

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitaciones

Es importante tener en cuenta las limitaciones de la detección de objetos para que pueda evitar o mitigar los efectos de los falsos negativos (objetos que faltan) y los detalles limitados.

  • Normalmente, los objetos no se detectan si son pequeños (menos del 5 % de la imagen).
  • Normalmente, los objetos no se detectan si se organizan estrechamente (una pila de placas, por ejemplo).
  • Los objetos no se diferencian por nombres de marca o producto (diferentes tipos de refrescos en una estantería de la tienda, por ejemplo). Sin embargo, puede obtener información de la marca de una imagen mediante la característica de detección de la marca.

Uso de la API

La característica de detección de objetos forma parte de la API de análisis de imágenes. Puede llamar a esta API mediante una SDK nativa o con llamadas a REST. Incluya Objects en el parámetro de consulta visualFeatures. Después, cuando obtenga la respuesta JSON completa, analice la cadena con el contenido de la sección "objects".