Detección de objetos

Artikulua
11/02/2024

En este artículo se explica el concepto de detección de objetos. La detección de objetos es similar al etiquetado, pero la API devuelve las coordenadas del rectángulo (en píxeles) que delimita cada objeto encontrado en la imagen. Por ejemplo, si una imagen contiene un perro, un gato y una persona, la operación de detección de objetos muestra esos objetos con sus coordenadas en la imagen. Puede usar esta funcionalidad para procesar las relaciones entre los objetos de una imagen. También permite determinar si hay varias instancias del mismo objeto en una imagen.

La función de detección de objetos aplica etiquetas basadas en los objetos o seres vivos identificados en la imagen. No hay ninguna relación formal entre la taxonomía de etiquetado y la taxonomía de detección de objetos. En un nivel conceptual, la función de detección de objetos solo encuentra objetos y elementos vivos, mientras que la función de etiqueta también puede incluir términos contextuales como interior, que no se pueden localizar con cuadros de límite.

Pruebe las funcionalidades de detección de objetos de forma rápida y sencilla en el explorador mediante Azure AI Vision Studio.

Prueba de Vision Studio

Ejemplo de detección de objetos

La siguiente respuesta JSON muestra lo que devuelve Analyze Image API cuando detecta objetos en la imagen de ejemplo.

Fotografía en la que se muestra a una mujer con un dispositivo Microsoft Surface en una cocina.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitaciones

Es importante tener en cuenta las limitaciones de la detección de objetos para que pueda evitar o mitigar los efectos de los falsos negativos (objetos que faltan) y los detalles limitados.

Normalmente, los objetos no se detectan si son pequeños (menos del 5 % de la imagen).
Normalmente, los objetos no se detectan si se organizan estrechamente (una pila de placas, por ejemplo).
Los objetos no se diferencian por nombres de marca o producto (diferentes tipos de refrescos en una estantería de la tienda, por ejemplo). Sin embargo, puede obtener información de la marca de una imagen mediante la característica de detección de la marca.

Uso de la API

La característica de detección de objetos forma parte de la API de análisis de imágenes. Puede llamar a esta API mediante una SDK nativa o con llamadas a REST. Incluya Objects en el parámetro de consulta visualFeatures. A continuación, cuando obtenga la respuesta JSON completa, analice la cadena para el contenido de la sección de objetos.

Inicio rápido: Image Analysis

Partekatu honen bidez:

Detección de objetos

Ejemplo de detección de objetos

Limitaciones

Uso de la API

Oharrak

Baliabide gehigarriak