Detección de objetos (versión 4.0)

2025-05-31

La detección de objetos es similar al etiquetado, pero la API devuelve las coordenadas del rectángulo (en píxeles) que delimita cada objeto encontrado en la imagen. Por ejemplo, si una imagen contiene un perro, un gato y una persona, la operación de detección de objetos muestra esos objetos con sus coordenadas en la imagen. Puede usar esta funcionalidad para procesar las relaciones entre los objetos de una imagen. También permite determinar si hay varias instancias del mismo objeto en una imagen.

La función de detección de objetos aplica etiquetas basadas en los objetos o seres vivos identificados en la imagen. No hay ninguna relación formal entre la taxonomía de etiquetado y la taxonomía de detección de objetos. En un nivel conceptual, la función de detección de objetos solo encuentra objetos y seres vivos, mientras que la función de etiquetado también puede incluir términos contextuales como interior, que no se pueden localizar con cajas delimitadoras.

Pruebe las funcionalidades de detección de objetos de forma rápida y sencilla en el explorador mediante Azure AI Vision Studio.

Prueba Vision Studio

Ejemplo de detección de objetos

La siguiente respuesta JSON muestra lo que devuelve la API Image Analysis 4.0 al detectar objetos en la imagen de ejemplo.

Fotografía de una mujer que usa un dispositivo Microsoft Surface en una cocina.

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Limitaciones

Tenga en cuenta las limitaciones de la detección de objetos para que pueda evitar o mitigar los efectos de falsos negativos (objetos perdidos) y detalles limitados.

Por lo general, los objetos no se detectan si son muy pequeños (menores del 5 % de la imagen).
Los objetos no se suelen detectar si están cerca (en una pila de platos, por ejemplo).
Los objetos no se diferencian por nombres de marca o producto (diferentes tipos de refrescos en una estantería de la tienda, por ejemplo). Sin embargo, puede obtener información de la marca de una imagen mediante la característica de detección de la marca.

Uso de la API

La característica de detección de objetos forma parte de la API de análisis de imágenes. Puede llamar a esta API mediante REST. Incluya Objects en el parámetro de consulta features. Después, cuando obtenga la respuesta JSON completa, analice la cadena con el contenido de la sección "objects".

Paso siguiente

Llame a la API Analyze Image

Compartir a través de

Detección de objetos (versión 4.0)

Ejemplo de detección de objetos

Limitaciones

Uso de la API

Paso siguiente

Comentarios

Recursos adicionales