Creación de un modelo personalizado de Image Analysis (versión preliminar)

Artículo
02/27/2024

Image Analysis 4.0 le permite entrenar un modelo personalizado con sus propias imágenes de entrenamiento. Al etiquetar las imágenes de forma manual, puede entrenar un modelo para aplicar etiquetas personalizadas a las imágenes (clasificación de imágenes) o detectar objetos personalizados (detección de objetos). Los modelos de Image Analysis 4.0 son eficaces, en particular, en el aprendizaje de pocas tomas, por lo que puede obtener modelos precisos con menos datos de entrenamiento.

En esta guía, se muestra cómo crear y entrenar un modelo de clasificación de imágenes personalizado. Se indican las pocas diferencias entre el entrenamiento de un modelo de clasificación de imágenes y el modelo de detección de objetos.

Requisitos previos

Una suscripción a Azure: cree una cuenta gratuita
Una vez que tenga la suscripción de Azure, cree un recurso de Visión en Azure Portal para obtener la clave y el punto de conexión. Si sigue esta guía con el uso de Vision Studio, debe crear el recurso en la región Este de EE. UU. Tras su implementación, seleccione Ir al recurso. Copie la clave y el punto de conexión en una ubicación temporal para usarlos más adelante.
Un recurso de Azure Storage: Crear uno
Un conjunto de imágenes con el que entrenar al modelo de clasificación. Puede usar el conjunto de imágenes de ejemplo en GitHub. O bien, puede usar sus propias imágenes. Aproximadamente solo necesita de 3 a 5 imágenes por clase.

Nota

No se recomienda usar modelos personalizados para los entornos críticos para la empresa debido a una posible latencia alta. Cuando los clientes entrenan modelos personalizados en Vision Studio, esos modelos personalizados pertenecen al recurso de Visión en el que se entrenaron y el cliente puede realizar llamadas a esos modelos mediante la API Analyze Image. Cuando realizan estas llamadas, el modelo personalizado se carga en la memoria y se inicializa la infraestructura de predicción. Mientras esto sucede, los clientes pueden experimentar una latencia mayor de la esperada al recibir resultados de predicción.

Vision Studio
REST API

Crear un nuevo modelo personalizado

Para empezar, vaya a Vision Studio y seleccione la pestaña Análisis de imágenes. A continuación, seleccione el icono Personalizar modelos.

Captura de pantalla del icono Personalizar modelos.

A continuación, inicie sesión con su cuenta de Azure y seleccione el recurso de Visión. Si no tienes una, puedes crearla desde esta pantalla.

Importante

Para entrenar un modelo personalizado en Vision Studio, la suscripción de Azure debe aprobarse para el acceso. Solicite acceso mediante este formulario.

Captura de pantalla de la pantalla de selección de recursos.

Preparar imágenes de entrenamiento

Debe cargar las imágenes de entrenamiento en un contenedor de Azure Blob Storage. Vaya al recurso de almacenamiento en el Azure Portal y vaya a la pestaña Explorador de almacenamiento. Aquí puede crear un contenedor de blobs y cargar las imágenes. Colóquelos todos en la raíz del contenedor.

Agregar un conjunto de datos

Para entrenar un modelo personalizado, debe asociarlo a un conjunto de datos donde proporcione imágenes y su información de etiqueta como datos de entrenamiento. En Vision Studio, seleccione la pestaña Conjuntos de datos para ver los conjuntos de datos.

Para crear un nuevo conjunto de datos, seleccione Agregar nuevo conjunto de datos. En la ventana emergente, escriba un nombre y seleccione un tipo de conjunto de datos para el caso de uso. Los modelos de clasificación de imágenes aplican etiquetas de contenido a toda la imagen, mientras que los modelos de detección de objetos aplican etiquetas de objeto a ubicaciones específicas de la imagen. Los modelos de reconocimiento de productos son una subcategoría de los modelos de detección de objetos optimizados para detectar productos comerciales.

Seleccionar Blob Storage

A continuación, seleccione el contenedor de la cuenta de Azure Blob Storage donde ha almacenado las imágenes de entrenamiento. Active la casilla para permitir que Vision Studio lea y escriba en el contenedor de Blob Storage. Este es un paso necesario para importar datos etiquetados. Cree el conjunto de datos.

Crear un proyecto de etiquetado de Azure Machine Learning

Necesita un archivo COCO para transmitir la información de etiquetado. Una manera sencilla de generar un archivo COCO es crear un proyecto de Azure Machine Learning, que incluye un flujo de trabajo de etiquetado de datos.

En la página de detalles del conjunto de datos, seleccione Agregar un nuevo proyecto de etiquetado de datos. Asígnele un nombre y seleccione Crear una nueva área de trabajo. Eso abre una nueva pestaña de Azure Portal donde puede crear el proyecto de Azure Machine Learning.

Seleccionar Azure Machine Learning

Una vez creado el proyecto de Azure Machine Learning, vuelva a la pestaña Vision Studio y selecciónelo en Área de trabajo. El portal de Azure Machine Learning se abrirá en una nueva pestaña del explorador.

Azure Machine Learning: crear etiquetas

Para iniciar el etiquetado, siga la indicación Agregar clases de etiquetas para agregar clases de etiquetas.

Clases de etiquetas

Agregar clases de etiquetas

Una vez que haya agregado todas las clases de etiquetas, guárdelas. Seleccione Iniciar en el proyecto y luego seleccione Etiquetar datos en la parte superior.

Inicio del etiquetado

Azure Machine Learning: etiquetar manualmente los datos de entrenamiento

Elija Iniciar etiquetado y siga las indicaciones para etiquetar todas las imágenes. Cuando haya terminado, vuelva a la pestaña Vision Studio del explorador.

Ahora seleccione Agregar archivo COCO y luego seleccione Importar archivo COCO desde un proyecto de etiquetado de datos de Azure ML. Esto importa los datos etiquetados de Azure Machine Learning.

El archivo COCO que acaba de crear se almacena ahora en el contenedor de Azure Storage que ha vinculado a este proyecto. Ahora puede importarlo en el flujo de trabajo de personalización del modelo. Selecciónela en la lista desplegable. Después de importar el archivo COCO en el conjunto de datos, este se puede usar para entrenar un modelo.

Nota

Importar archivos COCO desde otro lugar

Si tiene un archivo COCO listo para importar, vaya a la pestaña Conjuntos de datos y seleccione Add COCO files to this dataset. Puede optar por agregar un archivo COCO específico desde una cuenta de Blob Storage o importarlo desde el proyecto de etiquetado de Azure Machine Learning.

Actualmente, Microsoft está solucionando un problema que provoca un error en la importación de archivos COCO con conjuntos de datos grandes cuando se inician en Vision Studio. Para entrenar con un conjunto de datos grande, se recomienda usar la API de REST en su lugar.

Seleccionar COCO

Acerca de los archivos COCO

Los archivos COCO son archivos JSON con campos obligatorios específicos: "images", "annotations" y "categories". Un archivo COCO de ejemplo tendrá este aspecto:

{
 "images": [
   {
     "id": 1,
     "width": 500,
     "height": 828,
     "file_name": "0.jpg",
     "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/0.jpg"
   },
    {
      "id": 2,
      "width": 754,
      "height": 832,
      "file_name": "1.jpg",
      "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/1.jpg"
    },

   ...

  ],
  "annotations": [
    {
      "id": 1,
      "category_id": 7,
      "image_id": 1,
      "area": 0.407,
      "bbox": [
        0.02663142641129032,
        0.40691584277841153,
        0.9524163571731749,
        0.42766634515266866
      ]
    },
    {
      "id": 2,
      "category_id": 9,
      "image_id": 2,
      "area": 0.27,
      "bbox": [
        0.11803319477782331,
        0.41586723392402375,
        0.7765206955096307,
        0.3483334397217212
      ]
    },
    ...

  ],
  "categories": [
    {
      "id": 1,
      "name": "vegall original mixed vegetables"
    },
    {
      "id": 2,
      "name": "Amy's organic soups lentil vegetable"
    },
    {
      "id": 3,
      "name": "Arrowhead 8oz"
    },

    ...

  ]
}

Referencia de campos del archivo COCO

Si está generando su propio archivo COCO desde cero, asegúrese de que todos los campos necesarios se rellenen con los detalles correctos. Estas tablas describen cada campo de un archivo COCO:

"images"

Clave	Tipo	Description	¿Necesario?
`id`	integer	Identificador de imagen único; empieza desde 1	Sí
`width`	integer	Ancho de la imagen en píxeles	Sí
`height`	integer	Alto de la imagen en píxeles	Sí
`file_name`	string	Nombre único de la imagen.	Sí
`absolute_url` o `coco_url`	string	Ruta de acceso de imagen como un URI absoluto a un blob en un contenedor de blobs. El recurso de Visión debe tener permiso para leer los archivos de anotación y todos los archivos de imagen a los que se hace referencia.	Sí

Puede encontrar el valor de absolute_url en las propiedades del contenedor de blobs.

Dirección URL absoluta

"annotations"

Clave	Tipo	Description	¿Necesario?
`id`	integer	Id. de la anotación	Sí
`category_id`	integer	Id. de la categoría definida en la sección `categories`	Sí
`image_id`	integer	Id. de la imagen	Sí
`area`	integer	Valor de "Ancho" x "Alto" (tercer y cuarto valor de `bbox`)	No
`bbox`	list[float]	Coordenadas relativas del cuadro de límite (de 0 a 1), en el orden de "Izquierda", "Superior", "Ancho", "Alto"	Sí

"categories"

Clave	Tipo	Description	¿Necesario?
`id`	integer	Id. único para cada categoría (clase de etiqueta). Estos deben estar presentes en la sección `annotations`.	Sí
`name`	string	Nombre de la categoría (clase de etiqueta)	Sí

Comprobación de archivos COCO

Puede usar nuestro código de ejemplo de Python para comprobar el formato de un archivo COCO.

Entrenar el modelo personalizado

Para empezar a entrenar un modelo con el archivo COCO, vaya a la pestaña Modelos personalizados y seleccione Agregar un nuevo modelo. Escriba un nombre para el modelo y seleccione Image classification o Object detection como tipo de modelo.

Crear un modelo personalizado

Seleccione el conjunto de datos, que ahora está asociado al archivo COCO que contiene la información de etiquetado.

Luego seleccione un presupuesto de tiempo y entrene el modelo. Para obtener ejemplos pequeños, puede usar un presupuesto de 1 hour.

Revisar detalles del entrenamiento

El entrenamiento puede tardar en un rato en completarse. Los modelos de Image Analysis 4.0 pueden ser precisos con solo un pequeño conjunto de datos de entrenamiento, pero tardan más tiempo en entrenarse que los modelos anteriores.

Evaluar el modelo entrenado

Después de completar el entrenamiento, puede ver la evaluación del rendimiento del modelo. Se usan las métricas siguientes:

Clasificación de imágenes: Precisión promedio, Precisión con mejor puntuación, Precisión con mejores cinco
Detección de objetos: Media de precisión promedio @ 30, Media de precisión promedio @ 50, Media de precisión promedio @ 75

Si no se proporciona un conjunto de evaluación al entrenar el modelo, el rendimiento notificado se calcula en función de parte del conjunto de entrenamiento. Se recomienda encarecidamente usar un conjunto de datos de evaluación (usando el mismo proceso que antes) para tener una estimación confiable del rendimiento del modelo.

Captura de la evaluación

Probar el modelo personalizado en Vision Studio

Una vez que haya creado un modelo personalizado, puede probarlo seleccionando el botón Probar en la pantalla de evaluación del modelo.

Captura de pantalla de la pantalla de evaluación del modelo con el botón

Esto le lleva a la página Extraer etiquetas comunes de imágenes. Elija el modelo personalizado en el menú desplegable y cargue una imagen de prueba.

Captura de pantalla de selección del modelo de prueba en Vision Studio.

Los resultados de la predicción aparecen en la columna derecha.

Preparación de los datos de entrenamiento

Lo primero que debe hacer es crear un archivo COCO a partir de los datos de entrenamiento. Puede crear un archivo COCO al convertir un proyecto antiguo de Custom Vision mediante el script de migración. O bien, puede crear un archivo COCO desde cero con alguna otra herramienta de etiquetado. Use la siguiente especificación:

Acerca de los archivos COCO

Los archivos COCO son archivos JSON con campos obligatorios específicos: "images", "annotations" y "categories". Un archivo COCO de ejemplo tendrá este aspecto:

{
 "images": [
   {
     "id": 1,
     "width": 500,
     "height": 828,
     "file_name": "0.jpg",
     "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/0.jpg"
   },
    {
      "id": 2,
      "width": 754,
      "height": 832,
      "file_name": "1.jpg",
      "absolute_url": "https://blobstorage1.blob.core.windows.net/cpgcontainer/1.jpg"
    },

   ...

  ],
  "annotations": [
    {
      "id": 1,
      "category_id": 7,
      "image_id": 1,
      "area": 0.407,
      "bbox": [
        0.02663142641129032,
        0.40691584277841153,
        0.9524163571731749,
        0.42766634515266866
      ]
    },
    {
      "id": 2,
      "category_id": 9,
      "image_id": 2,
      "area": 0.27,
      "bbox": [
        0.11803319477782331,
        0.41586723392402375,
        0.7765206955096307,
        0.3483334397217212
      ]
    },
    ...

  ],
  "categories": [
    {
      "id": 1,
      "name": "vegall original mixed vegetables"
    },
    {
      "id": 2,
      "name": "Amy's organic soups lentil vegetable"
    },
    {
      "id": 3,
      "name": "Arrowhead 8oz"
    },

    ...

  ]
}

Referencia de campos del archivo COCO

Si está generando su propio archivo COCO desde cero, asegúrese de que todos los campos necesarios se rellenen con los detalles correctos. Estas tablas describen cada campo de un archivo COCO:

"images"

Clave	Tipo	Description	¿Necesario?
`id`	integer	Identificador de imagen único; empieza desde 1	Sí
`width`	integer	Ancho de la imagen en píxeles	Sí
`height`	integer	Alto de la imagen en píxeles	Sí
`file_name`	string	Nombre único de la imagen.	Sí
`absolute_url` o `coco_url`	string	Ruta de acceso de imagen como un URI absoluto a un blob en un contenedor de blobs. El recurso de Visión debe tener permiso para leer los archivos de anotación y todos los archivos de imagen a los que se hace referencia.	Sí

Puede encontrar el valor de absolute_url en las propiedades del contenedor de blobs.

Dirección URL absoluta

"annotations"

Clave	Tipo	Description	¿Necesario?
`id`	integer	Id. de la anotación	Sí
`category_id`	integer	Id. de la categoría definida en la sección `categories`	Sí
`image_id`	integer	Id. de la imagen	Sí
`area`	integer	Valor de "Ancho" x "Alto" (tercer y cuarto valor de `bbox`)	No
`bbox`	list[float]	Coordenadas relativas del cuadro de límite (de 0 a 1), en el orden de "Izquierda", "Superior", "Ancho", "Alto"	Sí

"categories"

Clave	Tipo	Description	¿Necesario?
`id`	integer	Id. único para cada categoría (clase de etiqueta). Estos deben estar presentes en la sección `annotations`.	Sí
`name`	string	Nombre de la categoría (clase de etiqueta)	Sí

Comprobación de archivos COCO

Puede usar nuestro código de ejemplo de Python para comprobar el formato de un archivo COCO.

Carga en el almacenamiento

Cargue el archivo COCO en un contenedor de Blob Storage, idealmente el mismo contenedor de blobs que contiene las propias imágenes de entrenamiento.

Crear el conjunto de datos de entrenamiento

La API datasets/<dataset-name> le permite crear un nuevo objeto de conjunto de datos que haga referencia a los datos de entrenamiento. Realice estos cambios en el siguiente comando cURL:

Reemplace <endpoint> por su punto de conexión de Visión de Azure AI.
Reemplace <dataset-name> por un nombre para el conjunto de datos.
Reemplace <subscription-key> por su clave de Visión de Azure AI.
En el cuerpo de la solicitud, establezca "annotationKind" en "imageClassification" o "imageObjectDetection", en función del proyecto.
En el cuerpo de la solicitud, establezca la matriz "annotationFileUris" en una matriz de cadenas que muestren las ubicaciones de URI de los archivos COCO en Blob Storage.

curl.exe -v -X PUT "<endpoint>/computervision/datasets/<dataset-name>?api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'annotationKind':'imageClassification',
'annotationFileUris':['<URI>']
}"

Crear y entrenar un modelo

La API models/<model-name> le permite crear un nuevo modelo personalizado y asociarlo a un conjunto de datos existente. También inicia el proceso de entrenamiento. Realice estos cambios en el siguiente comando cURL:

Reemplace <endpoint> por su punto de conexión de Visión de Azure AI.
Reemplace <model-name> por un nombre para el modelo.
Reemplace <subscription-key> por su clave de Visión de Azure AI.
En el cuerpo de la solicitud, establezca "trainingDatasetName" con el nombre del conjunto de datos del paso anterior.
En el cuerpo de la solicitud, establezca "modelKind" en "Generic-Classifier" o "Generic-Detector", en función del proyecto.

curl.exe -v -X PUT "<endpoint>/computervision/models/<model-name>?api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'trainingParameters': {
    'trainingDatasetName':'<dataset-name>',
    'timeBudgetInHours':1,
    'modelKind':'Generic-Classifier',
    }
}"

Evaluar el rendimiento del modelo en un conjunto de datos

La API models/<model-name>/evaluations/<eval-name> evalúa el rendimiento de un modelo existente. Realice estos cambios en el siguiente comando cURL:

Reemplace <endpoint> por su punto de conexión de Visión de Azure AI.
Reemplace <model-name> por el nombre de su modelo.
Reemplace <eval-name> por un nombre que se pueda usar para identificar de forma única la evaluación.
Reemplace <subscription-key> por su clave de Visión de Azure AI.
En el cuerpo de la solicitud, establezca "testDatasetName" con el nombre del conjunto de datos que desea usar para la evaluación. Si no tiene un conjunto de datos dedicado, puede usar el mismo conjunto de datos que ha usado para el entrenamiento.

curl.exe -v -X PUT "<endpoint>/computervision/models/<model-name>/evaluations/<eval-name>?api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'evaluationParameters':{
    'testDatasetName':'<dataset-name>'
    },
}"

La llamada API devuelve un objeto JSON ModelPerformance, que enumera las puntuaciones del modelo en varias categorías. Se usan las métricas siguientes:

Clasificación de imágenes: Precisión promedio, Precisión con mejor puntuación, Precisión con mejores cinco
Detección de objetos: Media de precisión promedio @ 30, Media de precisión promedio @ 50, Media de precisión promedio @ 75

Probar el modelo personalizado en una imagen

La API imageanalysis:analyze realiza operaciones habituales de análisis de imágenes. Al especificar algunos parámetros, puede usar esta API para consultar su propio modelo personalizado en lugar de los modelos de análisis de imágenes creados previamente. Realice estos cambios en el siguiente comando cURL:

Reemplace <endpoint> por su punto de conexión de Visión de Azure AI.
Reemplace <model-name> por el nombre de su modelo.
Reemplace <subscription-key> por su clave de Visión de Azure AI.
En el cuerpo de la solicitud, establezca "url" como la dirección URL de una imagen remota en la que desea probar el modelo.

curl.exe -v -X POST "<endpoint>/computervision/imageanalysis:analyze?model-name=<model-name>&api-version=2023-02-01-preview" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'
}"

La llamada API devuelve un objeto JSON ImageAnalysisResult, que contiene todas las etiquetas detectadas para un clasificador de imágenes u objetos para un detector de objetos, con sus puntuaciones de confianza.

{
  "kind": "imageAnalysisResult",
  "metadata": {
    "height": 900,
    "width": 1260
  },
  "customModelResult": {
    "classifications": [
      {
        "confidence": 0.97970027,
        "label": "hemlock"
      },
      {
        "confidence": 0.020299695,
        "label": "japanese-cherry"
      }
    ],
    "objects": [],
    "imageMetadata": {
      "width": 1260,
      "height": 900
    }
  }
}

Pasos siguientes

En esta guía, ha creado y entrenado un modelo de clasificación de imágenes personalizado con Image Analysis. A continuación, obtenga más información sobre la API Analyze Image 4.0 para que pueda llamar al modelo personalizado desde una aplicación mediante REST o SDK de bibliotecas.

Consulte la guía Conceptos de personalización de modelos para obtener una visión general amplia de esta característica y una lista de las preguntas más frecuentes.
Llamada a Analyze Image API.

Share via

Creación de un modelo personalizado de Image Analysis (versión preliminar)

Requisitos previos

Crear un nuevo modelo personalizado

Preparar imágenes de entrenamiento

Agregar un conjunto de datos

Crear un proyecto de etiquetado de Azure Machine Learning

Azure Machine Learning: crear etiquetas

Azure Machine Learning: etiquetar manualmente los datos de entrenamiento

Importar archivos COCO desde otro lugar

Acerca de los archivos COCO

Referencia de campos del archivo COCO

Comprobación de archivos COCO

Entrenar el modelo personalizado

Evaluar el modelo entrenado

Probar el modelo personalizado en Vision Studio

Preparación de los datos de entrenamiento

Acerca de los archivos COCO

Referencia de campos del archivo COCO

Comprobación de archivos COCO

Carga en el almacenamiento

Crear el conjunto de datos de entrenamiento

Crear y entrenar un modelo

Evaluar el rendimiento del modelo en un conjunto de datos

Probar el modelo personalizado en una imagen

Pasos siguientes

Recursos adicionales