Compartir a través de


Recopilar imágenes

Para entrenar un modelo de detección de objetos para que reconozca los objetos, debe recopilar imágenes que contengan esos objetos. Para obtener mejores resultados, siga las directrices sobre la cantidad y la calidad de las imágenes.

Formato y tamaño

Las imágenes que use como fuente para su modelo de detección de objeto deben tener estas características:

  • Formato:

    • JPG
    • PNG
    • BMP
  • Tamaño:

    • Máximo 6 MB para entrenamiento
    • Ancho/alto mínimo de 256 píxeles x 256 píxeles

Cantidad y equilibrio de datos

Es importante cargar suficientes imágenes para entrenar el modelo de IA. Un buen punto de partido es tener al menos 15 imágenes por objeto para el conjunto de entrenamiento. Con menos imágenes hay un riesgo probable de que el modelo aprenda conceptos que son solo ruido o no pertinentes. El entrenamiento del modelo con más imágenes aumentará la precisión.

Otra consideración es asegurarse de que los datos están equilibrados. Si tiene 500 imágenes de un objeto y solo 50 de otro, el conjunto de datos de entrenamiento no estará equilibrado. Es probable que el modelo sea mejor reconociendo uno de los objetos. Para unos resultados más coherentes, mantenga al menos una relación 1:2 entre el objeto con menos imágenes y el que tiene más. Por ejemplo, si el objeto con el mayor número de imágenes tiene 500 imágenes, el objeto con menos imágenes debe tener al menos 250 imágenes para el entrenamiento.

Usar imágenes más variadas

Proporcione las imágenes representativas de qué se enviará al modelo durante su uso normal. Por ejemplo, supongamos que va a entrenar un modelo para reconocer manzanas. Si solo entrena imágenes de manzanas en un plato, es posible que no reconozca de forma coherente las manzanas en los árboles. Al incluir diferentes tipos de imágenes se asegurará de que el modelo sea imparcial y pueda generalizar correctamente. A continuación aparecen algunas formas de diversificar el entrenamiento.

Fondo

Use imágenes de sus objetos frente a diferentes fondos, por ejemplo, fruta en platos, en manos y en árboles. Las fotos en contexto son mejores que las fotos delante de fondos neutrales porque proporcionan más información para el clasificador.

Fondos de imágenes.

Iluminación

Use imágenes de entrenamiento que tengan distinta iluminación, en especial si las imágenes usadas para la detección podrían tener una iluminación diferente. Por ejemplo, incluya imágenes tomadas con flash, alta exposición, etc. También es útil incluir imágenes con la saturación, el matiz y el brillo variados. Es probable que la cámara del dispositivo le permita controlar esta configuración.

Iluminación de imagen.

Tamaño de objeto

Proporcione imágenes en las que los objetos sean de diversos tamaños, capturando diferentes partes del objeto, por ejemplo, una foto de un racimo de plátanos y un primer plano de un solo plátano. Los tamaños distintos ayudan al modelo a generalizar mejor.

Tamaños de objeto.

Ángulo de la cámara

Intente proporcionar imágenes tomadas desde distintos ángulos. Si todas las fotografías provienen de un conjunto de cámaras fijas, como cámaras de vigilancia, asigne una etiqueta diferente a cada cámara. De esta forma, se evita incluir en el modelo objetos no relacionados, como farolas, como característica principal. Asigne etiquetas a las cámaras incluso si las cámaras capturan los mismos objetos.

Ángulos de cámara.

Resultados inesperados

Los modelos de IA pueden aprender incorrectamente características que sus imágenes tienen en común. Supongamos que quiere crear un modelo para distinguir las manzanas de los cítricos. Si usa imágenes de manzanas en la mano y de cítricos en platos blancos, el modelo podría entrenarse para distinguir manos de platos blancos en lugar de manzanas de cítricos.

Resultados inesperados.

Para solucionar esto, use la guía previa sobre entrenamiento con imágenes más variadas: proporcione imágenes con ángulos, fondos y tamaños de objeto distintos, grupos de objetos y otras variantes.

Introducción a la detección de objetos