Compartir a través de


Solución de problemas para el ajuste preciso de Azure OpenAI

¿Cómo se habilita el ajuste preciso?

Para acceder correctamente al ajuste preciso, necesita Colaborador de OpenAI de Cognitive Services asignado. Incluso alguien con permisos de administrador de servicios de alto nivel necesitaría esta cuenta establecida explícitamente para acceder al ajuste preciso. Para más información, consulte las instrucciones de control de acceso basado en rol.

¿Por qué se produjo un error en la carga?

Si se produce un error en la carga de archivos en el Portal de la Fundición de IA de Azure, puede ver el mensaje de error en Archivos de datos. Mantenga el mouse sobre donde indica el error (en la columna de estado) y se mostrará una explicación del error.

Captura de pantalla del mensaje de error de ajuste preciso.

Mi modelo finamente ajustado no parece haber mejorado

  • Mensaje del sistema que falta: Debe proporcionar un mensaje del sistema cuando realice un ajuste; querrá proporcionar ese mismo mensaje del sistema cuando utilice el modelo ajustado. Si proporciona un mensaje de sistema diferente, es posible que vea resultados diferentes a aquellos para los que realizó el ajuste.

  • Datos insuficientes: mientras que 10 es el mínimo para que se ejecute la canalización, necesita cientos de puntos de datos, o incluso miles, para enseñar al modelo una nueva aptitud. Con muy pocos puntos de datos se corre el riesgo de un sobreajuste y una generalización deficiente. El modelo con ajuste preciso puede funcionar bien en los datos de entrenamiento pero de manera deficiente en otros datos porque ha memorizado los ejemplos de entrenamiento en lugar de los patrones de aprendizaje. Para obtener los mejores resultados, planee preparar un conjunto de datos con cientos o miles de puntos de datos.

  • Datos incorrectos: un conjunto de datos mal mantenido o no representativo producirá un modelo de baja calidad. El modelo puede aprender patrones inexactos o sesgados del conjunto de datos. Por ejemplo, si está entrenando un bot de chat para el servicio al cliente, pero solo proporciona datos de entrenamiento para un escenario (por ejemplo, devoluciones de elementos), no sabrá cómo responder a otros escenarios. O, si los datos de entrenamiento son incorrectos (contiene respuestas incorrectas), el modelo aprenderá a proporcionar resultados incorrectos.

Optimización con visión

Qué hacer si se omiten las imágenes

Las imágenes se pueden omitir por los siguientes motivos:

  • contienen CAPTCHA
  • contiene personas
  • contiene caras

Quite la imagen. Por ahora, no podemos ajustar los modelos con imágenes que contienen estas entidades.

Problemas comunes

Cuestión Motivo o solución
Imágenes omitidas Las imágenes se pueden omitir por las siguientes razones: contienen CAPTCHA, personas o caras.

Quite la imagen. Por ahora, no podemos ajustar los modelos con imágenes que contienen estas entidades.
Dirección URL inaccesible Compruebe que la dirección URL de la imagen es accesible públicamente.
Imagen demasiado grande Compruebe que las imágenes se encuentran dentro de nuestros límites de tamaño del conjunto de datos.
Formato de imagen no válido Compruebe que las imágenes se encuentran dentro del formato del conjunto de datos.

Cómo cargar archivos grandes

Los archivos de formación podrían ser bastante grandes. Puede cargar archivos de hasta 8 GB en varias partes usando la API de Uploads, a diferencia de la API de Files, que solo permite cargar archivos de hasta 512 MB.

Reducción del costo de entrenamiento

Si establece el parámetro de detalle de una imagen en bajo, la imagen se redimensiona a 512 por 512 píxeles y solo se representa con 85 tokens independientemente de su tamaño. Esto reducirá el costo del entrenamiento.

{ 
    "type": "image_url", 

    "image_url": { 

        "url": "https://raw.githubusercontent.com/MicrosoftDocs/azure-ai-docs/main/articles/ai-services/openai/media/how-to/generated-seattle.png", 

        "detail": "low" 

    } 
} 

Otras consideraciones para la optimización de la visión

Para controlar la fidelidad de la comprensión de la imagen, establezca el parámetro de detalle de image_url en low, high o auto para cada imagen. Esto también afectará al número de tokens por imagen que el modelo ve durante el tiempo de entrenamiento y afectará al costo del entrenamiento.