Compartir a través de


Mejores prácticas para la comprensión de contenido

Azure AI Content Understanding es un servicio innovador de inteligencia artificial generativa diseñado para facilitar el análisis preciso y preciso de conjuntos de datos extensos. El servicio procesa diversas modalidades de contenido, incluidos documentos, imágenes, vídeos y audio, transformándolos en formatos de salida especificados por el usuario.

En este documento se proporcionan instrucciones y procedimientos recomendados para usar de forma eficaz Content Understanding para los requisitos de procesamiento y análisis de datos.

Usar descripciones de campo para orientar el resultado

Al definir un esquema, es esencial proporcionar descripciones detalladas de campos. Las descripciones claras y concisas guían el modelo para centrarse en la información correcta, lo que mejora la precisión de la salida.

Ejemplo 1
  • Si desea extraer la fecha de una factura, además de asignar un nombre al campo Date, proporcione una descripción como:

    The date when the invoice was issued, typically found at the top right corner of the document.

Ejemplo 2
  • Supongamos que desea extraer el Customer Name de una factura. La descripción podría leer:

    The name of the customer or client to whom this invoice is addressed, usually located near the billing address. It should be the name of the business or person, but not the entire mailing address.

Corrección de errores mediante la edición de descripciones de campos

Si la salida del sistema no cumple las expectativas, el primer paso es intentar refinar y actualizar las descripciones del campo. Aclarar el contexto y ser más explícito sobre lo que necesita, reduce la ambigüedad y mejora la precisión.

Ejemplo 3
  • Si el Shipping date campo generó una extracción incoherente o incorrecta, a menudo después de una Dispatch Date etiqueta, actualícela a algo más preciso como:

    The date when the products were shipped, typically found below the item list. It may also be labeled something similar like Delivery Date or Dispatch Date. Dates should typically have a format like 1/23/2024 or 01-04-2025.

  • Este contexto adicional guía el modelo a la ubicación correcta del documento.

Uso de campos de clasificación para salidas específicas

Cuando necesite que el sistema elija entre un conjunto de opciones predefinidas, por ejemplo, el tipo de documento, la categoría del producto o el estado, use campos de clasificación. Cuando haya ambigüedad con las opciones, proporcione descripciones claras para cada opción, lo que permite que el modelo clasifique los datos con precisión.

Ejemplo 4
  • Si necesita clasificar documentos como Invoice, Claimo Report, cree un campo de clasificación con estas palabras como nombres de categoría.
Ejemplo 5
  • Al procesar imágenes de producto, es posible que tenga que asignarlas a categorías como AlcoholicDrinks, SoftDrinks, Snacksy DairyProducts. Dado que algunos elementos pueden parecerse, proporcionar definiciones precisas para casos de llamada cercana puede ayudar. Por ejemplo:

    • Alcoholic Drinks: bebidas que contienen alcohol, como cerveza, vino y licores. Esta categoría excluye refrescos u otras bebidas no alcohólicas.

    • Soft Drinks: bebidas carbonatadas no alcohólicas, como refrescos y agua espumosa. Esta categoría no incluye jugos ni bebidas alcohólicas.

  • Al definir claramente cada categoría, asegúrese de que el sistema clasifica correctamente los productos a la vez que minimiza la clasificación incorrecta.

Usar puntuaciones de confianza para determinar cuándo se necesita revisión humana

Las puntuaciones de confianza le ayudan a decidir cuándo involucrar a los revisores humanos. Los clientes pueden interpretar las puntuaciones de confianza mediante umbrales para decidir qué resultados necesitan más revisiones, lo que minimiza el riesgo de errores.

Ejemplo 6
  • Para un caso de uso de revisión de la factura, si un campo clave extraído como TotalInvoiceAmount tiene una puntuación de confianza inferior a 0,80, envíe ese documento a revisión manual. Esto ayuda a garantizar que un usuario comprueba campos críticos, como totales de factura o declaraciones legales cuando sea necesario.

  • Puede establecer diferentes umbrales de confianza en función del tipo de campo. Por ejemplo, un umbral inferior para un Comments campo que es menos crítico y uno mayor para ContractTerminationDate garantizar que no haya errores.

Reducir los errores mediante la restricción de la selección de idioma para audio y vídeo

Cuando esté trabajando con contenido de audio y vídeo, seleccionar un conjunto estrecho de idiomas para la transcripción puede reducir potencialmente los errores. Cuantos más idiomas incluya, más tiene que adivinar qué idioma se habla, lo que puede aumentar la falta de reconocimiento.

Ejemplo 7
  • Si está seguro de que el contenido solo contiene inglés y español, configurar la transcripción en solo estos dos idiomas puede mejorar la calidad. Pero si el contenido incluye accidentalmente otros idiomas, esta configuración puede degradar realmente la calidad general.

Transcripción, texto del documento y datos del hablante: campos no obligatorios

De forma predeterminada, se puede acceder a la información de extracción de contenido, como transcripciones de voz, texto de documento extraído por OCRy fotogramas clave de vídeo directamente desde la salida del analizador para su revisión inmediata o procesamiento personalizado. No es necesario definir un campo en el esquema para estos elementos. Los campos se pueden usar cuando se necesita más procesamiento, por ejemplo, resumir transcripciones, identificar entidades o extraer elementos específicos de OCR. Cada campo puede indicar al sistema que extraiga o genere el contenido que necesita.