Partekatu honen bidez:


Compilación y entrenamiento de un modelo generativo personalizado con AI Studio

En este artículo, aprenderá a compilar y entrenar un modelo generativo personalizado con Azure AI Studio. Los modelos personalizados de Documento de inteligencia requieren tan solo cinco documentos de entrenamiento para empezar. ¿Tiene al menos cinco documentos? Si es así, vamos a empezar a entrenar y probar el modelo generativo personalizado.

Requisitos previos

  • Necesita una suscripción de Azure activa. Si no tiene una suscripción de Azure, puede crear una gratis.

  • Una vez que tenga la suscripción de Azure A instancia de Documento de instancia en Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio.

  • Después de implementar el recurso, seleccione el botón Ir al recurso para obtener la clave y el punto de conexión.

    • Necesita la clave y el punto de conexión del recurso para conectar la aplicación al servicio de Documento de inteligencia. En una sección posterior de este mismo inicio rápido, va a pegar la clave y el punto de conexión en el código. Puede encontrar estos valores en la página Claves y punto de conexión de Azure Portal.

Autorización de contenedor de almacenamiento

Puede elegir una de las siguientes opciones para autorizar el acceso al recurso Document.

✔️ Identidad administrada. La identidad administrada de Azure es una entidad de servicio que crea una identidad de Microsoft Entra y permisos específicos para los recursos administrados de Azure. Las identidades administradas le permiten ejecutar su aplicación Documento de inteligencia sin tener que incrustar credenciales en su código. Las identidades administradas son una manera más segura de conceder acceso a los datos de almacenamiento y reemplazar el requisito de incluir tokens de firma de acceso compartido (SAS) con las direcciones URL de origen y resultado.

Para más información, consulte Identidades administradas para el Documento de inteligencia.

Recorte de pantalla del flujo de identidad administrada (control de acceso basado en rol).

Importante

  • Al usar identidades administradas, no incluya una dirección URL de token de SAS con las solicitudes HTTP, ya que si lo hace, se producirá un error en las solicitudes. El uso de identidades administradas reemplaza el requisito de incluir tokens de firma de acceso compartido (SAS). Una firma de acceso compartido (SAS). Una firma de acceso compartido es una URL que concede acceso restringido durante un periodo de tiempo determinado a su servicio del Documento de inteligencia. Para utilizar este método, es necesario crear tokens de Firma de acceso compartido (SAS) para los contenedores de origen y resultado. Los contenedores de origen y de resultados deben incluir un token de Firma de acceso compartido (SAS), anexado como una cadena de consulta. El token se puede asignar al contenedor o a blobs específicos.

Captura de pantalla del URI de almacenamiento con el token de SAS anexado.

  • El contenedor de origen o el blob deben designar el acceso de lectura, escritura, listay eliminación.
  • El contenedor de resultados o el blob deben designar el acceso de escritura, listay eliminación.

Para más información, consulte Creación de tokens de SAS.

Datos de aprendizaje.

Siga estas sugerencias para optimizar el conjunto de datos para el entrenamiento:

  • Use documentos PDF basados en texto en lugar de documentos basados en imágenes. Los PDF escaneados se tratan como imágenes.

  • Use ejemplos que tienen todos los campos completados para formularios con campos de entrada.

  • Use formularios con valores distintos en cada campo.

  • Use un conjunto de datos mayor (imágenes de 10 a 15) si las imágenes de formulario son de menor calidad.

Una vez que tenga los contenedores de Azure Blob Storage, cargue los datos de entrenamiento en los contenedores de origen. Ahora está listo para entrenar el modelo generativo personalizado.

Inteligencia artificial de Azure Studio

  1. Vaya a Inteligencia artificial de Azure Studio. La primera vez que use Studio, debe inicializar la suscripción y crear un centro antes de crear un proyecto. Los modelos generativos personalizados solo están disponibles en Este de EE. UU. y Centro-norte de EE. UU. en versión preliminar. Asegúrese de que el grupo de recursos está establecido en Este de EE. UU. o Centro-norte de EE. UU. durante la creación del centro de conectividad.

  2. Seleccione el icono Visión + Documento.

    Recorte de pantalla del icono de inteligencia y visión del documento.

  3. A continuación, seleccione el icono Extracción de campos de documento y seleccione el botón Crear proyecto de extracción de campos de documento para crear un proyecto.

    Recorte de pantalla de la página crear proyecto de extracción de campos de documento.

  4. Creación del proyecto. Para obtener más información, vea Creación de un proyecto en Inteligencia artificial de Azure Studio.

  5. Cree una conexión de servicios de Azure AI para acceder al servicio Servicios de Azure AI:

    Recorte de pantalla de la página de información general del proyecto de creación de extracción de documentos.

  6. A continuación, seleccione la cuenta de almacenamiento que usó para cargar el conjunto de datos que desea utilizar para entrenar el modelo personalizado.

    Recorte de pantalla de la página de configuración de datos del proyecto de extracción de documentos.

  7. Revise la configuración del proyecto y seleccione Create a Project para crear un proyecto. Una vez seleccionado el proyecto, debería estar ahora en la ventana Define schema y ver los archivos del conjunto de datos enumerados.

Definición del esquema

  • Para el proyecto, la primera tarea consiste en agregar los campos para extraer y definir un esquema.

  • Los archivos cargados se muestran y puede usar la opción desplegable para seleccionar archivos. Para empezar a agregar campos, haga clic en el ➕ Add new field botón.

  • Escriba un nombre, una descripción y un tipo para el campo que se va a extraer. Una vez agregados todos los campos, seleccione el Save botón situado en la parte inferior de la pantalla.

Etiquetado de datos

  • Una vez guardado el esquema, todos los documentos de entrenamiento cargados se analizan y los valores de campo se extraen automáticamente. Los valores de campo se muestran en la pantalla para su revisión. Los campos autoextraídos se etiquetan como Predecidos.

  • Revise los valores previstos. Si el valor del campo es incorrecto o no se extrae, puede mantener el puntero sobre el campo previsto. Seleccione el botón editar para realizar los cambios:

    Recorte de pantalla del botón de edición del proyecto de extracción.

  • Una vez realizado el cambio, la etiqueta de predicción muestra Corrected:

    Recorte de pantalla del indicador corregido del proyecto de extracción.

  • Continúe revisando los campos previstos. Una vez que las etiquetas se revisen y corrijan para todos los documentos de entrenamiento, continúe con la compilación del modelo.

    Nota:

    Siempre se puede volver atrás y actualizar el esquema durante el entrenamiento del modelo, pero para utilizar la función de etiquetado automático, es necesario eliminar y volver a cargar los archivos utilizando la Upload files opción.

Compilar el modelo

Con el conjunto de datos etiquetado, está listo para entrenar el modelo. Seleccione Build model. En la página de diálogo Construir modelo, proporcione un nombre de modelo único y, opcionalmente, una descripción. El identificador del modelo acepta un tipo de datos de String.

Recorte de pantalla de la página compilar un modelo de extracción.

Seleccione Build para iniciar el proceso de entrenamiento. ¡Los modelos generativos se entrenan al instante! Actualice la página para seleccionar el modelo una vez que se cambie el estado para que se realice correctamente.

Comprobación del modelo

  • Una vez completado el entrenamiento del modelo, puede probar el modelo seleccionando Test el botón en la página CustomGenerative.

    Recorte de pantalla de la página generativa personalizada.

  • Cargue los archivos de prueba y seleccione Run Analysis para extraer los valores de campo de los documentos. Con la Analyze opción, puede elegir ejecutar y analizar en el documento actual o en todos los documentos.

  • Valide la precisión del modelo mediante la evaluación de los resultados de cada campo.

Eso es todo. Ha aprendido a entrenar un modelo generativo personalizado en Inteligencia artificial de Azure Studio. El modelo está listo para usarse con la API REST o el SDK para analizar documentos.

Pasos siguientes

Más información sobre el modelo generativo personalizado

Más información sobre la precisión y confianza del modelo personalizado