Compartir a través de


Introducción a estudio del documento de inteligencia

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.1 (GA)marca de verificación azulv3.0 (GA)

Estudio del documento de inteligencia es una herramienta en línea para explorar, comprender e integrar visualmente las funciones del servicio de Documento de inteligencia en sus aplicaciones. Para comenzar a usarlo, puede explorar los modelos previamente entrenados con documentos de ejemplo o los suyos propios. También puede crear proyectos en los que producir modelos de plantilla personalizados y haga referencia a ellos en las aplicaciones mediante la versión del SDK de Python y otros inicios rápidos.

Requisitos previos para nuevos usuarios

Sugerencia

Cree un recurso de servicios de Azure AI si tiene previsto acceder a varios servicios de Azure AI en un único punto de conexión o clave. Para obtener acceso solo a Documento de inteligencia cree un recurso de Documento de inteligencia. Tenga en cuenta que necesitará un recurso de servicio único si piensa usar autenticación de Microsoft Entra.

Document Intelligence ahora admite la autenticación de tokens de AAD adicional a la autenticación local (basada en claves) al acceder a los recursos y las cuentas de almacenamiento de Document Intelligence. Asegúrese de seguir las instrucciones siguientes para configurar los roles de acceso correctos, especialmente si los recursos se aplican con la directiva DisableLocalAuth.

Asignaciones de roles de Azure

Para el análisis de documentos y los modelos creados previamente, se requieren las siguientes asignaciones de roles para diferentes escenarios.

  • Básico
    • Usuario de Cognitive Services: necesita este rol para documentar inteligencia o recursos de servicios de Azure AI para escribir la página de análisis.
  • Avanzado
    • Colaborador: necesita este rol para crear un grupo de recursos, un servicio Document Intelligence o un recurso de servicios de Azure AI.

Para más información sobre la autorización, consulteDirectivas de autorización de Estudio de Documento de inteligencia.

Nota:

Si la autenticación local (basada en claves) está deshabilitada para el recurso del servicio Document Intelligence, asegúrese de obtener el rol de usuario de Cognitive Services y el token de AAD se usará para autenticar las solicitudes en Document Intelligence Studio. El rol Colaborador solo le permite enumerar claves, pero no le concede permiso para usar el recurso cuando el acceso a claves está deshabilitado.

Modelos

Los modelos precompilados le ayudan a agregar funciones de Documento de inteligencia a sus aplicaciones sin tener que crear, entrenar y publicar sus propios modelos. Puede elegir entre varios modelos precompilados previamente, cada uno de los cuales tiene su propio conjunto de campos de datos admitidos. La elección del modelo que se va a utilizar para la operación analyze depende del tipo de documento que se va a analizar. Actualmente, Documento de inteligencia admite los siguientes modelos predefinidos:

Análisis de documentos

  • Diseño: extrae texto, tablas, marcas de selección e información de estructura de documentos (PDF, TIFF) e imágenes (JPG, PNG, BMP).
  • Read: extrae líneas de texto, palabras, sus ubicaciones, idiomas detectados y estilo manuscrito si se detecta en documentos (PDF, TIFF) e imágenes (JPG, PNG, BMP).

Creada previamente

  • Factura: extrae texto, marcas de selección, tablas, pares clave-valor e información importante de las facturas.
  • Recibo: extrae texto e información clave de los recibos.
  • Tarjeta de seguro médico: extraiga aseguradoras, miembros, recetas, números de grupo y otra información clave de las tarjetas de seguro de salud de EE. UU.
  • W-2: extraer texto e información clave de los formularios de impuestos W-2.
  • Documento de identificación: extrae texto e información clave de permisos de conducir y pasaportes internacionales.

Personalizado

  • Modelos de extracción personalizados: extraiga información de formularios y documentos con modelos de extracción personalizados. Para entrenar rápidamente un modelo, etiquete tan solo cinco documentos de ejemplo.
  • Modelo de clasificación personalizado: Entrene un clasificador personalizado para distinguir entre los distintos tipos de documento dentro de las aplicaciones. Entrene rápidamente un modelo con tan solo dos clases y cinco ejemplos por clase.

Una vez completados los requisitos previos, vaya a Document Intelligence Studio.

  1. Seleccione una función de servicio de documento de inteligencia en la página de inicio de Studio. Se trata de un paso único a menos que ya haya seleccionado el recurso de servicio del uso anterior. Seleccione la suscripción de Azure, el grupo de recursos y el recurso. (Los recursos se pueden cambiar en cualquier momento en "Configuración" en el menú superior). Revise y confirme las selecciones.

  2. Seleccione el botón Analizar para ejecutar el análisis en el documento de ejemplo, o bien pruebe el documento mediante el comando Agregar.

  3. Use los controles de la parte inferior de la pantalla para acercar y alejar y girar la vista del documento.

  4. Observe el contenido extraído resaltado en la vista de documento. Mantenga el puntero sobre las claves y los valores para ver los detalles de estos.

  5. Seleccione la pestaña Resultados de la sección de salida y examine la salida JSON para comprender el formato de respuesta del servicio.

  6. Seleccione la pestaña Código y examine el código de ejemplo para la integración. Copie y descargue para empezar.

Requisitos previos agregados para proyectos personalizados

Además de la cuenta Azure y un recurso de servicios de documento de inteligencia o Azure AI, necesita:

Contenedor de Azure Blob Storage

Una cuenta de Azure Blob Storage con un rendimiento estándar. Creará contenedores para almacenar y organizar los documentos de entrenamiento en la cuenta de almacenamiento. Si no sabe cómo crear una cuenta de almacenamiento de Azure con un contenedor, siga estos inicios rápidos:

  • Creación de una cuenta de almacenamiento. Al crear la cuenta de almacenamiento, asegúrese de seleccionar rendimiento Estándar en el campo Detalles de instancia → Rendimiento.
  • Creación de un contenedor. Al crear un contenedor, establezca el campo Nivel de acceso público en Contenedor (acceso anónimo de lectura para contenedores y blobs) en la ventana Nuevo contenedor.

Asignaciones de roles de Azure

En el caso de los proyectos personalizados, se requieren las siguientes asignaciones de roles para distintos escenarios.

  • Básico
    • Usuario de Cognitive Services: Necesita este rol para el recurso de inteligencia de documentos o servicios de Azure AI para entrenar el modelo personalizado o realizar análisis con modelos entrenados.
    • Colaborador de datos de Storage Blob: Necesita este rol para que la cuenta de almacenamiento cree un proyecto y etiquete los datos.
  • Avanzado
    • Colaborador de la cuenta de almacenamiento: necesita este rol para que la cuenta de almacenamiento configure la configuración de CORS (esta acción es un esfuerzo único si se reutiliza la misma cuenta de almacenamiento).
    • colaborador: Necesita este rol para crear un grupo de recursos y recursos.

Configuración de CORS

CORS (uso compartido de recursos entre orígenes) debe configurarse en la cuenta de almacenamiento de Azure para que sea accesible desde Estudio de documento de inteligencia. Para configurar CORS en Azure Portal, necesita acceso a la pestaña CORS de su cuenta de almacenamiento.

  1. Seleccione la pestaña CORS de la cuenta de almacenamiento.

    Captura de pantalla del menú de configuración de CORS en Azure Portal.

  2. Empiece por crear una nueva entrada de CORS en Blob service.

  3. Establezca Orígenes permitidos en https://documentintelligence.ai.azure.com.

    Captura de pantalla que muestra la configuración de CORS para una cuenta de almacenamiento.

    Sugerencia

    También puede utilizar el carácter comodín (*), en lugar de un dominio específico, para permitir que todos los dominios de origen hagan solicitudes a través de CORS.

  4. Seleccione las ocho opciones disponibles de Métodos permitidos.

  5. Apruebe todos los encabezados permitidos y los encabezados expuestos; para ello, escriba * en cada campo.

  6. Establezca la antigüedad máxima en 120 segundos o cualquier valor aceptable.

  7. Seleccione el botón Guardar de la parte superior de la página para guardar los cambios.

CORS debe configurarse ahora para utilizar la cuenta de almacenamiento desde Estudio de documento de inteligencia.

Conjunto de documentos de ejemplo

  1. Inicie sesión en Azure portal y vaya a Su cuenta de almacenamiento>Almacenamiento de datos>Contenedores.

    Captura de pantalla del menú Almacenamiento de datos en Azure Portal.

  2. Seleccione un contenedor de la lista.

  3. En el menú de la parte superior de la página, seleccione Cargar.

    Captura de pantalla del botón de carga de contenedores en Azure Portal.

  4. Aparece la ventana Cargar blob.

  5. Seleccione los archivos que quiere cargar.

    Captura de pantalla de la ventana Cargar blob en Azure Portal.

Nota:

De manera predeterminada, Studio usará los documentos que se encuentran en la raíz del contenedor. Sin embargo, puede usar datos organizados en carpetas si se especifica la ruta de la carpeta en los pasos de creación del proyecto de formulario personalizado. ConsulteOrganización de los datos en subcarpetas.

Modelos personalizados

Para crear modelos personalizados, empiece por configurar el proyecto:

  1. En la página principal de Studio, seleccione la tarjeta Custom model (Modelo personalizado) para abrir la página Custom models (Modelos personalizados).

  2. Use el comando "Crear un proyecto" para iniciar el asistente para la configuración del nuevo proyecto.

  3. Escriba los detalles del proyecto, seleccione la suscripción y el recurso de Azure y el contenedor de Azure Blob Storage que contiene los datos.

  4. Revise y envíe los valores para crear el proyecto.

  5. Use la característica de etiquetado automático para usar un modelo ya entrenado o uno de nuestros modelos precompilados.

  6. Para etiquetar manualmente desde cero, defina las etiquetas y tipos que esté quiera extraer.

  7. Seleccione el texto del documento y la etiqueta de la lista desplegable o el panel etiquetas.

  8. Etiquete cuatro documentos más para tener al menos cinco documentos etiquetados.

  9. Seleccione el comando Entrenar e introduzca el nombre del modelo, seleccione si quiere el modelo neuronal (recomendado) o de plantilla para empezar a entrenar el modelo personalizado.

  10. Una vez que el modelo esté listo, use el comando Probar para validarlo con los documentos de prueba y observar los resultados.

Demostración del modelo personalizado de documento de inteligencia

Etiquetado como tablas

Nota

  • Con el lanzamiento de las versiones 2022-06-30-preview y posteriores de la API, los modelos de plantilla personalizados agregarán compatibilidad con campos tabulares (tablas) entre páginas.
  • Con el lanzamiento de las versiones 2022-06-30-preview y posteriores de la API, los modelos neuronales personalizados admitirán campos tabulares (tablas) y los modelos entrenados con la versión 2022-08-31 o posteriores de la API aceptarán etiquetas de campo tabulares.
  1. Usar el comando Eliminar para eliminar modelos que no son necesarios.

  2. Descargar los detalles del modelo para su visualización sin conexión.

  3. Seleccionar varios modelos y componerlos en un nuevo modelo que se usará en las aplicaciones.

usando tablas como patrón visual:

En el caso de los modelos de formulario personalizados, al crear los modelos personalizados, es posible que tenga que extraer colecciones de datos de los documentos. La colección de datos puede aparecer en un par de formatos, usando tablas como patrón visual:

  • Recuento dinámico o variable de valores (filas) para un conjunto determinado de campos (columnas)

  • Colección específica de valores para un conjunto determinado de campos (columnas o filas)

Etiquetado como tabla dinámica

Use tablas dinámicas para extraer el recuento variable de valores (filas) para un conjunto determinado de campos (columnas):

  1. Agregue una nueva etiqueta de tipo "Tabla", seleccione el tipo "Tabla dinámica" y asigne un nombre a la etiqueta.

  2. Agregue el número de columnas (campos) y filas (para datos) que necesita.

  3. Seleccione el texto de la página y, a continuación, elija la celda para asignar al texto. Repita el procedimiento para todas las filas y columnas de todas las páginas de todos los documentos.

Etiquetado de documento de inteligencia como ejemplo de tabla dinámica

Etiqueta como tabla fija

Use tablas fijas para extraer una colección específica de valores para un conjunto determinado de campos (columnas o filas):

  1. Cree una nueva etiqueta de tipo "Tabla", seleccione el tipo "Tabla fija" y asigne un nombre a la etiqueta.

  2. Agregue el número de columnas y filas que necesita para los dos conjuntos de campos.

  3. Seleccione el texto de la página y, a continuación, elija la celda para asignar al texto. Repita el procedimiento para otros documentos.

Etiquetado de documento de inteligencia como ejemplo de tabla fija

Detección de firma

Nota

Actualmente, los campos de firma solo se admiten para los modelos de plantilla personalizados. Al entrenar un modelo neuronal personalizado, se omiten los campos de firma etiquetados.

Para etiquetarlos para la detección de firmas: (solo formulario personalizado)

  1. En la vista de etiquetado, cree una nueva etiqueta de tipo "Firma" y asigne un nombre a la etiqueta.

  2. Use el comando Región para crear una región rectangular en la ubicación esperada de la firma.

  3. Seleccione la región dibujada y elija la etiqueta Tipo de firma para asignarla a la región dibujada. Repita el procedimiento para otros documentos.

Etiquetado de documento de inteligencia para detección de firmas ejemplo

Pasos siguientes

Comenzar con Estudio de documento de inteligencia.