Compartir vía


Estudio del documento de inteligencia

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documentación de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-02-29-preview.
  • La versión preliminar pública 2024-02-29-preview solo está disponible en las siguientes regiones de Azure:
  • Este de EE. UU.
  • Oeste de EE. UU. 2
  • Oeste de Europa

Este contenido se aplica a:marca de verificación v4.0 (versión preliminar) | Versiones anteriores: marca de verificación azul v3.1 (GA) marca de verificación azul v3.0 (GA)

Este contenido se aplica a:marca de verificación v3.1 (GA) | Versión más reciente: marca de verificación púrpura v4.0 (versión preliminar) | Versiones anteriores: marca de verificación azul v3.0

Este contenido se aplica a:marca de verificaciónv3.0 (GA) | Versiones más recientes:marca de verificación púrpurav4.0 (versión preliminar)marca de verificación púrpurav3.1

Importante

Document Intelligence Studio es una herramienta en línea para explorar, comprender e integrar visualmente las funciones del servicio Document Intelligence en sus aplicaciones. Use Document Intelligence Studio para:

  • Obtenga más información sobre las distintas funcionalidades de Document Intelligence.
  • Use el recurso de Document Intelligence para probar modelos en documentos de ejemplo o cargar sus propios documentos.
  • Experimente con diferentes características de complemento y versión preliminar para adaptar la salida a sus necesidades.
  • Entrenar modelos de clasificación personalizados para clasificar documentos.
  • Entrenamiento de modelos de extracción personalizados para extraer campos de documentos.
  • Obtenga código de ejemplo para la SDKs específica del lenguaje que se va a integrar en las aplicaciones.

Use la guía de inicio rápido de Document Intelligence Studio para empezar a analizar documentos con modelos precompilados o de análisis de documentos. Cree modelos personalizados y haga referencia a los modelos de las aplicaciones mediante uno de los SDKs específicos del lenguaje y otros inicios rápidos.

Introducción

Si va a visitar Studio por primera vez, siga la guía de introducción para configurar Studio para su uso.

Opciones de análisis

  • Documento de inteligencia es compatible con funcionalidades de análisis sofisticadas. El Estudio permite un punto de entrada (botón Analizar opciones) para configurar las capacidades del complemento con facilidad.

  • Según el escenario de extracción de documentos, configure el intervalo de análisis, el intervalo de páginas del documento, la detección opcional y las características de detección premium.

    Captura de pantalla de la ventana del cuadro de diálogo analizar opciones.

    Nota:

    La extracción de fuentes no se visualiza en Document Intelligence Studio. Sin embargo, puede comprobar la sección de estilos de la salida JSON para los resultados de detección de fuentes.

✔️ Etiquetado automático de documentos con modelos precompilados o uno de sus propios modelos

  • En la página de etiquetado de modelos de extracción personalizados, ahora puede etiquetar automáticamente los documentos con uno de los modelos precompilados del servicio Document Intelligent o con modelos que haya entrenado.

    Captura de pantalla animada que muestra el etiquetado automático en Studio.

  • En algunos documentos, se pueden duplicar las etiquetas después de ejecutar la etiqueta automática. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.

    Captura de pantalla que muestra la advertencia de etiquetas duplicadas tras el etiquetado automático.

✔️ Tablas de etiquetado automático

  • En la página de etiquetado del modelo de extracción personalizada, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.

    Captura de pantalla animada que muestra el etiquetado automático de tablas en Studio.

✔️ Agregar archivos de prueba directamente al conjunto de datos de entrenamiento

  • Una vez que haya entrenado un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo cargando documentos de prueba en el conjunto de datos de entrenamiento si es necesario.

  • Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de que están etiquetadas correctamente. Si no es así, agréguelos al conjunto de datos de entrenamiento y vuelva a etiquetarlos para mejorar la calidad del modelo.

Captura de pantalla animada que muestra cómo agregar archivos de prueba al conjunto de datos de entrenamiento.

✔️ Usar las opciones y filtros de la lista de documentos en proyectos personalizados

  • Use la página de etiquetado de modelos de extracción personalizados para navegar por sus documentos de entrenamiento con facilidad usando las características de búsqueda, filtrado y ordenación.

  • Utilice la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos más fácilmente.

    Captura de pantalla de las opciones y filtros de la vista de lista de documentos.

✔️ Uso compartido de proyectos

Compatibilidad con modelos de Inteligencia de documentos

  • Lectura: Pruebe la función Leer de Document Intelligence para extraer líneas de texto, palabras, idiomas detectados y estilo manuscrito si se detecta. Comience con la característica de lectura de Studio. Explore con documentos de ejemplo y los suyos propios. Use la visualización interactiva y la salida JSON para comprender cómo funciona la característica. Consulte la introducción al modelo de lectura para más información y empezar a trabajar con el inicio rápido del SDK de Python para Layout.

  • Diseño: Pruebe la función Diseño de Document Intelligence para extraer texto, tablas, marcas de selección e información sobre estructuras. Comience con la característica de diseño de Studio. Explore con documentos de ejemplo y los suyos propios. Use la visualización interactiva y la salida JSON para comprender cómo funciona la característica. Consulte la introducción a Layout para más información y empezar a trabajar con el inicio rápido del SDK de Python para Layout.

  • Modelos precompilados: Los modelos predefinidos de Document Intelligence le permiten agregar el procesamiento inteligente de documentos a sus aplicaciones y flujos sin tener que entrenar y crear sus propios modelos. Por ejemplo, comience con la característica de factura de Studio. Explore con documentos de ejemplo y los suyos propios. Use la visualización interactiva, la lista de campos extraídos y la salida JSON para comprender cómo funciona la característica. Consulte la introducción a los modelos para más información y empezar a trabajar con el inicio rápido del SDK de Python para facturación precompilado.

  • Modelos de extracción personalizados: Los modelos personalizados de Document Intelligence le permiten extraer campos y valores a partir de modelos entrenados con sus datos, adaptados a sus formularios y documentos. Para extraer datos de varios tipos de formulario, cree modelos personalizados independientes o combine dos o más modelos personalizados y cree un modelo compuesto. Comience con la característica de modelos personalizados de Studio. Utilice el asistente de ayuda, la interfaz de etiquetado, el paso de formación y las visualizaciones para comprender cómo funciona la característica. Pruebe el modelo personalizado con los documentos de ejemplo y realice la iteración para mejorar el modelo. Para más información, consulte la Introducción a los modelos personalizados.

  • Modelos de clasificación personalizados: La clasificación de documentos es un nuevo escenario soportado por Document Intelligence. la API clasificadora de documentos admite escenarios de clasificación y división. Entrene un modelo de clasificación para identificar los distintos tipos de documentos que admite la aplicación. El archivo de entrada del modelo de clasificación puede contener varios documentos y clasifica cada documento dentro de un intervalo de páginas asociado. Para obtener más información, vea modelos de clasificación personalizados.

  • Funcionalidades de complementos: Document Intelligence admite ahora funciones de análisis más sofisticadas. Estas funciones opcionales pueden habilitarse y deshabilitarse en el estudio mediante el botón Analze Options de la página de cada modelo. Hay cuatro funcionalidades de complemento disponibles: highResolution, formula, font y funcionalidades de extracción de códigos de barras. Para obtener más información, vea Funcionalidades de complemento.

Pasos siguientes