Introducción a los tipos de modelo en Microsoft Syntex

Se aplica a: ✓ Todos los modelos personalizados | ✓ Todos los modelos precompilados

La comprensión del contenido en Microsoft Syntex comienza con los modelos de procesamiento de documentos. Los modelos de procesamiento de documentos le permiten identificar y clasificar documentos que se cargan en bibliotecas de documentos de SharePoint y, a continuación, extraer la información que necesita de cada archivo.

Cuando se aplica a una biblioteca de documentos de SharePoint, el modelo está asociado a un tipo de contenido y tiene columnas para almacenar la información que se va a extraer. El tipo de contenido que cree se almacena en la galería de tipo de contenido de SharePoint. También puede optar por usar tipos de contenido existentes para usar su esquema.

Syntex usa modelos personalizados y modelos precompilados.

Diagrama que muestra los tipos de modelos personalizados y precompilados de Syntex.

Los modelos pueden ser modelos empresariales, que se crean en un centro de contenido o modelos locales, que se crean en el sitio de SharePoint local.

Modelos personalizados

El tipo de modelo personalizado que elija dependerá de los tipos de archivos que use, el formato y la estructura de los archivos y de dónde quiera aplicar el modelo.

Los modelos personalizados incluyen:

Para ver las diferencias en paralelo en los modelos personalizados, consulte Comparación de modelos personalizados.

Al crear un modelo personalizado, seleccionará el método de entrenamiento asociado al tipo de modelo. Por ejemplo, si desea crear un modelo de procesamiento de documentos no estructurado, en la página Opciones para la creación del modelo donde se crea un modelo, elegirá la opción Método teaching . En la tabla siguiente se muestra el método de entrenamiento asociado a cada tipo de modelo personalizado.

Desestructurado
procesamiento de documentos
Forma libre
procesamiento de documentos
Estructurado
procesamiento de documentos
Icono para el método de enseñanza. Icono para el método de seleción de forma libre. Icono para el método de diseño.

Nota:

Para que el método de selección Freeform y las opciones del método Layout estén disponibles para los usuarios, primero deben configurarse en el Centro de administración de Microsoft 365.

Procesamiento de documentos no estructurados

Use el modelo de procesamiento de documentos no estructurado para clasificar automáticamente documentos y extraer información de ellos. Funciona mejor con documentos sin estructura, como cartas o contratos. Estos documentos deben tener texto que pueda identificarse en función de frases o patrones. El texto identificado designa tanto el tipo de archivo (su clasificación) como lo que le gustaría extraer (sus extractores).

Por ejemplo, un documento no estructurado podría ser una carta de renovación de contrato que pueda escribirse de varias maneras. Sin embargo, la información existe de forma coherente en el cuerpo de cada documento de renovación del contrato, como la cadena de texto "Fecha de inicio del servicio de" seguida de una fecha real.

Este tipo de modelo admite la gama más amplia de tipos de archivo y admite más de 40 idiomas.

Al crear un modelo de procesamiento de documentos no estructurado, use la opción Del método Teaching .

Para obtener más información, vea Información general sobre el procesamiento de documentos no estructurados.

Procesamiento de documentos de forma libre

Use el modelo de procesamiento de documentos de forma libre para extraer automáticamente información de documentos no estructurados y de forma libre, como cartas y contratos, donde la información puede aparecer en cualquier parte del documento.

Los modelos de procesamiento de documentos de forma libre usan Microsoft Power Apps AI Builder para crear y entrenar modelos en Syntex.

Nota:

El modelo de procesamiento de documentos de forma libre todavía no está disponible en algunas regiones. Para obtener más información, consulte Disponibilidad de características por región.

Dado que su organización recibe cartas y documentos en grandes cantidades de diversos orígenes, como correo, fax y correo electrónico, procesar estos documentos y escribirlos manualmente en una base de datos puede tardar mucho tiempo. Mediante el uso de la inteligencia artificial para extraer el texto y otra información de estos documentos, este modelo automatiza este proceso.

Este tipo de modelo es la mejor opción para documentos en archivos PDF o de imagen cuando no se requiere la clasificación automática del tipo de documento y admite más de 40 idiomas.

Al crear un modelo de procesamiento de documentos de forma libre, use la opción Método de selección de forma libre .

Para obtener más información, consulte Información general sobre el procesamiento de documentos estructurados y de forma libre.

Procesamiento estructurado de documentos

Use el modelo de procesamiento estructurado de documentos para identificar automáticamente los valores de campo y tabla. Funciona mejor para documentos estructurados o semiestructurados, como formularios y facturas.

Los modelos de procesamiento estructurado de documentos usan el procesamiento de documentos de Microsoft Power Apps AI Builder (anteriormente conocido como procesamiento de formularios) para crear y entrenar modelos en Syntex.

Este tipo de modelo admite la gama más amplia de idiomas y se entrena para comprender el diseño del formulario a partir de documentos de ejemplo y, a continuación, aprende a buscar los datos que necesita extraer de ubicaciones similares. Los formularios suelen tener un diseño más estructurado donde las entidades están en la misma ubicación (por ejemplo, un número de seguridad social en un formulario fiscal).

Al crear un modelo de procesamiento de documentos estructurados, use la opción método Layout .

Para obtener más información, consulte Información general sobre el procesamiento de documentos estructurados y de forma libre.

Modelos creados previamente

Si no necesita crear un modelo personalizado, puede usar un modelo de procesamiento de documentos precompilado que ya se haya entrenado para documentos estructurados específicos.

Los modelos precompilados incluyen:

Captura de pantalla de la página Opciones para la creación del modelo que muestra las opciones del modelo precompilado.

Los modelos precompilados se entrenan previamente para reconocer los documentos y la información estructurada de los documentos. En lugar de tener que crear un nuevo modelo personalizado desde cero, puede iterar en un modelo previamente entrenado existente para agregar campos específicos que se ajusten a las necesidades de su organización.

Procesamiento del contrato

El modelo de procesamiento de contratos analiza y extrae información clave de documentos de contrato. La API analiza los contratos en varios formatos y extrae información clave del contrato, como el nombre del cliente o entidad, la dirección de facturación, la jurisdicción y la fecha de expiración.

Para obtener más información sobre los modelos de procesamiento de contratos precompilados, consulte Uso de un modelo precompilado para extraer información de contratos.

Procesamiento de facturas

El modelo de procesamiento de facturas analiza y extrae información clave de las facturas de ventas. La API analiza las facturas en varios formatos y extrae la información clave de la factura, como el nombre del cliente, la dirección de facturación, la fecha de vencimiento y el importe vencido.

Para obtener más información sobre los modelos de procesamiento de facturas precompilados, consulte Uso de un modelo precompilado para extraer información de facturas.

Procesamiento de recibos

El modelo de procesamiento de recibos precompilado analiza y extrae información clave de los recibos de ventas. La API analiza los recibos impresos y manuscritos y extrae información de recibo de clave, como el nombre del comerciante, el número de teléfono del comerciante, la fecha de transacción, los impuestos y el total de la transacción.

Para obtener más información sobre los modelos de procesamiento de recibos precompilados, consulte Uso de un modelo precompilado para extraer información de recibos.