Introducción al procesamiento de documentos no estructurados en Microsoft Syntex

Artículo
01/16/2024

Nota:

Hasta junio de 2024, puede probar el procesamiento de documentos no estructurados y otros servicios de Syntex seleccionados sin costo si tiene configurada la facturación de pago por uso . Para obtener información y limitaciones, consulte Probar Microsoft Syntex y explorar sus servicios.

Use el modelo de procesamiento de documentos no estructurado (método de enseñanza) para clasificar automáticamente los archivos y extraer información. Funciona mejor para documentos no estructurados, como cartas o contratos.

Nota:

Microsoft respeta la privacidad y la propiedad de los datos que usa para entrenar y procesar modelos en Syntex. Microsoft no usa ni transfiere ninguno de los datos de su organización para entrenar modelos de inteligencia artificial, modelos de gran tamaño o cualquier otro modelo. Los datos permanecen de forma segura dentro del inquilino de la organización. Para obtener más información, consulte Protección y privacidad de datos de Microsoft.

Introducción a los modelos no estructurados

El modelo de procesamiento de documentos no estructurado (anteriormente conocido como modelo de comprensión de documentos) usa inteligencia artificial (IA) para procesar documentos. Estos documentos deben tener texto que pueda identificarse en función de frases o patrones. El texto identificado designa tanto el tipo de archivo (su clasificación) como lo que le gustaría extraer (sus extractores).

Nota:

Para obtener más información sobre cómo usar Syntex y ejemplos de escenarios, consulte Introducción a la adopción de Microsoft Syntex y escenarios y casos de uso para Microsoft Syntex.

Los modelos de procesamiento de documentos no estructurados se crean y administran en un tipo de sitio de SharePoint denominado centro de contenido. Cuando se aplica a una biblioteca de documentos de SharePoint, el modelo está asociado a un tipo de contenido que tiene columnas para almacenar la información que se va a extraer. El tipo de contenido que cree se almacena en la galería de tipo de contenido de SharePoint. También puede optar por usar tipos de contenido existentes para usar su esquema.

Nota:

Los tipos de contenido de solo lectura o sellado no se pueden actualizar, por lo que no se pueden usar en un modelo.

Agregue clasificadores y extractores a los modelos de procesamiento de documentos no estructurados para realizar las siguientes acciones:

Los clasificadores se usan para identificar y clasificar documentos cargados en la biblioteca de documentos. Por ejemplo, un clasificador puede ser "entrenado" para identificar todos los documentos de renovación de contrato que se carguen en la biblioteca. El tipo de contenido de renovación de contrato lo define el usuario al crear el clasificador.
Los extractores extraen información de estos documentos. Por ejemplo, para cada documento de renovación de contrato identificado en la biblioteca de documentos, se mostrarán columnas que muestran la fecha de inicio del servicio y el cliente de cada documento.

Puede usar archivos de ejemplo para entrenarlos y probarlos en el modelo. Los archivos de ejemplo proporcionan ejemplos al modelo de lo que debe buscar al intentar identificar y extraer datos de archivos. Por ejemplo, entrenaría los clasificadores y extracciones de renovación de contrato con ejemplos de documentos de renovación de contratos con los que trabaja su empresa. También puede usar archivos de ejemplo para probar la efectividad del modelo.

Después de publicar el modelo, utilice el centro de contenido para aplicarlo a cualquier biblioteca de documentos de SharePoint a la que tenga acceso.

Requisitos y limitaciones

Para obtener información sobre los requisitos que se deben tener en cuenta al elegir este modelo, consulte Requisitos y limitaciones de los modelos en Microsoft Syntex.

Introducción al procesamiento de documentos no estructurados en Microsoft Syntex

Introducción a los modelos no estructurados

Requisitos y limitaciones

Comentarios

Comentarios

Recursos adicionales