Compartir vía


Introducción al procesamiento de documentos no estructurados en SharePoint

Nota:

Hasta diciembre de 2025, puede probar una cantidad limitada de procesamiento de documentos no estructurados y otros servicios de contenido seleccionados sin costo si tiene configurada la facturación de pago por uso . Para obtener información y limitaciones, consulte Probar servicios de pago por uso.

Use el modelo de procesamiento de documentos no estructurado (método de enseñanza) para clasificar automáticamente los archivos y extraer información. Funciona mejor para documentos no estructurados, como cartas o contratos.

Nota:

Microsoft respeta la privacidad y la propiedad de los datos que usa para entrenar y procesar modelos en Syntex. Microsoft no usa ni transfiere ninguno de los datos de su organización para entrenar modelos de inteligencia artificial, modelos de gran tamaño o cualquier otro modelo. Los datos permanecen de forma segura dentro del inquilino de la organización. Para obtener más información, consulte Protección y privacidad de datos de Microsoft.

Introducción a los modelos no estructurados

Los modelos de procesamiento de documentos no estructurados usan inteligencia artificial (IA) para analizar y extraer información de documentos. Estos modelos se basan en texto identificable, en función de frases o patrones, para determinar tanto la clasificación del documento como los datos que se van a extraer.

Nota:

Para obtener más información sobre cómo usar Syntex y ejemplos de escenarios, consulte Introducción a la adopción de Microsoft Syntex y escenarios y casos de uso para Microsoft Syntex.

Los modelos de procesamiento de documentos no estructurados se crean y administran en un centro de contenido de SharePoint. Cuando se aplica un modelo a una biblioteca de documentos de SharePoint, se asocia a un tipo de contenido que incluye columnas para almacenar información extraída. Puede crear un nuevo tipo de contenido o usar uno existente desde la galería de tipos de contenido de SharePoint.

Nota:

Los tipos de contenido de solo lectura o sellado no se pueden actualizar, por lo que no se pueden usar en un modelo.

Agregue clasificadores y extractores a los modelos de procesamiento de documentos no estructurados para realizar las siguientes acciones:

  • Los clasificadores se usan para identificar y clasificar documentos cargados en la biblioteca de documentos. Por ejemplo, un clasificador puede ser "entrenado" para identificar todos los documentos de renovación de contrato que se carguen en la biblioteca. El tipo de contenido de renovación de contrato lo define el usuario al crear el clasificador.

  • Los extractores extraen información de estos documentos. Por ejemplo, para cada documento de renovación de contrato identificado en la biblioteca de documentos, se muestran columnas que muestran la fecha de inicio del servicio y el cliente de cada documento.

Use archivos de ejemplo para entrenar y probar los clasificadores y extractores. Estos archivos ayudan al modelo a aprender qué buscar al identificar y extraer datos. Por ejemplo, entrene el modelo de renovación de contratos mediante documentos reales de renovación de contratos de su organización. También puede usar estos archivos para validar la precisión del modelo.

Después de publicar el modelo, utilice el centro de contenido para aplicarlo a cualquier biblioteca de documentos de SharePoint a la que tenga acceso.

Requisitos y limitaciones

Para obtener información sobre los requisitos que se deben tener en cuenta al elegir este modelo, consulte los requisitos y limitaciones para el procesamiento de documentos no estructurados.