Requisitos y limitaciones para los modelos de Microsoft Syntex

Se aplica a: ✓ Todos los modelos personalizados | ✓ Todos los modelos precompilados

Microsoft Syntex permite crear modelos personalizados y modelos precompilados. En función del tipo de modelo que elija, puede haber diferentes requisitos, como el tipo de archivo y el tamaño, los idiomas que se deben admitir, las consideraciones geográficas y otros factores que le ayudarán a decidir qué tipo de modelo usar.

Modelos personalizados:

Modelos precompilados:

Modelos personalizados

Procesamiento de documentos no estructurados

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls y .xlsx (no se ejecutan fórmulas en los archivos .xls y .xlsx).
Símbolo de conversación. Idiomas admitidos

Este modelo admite los siguientes idiomas: consulte los idiomas admitidos.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Si los archivos de .pdf están bloqueados con contraseña, debe quitar el bloqueo antes de enviarlos.
- El tamaño de archivo combinado de los documentos utilizados para el entrenamiento por colección no debe superar los 50 MB, y los documentos PDF no deben tener más de 500 páginas.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. Es posible que las imágenes muy anchas o con dimensiones inusuales (por ejemplo, planos de planta) se trunquen en el proceso de OCR y pierdan precisión.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- Si escaneó documentos en papel, los escaneos deben ser imágenes de alta calidad.
- Debe usar el alfabeto latino (caracteres en inglés).
Tenga en cuenta las siguientes diferencias sobre los archivos basados en texto de Microsoft Office y los archivos escaneados por OCR (.pdf, imagen o .tiff):
- Todos los archivos: truncados con 64 000 caracteres (en entrenamiento y cuando se ejecutan en archivos de una biblioteca de documentos).
- Archivos escaneados con OCR: hay un límite de 500 páginas. OCR solo procesa los tipos de archivo PDF y de imagen.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado.

Procesamiento de documentos de forma libre

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: consulte requisitos de tipo de archivo.
Símbolo de conversación. Idiomas admitidos
Este modelo admite los siguientes idiomas: consulte los idiomas admitidos.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen estos requisitos.
Símbolo de ancho de banda y eficiencia. Sugerencias de optimización
Si el modelo no funciona como quiere, pruebe estos pasos para mejorar el rendimiento del modelo.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de bloques. Entornos de Power Platform personalizados
Si usa un entorno personalizado (en lugar del entorno predeterminado) para el procesamiento de Power Platform, hay requisitos de configuración adicionales. Para obtener más información, consulte Entornos de Power Platform personalizados.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. Solo puede tener una forma libre o un modelo estructurado por biblioteca.

Procesamiento estructurado de documentos

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: consulte requisitos de tipo de archivo.
Símbolo de conversación. Idiomas admitidos
Este modelo admite los siguientes idiomas: consulte los idiomas admitidos.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen estos requisitos.
Símbolo de ancho de banda y eficiencia. Sugerencias de optimización
Si el modelo no funciona como quiere, pruebe estos pasos para mejorar el rendimiento del modelo.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de bloques. Entornos de Power Platform personalizados
Si usa un entorno personalizado (en lugar del entorno predeterminado) para el procesamiento de Power Platform, hay requisitos de configuración adicionales. Para obtener más información, consulte Entornos de Power Platform personalizados.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. Solo puede tener una forma libre o un modelo estructurado por biblioteca.

Modelos creados previamente

Procesamiento del contrato

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo solo admite contratos en inglés.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado.

Procesamiento de facturas

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo admite facturas en inglés, español, alemán, francés, italiano, portugués y holandés.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado.

Procesamiento de recibos

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo admite ventas en inglés, croation, checo, danés, holandés, finlandés, alemán, húngaro, italiano, japonés, letón, lituano, noruego, portugués, español, sueco y vietnamita.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado.