Compartir a través de


Modelo payStub de Document Intelligence

El modelo payStub de Document Intelligence combina potentes funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer datos de compensación y ganancias de los recibos de pago. La API analiza documentos y archivos con información relacionada con nóminas; extrae información clave y devuelve una representación de datos JSON estructurada.

Característica version Id. de modelo
modelo payStub • v4.0:2024-07-31 (versión preliminar) prebuilt-payStub.us

Prueba de la extracción de datos payStub

Los recibos de pago son documentos esenciales emitidos por los empleadores a los empleados, proporcionando ganancias, deducciones e información neta de pago para un período de pago específico. Vea cómo se extraen los datos mediante el modelo prebuilt-payStub.us. Tendrá que supervisar los recursos siguientes:

Estudio del documento de inteligencia

  1. En la página principal de Document Intelligence Studio, seleccione payStub.

  2. Puede analizar el recibo de pago de ejemplo o cargar archivos propios.

  3. Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :

Requisitos de entrada

  • Formatos de archivos admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Leer
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento general
    Creada previamente
    Extracción personalizada
    Clasificación personalizada ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).

  • Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a 8 puntos de texto a 150 puntos por pulgada (PPP).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.

    • Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.

    • Para el entrenamiento del modelo de clasificación personalizada, el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-07-31-preview y versiones posteriores, el tamaño total de los datos de entrenamiento es 2 GB con un máximo de 10 000 páginas.

Idiomas y configuraciones regionales compatibles

Para obtener una lista completa de los idiomas admitidos, consulte nuestra página sobre compatibilidad con lenguajes de modelos precompilados.

Extracciones de campos

Para ver los campos de extracción de documentos admitidos, consulte la página sobre el esquema del modelo payStub en nuestro repositorio de ejemplo de GitHub.

Configuraciones regionales admitidas

La versión 2027-07-31-preview prebuilt-payStub.us admite la configuración regional en-us.

Pasos siguientes