Modelo de documento de identificación de Documento de inteligencia

Importante

  • Las versiones preliminares públicas de Documento de inteligencia proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Antes de la disponibilidad general (GA), las características, los enfoques y los procesos podrían cambiar en función de los comentarios de los usuarios.
  • La versión preliminar pública de las bibliotecas cliente de Documentación de inteligencia tiene como valor predeterminado la versión de la API de REST 2024-02-29-preview.
  • La versión preliminar pública 2024-02-29-preview solo está disponible en las siguientes regiones de Azure:
  • Este de EE. UU.
  • Oeste de EE. UU. 2
  • Oeste de Europa

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.1 (GA)marca de verificación azulv3.0 (GA)marca de verificación azulv2.1 (GA)

Este contenido se aplica a:marca de verificaciónv3.1 (GA) | Versión más reciente:marca de verificación púrpurav4.0 (versión preliminar) | Versiones anteriores:marca de verificación azulv3.0marca de verificación azulv2.1

Este contenido se aplica a:marca de verificaciónv3.0 (GA) | Versiones más recientes:marca de verificación púrpurav4.0 (versión preliminar)marca de verificación púrpurav3.1 | Versión anterior:marca de verificación azulv2.1

Este contenido se aplica a:marca de verificaciónv2.1 | Versión más reciente:marca de verificación azulv4.0 (versión preliminar)

El modelo de documento de identificación (id.) de Documento de inteligencia combina el reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer la información clave de los documentos de identificación. La API analiza documentos de identidad (incluidos los siguientes), extrae información clave y devuelve una representación de datos JSON estructurados:

  • Libreta de pasaporte, tarjeta de pasaporte en todo el mundo
  • Licencia de conducir de Estados Unidos, Europa, India, Canadá y Australia
  • Tarjetas de identificación, permiso de residencia (tarjeta verde), tarjeta de seguridad social, identificación militar de Estados Unidos
  • Tarjetas de identificación, permisos de residencia de Europa
  • Tarjeta PAN, tarjeta Aadhaar de India
  • Tarjetas de identificación, permiso de residencia (tarjeta arce) de Canadá
  • Tarjeta de fotografía, tarjeta de identificación Keypass (incluida la versión digital) de Australia

Documento de inteligencia puede analizar y extraer información de documentos de identificación (id.) expedidos por gobiernos mediante sus modelos de id. compilados previamente. Combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con capacidades de reconocimiento de ID para extraer información clave de pasaportes de todo el mundo y de permisos de conducir de EE. UU. (de los 50 estados y del D.C.). La API de ID extrae información clave de estos documentos de identidad, como el nombre, el apellido, la fecha de nacimiento, el número del documento, etc. Esta API está disponible en Documento de inteligencia v2.1 como un servicio en la nube.

Procesamiento de documentos de identidad

El procesamiento de documentos de identidad implica extraer datos de documentos de identidad manualmente o mediante la tecnología basada en OCR. El procesamiento de documentos de identidad es un paso importante en cualquier operación empresarial en la que se necesite prueba de identidad. Entre los ejemplos se incluyen la verificación de clientes en bancos y otras instituciones financieras, aplicaciones hipotecas, visitas médicas, procesamiento de reclamaciones, industria de la hospitalidad, etc. Las personas proporcionan alguna prueba de su identidad a través de licencias de conducir, pasaportes y otros documentos similares para que la empresa pueda verificarlos de forma eficaz antes de proporcionar servicios y beneficios.

Licencia de conducir de EE. UU. de ejemplo procesada con Documento de inteligencia Studio

Imagen de un permiso de conducir de ejemplo.

Extracción de datos

El servicio de identificaciones precompiladas extrae los principales valores de pasaportes de todo el mundo y permisos de conducir de EE. UU. y los devuelve en una respuesta JSON estructurada organizada.

Ejemplo de permiso de conducir

Permiso de conducir de ejemplo

Ejemplo de pasaporte

Pasaporte de ejemplo

Opciones de desarrollo

Documento de inteligencia v4.0 (2024-02-29-preview, 2023-10-31-preview) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de documentación de id. Document Intelligence Studio
API REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
prebuilt-idDocument

Documento de inteligencia v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de documentación de id. Document Intelligence Studio
API REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
prebuilt-idDocument

Documento de inteligencia v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de documentación de id. Document Intelligence Studio
API REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
prebuilt-idDocument

Documento de inteligencia v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo de documentación de id. Herramienta de etiquetado de Documento de inteligencia
API REST
SDK de biblioteca cliente
Contenedor Docker de Documento de inteligencia

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Formatos de archivos admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y HTML
    Leer
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento general
    Creada previamente
    Extracción personalizada
    Clasificación personalizada ✔ (2024-02-29-preview)
  • En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).

  • Las imágenes deben tener unas dimensiones de entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a un 8 texto de 150 puntos a 150 puntos por pulgada (DPI).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.

    • Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 G-MB para el modelo neuronal.

    • Para el modelo de entrenamiento de clasificación personalizada, el tamaño total de los datos de entrenamiento es 1GB con un máximo de 10 000 páginas.

  • Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.

  • Número admitido de páginas para archivos PDF y TIFF hasta 2000 páginas o solo las dos primeras páginas para suscriptores de nivel gratuito.

  • Tamaño de archivo admitido: menos de 50 MB TOTAL; píxeles mínimos: 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.

Extracción de datos del modelo de documento de identificación

Extracción de datos, incluidos el nombre, la fecha de nacimiento y la fecha de expiración, de los documentos de identificación. Tendrá que supervisar los recursos siguientes:

  • Una suscripción a Azure: puede crear una cuenta gratuita.

  • Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de ubicación de las claves y el punto de conexión en Azure Portal.

Nota:

Documento de inteligencia Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.

  1. En la página principal de Document Intelligence Studio, seleccione Documentos de identidad

  2. Puede analizar la factura de muestra o cargar sus propios archivos.

  3. Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :

    Captura de pantalla de los botones Ejecutar análisis y Analizar opciones en Document Intelligence Studio.

Herramienta de etiquetado de ejemplo de Documento de inteligencia

  1. Vaya a Herramienta de ejemplo de Documento de inteligencia.

  2. En la página principal de la herramienta de ejemplo, seleccione el icono Use prebuilt model to get data (Usar un modelo precompilado para obtener datos).

    Captura de pantalla de la operación de análisis de resultados del modelo de diseño.

  3. Seleccione el Tipo de formulario que quiere analizar en el menú desplegable.

  4. Elija una dirección URL para el archivo que quiere analizar entre las opciones siguientes:

  5. En el campo Origen, seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar.

    Captura de pantalla del menú desplegable de ubicación del origen.

  6. En el campo Punto de conexión de Documento de inteligencia, pegue el punto de conexión que obtuvo con la suscripción de Documento de inteligencia.

  7. En el campo Clave, pegue la clave que obtuvo del recurso de Documento de inteligencia.

    Captura de pantalla del menú desplegable para seleccionar el tipo de documento.

  8. Seleccione Run analysis (Ejecutar análisis). La herramienta de etiquetado de ejemplo de Documento de inteligencia llama a la API Analyze Prebuilt y analiza el documento.

  9. Vea los resultados: consulte los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.

    Captura de pantalla de la operación de análisis de resultados del modelo de identidad.

  10. Descargue el archivo de salida JSON para ver los resultados detallados.

    • El nodo "readResults" contiene cada línea de texto con su posición de cuadro de límite correspondiente en la página.
    • El nodo "selectionMarks" muestra todas las marcas de selección (casilla, botón de opción) y si su estado es seleccionado o no seleccionado.
    • En la sección "pageResults" se incluyen las tablas extraídas. Para cada tabla, Documento de inteligencia extrae el texto, el índice de filas y columnas, la separación de filas y columnas, el rectángulo de selección, etc.
    • El campo "documentResults" contiene información de pares clave-valor y de elementos de línea para las partes más importantes del documento.

Nota

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio de Documento de inteligencia.

Tipos de documentos admitidos

Region Tipos de documento
Todo el mundo Pasaporte
Estados Unidos Permiso de conducir, tarjeta de identificación, permiso de residencia (tarjeta verde), tarjeta de la Seguridad Social, identificación militar
Europa Licencia de conducir, tarjeta de identificación, permiso de residencia
India Permiso de conducir, tarjeta PAN, tarjeta Aadhaar
Canada Permiso de conducir, tarjeta de identificación, permiso de residencia (tarjeta Maple)
Australia Permiso de conducir, tarjeta con fotografía, documento de identificación con clave (incluida la versión digital)

Extracciones de campos

A continuación se indican los campos extraídos por tipo de documento. El modelo de identificación prebuilt-idDocument de Documento de inteligencia extrae los siguientes campos de documents.*.fields. La salida json incluye todo el texto extraído en los documentos, palabras, líneas y estilos.

idDocument.driverLicense

Campo Tipo Descripción Ejemplo
CountryRegion countryRegion Código de país o región EE. UU.
Region string Estado o provincia Washington
DocumentNumber string Número de licencia de conducir WDLABCD456DG
DocumentDiscriminator string Discriminador de documentos de licencia de conducir 12645646464554646456464544
FirstName string Nombre e inicial del segundo nombre, si procede LIAM R.
LastName string Surname TALBOT
Address address Dirección "123 STREET ADDRESS YOUR CITY WA 99999-1234"
DateOfBirth date Fecha de nacimiento 01/06/1958
DateOfExpiration date Fecha de expiración 08/12/2020
DateOfIssue date Fecha del problema 08/12/2012
EyeColor string Color de ojos Azul
HairColor string Color del pelo Marrón
Height string Height 5'11"
Weight string Peso 185LB
Sex string Sex M
Endorsements string Aprobaciones L
Restrictions string Restricciones B
VehicleClassifications string Clasificación de vehículos D

idDocument.passport

Campo Tipo Descripción Ejemplo
DocumentNumber string Passport number 340020013
FirstName string Nombre e inicial del segundo nombre, si procede JENNIFER
MiddleName string Nombre entre el nombre y el apellido especificados REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string También conocida como MAT LIN
DateOfBirth date Fecha de nacimiento 1980-01-01
DateOfExpiration date Fecha de expiración 2019-05-05
DateOfIssue date Fecha del problema 2014-05-06
Sex string Sex F
CountryRegion countryRegion País u organización emisora EE. UU.
DocumentType string Tipo de documento P
Nationality countryRegion Nacionalidad EE. UU.
PlaceOfBirth string Lugar de nacimiento MASSACHUSETTS, U.S.A.
PlaceOfIssue string Lugar de problema LISBON
IssuingAuthority string Entidad emisora Departamento de Estado de los Estados Unidos
PersonalNumber string Identificación personal. No. A234567893
MachineReadableZone object Zona legible de la máquina (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Nombre e inicial del segundo nombre, si procede JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Passport number 340020013
MachineReadableZone.CountryRegion countryRegion País u organización emisora EE. UU.
MachineReadableZone.Nationality countryRegion Nacionalidad EE. UU.
MachineReadableZone.DateOfBirth date Fecha de nacimiento 1980-01-01
MachineReadableZone.DateOfExpiration date Fecha de expiración 2019-05-05
MachineReadableZone.Sex string Sex F

idDocument.nationalIdentityCard

Campo Tipo Descripción Ejemplo
CountryRegion countryRegion Código de país o región EE. UU.
Region string Estado o provincia Washington
DocumentNumber string Número de tarjeta de identidad nacional WDLABCD456DG
DocumentDiscriminator string Discriminador de documentos de tarjeta de identidad nacional 12645646464554646456464544
FirstName string Nombre e inicial del segundo nombre, si procede LIAM R.
LastName string Surname TALBOT
Address address Dirección "123 STREET ADDRESS YOUR CITY WA 99999-1234"
DateOfBirth date Fecha de nacimiento 01/06/1958
DateOfExpiration date Fecha de expiración 08/12/2020
DateOfIssue date Fecha del problema 08/12/2012
EyeColor string Color de ojos AZUL
HairColor string Color del pelo BROWN
Height string Height 5'11"
Weight string Peso 185LB
Sex string Sex M

idDocument.residencePermit

Campo Tipo Descripción Ejemplo
CountryRegion countryRegion Código de país o región EE. UU.
DocumentNumber string Número de permiso de residencia WDLABCD456DG
FirstName string Nombre e inicial del segundo nombre, si procede LIAM R.
LastName string Surname TALBOT
DateOfBirth date Fecha de nacimiento 01/06/1958
DateOfExpiration date Fecha de expiración 08/12/2020
DateOfIssue date Fecha del problema 08/12/2012
Sex string Sex M
PlaceOfBirth string Lugar de nacimiento Alemania
Category string Permitir categoría DV2
Address string Dirección "123 STREET ADDRESS YOUR CITY WA 99999-1234"

idDocument.usSocialSecurityCard

Campo Tipo Descripción Ejemplo
DocumentNumber string Número de tarjeta de seguridad social WDLABCD456DG
FirstName string Nombre e inicial del segundo nombre, si procede LIAM R.
LastName string Surname TALBOT
DateOfIssue date Fecha del problema 08/12/2012

idDocument

Campo Tipo Descripción Ejemplo
Address address Dirección "123 STREET ADDRESS YOUR CITY WA 99999-1234"
DocumentNumber string Número de licencia de conducir WDLABCD456DG
FirstName string Nombre e inicial del segundo nombre, si procede LIAM R.
LastName string Surname TALBOT
DateOfBirth date Fecha de nacimiento 01/06/1958
DateOfExpiration date Fecha de expiración 08/12/2020

Tipos de documento admitidos

El modelo de documento de identificación admite actualmente licencias de conducir de EE. UU. y la página biográfica de pasaportes internacionales (excepto la extracción de visados y otros documentos de viaje).

Campos extraídos

Nombre Escribir Descripción Valor
País country Código de país conforme con la norma ISO 3166 estándar. "USA"
DateOfBirth date Fecha de nacimiento en formato AAAA-MM-DD. "1980-01-01"
DateOfExpiration date Fecha de expiración en formato AAAA-MM-DD. "2019-05-05"
DocumentNumber string Número de pasaporte, número de permiso de conducir, etc. pertinente. "340020013"
FirstName string Nombre extraído e inicial del segundo nombre, si procede. "JENNIFER"
LastName string Apellido extraído "BROOKS"
Nacionalidad country Código de país conforme con la norma ISO 3166 estándar. "USA"
Sex gender Los valores extraídos posibles son "M", "F", "X" "F"
MachineReadableZone object Zona de lectura automática del pasaporte extraída, incluidas dos líneas de 44 caracteres cada una. "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Tipo de documento, por ejemplo, pasaporte o permiso de conducir. "passport"
Dirección string Dirección extraída (solo permiso de conducir) "123 STREET ADDRESS YOUR CITY WA 99999-1234"
Region string Valor extraído de región, estado, provincia, etc. (solo permiso de conducir) "Washington"

Guía de migración

Pasos siguientes