Modelo de documento de ID da Informação de Documentos

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
  • Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
  • Leste dos EUA
  • Oeste dos EUA 2
  • Oeste da Europa

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (GA)marca de seleção azulv3.0 (GA)marca de seleção azulv2.1 (GA)

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão mais recente:marca de seleção púrpurav4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.0marca de seleção azulv2.1

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção púrpurav3.1 | Versão anterior:marca de seleção azulv2.1

Este conteúdo se aplica a:marca de seleçãov2.1 | Versão mais recente:marca de seleção azulv4.0 (versão prévia)

O modelo de Documento de identidade (ID) da Informação de Documentos combina recursos avançados de OCR (Reconhecimento Óptico de Caracteres) com modelos de aprendizado profundo para analisar e extrair informações chave dos documentos de identidade. A API analisa documentos de identidade (incluindo os a seguir) e retorna uma representação de dados JSON estruturada:

  • Passaportes, passaportes em todo o mundo
  • Carteira de habilitação dos Estados Unidos, Europa, Índia, Canadá e Austrália
  • Carteira de habilitação, cartão de identificação, permissão de residência (Green card), previdência social, ID militar
  • Cartões de identificação europeus, permissões de residência
  • Cartão PAN da Índia, cartão Aadhaar
  • Cartões de identificação do Canadá, permissão de residência (cartão de bordo)
  • Cartão de fotos da Austrália, ID de passagem de chave (incluindo versão digital)

A Informação de Documentos do Azure pode analisar e extrair informações de documentos de ID (identificação) emitidos pelo governo usando um modelo de IDs predefinidas. Ele combina nossas funcionalidades avançadas de OCR (Reconhecimento Óptico de Caracteres) com funcionalidades de reconhecimento de ID para extrair informações importantes de passaportes internacionais e carteiras de motorista dos EUA (de todos os 50 estados e da capital). A API de IDs extrai as principais informações desses documentos de identidade, como nome, sobrenome, data de nascimento, número do documento, entre outros. Essa API está disponível na Informação de Documentos versão 2.1 como um serviço de nuvem.

Processamento de documentos de identidade

O processamento de documento de identificação envolve a extração de dados de documentos de identificação, de forma manual ou usando tecnologia baseada em OCR. O processamento de documentos de ID é uma etapa importante em qualquer operação de negócios que exija prova de identidade. Os exemplos incluem a verificação do cliente em bancos e outras instituições financeiras, pedido de hipoteca, visitas médicas, processamento de declaração, setor hoteleiro e muito mais. Os indivíduos fornecem alguma prova de identidade por meio de carteiras de habilitação, passaportes e outros documentos semelhantes para que a empresa possa verificá-los com eficiência antes de fornecer os serviços e benefícios.

Exemplo de Carteira de motorista dos Estados Unidos processada com o Estúdio da Informação de Documentos

Imagem de uma carteira de motorista de amostra.

Extração de dados

O serviço de IDs predefinidas extrai valores importantes de passaportes internacionais e carteiras de motorista dos EUA e retorna essas informações em uma resposta JSON estruturada e organizada.

Exemplo de carteira de motorista

Carteira de motorista de exemplo

Exemplo de passaporte

Passaporte de exemplo

Opções de desenvolvimento

A Informação de Documentos v4.0 (2024-02-29-preview, 2023-10-31-preview) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de documento de identificação Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-idDocument

A Informação de Documentos v3.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de documento de identificação Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-idDocument

A Informação de Documentos v3.0 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de documento de identificação Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-idDocument

O Document Intelligence v2.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo de documento de identificação Ferramenta de rotulagem da Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos

Requisitos de entrada

  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Formatos de arquivo com suporte:

    Modelar PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Ler
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-preview)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

  • Formatos de arquivo com suporte: JPEG, PNG, PDF e TIFF.

  • Número de páginas com suporte para arquivos PDF e TIFF: até duas mil páginas ou apenas as duas primeiras páginas para assinantes da camada Gratuita.

  • Tamanho do arquivo com suporte: inferior a 50 MB no total; mínimo de pixels: 50 x 50 px; máximo de pixels: 10.000 x 10.000 px.

Extração de dados de modelo de documentação de ID

Extrair dados, inclusive nome, data de nascimento e data de validade, de documentos de identificação. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Observação

O Estúdio da Informação de Documentos está disponível com APIs v3.1 e v3.0 e versões posteriores.

  1. Na home page do Estúdio da Informação de Documentos, selecione Documentos de identidade.

  2. Você pode analisar o documento de amostra ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões de opções Executar análise e Analisar no Document Intelligence Studio.

Ferramenta de Rotulagem de Amostra da Informação de Documentos

  1. Navegue até a Ferramenta de Exemplo da Informação de Documentos.

  2. Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.

    Captura de tela da operação de análise de resultados do modelo de layout.

  3. Selecione o Tipo de Formulário que deseja analisar no menu suspenso.

  4. Escolha um URL para o arquivo que você gostaria de analisar, usando as opções abaixo:

  5. No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar.

    Captura de tela do menu suspenso do local de origem.

  6. No campo Ponto de extremidade do serviço Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.

  7. No campo chave, cole a chave obtida do recurso Informação de Documentos.

    Captura de tela de selecione o menu suspenso tipo de formulário.

  8. Selecione Executar análise. A ferramenta de etiquetagem de exemplo da Informação de Documentos chama a API predefinida para Analisar Layout e analisará o documento.

  9. Veja os resultados: confira os pares chave-valor extraídos, os itens de linha, o texto realçado extraído e as tabelas detectadas.

    Captura de tela da operação de análise de resultados do modelo de identificação.

  10. Baixe o arquivo de saída JSON para exibir os resultados detalhados.

    • O nó "readResults" contém cada linha de texto com seu respectivo posicionamento de retângulo delimitador na página.
    • O nó "selectionMarks" mostra cada marca de seleção (caixa de seleção, marca de opção) e indica se o status é marcado ou não marcado.
    • A seção "pageResults" inclui as tabelas extraídas. Para cada tabela, a Informação de Documentos extrai o índice de texto, de linha e de coluna, abrangência de linha e coluna, caixa delimitadora e muito mais.
    • O campo "documentResults" contém as informações de pares chave/valor e as informações de itens de linha para as partes mais relevantes do documento.

Observação

A ferramenta de Rotulagem de Exemplo não é compatível com o formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documentos.

Tipos de documento suportados

Região Tipos de documento
No mundo inteiro Passaporte
Estados Unidos Carteira de Habilitação, Cartão de Identificação, Permissão de Residência (Green card), Previdência Social, ID Militar
Europa Carteira de Habilitação, Cartão de Identificação, Permissão de Residência
Índia Carteira de Habilitação, Cartão PAN, Cartão Aadhaar
Canadá Carteira de Habilitação, Cartão de Identificação, Permissão de Residência (Maple card)
Austrália Carteira de Habilitação, Cartão de Fotos, ID de passagem de chave (incluindo versão digital)

Extrações de campo

A seguir estão os campos extraídos por tipo de documento. O modelo de ID da Informação de Documentos do Azure prebuilt-idDocument extrai os campos a seguir no documents.*.fields. A saída json inclui todo o texto extraído nos documentos, palavras, linhas e estilos.

idDocument.driverLicense

Campo Type Descrição Exemplo
CountryRegion countryRegion Código do país ou região EUA
Region string Estado ou província Washington
DocumentNumber string Número da carteira de habilitação WDLABCD456DG
DocumentDiscriminator string Discriminador de documento de carteira de habilitação 12645646464554646456464544
FirstName string Nome e inicial do segundo nome, se aplicável LIAM R.
LastName string Sobrenome TALBOT
Address address Endereço 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Data de nascimento 01/06/1958
DateOfExpiration date Data de validade 08/12/2020
DateOfIssue date Data de emissão 08/12/2012
EyeColor string Cor dos olhos Azul
HairColor string Cor dos cabelos Marrom
Height string Altura 5'11"
Weight string Peso 185LB
Sex string Gênero M
Endorsements string Endossos L
Restrictions string Restrições B
VehicleClassifications string Classificação do veículo D

idDocument.passport

Campo Type Descrição Exemplo
DocumentNumber string Número de passaporte 340020013
FirstName string Nome e inicial do segundo nome, se aplicável JENNIFER
MiddleName string Nome entre o nome e o sobrenome REYES
LastName string Sobrenome BROOKS
Aliases array
Aliases.* string Também conhecida como MAT LIN
DateOfBirth date Data de nascimento 1980-01-01
DateOfExpiration date Data de validade 2019-05-05
DateOfIssue date Data de emissão 2014-05-06
Sex string Gênero F
CountryRegion countryRegion País ou organização de emissão EUA
DocumentType string Tipo de documento P
Nationality countryRegion Nacionalidade EUA
PlaceOfBirth string Local de nascimento MASSACHUSETTS, U.S.A.
PlaceOfIssue string Local de emissão LISBON
IssuingAuthority string Autoridade de emissão Departamento de Estado dos Estados Unidos
PersonalNumber string ID pessoal. Não. A234567893
MachineReadableZone object MRZ (zona legível por computador) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Nome e inicial do segundo nome, se aplicável JENNIFER
MachineReadableZone.LastName string Sobrenome BROOKS
MachineReadableZone.DocumentNumber string Número de passaporte 340020013
MachineReadableZone.CountryRegion countryRegion País ou organização de emissão EUA
MachineReadableZone.Nationality countryRegion Nacionalidade EUA
MachineReadableZone.DateOfBirth date Data de nascimento 1980-01-01
MachineReadableZone.DateOfExpiration date Data de validade 2019-05-05
MachineReadableZone.Sex string Gênero F

idDocument.nationalIdentityCard

Campo Type Descrição Exemplo
CountryRegion countryRegion Código do país ou região EUA
Region string Estado ou província Washington
DocumentNumber string Número do cartão de identificação nacional WDLABCD456DG
DocumentDiscriminator string Discriminador de documento de cartão de identificação nacional 12645646464554646456464544
FirstName string Nome e inicial do segundo nome, se aplicável LIAM R.
LastName string Sobrenome TALBOT
Address address Endereço 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Data de nascimento 01/06/1958
DateOfExpiration date Data de validade 08/12/2020
DateOfIssue date Data de emissão 08/12/2012
EyeColor string Cor dos olhos BLUE
HairColor string Cor dos cabelos BROWN
Height string Altura 5'11"
Weight string Peso 185LB
Sex string Gênero M

idDocument.residencePermit

Campo Type Descrição Exemplo
CountryRegion countryRegion Código do país ou região EUA
DocumentNumber string Número da permissão de residência WDLABCD456DG
FirstName string Nome e inicial do segundo nome, se aplicável LIAM R.
LastName string Sobrenome TALBOT
DateOfBirth date Data de nascimento 01/06/1958
DateOfExpiration date Data de validade 08/12/2020
DateOfIssue date Data de emissão 08/12/2012
Sex string Gênero M
PlaceOfBirth string Local de nascimento Alemanha
Category string Categoria da permissão DV2
Address string Endereço 123 STREET ADDRESS YOUR CITY WA 99999-1234

idDocument.usSocialSecurityCard

Campo Type Descrição Exemplo
DocumentNumber string Número do cartão de previdência social WDLABCD456DG
FirstName string Nome e inicial do segundo nome, se aplicável LIAM R.
LastName string Sobrenome TALBOT
DateOfIssue date Data de emissão 08/12/2012

idDocument

Campo Type Descrição Exemplo
Address address Endereço 123 STREET ADDRESS YOUR CITY WA 99999-1234
DocumentNumber string Número da carteira de habilitação WDLABCD456DG
FirstName string Nome e inicial do segundo nome, se aplicável LIAM R.
LastName string Sobrenome TALBOT
DateOfBirth date Data de nascimento 01/06/1958
DateOfExpiration date Data de validade 08/12/2020

Tipos de documento compatíveis

Atualmente, o modelo de documento de ID dá suporte a carteiras de motorista dos EUA e à página biográfica de extração de passaportes internacionais (excluindo vistos e outros documentos de viagem).

Campos extraídos

Nome Tipo Descrição Valor
País country O código do país em conformidade com o padrão ISO 3166 "EUA"
DateOfBirth date Nascimento no formato DD-MM-AAAA "01-01-1980"
DateOfExpiration date Data de validade no formato DD-MM-AAAA "05-05-2019"
DocumentNumber string Números relevantes do passaporte, da carteira de motorista etc. "340020013"
Nome string O primeiro nome e nome do meio extraídos, se aplicável "JENNIFER"
LastName string Sobrenome extraído "BROOKS"
Nacionalidade country O código do país em conformidade com o padrão ISO 3166 "EUA"
Gênero gender Os possíveis valores extraídos incluem: "M" "F" "X" "F"
MachineReadableZone objeto Um MRZ extraído do passaporte, incluindo duas linhas de 44 caracteres cada "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Tipo de documento, como passaporte e carteira de motorista "passaporte"
Endereço string Endereço extraído (somente da carteira de motorista) "ENDEREÇO Nº 123 SUA CIDADE WA 99999-1234"
Região string Informações extraídas, como região, estado, província etc. (somente da carteira de motorista) "Washington"

Guia de migração

Próximas etapas