Modelo de cartão de visita da Informação de Documentos

Importante

A partir da Informação de Documentos v4.0 (versão prévia) e, dela em diante, o modelo de cartão de visita (prebuilt-businessCard) está preterido. Para extrair dados de formatos de cartão de visitas, use o seguinte:

Recurso version ID do Modelo
Modelo de cartão de visita • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão anteriores:marca de seleção azulv3.0 marca de seleção azulv2.1

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção púrpurav3.1 | Versão anterior:marca de seleção azulv2.1

Este conteúdo se aplica a:marca de seleçãov2.1 | Versão mais recente:marca de seleção azulv4.0 (versão prévia)

O modelo de cartão de visita da Informação de Documentos combina funcionalidades avançadas de Reconhecimento Óptico de Caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair dados de imagens de cartões de visita. A API analisa cartões de visita impressos; extrai informações importantes, como nome, sobrenome, nome da empresa, endereço de email e número de telefone; e retorna uma representação de dados JSON estruturada.

Extração de dados de cartão de visita

Os cartões de visita são uma ótima forma de representar um negócio ou um profissional. O logotipo da empresa, as fontes e as imagens da tela de fundo encontrados em cartões de visita ajudam a empresa a criar uma identidade visual e se diferenciar das outras. A aplicação de técnicas baseadas em OCR e machine learning para automatizar a verificação de cartões de visita é um cenário comum de processamento de imagens. Os sistemas empresariais usados pelas equipes de vendas e marketing normalmente têm a funcionalidade de extração de dados de cartão de visita integrada para o benefício dos usuários.

Cartão de visita de exemplo processado com o Estúdio de Informação de Documentos

Captura de tela do exemplo de cartão de visita processado no Estúdio de Informação de Documentos.

Cartão de visita de exemplo processado com a ferramenta de Rotulagem de Exemplo da Informação de Documentos

Captura de tela de um cartão de visita de exemplo analisado com a ferramenta de rotulagem de exemplo da Informação de Documentos.

Opções de desenvolvimento

A Informação de Documentos v3.1:2023-07-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de cartão de visita Estúdio da Informação de Documentos
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

A Informação de Documentos v3.0:2022-08-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de cartão de visita Estúdio da Informação de Documentos
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

A Informação de Documentos v2.1 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo de cartão de visita Ferramenta de rotulagem da Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos

Experimentar a extração de dados de cartão de visita

Veja como os dados, incluindo nome, cargo, endereço, email e nome da empresa, são extraídos de cartões de visita. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure – você pode criar uma gratuitamente

  • Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Estúdio de Informação de Documentos

Observação

O Estúdio de Informação de Documentos está disponível com as APIs v3.1 e v3.0.

  1. Na página inicial do Estúdio de Informação de Documentos, selecione Cartões de visita.

  2. Você pode analisar o modelo de cartão de visita ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões de opções Executar análise e Analisar no Document Intelligence Studio.

Ferramenta de Rotulagem de Amostra da Informação de Documentos

  1. Navegue até a Ferramenta de Exemplo da Informação de Documentos.

  2. Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.

    Captura de tela da operação de análise de resultados do modelo de layout.

  3. Selecione o Tipo de Formulário que deseja analisar no menu suspenso.

  4. Escolha um URL para o arquivo que você gostaria de analisar, usando as opções abaixo:

  5. No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar.

    Captura de tela do menu suspenso do local de origem.

  6. No campo Ponto de extremidade do serviço Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.

  7. No campo chave, cole a chave obtida do recurso Informação de Documentos.

    Captura de tela do menu suspenso de tipo seleção de tipo de formulário.

  8. Selecione Executar análise. A ferramenta de rotulagem de exemplo da Informação de Documentos chamará a API predefinida Analisar e analisará o documento.

  9. Exiba os resultados. Consulte os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detectadas.

    Captura de tela da operação de análise de resultados do modelo de cartão de visita.

Observação

A ferramenta de Rotulagem de Exemplo não é compatível com o formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documentos.

Requisitos de entrada

  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Formatos de arquivo com suporte:

    Modelar PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Ler
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-preview)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

  • Formatos de arquivo compatíveis: JPEG, PNG, PDF e TIFF
  • Em PDF e TIFF, até 2000 páginas são processadas. Para assinantes de camada gratuita, somente as duas primeiras páginas são processadas.
  • O tamanho do arquivo precisa ser menor que 50 MB e ter as dimensões mínima de 50 x 50 pixels e máxima de 10.000 x 10.000 pixels.

Idiomas e localidades com suporte

Confira nossa página de Suporte ao idioma para obter uma vista completa dos idiomas compatíveis.

Extrações de campo

Nome Tipo Descrição Saída padronizada
ContactNames Matriz de objetos Nome de contato
Nome String Nome do contato
LastName String Sobrenome do contato
CompanyNames Matriz de cadeia de caracteres Nome(s) da empresa
Departments Matriz de cadeia de caracteres Departamento(s) ou organização(ões) de contato
JobTitles Matriz de cadeia de caracteres Cargo(s) do contato listado
Emails Matriz de cadeia de caracteres Endereço(s) de email de contato
Sites Matriz de cadeia de caracteres Site(s) da empresa
Endereços Matriz de cadeia de caracteres Endereço(s) extraído do cartão de visita
MobilePhones Matriz de números de telefone Número(s) de telefone celular do cartão de visita +1 xxx xxx xxxx
Faxes Matriz de números de telefone Número(s) de fax do cartão de visita +1 xxx xxx xxxx
WorkPhones Matriz de números de telefone Número(s) de telefone de trabalho do cartão de visita +1 xxx xxx xxxx
OtherPhones Matriz de números de telefone Outro(s) número de telefone(s) do cartão de visita +1 xxx xxx xxxx

Campos extraídos

Nome Tipo Descrição Texto
ContactNames matriz de objetos Nome do contato extraído do cartão de visita [{ "FirstName": "John", "LastName": "Doe" }]
FirstName string Nome do contato "John"
LastName string Sobrenome do contato "Doe"
CompanyNames Matriz de cadeias de caracteres Nome da empresa extraído do cartão de visita ["Contoso"]
Departments Matriz de cadeias de caracteres Departamento ou organização de contato ["R&D"]
JobTitles Matriz de cadeias de caracteres Cargo do contato listado ["Software Engineer"]
Emails Matriz de cadeias de caracteres Email do contato extraído do cartão de visita ["johndoe@contoso.com"]
Sites Matriz de cadeias de caracteres Site extraído do cartão de visita ["https://www.contoso.com"]
Endereços Matriz de cadeias de caracteres Endereço extraído do cartão de visita ["123 Main Street, Redmond, WA 98052"]
MobilePhones Matriz de números de telefone Número de telefone celular extraído do cartão de visita ["+19876543210"]
Faxes Matriz de números de telefone Número de fax extraído do cartão de visita ["+19876543211"]
WorkPhones Matriz de números de telefone Número de telefone comercial extraído do cartão de visita ["+19876543231"]
OtherPhones Matriz de números de telefone Outro número de telefone extraído do cartão de visita ["+19876543233"]

Localidades com suporte

Os cartões de visita predefinidos v2.1 são compatíveis com as seguintes localidades:

  • en-US
  • en-au
  • en-ca
  • en-gb
  • en-in

Guia de migração e API REST v3.1

Próximas etapas