Modelo de cartão de visita da Informação de Documentos
Importante
A partir da Informação de Documentos v4.0 (versão prévia) e, dela em diante, o modelo de cartão de visita (prebuilt-businessCard) está preterido. Para extrair dados de formatos de cartão de visitas, use o seguinte:
Recurso | version | ID do Modelo |
---|---|---|
Modelo de cartão de visita | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
Esse conteúdo se aplica a: v3.0 (GA) | Ultimas versões: v4.0 (versão prévia) v3.1 | Versões prévia: v2.1
Esse conteúdo se aplica a: v2.1 | ais recente: v4.0 (versão prévia)
O modelo de cartão de visita da Informação de Documentos combina funcionalidades avançadas de Reconhecimento Óptico de Caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair dados de imagens de cartões de visita. A API analisa cartões de visita impressos, extrai informações importantes, como nome, sobrenome, nome da empresa, endereço de email e número de telefone e retorna uma representação de dados JSON estruturada.
Extração de dados de cartão de visita
Os cartões de visita são uma ótima forma de representar um negócio ou um profissional. O logotipo da empresa, as fontes e as imagens em segundo plano encontrados em cartões de visita ajudam a empresa a criar uma identidade visual e se destacar das outras. A aplicação de técnicas baseadas em OCR e machine learning para automatizar a verificação de cartões de visita é um cenário comum de processamento de imagens. Os sistemas empresariais usados pelas equipes de vendas e marketing normalmente têm a funcionalidade de extração de dados de cartão de visita integrada para o benefício dos usuários.
Cartão de visita de exemplo processado com o Estúdio de Informação de Documentos
Cartão de visita de exemplo processado com a ferramenta de Rotulagem de Exemplo da Informação de Documentos
Opções de desenvolvimento
A Informação de Documentos v3.1:2023-07-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos | ID do Modelo |
---|---|---|
Modelo de cartão de visita | • Estúdio da Informação de Documentos • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
A Informação de Documentos v3.0:2022-08-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos | ID do Modelo |
---|---|---|
Modelo de cartão de visita | • Estúdio da Informação de Documentos • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
A Informação de Documentos v2.1 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos |
---|---|
Modelo de cartão de visita | • Ferramenta de rotulagem da Informação de Documentos • API REST SDK da biblioteca de clientes • Contêiner do Docker da Informação de Documentos |
Experimentar a extração de dados de cartão de visita
Veja como os dados, incluindo nome, cargo, endereço, email e nome da empresa, são extraídos de cartões de visita. Você precisa dos seguintes recursos:
Uma assinatura do Azure – você pode criar uma gratuitamente
Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.
Estúdio de Informação de Documentos
Observação
O Estúdio de Informação de Documentos está disponível com as APIs v3.1 e v3.0.
Na home page do Estúdio de Informação de Documentos, selecione Cartões de visita.
Você pode analisar o modelo de cartão de visita ou carregar seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :
Ferramenta de Rotulagem de Amostra da Informação de Documentos
Navegue até a Ferramenta de Exemplo da Informação de Documentos.
Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.
Selecione o Tipo de Formulário que deseja analisar no menu suspenso.
Escolha um URL para o arquivo que você gostaria de analisar, usando as opções abaixo:
No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar.
No campo Ponto de extremidade do serviço Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.
No campo chave, cole a chave obtida do recurso Informação de Documentos.
Selecione Executar análise. A ferramenta de rotulagem de exemplo da Informação de Documentos chamará a API predefinida Analisar e analisará o documento.
Veja os resultados: confira os pares chave-valor extraídos, os itens de linha, o texto realçado extraído e as tabelas detectadas.
Observação
A ferramenta de Rotulagem de Exemplo não é compatível com o formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documentos.
Requisitos de entrada
Formatos de arquivo com suporte:
Modelar PDF Image,: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento geral ✔ ✔ Predefinida ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e
4
MB para a camada gratuita (F0).As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente
8
pontos de texto a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e
1
GB para o modelo neural.Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de
1
GB, com um máximo de 10.000 páginas. Para a versão 2024-07-31-preview e posteriores, o tamanho total dos dados de treinamento é de2
GB, com um máximo de 10.000 páginas.
- Os formatos de arquivo compatíveis: JPEG, PNG, PDF e TIFF
- Em PDF e TIFF, até 2.000 páginas são processadas. Para assinantes de camada gratuita, somente as duas primeiras páginas são processadas.
- O tamanho do arquivo precisa ser menor que 50 MB e ter as dimensões mínima de 50 x 50 pixels e máxima de 10.000 x 10.000 pixels.
Idiomas e localidades com suporte
Confira nossa página de Suporte ao idioma para obter uma vista completa dos idiomas compatíveis.
Extrações de campo
Nome | Tipo | Descrição | Saída padronizada |
---|---|---|---|
ContactNames | Matriz de objetos | Nome de contato | |
Nome | String | Nome do contato | |
LastName | String | Sobrenome do contato | |
CompanyNames | Matriz das cadeias de caracteres | Nome da empresa | |
Departments | Matriz das cadeias de caracteres | Departamento ou organização de contato | |
JobTitles | Matriz das cadeias de caracteres | Cargo do contato listado | |
Emails | Matriz das cadeias de caracteres | Endereço de email de contato | |
Sites | Matriz das cadeias de caracteres | Site da empresa | |
Endereços | Matriz das cadeias de caracteres | Endereço extraído do cartão de visita | |
MobilePhones | Matriz de números de telefone | Número de telefone celular do cartão de visita | +1 xxx xxx xxxx |
Faxes | Matriz de números de telefone | Número de fax do cartão de visita | +1 xxx xxx xxxx |
WorkPhones | Matriz de números de telefone | Número de telefone comercial do cartão de visita | +1 xxx xxx xxxx |
OtherPhones | Matriz de números de telefone | Outro número de telefone do cartão de visita | +1 xxx xxx xxxx |
Campos extraídos
Nome | Tipo | Descrição | Texto |
---|---|---|---|
ContactNames | matriz de objetos | Nome do contato extraído do cartão de visita | [{ "FirstName": "John", "LastName": "Doe" }] |
FirstName | string | Nome do contato | "John" |
LastName | string | Sobrenome do contato | "Doe" |
CompanyNames | Matriz de cadeias de caracteres | Nome da empresa extraído do cartão de visita | ["Contoso"] |
Departments | Matriz de cadeias de caracteres | Departamento ou organização de contato | ["R&D"] |
JobTitles | Matriz de cadeias de caracteres | Cargo do contato listado | ["Software Engineer"] |
Emails | Matriz de cadeias de caracteres | Email do contato extraído do cartão de visita | ["johndoe@contoso.com"] |
Sites | Matriz de cadeias de caracteres | Site extraído do cartão de visita | ["https://www.contoso.com"] |
Endereços | Matriz de cadeias de caracteres | Endereço extraído do cartão de visita | ["123 Main Street, Redmond, Washington 98052"] |
MobilePhones | Matriz de números de telefone | Número de telefone celular extraído do cartão de visita | ["+19876543210"] |
Faxes | Matriz de números de telefone | Número de fax extraído do cartão de visita | ["+19876543211"] |
WorkPhones | Matriz de números de telefone | Número de telefone comercial extraído do cartão de visita | ["+19876543231"] |
OtherPhones | Matriz de números de telefone | Outro número de telefone extraído do cartão de visita | ["+19876543233"] |
Localidades com suporte
Os cartões de visita predefinidos v2.1 são compatíveis com as seguintes localidades:
- en-US
- en-au
- en-ca
- en-gb
- en-in
Guia de migração e API REST v3.1
- Siga nosso Guia de migração da Informação de Documentos v3.1 para saber como usar a versão v3.0 em seus aplicativos e fluxos de trabalho.
Próximas etapas
Experimente processar seus próprios formulários com o Estúdio de Informação de Documentos
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Experimente processar seus próprios formulários com a Amostra de ferramenta de rotulagem Estúdio de Informação de Documentos
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.