O que há de novo no Azure AI Document Intelligence
Este conteúdo aplica-se a: v4.0 (pré-visualização) v3.1 (GA) v3.0 (GA) v2.1 (GA)
O serviço de Informações Documentais é atualizado continuamente. Marque esta página para se manter atualizado com as notas de versão, aprimoramentos de recursos e nossa documentação mais recente.
Importante
As versões da API de visualização são desativadas assim que a API do GA é lançada. A versão da API 2023-02-28-preview está sendo desativada, se você ainda estiver usando a API de visualização ou as versões associadas do SDK, atualize seu código para direcionar a versão mais recente da API 2023-07-31 (GA).
Agosto de 2024
A API REST do Document Intelligence 2024-07-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:
A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. O novo modelo de extração de campo de documento no AI Studio só está disponível na região Centro-Norte dos EUA:
E.U.A. Leste
Oeste dos EUA2
Europa Ocidental
Centro-Norte dos EUA
🆕 Modelo de extração de campo de documento (generativo personalizado)
- Use a IA generativa para extrair campos de documentos e formulários. O Document Intelligence agora oferece um novo modelo de extração de campo de documento que utiliza grandes modelos de linguagem (LLMs) para extrair campos de documentos não estruturados ou formulários estruturados com uma ampla variedade de modelos visuais. Com valores fundamentados e pontuações de confiança, a nova extração baseada em IA generativa se encaixa em seus processos existentes.
🆕 Modelo composto com classificadores personalizados
- O Document Intelligence agora adiciona suporte para compor modelos com um modelo de classificação personalizado explícito. Saiba mais sobre os benefícios de usar o novo recurso de composição.
Modelo de classificação personalizado
- O modelo de classificação personalizado agora também suporta a atualização do modelo in-loco.
- O modelo de classificação personalizado adiciona suporte à operação de cópia de modelo para habilitar o backup e a recuperação de desastres.
- O modelo de classificação personalizado agora suporta a especificação explícita de páginas a serem classificadas a partir de um documento de entrada.
🆕 Modelo de documentos de hipoteca
- Extrair informações da Avaliação (Formulário 1004).
- Extraia informações da Validação de Emprego (Formulário 1005).
-
- Extraia o beneficiário, o montante, a data e outras informações relevantes dos cheques.
-
- Novo pré-construído para processar stubs de pagamento para extrair salários, horas, deduções, pagamento líquido e muito mais.
-
- Novo pré-construído para extrair informações da conta, incluindo saldos iniciais e finais, detalhes da transação de extratos bancários.
-
- Novo modelo tributário unificado dos EUA que pode extrair de formulários como W-2, 1098, 1099 e 1040.
🆕 PDF pesquisável. O modelo de leitura pré-construído agora suporta saída PDF para baixar PDFs com texto incorporado dos resultados da extração, permitindo que o PDF seja utilizado em cenários como cópia de pesquisa de conteúdo.
O modelo de layout agora suporta deteção de figuras aprimorada, onde figuras de documentos agora podem ser baixadas como um arquivo de imagem a ser usado para maior compreensão de figuras. O modelo de layout também apresenta melhorias no modelo OCR para melhorias na segmentação de texto digitalizado para caracteres únicos, texto em caixa e documentos de texto denso.
-
- O Document Intelligence agora adiciona suporte para a operação de análise em lote para dar suporte à análise de um conjunto de documentos para simplificar a experiência do desenvolvedor e melhorar a eficiência.
-
- Campos de consulta A qualidade da extração de IA é melhorada com o modelo mais recente.
maio de 2024
O Document Intelligence Studio adiciona suporte para autenticação do Microsoft Entra (anteriormente Azure Ative Directory). Para obter mais informações, consulte Visão geral do Document Intelligence Studio.
Fevereiro de 2024
A API REST do Document Intelligence 2024-07-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:
A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
O modelo de layout agora suporta deteção de figuras e análise hierárquica da estrutura do documento (seções e subseções). A qualidade da IA na ordem de leitura e na deteção de funções lógicas também é melhorada.
Modelos de extração personalizados
- Os modelos de extração personalizados agora suportam pontuações de confiança em nível de célula, linha e tabela. Saiba mais sobre a confiança na tabela, linha e célula.
- Os modelos de extração personalizados têm melhorias de qualidade de IA para extração de campo.
- O modelo de extração de modelo personalizado agora suporta a extração de campos sobrepostos. Saiba mais sobre campos sobrepostos e como usá-los.
Modelo de classificação personalizado
- O modelo de classificação personalizado agora oferece suporte ao treinamento incremental para cenários em que você precisa atualizar o modelo de classificador com amostras ou classes adicionadas. Saiba mais sobre o treinamento incremental.
- O modelo de classificação personalizado adiciona suporte para tipos de documentos do Office (.docx, .pptx e .xls). Saiba mais sobre o suporte expandido a tipos de documentos.
-
- Suporte para novas localidades:
Região Código Árabe ( ar
)Búlgaro ( bg
)Grego ( el
)Hebraico ( he
)Macedónio ( mk
)Russo ( ru
)Cirílico sérvio ( sr-cyrl
)Ucraniano ( uk
)Tailandês ( th
)Turco ( tr
)Vietnamita ( vi
)- Suporte para novos códigos de moeda:
Moeda Região Código BAM
Marca descapotável bósnia ( ba
)BGN
Lev búlgaro ( bg
)ILS
Novo Shekel israelita ( il
)MKD
Denar macedónio ( mk
)RUB
Rublo russo ( ru
)THB
Baht tailandês ( th
)TRY
Lira turca ( tr
)UAH
Hryvnia ucraniana ( ua
)VND
Dong vietnamita ( vn
)- Itens fiscais suportam a expansão para Alemanha (
de
), Espanha (es
), Portugal (pt
), Inglês Canadáen-CA
.
-
- Suporte de campo expandido para IDs da União Europeia e carteira de motorista.
-
- Extraia informações do Pedido de Empréstimo Residencial Uniforme (Formulário 1003).
- Extraia informações do Resumo Uniforme de Subscrição e Transmissão ou do Formulário 1008.
- Extraia informações da divulgação de fechamento de hipotecas.
🆕 Modelo de cartão de crédito/débito
- Extraia informações de cartões bancários.
-
- Novo pré-construído para extrair informações de certidões de casamento.
Dezembro de 2023
As bibliotecas de cliente do Document Intelligence destinadas à API REST 2023-10-31-preview já estão disponíveis para uso!
Novembro de 2023
A API REST do Document Intelligence 2023-10-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:
A versão de pré-visualização pública 2023-10-31-preview está atualmente disponível apenas nas seguintes regiões do Azure:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
-
- Expansão do idioma para caligrafia: russo(
ru
), árabe(ar
), tailandês(th
). - Conformidade com a Ordem Executiva Cibernética (EO).
- Expansão do idioma para caligrafia: russo(
-
- Escritório de suporte e arquivos HTML.
- Suporte de saída de Markdown.
- Melhorias na extração de tabelas, na ordem de leitura e na deteção de cabeçalhos de seção.
- Com o Document Intelligence 2023-10-31-preview, o modelo de documento geral (prebuilt-document) foi preterido. No futuro, para extrair pares chave-valor de documentos, use o
prebuilt-layout
modelo com o parâmetrofeatures=keyValuePairs
opcional de cadeia de caracteres de consulta habilitado.
-
- Agora extrai moeda para todos os campos relacionados a preços.
Modelo de Cartão de Seguro de Saúde
- Novo suporte de campo para informações sobre Medicare e Medicaid.
Modelos de documentos fiscais dos EUA
- Novo modelo fiscal 1099. Suporta o formulário base 1099 e as seguintes variações: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Suporte para
KVK
campo. - Suporte para
BPAY
campo. - Inúmeros refinamentos de campo.
- Suporte para
-
- Suporte para documentos multilingues.
- Novas opções de divisão de página: divisão automática, sempre dividida por página, sem divisão.
Nota
Com a versão 2022-08-31 API general availability (GA), as APIs de visualização associadas estão sendo preteridas. Se você estiver usando as versões da API 2021-09-30-preview, 2022-01-30-preview ou 2022-06-30-preview, atualize seus aplicativos para direcionar a versão da API 2022-08-31. Há algumas pequenas alterações envolvidas, para obter mais informações, consulte o guia de migração.
Julho de 2023
Nota
O Form Recognizer agora é o Azure AI Document Intelligence!
- Documento, os serviços de IA do Azure abrangem todos os que eram anteriormente conhecidos como Serviços Cognitivos e Serviços de IA Aplicada do Azure.
- Não há alterações nos preços.
- Os nomes Serviços Cognitivos e IA Aplicada do Azure continuam a ser usados na faturação do Azure, na análise de custos, na lista de preços e nas APIs de preços.
- Não há alterações significativas nas interfaces de programação de aplicativos (APIs) ou bibliotecas de clientes.
- Algumas plataformas ainda aguardam a atualização de renomeação. Todas as menções ao Reconhecedor de Formulários ou Inteligência de Documentos em nossa documentação referem-se ao mesmo serviço do Azure.
Inteligência Documental v3.1 (GA)
A API do Document Intelligence versão 3.1 está agora disponível para o público em geral (GA)! A versão da API corresponde a 2023-07-31
.
A API v3.1 introduz recursos novos e atualizados:
- As APIs de Document Intelligence agora são mais modulares e com suporte para recursos opcionais. Agora você pode personalizar a saída para incluir especificamente os recursos necessários. Saiba mais sobre os parâmetros opcionais.
- API de classificação de documentos para dividir um único arquivo em documentos individuais. Saiba mais sobre a classificação de documentos.
- Modelo de contrato pré-construído.
- Modelo 1098 do formulário de imposto dos EUA pré-construído.
- Suporte para tipos de arquivo do Office com API de leitura.
- Reconhecimento de código de barras em documentos.
- Capacidade complementar de reconhecimento de fórmulas.
- Capacidade de complemento de reconhecimento de fontes.
- Suporte para documentos de alta resolução.
- Modelos neurais personalizados agora exigem uma única amostra rotulada para treinar.
- Expansão de linguagem de modelos neurais personalizados. Treine um modelo neural para documentos em 30 idiomas. Consulte o suporte a idiomas para obter a lista completa de idiomas suportados.
- 🆕 Modelo de cartão de seguro de saúde pré-construído.
- Expansão da localidade do modelo de fatura pré-construído.
- Modelo de recibo pré-construído e expansão de localidade com mais de 100 idiomas suportados.
- O modelo de ID pré-construído agora suporta IDs europeus.
Atualizações de UX do Document Intelligence Studio
✔️ Analisar opções
O Document Intelligence agora suporta recursos de análise mais sofisticados e o Studio permite um ponto de entrada (botão Analisar opções) para configurar os recursos adicionais com facilidade.
Dependendo do cenário de extração de documentos, configure o intervalo de análise, o intervalo de páginas do documento, a deteção opcional e os recursos de deteção premium.
Nota
A extração de fontes não é visualizada no Document Intelligence Studio. No entanto, você pode verificar a seção de estilos da saída JSON para obter os resultados da deteção de fontes.
✔️ Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos
Na página de etiquetagem de modelo de extração personalizada, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou modelos que você treinou anteriormente.
Para alguns documentos, pode haver etiquetas duplicadas depois de executar a etiqueta automática. Certifique-se de modificar os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.
✔️ Tabelas de etiquetagem automática
Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.
✔️ Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento
Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.
Se for devolvida uma pontuação de confiança baixa para algumas etiquetas, certifique-se de que as etiquetas estão corretas. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.
✔️ Faça uso das opções e filtros da lista de documentos em projetos personalizados
Use a página de rotulagem do modelo de extração personalizado. Agora você pode navegar pelos documentos de treinamento com facilidade, usando a pesquisa, o filtro e a classificação por recurso.
Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer os documentos mais facilmente.
✔️ Partilha de projetos
- Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.
Maio de 2023
Apresentando a documentação atualizada para o Build 2023
🆕 Visão geral do Document Intelligence navegação aprimorada, pontos de acesso estruturados e imagens enriquecidas.
🆕 Escolha um modelo de Document Intelligence fornece orientação para escolher a melhor solução de Document Intelligence para seus projetos e fluxos de trabalho.
Abril de 2023
Anunciando a versão de visualização pública mais recente da biblioteca cliente do Document Intelligence
A versão 2023-02-28-preview da API REST do Document Intelligence suporta as bibliotecas de cliente da versão de visualização pública. Esta versão inclui os seguintes novos recursos e capacidades disponíveis para bibliotecas de cliente .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) e Python (3.3.0b.1):
Para obter mais informações, consulte Document Intelligence SDK (visualização pública) e Notas de versão de março de 2023
Março de 2023
Importante
2023-02-28-preview
Atualmente, os recursos estão disponíveis apenas nas seguintes regiões:
- Europa Ocidental
- E.U.A. Oeste 2
- E.U.A. Leste
- O modelo de classificação personalizado é um novo recurso dentro do Document Intelligence que começa com a
2023-02-28-preview
API. - Recursos de campos de consulta adicionados ao modelo de Documento Geral, use modelos do Azure OpenAI para extrair campos específicos de documentos. Experimente o recurso Documentos gerais com campos de consulta usando o Document Intelligence Studio. Atualmente, os campos de consulta estão ativos apenas para recursos na
East US
região. - Recursos complementares:
- A extração de fontes agora é reconhecida com a
2023-02-28-preview
API. - A extração de fórmulas agora é reconhecida com a
2023-02-28-preview
API. - A extração de alta resolução agora é reconhecida com a
2023-02-28-preview
API.
- A extração de fontes agora é reconhecida com a
- Atualizações do modelo de extração personalizado:
- Atualizações do Document Intelligence Studio :
- Além do suporte para todos os novos recursos, como classificação e campos de consulta, o Studio agora permite o compartilhamento de projetos para projetos de modelo personalizados.
- Novas adições de modelo na pré-visualização fechada: cartões de vacinação, contratos, imposto dos EUA 1098, imposto dos EUA 1098-E e imposto dos EUA 1098-T. Para solicitar acesso a modelos de visualização fechados, preencha e envie o formulário de solicitação de visualização privada do Document Intelligence.
- Atualizações do modelo de recibo:
- O modelo de recibo adiciona suporte para recibos térmicos.
- O modelo de recibo agora adiciona suporte a idiomas para 18 idiomas e três idiomas regionais (inglês, francês, português).
- O modelo de recibo agora suporta
TaxDetails
extração.
- O modelo de layout agora melhora o reconhecimento da tabela.
- O modelo Read agora adiciona melhorias para o reconhecimento de caracteres de um dígito.
Fevereiro de 2023
Selecione os contêineres do Document Intelligence para v3.0 agora estão disponíveis para uso!
Atualmente, os contêineres Read v3.0 e Layout v3.0 estão disponíveis.
Para obter mais informações, consulte Instalar e executar contêineres de Document Intelligence.
Janeiro de 2023
Modelo de recibo pré-construído - adicionado idiomas suportados. O modelo de recibo agora suporta esses idiomas e localidades adicionados
- Japonês - Japão (ja-JP)
- Francês - Canadá (fr-CA)
- Neerlandês - Países Baixos (nl-NL)
- Inglês - Emirados Árabes Unidos (pt-AE)
- Português - Brasil (pt-BR)
Modelo de fatura pré-construído - adicionado idiomas suportados. O modelo de fatura agora suporta esses idiomas e localidades adicionados
- Inglês - Estados Unidos (en-US), Austrália (en-AU), Canadá (en-CA), Reino Unido (en-UK), Índia (en-IN)
- Espanhol - Espanha (es-ES)
- Francês - França (fr-FR)
- Italiano - Itália (it-IT)
- Português - Portugal (pt-PT)
- Neerlandês - Países Baixos (nl-NL)
Modelo de fatura pré-construído - campos adicionados reconhecidos. O modelo de fatura agora reconhece esses campos adicionados
- Código de moeda
- Opções de pagamento
- Desconto total
- Itens fiscais (somente en-IN)
Modelo de ID pré-construído - adicionado tipos de documentos suportados. O modelo de ID agora suporta esses tipos de documentos adicionados
- Identificação militar dos EUA
Gorjeta
Todas as atualizações de janeiro de 2023 estão disponíveis com a versão 2022-08-31 (GA) da API REST.
Modelo de recibo pré-construído — suporte a idiomas adicionais:
O modelo de recibo pré-construído adiciona suporte para os seguintes idiomas:
- Inglês - Emirados Árabes Unidos (pt-AE)
- Neerlandês - Países Baixos (nl-NL)
- Francês - Canadá (fr-CA)
- Alemão - (de-DE)
- Italiano - (it-IT)
- Japonês - Japão (ja-JP)
- Português - Brasil (pt-BR)
Modelo de fatura pré-construído — suporte a idiomas adicionais e extrações de campo
O modelo de fatura pré-criado adiciona suporte para os seguintes idiomas:
- Inglês - Austrália (en-AU), Canadá (en-CA), Reino Unido (en-UK), Índia (en-IN)
- Português - Brasil (pt-BR)
O modelo de fatura pré-construído agora adiciona suporte para as seguintes extrações de campo:
- Código de moeda
- Opções de pagamento
- Desconto total
- Itens fiscais (somente en-IN)
Modelo de documento de ID pré-construído — suporte a tipos de documentos adicionais
O modelo de documento de ID pré-criado agora adiciona suporte para os seguintes tipos de documentos:
- Expansão da carteira de motorista com suporte para Índia, Canadá, Reino Unido e Austrália
- Cartões e documentos de identificação militar dos EUA
- Cartões de identidade e documentos da Índia (PAN e Aadhaar)
- Cartões de identificação e documentos da Austrália (cartão com foto, identificação com chave)
- Cartões de identificação e documentos do Canadá (cartão de identificação, cartão Maple)
- Bilhetes de identidade e documentos do Reino Unido (bilhete de identidade nacional/regional)
Dezembro de 2022
Atualizações do Document Intelligence Studio
A versão de dezembro do Document Intelligence Studio inclui as atualizações mais recentes do Document Intelligence Studio. Há melhorias significativas na experiência do usuário, principalmente com suporte à etiquetagem de modelo personalizado.
Intervalo de páginas. O Studio agora suporta a análise de páginas especificadas de um documento.
Etiquetagem de modelo personalizada:
Execute a API de layout automaticamente. Você pode optar por executar a API de layout para todos os documentos automaticamente em seu armazenamento de blob durante o processo de configuração do modelo personalizado.
Pesquisar. O Studio agora inclui a funcionalidade de pesquisa para localizar palavras dentro de um documento. Esta melhoria permite uma navegação mais fácil durante a rotulagem.
Navegação. Você pode selecionar rótulos para direcionar palavras rotuladas em um documento.
Etiquetagem automática de tabelas. Depois de selecionar o ícone de tabela em um documento, você pode optar por rotular automaticamente a tabela extraída na exibição de rotulagem.
Subtipos de rótulo e subtipos de segundo nível O Studio agora oferece suporte a subtipos para colunas de tabela, linhas de tabela e subtipos de segundo nível para tipos como datas e números.
A criação de modelos neurais personalizados agora é suportada na região Gov Virginia dos EUA.
Visualize as versões
2022-01-30-preview
da API e2021-09-30-preview
será desativada em 31 de janeiro de 2023. Atualize para a versão da API para evitar interrupções no2022-08-31
serviço.
Novembro de 2022
- Anunciando a versão estável mais recente das bibliotecas do Azure AI Document Intelligence
- Esta versão inclui alterações e atualizações importantes para bibliotecas de cliente .NET, Java, JavaScript e Python. Para obter mais informações, consulte Azure SDK DevBlog.
- As melhorias mais significativas são a introdução de dois novos clientes, o
DocumentAnalysisClient
e oDocumentModelAdministrationClient
.
Outubro de 2022
Conteúdo versionado do Document Intelligence
A documentação do Document Intelligence é atualizada para apresentar uma experiência versionada. Agora, você pode optar por visualizar o conteúdo direcionado à
v3.0 GA
experiência ou àv2.1 GA
experiência. A experiência v3.0 é o padrão.
Código de exemplo do Document Intelligence Studio
- O código de exemplo para a experiência de rotulagem do Document Intelligence Studio já está disponível no GitHub. Os clientes podem desenvolver e integrar a Document Intelligence em sua própria UX ou criar sua própria nova UX usando o código de exemplo do Document Intelligence Studio.
Expansão linguística
- Com a versão de visualização mais recente, os modelos de modelo Leitura (OCR), Layout e Personalizado do Document Intelligence suportam 134 novos idiomas. Estas adições linguísticas incluem grego, letão, sérvio, tailandês, ucraniano e vietnamita, juntamente com várias línguas latinas e cirílicas. O Document Intelligence agora tem um total de 299 idiomas suportados no GA mais recente e nas novas versões de visualização. Consulte as páginas de idiomas suportados para ver todos os idiomas suportados.
- Use o parâmetro
api-version=2022-06-30-preview
REST API ao usar a API ou o SDK correspondente para oferecer suporte aos novos idiomas em seus aplicativos.
Novo modelo de contrato pré-construído
- Um novo pré-construído que extrai informações de contratos, como partes, título, ID do contrato, data de execução e muito mais. O modelo de contratos está atualmente em pré-visualização, solicite acesso aqui.
Expansão de região para treinamento de modelos neurais personalizados
- Treinamento de modelos neurais personalizados agora suportados em regiões adicionadas.
- E.U.A. Leste
- E.U.A. Leste 2
- US Gov - Arizona
- Treinamento de modelos neurais personalizados agora suportados em regiões adicionadas.
Setembro de 2022
Nota
A partir da versão 4.0.0, um novo conjunto de clientes foi introduzido para aproveitar os recursos mais recentes do serviço de Inteligência Documental.
A versão do SDK versão 4.0.0 GA inclui as seguintes atualizações:
- Versão 4.0.0 GA (2022-09-08)
- Suporta clientes REST API v3.0 e v2.0
Expansão de região para treinamento de modelos neurais personalizados agora suportada em seis novas regiões
- Leste da Austrália
- E.U.A. Central
- Ásia Leste
- França Central
- Sul do Reino Unido
- E.U.A. Oeste 2
Para obter uma lista completa das regiões onde o treinamento é suportado, consulte modelos neurais personalizados.
Versão do SDK
4.0.0 GA
do Document Intelligence:- As bibliotecas de cliente do Document Intelligence versão 4.0.0 (.NET/C#, Java, JavaScript) e versão 3.2.0 (Python) estão geralmente disponíveis e prontas para uso em aplicativos de produção!.
- Para obter mais informações sobre bibliotecas de cliente do Document Intelligence, consulte a visão geral do SDK.
- Atualize seus aplicativos usando o guia de migração da linguagem de programação.
Agosto de 2022
A versão de pré-visualização de agosto de 2022 do SDK do Document Intelligence inclui as seguintes atualizações:
Versão 4.0.0-beta.5 (2022-08-09)
Document Intelligence v3.0 disponível em geral
- Document Intelligence REST API v3.0 agora está disponível para uso geral e pronto para uso em aplicativos de produção! Atualize seus aplicativos com a API REST versão 2022-08-31.
Atualizações do Document Intelligence Studio
- Próximos passos. Em cada página de modelo, o Studio agora tem uma seção de próximas etapas. Os usuários podem consultar rapidamente o código de exemplo, as diretrizes de solução de problemas e as informações de preços.
- Modelos personalizados. O Studio agora inclui a capacidade de reordenar etiquetas em projetos de modelos personalizados para melhorar a eficiência da rotulagem.
- Copiar modelos Os modelos personalizados podem ser copiados entre os serviços de Document Intelligence a partir do Studio. A operação possibilita a promoção de um modelo treinado para outros ambientes e regiões.
- Excluir documentos. O Studio agora suporta a exclusão de documentos de conjuntos de dados rotulados em projetos personalizados.
Atualizações do serviço de Inteligência Documental
- leitura pré-embutida. O modelo Read OCR agora também está disponível em Document Intelligence com parágrafos e deteção de idioma como os dois novos recursos. O Document Intelligence Read tem como alvo cenários avançados de documentos alinhados com os recursos mais amplos de inteligência documental do Document Intelligence.
- layout pré-construído. O modelo de layout extrai parágrafos e se o texto extraído é um parágrafo, título, título de seção, nota de rodapé, cabeçalho de página, rodapé de página ou número de página.
- fatura pré-embutida. Os campos TotalVAT e Linha/IVA agora são resolvidos para os campos existentes TotalTax e Line/Tax respectivamente.
- prebuilt-idDocument. Suporte de extração de dados para identificação do estado dos EUA, segurança social e green cards. Suporte para informações de visto de passaporte.
- recibo pré-embutido. Suporte de localidade expandido para francês (fr-FR), espanhol (es-ES), português (pt-PT), italiano (it-IT) e alemão (de-DE).
- cartão de visita pré-construído. Suporte à análise de endereços para extrair subcampos para componentes de endereço, como endereço, cidade, estado, país/região e código postal.
Melhorias na qualidade da IA
- leitura pré-embutida. Suporte aprimorado para caracteres únicos, datas manuscritas, valores, nomes, outros dados importantes comumente encontrados em recibos e faturas e processamento aprimorado de documentos PDF digitais.
- layout pré-construído. Suporte para melhor deteção de tabelas cortadas, tabelas sem bordas e melhor reconhecimento de células de extensão longa.
- documento pré-construído. Deteção melhorada de valores e caixas de verificação.
- personalizado-neural. Maior precisão para deteção e extração de tabelas.
Junho de 2022
- A versão beta de junho de 2022 do SDK do Document Intelligence inclui as seguintes atualizações:
Versão 4.0.0-beta.4 (2022-06-08)
A versão de junho do Document Intelligence Studio é a atualização mais recente do Document Intelligence Studio. Há melhorias consideráveis de experiência do usuário e acessibilidade abordadas nesta atualização:
- Exemplo de código para JavaScript e C#. A guia de código Studio agora adiciona exemplos de código JavaScript e C#, além do Python existente.
- Nova interface do usuário de carregamento de documentos. O Studio agora suporta o upload de um documento com arrastar & soltar na nova interface de usuário de upload.
- Novo recurso para projetos personalizados. Projetos personalizados agora suportam a criação de conta de armazenamento e blobs ao configurar o projeto. Além disso, o projeto personalizado agora suporta o upload de arquivos de treinamento diretamente no Studio e a cópia do modelo personalizado existente.
A versão 2022-06-30-preview do Document Intelligence v3.0 apresenta atualizações extensas nas APIs de recursos:
- O layout estende a extração da estrutura. O layout agora inclui elementos de estrutura adicionados, incluindo seções, cabeçalhos de seção e parágrafos. Esta atualização permite cenários de segmentação de documentos de grão mais fino. Para obter uma lista completa dos elementos de estrutura identificados, consulte Estrutura aprimorada.
- Suporte a campos tabulares de modelo neural personalizado. Os modelos de documentos personalizados agora suportam campos tabulares. Os campos tabulares por padrão também são de várias páginas. Para saber mais sobre campos tabulares em modelos neurais personalizados, consulte Campos tabulares.
- Suporte a campos tabulares de modelo de modelo personalizado para tabelas de páginas cruzadas. Os modelos de formulário personalizados agora oferecem suporte a campos tabulares nas páginas. Para saber mais sobre campos tabulares em modelos de modelo personalizados, consulte Campos tabulares.
- A saída do modelo de fatura agora inclui pares chave-valor gerais do documento. Quando as faturas contêm campos obrigatórios além dos campos incluídos no modelo pré-construído, o modelo de documento geral complementa a saída com pares chave-valor. Consulte os pares de valores de chave.
- Expansão do idioma da fatura. O modelo de fatura inclui suporte a idiomas expandido. Consulte os idiomas suportados.
- O cartão de visita pré-construído agora inclui suporte ao idioma japonês. Consulte os idiomas suportados.
- Modelo de documento de identificação pré-construído. O modelo de documento de identificação agora extrai DateOfIssue, Height, Weight, EyeColor, HairColor e DocumentDiscriminator das carteiras de motorista dos EUA. Veja extração de campo.
- O modelo Read agora suporta tipos de documentos comuns do Microsoft Office. Tipos de documentos como Word (docx), Excel (xlsx) e PowerPoint (pptx) agora são suportados com a API de leitura. Consulte Ler extração de dados.
Fevereiro de 2022
Versão 4.0.0-beta.3 (2022-02-10)
A versão prévia do Document Intelligence v3.0 apresenta vários novos recursos, recursos e aprimoramentos:
- Modelo neural personalizado ou modelo de documento personalizado é um novo modelo personalizado para extrair texto e marcas de seleção de formulários estruturados, documentos semiestruturados e não estruturados.
- O modelo pré-construído W-2 é um novo modelo pré-construído para extrair campos de formulários W-2 para relatórios fiscais e cenários de verificação de rendimentos.
- A API de leitura extrai linhas de texto impressas, palavras, locais de texto, idiomas detetados e texto manuscrito, se detetado.
- O modelo geral pré-treinado de documentos agora é atualizado para oferecer suporte a marcas de seleção, além de texto de API, tabelas, estrutura e pares chave-valor de formulários e documentos.
- API de faturas O modelo pré-construído de faturas expande o suporte a faturas espanholas.
- O Document Intelligence Studio adiciona novas demonstrações para amostras de recibos de Read, W2 e Hotel e suporte para treinar os novos modelos neurais personalizados.
- Expansão de idioma Document Intelligence Leitura, layout e formulário personalizado adicionam suporte para 42 novos idiomas, incluindo árabe, hindi e outros idiomas usando scripts árabes e devanágari para expandir a cobertura para 164 idiomas. O suporte a idiomas manuscritos expande-se para japonês e coreano.
Comece a usar a nova API de visualização v3.0.
Extração de dados do modelo Document Intelligence:
Modelo Extração de texto Pares chave-valor Marcas de seleção Tabelas Assinaturas Lida ✓ Documento geral ✓ ✓ ✓ ✓ Esquema ✓ ✓ ✓ Invoice ✓ ✓ ✓ ✓ Recibo ✓ ✓ ✓ Documento de identificação ✓ ✓ Cartão de visita ✓ ✓ Modelo personalizado ✓ ✓ ✓ ✓ ✓ Neural personalizado ✓ ✓ ✓ ✓ A versão beta do SDK do Document Intelligence inclui as seguintes atualizações:
Modelos e modos de documentos personalizados:
- Modelo personalizado (anteriormente formulário personalizado).
- Neural personalizado.
- Modelo personalizado — modo de compilação.
Modelo pré-construído W-2 (prebuilt-tax.us.w2).
Leia o modelo pré-construído (leitura pré-construída).
Modelo de fatura pré-construída (espanhol) (fatura pré-embutida).
Próximos passos
Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.