O que há de novo no Azure AI Document Intelligence

Artigo
02/29/2024

Este conteúdo aplica-se a:v4.0 (preview)v3.1 (GA)v3.0 (GA)v2.1 (GA)

O serviço de Informações Documentais é atualizado continuamente. Marque esta página para se manter atualizado com as notas de versão, aprimoramentos de recursos e nossa documentação mais recente.

Importante

As versões da API de visualização são desativadas assim que a API do GA é lançada. A versão da API 2023-02-28-preview está sendo desativada, se você ainda estiver usando a API de visualização ou as versões associadas do SDK, atualize seu código para direcionar a versão mais recente da API 2023-07-31 (GA).

maio de 2024

O Document Intelligence Studio adicionou suporte para autenticação do Microsoft Entra (anteriormente Azure Ative Directory). Para obter mais informações, consulteVisão geral do Document Intelligence Studio.

Fevereiro de 2024

A API REST do Document Intelligence 2024-02-29-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:

A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
O modelo de layout agora suporta deteção de figuras e análise hierárquica da estrutura do documento (seções e subseções). A qualidade da IA na ordem de leitura e na deteção de funções lógicas também é melhorada.
Modelos de extração personalizados
- Os modelos de extração personalizados agora suportam pontuações de confiança em nível de célula, linha e tabela. Saiba mais sobre a confiança na tabela, linha e célula.
- Os modelos de extração personalizados têm melhorias de qualidade de IA para extração de campo.
- O modelo de extração de modelo personalizado agora suporta a extração de campos sobrepostos. Saiba mais sobre campos sobrepostos e como usá-los.
Modelo de classificação personalizado
- O modelo de classificação personalizado agora oferece suporte ao treinamento incremental para cenários em que você precisa atualizar o modelo de classificador com amostras adicionais ou classes adicionais. Saiba mais sobre o treinamento incremental.
- O modelo de classificação personalizado adiciona suporte para tipos de documentos do Office (.docx, .pptx e .xls). Saiba mais sobre o suporte expandido a tipos de documentos.

Modelo de fatura

Suporte para novas localidades:

Região	Código
Árabe	(`ar`)
Búlgaro	(`bg`)
Grego	(`el`)
Hebraico	(`he`)
Macedónio	(`mk`)
Russo (`ru`)	Cirílico sérvio (`sr-cyrl`)
Ucraniano	(`uk`)
Tailandês	(`th`)
Turco	(`tr`)
Vietnamita	(`vi`)

Suporte para novos códigos de moeda:

Moeda	Região	Código
BAM	Marca descapotável bósnia	(`ba`)
BGN	Lev búlgaro	(`bg`)
ILS	Novo Shekel israelita	(`il`)
MKD	Denar macedónio	(`mk`)
RUB	Rublo russo	(`ru`)
THB	Baht tailandês	(`th`)
TRY	Lira turca	(`tr`)
SAU	Hryvnia ucraniana	(`ua`)
VND	Dong vietnamita	(`vn`)

Itens fiscais suportam a expansão para Alemanha (de), Espanha (es),Portugal (pt), Inglês Canadá en-CA.

Modelo de identificação
- Suporte de campo expandido para IDs da União Europeia e carteira de motorista.
🆕 Documentos de hipoteca
- Extraia informações do Pedido de Empréstimo Residencial Uniforme (Formulário 1003).
- Extraia informações do Resumo Uniforme de Subscrição e Transmissão ou do Formulário 1008.
- Extraia informações da divulgação de fechamento de hipotecas.
🆕 Modelo de cartão de crédito/débito
- Extraia informações de cartões bancários.
🆕 Certidão de casamento
- Novo pré-construído para extrair informações de certidões de casamento.

Dezembro de 2023

As bibliotecas de cliente do Document Intelligence destinadas à API REST 2023-10-31-preview já estão disponíveis para uso!

Novembro de 2023

A API REST do Document Intelligence 2023-10-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:

A versão de pré-visualização pública 2023-10-31-preview está atualmente disponível apenas nas seguintes regiões do Azure:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
Ler modelo
- Expansão do idioma para caligrafia: russo(ru), árabe(ar), tailandês(th).
- Conformidade com a Ordem Executiva Cibernética (EO).
Modelo de layout
- Escritório de suporte e arquivos HTML.
- Suporte de saída de Markdown.
- Melhorias na extração de tabelas, na ordem de leitura e na deteção de cabeçalhos de seção.
- Com o Document Intelligence 2023-10-31-preview, o modelo de documento geral (prebuilt-document) foi preterido. No futuro, para extrair pares chave-valor de documentos, use o prebuilt-layout modelo com o parâmetro features=keyValuePairs opcional de cadeia de caracteres de consulta habilitado.
Modelo de recibo
- Agora extrai moeda para todos os campos relacionados a preços.
Modelo de Cartão de Seguro de Saúde
- Novo suporte de campo para informações sobre Medicare e Medicaid.
Modelos de documentos fiscais dos EUA
- Novo modelo fiscal 1099. Suporta o formulário base 1099 e as seguintes variações: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
Modelo de fatura
- Suporte para KVK campo.
- Suporte para BPAY campo.
- Inúmeros refinamentos de campo.
Classificação personalizada
- Suporte para documentos multilingues.
- Novas opções de divisão de página: divisão automática, sempre dividida por página, sem divisão.
Capacidades adicionais
- Os campos de consulta estão disponíveis com a 2023-10-31-preview versão.
- Os recursos de complemento estão disponíveis em todos os modelos, exceto no modelo de leitura.

Nota

Com a versão 2022-08-31 API general availability (GA), as APIs de visualização associadas estão sendo preteridas. Se você estiver usando as versões da API 2021-09-30-preview, 2022-01-30-preview ou 2022-06-30-preview, atualize seus aplicativos para direcionar a versão da API 2022-08-31. Há algumas pequenas alterações envolvidas, para obter mais informações, consulte o guia de migração.

Julho de 2023

Nota

O Form Recognizer agora é o Azure AI Document Intelligence!

Documento, os serviços de IA do Azure abrangem todos os que eram anteriormente conhecidos como Serviços Cognitivos e Serviços de IA Aplicada do Azure.
Não há alterações nos preços.
Os nomes Serviços Cognitivos e IA Aplicada do Azure continuam a ser usados na faturação do Azure, na análise de custos, na lista de preços e nas APIs de preços.
Não há alterações significativas nas interfaces de programação de aplicativos (APIs) ou bibliotecas de clientes.
Algumas plataformas ainda aguardam a atualização de renomeação. Todas as menções ao Reconhecedor de Formulários ou Inteligência de Documentos em nossa documentação referem-se ao mesmo serviço do Azure.

Inteligência Documental v3.1 (GA)

A API do Document Intelligence versão 3.1 está agora disponível para o público em geral (GA)! A versão da API corresponde a 2023-07-31. A API v3.1 introduz recursos novos e atualizados:

As APIs de Document Intelligence agora são mais modulares e com suporte para recursos opcionais. Agora você pode personalizar a saída para incluir especificamente os recursos necessários. Saiba mais sobre os parâmetros opcionais.
API de classificação de documentos para dividir um único arquivo em documentos individuais. Saiba mais sobre a classificação de documentos.
Modelo de contrato pré-construído.
Modelo 1098 do formulário de imposto dos EUA pré-construído.
Suporte para tipos de arquivo do Office com API de leitura.
Reconhecimento de código de barras em documentos.
Capacidade complementar de reconhecimento de fórmulas.
Capacidade de complemento de reconhecimento de fontes.
Suporte para documentos de alta resolução.
Modelos neurais personalizados agora exigem uma única amostra rotulada para treinar.
Expansão de linguagem de modelos neurais personalizados. Treine um modelo neural para documentos em 30 idiomas. Consulte o suporte a idiomas para obter a lista completa de idiomas suportados.
🆕 Modelo de cartão de seguro de saúde pré-construído.
Expansão da localidade do modelo de fatura pré-construído.
Modelo de recibo pré-construído e expansão de localidade com mais de 100 idiomas suportados.
O modelo de ID pré-construído agora suporta IDs europeus.

Atualizações de UX do Document Intelligence Studio

✔️ Analisar opções

O Document Intelligence agora suporta recursos de análise mais sofisticados e o Studio permite um ponto de entrada (botão Analisar opções) para configurar os recursos adicionais com facilidade.
Dependendo do cenário de extração de documentos, configure o intervalo de análise, o intervalo de páginas do documento, a deteção opcional e os recursos de deteção premium.

Nota

A extração de fontes não é visualizada no Document Intelligence Studio. No entanto, você pode verificar a seção de estilos da saída JSON para obter os resultados da deteção de fontes.

✔️ Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos

Na página de etiquetagem de modelo de extração personalizada, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou modelos que você treinou anteriormente.
Para alguns documentos, pode haver etiquetas duplicadas depois de executar a etiqueta automática. Certifique-se de modificar os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

✔️ Tabelas de etiquetagem automática

Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

✔️ Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento

Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.
Se uma pontuação de confiança baixa for retornada para alguns rótulos, verifique se eles estão rotulados corretamente. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.

Captura de tela animada mostrando como adicionar arquivos de teste ao conjunto de dados de treinamento.

✔️ Faça uso das opções e filtros da lista de documentos em projetos personalizados

Use a página de rotulagem do modelo de extração personalizado. Agora você pode navegar pelos documentos de treinamento com facilidade, usando a pesquisa, o filtro e a classificação por recurso.
Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer os documentos mais facilmente.

✔️ Partilha de projetos

Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.

Maio de 2023

Apresentando a documentação atualizada para o Build 2023

🆕 Visão geral do Document Intelligence navegação aprimorada, pontos de acesso estruturados e imagens enriquecidas.
🆕 Escolha um modelo de Document Intelligence fornece orientação para escolher a melhor solução de Document Intelligence para seus projetos e fluxos de trabalho.

Abril de 2023

Anunciando a versão de visualização pública mais recente da biblioteca cliente do Document Intelligence

A versão 2023-02-28-preview da API REST do Document Intelligence suporta as bibliotecas de cliente da versão de visualização pública. Esta versão inclui os seguintes novos recursos e capacidades disponíveis para bibliotecas de cliente .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) e Python (3.3.0b.1):
Para obter mais informações, consulteDocument Intelligence SDK (visualização pública) e Notas de versão de março de 2023

Março de 2023

Importante

2023-02-28-preview Atualmente, os recursos estão disponíveis apenas nas seguintes regiões:

Europa Ocidental
E.U.A. Oeste 2
E.U.A. Leste

O modelo de classificação personalizado é um novo recurso dentro do Document Intelligence que começa com a 2023-02-28-preview API. Experimente o recurso de classificação de documentos usando o Document Intelligence Studio ou a API REST.
Recursos de campos de consulta adicionados ao modelo de Documento Geral, use modelos do Azure OpenAI para extrair campos específicos de documentos. Experimente o recurso Documentos gerais com campos de consulta usando o Document Intelligence Studio. Atualmente, os campos de consulta estão ativos apenas para recursos na East US região.
Recursos complementares:
- A extração de fontes agora é reconhecida com a 2023-02-28-preview API.
- A extração de fórmulas agora é reconhecida com a 2023-02-28-preview API.
- A extração de alta resolução agora é reconhecida com a 2023-02-28-preview API.
Atualizações do modelo de extração personalizado:
- O modelo neural personalizado agora suporta idiomas adicionados para treinamento e análise. Treine modelos neurais para holandês, francês, alemão, italiano e espanhol.
- O modelo de modelo personalizado agora tem um recurso aprimorado de deteção de assinatura.
Atualizações do Document Intelligence Studio :
- Além do suporte para todos os novos recursos, como classificação e campos de consulta, o Studio agora permite o compartilhamento de projetos para projetos de modelo personalizados.
- Novas adições de modelo na pré-visualização fechada: cartões de vacinação, contratos, imposto dos EUA 1098, imposto dos EUA 1098-E e imposto dos EUA 1098-T. Para solicitar acesso a modelos de visualização fechados, preencha e envie o formulário de solicitação de visualização privada do Document Intelligence.
Atualizações do modelo de recibo:
- O modelo de recibo adiciona suporte para recibos térmicos.
- O modelo de recibo agora adiciona suporte a idiomas para 18 idiomas e três idiomas regionais (inglês, francês, português).
- O modelo de recibo agora suporta TaxDetails extração.
O modelo de layout agora melhora o reconhecimento da tabela.
O modelo Read agora adiciona melhorias para o reconhecimento de caracteres de um dígito.

Fevereiro de 2023

Selecione os contêineres do Document Intelligence para v3.0 agora estão disponíveis para uso!
Atualmente, os contêineres Read v3.0 e Layout v3.0 estão disponíveis.

Para obter mais informações, consulteInstalar e executar contêineres de Document Intelligence.

Janeiro de 2023

Modelo de recibo pré-construído - adicionado idiomas suportados. O modelo de recibo agora suporta esses idiomas e localidades adicionados
- Japonês - Japão (ja-JP)
- Francês - Canadá (fr-CA)
- Neerlandês - Países Baixos (nl-NL)
- Inglês - Emirados Árabes Unidos (pt-AE)
- Português - Brasil (pt-BR)
Modelo de fatura pré-construído - adicionado idiomas suportados. O modelo de fatura agora suporta esses idiomas e localidades adicionados
- Inglês - Estados Unidos (en-US), Austrália (en-AU), Canadá (en-CA), Reino Unido (en-UK), Índia (en-IN)
- Espanhol - Espanha (es-ES)
- Francês - França (fr-FR)
- Italiano - Itália (it-IT)
- Português - Portugal (pt-PT)
- Neerlandês - Países Baixos (nl-NL)
Modelo de fatura pré-construído - campos adicionados reconhecidos. O modelo de fatura agora reconhece esses campos adicionados
- Código de moeda
- Opções de pagamento
- Desconto total
- Itens fiscais (somente en-IN)
Modelo de ID pré-construído - adicionado tipos de documentos suportados. O modelo de ID agora suporta esses tipos de documentos adicionados
- Identificação militar dos EUA

Gorjeta

Todas as atualizações de janeiro de 2023 estão disponíveis com a versão 2022-08-31 (GA) da API REST.

Modelo de recibo pré-construído — suporte a idiomas adicionais:

O modelo de recibo pré-construído adiciona suporte para os seguintes idiomas:
- Inglês - Emirados Árabes Unidos (pt-AE)
- Neerlandês - Países Baixos (nl-NL)
- Francês - Canadá (fr-CA)
- Alemão - (de-DE)
- Italiano - (it-IT)
- Japonês - Japão (ja-JP)
- Português - Brasil (pt-BR)
Modelo de fatura pré-construído — suporte a idiomas adicionais e extrações de campo

O modelo de fatura pré-criado adiciona suporte para os seguintes idiomas:
- Inglês - Austrália (en-AU), Canadá (en-CA), Reino Unido (en-UK), Índia (en-IN)
- Português - Brasil (pt-BR)
O modelo de fatura pré-construído agora adiciona suporte para as seguintes extrações de campo:
- Código de moeda
- Opções de pagamento
- Desconto total
- Itens fiscais (somente en-IN)
Modelo de documento de ID pré-construído — suporte a tipos de documentos adicionais

O modelo de documento de ID pré-criado agora adiciona suporte para os seguintes tipos de documentos:
- Expansão da carteira de motorista com suporte para Índia, Canadá, Reino Unido e Austrália
- Cartões e documentos de identificação militar dos EUA
- Cartões de identidade e documentos da Índia (PAN e Aadhaar)
- Cartões de identificação e documentos da Austrália (cartão com foto, identificação com chave)
- Cartões de identificação e documentos do Canadá (cartão de identificação, cartão Maple)
- Bilhetes de identidade e documentos do Reino Unido (bilhete de identidade nacional/regional)

Dezembro de 2022

Atualizações do Document Intelligence Studio

A versão de dezembro do Document Intelligence Studio inclui as atualizações mais recentes do Document Intelligence Studio. Há melhorias significativas na experiência do usuário, principalmente com suporte à etiquetagem de modelo personalizado.
- Intervalo de páginas. O Studio agora suporta a análise de páginas especificadas de um documento.
- Etiquetagem de modelo personalizada:
  - Execute a API de layout automaticamente. Você pode optar por executar a API de layout para todos os documentos automaticamente em seu armazenamento de blob durante o processo de configuração do modelo personalizado.
  - Pesquisar. O Studio agora inclui a funcionalidade de pesquisa para localizar palavras dentro de um documento. Esta melhoria permite uma navegação mais fácil durante a rotulagem.
  - Navegação. Você pode selecionar rótulos para direcionar palavras rotuladas em um documento.
  - Etiquetagem automática de tabelas. Depois de selecionar o ícone de tabela em um documento, você pode optar por rotular automaticamente a tabela extraída na exibição de rotulagem.
  - Subtipos de rótulo e subtipos de segundo nível O Studio agora oferece suporte a subtipos para colunas de tabela, linhas de tabela e subtipos de segundo nível para tipos como datas e números.
A criação de modelos neurais personalizados agora é suportada na região Gov Virginia dos EUA.
Visualize as versões 2022-01-30-preview da API e 2021-09-30-preview será desativada em 31 de janeiro de 2023. Atualize para a versão da API para evitar interrupções no 2022-08-31 serviço.

Novembro de 2022

Anunciando a versão estável mais recente das bibliotecas do Azure AI Document Intelligence
- Esta versão inclui alterações e atualizações importantes para bibliotecas de cliente .NET, Java, JavaScript e Python. Para obter mais informações, consulteAzure SDK DevBlog.
- As melhorias mais significativas são a introdução de dois novos clientes, o DocumentAnalysisClient e o DocumentModelAdministrationClient.

Outubro de 2022

Conteúdo versionado do Document Intelligence
- A documentação do Document Intelligence é atualizada para apresentar uma experiência versionada. Agora, você pode optar por visualizar o conteúdo direcionado à v3.0 GA experiência ou à v2.1 GA experiência. A experiência v3.0 é o padrão.
Código de exemplo do Document Intelligence Studio
- O código de exemplo para a experiência de rotulagem do Document Intelligence Studio já está disponível no GitHub. Os clientes podem desenvolver e integrar a Document Intelligence em sua própria UX ou criar sua própria nova UX usando o código de exemplo do Document Intelligence Studio.
Expansão linguística
- Com a versão de visualização mais recente, os modelos de modelo Leitura (OCR), Layout e Personalizado do Document Intelligence suportam 134 novos idiomas. Estas adições linguísticas incluem grego, letão, sérvio, tailandês, ucraniano e vietnamita, juntamente com várias línguas latinas e cirílicas. O Document Intelligence agora tem um total de 299 idiomas suportados no GA mais recente e nas novas versões de visualização. Consulte a página de idiomas suportados para ver todos os idiomas suportados.
- Use o parâmetro api-version=2022-06-30-preview REST API ao usar a API ou o SDK correspondente para oferecer suporte aos novos idiomas em seus aplicativos.
Novo modelo de contrato pré-construído
- Um novo pré-construído que extrai informações de contratos, como partes, título, ID do contrato, data de execução e muito mais. O modelo de contratos está atualmente em pré-visualização, solicite acesso aqui.
Expansão de região para treinamento de modelos neurais personalizados
- Treinamento de modelos neurais personalizados agora suportados em regiões adicionadas.
  - E.U.A. Leste
  - E.U.A. Leste 2
  - US Gov - Arizona

Setembro de 2022

Nota

A partir da versão 4.0.0, um novo conjunto de clientes foi introduzido para aproveitar os recursos mais recentes do serviço de Inteligência Documental.

A versão do SDK versão 4.0.0 GA inclui as seguintes atualizações:

Expansão de região para treinamento de modelos neurais personalizados agora suportada em seis novas regiões
- Leste da Austrália
- E.U.A. Central
- Ásia Leste
- França Central
- Sul do Reino Unido
- E.U.A. Oeste 2
- Para obter uma lista completa das regiões onde o treinamento é suportado, consulte modelos neurais personalizados.
- Versão do SDK 4.0.0 GA do Document Intelligence:
  - As bibliotecas de cliente do Document Intelligence versão 4.0.0 (.NET/C#, Java, JavaScript) e versão 3.2.0 (Python) estão geralmente disponíveis e prontas para uso em aplicativos de produção!.
  - Para obter mais informações sobre bibliotecas de cliente do Document Intelligence, consulte a visão geral do SDK.
  - Atualize seus aplicativos usando o guia de migração da linguagem de programação.

Agosto de 2022

A versão de pré-visualização de agosto de 2022 do SDK do Document Intelligence inclui as seguintes atualizações:

Versão 4.0.0-beta.5 (2022-08-09)

Registo de alterações/Histórico de versões

Pacote (NuGet)

Documentação de referência do SDK

Document Intelligence v3.0 disponível em geral
- Document Intelligence REST API v3.0 agora está disponível para uso geral e pronto para uso em aplicativos de produção! Atualize seus aplicativos com a API REST versão 2022-08-31.
Atualizações do Document Intelligence Studio
- Próximos passos. Em cada página de modelo, o Studio agora tem uma seção de próximas etapas. Os usuários podem consultar rapidamente o código de exemplo, as diretrizes de solução de problemas e as informações de preços.
- Modelos personalizados. O Studio agora inclui a capacidade de reordenar etiquetas em projetos de modelos personalizados para melhorar a eficiência da rotulagem.
- Copiar modelos Os modelos personalizados podem ser copiados entre os serviços de Document Intelligence a partir do Studio. A operação possibilita a promoção de um modelo treinado para outros ambientes e regiões.
- Excluir documentos. O Studio agora suporta a exclusão de documentos de conjuntos de dados rotulados em projetos personalizados.
Atualizações do serviço de Inteligência Documental
- leitura pré-embutida. O modelo Read OCR agora também está disponível em Document Intelligence com parágrafos e deteção de idioma como os dois novos recursos. O Document Intelligence Read tem como alvo cenários avançados de documentos alinhados com os recursos mais amplos de inteligência documental do Document Intelligence.
- layout pré-construído. O modelo de layout extrai parágrafos e se o texto extraído é um parágrafo, título, título de seção, nota de rodapé, cabeçalho de página, rodapé de página ou número de página.
- fatura pré-embutida. Os campos TotalVAT e Linha/IVA agora são resolvidos para os campos existentes TotalTax e Line/Tax respectivamente.
- prebuilt-idDocument. Suporte de extração de dados para identificação do estado dos EUA, segurança social e green cards. Suporte para informações de visto de passaporte.
- recibo pré-embutido. Suporte de localidade expandido para francês (fr-FR), espanhol (es-ES), português (pt-PT), italiano (it-IT) e alemão (de-DE).
- cartão de visita pré-construído. Suporte à análise de endereços para extrair subcampos para componentes de endereço, como endereço, cidade, estado, país/região e código postal.
Melhorias na qualidade da IA
- leitura pré-embutida. Suporte aprimorado para caracteres únicos, datas manuscritas, valores, nomes, outros dados importantes comumente encontrados em recibos e faturas e processamento aprimorado de documentos PDF digitais.
- layout pré-construído. Suporte para melhor deteção de tabelas cortadas, tabelas sem bordas e melhor reconhecimento de células de extensão longa.
- documento pré-construído. Deteção melhorada de valores e caixas de verificação.
- personalizado-neural. Maior precisão para deteção e extração de tabelas.

Junho de 2022

A versão beta de junho de 2022 do SDK do Document Intelligence inclui as seguintes atualizações:

Versão 4.0.0-beta.4 (2022-06-08)

Registo de alterações/Histórico de versões

Pacote (NuGet)

Documentação de referência do SDK

A versão de junho do Document Intelligence Studio é a atualização mais recente do Document Intelligence Studio. Há melhorias consideráveis de experiência do usuário e acessibilidade abordadas nesta atualização:
- Exemplo de código para JavaScript e C#. A guia de código Studio agora adiciona exemplos de código JavaScript e C#, além do Python existente.
- Nova interface do usuário de carregamento de documentos. O Studio agora suporta o upload de um documento com arrastar & soltar na nova interface de usuário de upload.
- Novo recurso para projetos personalizados. Projetos personalizados agora suportam a criação de conta de armazenamento e blobs ao configurar o projeto. Além disso, o projeto personalizado agora suporta o upload de arquivos de treinamento diretamente no Studio e a cópia do modelo personalizado existente.
A versão 2022-06-30-preview do Document Intelligence v3.0 apresenta atualizações extensas nas APIs de recursos:
- O layout estende a extração da estrutura. O layout agora inclui elementos de estrutura adicionados, incluindo seções, cabeçalhos de seção e parágrafos. Esta atualização permite cenários de segmentação de documentos de grão mais fino. Para obter uma lista completa dos elementos de estrutura identificados, consulteEstrutura aprimorada.
- Suporte a campos tabulares de modelo neural personalizado. Os modelos de documentos personalizados agora suportam campos tabulares. Os campos tabulares por padrão também são de várias páginas. Para saber mais sobre campos tabulares em modelos neurais personalizados, consulteCampos tabulares.
- Suporte a campos tabulares de modelo de modelo personalizado para tabelas de páginas cruzadas. Os modelos de formulário personalizados agora oferecem suporte a campos tabulares nas páginas. Para saber mais sobre campos tabulares em modelos de modelo personalizados, consulteCampos tabulares.
- A saída do modelo de fatura agora inclui pares chave-valor gerais do documento. Quando as faturas contêm campos obrigatórios além dos campos incluídos no modelo pré-construído, o modelo de documento geral complementa a saída com pares chave-valor. Consulteos pares de valores de chave.
- Expansão do idioma da fatura. O modelo de fatura inclui suporte a idiomas expandido. Consulteos idiomas suportados.
- O cartão de visita pré-construído agora inclui suporte ao idioma japonês. Consulteos idiomas suportados.
- Modelo de documento de identificação pré-construído. O modelo de documento de identificação agora extrai DateOfIssue, Height, Weight, EyeColor, HairColor e DocumentDiscriminator das carteiras de motorista dos EUA. Vejaextração de campo.
- O modelo Read agora suporta tipos de documentos comuns do Microsoft Office. Tipos de documentos como Word (docx), Excel (xlsx) e PowerPoint (pptx) agora são suportados com a API de leitura. Consulte Ler extração de dados.

Fevereiro de 2022

Versão 4.0.0-beta.3 (2022-02-10)

Registo de alterações/Histórico de versões

Pacote (NuGet)

Documentação de referência do SDK

A versão prévia do Document Intelligence v3.0 apresenta vários novos recursos, recursos e aprimoramentos:
- Modelo neural personalizado ou modelo de documento personalizado é um novo modelo personalizado para extrair texto e marcas de seleção de formulários estruturados, documentos semiestruturados e não estruturados.
- O modelo pré-construído W-2 é um novo modelo pré-construído para extrair campos de formulários W-2 para relatórios fiscais e cenários de verificação de rendimentos.
- A API de leitura extrai linhas de texto impressas, palavras, locais de texto, idiomas detetados e texto manuscrito, se detetado.
- O modelo geral pré-treinado de documentos agora é atualizado para oferecer suporte a marcas de seleção, além de texto de API, tabelas, estrutura e pares chave-valor de formulários e documentos.
- API de faturas O modelo pré-construído de faturas expande o suporte a faturas espanholas.
- O Document Intelligence Studio adiciona novas demonstrações para amostras de recibos de Read, W2 e Hotel e suporte para treinar os novos modelos neurais personalizados.
- Expansão de idioma Document Intelligence Leitura, layout e formulário personalizado adicionam suporte para 42 novos idiomas, incluindo árabe, hindi e outros idiomas usando scripts árabes e devanágari para expandir a cobertura para 164 idiomas. O suporte a idiomas manuscritos expande-se para japonês e coreano.
Introdução à nova API REST, Python ou SDK .NET para a API de visualização v3.0.

Extração de dados do modelo Document Intelligence:

Modelo	Extração de texto	Pares chave-valor	Marcas de seleção	Tabelas	Assinaturas
Lida	✓
Documento geral	✓	✓	✓	✓
Esquema	✓		✓	✓
Invoice	✓	✓	✓	✓
Recibo	✓	✓			✓
Documento de identificação	✓	✓
Cartão de visita	✓	✓
Modelo personalizado	✓	✓	✓	✓	✓
Neural personalizado	✓	✓	✓	✓

A versão beta do SDK do Document Intelligence inclui as seguintes atualizações:
- Modelos e modos de documentos personalizados:
  - Modelo personalizado (anteriormente formulário personalizado).
  - Neural personalizado.
  - Modelo personalizado — modo de compilação.
- Modelo pré-construído W-2 (prebuilt-tax.us.w2).
- Leia o modelo pré-construído (leitura pré-construída).
- Modelo de fatura pré-construída (espanhol) (fatura pré-embutida).

Novembro de 2021

Versão 4.0.0-beta.2 (2021-11-09)

| Documentação de referência da API Package (NuGet) | Changelog/Release History |

A atualização de versão do SDK de visualização do Document Intelligence v3.0 (beta.2) incorpora correções de bugs e pequenas atualizações de recursos.

Outubro de 2021

O Document Intelligence v3.0 preview versão de lançamento 4.0.0-beta.1 (2021-10-07) introduz vários novos recursos e capacidades:
- Modelo de documento geral é uma nova API que usa um modelo pré-treinado para extrair texto, tabelas, estrutura e pares chave-valor de formulários e documentos.
- Modelo de recibo do hotel adicionado ao processamento de recibos pré-construídos.
- Campos expandidos para documento de identificação O modelo de ID suporta endossos, restrições e extração de classificação de veículos das carteiras de motorista dos EUA.
- Campo de assinatura é um novo tipo de campo em formulários personalizados para detetar a presença de uma assinatura em um campo de formulário.
- Suporte de expansão de idioma para 122 idiomas (impresso) e 7 idiomas (manuscrito). O Layout de Inteligência de Documentos e o Formulário Personalizado expandem os idiomas suportados para 122 com sua visualização mais recente. A visualização inclui extração de texto para impressão de texto em 49 novos idiomas, incluindo russo, búlgaro e outros idiomas cirílicos e mais latinos. Além disso, a extração de texto manuscrito agora suporta sete idiomas que incluem inglês e novas visualizações de chinês simplificado, francês, alemão, italiano, português e espanhol.
- Tabelas e aprimoramentos de extração de texto O layout agora suporta a extração de tabelas de linha única, também chamadas de tabelas chave-valor. Os aprimoramentos de extração de texto incluem melhor processamento de PDFs digitais e texto de zona de leitura ótica (MRZ) em documentos de identidade, juntamente com o desempenho geral.
- Document Intelligence Studio Para simplificar o uso do serviço, agora você pode acessar o Document Intelligence Studio para testar os diferentes modelos pré-construídos ou rotular e treinar um modelo personalizado.
- Introdução à nova API REST, Python ou SDK .NET para a API de visualização v3.0.

Extração de dados do modelo de Document Intelligence

Modelo	Extração de texto	Pares chave-valor	Marcas de seleção	Tabelas
Documento geral	✓	✓	✓	✓
Esquema	✓		✓	✓
Invoice	✓	✓	✓	✓
Recibo	✓	✓
Documento de identificação	✓	✓
Cartão de visita	✓	✓
Personalizado	✓	✓	✓	✓

Setembro de 2021

Os recursos avançados do explorador de métricas do Azure estão disponíveis na página de visão geral dos recursos do Document Intelligence no portal do Azure.
Menu de monitoramento:
Gráficos:
Atualização do modelo do documento de identificação : nomes próprios, incluindo um sufixo, com ou sem um ponto (ponto final), processo bem-sucedido:

Texto de entrada Resultado com atualização

Guilherme Isaac Kirby Jr. Nome: William Isaac

Sobrenome: Kirby Jr.

Henry Caleb Ross Sr Nome: Henry Caleb

Sobrenome: Ross Sr.

Texto de entrada	Resultado com atualização
Guilherme Isaac Kirby Jr.	Nome: William Isaac Sobrenome: Kirby Jr.
Henry Caleb Ross Sr	Nome: Henry Caleb Sobrenome: Ross Sr.

Julho de 2021

Suporte de identidade gerenciada atribuída pelo sistema: agora você pode habilitar uma identidade gerenciada atribuída pelo sistema para conceder à Document Intelligence acesso limitado a contas de armazenamento privado, incluindo contas protegidas por uma Rede Virtual, firewall ou BYOS (traga seu próprio armazenamento) habilitado. ConsulteCriar e usar identidade gerenciada para seu recurso de Document Intelligence para saber mais.

Junho de 2021

| Documentação | de referência Pacote NuGet versão 3.1.1 |

Os contêineres do Document Intelligence v2.1 foram lançados na visualização fechada e agora são suportados por seis contêineres de recursos: Layout, Cartão de Visita, Documento de ID, Recibo, Fatura e Personalizado. Para usá-los, você deve enviar uma solicitação on-line e receber aprovação.
- ConsulteInstalar e executar contêineres do Docker para Document Intelligence e Configurar contêineres do Document Intelligence
Conector de Inteligência de Documentos lançado em pré-visualização: o conector de Inteligência de Documentos integra-se com as Aplicações Lógicas do Azure, o Microsoft Power Automatizar e as Aplicações Microsoft Power. O conector suporta ações e gatilhos de fluxo de trabalho para extrair e analisar dados e estrutura de documentos de formulários personalizados e pré-construídos, faturas, recibos, cartões de visita e documentos de identificação.
Document Intelligence SDK v3.1.0 corrigido para v3.1.1 para C#, Java e Python. O patch aborda faturas que não têm campos de item de sublinha detetados, como um FormField com Text mas não BoundingBox ou Page informações.

Maio de 2021

Versão 3.1.0 (2021-05-26)

Changelog/Release History| Documentação de referência Pacote | NuGet versão 3.0.1 |

Document Intelligence 2.1 está geralmente disponível. A versão GA marca a estabilidade das alterações introduzidas nas versões anteriores do pacote de visualização 2.1. Esta versão permite detetar e extrair informações e dados dos seguintes tipos de documentos:
Para começar, experimente a Document Intelligence Sample Tool e siga o guia de início rápido.
O recurso de tabela da API de layout atualizado adiciona reconhecimento de cabeçalho com cabeçalhos de coluna que podem abranger várias linhas. Cada célula da tabela tem um atributo que indica se faz parte de um cabeçalho ou não. Esta atualização pode ser usada para identificar quais linhas compõem o cabeçalho da tabela.

Abril de 2021

Pacote NuGet versão 3.1.0-beta.4
Changelog/Histórico de lançamentos.
Novos métodos para analisar dados de documentos de identidade:

StartRecognizeIdDocumentsFromUriAsync

StartRecognizeIdDocumentsAsync

Para obter uma lista de valores de campo, consulteCampos extraídos em nossa documentação de Document Intelligence.
Expandido o conjunto de idiomas de documento que podem ser fornecidos ao método StartRecognizeContent.
Nova propriedade Pages suportada pelas seguintes classes:

ReconheçaCartões de NegóciosOpções
ReconheçaPersonalizadoFormuláriosOpções
ReconheçaFaturasOpções
ReconheçaRecibosOpções

A Pages propriedade permite que você selecione páginas individuais ou um intervalo de páginas para documentos PDF e TIFF de várias páginas. Para páginas individuais, insira o número da página, por exemplo, 3. Para um intervalo de páginas (como a página 2 e as páginas 5-7), insira os números de idade p e os intervalos separados por vírgulas: 2, 5-7.
Nova propriedade ReadingOrder suportada para a seguinte classe:

RecognizeContentOptions

A ReadingOrder propriedade é um parâmetro opcional que permite especificar qual algoritmo de ordem de leitura —basic ou natural— deve ser aplicado para ordenar a extração de elementos de texto. Se não for especificado, o valor padrão será basic.

Dependência do pacote de artefato Maven versão 3.1.0-beta.3

Novos métodos para analisar dados de documentos de identidade:

[beginRecognizeIdDocumentsFromUrl]

[beginRecognizeIdDocuments]

Para obter uma lista de valores de campo, consulteCampos extraídos em nossa documentação de Document Intelligence.
** Suporte de arquivo de imagem bitmap (.bmp) para formulários personalizados e métodos de treinamento nos FormContentType campos:
- image/bmp
- Nova propriedade Pages suportada pelas seguintes classes:
ReconheçaCartões de NegóciosOpções
ReconheçaPersonalizadoFormulárioOpções
ReconheçaFaturasOpções
ReconheçaRecibosOpções
- A Pages propriedade permite que você selecione páginas individuais ou um intervalo de páginas para documentos PDF e TIFF de várias páginas. Para páginas individuais, insira o número da página, por exemplo, 3. Para um intervalo de páginas (como a página 2 e as páginas 5-7), insira os números de página e os intervalos separados por vírgulas: 2, 5-7.
Novo argumento ReadingOrder de palavra-chave suportado para os seguintes métodos:
- beginRecognizeContent.
- beginRecognizeContentFromUrl.
- O ReadingOrder argumento da palavra-chave é um parâmetro opcional que permite especificar qual algoritmo de ordem de leitura —basic ou natural— deve ser aplicado para ordenar a extração de elementos de texto. Se não for especificado, o valor padrão será basic.
O cliente assume como padrão a versão de serviço suportada mais recente, que atualmente é 2.1-preview.3.

npm pacote versão 3.1.0-beta.3

Novos métodos para analisar dados de documentos de identidade:

azure-ai-form-recognizer-formrecognizerclient-beginrecognizeidentitydocumentsfromurl

beginRecognizeIdDocuments

Para obter uma lista de valores de campo, consulteCampos extraídos em nossa documentação de Document Intelligence.
Novos valores de campo adicionados à interface FieldValue:

gender—os valores possíveis são MF ou .
countryX—os valores possíveis seguem a cadeia de código de país de três letras ISO alfa-3.
Nova opção pages suportada por todos os métodos de inteligência documental (formulários personalizados e todos os modelos pré-construídos). O argumento permite selecionar páginas individuais ou um intervalo de páginas para documentos PDF e TIFF de várias páginas. Para páginas individuais, insira o número da página, por exemplo, 3. Para um intervalo de páginas (como a página 2 e as páginas 5-7), insira os números de página e os intervalos separados por vírgulas: 2, 5-7.
Adicionado suporte para um tipo ReadingOrder aos métodos de reconhecimento de conteúdo. Essa opção permite controlar o algoritmo que o serviço usa para determinar como as linhas de texto reconhecidas devem ser ordenadas. Você pode especificar qual algoritmo de ordem de leitura —basic ou natural— deve ser aplicado para ordenar a extração de elementos de texto. Se não for especificado, o valor padrão será basic.
Divida o tipo FormField em várias interfaces diferentes. Esta atualização não deve causar problemas de compatibilidade de API, exceto em certos casos de borda (valueType indefinido).
Migrado para o ponto de extremidade do 2.1-preview.3 serviço Document Intelligence para todas as chamadas de API REST.

pip pacote versão 3.1.0b4

Novos métodos para analisar dados de documentos de identidade:

begin_recognize_id_documents_from_url

begin_recognize_id_documents

Para obter uma lista de valores de campo, consulteCampos extraídos em nossa documentação de Document Intelligence.
Novos valores de campo adicionados ao enum FieldValueType:

gênero – valores possíveis são MF ou X.

país — os valores possíveis seguem os códigos de país ISO alfa-3.
Suporte de arquivo de imagem bitmap (.bmp) para formulários personalizados e métodos de treinamento no enum FormContentType:
Novo argumento pages de palavra-chave suportado pelos seguintes métodos:

begin_recognize_receipts

begin_recognize_receipts_from_url

begin_recognize_business_cards

begin_recognize_business_cards_from_url

begin_recognize_invoices

begin_recognize_invoices_from_url

begin_recognize_content

begin_recognize_content_from_url

O pages argumento da palavra-chave permite selecionar páginas individuais ou um intervalo de páginas para documentos PDF e TIFF de várias páginas. Para páginas individuais, insira o número da página, por exemplo, 3. Para um intervalo de páginas (como a página 2 e as páginas 5-7), insira os números de página e os intervalos separados por vírgulas: 2, 5-7.
Novo argumento readingOrder de palavra-chave suportado para os seguintes métodos:

begin_recognize_content

begin_recognize_content_from_url

O readingOrder argumento da palavra-chave é um parâmetro opcional que permite especificar qual algoritmo de ordem de leitura —basic ou natural— deve ser aplicado para ordenar a extração de elementos de texto. Se não for especificado, o valor padrão será basic.

As atualizações de visualização do SDK para a versão 2.1-preview.3 da API introduzem atualizações e aprimoramentos de recursos.

Março de 2021

Document Intelligence v2.1 public preview v2.1-preview.3 foi lançado e inclui os seguintes recursos:

Novo modelo de ID pré-construído O novo modelo de ID pré-construído permite que os clientes obtenham IDs e retornem dados estruturados para automatizar o processamento. Ele combina nossos poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) com modelos de compreensão de ID para extrair informações importantes de passaportes e carteiras de motorista dos EUA.

Saiba mais sobre o modelo de ID pré-criado
Extração de item de linha para modelo de fatura - O modelo de fatura pré-construído agora suporta extração de item de linha, agora extrai itens completos e suas partes - descrição, quantidade, quantidade, ID do produto, data e muito mais. Com uma simples chamada API/SDK, você pode extrair dados úteis de suas faturas - texto, tabela, pares chave-valor e itens de linha.

Saiba mais sobre o modelo de fatura.
Treinamento e rotulagem supervisionada de tabelas, rotulagem de valor vazio - Além dos recursos de extração automática de tabelas de aprendizado profundo de última geração da Document Intelligence, ela agora permite que os clientes rotulem e treinem em mesas. Esta nova versão inclui a capacidade de rotular e treinar itens/tabelas on-line (dinâmicos e fixos) e treinar um modelo personalizado para extrair pares chave-valor e itens de linha. Depois que um modelo é treinado, o modelo extrai itens de linha como parte da saída JSON na seção documentResults.

Além de rotular tabelas, agora você pode rotular valores e regiões vazios. Se alguns documentos em seu conjunto de treinamento não tiverem valores para determinados campos, você poderá rotulá-los para que seu modelo saiba extrair valores corretamente dos documentos analisados.
Suporte para 66 novos idiomas - A API de layout e os modelos personalizados para inteligência de documentos agora suportam 73 idiomas.

Saiba mais sobre o suporte linguístico do Document Intelligence.
Ordem de leitura natural, classificação de manuscrito e seleção de página - Com esta atualização, você pode optar por obter as saídas de linha de texto na ordem de leitura natural em vez da ordem padrão da esquerda para a direita e de cima para baixo. Use o novo parâmetro de consulta readingOrder e defina-o como valor "natural" para uma saída de ordem de leitura mais amigável para o ser humano. Além disso, para as línguas latinas, o Document Intelligence classifica as linhas de texto como estilo manuscrito ou não e dá uma pontuação de confiança.
Melhorias na qualidade do modelo de recibo pré-construído Esta atualização inclui muitas melhorias de qualidade para o modelo de recibo pré-construído, especialmente em torno da extração de item de linha.

Novembro de 2020

Document Intelligence v2.1-preview.2 foi lançado e inclui os seguintes recursos:
- Novo modelo de fatura pré-construído - O novo modelo de fatura pré-construído permite que os clientes recebam faturas em vários formatos e devolvam dados estruturados para automatizar o processamento de faturas. Ele combina nossos poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) com modelos de aprendizagem profunda de compreensão de faturas para extrair informações importantes de faturas em inglês. Ele extrai texto-chave, tabelas e informações, como cliente, fornecedor, ID da fatura, data de vencimento da fatura, total, valor devido, valor do imposto, envio e fatura.
  
  Saiba mais sobre o modelo de fatura pré-criado
- Extração de tabela aprimorada - A Document Intelligence agora oferece extração de tabela aprimorada, que combina nossos poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) com um modelo de extração de tabela de aprendizado profundo. O Document Intelligence pode extrair dados de tabelas, incluindo tabelas complexas com colunas mescladas, linhas, sem bordas e muito mais.
  
  Saiba mais sobre a extração de layout.
- Atualização da biblioteca do cliente - As versões mais recentes das bibliotecas de cliente para .NET, Python, Java e JavaScript suportam a API do Document Intelligence 2.1.
- Novo idioma suportado: Japonês - Os seguintes novos idiomas são agora suportados: para AnalyzeLayout e AnalyzeCustomForm: Japonês (ja). Suporte linguístico.
- Indicação de estilo de linha de texto (manuscrita/outra) (somente em línguas latinas) - O Document Intelligence agora produz um appearance objeto classificando se cada linha de texto é estilo manuscrito ou não, juntamente com uma pontuação de confiança. Este recurso é suportado apenas para idiomas latinos.
- Melhorias de qualidade - Melhorias na extração, incluindo melhorias na extração de um dígito.
- Novo recurso try-it-out na Document Intelligence Sample and Labeling Tool - Capacidade de experimentar modelos pré-construídos de fatura, recibo e cartão de visita e a API de layout usando a ferramenta Document Intelligence Sample Labeling. Veja como seus dados são extraídos sem escrever nenhum código.
- Experimente a ferramenta Document Intelligence Sample Labeling
  - Feedback Loop - Ao analisar arquivos através da ferramenta Sample Labeling, agora você também pode adicioná-lo ao conjunto de treinamento e ajustar os rótulos, se necessário, e treinar para melhorar o modelo.
  - Auto Label Documents - Rotula automaticamente os documentos adicionados com base em documentos rotulados anteriores no projeto.

Agosto de 2020

**A Inteligência v2.1-preview.1 Documental inclui as seguintes funcionalidades:
- A referência da API REST está disponível - Veja o v2.1-preview.1 referencearquivo .
- Novos idiomas suportados Além do inglês, os seguintes idiomas agora são suportados: inglês Train Custom ModelLayout (en), chinês (simplificado) (zh-Hans), holandês (nl), francês (fr), alemão (de), italiano (it), português (pt) e espanhol (es).
- Deteção de caixas de seleção / marcas de seleção – O Document Intelligence suporta a deteção e extração de marcas de seleção, como caixas de seleção e botões de opção. As Marcas de Seleção são extraídas Layout e agora você também pode rotular e treinar emTrain Custom Model - Treinar com Etiquetas para extrair pares chave-valor para marcas de seleção.
- Model Compose - permite que vários modelos sejam compostos e chamados com um único ID de modelo. Quando você envia um documento para ser analisado com um ID de modelo composto, uma etapa de classificação é executada primeiro para encaminhá-lo para o modelo personalizado correto. Modelo de composição está disponível para Train Custom Model - Trem com etiquetas.
- Nome do modelo - adicione um nome amigável aos seus modelos personalizados para facilitar o gerenciamento e o rastreamento.
- Novo modelo pré-construído para cartões de visita para extrair campos comuns em inglês, cartões de visita de idioma.
- Novas localidades para recibos pré-construídos , além de EN-US, o suporte agora está disponível para EN-AU, EN-CA, EN-GB, EN-IN.
- Melhorias de qualidade para Layout, Train Custom Model - Treinar sem Etiquetas e Treinar com Etiquetas.
v2.0 inclui a seguinte atualização:
- As bibliotecas de cliente para NET, Python, Java e JavaScript estão geralmente disponíveis.
Novas amostras estão disponíveis no GitHub.
- O Knowledge Extraction Recipes - Forms Playbook coleta as melhores práticas de compromissos reais com clientes do Document Intelligence e fornece exemplos de código utilizáveis, listas de verificação e pipelines de exemplo usados no desenvolvimento desses projetos.
- A ferramenta Etiquetagem de Exemplo é atualizada para suportar a nova funcionalidade v2.1. Consulte este guia de início rápido para começar a usar a ferramenta.
- O exemplo de Inteligência Documental de Quiosque Inteligente mostra como integrar Analyze Receipt eTrain Custom Model - treinar sem etiquetas.

Julho de 2020

Referência do Document Intelligence v2.0 disponível - Exiba a Referência da API v2.0 e as bibliotecas de cliente atualizadas para .NET, Python, Java e JavaScript.
- Aprimoramentos de tabela e Extração - inclui melhorias de precisão e extrações de tabelas, especificamente, a capacidade de aprender cabeçalhos e estruturas de tabelas em trens personalizados sem etiquetas.
- Suporte de moeda - Deteção e extração de símbolos de moeda global.
- Azure Gov - Document Intelligence agora também está disponível no Azure Gov.
- Elementos de segurança melhorados:
  - Traga sua própria chave - O Document Intelligence criptografa automaticamente seus dados quando persistem na nuvem para protegê-los e ajudá-lo a cumprir seus compromissos organizacionais de segurança e conformidade. Por predefinição, a subscrição utiliza chaves de encriptação geridas pela Microsoft. Agora também pode gerir a sua subscrição com as suas próprias chaves de encriptação. As chaves gerenciadas pelo cliente, também conhecidas como traga sua própria chave (BYOK), oferecem maior flexibilidade para criar, girar, desabilitar e revogar controles de acesso. Também pode auditar as chaves de encriptação utilizadas para proteger os dados.
  - Pontos de extremidade privados – Permite que você em uma rede virtual acesse dados com segurança através de um link privado.

Junho de 2020

API CopyModel adicionada a bibliotecas de cliente - Agora você pode usar as bibliotecas de cliente para copiar modelos de uma assinatura para outra. Consulte Fazer backup e recuperar modelos para obter informações gerais sobre esse recurso.
Integração com o Ative Directory do Azure - Agora você pode usar suas credenciais do Azure AD para autenticar seus objetos de cliente do Document Intelligence nas bibliotecas de cliente.
Alterações específicas do SDK - Esta alteração inclui pequenas adições de recursos e alterações de quebra. Para obter mais informações, consulte os changelogs do SDK.

Abril de 2020

Suporte do SDK para o Document Intelligence API v2.0 Public Preview - Este mês, expandimos nosso suporte de serviço para incluir uma versão do SDK de visualização para Document Intelligence v2.0. Use estes links para começar a usar o idioma de sua escolha:
SDK do .NET
SDK Java
Python SDK
SDK JavaScript

O novo SDK suporta todos os recursos da API REST v2.0 para Document Intelligence. Você pode compartilhar seus comentários sobre as bibliotecas de cliente por meio do formulário Comentários do SDK.

Copiar modelo personalizado Agora você pode copiar modelos entre regiões e assinaturas usando o novo recurso Copiar modelo personalizado. Antes de invocar a API Copy Custom Model, você deve primeiro obter autorização para copiar para o recurso de destino. Essa autorização é protegida chamando a operação Copiar Autorização em relação ao ponto de extremidade do recurso de destino.
Gere uma API REST de autorização de cópia.
Copie uma API REST de modelo personalizado.
Melhorias de segurança.
As chaves gerenciadas pelo cliente agora estão disponíveis para o FormRecognizer. Para obter mais informações, consulte Criptografia de dados em repouso para Document Intelligence.
Use Identidades Gerenciadas para acessar recursos do Azure com o Azure Ative Directory. Para obter mais informações, consulte Autorizar acesso a identidades gerenciadas.

Março de 2020

Tipos de valor para rotulagem Agora você pode especificar os tipos de valores que está rotulando com a ferramenta Document Intelligence Sample Labeling. Os seguintes tipos de valor e variações são atualmente suportados:
string
- por defeito, no-whitespaces, alphanumeric
number
- padrão, currency
date
- padrão, dmy, mdy, ymd
time
integer

Consulte o guia da ferramenta Etiquetagem de Exemplo para saber como usar esse recurso.

Visualização de tabela A ferramenta Rotulagem de exemplo agora exibe tabelas que foram reconhecidas no documento. Esse recurso permite visualizar tabelas reconhecidas e extraídas do documento antes de rotular e analisar. Este recurso pode ser ativado / desativado usando a opção de camadas.
A imagem a seguir é um exemplo de como as tabelas são reconhecidas e extraídas:
As tabelas extraídas estão disponíveis na saída JSON em "pageResults".

Importante

Não há suporte para tabelas de rotulagem. Se as tabelas não forem reconhecidas e extraídas automaticamente, você só poderá rotulá-las como pares chave/valor. Ao rotular tabelas como pares chave/valor, rotule cada célula como um valor exclusivo.
Melhorias na extração.
Esta versão inclui aprimoramentos de extração e melhorias de precisão, especificamente, a capacidade de rotular e extrair vários pares chave/valor na mesma linha de texto.
A ferramenta Sample Labeling agora é de código aberto.
A ferramenta Document Intelligence Sample Labeling está agora disponível como um projeto de código aberto. Você pode integrá-lo em suas soluções e fazer alterações específicas do cliente para atender às suas necessidades.
Para obter mais informações sobre a ferramenta Document Intelligence Sample Labeling, consulte a documentação disponível no GitHub.
TLS 1.2 Execução.
TLS 1.2 agora é aplicado para todas as solicitações HTTP para este serviço. Para obter mais informações, consulte Segurança dos serviços de IA do Azure.

Janeiro de 2020

Esta versão apresenta o Document Intelligence 2.0. Nas próximas seções, você encontrará mais informações sobre novos recursos, aprimoramentos e alterações.

Novas funcionalidades
- Modelo personalizado
  - Treinar com etiquetas Agora você pode treinar um modelo personalizado com dados rotulados manualmente. Esse método resulta em modelos de melhor desempenho e pode produzir modelos que trabalham com formulários complexos ou formulários contendo valores sem chaves.
  - API assíncrona Você pode usar chamadas de API assíncronas para treinar e analisar grandes conjuntos de dados e arquivos.
  - Suporte a arquivos TIFF Agora você pode treinar e extrair dados de documentos TIFF.
  - Melhorias na precisão de extração.
- Modelo de recibo pré-construído
  - Valores de gorjetas Agora você pode extrair valores de gorjetas e outros valores manuscritos.
  - Extração de item de linha Você pode extrair valores de item de linha de recibos.
  - Valores de confiança Você pode visualizar a confiança do modelo para cada valor extraído.
  - Melhorias na precisão de extração.
  - Extração de layout Agora você pode usar a API de layout para extrair dados de texto e dados de tabela de seus formulários.
Alterações na API do modelo personalizado

Todas as APIs para treinamento e uso de modelos personalizados são renomeadas e alguns métodos síncronos agora são assíncronos. As principais alterações são as seguintes:
- O processo de formação de um modelo é agora assíncrono. Você inicia o treinamento por meio da chamada de API /custom/models . Essa chamada retorna um ID de operação, que você pode passar para custom/models/{modelID} para retornar os resultados do treinamento.
- A extração de chave/valor agora é iniciada pela chamada de API /custom/models/{modelID}/analyze . Essa chamada retorna um ID de operação, que você pode passar para custom/models/{modelID}/analyzeResults/{resultID} para retornar os resultados da extração.
- Os IDs de operação para a operação Train agora são encontrados no cabeçalho Location das respostas HTTP, não no cabeçalho Operation-Location .
Alterações na API de recebimento
- As APIs para leitura de recibos de vendas são renomeadas.
- A extração de dados de recebimento agora é iniciada pela chamada de API /prebuilt/receipt/analyze . Essa chamada retorna um ID de operação, que você pode passar para /prebuilt/receipt/analyzeResults/{resultID} para retornar os resultados da extração.
Alterações no formato de saída
- As respostas JSON para todas as chamadas de API têm novos formatos. Algumas chaves e valores são adicionados, removidos ou renomeados. Consulte os guias de início rápido para obter exemplos dos formatos JSON atuais.

Próximos passos

Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Share via

O que há de novo no Azure AI Document Intelligence

maio de 2024

Fevereiro de 2024

Dezembro de 2023

Novembro de 2023

Julho de 2023

Maio de 2023

Abril de 2023

Março de 2023

Fevereiro de 2023

Janeiro de 2023

Dezembro de 2022

Novembro de 2022

Outubro de 2022

Setembro de 2022

Agosto de 2022

Junho de 2022

Fevereiro de 2022

Novembro de 2021

Outubro de 2021

Setembro de 2021

Julho de 2021

Junho de 2021

Maio de 2021

Abril de 2021

Março de 2021

Novembro de 2020

Agosto de 2020

Julho de 2020

Junho de 2020

Abril de 2020

Março de 2020

Janeiro de 2020

Próximos passos

Recursos adicionais