Partilhar via


O que há de novo no Azure AI Document Intelligence

Este conteúdo aplica-se a: marca de verificação v4.0 (pré-visualização) marca de verificação v3.1 (GA)marca de verificação v3.0 (GA) marca de verificação v2.1 (GA)

O serviço de Informações Documentais é atualizado continuamente. Marque esta página para se manter atualizado com as notas de versão, aprimoramentos de recursos e nossa documentação mais recente.

Importante

As versões da API de visualização são desativadas assim que a API do GA é lançada. A versão da API 2023-02-28-preview está sendo desativada, se você ainda estiver usando a API de visualização ou as versões associadas do SDK, atualize seu código para direcionar a versão mais recente da API 2023-07-31 (GA).

Agosto de 2024

A API REST do Document Intelligence 2024-07-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:

  • A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. O novo modelo de extração de campo de documento no AI Studio só está disponível na região Centro-Norte dos EUA:

  • E.U.A. Leste

  • Oeste dos EUA2

  • Europa Ocidental

  • Centro-Norte dos EUA

  • 🆕 Modelo de extração de campo de documento (generativo personalizado)

    • Use a IA generativa para extrair campos de documentos e formulários. O Document Intelligence agora oferece um novo modelo de extração de campo de documento que utiliza grandes modelos de linguagem (LLMs) para extrair campos de documentos não estruturados ou formulários estruturados com uma ampla variedade de modelos visuais. Com valores fundamentados e pontuações de confiança, a nova extração baseada em IA generativa se encaixa em seus processos existentes.
  • 🆕 Modelo composto com classificadores personalizados

    • O Document Intelligence agora adiciona suporte para compor modelos com um modelo de classificação personalizado explícito. Saiba mais sobre os benefícios de usar o novo recurso de composição.
  • Modelo de classificação personalizado

    • O modelo de classificação personalizado agora também suporta a atualização do modelo in-loco.
    • O modelo de classificação personalizado adiciona suporte à operação de cópia de modelo para habilitar o backup e a recuperação de desastres.
    • O modelo de classificação personalizado agora suporta a especificação explícita de páginas a serem classificadas a partir de um documento de entrada.
  • 🆕 Modelo de documentos de hipoteca

    • Extrair informações da Avaliação (Formulário 1004).
    • Extraia informações da Validação de Emprego (Formulário 1005).
  • 🆕 Verificar modelo

    • Extraia o beneficiário, o montante, a data e outras informações relevantes dos cheques.
  • 🆕 Modelo Pay Stub

    • Novo pré-construído para processar stubs de pagamento para extrair salários, horas, deduções, pagamento líquido e muito mais.
  • 🆕 Modelo de extrato bancário

    • Novo pré-construído para extrair informações da conta, incluindo saldos iniciais e finais, detalhes da transação de extratos bancários.
  • 🆕 Modelo tributário dos EUA

    • Novo modelo tributário unificado dos EUA que pode extrair de formulários como W-2, 1098, 1099 e 1040.
  • 🆕 PDF pesquisável. O modelo de leitura pré-construído agora suporta saída PDF para baixar PDFs com texto incorporado dos resultados da extração, permitindo que o PDF seja utilizado em cenários como cópia de pesquisa de conteúdo.

  • O modelo de layout agora suporta deteção de figuras aprimorada, onde figuras de documentos agora podem ser baixadas como um arquivo de imagem a ser usado para maior compreensão de figuras. O modelo de layout também apresenta melhorias no modelo OCR para melhorias na segmentação de texto digitalizado para caracteres únicos, texto em caixa e documentos de texto denso.

  • 🆕 API de lote

    • O Document Intelligence agora adiciona suporte para a operação de análise em lote para dar suporte à análise de um conjunto de documentos para simplificar a experiência do desenvolvedor e melhorar a eficiência.
  • Capacidades adicionais

    • Campos de consulta A qualidade da extração de IA é melhorada com o modelo mais recente.

maio de 2024

O Document Intelligence Studio adiciona suporte para autenticação do Microsoft Entra (anteriormente Azure Ative Directory). Para obter mais informações, consulte Visão geral do Document Intelligence Studio.

Fevereiro de 2024

A API REST do Document Intelligence 2024-07-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:

  • A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure:

    • E.U.A. Leste
    • Oeste dos EUA2
    • Europa Ocidental
  • O modelo de layout agora suporta deteção de figuras e análise hierárquica da estrutura do documento (seções e subseções). A qualidade da IA na ordem de leitura e na deteção de funções lógicas também é melhorada.

  • Modelos de extração personalizados

    • Os modelos de extração personalizados agora suportam pontuações de confiança em nível de célula, linha e tabela. Saiba mais sobre a confiança na tabela, linha e célula.
    • Os modelos de extração personalizados têm melhorias de qualidade de IA para extração de campo.
    • O modelo de extração de modelo personalizado agora suporta a extração de campos sobrepostos. Saiba mais sobre campos sobrepostos e como usá-los.
  • Modelo de classificação personalizado

    • O modelo de classificação personalizado agora oferece suporte ao treinamento incremental para cenários em que você precisa atualizar o modelo de classificador com amostras ou classes adicionadas. Saiba mais sobre o treinamento incremental.
    • O modelo de classificação personalizado adiciona suporte para tipos de documentos do Office (.docx, .pptx e .xls). Saiba mais sobre o suporte expandido a tipos de documentos.
  • Modelo de fatura

    • Suporte para novas localidades:
    Região Código
    Árabe (ar)
    Búlgaro (bg)
    Grego (el)
    Hebraico (he)
    Macedónio (mk)
    Russo (ru) Cirílico sérvio (sr-cyrl)
    Ucraniano (uk)
    Tailandês (th)
    Turco (tr)
    Vietnamita (vi)
    • Suporte para novos códigos de moeda:
    Moeda Região Código
    BAM Marca descapotável bósnia (ba)
    BGN Lev búlgaro (bg)
    ILS Novo Shekel israelita (il)
    MKD Denar macedónio (mk)
    RUB Rublo russo (ru)
    THB Baht tailandês (th)
    TRY Lira turca (tr)
    UAH Hryvnia ucraniana (ua)
    VND Dong vietnamita (vn)
    • Itens fiscais suportam a expansão para Alemanha (de), Espanha (es), Portugal (pt), Inglês Canadá en-CA.
  • Modelo de identificação

    • Suporte de campo expandido para IDs da União Europeia e carteira de motorista.
  • 🆕 Documentos de hipoteca

    • Extraia informações do Pedido de Empréstimo Residencial Uniforme (Formulário 1003).
    • Extraia informações do Resumo Uniforme de Subscrição e Transmissão ou do Formulário 1008.
    • Extraia informações da divulgação de fechamento de hipotecas.
  • 🆕 Modelo de cartão de crédito/débito

    • Extraia informações de cartões bancários.
  • 🆕 Certidão de casamento

    • Novo pré-construído para extrair informações de certidões de casamento.

Dezembro de 2023

As bibliotecas de cliente do Document Intelligence destinadas à API REST 2023-10-31-preview já estão disponíveis para uso!

Novembro de 2023

A API REST do Document Intelligence 2023-10-31-preview já está disponível. Esta API de pré-visualização introduz capacidades novas e atualizadas:

  • A versão de pré-visualização pública 2023-10-31-preview está atualmente disponível apenas nas seguintes regiões do Azure:

    • E.U.A. Leste
    • Oeste dos EUA2
    • Europa Ocidental
  • Ler modelo

    • Expansão do idioma para caligrafia: russo(ru), árabe(ar), tailandês(th).
    • Conformidade com a Ordem Executiva Cibernética (EO).
  • Modelo de layout

    • Escritório de suporte e arquivos HTML.
    • Suporte de saída de Markdown.
    • Melhorias na extração de tabelas, na ordem de leitura e na deteção de cabeçalhos de seção.
    • Com o Document Intelligence 2023-10-31-preview, o modelo de documento geral (prebuilt-document) foi preterido. No futuro, para extrair pares chave-valor de documentos, use o prebuilt-layout modelo com o parâmetro features=keyValuePairs opcional de cadeia de caracteres de consulta habilitado.
  • Modelo de recibo

    • Agora extrai moeda para todos os campos relacionados a preços.
  • Modelo de Cartão de Seguro de Saúde

    • Novo suporte de campo para informações sobre Medicare e Medicaid.
  • Modelos de documentos fiscais dos EUA

    • Novo modelo fiscal 1099. Suporta o formulário base 1099 e as seguintes variações: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Modelo de fatura

    • Suporte para KVK campo.
    • Suporte para BPAY campo.
    • Inúmeros refinamentos de campo.
  • Classificação personalizada

    • Suporte para documentos multilingues.
    • Novas opções de divisão de página: divisão automática, sempre dividida por página, sem divisão.
  • Capacidades adicionais

    • Os campos de consulta estão disponíveis com a 2023-10-31-preview versão.
    • Os recursos de complemento estão disponíveis em todos os modelos, exceto no modelo de leitura.

Nota

Com a versão 2022-08-31 API general availability (GA), as APIs de visualização associadas estão sendo preteridas. Se você estiver usando as versões da API 2021-09-30-preview, 2022-01-30-preview ou 2022-06-30-preview, atualize seus aplicativos para direcionar a versão da API 2022-08-31. Há algumas pequenas alterações envolvidas, para obter mais informações, consulte o guia de migração.

Julho de 2023

Nota

O Form Recognizer agora é o Azure AI Document Intelligence!

  • Documento, os serviços de IA do Azure abrangem todos os que eram anteriormente conhecidos como Serviços Cognitivos e Serviços de IA Aplicada do Azure.
  • Não há alterações nos preços.
  • Os nomes Serviços Cognitivos e IA Aplicada do Azure continuam a ser usados na faturação do Azure, na análise de custos, na lista de preços e nas APIs de preços.
  • Não há alterações significativas nas interfaces de programação de aplicativos (APIs) ou bibliotecas de clientes.
  • Algumas plataformas ainda aguardam a atualização de renomeação. Todas as menções ao Reconhecedor de Formulários ou Inteligência de Documentos em nossa documentação referem-se ao mesmo serviço do Azure.

Inteligência Documental v3.1 (GA)

A API do Document Intelligence versão 3.1 está agora disponível para o público em geral (GA)! A versão da API corresponde a 2023-07-31. A API v3.1 introduz recursos novos e atualizados:

  • As APIs de Document Intelligence agora são mais modulares e com suporte para recursos opcionais. Agora você pode personalizar a saída para incluir especificamente os recursos necessários. Saiba mais sobre os parâmetros opcionais.
  • API de classificação de documentos para dividir um único arquivo em documentos individuais. Saiba mais sobre a classificação de documentos.
  • Modelo de contrato pré-construído.
  • Modelo 1098 do formulário de imposto dos EUA pré-construído.
  • Suporte para tipos de arquivo do Office com API de leitura.
  • Reconhecimento de código de barras em documentos.
  • Capacidade complementar de reconhecimento de fórmulas.
  • Capacidade de complemento de reconhecimento de fontes.
  • Suporte para documentos de alta resolução.
  • Modelos neurais personalizados agora exigem uma única amostra rotulada para treinar.
  • Expansão de linguagem de modelos neurais personalizados. Treine um modelo neural para documentos em 30 idiomas. Consulte o suporte a idiomas para obter a lista completa de idiomas suportados.
  • 🆕 Modelo de cartão de seguro de saúde pré-construído.
  • Expansão da localidade do modelo de fatura pré-construído.
  • Modelo de recibo pré-construído e expansão de localidade com mais de 100 idiomas suportados.
  • O modelo de ID pré-construído agora suporta IDs europeus.

Atualizações de UX do Document Intelligence Studio

✔️ Analisar opções

  • O Document Intelligence agora suporta recursos de análise mais sofisticados e o Studio permite um ponto de entrada (botão Analisar opções) para configurar os recursos adicionais com facilidade.

  • Dependendo do cenário de extração de documentos, configure o intervalo de análise, o intervalo de páginas do documento, a deteção opcional e os recursos de deteção premium.

    Captura de tela animada mostrando o uso do botão de opções de análise para configurar opções no Studio.

    Nota

    A extração de fontes não é visualizada no Document Intelligence Studio. No entanto, você pode verificar a seção de estilos da saída JSON para obter os resultados da deteção de fontes.

✔️ Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos

  • Na página de etiquetagem de modelo de extração personalizada, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou modelos que você treinou anteriormente.

    Captura de tela animada mostrando a etiquetagem automática no Studio.

  • Para alguns documentos, pode haver etiquetas duplicadas depois de executar a etiqueta automática. Certifique-se de modificar os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

    Captura de ecrã a mostrar aviso de etiqueta duplicada após etiquetagem automática.

✔️ Tabelas de etiquetagem automática

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

    Captura de tela animada mostrando a etiquetagem automática da tabela no Studio.

✔️ Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento

  • Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.

  • Se for devolvida uma pontuação de confiança baixa para algumas etiquetas, certifique-se de que as etiquetas estão corretas. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.

Captura de tela animada mostrando como adicionar arquivos de teste ao conjunto de dados de treinamento.

✔️ Faça uso das opções e filtros da lista de documentos em projetos personalizados

  • Use a página de rotulagem do modelo de extração personalizado. Agora você pode navegar pelos documentos de treinamento com facilidade, usando a pesquisa, o filtro e a classificação por recurso.

  • Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer os documentos mais facilmente.

    Captura de ecrã a mostrar opções e filtros de vista de lista de documentos.

✔️ Partilha de projetos

Maio de 2023

Apresentando a documentação atualizada para o Build 2023

Abril de 2023

Anunciando a versão de visualização pública mais recente da biblioteca cliente do Document Intelligence

Março de 2023

Importante

2023-02-28-preview Atualmente, os recursos estão disponíveis apenas nas seguintes regiões:

  • Europa Ocidental
  • E.U.A. Oeste 2
  • E.U.A. Leste
  • O modelo de classificação personalizado é um novo recurso dentro do Document Intelligence que começa com a 2023-02-28-preview API.
  • Recursos de campos de consulta adicionados ao modelo de Documento Geral, use modelos do Azure OpenAI para extrair campos específicos de documentos. Experimente o recurso Documentos gerais com campos de consulta usando o Document Intelligence Studio. Atualmente, os campos de consulta estão ativos apenas para recursos na East US região.
  • Recursos complementares:
    • A extração de fontes agora é reconhecida com a 2023-02-28-preview API.
    • A extração de fórmulas agora é reconhecida com a 2023-02-28-preview API.
    • A extração de alta resolução agora é reconhecida com a 2023-02-28-preview API.
  • Atualizações do modelo de extração personalizado:
    • O modelo neural personalizado agora suporta idiomas adicionados para treinamento e análise. Treine modelos neurais para holandês, francês, alemão, italiano e espanhol.
    • O modelo de modelo personalizado agora tem um recurso aprimorado de deteção de assinatura.
  • Atualizações do Document Intelligence Studio :
    • Além do suporte para todos os novos recursos, como classificação e campos de consulta, o Studio agora permite o compartilhamento de projetos para projetos de modelo personalizados.
    • Novas adições de modelo na pré-visualização fechada: cartões de vacinação, contratos, imposto dos EUA 1098, imposto dos EUA 1098-E e imposto dos EUA 1098-T. Para solicitar acesso a modelos de visualização fechados, preencha e envie o formulário de solicitação de visualização privada do Document Intelligence.
  • Atualizações do modelo de recibo:
    • O modelo de recibo adiciona suporte para recibos térmicos.
    • O modelo de recibo agora adiciona suporte a idiomas para 18 idiomas e três idiomas regionais (inglês, francês, português).
    • O modelo de recibo agora suporta TaxDetails extração.
  • O modelo de layout agora melhora o reconhecimento da tabela.
  • O modelo Read agora adiciona melhorias para o reconhecimento de caracteres de um dígito.

Fevereiro de 2023

  • Selecione os contêineres do Document Intelligence para v3.0 agora estão disponíveis para uso!

  • Atualmente, os contêineres Read v3.0 e Layout v3.0 estão disponíveis.

    Para obter mais informações, consulte Instalar e executar contêineres de Document Intelligence.


Janeiro de 2023

  • Modelo de recibo pré-construído - adicionado idiomas suportados. O modelo de recibo agora suporta esses idiomas e localidades adicionados

    • Japonês - Japão (ja-JP)
    • Francês - Canadá (fr-CA)
    • Neerlandês - Países Baixos (nl-NL)
    • Inglês - Emirados Árabes Unidos (pt-AE)
    • Português - Brasil (pt-BR)
  • Modelo de fatura pré-construído - adicionado idiomas suportados. O modelo de fatura agora suporta esses idiomas e localidades adicionados

    • Inglês - Estados Unidos (en-US), Austrália (en-AU), Canadá (en-CA), Reino Unido (en-UK), Índia (en-IN)
    • Espanhol - Espanha (es-ES)
    • Francês - França (fr-FR)
    • Italiano - Itália (it-IT)
    • Português - Portugal (pt-PT)
    • Neerlandês - Países Baixos (nl-NL)
  • Modelo de fatura pré-construído - campos adicionados reconhecidos. O modelo de fatura agora reconhece esses campos adicionados

    • Código de moeda
    • Opções de pagamento
    • Desconto total
    • Itens fiscais (somente en-IN)
  • Modelo de ID pré-construído - adicionado tipos de documentos suportados. O modelo de ID agora suporta esses tipos de documentos adicionados

    • Identificação militar dos EUA

Gorjeta

Todas as atualizações de janeiro de 2023 estão disponíveis com a versão 2022-08-31 (GA) da API REST.

  • Modelo de recibo pré-construído — suporte a idiomas adicionais:

    O modelo de recibo pré-construído adiciona suporte para os seguintes idiomas:

    • Inglês - Emirados Árabes Unidos (pt-AE)
    • Neerlandês - Países Baixos (nl-NL)
    • Francês - Canadá (fr-CA)
    • Alemão - (de-DE)
    • Italiano - (it-IT)
    • Japonês - Japão (ja-JP)
    • Português - Brasil (pt-BR)
  • Modelo de fatura pré-construído — suporte a idiomas adicionais e extrações de campo

    O modelo de fatura pré-criado adiciona suporte para os seguintes idiomas:

    • Inglês - Austrália (en-AU), Canadá (en-CA), Reino Unido (en-UK), Índia (en-IN)
    • Português - Brasil (pt-BR)

    O modelo de fatura pré-construído agora adiciona suporte para as seguintes extrações de campo:

    • Código de moeda
    • Opções de pagamento
    • Desconto total
    • Itens fiscais (somente en-IN)
  • Modelo de documento de ID pré-construído — suporte a tipos de documentos adicionais

    O modelo de documento de ID pré-criado agora adiciona suporte para os seguintes tipos de documentos:

    • Expansão da carteira de motorista com suporte para Índia, Canadá, Reino Unido e Austrália
    • Cartões e documentos de identificação militar dos EUA
    • Cartões de identidade e documentos da Índia (PAN e Aadhaar)
    • Cartões de identificação e documentos da Austrália (cartão com foto, identificação com chave)
    • Cartões de identificação e documentos do Canadá (cartão de identificação, cartão Maple)
    • Bilhetes de identidade e documentos do Reino Unido (bilhete de identidade nacional/regional)

Dezembro de 2022

  • Atualizações do Document Intelligence Studio

    A versão de dezembro do Document Intelligence Studio inclui as atualizações mais recentes do Document Intelligence Studio. Há melhorias significativas na experiência do usuário, principalmente com suporte à etiquetagem de modelo personalizado.

    • Intervalo de páginas. O Studio agora suporta a análise de páginas especificadas de um documento.

    • Etiquetagem de modelo personalizada:

      • Execute a API de layout automaticamente. Você pode optar por executar a API de layout para todos os documentos automaticamente em seu armazenamento de blob durante o processo de configuração do modelo personalizado.

      • Pesquisar. O Studio agora inclui a funcionalidade de pesquisa para localizar palavras dentro de um documento. Esta melhoria permite uma navegação mais fácil durante a rotulagem.

      • Navegação. Você pode selecionar rótulos para direcionar palavras rotuladas em um documento.

      • Etiquetagem automática de tabelas. Depois de selecionar o ícone de tabela em um documento, você pode optar por rotular automaticamente a tabela extraída na exibição de rotulagem.

      • Subtipos de rótulo e subtipos de segundo nível O Studio agora oferece suporte a subtipos para colunas de tabela, linhas de tabela e subtipos de segundo nível para tipos como datas e números.

  • A criação de modelos neurais personalizados agora é suportada na região Gov Virginia dos EUA.

  • Visualize as versões 2022-01-30-preview da API e 2021-09-30-preview será desativada em 31 de janeiro de 2023. Atualize para a versão da API para evitar interrupções no 2022-08-31 serviço.


Novembro de 2022

  • Anunciando a versão estável mais recente das bibliotecas do Azure AI Document Intelligence
    • Esta versão inclui alterações e atualizações importantes para bibliotecas de cliente .NET, Java, JavaScript e Python. Para obter mais informações, consulte Azure SDK DevBlog.
    • As melhorias mais significativas são a introdução de dois novos clientes, o DocumentAnalysisClient e o DocumentModelAdministrationClient.

Outubro de 2022

  • Conteúdo versionado do Document Intelligence

    • A documentação do Document Intelligence é atualizada para apresentar uma experiência versionada. Agora, você pode optar por visualizar o conteúdo direcionado à v3.0 GA experiência ou à v2.1 GA experiência. A experiência v3.0 é o padrão.

      Captura de tela da página inicial do Document Intelligence indicando o menu suspenso da versão.

  • Código de exemplo do Document Intelligence Studio

    • O código de exemplo para a experiência de rotulagem do Document Intelligence Studio já está disponível no GitHub. Os clientes podem desenvolver e integrar a Document Intelligence em sua própria UX ou criar sua própria nova UX usando o código de exemplo do Document Intelligence Studio.
  • Expansão linguística

    • Com a versão de visualização mais recente, os modelos de modelo Leitura (OCR), Layout e Personalizado do Document Intelligence suportam 134 novos idiomas. Estas adições linguísticas incluem grego, letão, sérvio, tailandês, ucraniano e vietnamita, juntamente com várias línguas latinas e cirílicas. O Document Intelligence agora tem um total de 299 idiomas suportados no GA mais recente e nas novas versões de visualização. Consulte as páginas de idiomas suportados para ver todos os idiomas suportados.
    • Use o parâmetro api-version=2022-06-30-preview REST API ao usar a API ou o SDK correspondente para oferecer suporte aos novos idiomas em seus aplicativos.
  • Novo modelo de contrato pré-construído

    • Um novo pré-construído que extrai informações de contratos, como partes, título, ID do contrato, data de execução e muito mais. O modelo de contratos está atualmente em pré-visualização, solicite acesso aqui.
  • Expansão de região para treinamento de modelos neurais personalizados

    • Treinamento de modelos neurais personalizados agora suportados em regiões adicionadas.
      • E.U.A. Leste
      • E.U.A. Leste 2
      • US Gov - Arizona

Setembro de 2022

Nota

A partir da versão 4.0.0, um novo conjunto de clientes foi introduzido para aproveitar os recursos mais recentes do serviço de Inteligência Documental.

A versão do SDK versão 4.0.0 GA inclui as seguintes atualizações:

  • Versão 4.0.0 GA (2022-09-08)
  • Suporta clientes REST API v3.0 e v2.0

Pacote (NuGet)

Registo de alterações/Histórico de versões

Guia de migração

Leia-me

Amostras

  • Expansão de região para treinamento de modelos neurais personalizados agora suportada em seis novas regiões

    • Leste da Austrália
    • E.U.A. Central
    • Ásia Leste
    • França Central
    • Sul do Reino Unido
    • E.U.A. Oeste 2
    • Para obter uma lista completa das regiões onde o treinamento é suportado, consulte modelos neurais personalizados.

    • Versão do SDK 4.0.0 GA do Document Intelligence:

      • As bibliotecas de cliente do Document Intelligence versão 4.0.0 (.NET/C#, Java, JavaScript) e versão 3.2.0 (Python) estão geralmente disponíveis e prontas para uso em aplicativos de produção!.
      • Para obter mais informações sobre bibliotecas de cliente do Document Intelligence, consulte a visão geral do SDK.
      • Atualize seus aplicativos usando o guia de migração da linguagem de programação.

Agosto de 2022

A versão de pré-visualização de agosto de 2022 do SDK do Document Intelligence inclui as seguintes atualizações:

  • Document Intelligence v3.0 disponível em geral

    • Document Intelligence REST API v3.0 agora está disponível para uso geral e pronto para uso em aplicativos de produção! Atualize seus aplicativos com a API REST versão 2022-08-31.
  • Atualizações do Document Intelligence Studio

    • Próximos passos. Em cada página de modelo, o Studio agora tem uma seção de próximas etapas. Os usuários podem consultar rapidamente o código de exemplo, as diretrizes de solução de problemas e as informações de preços.
    • Modelos personalizados. O Studio agora inclui a capacidade de reordenar etiquetas em projetos de modelos personalizados para melhorar a eficiência da rotulagem.
    • Copiar modelos Os modelos personalizados podem ser copiados entre os serviços de Document Intelligence a partir do Studio. A operação possibilita a promoção de um modelo treinado para outros ambientes e regiões.
    • Excluir documentos. O Studio agora suporta a exclusão de documentos de conjuntos de dados rotulados em projetos personalizados.
  • Atualizações do serviço de Inteligência Documental

    • leitura pré-embutida. O modelo Read OCR agora também está disponível em Document Intelligence com parágrafos e deteção de idioma como os dois novos recursos. O Document Intelligence Read tem como alvo cenários avançados de documentos alinhados com os recursos mais amplos de inteligência documental do Document Intelligence.
    • layout pré-construído. O modelo de layout extrai parágrafos e se o texto extraído é um parágrafo, título, título de seção, nota de rodapé, cabeçalho de página, rodapé de página ou número de página.
    • fatura pré-embutida. Os campos TotalVAT e Linha/IVA agora são resolvidos para os campos existentes TotalTax e Line/Tax respectivamente.
    • prebuilt-idDocument. Suporte de extração de dados para identificação do estado dos EUA, segurança social e green cards. Suporte para informações de visto de passaporte.
    • recibo pré-embutido. Suporte de localidade expandido para francês (fr-FR), espanhol (es-ES), português (pt-PT), italiano (it-IT) e alemão (de-DE).
    • cartão de visita pré-construído. Suporte à análise de endereços para extrair subcampos para componentes de endereço, como endereço, cidade, estado, país/região e código postal.
  • Melhorias na qualidade da IA

    • leitura pré-embutida. Suporte aprimorado para caracteres únicos, datas manuscritas, valores, nomes, outros dados importantes comumente encontrados em recibos e faturas e processamento aprimorado de documentos PDF digitais.
    • layout pré-construído. Suporte para melhor deteção de tabelas cortadas, tabelas sem bordas e melhor reconhecimento de células de extensão longa.
    • documento pré-construído. Deteção melhorada de valores e caixas de verificação.
    • personalizado-neural. Maior precisão para deteção e extração de tabelas.

Junho de 2022

  • A versão beta de junho de 2022 do SDK do Document Intelligence inclui as seguintes atualizações:
  • A versão de junho do Document Intelligence Studio é a atualização mais recente do Document Intelligence Studio. Há melhorias consideráveis de experiência do usuário e acessibilidade abordadas nesta atualização:

    • Exemplo de código para JavaScript e C#. A guia de código Studio agora adiciona exemplos de código JavaScript e C#, além do Python existente.
    • Nova interface do usuário de carregamento de documentos. O Studio agora suporta o upload de um documento com arrastar & soltar na nova interface de usuário de upload.
    • Novo recurso para projetos personalizados. Projetos personalizados agora suportam a criação de conta de armazenamento e blobs ao configurar o projeto. Além disso, o projeto personalizado agora suporta o upload de arquivos de treinamento diretamente no Studio e a cópia do modelo personalizado existente.
  • A versão 2022-06-30-preview do Document Intelligence v3.0 apresenta atualizações extensas nas APIs de recursos:

    • O layout estende a extração da estrutura. O layout agora inclui elementos de estrutura adicionados, incluindo seções, cabeçalhos de seção e parágrafos. Esta atualização permite cenários de segmentação de documentos de grão mais fino. Para obter uma lista completa dos elementos de estrutura identificados, consulte Estrutura aprimorada.
    • Suporte a campos tabulares de modelo neural personalizado. Os modelos de documentos personalizados agora suportam campos tabulares. Os campos tabulares por padrão também são de várias páginas. Para saber mais sobre campos tabulares em modelos neurais personalizados, consulte Campos tabulares.
    • Suporte a campos tabulares de modelo de modelo personalizado para tabelas de páginas cruzadas. Os modelos de formulário personalizados agora oferecem suporte a campos tabulares nas páginas. Para saber mais sobre campos tabulares em modelos de modelo personalizados, consulte Campos tabulares.
    • A saída do modelo de fatura agora inclui pares chave-valor gerais do documento. Quando as faturas contêm campos obrigatórios além dos campos incluídos no modelo pré-construído, o modelo de documento geral complementa a saída com pares chave-valor. Consulte os pares de valores de chave.
    • Expansão do idioma da fatura. O modelo de fatura inclui suporte a idiomas expandido. Consulte os idiomas suportados.
    • O cartão de visita pré-construído agora inclui suporte ao idioma japonês. Consulte os idiomas suportados.
    • Modelo de documento de identificação pré-construído. O modelo de documento de identificação agora extrai DateOfIssue, Height, Weight, EyeColor, HairColor e DocumentDiscriminator das carteiras de motorista dos EUA. Veja extração de campo.
    • O modelo Read agora suporta tipos de documentos comuns do Microsoft Office. Tipos de documentos como Word (docx), Excel (xlsx) e PowerPoint (pptx) agora são suportados com a API de leitura. Consulte Ler extração de dados.

Fevereiro de 2022

  • A versão prévia do Document Intelligence v3.0 apresenta vários novos recursos, recursos e aprimoramentos:

    • Modelo neural personalizado ou modelo de documento personalizado é um novo modelo personalizado para extrair texto e marcas de seleção de formulários estruturados, documentos semiestruturados e não estruturados.
    • O modelo pré-construído W-2 é um novo modelo pré-construído para extrair campos de formulários W-2 para relatórios fiscais e cenários de verificação de rendimentos.
    • A API de leitura extrai linhas de texto impressas, palavras, locais de texto, idiomas detetados e texto manuscrito, se detetado.
    • O modelo geral pré-treinado de documentos agora é atualizado para oferecer suporte a marcas de seleção, além de texto de API, tabelas, estrutura e pares chave-valor de formulários e documentos.
    • API de faturas O modelo pré-construído de faturas expande o suporte a faturas espanholas.
    • O Document Intelligence Studio adiciona novas demonstrações para amostras de recibos de Read, W2 e Hotel e suporte para treinar os novos modelos neurais personalizados.
    • Expansão de idioma Document Intelligence Leitura, layout e formulário personalizado adicionam suporte para 42 novos idiomas, incluindo árabe, hindi e outros idiomas usando scripts árabes e devanágari para expandir a cobertura para 164 idiomas. O suporte a idiomas manuscritos expande-se para japonês e coreano.
  • Comece a usar a nova API de visualização v3.0.

  • Extração de dados do modelo Document Intelligence:

    Modelo Extração de texto Pares chave-valor Marcas de seleção Tabelas Assinaturas
    Lida
    Documento geral
    Esquema
    Invoice
    Recibo
    Documento de identificação
    Cartão de visita
    Modelo personalizado
    Neural personalizado
  • A versão beta do SDK do Document Intelligence inclui as seguintes atualizações:


Próximos passos

  • Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.

  • Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.