Q: O que é a pontuação de precisão e como é calculada?

A saída de uma build operação de modelo personalizado (v3.0 e versões posteriores) ou train (v2.1) inclui a pontuação de precisão estimada. Essa pontuação representa a capacidade do modelo de prever com precisão o valor rotulado em um documento visualmente semelhante. A precisão é medida dentro de um intervalo de valores percentuais de 0% (baixo) a 100% (alto). Para obter mais informações, consulte Pontuações de precisão e confiança.

Question 1

O que é o Azure AI Document Intelligence e o que aconteceu com o Azure AI Form Recognizer?

Accepted Answer

O Azure AI Document Intelligence é um serviço baseado na nuvem que utiliza modelos de aprendizagem automática para extrair pares chave/valor, texto e tabelas dos seus documentos. O resultado retornado é uma saída JSON estruturada. Os casos de uso do Document Intelligence incluem processamento automatizado de dados, estratégias aprimoradas orientadas por dados e recursos enriquecidos de pesquisa de documentos.

A Inteligência de Documentos faz parte dos serviços de IA do Azure. Os serviços de IA do Azure abrangem todos os que eram anteriormente conhecidos como Serviços Cognitivos do Azure e Serviços de IA Aplicada do Azure.

O nome anterior para Document Intelligence era Azure AI Form Recognizer. O Form Recognizer tornou-se oficialmente Document Intelligence em julho de 2023.

Não há alterações nos preços. Os nomes Serviços Cognitivos e Serviços de IA Aplicada continuam a ser usados na faturação do Azure, na análise de custos, nas listas de preços e nas APIs de preços.

Não há alterações significativas em APIs ou bibliotecas de cliente (SDKs). As APIs REST e as versões SDK 2024-02-29-preview, 2023-10-31-preview e posteriores são renomeadas document intelligence.

Algumas plataformas ainda aguardam a atualização de renomeação. Na documentação da Microsoft, todas as menções ao Form Recognizer e ao Document Intelligence referem-se ao mesmo serviço do Azure.

Question 2

Como a Inteligência Documental está relacionada à IA generativa de documentos?

Accepted Answer

Você pode usar uma solução de IA generativa de documentos para conversar com seus documentos, gerar conteúdo cativante a partir desses documentos e acessar modelos do Serviço OpenAI do Azure em seus dados. Com o Azure AI Document Intelligence e o Azure OpenAI combinados, pode criar uma aplicação empresarial para interagir perfeitamente com os seus documentos utilizando linguagens naturais, encontrar facilmente respostas e obter informações valiosas e gerar conteúdo novo e envolvente a partir dos seus documentos existentes. Encontre mais detalhes no blog da comunidade técnica.

Question 3

Como a Inteligência Documental está relacionada à geração aumentada de recuperação?

Accepted Answer

A fragmentação semântica é uma etapa fundamental na geração aumentada de recuperação (RAG) para garantir seu armazenamento e recuperação eficientes. O modelo de layout Document Intelligence oferece uma solução abrangente para os recursos de extração avançada de conteúdo e análise da estrutura do documento.

Com o modelo de layout, você pode extrair facilmente texto e elementos estruturais para dividir grandes corpos de texto em partes menores e significativas com base em conteúdo semântico, em vez de divisões arbitrárias. Em seguida, você pode exportar convenientemente as informações extraídas para o formato Markdown, para que possa definir sua estratégia de fragmentação semântica com base nos blocos de construção fornecidos. Encontre mais detalhes na visão geral do RAG em Document Intelligence.

Question 4

Que casos de uso de Inteligência Documental requerem consideração especial?

Accepted Answer

Dê uma consideração cuidadosa aos projetos de processamento de documentos que abrangem dados financeiros, dados de saúde protegidos, dados pessoais ou dados altamente sensíveis.

Certifique-se de cumprir todos os requisitos nacionais/regionais e específicos do setor.

Question 5

Que idiomas são suportados pelo Document Intelligence?

Accepted Answer

Os modelos universais baseados em aprendizagem profunda em Document Intelligence suportam muitas linguagens que podem extrair texto multilíngue de suas imagens e documentos, incluindo linhas de texto com idiomas mistos.

O suporte a idiomas varia de acordo com a funcionalidade do serviço Document Intelligence. Para obter uma lista completa do texto manuscrito e impresso suportado pelo Document Intelligence, consulte Suporte a idiomas.

Question 6

O Document Intelligence está disponível na minha região do Azure?

Accepted Answer

O Document Intelligence está geralmente disponível em muitas das 60+ regiões de infraestrutura global do Azure.

Escolha a região que é melhor para si e para os seus clientes.

Question 7

O Document Intelligence integra-se com outros serviços da Microsoft?

Accepted Answer

"Sim, o Document Intelligence integra-se com os seguintes serviços:"

Fluxos de trabalho do AI Builder
Azure AI Search
Funções do Azure
Azure Logic Apps

Question 8

Como a Inteligência Documental está relacionada ao reconhecimento ótico de caracteres?

Accepted Answer

O Document Intelligence é um serviço baseado na nuvem que incorpora reconhecimento ótico de carateres (OCR), análise de texto e classificação de texto personalizada dos serviços de IA do Azure.

O Document Intelligence usa OCR para detetar e extrair informações de documentos de texto tipográficos e manuscritos suportados por IA para fornecer mais estrutura e informações para a extração de texto.

Question 9

Por quanto tempo meu modelo personalizado está disponível para uso?

Accepted Answer

Um modelo tem o mesmo ciclo de vida que a versão da API que você usa para treiná-lo. Os modelos personalizados treinados com uma versão de disponibilidade geral (GA) da API têm o mesmo ciclo de vida que a versão da API. Quando a versão da API é preterida, o modelo não está mais disponível para inferência. Os modelos treinados com uma versão de visualização da API também têm o mesmo ciclo de vida que a API de visualização.

Espere a descontinuação da API de visualização dentro de três meses após uma versão atualizada da API de visualização ou uma versão mais recente da API do GA.

Question 10

O que é a pontuação de precisão e como é calculada?

Accepted Answer

A saída de uma build operação de modelo personalizado (v3.0 e versões posteriores) ou train (v2.1) inclui a pontuação de precisão estimada. Essa pontuação representa a capacidade do modelo de prever com precisão o valor rotulado em um documento visualmente semelhante.

A precisão é medida dentro de um intervalo de valores percentuais de 0% (baixo) a 100% (alto).

Para obter mais informações, consulte Pontuações de precisão e confiança.

Question 11

Como posso melhorar as pontuações de precisão?

Accepted Answer

Variações na estrutura visual de seus documentos podem influenciar a precisão de um modelo. Aqui ficam algumas dicas:

Inclua todas as variações de um documento no conjunto de dados de treinamento. As variações incluem diferentes formatos; por exemplo, PDFs digitais versus digitalizados.
Separe tipos de documentos visualmente distintos e treine modelos diferentes.
Certifique-se de que não tem rótulos estranhos.
Não inclua o texto circundante para etiquetagem da assinatura e região.

Para obter mais informações, consulte Pontuações de precisão e confiança.

Question 12

O que é o índice de confiança e como é calculado?

Accepted Answer

Um escore de confiança indica probabilidade medindo o grau de certeza estatística de que o resultado extraído é detetado corretamente.

O intervalo do valor de confiança é uma percentagem de 0% (baixo) a 100% (alto). É melhor atingir uma pontuação de 80% ou mais. Para casos mais sensíveis, como prontuários financeiros ou médicos, recomendamos uma pontuação próxima de 100%. Você também pode exigir revisão humana.

Para obter mais informações, consulte Pontuações de precisão e confiança.

Question 13

Como posso melhorar as pontuações de confiança?

Accepted Answer

Após uma operação de análise, revise a saída JSON. Examine os confidence valores para cada resultado de chave/valor no pageResults nó. Você também deve olhar para a pontuação de confiança no readResults nó, que corresponde à operação de leitura de texto. A confiança dos resultados lidos não afeta a confiança dos resultados de extração de chave/valor, portanto, você deve verificar ambos. Aqui ficam algumas dicas:

Se a pontuação de confiança do readResults objeto for baixa, melhore a qualidade dos documentos de entrada.
Se a pontuação de confiança para o pageResults objeto for baixa, certifique-se de que os documentos que você está analisando são do mesmo tipo.
Considere incorporar a revisão humana em seus fluxos de trabalho.
Use formulários com valores diferentes em cada campo.
Para modelos personalizados, use um conjunto maior de documentos de treinamento. Marcar mais documentos ensina seu modelo a reconhecer campos com maior precisão.

Para obter mais informações, consulte Pontuações de precisão e confiança.

Question 14

O que é uma caixa delimitadora?

Accepted Answer

Uma caixa delimitadora (polygon na v3.0 e versões posteriores) é um retângulo abstrato que envolve elementos de texto em um documento ou formulário. Ele é usado como um ponto de referência para deteção de objetos.

A caixa delimitadora especifica a posição usando um plano de coordenadas x e y apresentado em uma matriz de quatro pares numéricos. Cada par representa um canto da caixa na seguinte ordem: superior esquerdo, superior direito, inferior direito, inferior direito, inferior esquerdo.

Para uma imagem, as coordenadas estão em pixels. Para um PDF, as coordenadas estão em polegadas.

Question 15

O Document Intelligence pode me ajudar a classificar documentos?

Accepted Answer

O Document Intelligence fornece modelos de classificação personalizados que podem analisar documentos de arquivo único ou múltiplo para identificar se um arquivo de entrada contém algum dos tipos de documentos treinados. O serviço suporta os seguintes cenários:

Um único arquivo que contém um tipo de documento, como um formulário de solicitação de empréstimo.
Um único arquivo que contém vários documentos. Um exemplo é um pacote de pedido de empréstimo que contém um formulário de pedido de empréstimo, boleto de pagamento e extrato bancário.
Um único arquivo que contém várias instâncias do mesmo documento. Um exemplo é uma coleção de faturas digitalizadas.

Para obter mais informações, consulte a visão geral dos modelos de classificação personalizados.

Question 16

De que permissões necessito para aceder ao Document Intelligence Studio?

Accepted Answer

Você precisa de uma conta ativa do Azure e uma assinatura com pelo menos uma função de Leitor para acessar o Document Intelligence Studio.

Para análise de documentos e modelos pré-construídos, aqui estão os requisitos de função para cenários de usuário:

Básica
- Usuário de Serviços Cognitivos: você precisa dessa função para um recurso de vários serviços de Inteligência Documental ou Serviços Cognitivos para ler/gravar dados e é necessário chamar a API.
Avançado
- Colaborador: você precisa dessa função para criar um grupo de recursos ou um recurso de Inteligência Documental. A função de Colaborador não permite listar chaves para Serviços Cognitivos e não lhe dá acesso para usar os recursos ou armazenamento criados, apenas permite que um usuário leia/grave o próprio recurso. Para usar o Document Intelligence Studio, você ainda precisa da função Usuário dos Serviços Cognitivos.

Para projetos de modelo personalizado, aqui estão os requisitos de função para cenários de usuário:

Básica
- Usuário de Serviços Cognitivos: você precisa dessa função para um recurso de vários serviços de Inteligência Documental ou Serviços Cognitivos para ler/gravar dados e é necessário chamar a API. Esta função também é o mínimo necessário para treinar um modelo personalizado ou analisar com modelos treinados.
- Contribuidor de dados de Blob de armazenamento: você precisa dessa função para uma conta de armazenamento para criar dados de projeto e rotulagem.
Avançado
- Colaborador da conta de armazenamento: você precisa dessa função para que a conta de armazenamento configure as configurações de compartilhamento de recursos entre origens (CORS). É um esforço único se você reutilizar a mesma conta de armazenamento.
  
  A função de Colaborador não permite que você acesse dados em seu blob. Para usar o Document Intelligence Studio, você ainda precisa da função de Colaborador de Dados de Blob de Armazenamento.
- Colaborador: você precisa dessa função para criar um grupo de recursos e recursos. A função de Colaborador não lhe dá acesso para usar os recursos ou armazenamento criados, apenas permite que um usuário leia/grave o próprio recurso. Para usar o Document Intelligence Studio, você ainda precisa de funções básicas.

Para obter mais informações, consulte Funções internas do Microsoft Entra e as seções sobre atribuições de função do Azure no Guia de início rápido do Document Intelligence Studio.

Question 17

Tenho várias páginas num documento. Por que apenas duas páginas são analisadas no Document Intelligence Studio?

Accepted Answer

Para recursos de camada livre (F0), apenas as duas primeiras páginas são analisadas se você estiver usando o Document Intelligence Studio, a API REST ou SDKs.

No Document Intelligence Studio, selecione o botão Configurações (engrenagem), selecione a guia Recursos e verifique a faixa de preço que você está usando para analisar os documentos. Se quiser analisar todas as páginas de um documento, mude para um recurso pago (S0).

Question 18

Como posso alterar diretórios ou assinaturas no Document Intelligence Studio?

Accepted Answer

Para alterar um diretório no Document Intelligence Studio, selecione o botão Configurações (engrenagem). Em Diretório, selecione o diretório na lista e, em seguida, selecione Alternar diretório. Você será solicitado a entrar novamente depois de alternar o diretório.

Para alterar uma subscrição ou recurso, aceda ao separador Recurso em Definições.

Question 19

Por que estou recebendo um erro de armazenamento em uma operação de compartilhamento de projeto, rotulagem automática ou atualização de OCR quando meu recurso de conta de armazenamento está configurado com um firewall ou rede virtual?

Accepted Answer

Consulte Identidades gerenciadas para Document Intelligence para configurar seus recursos do Azure.

Question 20

Por que estou recebendo o erro "Acesso negado devido a regras de Rede Virtual/Firewall" em uma operação de atualização automática de rotulagem ou OCR quando meu recurso de Document Intelligence está configurado com um firewall ou rede virtual?

Accepted Answer

Você precisa adicionar o endereço IP dedicado 20.3.165.95 à lista de permissões do firewall para seu recurso de Document Intelligence.

Question 21

Posso reutilizar ou personalizar a experiência de etiquetagem do Document Intelligence Studio e criá-la em meu próprio aplicativo?

Accepted Answer

Sim. A experiência de rotulagem do Document Intelligence Studio é de código aberto no repositório do Toolkit.

Question 22

Por que estou recebendo o erro "Form Recognizer Not Found" ao abrir meu projeto personalizado?

Accepted Answer

Seu recurso de Document Intelligence vinculado a este projeto personalizado foi excluído ou movido para outro grupo de recursos. Há duas maneiras de resolver esse problema:

Recrie o recurso Document Intelligence sob a mesma assinatura e grupo de recursos com o mesmo nome.
Recrie um projeto personalizado com o recurso Document Intelligence migrado e especifique a mesma conta de armazenamento.

Question 23

Existem pontos de extremidade de URL separados para regiões de nuvem soberana de Inteligência Documental?

Accepted Answer

"Sim. O Document Intelligence Studio tem pontos de extremidade de URL separados para regiões de nuvem soberana:"

"URL para a nuvem do Azure US Government (Azure Fairfax): Document Intelligence Studio US Government".
"URL Microsoft Azure operado pela 21Vianet (Azure na China): Document Intelligence Studio China".

Question 24

Quais são as opções de desenvolvimento para Document Intelligence?

Accepted Answer

A Document Intelligence oferece as mais recentes opções de desenvolvimento nas seguintes plataformas:

API REST
Estúdio de Inteligência de Documentação
C#/.NET
Java
JavaScript/TypeScript
Python

Question 25

Onde posso encontrar a versão da API suportada para os SDKs de linguagem de programação mais recentes?

Accepted Answer

Esta tabela fornece links para as versões mais recentes do SDK e mostra a relação entre as versões suportadas do SDK do Document Intelligence e da API:

Referência do SDK do Azure no idioma suportado	Versões de API suportadas
• C#/.NET: 4.0.0 • Java: 4.0.0 • JavaScript: 4.0.0 • Python 3.2.0	2023-10-31-pré-visualização v3.0 v2.1 v2.0

Para obter mais informações, consulte Clientes suportados para v4.0 e Clientes suportados para v3.1.

Question 26

Qual é a diferença entre o Document Intelligence v3.0 e v2.1 e como faço para migrar para a versão mais recente?

Accepted Answer

Para melhorar a usabilidade, o Document Intelligence v3.0 apresenta uma biblioteca de cliente totalmente redesenhada. Para usar com êxito os recursos mais recentes da API de Document Intelligence, você precisa do SDK mais recente e o código do aplicativo deve ser atualizado para usar os novos clientes.

Esta tabela fornece links para instruções detalhadas para migrar para a versão mais recente do Document Intelligence:

Idioma/API	Guia de migração
API REST	v3
C#/.NET	4.0.0
Java	4.0.0
JavaScript	4.0.0
Python	3.2.0

Question 27

Quais formatos de arquivo são suportados pelo Document Intelligence? Existem limitações de tamanho para documentos de entrada?

Accepted Answer

Para obter os melhores resultados, consulte os requisitos de entrada.

Question 28

Como posso especificar um intervalo de páginas a analisar num documento?

Accepted Answer

Use o pages parâmetro (suportado nas v2.1, v3.0 e versões posteriores da API REST) para especificar páginas para documentos PDF e TIFF de várias páginas. A entrada aceita inclui os seguintes intervalos:

Páginas únicas. Por exemplo, se você especificar 1, 2, as páginas 1 e 2 serão processadas.
Intervalos finitos. Por exemplo, se você especificar 2-5, as páginas 2 a 5 serão processadas.
Intervalos abertos. Por exemplo, se você especificar 5-, todas as páginas da página 5 serão processadas. Se você especificar -10, as páginas 1 a 10 serão processadas.

Você pode misturar esses parâmetros e os intervalos podem se sobrepor. Por exemplo, se você especificar -5, 1, 3, 5-10, as páginas 1 a 10 serão processadas.

O serviço aceita o pedido se puder processar pelo menos uma página do documento. Por exemplo, usar 5-100 em um documento de cinco páginas é uma entrada válida que significa que a página 5 é processada.

Se você não fornecer um intervalo de páginas, todo o documento será processado.

Question 29

O Document Intelligence Studio e a ferramenta FOTT Sample Labeling estão disponíveis. Qual devo usar?

Accepted Answer

Na maioria das vezes, recomendamos o Document Intelligence Studio porque ele pode reduzir seu tempo para configurar recursos e serviços de armazenamento do Document Intelligence.

Considere o uso da ferramenta de teste de OCR de formulário (FOTT) para os seguintes cenários:

Seus dados devem permanecer em uma única máquina. Use a ferramenta FOTT Sample Labeling e um contêiner Document Intelligence.
Seu projeto é altamente dependente do Document Intelligence v2.1 e você deseja continuar usando as APIs v2.1.

Question 30

A versão 2024-02-29-preview da API REST do Document Intelligence está disponível na minha região?

Accepted Answer

A versão 2024-02-29-preview da API REST está disponível nas seguintes regiões:

E.U.A. Leste
E.U.A. Oeste 2
Europa Ocidental

Question 31

Como o Azure calcula o preço para usar o Document Intelligence?

Accepted Answer

O faturamento do Document Intelligence é calculado mensalmente com base no tipo de modelo e no número de páginas analisadas. Aqui estão alguns detalhes:

Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o pages parâmetro em sua solicitação. Quando o serviço analisa documentos do Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, ele conta cada planilha do Excel e slide do PowerPoint como uma página.
Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página sem limites máximos de caracteres.
Quando o serviço analisa arquivos do Microsoft Word e HTML suportados pelos modelos de leitura e layout, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres totalizam três páginas.
Quando você estiver usando o modelo de leitura ou layout para analisar arquivos do Microsoft Word, Excel, PowerPoint e HTML, imagens incorporadas ou vinculadas não são suportadas. Assim, o serviço não as conta como imagens adicionadas.
Treinar um modelo personalizado é sempre gratuito com Document Intelligence. Você será cobrado somente quando o serviço usar um modelo para analisar um documento.
O preço do contêiner é o mesmo que o preço do serviço de nuvem.
O Document Intelligence oferece um nível gratuito (F0) onde você pode testar todos os recursos do Document Intelligence.
A Document Intelligence tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.

Saiba mais sobre as opções de preços do Azure AI Document Intelligence.

Question 32

Como posso verificar a minha utilização de Document Intelligence e estimar o preço?

Accepted Answer

Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure AI Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços do Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo.

Question 33

Quais são as melhores práticas para mitigar a limitação?

Accepted Answer

A Document Intelligence usa o dimensionamento automático para fornecer os recursos computacionais necessários sob demanda, mantendo os custos do cliente baixos. Para reduzir a limitação durante o dimensionamento automático, recomendamos a seguinte abordagem:

Implemente a lógica de repetição na aplicação.
Se você achar que está sendo limitado no número de POST solicitações, considere adicionar um atraso entre as solicitações.
Aumente a carga de trabalho gradualmente. Evite mudanças bruscas.
Crie uma solicitação de suporte para aumentar o limite de transações por segundo (TPS).

Saiba mais sobre as cotas e limites do serviço de Document Intelligence.

Question 34

Quanto tempo demora a análise de um documento?

Accepted Answer

O tempo para analisar um documento depende do tamanho (por exemplo, número de páginas) e dos conteúdos associados em cada página.

O Document Intelligence é um serviço multilocatário onde a latência de documentos semelhantes é comparável, mas nem sempre idêntica. Latência é a quantidade de tempo que um servidor de API leva para lidar e processar uma solicitação de entrada e entregar a resposta de saída para o cliente. A variabilidade ocasional na latência e no desempenho é inerente a qualquer serviço assíncrono, sem monitoração de estado e baseado em microsserviços que processa imagens e documentos grandes em escala.

Embora estejamos continuamente ampliando o hardware e a capacidade e os recursos de dimensionamento, você ainda pode ter problemas de latência em tempo de execução.

Question 35

Como faço para reunir os melhores dados de treinamento?

Accepted Answer

Ao usar o modelo personalizado de Document Intelligence, você fornece seus próprios dados de treinamento. Aqui estão algumas dicas para ajudar a treinar seus modelos de forma eficaz:

Sempre que possível, use PDFs baseados em texto em vez de imagem. Uma maneira de identificar um PDF baseado em imagem é tentar selecionar texto específico no documento. Se você puder selecionar apenas a imagem inteira do texto, o documento será baseado em imagem e não em texto.
Organize seus documentos de treinamento usando uma subpasta para cada formato (JPEG/JPG, PNG, BMP, PDF ou TIFF).
Use formulários que tenham todos os campos disponíveis preenchidos.
Use formulários com valores diferentes em cada campo.
Se as imagens forem de baixa qualidade, use um conjunto de dados maior (mais de cinco documentos de treinamento).

Saiba mais sobre como criar um conjunto de dados de treinamento.

Question 36

Quais são as melhores práticas para treinar um modelo personalizado altamente preciso?

Accepted Answer

O nível de precisão para o seu modelo depende da qualidade dos seus materiais de treinamento. Aqui ficam algumas dicas:

Determine se você precisa usar um único modelo ou vários modelos compostos em um único modelo.
A precisão do modelo pode diminuir quando você tem diferentes formatos analisados com um único modelo. Planeje segmentar seu conjunto de dados em pastas, onde cada pasta é um modelo exclusivo. Treine um modelo por pasta e componha os modelos resultantes em um único ponto de extremidade.
Os formulários personalizados dependem de um modelo visual consistente. Se o formulário tiver variações com formatos e quebras de página, considere segmentar o conjunto de dados para treinar vários modelos.
Certifique-se de ter um conjunto de dados equilibrado contabilizando formatos, tipos de documentos e estrutura.

Saiba mais sobre modelos compostos.

Question 37

Posso treinar novamente um modelo personalizado?

Accepted Answer

O Document Intelligence não tem uma operação explícita de retreinamento. Cada operação de trem gera um novo modelo.

Se você achar que seu modelo precisa de retreinamento, adicione mais amostras ao seu conjunto de dados de treinamento e treine um novo modelo.

Question 38

Quantos modelos personalizados posso compor em um único modelo personalizado?

Accepted Answer

Com a operação Model Compes , você pode atribuir até 200 modelos a um único ID de modelo. Quando você faz a solicitação com um ID de Analyze Document modelo composto, o Document Intelligence classifica o formulário enviado, escolhe o melhor modelo e retorna os resultados. Atualmente, o Model Compose está disponível apenas para modelos personalizados treinados com etiquetas.

Analisar um documento usando modelos compostos é idêntico a analisar um documento usando um único modelo. O Analyze Document resultado retorna uma docType propriedade que indica qual dos modelos de componente você selecionou para analisar o documento. Não há alteração no preço para analisar um documento usando um modelo personalizado individual ou um modelo personalizado composto.

Saiba mais sobre modelos compostos.

Question 39

Se o número de modelos que quero compor exceder o limite superior de um modelo composto, quais são as alternativas?

Accepted Answer

Você pode usar uma destas alternativas:

Classifique os documentos antes de chamar o modelo personalizado. Você pode usar o modelo de leitura e criar uma classificação com base no texto extraído dos documentos e determinadas frases usando fontes como código, expressões regulares ou pesquisa.
Se você quiser extrair os mesmos campos de vários documentos estruturados, semiestruturados e não estruturados, considere usar o modelo neural personalizado de aprendizado profundo. Saiba mais sobre as diferenças entre o modelo de modelo personalizado e o modelo neural personalizado.

Question 40

Como refinar um modelo para além da formação inicial?

Accepted Answer

Cada operação de treinamento gera um novo modelo.

Crie um conjunto de dados para seu novo modelo.
Rotule e treine um novo modelo.
Valide se o novo modelo tem um bom desempenho para seus tipos de documentos específicos.
Componha seu novo modelo com o modelo existente em um único ponto de extremidade. O Document Intelligence pode então determinar o melhor modelo para cada documento a ser analisado.

Saiba mais sobre modelos compostos.

Question 41

Estou construindo um modelo personalizado. O que a etiqueta de deteção de assinatura retorna?

Accepted Answer

A deteção de assinatura procura a presença de uma assinatura, não a identidade da pessoa que assina o documento.

Se o modelo retornar não assinado para deteção de assinatura, o modelo não encontrou uma assinatura no campo definido.

Question 42

O que devo considerar e quais são as melhores práticas para extrair tabelas de documentos?

Accepted Answer

Você pode começar com o modelo de layout do Document Intelligence para extrair textos, tabelas, marcas de seleção e estruturar informações de documentos e imagens. Você também pode considerar os seguintes fatores:

Os dados que você deseja extrair são apresentados como uma tabela e a estrutura da tabela é significativa?
Se os dados não estiverem em um formato de tabela, os dados podem caber em uma grade bidimensional?
As suas tabelas abrangem várias páginas? Em caso afirmativo, para evitar ter que rotular todas as páginas, divida o PDF em páginas antes de enviá-lo para o Document Intelligence. Após a análise, pós-processe as páginas para uma única tabela.
Se estiver a criar modelos personalizados, consulte Etiquetagem como tabelas. As tabelas dinâmicas têm um número variável de linhas para cada coluna. As tabelas fixas têm um número constante de linhas para cada coluna.

Question 43

Como posso mover meus modelos treinados de um ambiente (como beta) para outro (como produção)?

Accepted Answer

Você pode usar a API de cópia para copiar modelos personalizados de uma conta do Document Intelligence para outras que existem em qualquer região geográfica suportada. Para obter instruções detalhadas, consulte Recuperação de desastres.

A operação de cópia é limitada à cópia de modelos dentro do ambiente de nuvem específico onde você treinou o modelo. Por exemplo, não há suporte para copiar modelos da nuvem pública para a nuvem do Azure Government.

Question 44

Por que fui cobrado pelo layout ao executar o treinamento personalizado?

Accepted Answer

O layout é necessário para gerar rótulos para seu conjunto de dados. Se o conjunto de dados que você usa para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você.

Question 45

Consegui aceder à minha conta de armazenamento há alguns dias. Por que agora estou tendo problemas para me reconectar?

Accepted Answer

Quando você cria uma assinatura de acesso compartilhado, a duração padrão é de 48 horas. Após 48 horas, você precisa criar um novo token.

Considere definir um período de duração mais longo para o tempo em que você estiver usando sua conta de armazenamento com o Document Intelligence.

Question 46

Se minha conta de armazenamento estiver atrás de uma rede virtual ou firewall, como faço para dar acesso à Document Intelligence aos dados?

Accepted Answer

Se você tiver uma conta de armazenamento do Azure protegida por uma rede virtual ou firewall, a Document Intelligence não poderá acessar diretamente sua conta de armazenamento. No entanto, o acesso à conta de armazenamento privada do Azure e a autenticação dão suporte a identidades gerenciadas para recursos do Azure. Quando você usa uma identidade gerenciada, o serviço de Inteligência Documental pode acessar sua conta de armazenamento usando uma credencial atribuída.

Se você pretende analisar os dados da sua conta de armazenamento privado usando FOTT, você deve implantar a ferramenta por trás da rede virtual ou firewall.

Saiba como criar e usar uma identidade gerenciada para seu recurso de Document Intelligence.

Se você pretende analisar os dados da sua conta de armazenamento privado usando FOTT, você deve implantar a ferramenta por trás da rede virtual ou firewall.

Saiba como criar e usar uma identidade gerenciada para seu recurso de Document Intelligence.

Question 47

Preciso de uma ligação à Internet para utilizar contentores de Document Intelligence?

Accepted Answer

Sim. Os contêineres do Document Intelligence exigem conectividade com a Internet para enviar informações de cobrança para o Azure. Saiba mais sobre a segurança de contêineres do Azure.

Question 48

Qual é a diferença entre contêineres desconectados e conectados?

Accepted Answer

Os contêineres conectados enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Com contêineres conectados, a conectividade com a Internet é necessária para enviar informações de cobrança para o Azure.

Os contêineres desconectados permitem que você use APIs desconectadas da Internet. As informações de faturação não são enviadas através da Internet. Em vez disso, você será cobrado com base em uma camada de compromisso comprada. Atualmente, o uso de contêiner desconectado está disponível para modelos personalizados e de fatura do Document Intelligence.

Os recursos de modelo fornecidos em contêineres conectados e desconectados são os mesmos e são suportados pelo Document Intelligence v2.1.

Question 49

Quais dados os contêineres conectados enviam para a nuvem?

Accepted Answer

Os contêineres conectados ao Document Intelligence enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Os contêineres conectados não enviam dados do cliente, como a imagem ou o texto que está sendo analisado, para a Microsoft.

Para obter um exemplo das informações que os contêineres conectados enviam à Microsoft para cobrança, consulte as Perguntas frequentes sobre contêineres do Azure AI.

Question 50

Por que estou recebendo o erro "O contêiner não está em um estado válido. A validação da assinatura falhou com o status 'OutOfQuota' API key is out of quota"?

Accepted Answer

Os contêineres conectados ao Document Intelligence enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Você pode receber essa mensagem se os contêineres não puderem se comunicar com o ponto de extremidade de faturamento.

Question 51

Posso usar o armazenamento local para o contêiner DOTT (Document Intelligence Sample Labeling Tool)?

Accepted Answer

O FOTT tem uma versão que usa armazenamento local. A versão precisa ser instalada em uma máquina Windows. Você pode instalá-lo a partir deste local.

Na página do projeto, especifique o URI da pasta de rótulo como /shared ou /shared/sub-dir se os arquivos de rotulagem estiverem em um subdiretório. Todos os outros comportamentos da Document Intelligence Sample Labeling Tool são os mesmos do serviço hospedado.

Question 52

Qual é a melhor prática para aumentar a escala?

Accepted Answer

Para chamadas assíncronas, você pode executar vários contêineres com armazenamento compartilhado. O contêiner que está processando a POST chamada de análise armazena a saída no armazenamento. Em seguida, qualquer outro contêiner pode buscar os resultados do armazenamento e atender as GET chamadas. O ID da solicitação não está vinculado a um contêiner.

Para chamadas síncronas, você pode executar vários contêineres, mas apenas um contêiner atende a uma solicitação. Como é uma chamada de bloqueio, qualquer contêiner do pool pode atender à solicitação e enviar a resposta. Aqui, apenas um contêiner é vinculado a uma solicitação de cada vez, e nenhuma sondagem é necessária.

Question 53

Como posso configurar contêineres com armazenamento compartilhado?

Accepted Answer

Os contêineres usam a propriedade durante a Mounts:Shared inicialização para especificar o armazenamento compartilhado para armazenar os arquivos de processamento. Para ver o uso dessa propriedade, consulte a documentação de contêineres.

Question 54

Quais são os métodos e requisitos para autenticar solicitações para serviços de IA do Azure?

Accepted Answer

Cada solicitação para um serviço do Azure deve incluir um cabeçalho de autenticação. Você pode autenticar uma solicitação usando vários métodos:

Autentique-se com uma chave de serviço único ou de vários serviços .
Autentique-se com o Microsoft Entra ID.
Habilite chaves gerenciadas pelo cliente.
Autorizar identidades gerenciadas.

Question 55

O Document Intelligence armazena meus dados?

Accepted Answer

Para todos os recursos, o Document Intelligence armazena temporariamente dados e resultados no Armazenamento do Azure na mesma região da solicitação. Seus dados são excluídos dentro de 24 horas a partir do momento em que você envia uma solicitação de análise.

Saiba mais sobre dados, privacidade e segurança para Document Intelligence.

Question 56

Como meus modelos personalizados treinados são armazenados e usados no Document Intelligence?

Accepted Answer

As saídas provisórias após análise e rotulagem são armazenadas no mesmo local de Armazenamento do Azure onde você armazena seus dados de treinamento. Os modelos personalizados treinados são armazenados no Armazenamento do Azure na mesma região e são logicamente isolados com sua assinatura do Azure e credenciais de API.

Question 57

Onde posso encontrar mais soluções para minhas perguntas sobre o Azure AI Document Intelligence?

Accepted Answer

As Perguntas e Respostas da Microsoft são a casa para perguntas e respostas técnicas na Microsoft. Você pode filtrar consultas específicas do Document Intelligence.

Question 58

O que devo fazer se o serviço não reconhecer um texto específico, ou reconhecê-lo incorretamente, quando estou rotulando documentos?

Accepted Answer

Atualizamos e melhoramos continuamente o modelo de OCR de Inteligência Documental. Você pode enviar um e-mail para a equipe de Document Intelligence. Se possível, compartilhe um documento de exemplo com o problema realçado.

Share via

Perguntas frequentes sobre o Azure AI Document Intelligence

Conceitos gerais

O que é o Azure AI Document Intelligence e o que aconteceu com o Azure AI Form Recognizer?

Como a Inteligência Documental está relacionada à IA generativa de documentos?

Como a Inteligência Documental está relacionada à geração aumentada de recuperação?

Que casos de uso de Inteligência Documental requerem consideração especial?

Que idiomas são suportados pelo Document Intelligence?

O Document Intelligence está disponível na minha região do Azure?

O Document Intelligence integra-se com outros serviços da Microsoft?

Como a Inteligência Documental está relacionada ao reconhecimento ótico de caracteres?

Por quanto tempo meu modelo personalizado está disponível para uso?

O que é a pontuação de precisão e como é calculada?

Como posso melhorar as pontuações de precisão?

O que é o índice de confiança e como é calculado?

Como posso melhorar as pontuações de confiança?

O que é uma caixa delimitadora?

O Document Intelligence pode me ajudar a classificar documentos?

Estúdio de Inteligência de Documentação

De que permissões necessito para aceder ao Document Intelligence Studio?

Tenho várias páginas num documento. Por que apenas duas páginas são analisadas no Document Intelligence Studio?

Como posso alterar diretórios ou assinaturas no Document Intelligence Studio?

Por que estou recebendo um erro de armazenamento em uma operação de compartilhamento de projeto, rotulagem automática ou atualização de OCR quando meu recurso de conta de armazenamento está configurado com um firewall ou rede virtual?

Por que estou recebendo o erro "Acesso negado devido a regras de Rede Virtual/Firewall" em uma operação de atualização automática de rotulagem ou OCR quando meu recurso de Document Intelligence está configurado com um firewall ou rede virtual?

Posso reutilizar ou personalizar a experiência de etiquetagem do Document Intelligence Studio e criá-la em meu próprio aplicativo?

Por que estou recebendo o erro "Form Recognizer Not Found" ao abrir meu projeto personalizado?

Existem pontos de extremidade de URL separados para regiões de nuvem soberana de Inteligência Documental?

Desenvolvimento de aplicações

Quais são as opções de desenvolvimento para Document Intelligence?

Onde posso encontrar a versão da API suportada para os SDKs de linguagem de programação mais recentes?

Qual é a diferença entre o Document Intelligence v3.0 e v2.1 e como faço para migrar para a versão mais recente?

Quais formatos de arquivo são suportados pelo Document Intelligence? Existem limitações de tamanho para documentos de entrada?

Como posso especificar um intervalo de páginas a analisar num documento?

O Document Intelligence Studio e a ferramenta FOTT Sample Labeling estão disponíveis. Qual devo usar?

Limites de serviço e preços

A versão 2024-02-29-preview da API REST do Document Intelligence está disponível na minha região?

Como o Azure calcula o preço para usar o Document Intelligence?

Como posso verificar a minha utilização de Document Intelligence e estimar o preço?

Quais são as melhores práticas para mitigar a limitação?

Quanto tempo demora a análise de um documento?

Modelos personalizados

Como faço para reunir os melhores dados de treinamento?

Quais são as melhores práticas para treinar um modelo personalizado altamente preciso?

Posso treinar novamente um modelo personalizado?

Quantos modelos personalizados posso compor em um único modelo personalizado?

Se o número de modelos que quero compor exceder o limite superior de um modelo composto, quais são as alternativas?

Como refinar um modelo para além da formação inicial?

Estou construindo um modelo personalizado. O que a etiqueta de deteção de assinatura retorna?

O que devo considerar e quais são as melhores práticas para extrair tabelas de documentos?

Como posso mover meus modelos treinados de um ambiente (como beta) para outro (como produção)?

Por que fui cobrado pelo layout ao executar o treinamento personalizado?

Conta de armazenamento

Consegui aceder à minha conta de armazenamento há alguns dias. Por que agora estou tendo problemas para me reconectar?

Se minha conta de armazenamento estiver atrás de uma rede virtual ou firewall, como faço para dar acesso à Document Intelligence aos dados?

Contentores

Preciso de uma ligação à Internet para utilizar contentores de Document Intelligence?

Qual é a diferença entre contêineres desconectados e conectados?

Quais dados os contêineres conectados enviam para a nuvem?

Por que estou recebendo o erro "O contêiner não está em um estado válido. A validação da assinatura falhou com o status 'OutOfQuota' API key is out of quota"?

Posso usar o armazenamento local para o contêiner DOTT (Document Intelligence Sample Labeling Tool)?

Qual é a melhor prática para aumentar a escala?

Como posso configurar contêineres com armazenamento compartilhado?

Segurança e privacidade

Quais são os métodos e requisitos para autenticar solicitações para serviços de IA do Azure?

O Document Intelligence armazena meus dados?

Como meus modelos personalizados treinados são armazenados e usados no Document Intelligence?

Mais ajuda e suporte

Onde posso encontrar mais soluções para minhas perguntas sobre o Azure AI Document Intelligence?

O que devo fazer se o serviço não reconhecer um texto específico, ou reconhecê-lo incorretamente, quando estou rotulando documentos?

Comentários

Recursos adicionais