Editar

Share via


Perguntas frequentes sobre o Azure AI Document Intelligence

Este conteúdo aplica-se a:marca de verificaçãov4.0 (preview)marca de verificaçãov3.1 (GA)marca de verificaçãov3.0 (GA)marca de verificaçãov2.1 (GA)

Conceitos gerais

O que é o Azure AI Document Intelligence e o que aconteceu com o Azure AI Form Recognizer?

O Azure AI Document Intelligence é um serviço baseado na nuvem que utiliza modelos de aprendizagem automática para extrair pares chave/valor, texto e tabelas dos seus documentos. O resultado retornado é uma saída JSON estruturada. Os casos de uso do Document Intelligence incluem processamento automatizado de dados, estratégias aprimoradas orientadas por dados e recursos enriquecidos de pesquisa de documentos.

A Inteligência de Documentos faz parte dos serviços de IA do Azure. Os serviços de IA do Azure abrangem todos os que eram anteriormente conhecidos como Serviços Cognitivos do Azure e Serviços de IA Aplicada do Azure.

O nome anterior para Document Intelligence era Azure AI Form Recognizer. O Form Recognizer tornou-se oficialmente Document Intelligence em julho de 2023.

Não há alterações nos preços. Os nomes Serviços Cognitivos e Serviços de IA Aplicada continuam a ser usados na faturação do Azure, na análise de custos, nas listas de preços e nas APIs de preços.

Não há alterações significativas em APIs ou bibliotecas de cliente (SDKs). As APIs REST e as versões SDK 2024-02-29-preview, 2023-10-31-preview e posteriores são renomeadas document intelligence.

Algumas plataformas ainda aguardam a atualização de renomeação. Na documentação da Microsoft, todas as menções ao Form Recognizer e ao Document Intelligence referem-se ao mesmo serviço do Azure.

Como a Inteligência Documental está relacionada à IA generativa de documentos?

Você pode usar uma solução de IA generativa de documentos para conversar com seus documentos, gerar conteúdo cativante a partir desses documentos e acessar modelos do Serviço OpenAI do Azure em seus dados. Com o Azure AI Document Intelligence e o Azure OpenAI combinados, pode criar uma aplicação empresarial para interagir perfeitamente com os seus documentos utilizando linguagens naturais, encontrar facilmente respostas e obter informações valiosas e gerar conteúdo novo e envolvente a partir dos seus documentos existentes. Encontre mais detalhes no blog da comunidade técnica.

Como a Inteligência Documental está relacionada à geração aumentada de recuperação?

A fragmentação semântica é uma etapa fundamental na geração aumentada de recuperação (RAG) para garantir seu armazenamento e recuperação eficientes. O modelo de layout Document Intelligence oferece uma solução abrangente para os recursos de extração avançada de conteúdo e análise da estrutura do documento.

Com o modelo de layout, você pode extrair facilmente texto e elementos estruturais para dividir grandes corpos de texto em partes menores e significativas com base em conteúdo semântico, em vez de divisões arbitrárias. Em seguida, você pode exportar convenientemente as informações extraídas para o formato Markdown, para que possa definir sua estratégia de fragmentação semântica com base nos blocos de construção fornecidos. Encontre mais detalhes na visão geral do RAG em Document Intelligence.

Que casos de uso de Inteligência Documental requerem consideração especial?

Dê uma consideração cuidadosa aos projetos de processamento de documentos que abrangem dados financeiros, dados de saúde protegidos, dados pessoais ou dados altamente sensíveis.

Certifique-se de cumprir todos os requisitos nacionais/regionais e específicos do setor.

Que idiomas são suportados pelo Document Intelligence?

Os modelos universais baseados em aprendizagem profunda em Document Intelligence suportam muitas linguagens que podem extrair texto multilíngue de suas imagens e documentos, incluindo linhas de texto com idiomas mistos.

O suporte a idiomas varia de acordo com a funcionalidade do serviço Document Intelligence. Para obter uma lista completa do texto manuscrito e impresso suportado pelo Document Intelligence, consulte Suporte a idiomas.

O Document Intelligence está disponível na minha região do Azure?

O Document Intelligence está geralmente disponível em muitas das 60+ regiões de infraestrutura global do Azure.

Escolha a região que é melhor para si e para os seus clientes.

O Document Intelligence integra-se com outros serviços da Microsoft?

"Sim, o Document Intelligence integra-se com os seguintes serviços:"

Como a Inteligência Documental está relacionada ao reconhecimento ótico de caracteres?

O Document Intelligence é um serviço baseado na nuvem que incorpora reconhecimento ótico de carateres (OCR), análise de texto e classificação de texto personalizada dos serviços de IA do Azure.

O Document Intelligence usa OCR para detetar e extrair informações de documentos de texto tipográficos e manuscritos suportados por IA para fornecer mais estrutura e informações para a extração de texto.

Por quanto tempo meu modelo personalizado está disponível para uso?

Um modelo tem o mesmo ciclo de vida que a versão da API que você usa para treiná-lo. Os modelos personalizados treinados com uma versão de disponibilidade geral (GA) da API têm o mesmo ciclo de vida que a versão da API. Quando a versão da API é preterida, o modelo não está mais disponível para inferência. Os modelos treinados com uma versão de visualização da API também têm o mesmo ciclo de vida que a API de visualização.

Espere a descontinuação da API de visualização dentro de três meses após uma versão atualizada da API de visualização ou uma versão mais recente da API do GA.

O que é a pontuação de precisão e como é calculada?

A saída de uma build operação de modelo personalizado (v3.0 e versões posteriores) ou train (v2.1) inclui a pontuação de precisão estimada. Essa pontuação representa a capacidade do modelo de prever com precisão o valor rotulado em um documento visualmente semelhante.

A precisão é medida dentro de um intervalo de valores percentuais de 0% (baixo) a 100% (alto).

Para obter mais informações, consulte Pontuações de precisão e confiança.

Como posso melhorar as pontuações de precisão?

Variações na estrutura visual de seus documentos podem influenciar a precisão de um modelo. Aqui ficam algumas dicas:

  • Inclua todas as variações de um documento no conjunto de dados de treinamento. As variações incluem diferentes formatos; por exemplo, PDFs digitais versus digitalizados.

  • Separe tipos de documentos visualmente distintos e treine modelos diferentes.

  • Certifique-se de que não tem rótulos estranhos.

  • Não inclua o texto circundante para etiquetagem da assinatura e região.

Para obter mais informações, consulte Pontuações de precisão e confiança.

O que é o índice de confiança e como é calculado?

Um escore de confiança indica probabilidade medindo o grau de certeza estatística de que o resultado extraído é detetado corretamente.

O intervalo do valor de confiança é uma percentagem de 0% (baixo) a 100% (alto). É melhor atingir uma pontuação de 80% ou mais. Para casos mais sensíveis, como prontuários financeiros ou médicos, recomendamos uma pontuação próxima de 100%. Você também pode exigir revisão humana.

Para obter mais informações, consulte Pontuações de precisão e confiança.

Como posso melhorar as pontuações de confiança?

Após uma operação de análise, revise a saída JSON. Examine os confidence valores para cada resultado de chave/valor no pageResults nó. Você também deve olhar para a pontuação de confiança no readResults nó, que corresponde à operação de leitura de texto. A confiança dos resultados lidos não afeta a confiança dos resultados de extração de chave/valor, portanto, você deve verificar ambos. Aqui ficam algumas dicas:

  • Se a pontuação de confiança do readResults objeto for baixa, melhore a qualidade dos documentos de entrada.

  • Se a pontuação de confiança para o pageResults objeto for baixa, certifique-se de que os documentos que você está analisando são do mesmo tipo.

  • Considere incorporar a revisão humana em seus fluxos de trabalho.

  • Use formulários com valores diferentes em cada campo.

  • Para modelos personalizados, use um conjunto maior de documentos de treinamento. Marcar mais documentos ensina seu modelo a reconhecer campos com maior precisão.

Para obter mais informações, consulte Pontuações de precisão e confiança.

O que é uma caixa delimitadora?

Uma caixa delimitadora (polygon na v3.0 e versões posteriores) é um retângulo abstrato que envolve elementos de texto em um documento ou formulário. Ele é usado como um ponto de referência para deteção de objetos.

A caixa delimitadora especifica a posição usando um plano de coordenadas x e y apresentado em uma matriz de quatro pares numéricos. Cada par representa um canto da caixa na seguinte ordem: superior esquerdo, superior direito, inferior direito, inferior direito, inferior esquerdo.

Para uma imagem, as coordenadas estão em pixels. Para um PDF, as coordenadas estão em polegadas.

O Document Intelligence pode me ajudar a classificar documentos?

O Document Intelligence fornece modelos de classificação personalizados que podem analisar documentos de arquivo único ou múltiplo para identificar se um arquivo de entrada contém algum dos tipos de documentos treinados. O serviço suporta os seguintes cenários:

  • Um único arquivo que contém um tipo de documento, como um formulário de solicitação de empréstimo.

  • Um único arquivo que contém vários documentos. Um exemplo é um pacote de pedido de empréstimo que contém um formulário de pedido de empréstimo, boleto de pagamento e extrato bancário.

  • Um único arquivo que contém várias instâncias do mesmo documento. Um exemplo é uma coleção de faturas digitalizadas.

Para obter mais informações, consulte a visão geral dos modelos de classificação personalizados.

Estúdio de Inteligência de Documentação

De que permissões necessito para aceder ao Document Intelligence Studio?

Você precisa de uma conta ativa do Azure e uma assinatura com pelo menos uma função de Leitor para acessar o Document Intelligence Studio.

Para análise de documentos e modelos pré-construídos, aqui estão os requisitos de função para cenários de usuário:

  • Básica

  • Avançado

    • Colaborador: você precisa dessa função para criar um grupo de recursos ou um recurso de Inteligência Documental. A função de Colaborador não permite listar chaves para Serviços Cognitivos e não lhe dá acesso para usar os recursos ou armazenamento criados, apenas permite que um usuário leia/grave o próprio recurso. Para usar o Document Intelligence Studio, você ainda precisa da função Usuário dos Serviços Cognitivos.

Para projetos de modelo personalizado, aqui estão os requisitos de função para cenários de usuário:

  • Básica

    • Usuário de Serviços Cognitivos: você precisa dessa função para um recurso de vários serviços de Inteligência Documental ou Serviços Cognitivos para ler/gravar dados e é necessário chamar a API. Esta função também é o mínimo necessário para treinar um modelo personalizado ou analisar com modelos treinados.

    • Contribuidor de dados de Blob de armazenamento: você precisa dessa função para uma conta de armazenamento para criar dados de projeto e rotulagem.

  • Avançado

    • Colaborador da conta de armazenamento: você precisa dessa função para que a conta de armazenamento configure as configurações de compartilhamento de recursos entre origens (CORS). É um esforço único se você reutilizar a mesma conta de armazenamento.

      A função de Colaborador não permite que você acesse dados em seu blob. Para usar o Document Intelligence Studio, você ainda precisa da função de Colaborador de Dados de Blob de Armazenamento.

    • Colaborador: você precisa dessa função para criar um grupo de recursos e recursos. A função de Colaborador não lhe dá acesso para usar os recursos ou armazenamento criados, apenas permite que um usuário leia/grave o próprio recurso. Para usar o Document Intelligence Studio, você ainda precisa de funções básicas.

Para obter mais informações, consulte Funções internas do Microsoft Entra e as seções sobre atribuições de função do Azure no Guia de início rápido do Document Intelligence Studio.

Tenho várias páginas num documento. Por que apenas duas páginas são analisadas no Document Intelligence Studio?

Para recursos de camada livre (F0), apenas as duas primeiras páginas são analisadas se você estiver usando o Document Intelligence Studio, a API REST ou SDKs.

No Document Intelligence Studio, selecione o botão Configurações (engrenagem), selecione a guia Recursos e verifique a faixa de preço que você está usando para analisar os documentos. Se quiser analisar todas as páginas de um documento, mude para um recurso pago (S0).

Como posso alterar diretórios ou assinaturas no Document Intelligence Studio?

Para alterar um diretório no Document Intelligence Studio, selecione o botão Configurações (engrenagem). Em Diretório, selecione o diretório na lista e, em seguida, selecione Alternar diretório. Você será solicitado a entrar novamente depois de alternar o diretório.

Para alterar uma subscrição ou recurso, aceda ao separador Recurso em Definições.

Por que estou recebendo um erro de armazenamento em uma operação de compartilhamento de projeto, rotulagem automática ou atualização de OCR quando meu recurso de conta de armazenamento está configurado com um firewall ou rede virtual?

Consulte Identidades gerenciadas para Document Intelligence para configurar seus recursos do Azure.

Por que estou recebendo o erro "Acesso negado devido a regras de Rede Virtual/Firewall" em uma operação de atualização automática de rotulagem ou OCR quando meu recurso de Document Intelligence está configurado com um firewall ou rede virtual?

Você precisa adicionar o endereço IP dedicado 20.3.165.95 à lista de permissões do firewall para seu recurso de Document Intelligence.

Posso reutilizar ou personalizar a experiência de etiquetagem do Document Intelligence Studio e criá-la em meu próprio aplicativo?

Sim. A experiência de rotulagem do Document Intelligence Studio é de código aberto no repositório do Toolkit.

Por que estou recebendo o erro "Form Recognizer Not Found" ao abrir meu projeto personalizado?

Seu recurso de Document Intelligence vinculado a este projeto personalizado foi excluído ou movido para outro grupo de recursos. Há duas maneiras de resolver esse problema:

  • Recrie o recurso Document Intelligence sob a mesma assinatura e grupo de recursos com o mesmo nome.

  • Recrie um projeto personalizado com o recurso Document Intelligence migrado e especifique a mesma conta de armazenamento.

Existem pontos de extremidade de URL separados para regiões de nuvem soberana de Inteligência Documental?

"Sim. O Document Intelligence Studio tem pontos de extremidade de URL separados para regiões de nuvem soberana:"

Desenvolvimento de aplicações

Quais são as opções de desenvolvimento para Document Intelligence?

A Document Intelligence oferece as mais recentes opções de desenvolvimento nas seguintes plataformas:

Onde posso encontrar a versão da API suportada para os SDKs de linguagem de programação mais recentes?

Esta tabela fornece links para as versões mais recentes do SDK e mostra a relação entre as versões suportadas do SDK do Document Intelligence e da API:

Referência do SDK do Azure no idioma suportado Versões de API suportadas
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-pré-visualização
v3.0 v2.1
v2.0

Para obter mais informações, consulte Clientes suportados para v4.0 e Clientes suportados para v3.1.

Qual é a diferença entre o Document Intelligence v3.0 e v2.1 e como faço para migrar para a versão mais recente?

Para melhorar a usabilidade, o Document Intelligence v3.0 apresenta uma biblioteca de cliente totalmente redesenhada. Para usar com êxito os recursos mais recentes da API de Document Intelligence, você precisa do SDK mais recente e o código do aplicativo deve ser atualizado para usar os novos clientes.

Esta tabela fornece links para instruções detalhadas para migrar para a versão mais recente do Document Intelligence:

Idioma/API Guia de migração
API REST v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Quais formatos de arquivo são suportados pelo Document Intelligence? Existem limitações de tamanho para documentos de entrada?

Para obter os melhores resultados, consulte os requisitos de entrada.

Como posso especificar um intervalo de páginas a analisar num documento?

Use o pages parâmetro (suportado nas v2.1, v3.0 e versões posteriores da API REST) para especificar páginas para documentos PDF e TIFF de várias páginas. A entrada aceita inclui os seguintes intervalos:

  • Páginas únicas. Por exemplo, se você especificar 1, 2, as páginas 1 e 2 serão processadas.
  • Intervalos finitos. Por exemplo, se você especificar 2-5, as páginas 2 a 5 serão processadas.
  • Intervalos abertos. Por exemplo, se você especificar 5-, todas as páginas da página 5 serão processadas. Se você especificar -10, as páginas 1 a 10 serão processadas.

Você pode misturar esses parâmetros e os intervalos podem se sobrepor. Por exemplo, se você especificar -5, 1, 3, 5-10, as páginas 1 a 10 serão processadas.

O serviço aceita o pedido se puder processar pelo menos uma página do documento. Por exemplo, usar 5-100 em um documento de cinco páginas é uma entrada válida que significa que a página 5 é processada.

Se você não fornecer um intervalo de páginas, todo o documento será processado.

O Document Intelligence Studio e a ferramenta FOTT Sample Labeling estão disponíveis. Qual devo usar?

Na maioria das vezes, recomendamos o Document Intelligence Studio porque ele pode reduzir seu tempo para configurar recursos e serviços de armazenamento do Document Intelligence.

Considere o uso da ferramenta de teste de OCR de formulário (FOTT) para os seguintes cenários:

  • Seus dados devem permanecer em uma única máquina. Use a ferramenta FOTT Sample Labeling e um contêiner Document Intelligence.

  • Seu projeto é altamente dependente do Document Intelligence v2.1 e você deseja continuar usando as APIs v2.1.

Limites de serviço e preços

A versão 2024-02-29-preview da API REST do Document Intelligence está disponível na minha região?

A versão 2024-02-29-preview da API REST está disponível nas seguintes regiões:

  • E.U.A. Leste
  • E.U.A. Oeste 2
  • Europa Ocidental

Como o Azure calcula o preço para usar o Document Intelligence?

O faturamento do Document Intelligence é calculado mensalmente com base no tipo de modelo e no número de páginas analisadas. Aqui estão alguns detalhes:

  • Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o pages parâmetro em sua solicitação. Quando o serviço analisa documentos do Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, ele conta cada planilha do Excel e slide do PowerPoint como uma página.

  • Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página sem limites máximos de caracteres.

  • Quando o serviço analisa arquivos do Microsoft Word e HTML suportados pelos modelos de leitura e layout, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres totalizam três páginas.

  • Quando você estiver usando o modelo de leitura ou layout para analisar arquivos do Microsoft Word, Excel, PowerPoint e HTML, imagens incorporadas ou vinculadas não são suportadas. Assim, o serviço não as conta como imagens adicionadas.

  • Treinar um modelo personalizado é sempre gratuito com Document Intelligence. Você será cobrado somente quando o serviço usar um modelo para analisar um documento.

  • O preço do contêiner é o mesmo que o preço do serviço de nuvem.

  • O Document Intelligence oferece um nível gratuito (F0) onde você pode testar todos os recursos do Document Intelligence.

  • A Document Intelligence tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.

Saiba mais sobre as opções de preços do Azure AI Document Intelligence.

Como posso verificar a minha utilização de Document Intelligence e estimar o preço?

Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure AI Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços do Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo.

Quais são as melhores práticas para mitigar a limitação?

A Document Intelligence usa o dimensionamento automático para fornecer os recursos computacionais necessários sob demanda, mantendo os custos do cliente baixos. Para reduzir a limitação durante o dimensionamento automático, recomendamos a seguinte abordagem:

  • Implemente a lógica de repetição na aplicação.

  • Se você achar que está sendo limitado no número de POST solicitações, considere adicionar um atraso entre as solicitações.

  • Aumente a carga de trabalho gradualmente. Evite mudanças bruscas.

  • Crie uma solicitação de suporte para aumentar o limite de transações por segundo (TPS).

Saiba mais sobre as cotas e limites do serviço de Document Intelligence.

Quanto tempo demora a análise de um documento?

O tempo para analisar um documento depende do tamanho (por exemplo, número de páginas) e dos conteúdos associados em cada página.

O Document Intelligence é um serviço multilocatário onde a latência de documentos semelhantes é comparável, mas nem sempre idêntica. Latência é a quantidade de tempo que um servidor de API leva para lidar e processar uma solicitação de entrada e entregar a resposta de saída para o cliente. A variabilidade ocasional na latência e no desempenho é inerente a qualquer serviço assíncrono, sem monitoração de estado e baseado em microsserviços que processa imagens e documentos grandes em escala.

Embora estejamos continuamente ampliando o hardware e a capacidade e os recursos de dimensionamento, você ainda pode ter problemas de latência em tempo de execução.

Modelos personalizados

Como faço para reunir os melhores dados de treinamento?

Ao usar o modelo personalizado de Document Intelligence, você fornece seus próprios dados de treinamento. Aqui estão algumas dicas para ajudar a treinar seus modelos de forma eficaz:

  • Sempre que possível, use PDFs baseados em texto em vez de imagem. Uma maneira de identificar um PDF baseado em imagem é tentar selecionar texto específico no documento. Se você puder selecionar apenas a imagem inteira do texto, o documento será baseado em imagem e não em texto.

  • Organize seus documentos de treinamento usando uma subpasta para cada formato (JPEG/JPG, PNG, BMP, PDF ou TIFF).

  • Use formulários que tenham todos os campos disponíveis preenchidos.

  • Use formulários com valores diferentes em cada campo.

  • Se as imagens forem de baixa qualidade, use um conjunto de dados maior (mais de cinco documentos de treinamento).

Saiba mais sobre como criar um conjunto de dados de treinamento.

Quais são as melhores práticas para treinar um modelo personalizado altamente preciso?

O nível de precisão para o seu modelo depende da qualidade dos seus materiais de treinamento. Aqui ficam algumas dicas:

  • Determine se você precisa usar um único modelo ou vários modelos compostos em um único modelo.

  • A precisão do modelo pode diminuir quando você tem diferentes formatos analisados com um único modelo. Planeje segmentar seu conjunto de dados em pastas, onde cada pasta é um modelo exclusivo. Treine um modelo por pasta e componha os modelos resultantes em um único ponto de extremidade.

  • Os formulários personalizados dependem de um modelo visual consistente. Se o formulário tiver variações com formatos e quebras de página, considere segmentar o conjunto de dados para treinar vários modelos.

  • Certifique-se de ter um conjunto de dados equilibrado contabilizando formatos, tipos de documentos e estrutura.

Saiba mais sobre modelos compostos.

Posso treinar novamente um modelo personalizado?

O Document Intelligence não tem uma operação explícita de retreinamento. Cada operação de trem gera um novo modelo.

Se você achar que seu modelo precisa de retreinamento, adicione mais amostras ao seu conjunto de dados de treinamento e treine um novo modelo.

Quantos modelos personalizados posso compor em um único modelo personalizado?

Com a operação Model Compes , você pode atribuir até 200 modelos a um único ID de modelo. Quando você faz a solicitação com um ID de Analyze Document modelo composto, o Document Intelligence classifica o formulário enviado, escolhe o melhor modelo e retorna os resultados. Atualmente, o Model Compose está disponível apenas para modelos personalizados treinados com etiquetas.

Analisar um documento usando modelos compostos é idêntico a analisar um documento usando um único modelo. O Analyze Document resultado retorna uma docType propriedade que indica qual dos modelos de componente você selecionou para analisar o documento. Não há alteração no preço para analisar um documento usando um modelo personalizado individual ou um modelo personalizado composto.

Saiba mais sobre modelos compostos.

Se o número de modelos que quero compor exceder o limite superior de um modelo composto, quais são as alternativas?

Você pode usar uma destas alternativas:

  • Classifique os documentos antes de chamar o modelo personalizado. Você pode usar o modelo de leitura e criar uma classificação com base no texto extraído dos documentos e determinadas frases usando fontes como código, expressões regulares ou pesquisa.

  • Se você quiser extrair os mesmos campos de vários documentos estruturados, semiestruturados e não estruturados, considere usar o modelo neural personalizado de aprendizado profundo. Saiba mais sobre as diferenças entre o modelo de modelo personalizado e o modelo neural personalizado.

Como refinar um modelo para além da formação inicial?

Cada operação de treinamento gera um novo modelo.

  1. Crie um conjunto de dados para seu novo modelo.

  2. Rotule e treine um novo modelo.

  3. Valide se o novo modelo tem um bom desempenho para seus tipos de documentos específicos.

  4. Componha seu novo modelo com o modelo existente em um único ponto de extremidade. O Document Intelligence pode então determinar o melhor modelo para cada documento a ser analisado.

Saiba mais sobre modelos compostos.

Estou construindo um modelo personalizado. O que a etiqueta de deteção de assinatura retorna?

A deteção de assinatura procura a presença de uma assinatura, não a identidade da pessoa que assina o documento.

Se o modelo retornar não assinado para deteção de assinatura, o modelo não encontrou uma assinatura no campo definido.

O que devo considerar e quais são as melhores práticas para extrair tabelas de documentos?

Você pode começar com o modelo de layout do Document Intelligence para extrair textos, tabelas, marcas de seleção e estruturar informações de documentos e imagens. Você também pode considerar os seguintes fatores:

  • Os dados que você deseja extrair são apresentados como uma tabela e a estrutura da tabela é significativa?

  • Se os dados não estiverem em um formato de tabela, os dados podem caber em uma grade bidimensional?

  • As suas tabelas abrangem várias páginas? Em caso afirmativo, para evitar ter que rotular todas as páginas, divida o PDF em páginas antes de enviá-lo para o Document Intelligence. Após a análise, pós-processe as páginas para uma única tabela.

  • Se estiver a criar modelos personalizados, consulte Etiquetagem como tabelas. As tabelas dinâmicas têm um número variável de linhas para cada coluna. As tabelas fixas têm um número constante de linhas para cada coluna.

Como posso mover meus modelos treinados de um ambiente (como beta) para outro (como produção)?

Você pode usar a API de cópia para copiar modelos personalizados de uma conta do Document Intelligence para outras que existem em qualquer região geográfica suportada. Para obter instruções detalhadas, consulte Recuperação de desastres.

A operação de cópia é limitada à cópia de modelos dentro do ambiente de nuvem específico onde você treinou o modelo. Por exemplo, não há suporte para copiar modelos da nuvem pública para a nuvem do Azure Government.

Por que fui cobrado pelo layout ao executar o treinamento personalizado?

O layout é necessário para gerar rótulos para seu conjunto de dados. Se o conjunto de dados que você usa para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você.

Conta de armazenamento

Consegui aceder à minha conta de armazenamento há alguns dias. Por que agora estou tendo problemas para me reconectar?

Quando você cria uma assinatura de acesso compartilhado, a duração padrão é de 48 horas. Após 48 horas, você precisa criar um novo token.

Considere definir um período de duração mais longo para o tempo em que você estiver usando sua conta de armazenamento com o Document Intelligence.

Se minha conta de armazenamento estiver atrás de uma rede virtual ou firewall, como faço para dar acesso à Document Intelligence aos dados?

Se você tiver uma conta de armazenamento do Azure protegida por uma rede virtual ou firewall, a Document Intelligence não poderá acessar diretamente sua conta de armazenamento. No entanto, o acesso à conta de armazenamento privada do Azure e a autenticação dão suporte a identidades gerenciadas para recursos do Azure. Quando você usa uma identidade gerenciada, o serviço de Inteligência Documental pode acessar sua conta de armazenamento usando uma credencial atribuída.

Se você pretende analisar os dados da sua conta de armazenamento privado usando FOTT, você deve implantar a ferramenta por trás da rede virtual ou firewall.

Saiba como criar e usar uma identidade gerenciada para seu recurso de Document Intelligence.

Contentores

Preciso de uma ligação à Internet para utilizar contentores de Document Intelligence?

Sim. Os contêineres do Document Intelligence exigem conectividade com a Internet para enviar informações de cobrança para o Azure. Saiba mais sobre a segurança de contêineres do Azure.

Qual é a diferença entre contêineres desconectados e conectados?

Os contêineres conectados enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Com contêineres conectados, a conectividade com a Internet é necessária para enviar informações de cobrança para o Azure.

Os contêineres desconectados permitem que você use APIs desconectadas da Internet. As informações de faturação não são enviadas através da Internet. Em vez disso, você será cobrado com base em uma camada de compromisso comprada. Atualmente, o uso de contêiner desconectado está disponível para modelos personalizados e de fatura do Document Intelligence.

Os recursos de modelo fornecidos em contêineres conectados e desconectados são os mesmos e são suportados pelo Document Intelligence v2.1.

Quais dados os contêineres conectados enviam para a nuvem?

Os contêineres conectados ao Document Intelligence enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Os contêineres conectados não enviam dados do cliente, como a imagem ou o texto que está sendo analisado, para a Microsoft.

Para obter um exemplo das informações que os contêineres conectados enviam à Microsoft para cobrança, consulte as Perguntas frequentes sobre contêineres do Azure AI.

Por que estou recebendo o erro "O contêiner não está em um estado válido. A validação da assinatura falhou com o status 'OutOfQuota' API key is out of quota"?

Os contêineres conectados ao Document Intelligence enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Você pode receber essa mensagem se os contêineres não puderem se comunicar com o ponto de extremidade de faturamento.

Posso usar o armazenamento local para o contêiner DOTT (Document Intelligence Sample Labeling Tool)?

O FOTT tem uma versão que usa armazenamento local. A versão precisa ser instalada em uma máquina Windows. Você pode instalá-lo a partir deste local.

Na página do projeto, especifique o URI da pasta de rótulo como /shared ou /shared/sub-dir se os arquivos de rotulagem estiverem em um subdiretório. Todos os outros comportamentos da Document Intelligence Sample Labeling Tool são os mesmos do serviço hospedado.

Qual é a melhor prática para aumentar a escala?

Para chamadas assíncronas, você pode executar vários contêineres com armazenamento compartilhado. O contêiner que está processando a POST chamada de análise armazena a saída no armazenamento. Em seguida, qualquer outro contêiner pode buscar os resultados do armazenamento e atender as GET chamadas. O ID da solicitação não está vinculado a um contêiner.

Para chamadas síncronas, você pode executar vários contêineres, mas apenas um contêiner atende a uma solicitação. Como é uma chamada de bloqueio, qualquer contêiner do pool pode atender à solicitação e enviar a resposta. Aqui, apenas um contêiner é vinculado a uma solicitação de cada vez, e nenhuma sondagem é necessária.

Como posso configurar contêineres com armazenamento compartilhado?

Os contêineres usam a propriedade durante a Mounts:Shared inicialização para especificar o armazenamento compartilhado para armazenar os arquivos de processamento. Para ver o uso dessa propriedade, consulte a documentação de contêineres.

Segurança e privacidade

Quais são os métodos e requisitos para autenticar solicitações para serviços de IA do Azure?

Cada solicitação para um serviço do Azure deve incluir um cabeçalho de autenticação. Você pode autenticar uma solicitação usando vários métodos:

O Document Intelligence armazena meus dados?

Para todos os recursos, o Document Intelligence armazena temporariamente dados e resultados no Armazenamento do Azure na mesma região da solicitação. Seus dados são excluídos dentro de 24 horas a partir do momento em que você envia uma solicitação de análise.

Saiba mais sobre dados, privacidade e segurança para Document Intelligence.

Como meus modelos personalizados treinados são armazenados e usados no Document Intelligence?

As saídas provisórias após análise e rotulagem são armazenadas no mesmo local de Armazenamento do Azure onde você armazena seus dados de treinamento. Os modelos personalizados treinados são armazenados no Armazenamento do Azure na mesma região e são logicamente isolados com sua assinatura do Azure e credenciais de API.

Mais ajuda e suporte

Onde posso encontrar mais soluções para minhas perguntas sobre o Azure AI Document Intelligence?

As Perguntas e Respostas da Microsoft são a casa para perguntas e respostas técnicas na Microsoft. Você pode filtrar consultas específicas do Document Intelligence.

O que devo fazer se o serviço não reconhecer um texto específico, ou reconhecê-lo incorretamente, quando estou rotulando documentos?

Atualizamos e melhoramos continuamente o modelo de OCR de Inteligência Documental. Você pode enviar um e-mail para a equipe de Document Intelligence. Se possível, compartilhe um documento de exemplo com o problema realçado.