Estúdio de Inteligência de Documentação
Importante
- As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
- Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
- A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
- A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores:
v3.1 (GA)
v3.0 (GA)
Este conteúdo aplica-se a: v3.1 (GA) | Última versão:
v4.0 (pré-visualização) | Versões anteriores:
v3.0
Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões:
v4.0 (pré-visualização)
v3.1
Importante
- Existem URLs separados para regiões de nuvem soberana do Document Intelligence Studio.
- Azure para o governo dos EUA: Document Intelligence Studio (nuvem do Azure Fairfax)
- Microsoft Azure operado pela 21Vianet: Document Intelligence Studio (Azure na China)
O Document Intelligence Studio é uma ferramenta online para explorar, compreender e integrar visualmente recursos do serviço Document Intelligence em seus aplicativos. Use o Document Intelligence Studio para:
- Saiba mais sobre os diferentes recursos do Document Intelligence.
- Use seu recurso Document Intelligence para testar modelos em documentos de amostra ou carregar seus próprios documentos.
- Experimente diferentes funcionalidades adicionais e de pré-visualização para adaptar a saída às suas necessidades.
- Treine modelos de classificação personalizados para classificar documentos.
- Treine modelos de extração personalizados para extrair campos de documentos.
- Obtenha um código de exemplo para o idioma específico
SDKs
para integrar em seus aplicativos.
Use o Guia de início rápido do Document Intelligence Studio para começar a analisar documentos com análise de documentos ou modelos pré-construídos. Crie modelos personalizados e faça referência aos modelos em seus aplicativos usando um dos tipos específicos SDKs
de linguagem e outros inícios rápidos.
Introdução
Se você estiver visitando o Studio pela primeira vez, siga o guia de introdução para configurar o Studio para uso.
Analisar opções
O Document Intelligence suporta recursos sofisticados de análise. O Studio permite um ponto de entrada (botão Analisar opções) para configurar os recursos do complemento com facilidade.
Dependendo do cenário de extração de documentos, configure o intervalo de análise, o intervalo de páginas do documento, a deteção opcional e os recursos de deteção premium.
Nota
A extração de fontes não é visualizada no Document Intelligence Studio. No entanto, você pode verificar a seção de estilos da saída JSON para obter os resultados da deteção de fontes.
✔️ Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos
Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou seus modelos treinados.
Para alguns documentos, é possível duplicar etiquetas depois de executar a etiqueta automática. Certifique-se de modificar os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.
✔️ Tabelas de etiquetagem automática
Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.
✔️ Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento
Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.
Se uma pontuação de confiança baixa for retornada para alguns rótulos, verifique se eles estão rotulados corretamente. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.
✔️ Faça uso das opções e filtros da lista de documentos em projetos personalizados
Use a página de rotulagem de modelo de extração personalizada para navegar pelos documentos de treinamento com facilidade, usando o recurso de pesquisa, filtro e classificação por recurso.
Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer os documentos mais facilmente.
✔️ Partilha de projetos
- Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.
Suporte ao modelo de Document Intelligence
Leia: experimente o recurso Leitura do Document Intelligence para extrair linhas de texto, palavras, idiomas detetados e estilo manuscrito, se detetado. Comece com o recurso Studio Read. Explore com exemplos de documentos e seus documentos. Use a visualização interativa e a saída JSON para entender como o recurso funciona. Consulte a Visão geral de Leitura para saber mais e começar a usar o Guia de início rápido do Python SDK para Layout.
Layout: experimente o recurso Layout do Document Intelligence para extrair texto, tabelas, marcas de seleção e informações de estrutura. Comece com o recurso Layout do Studio. Explore com exemplos de documentos e seus documentos. Use a visualização interativa e a saída JSON para entender como o recurso funciona. Consulte a Visão geral do layout para saber mais e começar a usar o início rápido do Python SDK para layout.
Modelos pré-construídos: os modelos pré-construídos do Document Intelligence permitem que você adicione processamento inteligente de documentos aos seus aplicativos e fluxos sem ter que treinar e construir seus próprios modelos. Como exemplo, comece com o recurso Fatura do Studio. Explore com exemplos de documentos e seus documentos. Use a visualização interativa, a lista de campos extraídos e a saída JSON para entender como o recurso funciona. Consulte a visão geral de Modelos para saber mais e começar a usar o início rápido do Python SDK para fatura pré-construída.
Modelos de extração personalizados: os modelos personalizados do Document Intelligence permitem extrair campos e valores de modelos treinados com seus dados, adaptados aos seus formulários e documentos. Para extrair dados de vários tipos de formulário, crie modelos personalizados autônomos ou combine dois ou mais modelos personalizados e crie um modelo composto. Comece com o recurso de modelos personalizados do Studio. Use o assistente de ajuda, a interface de rotulagem, a etapa de treinamento e as visualizações para entender como o recurso funciona. Teste o modelo personalizado com seus documentos de exemplo e itere para melhorar o modelo. Para saber mais, consulte a Visão geral de modelos personalizados para saber mais.
Modelos de classificação personalizados: A classificação de documentos é um novo cenário suportado pelo Document Intelligence. a API do classificador de documentos suporta cenários de classificação e divisão. Treine um modelo de classificação para identificar os diferentes tipos de documentos suportados pelo seu aplicativo. O arquivo de entrada para o modelo de classificação pode conter vários documentos e classifica cada documento dentro de um intervalo de páginas associado. Para saber mais, consulte Modelos de classificação personalizados.
Recursos complementares: o Document Intelligence agora suporta recursos de análise mais sofisticados. Esses recursos opcionais podem ser ativados e desativados no estúdio usando o botão em cada página do
Analze Options
modelo. Há quatro recursos adicionais disponíveis: highResolution, fórmula, fonte e recursos de extração de código de barras. Para saber mais, consulte Recursos complementares.
Próximos passos
Visite o Document Intelligence Studio para começar a usar os modelos e recursos.
Comece a usar nosso Guia de início rápido do Document Intelligence Studio.
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários