Share via


Treinar um modelo de processamento de documento estruturado ou de forma livre no Microsoft Syntex

Siga as instruções em Criar um modelo no Syntex para criar um modelo de processamento de documento estruturado ou de forma livre em um centro de conteúdo. Ou siga as instruções em Criar um modelo em um site local do SharePoint para criar o modelo em um site local. Em seguida, use este artigo para treinar seu modelo.

Diagrama do fluxo de trabalho para treinar um modelo do Construtor de IA.

Para treinar um modelo de processamento de documento estruturado ou de forma livre, siga estas etapas:

Etapa 1: Adicionar e analisar documentos

Depois de criar seu modelo de processamento de documento estruturado ou de forma livre, a página Escolher informações para extrair será aberta. Aqui você lista todas as informações que deseja que o modelo de IA extraia de seus documentos, como Nome, Endereço ou Quantidade.

Observação

Ao procurar arquivos de exemplo a serem usados, consulte os requisitos do documento de entrada do modelo de processamento de documentos e as dicas de otimização.

  1. Primeiro, você define os campos e tabelas que deseja ensinar ao seu modelo a extrair na página Escolher informações para extrair. Para obter etapas detalhadas, confira Definir campos e tabelas a serem extraídas.

  2. Você pode criar quantas coleções de layouts de documento desejar que seu modelo processe. Para obter etapas detalhadas, confira Agrupar documentos por coleções.

  3. Depois de criar suas coleções e adicionar pelo menos cinco arquivos de exemplo para cada, o Construtor de IA no Syntex examinará os documentos carregados para detectar os campos e tabelas. Esse processo geralmente leva alguns segundos. Quando a análise for concluída, você poderá prosseguir com a marcação dos documentos.

Etapa 2: Marcar campos e tabelas

Você precisa marcar os documentos para ensinar o modelo a entender os campos e os dados da tabela que deseja extrair. Para obter etapas detalhadas, confira Marcar documentos.

Etapa 3: Treinar e publicar seu modelo

  1. Depois de criar e treinar seu modelo, você estará pronto para publicá-lo e usá-lo no SharePoint. Para publicar o modelo, selecione Publicar. Para obter etapas detalhadas, consulte Treinar e publicar seu modelo de processamento de documentos.

    Captura de tela ao mostrar os detalhes do modelo na home page do modelo.

  2. Depois que o modelo for publicado, você acessará a home page do modelo. Em seguida, você terá a opção de aplicar o modelo a uma biblioteca de documentos.

    Captura de tela da home page do modelo para aplicar o modelo a uma biblioteca.

Etapa 4: usar seu modelo

  1. Na exibição do modelo da biblioteca de documentos, observe que os campos selecionados agora aparecem como colunas.

    Modelo de biblioteca de documentos aplicado.

  2. Observe que o link de informações ao lado de Documentos indica que um modelo de processamento de formulários é aplicado a esta biblioteca de documentos.

  1. Carregue arquivos para sua biblioteca de documentos. Todos os arquivo que o modelo identifica como seu tipo de conteúdo lista os arquivos em sua exibição e exibe os dados extraídos nas colunas.

    Captura de tela mostrando dados extraídos.

Observação

Se um modelo de processamento de documento estruturado ou de forma livre e um modelo de processamento de documento não estruturado forem aplicados à mesma biblioteca, o arquivo será classificado usando o modelo de processamento de documento não estruturado e quaisquer extratores treinados para esse modelo. Se houver colunas vazias que correspondam ao modelo de processamento de documentos, as colunas serão preenchidas usando esses valores extraídos.

Campo Data de Classificação

Quando qualquer modelo personalizado é aplicado a uma biblioteca de documentos, o campo Data de Classificação é incluído no esquema de biblioteca. Por padrão, esse campo está vazio. No entanto, quando os documentos são processados e classificados por um modelo, esse campo é atualizado com um carimbo de data e hora de conclusão.

Quando um modelo é carimbado com a Data de Classificação, você pode usar o Enviar um email após o Syntex processar um fluxo de arquivos para notificar os usuários de que um novo arquivo foi processado e classificado por um modelo na biblioteca de documentos do SharePoint.

Para executar o fluxo:

  1. Selecione um arquivo e selecione Integrar>Power Automate>Criar um fluxo.

  2. No painel Criar um fluxo , selecione Enviar um email após o Syntex processar um arquivo.

    Captura de tela mostrando a opção Criar um painel de fluxo e fluxo realçada.

Usar fluxos para extrair informações

Importante

As informações nesta seção não se aplicam à versão mais recente do Syntex. Ele é deixado como referência apenas para os modelos de processamento de formulário que foram criados em versões anteriores. Na versão mais recente, você não precisa mais configurar os fluxos para processar arquivos existentes.

Dois fluxos estão disponíveis para processar um arquivo selecionado ou um lote de arquivos em uma biblioteca em que um modelo de processamento de documento estruturado ou de forma livre foi aplicado.

  • Extrair informações de uma imagem ou arquivo PDF com um modelo de processamento de documento – Use para extrair texto de uma imagem ou arquivo PDF selecionado executando um modelo de processamento de documento. Dá suporte a um único arquivo selecionado por vez e dá suporte apenas a arquivos PDF e arquivos de imagem (.png, .jpg e .jpeg). Para executar o fluxo, selecione um arquivo e selecione Automatizar>Informações de Extração.

    Captura de tela mostrando o menu Automatizar com extração de informações realçadas.

  • Extrair informações de arquivos com um modelo de processamento de documentos – use com modelos de processamento de documentos para ler e extrair informações de um lote de arquivos. Processa até 5.000 arquivos do SharePoint por vez. Ao executar esse fluxo, há determinados parâmetros que você pode definir. Você pode:

    • Escolha se deve incluir arquivos processados anteriormente (o padrão não é incluir arquivos processados anteriormente).
    • Selecione o número de arquivos a serem processados (o padrão é 100 arquivos).
    • Especifique a ordem na qual processar os arquivos (as opções são por ID do arquivo, nome do arquivo, hora criada pelo arquivo ou última hora modificada).
    • Especifique como você deseja classificar a ordem (ordem crescente ou decrescente).

    Captura de tela mostrando o painel Executar fluxo com opções de parâmetro realçadas.

Observação

O Extração de informações de uma imagem ou arquivo PDF com um fluxo de modelo de processamento de documentos está disponível automaticamente para uma biblioteca com um modelo de processamento de documentos associado. O Extração de informações de arquivos com um fluxo de modelo de processamento de documentos é um modelo que deve ser adicionado à biblioteca, se necessário.