Comece com classificadores treináveis

Um classificador treinável do Microsoft 365 é uma ferramenta que você pode treinar para reconhecer vários tipos de conteúdo fornecendo a ele exemplos para examinar. Depois de treinado, você pode usá-lo para identificar o item para a aplicação de rótulos de confidencialidade do Office, políticas de conformidade de comunicações e políticas de rótulo de retenção.

Criar um classificador treinável personalizado primeiro envolve fornecer amostras que são escolhidas por humanos e que correspondem positivamente à categoria. Em seguida, depois de processá-los, você testará a capacidade dos classificadores de prever fornecendo a ele uma combinação de amostras positivas e negativas. Este artigo mostra como criar e treinar um classificador personalizado e como melhorar o desempenho de classificadores treináveis personalizados e classificadores pré-treinados durante seu tempo de vida por meio de novo treinamento.

Para saber mais sobre os diferentes tipos de classificadores, consulte Saiba mais sobre classificadores treináveis.

Assista a este vídeo para obter um resumo rápido da criação de um classificador treinável. Você ainda precisará ler este artigo completo para obter os detalhes.


[!VIDEO https://www.microsoft.com/videoplayer/embed/RWyGL7]

Pré-requisitos

Requisitos de licenciamento

Os classificadores são um Microsoft 365 E5 ou de Conformidade do E5. Você deve ter uma dessas assinaturas para usá-las.

Permissões

Para acessar classificadores na interface do usuário:

  • o administrador global precisa aceitar que o locatário crie classificadores personalizados.
  • A função administrador de conformidade é necessária para treinar um classificador.

Você precisará de contas com essas permissões para usar classificadores nestes cenários:

  • Cenário de política de rótulo de retenção: funções de Gerenciamento de Registros e Gerenciamento de Retenção
  • Cenário de política de rótulo de confidencialidade: Administrador de Segurança, Administrador de Conformidade, Administrador de Dados de Conformidade
  • Cenário de política de conformidade de comunicação: Gerenciamento de Risco Interno Administração, Administrador de Revisão de Supervisão

Importante

Por padrão, somente o usuário que cria um classificador personalizado pode treinar e examinar previsões feitas por esse classificador.

Preparar-se para um classificador treinável personalizado

É útil entender o que está envolvido na criação de um classificador treinável personalizado antes de se aprofundar.

Linha do tempo

Essa linha do tempo reflete uma implantação de exemplo de classificadores treináveis.

trainable-classifier-timeline.

Dica

A aceitação é necessária na primeira vez para classificadores treináveis. Leva doze dias para o Microsoft 365 concluir uma avaliação de linha de base do conteúdo de suas organizações. Entre em contato com o administrador global para iniciar o processo de aceitação.

Fluxo de trabalho geral

Para entender mais sobre o fluxo de trabalho geral da criação de classificadores treináveis personalizados, consulte o fluxo de processo para criar classificadores treináveis personalizados.

Propagar conteúdo

Quando você deseja que um classificador treinável identifique de forma independente e precisa um item como sendo em uma categoria específica de conteúdo, primeiro você precisa apresentá-lo com muitos exemplos do tipo de conteúdo que estão na categoria. Essa alimentação de amostras para o classificador treinável é conhecida como propagação. O conteúdo de semente é selecionado por um humano e é julgado por representar a categoria de conteúdo.

Dica

Você precisa ter pelo menos 50 amostras positivas e até 500. O classificador treinável processará até os 500 exemplos criados mais recentes (por carimbo de data/hora criado pelo arquivo). Quanto mais amostras você fornecer, mais precisas serão as previsões que o classificador fará.

Testando conteúdo

Depois que o classificador treinável tiver processado amostras positivas suficientes para criar um modelo de previsão, você precisará testar as previsões que ele faz para ver se o classificador pode distinguir corretamente entre itens que correspondem à categoria e aos itens que não correspondem. Faça isso selecionando outro conjunto maior de conteúdo escolhido por humanos que consiste em exemplos que devem se enquadrar na categoria e em exemplos que não se enquadram. Você deve testar com dados diferentes dos dados de semente iniciais fornecidos pela primeira vez. Depois de processá-los, você percorrerá manualmente os resultados e verificará se cada previsão está correta, incorreta ou se não tem certeza. O classificador treinável usa esses comentários para melhorar seu modelo de previsão.

Dica

Para obter melhores resultados, tenha pelo menos 200 itens no conjunto de amostras de teste com uma distribuição uniforme de resultados positivos e negativos.

Como criar um classificador treinável

  1. Coletar entre 50 a 500 itens de conteúdo de semente. Esses devem ser apenas exemplos que representam fortemente o tipo de conteúdo que você deseja que o classificador treinável identifique positivamente como estando na categoria de classificação. Consulte, Extensões de nome de arquivo rastreado padrão e tipos de arquivo analisados no SharePoint Server para os tipos de arquivo com suporte.

    Importante

    Verifique se os itens em seu conjunto de sementes são exemplos fortes da categoria. Inicialmente, o classificador treinável cria seu modelo com base no que você o propaga. O classificador pressupõe que todas as amostras de semente são fortes positivos e não tem como saber se uma amostra é uma correspondência fraca ou negativa com a categoria.

  2. Coloque o conteúdo de semente em uma pasta do SharePoint Online dedicada a conter apenas o conteúdo de semente. Anote o site, a biblioteca e a URL da pasta.

    Dica

    Se você criar um novo site e pasta para seus dados de semente, aguarde pelo menos uma hora para que esse local seja indexado antes de criar o classificador treinável que usará esses dados de semente.

  3. Entre no portal de conformidade do Microsoft Purview com acesso à função de administrador de conformidade ou administrador de segurança e abra portal de conformidade do Microsoft Purview ou Microsoft 365 Defender portal > Classificação de dados.

  4. Escolha a guia Classificadores treináveis .

  5. Escolha Criar classificador treinável.

  6. Preencha os valores apropriados para os Name Description campos e a categoria de itens que você deseja que esse classificador treinável identifique.

  7. Escolha o site, a biblioteca e a URL da pasta do SharePoint Online para o site de conteúdo de semente da etapa 2. Escolha Add.

  8. Examine as configurações e escolha Create trainable classifier.

  9. Dentro de 24 horas, o classificador treinável processará os dados de semente e criará um modelo de previsão. O status do classificador é In progress enquanto processa os dados de semente. Quando o classificador terminar de processar os dados de semente, o status será alterado para Need test items.

  10. Agora você pode exibir a página de detalhes escolhendo o classificador.

    classificador treinável pronto para teste.

  11. Colete pelo menos 200 itens de conteúdo de teste (10.000 no máximo) para obter melhores resultados. Eles devem ser uma combinação de itens que são fortes positivos, fortes negativos e alguns que são um pouco menos óbvios em sua natureza. Consulte, Extensões de nome de arquivo rastreado padrão e tipos de arquivo analisados no SharePoint Server para os tipos de arquivo com suporte.

  12. Coloque o conteúdo de teste em uma pasta do SharePoint Online dedicada a manter o conteúdo de teste somente. Anote o site, a biblioteca e a URL da pasta do SharePoint Online.

    Dica

    Se você criar um novo site e pasta para seus dados de teste, aguarde pelo menos uma hora para que esse local seja indexado antes de criar o classificador treinável que usará esses dados de semente.

  13. Escolha Add items to test.

  14. Escolha o site, a biblioteca e a URL da pasta do SharePoint Online para o site de conteúdo de teste da etapa 12. Escolha Add.

  15. Conclua o assistente escolhendo Done. O classificador treinável levará até uma hora para processar os arquivos de teste.

  16. Quando o classificador treinável terminar de processar seus arquivos de teste, o status na página de detalhes será alterado para Ready to review. Se você precisar aumentar o tamanho do exemplo de teste, escolha Add items to test e permita que o classificador treinável processe os itens adicionais.

    pronto para examinar a captura de tela.

  17. Escolha a Tested items to review guia para revisar itens.

  18. O Microsoft 365 apresentará 30 itens por vez. Examine-os e, na We predict this item is "Relevant". Do you agree? caixa, escolha um Yes ou No ou Not sure, skip to next item. A precisão do modelo é atualizada automaticamente após cada 30 itens.

    caixa revisar itens.

  19. Examine pelo menos 200 itens. Depois que a pontuação de precisão for estabilizada, a opção de publicação ficará disponível e o status do classificador dirá Ready to use.

    pontuação de precisão e pronto para publicação.

  20. Publique o classificador.

  21. Depois de publicado, o classificador estará disponível como uma condição na rotulagem automática do Office com rótulos de confidencialidade , aplique automaticamente a política de rótulo de retenção com base em uma condição e na conformidade de comunicação.