Criar um classificador treinável personalizado
Muitas vezes, as organizações precisam de classificar dados não estruturados que não seguem padrões previsíveis. Os classificadores treináveis personalizados permitem-lhe preparar o Microsoft Purview para reconhecer conteúdos exclusivos ao fornecer documentos de exemplo para análise baseada em IA. Depois de preparados, os classificadores podem ser utilizados para atribuir automaticamente conteúdos, aplicar políticas de retenção e suportar a conformidade de comunicação.
Como funcionam os classificadores treináveis
Os classificadores treináveis utilizam machine learning para detetar conteúdos com base no significado e no contexto, em vez de padrões predefinidos. Ao contrário dos tipos de informações confidenciais (SITs), que dependem de palavras-chave ou de deteção baseada em padrões, os classificadores treináveis melhoram a precisão da classificação através da análise de exemplos do mundo real.
A criação de um classificador envolve a preparação de um modelo com conteúdo de exemplo, incluindo documentos relevantes e irrelevantes. Este processo ajuda o modelo a distinguir entre dados que pertencem a uma categoria de classificação e dados que não pertencem.
Requisitos
Antes de criar um classificador, certifique-se de que cumpre os requisitos de licenciamento e permissão.
Licenciamento
Os classificadores treináveis no Microsoft Purview necessitam de uma das seguintes combinações de licenças:
- Microsoft 365 E5
- Conformidade do Microsoft 365 E5
- Microsoft 365 E3 com o suplemento Proteção de Informações do Microsoft Purview e Governação
Estas licenças incluem o acesso a funcionalidades de classificação avançadas, como classificadores treináveis, correspondência de dados exata, entidades nomeadas e análise contextual.
Permissões
Para criar e gerir classificadores treináveis, os utilizadores têm de ter as permissões de função adequadas. As permissões necessárias dependem do local onde o classificador será utilizado.
| Cenário | Permissões de função necessárias |
|---|---|
| Política de etiqueta de retenção | Gestão de Registos, Gestão de Retenção |
| Política de etiquetas de confidencialidade | Administrador de Segurança, Administrador de Conformidade, Administrador de Dados de Conformidade |
| Política de conformidade de comunicações | Administrador de Gestão de Riscos Internos, Administrador de Revisão de Supervisão |
Importante
Por predefinição, apenas o utilizador que cria um classificador personalizado pode preparar e rever as predições feitas por esse classificador.
Passos para criar um classificador treinável
A criação de um classificador segue um processo estruturado que inclui preparação, teste e publicação.
Passo 1: recolher dados de preparação
Para preparar o classificador, tem de fornecer dois conjuntos de dados de exemplo selecionados manualmente pelos utilizadores:
- Exemplos positivos (50 a 500 itens): documentos que pertencem à categoria.
- Exemplos negativos (150 a 1500 itens): documentos que não pertencem à categoria.
Dica
Quanto mais diversos e bem selecionados forem os dados de preparação, mais preciso será o classificador.
Passo 2: armazenar dados no SharePoint
Armazene os exemplos positivos e negativos em pastas separadas do SharePoint . Certifique-se de que estas pastas contêm apenas os respetivos dados de preparação.
Observação
Se criar novas pastas, aguarde pelo menos uma hora pela indexação antes de as utilizar na configuração do classificador.
Passo 3: criar o classificador treinável
- Inicie sessão no portal do Microsoft Purview .
- Navegue para Proteção de Informações>Classifiers>Classificadores treináveis.
- Selecione Criar classificador treinável.
- Introduza um nome e uma descrição.
- Adicione o URL da pasta do SharePoint para obter exemplos positivos e selecione Seguinte.
- Adicione o URL da pasta do SharePoint para obter exemplos negativos e selecione Seguinte.
- Examine as configurações e selecione Criar classificador treinável.
Depois de criado, o classificador começa a processar os dados de preparação. O tempo de processamento varia, mas normalmente é concluído dentro de 24 horas.
Passo 4: Rever e testar o classificador
Assim que o classificador processar amostras positivas e negativas suficientes, tem de verificar as predições.
- Abra o classificador e reveja os resultados.
- Confirme se cada predição está correta, incorreta ou incerta.
- A Microsoft utiliza este feedback para refinar o modelo de classificação.
Dica
Pelo menos 200 itens de teste devem ser revistos para obter a melhor precisão.
Passo 5: publicar o classificador
Quando satisfeito com a precisão do classificador:
- Selecione Publicar para utilização.
- O classificador fica disponível para:
- Políticas de etiquetas automáticas
- Políticas de retenção
- Prevenção de perda de dados (DLP)
- Conformidade de comunicações
O classificador identifica e categoriza automaticamente o conteúdo com base na sua preparação.
Melhores práticas para classificadores treináveis personalizados
- Garantir diversos exemplos de preparação: inclua um intervalo de conteúdos que represente com precisão a categoria de classificação.
- Evitar o sobreajuste: não utilize demasiados documentos semelhantes; A diversidade melhora a flexibilidade do classificador.
- Rever e voltar a preparar regularmente: à medida que o conteúdo muda, atualize os classificadores para manter a precisão.
- Utilizar, pelo menos, 200 itens de teste: para obter os melhores resultados, tenha, pelo menos, 200 itens no conjunto de exemplos de teste que inclua, pelo menos, 50 exemplos positivos e, pelo menos, 150 exemplos negativos. Isto melhora a confiança nas predições antes da publicação.