Aumentar a precisão do classificador

Classificadores, como tipos de informações confidenciais (SIT) e classificadores treináveis, são usados em vários tipos de políticas para identificar informações confidenciais. Como a maioria desses modelos, às vezes eles identificam um item como sendo confidencial que não é. Ou, eles podem não identificar um item como sendo confidencial quando ele realmente é. Estes são chamados falsos positivos e falsos negativos.

Este artigo mostra como confirmar se os itens correspondidos por um classificador são verdadeiros positivos (um Match) ou falsos positivos (Não correspondem) e fornecem comentários correspondentes a Match/Not . Você pode usar esse comentário para ajustar seus classificadores para aumentar a precisão. Você também pode enviar versões redigidas do documento, bem como os comentários Match, Not a Match para a Microsoft se quiser ajudar a aumentar a precisão dos classificadores que a Microsoft fornece.

As experiências Match, Not a match e Contextual Summary estão disponíveis em:

  • Conteúdo Explorer – para sites do SharePoint, sites do OneDrive
  • Página Itens correspondentes do tipo de informações confidenciais – para sites do SharePoint, sites do OneDrive
  • Página Itens Correspondentes do Classificador Treinável – para sites do SharePoint, sites do OneDrive
  • página alertas de Prevenção Contra Perda de Dados do Microsoft Purview (DLP) – para sites do SharePoint, OneDrive e emails no Exchange
  • Página alertas da Proteção contra Ameaças da Microsoft (MTP) – para sites do SharePoint, sites do OneDrive e emails no Exchange

A experiência de Resumo Contextual está disponível em:

  • Proteção de Informações do Microsoft Purview (MIP) Simulação de rotulagem automática correspondente a itens – para sites do SharePoint, sites do OneDrive

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Aplicável a

Classificador Resumo contextual Painel de visualização redigido Corresponder e não corresponder
SENTAR Sim Sim Sim
SIT personalizado Sim Não Sim
Impressão digital SIT Não Não Sim
Dados exatos correspondem a SIT Não* Não Não
Entidades nomeadas Não* Não Não
Verificação de credenciais Não* Não Não
Classificadores treináveis internos Sim** Sim Sim
Classificador treinável personalizado Não Não Sim

* Esses classificadores têm suporte em itens compatíveis com simulação de rotulagem automática do MIP para sites do SharePoint e sites do OneDrive.

** Lista de classificadores treináveis internos e que dão suporte a resumo contextual.

Importante

O match/not a match feedback e a experiência de resumo contextual dão suporte a itens em: sites do SharePoint & sites do OneDrive – para Explorer de Conteúdo, Tipo de Informações Confidenciais e Itens Correspondentes do Classificador Treinável, Alertas DLP e Alertas MTP. Emails no Exchange – para alertas DLP e alertas MTP. A experiência de resumo contextual dá suporte a itens em: sites do SharePoint e sites do OneDrive – para itens compatíveis com simulação de MIP

Licenciamento e assinaturas

Para obter informações sobre o licenciamento e as assinaturas relevantes, consulte os requisitos de licenciamento para análise de classificação de dados: Visão geral Conteúdo & Atividade Explorer.

Limitações conhecidas

  • O resumo contextual mostra apenas um número limitado de correspondências em qualquer item, nem todas as correspondências.
  • A experiência de resumo e comentários contextuais só está disponível para itens criados ou atualizados depois que a experiência de feedback foi habilitada para o locatário. Os itens classificados antes da habilitação do recurso podem não ter a experiência de resumo e comentários contextuais disponíveis.

Como avaliar a precisão da correspondência e fornecer comentários

A experiência de resumo contextual, em que você indica se um item correspondente é um verdadeiro positivo (Match) ou um falso positivo (Não uma correspondência), é semelhante em todos os lugares que ele aparece.

Importante

Você já deve ter implantado políticas DLP que usam SITs ou classificadores treináveis para sites do OneDrive, sites do SharePoint ou caixas de correio do Exchange. Você também deve ter tido itens correspondentes antes de qualquer item aparecer na página resumo contextual .

Usando conteúdo Explorer

Este exemplo mostra como usar a guia Resumo Contextual para dar comentários.

  1. Abra a página explorador deconteúdo de classificação>portal de conformidade do Microsoft Purview> Data.
  2. Digite o nome do classificador SIT ou trainable para o qual você deseja marcar correspondências em Filtrar em rótulos, tipos de informações ou categorias.
  3. Selecione o SIT.
  4. Selecione o local e verifique se há um valor não zero na coluna Arquivos . (Os únicos locais com suporte são SharePoint e OneDrive.)
  5. Abra a pasta e selecione um documento.
  6. Selecione o link na coluna Tipo de informação confidencial para o documento para ver quais SITs o item correspondeu e o nível de confiança.
  7. Escolher Fechar
  8. Abra um documento e selecione a guia Resumo Contextual .
  9. Examine o item e confirme se ele é ou não compatível.
  10. Se for uma correspondência, escolha Fechar. Você terminou.
  11. Se não for uma correspondência, escolha Não uma correspondência.
  12. Se você cometer um erro e escolher a opção errada, selecione Retirar comentários ao lado de Fechar. Isso coloca o item de volta no estado Not a match/Match .
  13. Examine o item e redigir ou desativar qualquer texto.
  14. Escolha Fechar.

Usando a página Itens Correspondentes do Tipo de Informações Confidenciais

Você pode acessar os mesmos mecanismos de comentários na página Tipos de Informações Confidenciais .

  1. Abra o portal de conformidade do Microsoft Purview e navegue até Tipos deinformações confidenciaisde>classificação> de dados.
  2. No campo Pesquisa, insira o nome do SIT cuja precisão você deseja marcar.
  3. Abra o SIT. Isso traz a guia Visão geral . Aqui você pode ver a contagem do número de itens que correspondem, uma contagem do número de itens que não são compatíveis e o número de itens com comentários.
  4. Selecione a guia itens correspondentes .
  5. Abra a pasta e selecione um documento. Somente o SharePoint, o OneDrive tem suporte para locais aqui. Verifique se há um valor não zero na coluna Arquivos .
  6. Selecione o link na coluna Tipo de informações confidenciais para um item para ver quais SITs o item correspondeu e o nível de confiança.
  7. Escolha Fechar.
  8. Abra um documento e selecione a guia Resumo Contextual .
  9. Examine o item e confirme se ele é compatível.
  10. Se for uma correspondência, escolha Corresponder e feche.
  11. Se não for uma correspondência, escolha **Not a Match ****
  12. Se você cometer um erro e selecionar a opção errada, selecione Retirar comentários ao lado de Fechar. Isso coloca o item de volta no estado Not a match/Match .
  13. Escolha Fechar.

Usando a página Itens Correspondentes do Classificador Treinável

  1. Abra o portal de conformidade do Microsoft Purview e navegue até classificadores de classificação> de dadosClassificadores>treináveis classificadores.
  2. Selecione o classificador treinável cuja precisão você deseja marcar.
  3. Abra o classificador treinável. Isso traz a guia Visão geral . Aqui você pode ver a contagem do número de itens que correspondem, uma contagem do número de itens que não são compatíveis e o número de itens com comentários.
  4. Selecione a guia itens correspondentes .
  5. Abra a pasta e abra um documento. Somente o SharePoint, o OneDrive tem suporte para locais aqui. Verifique se há um valor não zero na coluna Arquivos .
  6. Abra um documento e selecione a guia Resumo Contextual .
  7. Examine o item e confirme se ele é compatível.
  8. Se for uma correspondência, escolha Corresponder e, em seguida, escolha Fechar.
  9. Se não for uma correspondência, escolha **Not a Match ****
  10. Se você cometer um erro e selecionar a opção errada, escolha Retirar comentários ao lado de Fechar. Isso coloca o item de volta no estado Not a match/Match .
  11. Escolha Fechar.

Usando a página Alertas de Prevenção contra Perda de Dados

  1. Abra o portal de conformidade do Microsoft Purview e navegue até a páginaAlertas de prevenção> contra perda de dados.
  2. Escolha um alerta.
  3. Escolha Exibir detalhes.
  4. Escolha a guia Eventos .
  5. Maximize a guia Detalhes .
  6. Examine o item e confirme se ele é compatível.
  7. Escolha Ações.
  8. Se for uma correspondência, feche a janela. Você terminou.
  9. Se não for uma correspondência, escolha Ações e, em seguida, Não uma correspondência.
  10. Examine o item e redigir ou desativar qualquer texto.
  11. Feche a janela.

Usando os comentários para ajustar seus classificadores

Se seus SITs ou classificadores treináveis estiverem retornando muitos falsos positivos com base nos comentários, experimente algumas dessas opções para refiná-los e aumentar sua precisão.

Classificadores de treinamento

Use as etapas em Como treinar novamente um classificador no gerenciador de conteúdo para aumentar a precisão de um classificador treinável.

Tipos de informações confidenciais

  • Aumente os limites de tipos de informações confidenciais encontrados para determinar a gravidade. Não há problema em usar limites diferentes para classificadores individuais.

  • Entenda os níveis de confiança e como eles são definidos. Tente usar uma baixa confiança com alta contagem de instâncias ou um nível de confiança mais alto com uma contagem de instâncias baixa.

  • Clone e modifique os SITs internos para incluir outras condições, como as presenças de palavras-chave, correspondência de valor mais rigorosa ou requisitos de formatação mais fortes.

  • Modifique um SIT personalizado para excluir prefixos, sufixos ou padrões conhecidos. Por exemplo, um SIT personalizado para detectar números de telefone pode disparar para cada email se suas assinaturas de email ou cabeçalhos de documento incluirem números de telefone. Excluir as sequências de números de telefone da sua organização do SIT personalizado pode impedir que a regra seja disparada para cada email ou documento.

  • Inclua mais SITs baseados em dicionário como condições para restringir as correspondências aos itens que falam sobre os artigos relevantes. Por exemplo, uma regra para correspondência de diagnóstico do paciente pode ser aprimorada exigindo a presença de palavras como diagnóstico, diagnóstico, condição, sintoma e paciente.

  • Para SITs de entidade nomeada, como Todos os Nomes Completos, é melhor definir um limite de contagem de instâncias mais alto, como 10 ou 50. Se os nomes de pessoa e os SSNs (Números de Segurança Social) forem detectados juntos, é mais provável que os SSNs sejam realmente SSNs e reduzamos o risco de que a política não seja disparada porque poucos SSNs são detectados.