Partilhar via


Teste um tipo de informação confidencial de correspondência de dados exata

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Aplicável a

Após a criação do tipo de informações confidenciais (SIT) de correspondência de dados exata (EDM) e uma hora depois de verificar se a tabela de informações confidenciais terminou o carregamento e a indexação, pode testar se deteta ou não as informações que pretende proteger utilizando a função Test na secção Tipos de informações confidenciais no Portal de Conformidade do Microsoft Purview.

Observação

As alterações num SIT EDM existente podem demorar algum tempo a propagar-se pelo sistema. Se estiver a fazer alterações a um SIT EDM para resolver problemas de deteção, certifique-se de que aguarda, pelo menos, uma hora depois de efetuar essas alterações antes de utilizar a função Test para validar o respetivo impacto.

Independentemente do método que utilizar para testes, os resultados do teste incluirão correspondências para o SIT EDM específico e para os elementos principais que estão configurados para esse SIT EDM.

Métodos para testar o SEU SIT EDM

Existem dois métodos que pode utilizar para testar o seu SIT EDM.

Método Disponível na nova experiência EDM Disponível na experiência EDM Novo e Clássico
Método de tipo de informação confidencial (SIT) Sim Sim
Método de classificadores EDM Sim Não

Observação

Se estiver a utilizar a experiência EDM Clássica, tem de utilizar o método SIT.

Testar um SIT EDM com o método Tipos de Informações Confidenciais

Para testar um SIT EDM com o método Tipos de Informações Confidenciais , siga os seguintes passos.

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.

  1. Inicie sessão no portal > do Microsoft PurviewProteção de Informações>Classifiers>Tipos de informações confidenciais.

  2. Selecione o seu SIT EDM na lista e, em seguida, selecione o ícone Testar .

  3. No painel de lista de opções, carregue um ficheiro que contenha dados que pretenda detetar. Por exemplo, crie um ficheiro que contenha um subconjunto das linhas na tabela de informações confidenciais. Se utilizou a funcionalidade de correspondência configurável no esquema para definir delimitadores ignorados, certifique-se de que o ficheiro de exemplo inclui exemplos com e sem esses delimitadores.

  4. Selecione Testar.

  5. Depois de o ficheiro ter sido carregado e analisado, marcar para obter correspondências com o SEU SIT EDM.

  6. Se a função Teste no SIT detetar uma correspondência, verifique se o SIT não está a aparar ou a extrair o item correspondente incorretamente. Os problemas comuns incluem SITs que:

    • Extrair apenas uma subcadeia da cadeia completa que deve ser detetada
    • Recolher apenas a primeira palavra numa cadeia de várias palavras
    • Incluir símbolos ou carateres adicionais na extração

Para obter detalhes sobre a utilização de expressões regulares, consulte a Linguagem de Expressão Regular – Referência Rápida.

Testar o SIT do EDM com o método EDM Classifier

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.

  1. Inicie sessão no portal > do Microsoft PurviewProteção de Informações>ClassifiersEDM classifiers>.

  2. Certifique-se de que o botão de alternar Nova experiência do EDM está definido como Ativado.

  3. Selecione o seu SIT EDM na lista e, em seguida, selecione o ícone Testar .

  4. Carregue um ficheiro que contenha dados que pretende detetar. Por exemplo, crie um ficheiro que contenha um subconjunto das linhas na tabela de informações confidenciais. Se utilizou a funcionalidade de correspondência configurável no esquema para definir delimitadores ignorados, certifique-se de que o ficheiro de exemplo inclui exemplos com e sem esses delimitadores.

  5. Depois de o ficheiro ter sido carregado e analisado, marcar para obter correspondências com o SEU SIT EDM.

  6. Se a função Teste no SIT detetar uma correspondência, verifique se o SIT não está a aparar ou a extrair o item correspondente incorretamente. Os problemas comuns incluem SITs que:

    • Extrair apenas uma subcadeia da cadeia completa que deve ser detetada
    • Recolher apenas a primeira palavra numa cadeia de várias palavras
    • Incluir símbolos ou carateres adicionais na extração

Testar o EDM SIT com o PowerShell

Para testar com o PowerShell, utilize o seguinte cmdlet do PowerShell:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Independentemente do método que utilizar para testes, os resultados do teste incluirão correspondências para o SIT EDM específico e para os elementos principais que estão configurados para esse SIT EDM.

Observação

Quando cria ou edita um tipo de informação confidencial EDM ou o SIT primário no qual se baseia um tipo de EDM, todos os novos conteúdos (bem como o conteúdo que é modificado após efetuar alterações aos SITs) serão pesquisados para obter conteúdo que corresponda às novas definições. No entanto, o conteúdo pré-existente não será pesquisado até ser modificado ou reindexado.

Para forçar a nova pesquisa de conteúdos existentes num site ou biblioteca do SharePoint ou no OneDrive, siga as instruções em Pedido manual de pesquisa e reindexação de um site, biblioteca ou lista.

Testar o SIT do EDM com políticas de proteção de informações

Pode ver onde o SEU SIT EDM está a ser utilizado e quão preciso é na produção, ao utilizá-lo em políticas:

  1. Crie uma política de etiquetagem automática e execute-a na Descrição geral da simulação.

  2. Adicione algum conteúdo que irá acionar o SIT EDM, juntamente com o conteúdo que não aciona o SIT do EDM, para uma localização que a sua política está a monitorizar.

  3. Abra o separador Itens para rever para marcar as correspondências.

  4. Ajuste as suas políticas conforme adequado.

Assim que estiver satisfeito com os resultados do teste e da otimização, o SIT personalizado baseado em EDM está pronto para ser utilizado em políticas de proteção de informações, por exemplo:

Dicas de solução de problemas

Se o SEU SIT EDM não detetar correspondências nos seus dados, as sugestões seguintes podem ajudá-lo a diagnosticar o problema.

Problema Dica de solução de problemas
Não foram encontradas correspondências Confirme que os dados confidenciais foram carregados corretamente com os comandos explicados no Hash e carregue a tabela de origem de informações confidenciais para que os dados exatos correspondam aos tipos de informações confidenciais.
Não foram encontradas correspondências Teste o SIT que utilizou quando configurou o elemento principal em cada um dos seus padrões. Este teste verifica se o SIT pode corresponder aos exemplos no item. Utilizar um SIT definido incorretamente como o elemento de classificação de um SIT EDM é a causa mais comum para falhas de deteção no EDM.
O SIT que selecionou para um elemento primário no tipo EDM não encontra uma correspondência no item ou encontra menos correspondências do que o esperado Confirme que o SIT suporta os separadores e delimitadores que ocorrem no conteúdo. Certifique-se de que inclui os delimitadores ignorados definidos no seu esquema.
O SIT associado ao elemento principal encontra correspondências no seu conteúdo, mas o SIT EDM não.
  • Verifique se as instruções REGEX estão a detetar delimitadores de espaço em branco no início ou no fim de um item que pretende detetar. Por exemplo, procure instruções que incluam o \s delimitador. Se estiverem incluídos delimitadores de espaço em branco, o espaço em branco não corresponderá ao valor hash na tabela de dados. Em vez disso, utilize um delimitador de palavras, como \b.
  • Verifique as instruções REGEX para garantir que capturam toda a cadeia que pretende detetar e não apenas uma subcadeia. Por exemplo, considere este padrão para endereços de e-mail: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b. Este padrão corresponderá corretamente user@contoso.coma , mas apenas será capturado user@contoso.co.jp de forma incompleta.
Um SIT EDM com elementos primários, mas sem elementos secundários definidos, deteta itens, mas não deteta correspondências (ou deteta menos correspondências do que o esperado) quando são necessários elementos primários e secundários. Se os valores numa coluna utilizada para provas secundárias não forem compostos por uma única palavra ou cadeias que não contenham espaços, vírgulas ou outros separadores de palavras, existem duas formas de testar:
  1. Selecione a opção de correspondência de vários tokens .
  2. Associe os valores a um SIT que utiliza um REGEX concebido para detetar cadeias de várias palavras que seguem o padrão pretendido (por exemplo, um número fixo de palavras consecutivas que começam com um caráter maiúscula) ou um dicionário palavra-chave que lista todos os valores exclusivos nessa coluna. Por exemplo, se existir uma coluna de provas adicional para a cidade ou residência de uma pessoa, pode criar uma lista com todos os nomes de cidade exclusivos da tabela e, em seguida, utilizá-la para criar um tipo de informação confidencial baseada no dicionário.

Utilize este SIT como elemento de classificação para a coluna correspondente no seu SIT EDM ao exportar e editar a definição EDM SIT no XML. Para obter mais informações, consulte Criar um pacote de regras manualmente.
A função de teste SIT não deteta nenhuma correspondência. Verifique se o SIT que selecionou inclui requisitos para palavras-chave adicionais ou outras validações. Para SITs incorporados, veja Definições de entidades de tipo de informações confidenciais para determinar quais são os requisitos mínimos para corresponder a cada tipo.
A funcionalidade Testar funciona, mas os itens do SharePoint ou do OneDrive não estão a ser detetados em DLP ou regras de etiquetagem automática Verifique se os documentos em que espera encontrar correspondências são realmente apresentados no explorador de conteúdos. As correspondências só são detetadas no conteúdo que é criado após serem aplicadas alterações ao SIT. Por isso, se as correspondências esperadas não aparecerem, volte a pesquisar os sites e bibliotecas para quaisquer itens pré-existentes. Para obter detalhes sobre como voltar a pesquisar o SharePoint e o OneDrive, veja Manually request crawling and re-indexing of a site, a library or a list (Pedir manualmente a pesquisa e reindexação de um site, biblioteca ou lista).
DLP ou regras de etiquetagem automática que requerem múltiplas correspondências não são acionadas Certifique-se de que os requisitos de proximidade para o SEU SIT EDM e os SITs de base são cumpridos. Por exemplo, se a distância máxima entre o elemento primário e as palavras-chave de suporte for de 300 carateres, mas as palavras-chave só estiverem presentes na primeira linha de uma tabela longa, é provável que apenas as primeiras linhas de valores correspondentes cumpram os requisitos de proximidade. Modifique as definições DO SIT para suportar regras de proximidade mais flexíveis ou utilize a opção Qualquer lugar no documento para obter as condições de evidência adicionais.
A deteção de um SIT EDM é inconsistente ou errática Certifique-se de que o SIT que utilizou como base para o elemento primário no SEU SIT EDM não está a detetar conteúdo desnecessário. A utilização de um SIT que corresponda a demasiados conteúdos não relacionados, como qualquer palavra, qualquer número ou todos os endereços de e-mail, pode fazer com que o serviço ignore correspondências relevantes. Verifique o número de peças de conteúdo que correspondem ao tipo confidencial que utilizou para os elementos principais no explorador de conteúdos.

Para estimar se o SIT corresponde a demasiado conteúdo:
  1. Divida o número de itens de conteúdo no Conteúdo do Microsoft Purview Explorer pelo número de dias desde que o tipo confidencial foi criado.
  2. Se o número de correspondências por dia estiver no intervalo de centenas de milhares ou mais, é possível que o SIT primário seja demasiado amplo.

Para obter recomendações e melhores práticas sobre a seleção do tipo de informações confidenciais correto para um SIT EDM, veja Saiba mais sobre os tipos de informações confidenciais baseados na correspondência de dados exatas.