Modificar o esquema de Correspondência de Dados Exatos para usar correspondência configurável

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Aplicável a

  • Criação de SIT (tipo de informação confidencial) de correspondência de dados exatos (EDM) usando o PowerShell.

A classificação baseada no EDM permite criar tipos personalizados de informações confidenciais que fazem referência a valores exatos em um banco de dados de informações confidenciais. Quando você precisa permitir variantes de uma cadeia de caracteres exata, você pode usar correspondência configurável para dizer ao Microsoft Purview para ignorar o caso e alguns delimitadores.

Importante

Use este procedimento para modificar um esquema EDM e um arquivo de dados.

  1. Desinstale o EdmUploadAgent.exe do computador que você usa para se conectar ao Microsoft 365 para fins de carregamento de arquivo de dados e esquema EDM

  2. Baixe o arquivo deEdmUploadAgent.exe apropriado para sua assinatura usando os seguintes links:

    • Comercial + GCC – A maioria dos clientes comerciais deve usar essa opção
    • GCC-High - Essa opção é especificamente para assinantes de nuvem governamental de alta segurança
    • DoD – Essa opção é especificamente para clientes de nuvem do Departamento de Defesa Estados Unidos
  3. Autorize o Agente de Upload do EDM, abra uma janela do Prompt de Comando (como administrador) e execute o seguinte comando:

    EdmUploadAgent.exe /Authorize
    
  4. Se você não tiver uma cópia atual do esquema existente, precisará baixar uma cópia do esquema existente. Para fazer isso, execute este comando:

    EdmUploadAgent.exe /SaveSchema /DataStoreName <dataStoreName> [/OutputDir [Output dir location]]
    
  5. Personalize o esquema para que cada coluna utilize caseInsensitive e/ou ignoredDelimiters. O valor padrão para caseInsensitive é "false" e para ignoredDelimiters, o padrão é uma cadeia de caracteres vazia.

    Observação

    O tipo de informação confidencial personalizado subjacente ou o tipo de informação confidencial interno usado para detectar o padrão regex geral deve dar suporte à detecção das variações de entrada listadas com ignoredDelimiters. Por exemplo, o tipo de informação confidencial SSN (Número de Segurança Social) interno dos EUA pode detectar variações nos dados que incluem traços, espaços ou falta de espaços entre os números agrupados que compõem o SSN. Como resultado, os únicos delimitadores relevantes para incluir nos dados do ignoredDelimiters EDM para SSN são: traço e espaço.

    Aqui está um esquema de exemplo que simula correspondências insensíveis a casos criando as colunas extras necessárias para reconhecer as variações de caso nos dados confidenciais.

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
               <Field name="PolicyNumber" searchable="true" />
               <Field name="PolicyNumberLowerCase" searchable="true" />
               <Field name="PolicyNumberUpperCase" searchable="true" />
               <Field name="PolicyNumberCapitalLetters" searchable="true" />
      </DataStore>
    </EdmSchema>
    

    No exemplo acima, as variações da coluna original PolicyNumber não são necessárias se ambas caseInsensitive e ignoredDelimiters forem adicionadas.

    Para atualizar esse esquema para que o EDM use correspondência configurável, use o e ignoredDelimiters sinalizadorescaseInsensitive. Veja como isso é possível:

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
      <DataStore name="PatientRecords" description="Schema for patient records policy" version="1">
             <Field name="PolicyNumber" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
      </DataStore>
    </EdmSchema>
    

    Para obter informações sobre os caracteres com suporte pelo ignoredDelimiters sinalizador, consulte Usando os campos caseInsensitive e ignoredDelimiters.

  6. Conectar-se ao PowerShell de Segurança e Conformidade

    Observação

    Se sua organização tiver configurado a Chave do Cliente para o Microsoft 365 no nível do locatário, o Exact Data Match usará sua funcionalidade de criptografia automaticamente. Isso está disponível apenas para locatários licenciados do E5 na nuvem Comercial. Para obter mais informações, consulte Visão geral da Chave do Cliente.

  7. Atualize o esquema executando o seguinte comando:

    Set-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    
  8. Se necessário, atualize o arquivo de dados para corresponder à nova versão do esquema.

    Dica

    Opcionalmente, você pode executar uma validação em seu arquivo CSV antes de carregá-la executando:

    EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

    Por exemplo: EdmUploadAgent.exe /ValidateData /DataFile C:\data\testdelimiters.csv /Schema C:\EDM\patientrecords.xml

    Para obter mais informações sobre todos os parâmetros compatíveis com EdmUploadAgent.exe, execute

    EdmUploadAgent.exe /?

  9. Abra uma janela prompt de comando (como administrador) e execute o seguinte comando para hash e carregue seus dados confidenciais:

    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Salt [custom salt] /Schema [Schema file]