Partilhar via


Criar o esquema para tipos de informações confidenciais com base em correspondência exata de dados

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Aplicável a

  • Experiência de criação de sit (tipo de informações confidenciais) clássica de correspondência de dados exatos (EDM).

Usar o esquema exato de correspondência de dados e a ferramenta de padrão de tipo de informação confidencial

Se você não estiver familiarizado com o SITS baseado em EDM ou sua implementação, você deverá se familiarizar com:

Um único esquema EDM pode ser usado em vários tipos de informações confidenciais que usam a mesma tabela de dados confidenciais. Você pode criar até 10 esquemas EDM diferentes em um locatário do Microsoft 365.

Usar o Esquema exato de correspondência de dados e a ferramenta tipo de informações confidenciais

Você pode usar essa ferramenta para ajudar a simplificar o processo de criação de arquivo de esquema.

Pré-requisitos

Usar o esquema exato de correspondência de dados e a ferramenta de padrão de tipo de informação confidencial

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o portal de conformidade, consulte portal de conformidade do Microsoft Purview.

  1. Entre no portal > do Microsoft PurviewProteção de Informações>Classifiers>EDM classifica esquemas>EDM (disponíveis quando a experiência Novo EMD é alternada para Desativar).

  2. Escolha Criar esquema EDM para abrir o flyout da configuração da ferramenta de esquema.

    Flyout de configuração do assistente de criação de esquema do EDM.

  3. Preencha umNome e umaDescrição apropriados.

  4. Escolha Ignorar delimitadores e pontuação para todos os campos de esquema se você quiser aplicar o comportamento Ignore... para todo o esquema. Para obter mais informações sobre como configurar o EDM para ignorar casos ou delimitadores, consulte Usando os campos caseInsensitive e ignoredDelimiters para obter mais detalhes sobre esse recurso.

  5. Preencha os valores desejados para seu Campo de esquema #1 e adicione mais campos, conforme necessário. Cada campo de esquema deve ser idêntico aos cabeçalhos de coluna em seu arquivo de origem de informações confidenciais.

  6. Se desejar, defina os valores por campo para o seguinte:

    • O campo é pesquisável
    • O campo é insensibilidade de maiúsculas de minúsculas
    • Escolha delimitadores e pontuação para ignorar para este campo
    • Insira delimitadores personalizados e pontuação para este campo

    Importante

    Pelo menos um, mas não mais de dez, de seus campos de esquema devem ser designados como pesquisáveis.

  7. Escolha Salvar. Seu esquema agora está listado e disponível para uso.

    Importante

    Se você quiser remover um esquema que já está associado a um SIT EDM, primeiro exclua o SIT do EDM. Excluir um esquema que tem um armazenamento de dados associado a ele também exclui o armazenamento de dados dentro de 24 horas.

Exportando o arquivo de esquema EDM no formato XML

Se você criou o esquema EDM na ferramenta de esquema EDM, deverá exportar o arquivo de esquema no formato XML. Você precisará do arquivo XML para concluir o Hash e carregar a tabela de origem de informações confidenciais para que os dados exatos correspondam à fase de tipos de informações confidenciais .

  1. Conectar-se a Segurança e Conformidade do PowerShell.

  2. Para exportar o arquivo de esquema EDM, use esta sintaxe:

    $Schema = Get-DlpEdmSchema -Identity "[your EDM Schema name]"
    Set-Content -Path ".\Schemafile.xml" -Value $Schema.EdmSchemaXML
    
  3. Salve este arquivo para uso posterior.

Criar e carregar o arquivo de esquema de correspondência de dados exato manualmente

Ao criar seu arquivo de esquema, os cabeçalhos de coluna (campos de dados) devem seguir os seguintes requisitos de nomenclatura:

  • Deve começar com uma letra e deve consistir em pelo menos três caracteres alfanuméricos.
  • Deve incluir apenas caracteres alfanuméricos.

Use a seguinte sintaxe para cada campo coluna/dados:

<Field name="FieldName" searchable="true/false" caseInsensitive="true/false" ignoredDelimiters="delimiter characters" />

Usando os campos caseInsensitive e ignoredDelimiters

O exemplo XML de esquema a seguir faz uso dos caseInsensitive campos e ignoredDelimiters .

Quando você incluir o caseInsensitive campo definido como o valor de em sua definição de true esquema, o EDM não excluirá um item com base nas diferenças de caso. Por exemplo, o EDM vê os valores FOO-1234 e fOo-1234 como idênticos para o PatientID campo.

Quando você inclui o ignoredDelimiters campo com caracteres com suporte, o EDM ignora esses caracteres. Assim, o EDM vê os valores FOO-1234 e FOO#1234 como idênticos para o PatientID campo.

Neste exemplo, em que ambos caseInsensitive e ignoredDelimiters são usados, o EDM vê FOO-1234 e fOo#1234 como idênticos e classifica o item como um tipo de informação confidencial de registro do paciente.

Ambos os parâmetros são usados por campo.

Importante

Se você configurar espaços a serem ignorados, isso só será eficaz para colunas de campo primário e para o qual um tipo de informação confidencial que pode detectar cadeias de caracteres de várias palavras é definido. Caso contrário, a comparação será feita em relação a cada palavra individual no conteúdo que está sendo analisado.

O ignoredDelimiters sinalizador dá suporte a qualquer caractere não numérico, aqui estão alguns exemplos:

  • .
  • -
  • /
  • _
  • *
  • ^
  • #
  • !
  • ?
  • [
  • ]
  • {
  • }
  • \
  • ~
  • ;

O sinalizador ignoredDelimiters não tem suporte para:

  • caracteres de 0 a 9
  • A-Z
  • A-Z
  • "
  • ,

Importante

Ao definir o tipo de informações confidenciais do EDM, ignoredDelimiters não afetará como o tipo de informação confidencial classificação associado ao elemento primário em um padrão EDM identifica o conteúdo em um item. Portanto, se você configurar ignoredDelimiters para um campo pesquisável, precisará verificar se o tipo de informação confidencial usado para um elemento primário com base nesse campo escolherá cadeias de caracteres com e sem esses caracteres presentes.

O número de colunas na tabela de origem de informações confidenciais e o número de campos em seu esquema devem corresponder, a ordem não importa.

Os caracteres usados como separadores de token se comportam de forma diferente dos outros delimitadores. Aqui estão alguns exemplos:

  • \ (espaço)
  • \T
  • ,
  • .
  • ;
  • ?
  • !
  • \R
  • \n

Quando você inclui um separador de token, o EDM quebra o token em que o separador está. Por exemplo, o EDM vê o valor Middle-Last Name em Middle-Last e Name para o LastName campo. Se o ignoredDelimiters for incluído para o LastName campo com o caractere '-', essa ação só acontecerá depois que o valor for quebrado. No final, o EDM veria os seguintes valores MiddleLast e Name.

Para usar os caracteres a seguir como ignoredDelimiters e não separadores de token, um SIT que corresponda ao formato correspondente precisa ser associado ao campo. Por exemplo, um SIT que detecta uma cadeia de caracteres de várias palavras com traços nele precisa ser associado ao LastName campo.

  • .
  • ;
  • !
  • ?
  • \

É possível associar SITs a elementos secundários usando o PowerShell.

  1. Defina o esquema no formato XML (semelhante ao exemplo a seguir). Nomeie esse arquivo de esquemaedm.xml e configure-o de modo que, para cada coluna na tabela de origem de informações confidenciais, haja uma linha que usa a sintaxe:

    \<Field name="" searchable=""/\>.

    • Use nomes de coluna para valores de Nome de campo.
    • Use searchable="true" para os campos que você deseja ser pesquisáveis e campos primários até um máximo de cinco campos. Pelo menos um campo deve ser pesquisável.

    Como exemplo, o seguinte arquivo XML define o esquema de um banco de dados de registros de pacientes, com cinco campos especificados como pesquisáveis: , , , e DOBPhone. SSNMRNPatientID

    (Você pode copiar, modificar e usar nosso exemplo.)

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
          <DataStore name="PatientRecords" description="Schema for patient records" version="1">
                <Field name="PatientID" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
                <Field name="MRN" searchable="true" />
                <Field name="FirstName" />
                <Field name="LastName" />
                <Field name="SSN" searchable="true" />
                <Field name="Phone" searchable="true" />
                <Field name="DOB" searchable="true" />
                <Field name="Gender" />
                <Field name="Address" />
          </DataStore>
    </EdmSchema>
    

    Depois de criar o arquivo de esquema EDM no formato XML, você precisará carregá-lo no serviço de nuvem.

  2. Conectar-se a Segurança e Conformidade do PowerShell.

  3. Para carregar o esquema de banco de dados, execute o seguinte comando:

    New-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    

    Você será solicitado a confirmar, da seguinte maneira:

    Confirmar

    Tem certeza que deseja executar essa ação?

    Novo esquema EDM para o armazenamento de dados 'patientrecords' será importado.

    [Y] Sim [A] Sim para Todos [N] Não [L] Não para Todos [?] Ajuda (padrão é "Y"):

    Dica

    Se você quiser que suas alterações ocorram sem confirmação, não use -Confirm:$true na Etapa 3.

Observação

Pode levar de 10 a 60 minutos para atualizar o EDMSchema com as adições. A atualização deve ser concluída antes que você execute as etapas que usam as adições.

Próxima etapa