Partilhar via


Criar o esquema para tipos de informações confidenciais com base em correspondência exata de dados

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Aplicável a

  • Experiência de criação de tipo de informação confidencial (SIT) de correspondência de dados exata clássica (EDM).

Utilizar o esquema exato de correspondência de dados e a ferramenta de padrão de tipo de informações confidenciais

Se não estiver familiarizado com o SITS baseado em EDM ou com a respetiva implementação, deve familiarizar-se com:

Um único esquema EDM pode ser utilizado em vários tipos de informações confidenciais que utilizam a mesma tabela de dados confidencial. Pode criar até 10 esquemas EDM diferentes num inquilino do Microsoft 365.

Utilizar a Ferramenta de Tipo de Informação Sensível e Esquema de Correspondência de Dados Exata

Pode utilizar esta ferramenta para ajudar a simplificar o processo de criação de ficheiros de esquema.

Pré-requisitos

Utilizar o esquema exato de correspondência de dados e a ferramenta de padrão de tipo de informações confidenciais

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.

  1. Inicie sessão no portal > do Microsoft PurviewProteção de Informações>Classifiers>EDM classifica esquemas> EDM (disponíveis quando a nova experiência de EMD estádesativada).

  2. Selecione Criar esquema EDM para abrir a lista de opções de configuração da ferramenta de esquema.

    Lista de opções de configuração do assistente de criação de esquemas EDM.

  3. Preencha umNome e umaDescrição apropriados.

  4. Selecione Ignorar delimitadores e pontuação para todos os campos de esquema se quiser aplicar o comportamento Ignorar... para todo o esquema. Para obter mais informações sobre como configurar o EDM para ignorar maiúsculas e minúsculas, consulte Utilizar os campos caseInsensitive e ignoredDelimiters para obter mais detalhes sobre esta funcionalidade.

  5. Preencha os valores desejados para seu Campo de esquema #1 e adicione mais campos, conforme necessário. Cada campo de esquema tem de ser idêntico aos cabeçalhos de coluna no ficheiro de origem de informações confidenciais.

  6. Se quiser, defina os valores por campo para o seguinte:

    • O campo é pesquisável
    • O campo não é sensível a maiúsculas e minúsculas
    • Escolher delimitadores e pontuação a ignorar para este campo
    • Introduza delimitadores personalizados e pontuação para este campo

    Importante

    Pelo menos um, mas não mais do que dez, dos campos de esquema tem de ser designado como pesquisável.

  7. Escolha Salvar. O esquema está agora listado e disponível para utilização.

    Importante

    Se quiser remover um esquema que já esteja associado a um SIT EDM, primeiro tem de eliminar o SIT EDM. Eliminar um esquema que tenha um arquivo de dados associado também elimina o arquivo de dados no prazo de 24 horas.

Exportar o ficheiro de esquema EDM no formato XML

Se tiver criado o esquema EDM na ferramenta de esquema EDM, tem de exportar o ficheiro de esquema no formato XML. Precisará do ficheiro XML para concluir o Hash e carregar a tabela de origem de informações confidenciais para a fase exata de tipos de informações confidenciais de correspondência de dados .

  1. Conectar-se a Segurança e Conformidade do PowerShell.

  2. Para exportar o ficheiro de esquema EDM, utilize esta sintaxe:

    $Schema = Get-DlpEdmSchema -Identity "[your EDM Schema name]"
    Set-Content -Path ".\Schemafile.xml" -Value $Schema.EdmSchemaXML
    
  3. Guarde este ficheiro para utilização posterior.

Criar e carregar manualmente o ficheiro de esquema de correspondência de dados exata

À medida que cria o ficheiro de esquema, os cabeçalhos de coluna (campos de dados) têm de cumprir os seguintes requisitos de nomenclatura:

  • Tem de começar com uma letra e tem de consistir em, pelo menos, três carateres alfanuméricos.
  • Tem de incluir apenas carateres alfanuméricos.

Utilize a seguinte sintaxe para cada campo de coluna/dados:

<Field name="FieldName" searchable="true/false" caseInsensitive="true/false" ignoredDelimiters="delimiter characters" />

Utilizar os campos caseInsensitive e ignoredDelimiters

O exemplo XML de esquema que se segue utiliza os caseInsensitive campos e ignoredDelimiters .

Quando inclui o caseInsensitive campo definido como o valor de na definição de true esquema, o EDM não excluirá um item com base nas diferenças de casos. Por exemplo, o EDM vê os valores FOO-1234 e fOo-1234 como idênticos para o PatientID campo.

Quando inclui o ignoredDelimiters campo com carateres suportados, o EDM ignora esses carateres. Assim, a EDM vê os valores FOO-1234 e FOO#1234 como idênticos para o PatientID campo.

Neste exemplo, onde e caseInsensitiveignoredDelimiters são utilizados, o EDM vê FOO-1234 e fOo#1234 como idênticos e classifica o item como um tipo de informação confidencial de registo do paciente.

Ambos os parâmetros são utilizados por campo.

Importante

Se configurar espaços para serem ignorados, isto só será eficaz para colunas de campo primárias e para os quais é definido um tipo de informação confidencial que consegue detetar cadeias de várias palavras. Caso contrário, a comparação será feita em relação a cada palavra individual no conteúdo que está a ser analisado.

O ignoredDelimiters sinalizador suporta qualquer caráter não fantasmagórico. Eis alguns exemplos:

  • .
  • -
  • /
  • _
  • *
  • ^
  • #
  • !
  • ?
  • [
  • ]
  • {
  • }
  • \
  • ~
  • ;

O sinalizador ignoredDelimiters não tem suporte para:

  • caracteres de 0 a 9
  • A-Z
  • A-Z
  • "
  • ,

Importante

Ao definir o seu tipo de informações confidenciais EDM, ignoredDelimiters não afetará a forma como o tipo de informações confidenciais de Classificação associado ao elemento primário num padrão EDM identifica o conteúdo num item. Por isso, se configurar ignoredDelimiters um campo pesquisável, tem de se certificar de que o tipo de informações confidenciais utilizado para um elemento primário baseado nesse campo irá escolher cadeias com e sem esses carateres presentes.

O número de colunas na tabela de origem de informações confidenciais e o número de campos no esquema têm de corresponder, a ordem não importa.

Os carateres que são utilizados como separadores de tokens comportam-se de forma diferente dos outros delimitadores. Aqui estão alguns exemplos:

  • \ (espaço)
  • \t
  • ,
  • .
  • ;
  • ?
  • !
  • \r
  • \n

Quando inclui um separador de token, o EDM quebra o token onde se encontra o separador. Por exemplo, EDM vê o valor De Apelido Médio em Apelido Médio e Nome para o LastName campo. Se o ignoredDelimiters for incluído para o LastName campo com o caráter '-', essa ação só ocorre depois de o valor ser quebrado. No final, o EDM veria os seguintes valores MiddleLast e Name.

Para utilizar os seguintes carateres como e não como ignoredDelimitersseparadores de tokens, é necessário associar um SIT que corresponda ao formato correspondente ao campo. Por exemplo, um SIT que detete uma cadeia de várias palavras com travessões tem de ser associado ao LastName campo.

  • .
  • ;
  • !
  • ?
  • \

É possível associar SITs a elementos secundários com o PowerShell.

  1. Defina o esquema no formato XML (semelhante ao seguinte exemplo). Atribua um nome a este ficheiro de esquema edm.xml e, em seguida, configure-o de modo a que, para cada coluna na tabela de origem de informações confidenciais, exista uma linha que utiliza a sintaxe:

    \<Field name="" searchable=""/\>.

    • Use nomes de coluna para valores de Nome de campo.
    • Utilize searchable="true" para os campos que pretende que sejam pesquisáveis e campos primários até um máximo de cinco campos. Pelo menos um campo deve ser pesquisável.

    Por exemplo, o seguinte ficheiro XML define o esquema de uma base de dados de registos de pacientes, com cinco campos especificados como pesquisáveis: PatientID, MRN, SSN, Phonee DOB.

    (Você pode copiar, modificar e usar nosso exemplo.)

    <EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm">
          <DataStore name="PatientRecords" description="Schema for patient records" version="1">
                <Field name="PatientID" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" />
                <Field name="MRN" searchable="true" />
                <Field name="FirstName" />
                <Field name="LastName" />
                <Field name="SSN" searchable="true" />
                <Field name="Phone" searchable="true" />
                <Field name="DOB" searchable="true" />
                <Field name="Gender" />
                <Field name="Address" />
          </DataStore>
    </EdmSchema>
    

    Depois de criar o ficheiro de esquema EDM no formato XML, tem de carregá-lo para o serviço cloud.

  2. Conectar-se a Segurança e Conformidade do PowerShell.

  3. Para carregar o esquema da base de dados, execute o seguinte comando:

    New-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
    

    Ser-lhe-á pedido que confirme, da seguinte forma:

    Confirmar

    Tem certeza que deseja executar essa ação?

    Será importado o novo Esquema EDM para o arquivo de dados "registos de pacientes".

    [Y] Yes [A] Yes to All [N] No [L] No to All [?] Ajuda (a predefinição é "Y"):

    Dica

    Se quiser que as alterações ocorram sem confirmação, não utilize -Confirm:$true no Passo 3.

Observação

Pode levar de 10 a 60 minutos para atualizar o EDMSchema com as adições. A atualização deve ser concluída antes que você execute as etapas que usam as adições.

Próxima etapa