Criar o esquema para tipos de informações confidenciais com base em correspondência exata de dados
Dica
Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.
Aplicável a
- Experiência de criação de tipo de informação confidencial (SIT) de correspondência de dados exata clássica (EDM).
Se não estiver familiarizado com o SITS baseado em EDM ou com a respetiva implementação, deve familiarizar-se com:
- Aprenda sobre os tipos de informações confidenciais
- Saiba sobre os tipos exatos de informações confidenciais baseados em correspondência de dados
- Introdução com a correspondência exata de dados com base em tipos de informações confidenciais
Um único esquema EDM pode ser utilizado em vários tipos de informações confidenciais que utilizam a mesma tabela de dados confidencial. Pode criar até 10 esquemas EDM diferentes num inquilino do Microsoft 365.
Utilizar a Ferramenta de Tipo de Informação Sensível e Esquema de Correspondência de Dados Exata
Pode utilizar esta ferramenta para ajudar a simplificar o processo de criação de ficheiros de esquema.
Pré-requisitos
- Execute os passos em Exportar dados de origem para o tipo de informações confidenciais com base na correspondência de dados exata.
Utilizar o esquema exato de correspondência de dados e a ferramenta de padrão de tipo de informações confidenciais
Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.
Inicie sessão no portal > do Microsoft PurviewProteção de Informações>Classifiers>EDM classifica esquemas> EDM (disponíveis quando a nova experiência de EMD estádesativada).
Selecione Criar esquema EDM para abrir a lista de opções de configuração da ferramenta de esquema.
Preencha umNome e umaDescrição apropriados.
Selecione Ignorar delimitadores e pontuação para todos os campos de esquema se quiser aplicar o comportamento Ignorar... para todo o esquema. Para obter mais informações sobre como configurar o EDM para ignorar maiúsculas e minúsculas, consulte Utilizar os campos caseInsensitive e ignoredDelimiters para obter mais detalhes sobre esta funcionalidade.
Preencha os valores desejados para seu Campo de esquema #1 e adicione mais campos, conforme necessário. Cada campo de esquema tem de ser idêntico aos cabeçalhos de coluna no ficheiro de origem de informações confidenciais.
Se quiser, defina os valores por campo para o seguinte:
- O campo é pesquisável
- O campo não é sensível a maiúsculas e minúsculas
- Escolher delimitadores e pontuação a ignorar para este campo
- Introduza delimitadores personalizados e pontuação para este campo
Importante
Pelo menos um, mas não mais do que dez, dos campos de esquema tem de ser designado como pesquisável.
Escolha Salvar. O esquema está agora listado e disponível para utilização.
Importante
Se quiser remover um esquema que já esteja associado a um SIT EDM, primeiro tem de eliminar o SIT EDM. Eliminar um esquema que tenha um arquivo de dados associado também elimina o arquivo de dados no prazo de 24 horas.
Exportar o ficheiro de esquema EDM no formato XML
Se tiver criado o esquema EDM na ferramenta de esquema EDM, tem de exportar o ficheiro de esquema no formato XML. Precisará do ficheiro XML para concluir o Hash e carregar a tabela de origem de informações confidenciais para a fase exata de tipos de informações confidenciais de correspondência de dados .
Para exportar o ficheiro de esquema EDM, utilize esta sintaxe:
$Schema = Get-DlpEdmSchema -Identity "[your EDM Schema name]" Set-Content -Path ".\Schemafile.xml" -Value $Schema.EdmSchemaXML
Guarde este ficheiro para utilização posterior.
Criar e carregar manualmente o ficheiro de esquema de correspondência de dados exata
À medida que cria o ficheiro de esquema, os cabeçalhos de coluna (campos de dados) têm de cumprir os seguintes requisitos de nomenclatura:
- Tem de começar com uma letra e tem de consistir em, pelo menos, três carateres alfanuméricos.
- Tem de incluir apenas carateres alfanuméricos.
Utilize a seguinte sintaxe para cada campo de coluna/dados:
<Field name="FieldName" searchable="true/false" caseInsensitive="true/false" ignoredDelimiters="delimiter characters" />
Utilizar os campos caseInsensitive e ignoredDelimiters
O exemplo XML de esquema que se segue utiliza os caseInsensitive
campos e ignoredDelimiters
.
Quando inclui o caseInsensitive
campo definido como o valor de na definição de true
esquema, o EDM não excluirá um item com base nas diferenças de casos. Por exemplo, o EDM vê os valores FOO-1234 e fOo-1234 como idênticos para o PatientID
campo.
Quando inclui o ignoredDelimiters
campo com carateres suportados, o EDM ignora esses carateres. Assim, a EDM vê os valores FOO-1234 e FOO#1234 como idênticos para o PatientID
campo.
Neste exemplo, onde e caseInsensitive
ignoredDelimiters
são utilizados, o EDM vê FOO-1234 e fOo#1234 como idênticos e classifica o item como um tipo de informação confidencial de registo do paciente.
Ambos os parâmetros são utilizados por campo.
Importante
Se configurar espaços para serem ignorados, isto só será eficaz para colunas de campo primárias e para os quais é definido um tipo de informação confidencial que consegue detetar cadeias de várias palavras. Caso contrário, a comparação será feita em relação a cada palavra individual no conteúdo que está a ser analisado.
O ignoredDelimiters
sinalizador suporta qualquer caráter não fantasmagórico. Eis alguns exemplos:
- .
- -
- /
- _
- *
- ^
- #
- !
- ?
- [
- ]
- {
- }
- \
- ~
- ;
O sinalizador ignoredDelimiters
não tem suporte para:
- caracteres de 0 a 9
- A-Z
- A-Z
- "
- ,
Importante
Ao definir o seu tipo de informações confidenciais EDM, ignoredDelimiters
não afetará a forma como o tipo de informações confidenciais de Classificação associado ao elemento primário num padrão EDM identifica o conteúdo num item. Por isso, se configurar ignoredDelimiters
um campo pesquisável, tem de se certificar de que o tipo de informações confidenciais utilizado para um elemento primário baseado nesse campo irá escolher cadeias com e sem esses carateres presentes.
O número de colunas na tabela de origem de informações confidenciais e o número de campos no esquema têm de corresponder, a ordem não importa.
Os carateres que são utilizados como separadores de tokens comportam-se de forma diferente dos outros delimitadores. Aqui estão alguns exemplos:
- \ (espaço)
- \t
- ,
- .
- ;
- ?
- !
- \r
- \n
Quando inclui um separador de token, o EDM quebra o token onde se encontra o separador. Por exemplo, EDM vê o valor De Apelido Médio em Apelido Médio e Nome para o LastName
campo. Se o ignoredDelimiters
for incluído para o LastName
campo com o caráter '-', essa ação só ocorre depois de o valor ser quebrado. No final, o EDM veria os seguintes valores MiddleLast e Name.
Para utilizar os seguintes carateres como e não como ignoredDelimiters
separadores de tokens, é necessário associar um SIT que corresponda ao formato correspondente ao campo. Por exemplo, um SIT que detete uma cadeia de várias palavras com travessões tem de ser associado ao LastName
campo.
- .
- ;
- !
- ?
- \
É possível associar SITs a elementos secundários com o PowerShell.
Defina o esquema no formato XML (semelhante ao seguinte exemplo). Atribua um nome a este ficheiro de esquema edm.xml e, em seguida, configure-o de modo a que, para cada coluna na tabela de origem de informações confidenciais, exista uma linha que utiliza a sintaxe:
\<Field name="" searchable=""/\>
.- Use nomes de coluna para valores de Nome de campo.
- Utilize
searchable="true"
para os campos que pretende que sejam pesquisáveis e campos primários até um máximo de cinco campos. Pelo menos um campo deve ser pesquisável.
Por exemplo, o seguinte ficheiro XML define o esquema de uma base de dados de registos de pacientes, com cinco campos especificados como pesquisáveis:
PatientID
,MRN
,SSN
,Phone
eDOB
.(Você pode copiar, modificar e usar nosso exemplo.)
<EdmSchema xmlns="http://schemas.microsoft.com/office/2018/edm"> <DataStore name="PatientRecords" description="Schema for patient records" version="1"> <Field name="PatientID" searchable="true" caseInsensitive="true" ignoredDelimiters="-,/,*,#,^" /> <Field name="MRN" searchable="true" /> <Field name="FirstName" /> <Field name="LastName" /> <Field name="SSN" searchable="true" /> <Field name="Phone" searchable="true" /> <Field name="DOB" searchable="true" /> <Field name="Gender" /> <Field name="Address" /> </DataStore> </EdmSchema>
Depois de criar o ficheiro de esquema EDM no formato XML, tem de carregá-lo para o serviço cloud.
Para carregar o esquema da base de dados, execute o seguinte comando:
New-DlpEdmSchema -FileData ([System.IO.File]::ReadAllBytes('.\\edm.xml')) -Confirm:$true
Ser-lhe-á pedido que confirme, da seguinte forma:
Confirmar
Tem certeza que deseja executar essa ação?
Será importado o novo Esquema EDM para o arquivo de dados "registos de pacientes".
[Y] Yes [A] Yes to All [N] No [L] No to All [?] Ajuda (a predefinição é "Y"):
Dica
Se quiser que as alterações ocorram sem confirmação, não utilize
-Confirm:$true
no Passo 3.
Observação
Pode levar de 10 a 60 minutos para atualizar o EDMSchema com as adições. A atualização deve ser concluída antes que você execute as etapas que usam as adições.