Criar e gerenciar tipos de informações confidenciais de correspondência exata de dados
A correspondência exata de dados (EDM) permite criar um tipo de informação confidencial (SITs) que usa valores de dados exatos para identificar e proteger informações confidenciais. Com o EDM, pode garantir que o seu SIT:
- É facilmente atualizado: adapte-se rapidamente às alterações nos seus dados confidenciais.
- Reduz os falsos positivos: Identifique com precisão as informações corretas, minimizando os erros.
- Adapta-se a dados estruturados: funciona bem com conjuntos de dados organizados.
- Garante privacidade: mantém os dados confidenciais seguros e privados, mesmo da Microsoft.
- Integra-se entre serviços: Funciona com uma gama de serviços de nuvem da Microsoft para uma melhor governança de dados.
Por exemplo, se você tiver números de conta de cliente, o EDM sinalizará especificamente apenas esses números, o que diminui significativamente o risco de sinalizadores incorretos.
A classificação baseada em EDM permite criar tipos confidenciais personalizados que correspondem a valores exatos de um banco de dados. Esse banco de dados pode conter até 100 milhões de linhas de dados e pode ser atualizado diariamente para refletir mudanças, como funcionários, pacientes ou clientes novos ou que saem. Isso garante que seus tipos de informações confidenciais personalizados permaneçam atuais e relevantes.
O que há de diferente em um EDM SIT
Um EDM SIT é diferente dos SITs padrão porque corresponde a valores de dados exatos em vez de depender apenas de padrões ou palavras-chave. Inclui também alguns conceitos específicos:
Esquema
O esquema é um arquivo XML que serve como o modelo para o seu EDM SIT. Define:
- O nome do esquema, mais tarde referido como DataStore.
- Nomes de campos que correspondem às colunas na tabela de fontes de informações confidenciais.
- Quais campos são pesquisáveis, permitindo um controle preciso sobre o que o SIT irá verificar.
- Uma correspondência configurável para refinar sua pesquisa, como diferenciação de maiúsculas e minúsculas ou ignorar pontuação.
Tabela de fontes de informações confidenciais
A tabela de fonte de informações confidenciais é o conjunto de dados real usado para correspondência. Contém:
- Cabeçalhos de coluna que representam os nomes dos campos (como Nome, Sobrenome, Data de Nascimento).
- Linhas que representam registros individuais, com cada célula contendo o valor específico para seu campo.
Tabela de exemplo:
| Nome próprio | Nome de família | Data de nascimento |
|---|---|---|
| Isaías | Langer | 05-05-1960 |
| Adriana | Arqueiro | 11-24-1971 |
| Oscar | Ala | 02-12-1998 |
Pacote de regras
O pacote de regras em um EDM SIT define:
- As correspondências especificam o elemento primário usado para pesquisas exatas, como uma expressão regular ou uma função.
- A classificação determina o tipo de informação sensível que está a ser pesquisada.
- Os níveis de confiança medem a probabilidade de uma correspondência, com base na quantidade de evidências de apoio presentes.
- A proximidade define a distância de caracteres permitida entre os elementos primário e de suporte.
- Os elementos de suporte fornecem contexto adicional, melhorando a precisão reduzindo os falsos positivos e aumentando a confiança. Por exemplo, encontrar "SSN" perto de um número de segurança social ajuda a confirmá-lo.
Elementos de suporte primários e secundários
Em um SIT EDM, o elemento principal é o ponto de dados chave que você está procurando proteger, como um número de segurança social ou número de cartão de crédito. Você deve corresponder o elemento principal a um SIT existente que o Microsoft Purview já possa identificar.
Uma vez detetado o elemento primário, a EDM procura um elemento de apoio secundário, como encontrar o termo "SSN" perto do número de segurança social real. Isso confirma ainda mais a identificação, aumentando a confiança na partida.
Os elementos de suporte nem sempre precisam de padrões fixos, mas se contiverem várias palavras, é necessário um padrão definido.
Criar um SIT baseado em EDM
A criação de um EDM SIT é um processo multifásico. Você pode usar a nova experiência ou a experiência clássica, dependendo das suas necessidades.
A nova experiência EDM
A nova experiência EDM integra a criação de esquemas e a definição de SIT em um fluxo de trabalho simplificado:
- Fluxo de trabalho simplificado: a nova experiência EDM simplifica o processo combinando a criação de esquema e SIT, reduzindo etapas e orientando você através do mapeamento de campos de dados para SITS predefinidos.
- Guarda-corpos adicionais para garantir um melhor desempenho: alerta-o quando os campos são demasiado amplos, ajudando-o a evitar correspondências ineficientes e garantindo um elevado desempenho.
A experiência clássica de EDM
Você pode alternar entre as experiências novas e clássicas, mas recomendamos usar a nova experiência, a menos que suas necessidades se enquadrem em um ou mais destes quatro casos de uso:
- Vários SITs por esquema: A experiência clássica permite que vários SITs sejam mapeados para um único esquema, o que não é possível na nova experiência.
- Gerenciando mais de 10 SITs: Se você precisa criar ou gerenciar mais de 10 SITs, você precisa usar a experiência clássica. Como é possível mapear vários SITs EDM para o mesmo esquema, você pode ter mais de 10 SITs EDM. Tentar criar um décimo primeiro esquema com a nova experiência gera um erro.
- Nomes de esquema personalizados: a experiência clássica permite especificar nomes personalizados para seus esquemas EDM, ao contrário da nova experiência que gera automaticamente nomes de esquema.
- Editando esquemas existentes: se você precisar editar esquemas criados na experiência clássica ou carregados via PowerShell, deverá usar a experiência clássica, pois a nova experiência não oferece suporte a essa funcionalidade.
Use o procedimento para entender como criar um SIT EDM. Selecione a guia apropriada para obter orientação sobre como criar uma com a experiência nova ou clássica .
Verifique se a alternância Nova experiência EDM está definida como Ativado.
Selecione Criar classificador EDM.
Reveja a página Familiarize-se com os passos necessários para colocar o classificador a funcionar e, em seguida, selecione Criar classificador EDM.
Na página Nome e descrição do classificador EDM, nomeie o SIT e adicione uma descrição. O sistema usa este nome, anexado com a palavra schema, para o esquema associado que gera.
Selecione Seguinte.
Na página Escolha um método para definir seu esquema, selecione o método que deseja usar para seu esquema: Carregar um arquivo contendo dados de exemplo ou Definir manualmente sua estrutura de dados.
A prática recomendada é carregar um arquivo de dados de exemplo. O resto deste procedimento assume esta opção.
Selecione Seguinte.
Na página Carregar seu arquivo de exemplo, selecione seu arquivo de exemplo e, em seguida, selecione Carregar arquivo. Selecione Seguinte.
Se forem apresentados erros durante o carregamento, resolva-os e tente novamente.
Na página Selecionar elementos primários:
Na coluna Elemento primário, selecione o elemento principal. Cada elemento primário deve ser mapeado para um SIT. A prática recomendada é selecionar campos que mostrem Correspondência completa na coluna Validação de correspondência.
Na coluna Modo de correspondência para cada campo, designe qual das seguintes opções correspondentes deve ser aplicada:
- Opção 1: Não fazer nada para aceitar o SIT sugerido pelo sistema.
- Opção 2: Expanda o menu suspenso. Em Tipo de Informação Sensível (SIT), escolha o ícone de lápis (Editar) e, em seguida, selecione outro SIT existente.
- Opção 3: Em Modo de correspondência, selecione Token único.
- Opção 4: Em Modo de correspondência, selecione Multi-token.
Selecione Seguinte.
Defina configurações para dados em colunas selecionadas.
- A alternância Usar as mesmas configurações para todas as colunas está definida como Ativado por padrão. Se quiser usar configurações separadas para cada campo de dados, defina a alternância como Desativado.
- A opção Dados em colunas não diferenciam maiúsculas de minúsculas é selecionada por padrão. Para impor a deteção que diferencia maiúsculas de minúsculas , desmarque esta caixa.
- Se necessário, selecione a opção Ignorar delimitadores e pontuação para dados em todas as colunas Você pode selecionar os delimitadores e os sinais de pontuação que deseja ignorar em uma lista ou inserir delimitadores personalizados e sinais de pontuação para ignorar.
Na página Rever definições e concluir, selecione Submeter.
Na página Você criou com êxito um classificador EDM, capture o nome do esquema. Esse nome é necessário ao fazer hash e carregar a tabela de fonte de informações confidenciais para garantir o mapeamento adequado dos dados para o esquema.
Depois de capturar o nome do esquema, selecione Concluído.
Depois de criar seu esquema EDM, a próxima etapa é hash e carregar seus dados confidenciais. Isso garante que os dados possam ser usados com segurança para classificação. Para obter etapas detalhadas sobre hashing e upload de sua tabela de origem, consulte Hash e carregar a tabela de fonte de informações confidenciais para que os dados correspondam exatamente aos tipos de informações confidenciais