Compartilhar via


Criar um esquema e um pacote de regras do EDM SIT (Nova experiência)

Você pode criar o esquema EDM (correspondência exata de dados) e o TIPO de informações confidenciais do EDM (SIT) na nova experiência usando um único fluxo de trabalho no Portal de Conformidade do Microsoft Purview.

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Aplicável a

  • Nova experiência

Se você quiser criar um EDM SIT usando a experiência clássica, consulte Criar um EDM SIT (experiência clássica). Se você precisar de ajuda para decidir qual experiência usar, confira Escolhendo a experiência de criação do EDM SIT correta para você.

Antes de começar

Conclua as etapas nos artigos a seguir antes de iniciar os procedimentos descritos neste artigo.

  1. Exportar dados de origem para tipos de informações confidenciais baseados em correspondência de dados exatos
  2. Criar o arquivo de exemplo SIT do EDM (Nova experiência)

Se você não está familiarizado com SITs baseados em EDM ou sua implementação, é essencial familiarizar-se com os conceitos nos seguintes artigos:

Permissões

Você deve ter permissões de administrador global ou de conformidade para criar, testar e implantar um tipo de informação confidencial personalizado por meio do portal de conformidade. Para obter mais informações sobre funções e permissões, consulte Sobre funções de administrador no Office 365.

Considerações importantes

A seguir estão várias considerações importantes que você deve levar em conta ao criar seu esquema EDM e SITs baseados em EDM.

  • Antes de selecionar seus elementos primários, examine os SITs internos para ter uma ideia de quais atendem melhor às suas necessidades.

  • Para cada EDM SIT, você deve selecionar pelo menos um elemento primário e não mais de 10 elementos primários. Se você tiver um campo de dados de confirmação de vários tokens, escolha uma das seguintes opções:

    1. Selecione Correspondência de vários tokens.
    2. Mapeie os elementos em seus campos de vários tokens para um SIT que possa detectar esse conteúdo. (Quanto mais campos com valores exclusivos você mapear, mais preciso será o SIT do EDM. Mapear vários campos também ajuda a melhorar o desempenho, reduzir a carga de processamento e evitar tempo limite do sistema.)
  • Ao selecionar os elementos primários para seu SIT, selecione campos que garantem que cada linha em sua tabela de dados seja exclusiva. Por exemplo, não use campos como FirstName ou DateOfBirth. Por quê? Como os primeiros nomes e datas de nascimento provavelmente serão duplicados em toda a tabela de dados confidenciais. Em vez disso, use campos com valores exclusivos, como SocialSecurityNumber ou BankAccountNumber.

  • Recomendação: Crie seu esquema EDM a partir de um arquivo de dados de exemplo. Ao seguir esta recomendação, certifique-se de que o arquivo de dados de exemplo adere aos seguintes requisitos:

    • Os dados devem ser organizados como uma tabela, com colunas e linhas. Use os nomes de campo para os cabeçalhos de coluna. (As linhas em sua tabela correspondem aos itens de dados individuais.)
    • Os nomes de campo podem incluir apenas caracteres alfanuméricos.
    • Os nomes de campo devem começar com uma letra e devem consistir em pelo menos três caracteres alfanuméricos.
    • Se esses requisitos de nomenclatura não forem atendidos, erros poderão ocorrer ao carregar seu arquivo de dados de exemplo.
  • Se você usar um arquivo de exemplo de informações confidenciais para configurar seu EDM SIT, o sistema sugerirá o SIT existente para cada campo que detecta melhor os dados carregados, se tal SIT estiver disponível. O Microsoft Purview é padrão para correspondência de token único para detectar conteúdo confidencial. Portanto, se nenhum SITs existente for capaz de detectar os dados de um campo em seu esquema EDM, ele aplicará o modo de correspondência de token único. É fundamental que você verifique se o SIT sugerido para cada elemento detectará a cadeia de caracteres exata que você deseja monitorar:

    1. Verifique se o SIT sugerido não contém nenhum caractere ao redor que difere do conteúdo que você deseja detectar.
    2. Verifique se o SIT sugerido não exclui nenhuma parte válida da cadeia de caracteres, conforme armazenado em sua tabela de informações confidenciais.
    3. Verifique se o SIT usado corresponde de perto ao formato dos dados que você deseja detectar. Por exemplo, procure algo comoNine digits with optional hyphens or spaces, em vez de simplesmente digits, ou marcar em A combination of 32 characters consisting of letters and digits vez de simplesmente text strings.

      Usar SITs que correspondem de perto ao formato dos dados que você está tentando detectar é outra maneira de melhorar a precisão de seus resultados e reduzir o tempo necessário para que a correspondência seja concluída.

Observação

Todos os seus dados são salvos à medida que você navega para frente (Próximo) e para trás (Voltar) pela ferramenta enquanto faz suas seleções. A navegação para trás só dá suporte à movimentação da página de nível superior para a página de nível superior e da sub-página para a sub-página. Você não pode navegar para trás de uma página de nível superior para a sub-página anterior ou de uma sub-página para uma página de nível superior anterior.

Criar seu esquema EDM e SIT

O procedimento a seguir fornece diretrizes passo a passo para criar seu esquema EDM e SITs usando a nova experiência. Para obter uma visão geral conceitual e um diagrama do processo como um todo, consulte Visão geral do fluxo de trabalho EDM (Nova experiência).

Instruções

  1. No portal de conformidade do locatário, acesseclassificadores EDM de classificação> de dados.

  2. Verifique se a alternância da nova experiência EDM está definida como Ativada.

  3. Escolha + Criar classificador EDM.

  4. Nomeie o SIT e adicione uma descrição. O sistema usa esse nome, acrescentado ao esquema de palavras, para o esquema associado que ele gera.

  5. Escolha Avançar.

  6. Selecione o método que você deseja usar para seu esquema: carregue um arquivo que contém dados de exemplo ou defina manualmente sua estrutura de dados. (A melhor prática é carregar um arquivo de dados de exemplo. O restante desse procedimento pressupõe essa opção.)

    Em ambos os casos, você precisa das informações discutidas em Criar um arquivo de exemplo SIT do EDM (Nova experiência) para o arquivo de exemplo.

  7. Escolha Avançar.

  8. Selecione seu arquivo de exemplo e selecione Carregar arquivo. Escolha Avançar.
    (Se os erros forem exibidos durante o upload, endereça-os e tente novamente.)

  9. Na página Selecionar elementos primários :

    1. Na coluna Elemento primário , selecione seu elemento primário. Cada elemento primário deve ser mapeado para um SIT. A melhor prática é selecionar campos que mostram correspondência completa na coluna Validação de Correspondência .
    2. Na coluna Modo de correspondência para cada campo, designe qual das seguintes opções correspondentes serão aplicadas:
      • Opção 1: Não faça nada para aceitar o SIT sugerido pelo sistema.
      • Opção 2: Expanda o menu suspenso. Em SIT (tipo informações confidenciais), escolha o ícone lápis (Editar) e selecione outro SIT existente.
      • Opção 3: Em Modo de correspondência , selecione Token único.
      • Opção 4: Em Modo de correspondência , selecione Vários tokens.
  10. Escolha Avançar.

  11. Configurar configurações para dados em colunas selecionadas.

    • O alternância Usar as mesmas configurações para todas as colunas é definido como Ativado por padrão. Se você quiser usar configurações separadas para cada campo de dados, defina a alternância como Desativada.
    • A opção Dados em colunas são insensíveis a casos é selecionada por padrão. Para impor a detecção sensível a casos , desmarque essa caixa.
    • Se necessário, selecione a opção Ignorar delimitadores e pontuação de dados em todas as colunas Você pode selecionar os delimitadores e as marcas de pontuação que você deseja ignorar de uma lista ou pode inserir delimitadores personalizados e marcas de pontuação a serem ignorados.

Importante

Se você selecionar a opção Ignorar Delimitadores para a coluna de elemento primário em seu esquema, verifique se o SIT para o qual você mapeá-lo foi projetado para corresponder dados com e sem os delimitadores selecionados.

  1. Choose Submit.



Depois de terminar, o EDM gera automaticamente uma regra de detecção para cada um dos elementos primários que você identificou. Ele também cria uma regra de alta confiança e uma regra de confiança média . Regras de alta confiança têm mais requisitos correspondentes do que regras de confiança média, que, por sua vez, têm mais requisitos do que regras de baixa confiança. (Regras de baixa confiança devem ser criadas manualmente.) Você pode examinar e editar essas regras na página Configurar regras de detecção para elementos primários .

Dica

Esses elementos que não são selecionados como primários ainda podem ser usados como evidência corroborativa (de suporte). Quanto mais elementos de suporte encontrados que estão em uma proximidade definida com elementos primários, maior a confiança de que a correspondência é um verdadeiro positivo.

Recomendações

  • Aguarde pelo menos uma hora depois de criar ou editar um esquema antes de baixá-lo e usá-lo para o carregamento de dados EDM. Isso ajuda a garantir que o esquema tenha sido sincronizado com o sistema. Se um esquema for baixado muito cedo, uma mensagem de erro poderá ser exibida ao tentar baixar o esquema por meio da linha de comando.

  • Não use o Agente de Carregamento EDM para baixar, editar manualmente e carregar novamente um esquema. Isso resulta em um erro porque usar o Agente de Carregamento do EDM para baixar um esquema adiciona marcas ao esquema que não passam verificações de criação de esquema.

  • Para ajudar a garantir que todas as evidências corroborativas sejam detectadas, tome uma das seguintes ações: – Cortar campos de evidências corroborativas de vários tokens para o número máximo de tokens com suporte pelo recurso multi token (atualmente cinco tokens).
    - Mapear o campo de vários tokens para um SIT que pode detectar totalmente os dados de vários tokens. - Depois de criar ou editar seu EDM SIT, teste-o usando o cmdlet do PowerShell a seguir e aguarde 24 horas antes de testá-lo em uma solução de política de DLP (prevenção contra perda de dados).

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Próxima etapa