Partilhar via


Criar um arquivo de exemplo do EDM SIT (Nova experiência)

Criar e disponibilizar um SIT (tipo de informação confidencial) baseado em EDM (correspondência exata de dados) é um processo de várias fases. Eles podem ser usados em políticas de prevenção contra perda de dados do Microsoft Purview, descoberta eletrônica e determinadas tarefas de governança de conteúdo.

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Aplicável a

  • Nova experiência

Se você quiser criar um EDM SIT usando a experiência clássica, consulte Criar experiência clássica do EDM SIT.

Antes de começar

Formatar o arquivo de exemplo

O sistema extrairá os nomes de coluna do arquivo de exemplo para criar o esquema e recomendará SITs base para mapear os dados de campo de exemplo. Ele deve ser formatado de forma idêntica ao arquivo de tabela de informações confidenciais de origem e deve conter valores sintéticos representativos dos dados reais. O arquivo pode ser salvo no formato.csv (valores separados por vírgula), .tsv (valores separados por guia) ou separado por pipe (|), mas deve ser o mesmo que o arquivo de tabela de informações confidenciais de origem real. O formato .tsv é recomendado nos casos em que seus valores de dados incluem vírgulas, como endereços de rua.

  • Use cerca de 10 a 20 linhas de dados para garantir que o sistema tenha amostras suficientes para trabalhar.
  • Os valores de campo que contêm vírgulas devem ser incluídos entre aspas ".
  • A primeira linha deve ser a linha de cabeçalho e conter nomes de coluna.
  • O arquivo deve conter pelo menos uma linha de dados.
  • Cada linha de dados deve conter o número correto de campos, correspondente aos cabeçalhos.
  • O arquivo de exemplo pode conter até 32 colunas.
  • O arquivo de exemplo não pode exceder 2,5 MB de tamanho.
  • Os nomes de coluna (campo) devem começar com uma letra, ter pelo menos três caracteres e consistir apenas em caracteres alfanuméricos (A-Z, a z, 0-9) e não podem incluir espaços, sublinhados ou outros caracteres especiais.

Por exemplo, se os dados reais usarem o formato de guia delimitado (.tsv) e forem semelhantes a este:

imagem mostrando uma tabela separada de guia com quatro colunas e três linhas de dados de dados reais artificiais

Em seguida, seu arquivo de exemplo deve ter os mesmos cabeçalhos de coluna, mas usar valores sintéticos para as linhas, assim

FirstName Sobrenome PatientNumber CreditCardNumber
Eric Salomão 987-65-4321 9000000000000000
Lisa Taylor 123-45-6789 500000000000000
Andre Lawson 234-56-7890 200000000000000

Como usar os modelos de arquivo de exemplo

Se você estiver nas versões verticais da área de saúde dos EUA, serviços financeiros dos EUA ou do setor de seguros dos EUA, poderá começar com os seguintes modelos de arquivo de exemplo para acelerar o processo de criação de arquivo de exemplo. Esses arquivos contêm os cabeçalhos de coluna mais usados nos respectivos setores, bem como valores sintéticos nos campos.

Para usar esses modelos:

  1. Baixe o modelo de arquivo de exemplo para seu setor.
  2. Compare os cabeçalhos de coluna no modelo com seus dados de origem reais e escolha os que você deseja usar como campos primários em seu arquivo de exemplo personalizado.
  3. Compare a formatação dos dados de origem reais com a formatação dos valores sintéticos. Altere a formatação dos valores sintéticos para corresponder à formatação dos valores de dados de origem.
  4. Salve seu arquivo de exemplo personalizado a ser usado ao criar o esquema SIT do EDM e o pacote de regras.

Dica

Ao trabalhar na nova experiência, você tem a opção de carregar um arquivo de exemplo ou inserir os valores do arquivo de exemplo manualmente. Recomendamos criar o arquivo de exemplo.

Próxima etapa