Criar um conjunto de regras de verificação

Em um catálogo do Microsoft Purview, você pode criar conjuntos de regras de verificação para permitir que você examine rapidamente as fontes de dados em sua organização.

Um conjunto de regras de verificação é um contêiner para agrupar um conjunto de regras de verificação para que você possa associá-las facilmente a uma verificação. Por exemplo, você pode criar um conjunto de regras de verificação padrão para cada um de seus tipos de fonte de dados e, em seguida, usar esses conjuntos de regras de verificação por padrão para todas as verificações em sua empresa. Você também pode querer que os usuários com as permissões certas criem outros conjuntos de regras de verificação com configurações diferentes com base na necessidade de negócios.

Etapas para criar um conjunto de regras de verificação

Para criar um conjunto de regras de verificação:

  1. No portal de governança do Microsoft Purview do Azure, selecione Mapa de Dados.

  2. Selecione Examinar conjuntos de regras no painel esquerdo e selecione Novo.

  3. Na página Novo conjunto de regras de verificação , selecione as fontes de dados que o scanner de catálogo dá suporte na lista suspensa Tipo de Origem . Você pode criar um conjunto de regras de verificação para cada tipo de fonte de dados que pretende examinar.

  4. Dê ao conjunto de regras de verificação um Nome. O comprimento máximo é de 63 caracteres, sem espaços permitidos. Opcionalmente, insira uma Descrição. O comprimento máximo é de 256 caracteres.

    Captura de tela mostrando a página De conjunto de regras de verificação.

  5. Selecione Continuar.

    A página Selecionar tipos de arquivo é exibida. Observe que as opções de tipo de arquivo nesta página variam de acordo com o tipo de fonte de dados que você escolheu na página anterior. Todos os tipos de arquivo estão habilitados por padrão.

    Captura de tela mostrando a página Selecionar tipos de arquivo.

    A seleção de tipos de arquivo de documento nesta página permite que você inclua ou exclua os seguintes tipos de arquivo do office: .doc, .docm, .docx, .dot, .odp, .ods, .odt, .pdf, .pot, .pps, .ppsx, .ppt, .pptm, .pptx, .xlc, .xls, .xlsb, .xlsm, .xlsx e .xlt.

  6. Habilite ou desabilite um bloco de tipo de arquivo selecionando ou desmarcando sua caixa de marcar. Se você escolher uma fonte de dados de tipo do Data Lake (por exemplo, Azure Data Lake Storage Gen2 ou Blob do Azure), habilite os tipos de arquivo para os quais você deseja ter o esquema extraído e classificado.

  7. Para determinados tipos de fonte de dados, você também pode criar um tipo de arquivo personalizado.

  8. Selecione Continuar.

    A página Selecionar regras de classificação é exibida. Esta página exibe as regras de sistema selecionadas e as regras personalizadas e o número total de regras de classificação selecionadas. Por padrão, todas as regras do sistema marcar caixas são selecionadas

  9. Para as regras que você deseja incluir ou excluir, você pode selecionar ou limpar a regra de classificação de regras do sistema marcar caixas globalmente por categoria.

    Captura de tela mostrando a página Selecionar regras de classificação.

  10. Você pode expandir o nó de categoria e selecionar ou limpar caixas de marcar individuais. Por exemplo, se a regra para o número Argentina.DNI tiver falsos positivos altos, você poderá limpar essa caixa de marcar específica.

    Captura de tela mostrando como selecionar regras do sistema.

  11. Selecione Criar para concluir a criação do conjunto de regras de verificação.

Criar um tipo de arquivo personalizado

O Microsoft Purview dá suporte à adição de uma extensão personalizada e à definição de um delimitador de coluna personalizado em um conjunto de regras de verificação.

Para criar um tipo de arquivo personalizado:

  1. Siga as etapas 1 a 5 em Etapas para criar um conjunto de regras de verificação ou editar um conjunto de regras de verificação existente.

  2. Na página Selecionar tipos de arquivo, selecioneNovo tipo de arquivo para criar um novo tipo de arquivo personalizado.

    Captura de tela mostrando como selecionar Novo tipo de arquivo na página Selecionar tipos de arquivo.

  3. Insira uma extensão de arquivo e uma descrição opcional.

    Captura de tela mostrando a página Novo tipo de arquivo personalizado.

  4. Faça uma das seguintes seleções para conteúdo de arquivo dentro para especificar o tipo de conteúdo do arquivo em seu arquivo:

    • Selecione Delimitador Personalizado e insira seu próprio delimitador personalizado (somente caractere único).

    • Selecione Tipo de Arquivo do Sistema e escolha um tipo de arquivo do sistema (por exemplo, XML) na lista suspensa Tipo de arquivo do sistema .

  5. Selecione Criar para salvar o arquivo personalizado.

    O sistema retorna à página Selecionar tipos de arquivo e insere o novo tipo de arquivo personalizado como um novo bloco.

    Captura de tela mostrando o novo bloco de tipo de arquivo personalizado na página Selecionar tipos de arquivo.

  6. Selecione Editar no novo bloco de tipo de arquivo se você quiser alterá-lo ou excluí-lo.

  7. Selecione Continuar para concluir a configuração do conjunto de regras de verificação.

Ignorar padrões

O Microsoft Purview dá suporte à definição de expressões regulares (regex) para excluir ativos durante a verificação. Durante a verificação, o Microsoft Purview comparará a URL do ativo com essas expressões regulares. Todos os ativos correspondentes a qualquer um dos regexes mencionados serão ignorados durante a verificação.

A folha Ignorar padrões pré-popula um regex para arquivos de transação spark. Você pode remover o padrão pré-existente se ele não for necessário. Você pode definir até 10 padrões de ignorar.

Captura de tela mostrando a folha ignorar padrões com quatro expressões regulares definidas. O primeiro é o regex de transação spark pré-populado, o segundo é \\.txt$, o terceiro é \\.csv$e, por fim, .folderB/.*.

No exemplo acima:

  • Os Regexes 2 e 3 ignoram todos os arquivos que terminam com .txt e .csv durante a verificação.
  • O Regex 4 ignora /folderB/ e todo o conteúdo durante a verificação.

Aqui estão mais algumas dicas que você pode usar para ignorar padrões:

  • Ao processar o regex, o Microsoft Purview adicionará $ ao regex por padrão.

  • Uma boa maneira de entender qual url o agente de verificação comparará com sua expressão regular é navegar pelo catálogo de dados do Microsoft Purview, localizar o ativo que você deseja ignorar no futuro e ver seu nome totalmente qualificado (FQN) na guia Visão geral .

    Captura de tela mostrando o nome totalmente qualificado na guia visão geral de um ativo.

Conjuntos de regras de verificação do sistema

Os conjuntos de regras de verificação do sistema são conjuntos de regras de verificação definidos pela Microsoft que são criados automaticamente para cada catálogo do Microsoft Purview. Cada conjunto de regras de verificação do sistema está associado a um tipo de fonte de dados específico. Ao criar uma verificação, você pode associá-la a um conjunto de regras de verificação do sistema. Sempre que a Microsoft faz uma atualização para esses conjuntos de regras do sistema, você pode atualizá-los em seu catálogo e aplicar a atualização a todas as verificações associadas.

  1. Para exibir a lista de conjuntos de regras de verificação do sistema, selecione Verificar conjuntos de regras no Centro de Gerenciamento e escolha a guia Sistema .

    Captura de tela mostrando a lista de conjuntos de regras de verificação do sistema.

  2. Cada conjunto de regras de verificação do sistema tem um nome, tipo de origem e uma versão. Se você selecionar o número de versão de uma regra de verificação definida na coluna Versão , verá as regras associadas à versão atual e às versões anteriores (se houver).

    Captura de tela mostrando uma página de conjunto de regras de verificação do sistema.

  3. Se uma atualização estiver disponível para um conjunto de regras de verificação do sistema, você poderá selecionar Atualizar na coluna Versão . Na página de regra de verificação do sistema, escolha entre uma versão da lista selecionar uma nova versão para atualizar a lista suspensa. A página fornece uma lista de regras de classificação do sistema associadas à nova versão e à versão atual.

    Captura de tela mostrando como alterar a versão de um conjunto de regras de verificação do sistema.

Associar uma verificação a um conjunto de regras de verificação do sistema

Ao criar uma verificação, você pode optar por associá-la a um conjunto de regras de verificação do sistema da seguinte maneira:

  1. Na página Selecionar um conjunto de regras de verificação , selecione o conjunto de regras de verificação do sistema.

    Captura de tela mostrando como selecionar um conjunto de regras de verificação do sistema para uma verificação.

  2. Selecione Continuar e selecione Salvar e Executar.