Conectar-se ao Azure Data Lake Gen1 no Microsoft Purview

Este artigo descreve o processo para registrar uma fonte de dados Azure Data Lake Storage Gen1 no Microsoft Purview, incluindo instruções para autenticar e interagir com a fonte Azure Data Lake Storage Gen1.

Observação

Azure Data Lake Storage Gen2 agora está geralmente disponível. Recomendamos que você comece a usá-lo hoje. Para obter mais informações, confira a página do produto.

Recursos compatíveis

Extração de metadados Verificação Completa Verificação Incremental Verificação em escopo Classificação Rotulamento Política de Acesso Linhagem Compartilhamento de dados Exibição ao vivo
Sim Sim Sim Sim Sim Sim Não Limitado** Não Não

** Há suporte para linhagem se o conjunto de dados for usado como fonte/coletor no Data Factory atividade Copy

Pré-requisitos

Registrar

Esta seção permitirá que você registre a fonte de dados do ADLS Gen1 e configure um mecanismo de autenticação apropriado para garantir a verificação bem-sucedida da fonte de dados.

Etapas para se registrar

É importante registrar a fonte de dados no Microsoft Purview antes de configurar uma verificação para a fonte de dados.

  1. Abra o portal de governança do Microsoft Purview por:

  2. Navegar até o Mapa de Dados --> Fontes

    Captura de tela que mostra o link para abrir o portal de governança do Microsoft Purview

    Captura de tela que navega até o link Fontes no Mapa de Dados

  3. Criar a hierarquia Collection usando o menu Coleções e atribuir permissões a subcolleções individuais, conforme necessário

    Captura de tela que mostra o menu de coleção para criar hierarquia de coleção

  4. Navegue até a coleção apropriada no menu Fontes e selecione o ícone Registrar para registrar uma nova fonte de dados do ADLS Gen1

    Captura de tela que mostra a coleção usada para registrar a fonte de dados

  5. Selecione a fonte de dados Azure Data Lake Storage Gen1 e selecione Continuar

    Captura de tela que permite a seleção da fonte de dados

  6. Forneça um nome adequado para a fonte de dados, selecione a assinatura relevante do Azure, o nome da conta existente do Data Lake Store e a coleção e selecione Aplicar

    Captura de tela que mostra os detalhes a serem inseridos para registrar a fonte de dados

  7. A conta de armazenamento do ADLS Gen1 será mostrada na Coleção selecionada

    Captura de tela que mostra a fonte de dados mapeada para a coleção para iniciar a verificação

Examinar

Pré-requisitos para verificação

Para ter acesso para verificar a fonte de dados, um método de autenticação na conta de armazenamento do ADLS Gen1 precisa ser configurado. Há suporte para as seguintes opções:

Observação

Se você tiver o firewall habilitado para a conta de armazenamento, deverá usar o método de autenticação de identidade gerenciada ao configurar uma verificação.

  • Identidade gerenciada atribuída pelo sistema (Recomendado) – Assim que a Conta do Microsoft Purview é criada, uma Identidade Gerenciada do sistema é criada automaticamente em Azure AD locatário. Dependendo do tipo de recurso, atribuições específicas de função RBAC são necessárias para que o SAMI do Microsoft Purview execute as verificações.

  • Identidade gerenciada atribuída pelo usuário (versão prévia) – Semelhante a uma identidade gerenciada pelo sistema, uma identidade gerenciada atribuída pelo usuário é um recurso de credencial que pode ser usado para permitir que o Microsoft Purview se autentique no Azure Active Directory. Para obter mais informações, você pode ver nosso guia de identidade gerenciada atribuído pelo usuário.

  • Entidade de Serviço – Neste método, você pode criar uma nova ou usar uma entidade de serviço existente no locatário do Azure Active Directory.

Autenticação para uma verificação

Usar a identidade gerenciada atribuída pelo sistema ou pelo usuário para verificação

É importante dar à sua conta do Microsoft Purview a permissão para verificar a fonte de dados do ADLS Gen1. Você pode adicionar a identidade gerenciada do sistema ou a identidade gerenciada atribuída pelo usuário no nível de Assinatura, Grupo de Recursos ou Recurso, dependendo do que você deseja que ele tenha permissões de verificação.

Observação

Você precisa ser um proprietário da assinatura para poder adicionar uma identidade gerenciada em um recurso do Azure.

  1. No portal do Azure, localize a assinatura, o grupo de recursos ou o recurso (por exemplo, uma conta de armazenamento Azure Data Lake Storage Gen1) que você gostaria de permitir que o catálogo verificasse.

  2. Selecione Visão geral e selecione Gerenciador de dados

    Captura de tela que mostra a conta de armazenamento

  3. Selecione Acesso na navegação superior

    Captura de tela que mostra o Gerenciador de dados da conta de armazenamento

  4. Escolha Selecionar e adicionar o Nome do Microsoft Purview (que é a identidade gerenciada do sistema) ou a identidade gerenciada atribuída pelo usuário(versão prévia), que já foi registrada no Microsoft Purview, no menu Selecionar usuário ou grupo .

  5. Selecione Ler e Executar permissões. Escolha Esta pasta e todas as crianças e Uma entrada de permissão de acesso e uma entrada de permissão padrão nas opções Adicionar, conforme mostrado na captura de tela abaixo. Selecione OK

    Captura de tela que mostra os detalhes para atribuir permissões para a conta do Microsoft Purview

Dica

Uma entrada de permissão de acesso é uma entrada de permissão em arquivos e pastas atuais . Uma entrada de permissão padrão é uma entrada de permissão que será herdada por novos arquivos e pastas. Para conceder permissão somente para arquivos existentes atualmente, escolha uma entrada de permissão de acesso. Para conceder permissão para verificar arquivos e pastas que serão adicionados no futuro, inclua uma entrada de permissão padrão.

Usando a Entidade de Serviço para verificação

Criando uma nova entidade de serviço

Se você precisar criar uma nova entidade de serviço, será necessário registrar um aplicativo em seu locatário Azure AD e fornecer acesso à Entidade de Serviço em suas fontes de dados. Seu administrador global Azure AD ou outras funções, como o Administrador de Aplicativos, pode executar essa operação.

Obtendo a ID do aplicativo da Entidade de Serviço
  1. Copiar a ID do aplicativo (cliente) presente na visão geral da Entidade de Serviço já criada

    Captura de tela que mostra a ID do aplicativo (cliente) para a Entidade de Serviço

Concedendo à Entidade de Serviço acesso à sua conta do ADLS Gen1

É importante dar à entidade de serviço a permissão para examinar a fonte de dados do ADLS Gen2. Você pode adicionar acesso à entidade de serviço no nível de Assinatura, Grupo de Recursos ou Recurso, dependendo das permissões necessárias.

Observação

Você precisa ser proprietário da assinatura para poder adicionar uma entidade de serviço em um recurso do Azure.

  1. Forneça à entidade de serviço acesso à conta de armazenamento abrindo a conta de armazenamento e selecionando Visão geral -->Data Explorer

    Captura de tela que mostra a conta de armazenamento

  2. Selecione Acesso na navegação superior

    Captura de tela que mostra o Gerenciador de dados da conta de armazenamento

  3. Selecione Selecionar e Adicionar a Entidade de Serviço na seleção Selecionar usuário ou grupo.

  4. Selecione Ler e Executar permissões. Escolha Esta pasta e todas as crianças e Uma entrada de permissão de acesso e uma entrada de permissão padrão nas opções Adicionar. Selecione OK

    Captura de tela que mostra os detalhes para atribuir permissões para a entidade de serviço

Criando a verificação

  1. Abra sua conta do Microsoft Purview e selecione o portal de governança Open Microsoft Purview

  2. Navegue até o mapa de dados -->Fontes para exibir a hierarquia de coleção

    Captura de tela que mostra a hierarquia de coleção

  3. Selecione o ícone Nova Verificação na fonte de dados do ADLS Gen1 registrada anteriormente

    Captura de tela que mostra a fonte de dados com o novo ícone de verificação

Se estiver usando a identidade gerenciada atribuída pelo sistema ou pelo usuário

Forneça um Nome para a verificação, selecione o sistema ou a identidade gerenciada atribuída pelo usuário em Credencial, escolha a coleção apropriada para a verificação e selecione Testar conexão. Em uma conexão bem-sucedida, selecione Continuar.

Captura de tela que mostra a opção de identidade gerenciada para executar a verificação

Se estiver usando a Entidade de Serviço

  1. Forneça um Nome para a verificação, escolha a coleção apropriada para a verificação e selecione o + Novo em Credencial

    Captura de tela que mostra a opção de entidade de serviço

  2. Selecione a conexão apropriada do key vault e o nome secreto usado durante a criação da Entidade de Serviço. A ID da Entidade de Serviço é a ID do aplicativo (cliente) copiada conforme indicado anteriormente

    Captura de tela que mostra a opção do cofre de chaves da entidade de serviço

  3. Selecione Testar conexão. Em uma conexão bem-sucedida, selecione Continuar

    Captura de tela que mostra a conexão de teste para a entidade de serviço

Escopo e execução da verificação

  1. Você pode escopo sua verificação para pastas e subpastas específicas escolhendo os itens apropriados na lista.

    Escopo da verificação

  2. Em seguida, selecione um conjunto de regras de verificação. Você pode escolher entre o padrão do sistema, os conjuntos de regras personalizados existentes ou criar um novo conjunto de regras embutido.

    Conjunto de regras de verificação

  3. Se criar um novo conjunto de regras de verificação, selecione os tipos de arquivo a serem incluídos na regra de verificação.

    Verificar tipos de arquivo de conjunto de regras

  4. Você pode selecionar as regras de classificação a serem incluídas na regra de verificação

    Examinar regras de classificação de conjunto de regras

    Seleção de conjunto de regras de verificação

  5. Escolha o gatilho de verificação. Você pode configurar uma agenda ou executar a verificação uma vez.

    gatilho de verificação

    seleção de gatilho de verificação

  6. Examine a verificação e selecione Salvar e executar.

    revisão de verificação

Exibição de verificação

  1. Navegue até a fonte de dados na Coleção e selecione Exibir Detalhes para marcar o status da verificação

    exibir verificação

  2. Os detalhes da verificação indicam o progresso da verificação no último status de execução e o número de ativos verificados e classificados

    exibir detalhes da verificação

  3. O último status de execução será atualizado para Em andamento e concluído depois que a verificação inteira for executada com êxito

    exibir a verificação em andamento

    verificação de exibição concluída

Gerenciando a verificação

Os exames podem ser gerenciados ou executados novamente após a conclusão.

  1. Selecione o nome De verificação para gerenciar a verificação

    gerenciar a verificação

  2. Você pode executar a verificação novamente, editar a verificação, excluir a verificação

    gerenciar opções de verificação

    Observação

    • A exclusão da verificação não exclui os ativos de catálogo criados de verificações anteriores.
    • O ativo não será mais atualizado com alterações de esquema se sua tabela de origem tiver sido alterada e você examinar novamente a tabela de origem depois de editar a descrição na guia esquema do Microsoft Purview.
  3. Você pode executar uma verificação incremental ou uma verificação completa novamente.

    gerenciar a verificação completa ou incremental

    gerenciar resultados de verificação

Próximas etapas

Agora que você registrou sua origem, siga os guias a seguir para saber mais sobre o Microsoft Purview e seus dados.