Conectar o Azure Data Lake Storage Gen2 para armazenamento de fluxo de dados
Você pode configurar fluxos de dados para armazenar dados na conta do Azure Data Lake Storage Gen2 de sua organização. Este artigo descreve as etapas gerais necessárias para fazê-lo e fornece orientação e práticas recomendadas ao longo do processo.
Importante
O fluxo de dados com recurso de Tabelas analíticas utiliza o serviço Link do Azure Synapse para o Dataverse, que pode oferecer diferentes níveis de compromissos de conformidade, privacidade, segurança e localização de dados. Para saber mais sobre o Azure Synapse Link para Dataverse, acesse O que é o Azure Synapse Link para Dataverse?.
Há algumas vantagens em configurar para que fluxos de dados armazenem as definições e arquivos de dados no data lake, como:
- O Azure Data Lake Storage Gen2 fornece um local de armazenamento extremamente escalonável para os dados.
- Os arquivos de definição e de dados de fluxo de dados podem ser usados pelos desenvolvedores de seu departamento de TI para aproveitar os serviços de IA (inteligência artificial) e dados do Azure, conforme demonstrado nos exemplos do GitHub dos serviços de dados do Azure.
- Permite que os desenvolvedores da sua organização integrem dados de fluxo de dados a aplicativos internos e soluções de linha de negócios, usando recursos para desenvolvedores em fluxos de dados e no Azure.
Requisitos
Para usar o Azure Data Lake Storage Gen2 para fluxos de dados, faça o seguinte:
- Um ambiente do Power Apps. Qualquer plano do Power Apps permitirá que você crie fluxos de dados com Azure Data Lake Storage Gen2 como destino. Você precisará ser autorizado no ambiente como um criador.
- Uma assinatura do Azure. Você precisa de uma assinatura do Azure para usar o Azure Data Lake Storage Gen2.
- Um grupo de recursos. Use um grupo de recursos existente ou crie um.
- Uma conta de armazenamento do Azure. A conta de armazenamento deve ter o recurso Data Lake Storage Gen2 habilitado.
Dica
Se você não tiver uma assinatura do Azure, crie uma conta de avaliação gratuita antes de começar.
Preparar o Azure Data Lake Storage Gen2 para fluxos de dados do Power Platform
Antes de configurar o ambiente com uma conta do Azure Data Lake Storage Gen2, você deve criar e configurar uma conta de armazenamento. Aqui estão os requisitos para fluxos de dados do Power Platform:
- A conta de armazenamento deve ser criada no mesmo locatário do Microsoft Entra ID que seu locatário do Power Apps .
- Recomendamos que a conta de armazenamento seja criada na mesma região que o ambiente do Power Apps em que você planeja usá-la. Para determinar o local em que está o ambiente do Power Apps, entre em contato com o administrador do ambiente.
- A conta de armazenamento deve ter o recurso namespace hierárquico habilitado.
- Você deve receber uma função Proprietário na conta de armazenamento.
As seções a seguir percorrem as etapas necessárias para configurar a conta do Azure Data Lake Storage Gen2.
Criar a conta de armazenamento
Siga as etapas em Criar uma conta de armazenamento do Azure Data Lake Storage Gen2.
- Selecione a mesma região que a do ambiente e defina o armazenamento como StorageV2 (uso geral v2).
- Habilite o recurso de namespace hierárquico.
- Recomendamos que você defina a configuração de replicação como RA-GRS (Armazenamento com redundância geográfica com acesso de leitura).
Conectar o Azure Data Lake Storage Gen2 ao Power Apps
Depois de configurar sua conta do Azure Data Lake Storage Gen2 no portal do Azure, você estará pronto para conectá-la a um fluxo de dados específico ou a um ambiente do Power Apps. Conectar o lake a um ambiente permitirá que outros criadores e administradores no ambiente também criem fluxos de dados que armazenam os dados no lake da sua organização.
Para conectar sua conta do Azure Data Lake Storage Gen2 ao fluxo de dados, siga estas etapas:
Entre no Power Apps e verifique em qual ambiente você está. O comutador de ambiente está localizado no lado direito do cabeçalho.
No painel de navegação à esquerda, selecione a seta para baixo ao lado de Dados.
Na lista exibida, selecione Fluxos de dados e, na barra de comandos, selecione Novo fluxo de dados.
Selecione as tabelas analíticas que deseja. Essas tabelas indicam quais dados você deseja armazenar na conta do Azure Data Lake Store Gen2 da sua organização.
Selecione a conta de armazenamento a ser usada para o armazenamento do fluxo de dados
Se uma conta de armazenamento ainda não tiver sido associada ao ambiente, uma caixa de diálogo Vincular ao data lake será exibida. Você precisará entrar e encontrar o data lake criado nas etapas anteriores. Neste exemplo, nenhum data lake está associado ao ambiente e, portanto, um prompt é exibido solicitando para adicionar um.
Selecionar conta de armazenamento.
A tela Selecionar Conta de Armazenamento é exibida.
Selecione a ID da Assinatura da conta de armazenamento.
Selecione o Nome do grupo de recursos em que a conta de armazenamento foi criada.
Insira o Nome da conta de armazenamento.
Selecione Salvar.
Depois que essas etapas forem concluídas com êxito, a conta do Azure Data Lake Storage Gen2 estará conectada aos fluxos de dados do Power Platform e você poderá continuar para criar um fluxo de dados.
Considerações e limitações
Há algumas considerações e limitações ao trabalhar com o armazenamento de fluxo de dados:
- Não há suporte para a vinculação de uma conta do Azure Data Lake Store Gen2 para armazenamento de fluxo de dados no ambiente padrão.
- Depois que um local de armazenamento de fluxo de dados for configurado para um fluxo de dados, ele não poderá ser alterado.
- Após a vinculação de uma conta de armazenamento, não há suporte à alteração do nome do ambiente e os fluxos de dados vinculados a essa conta de armazenamento falharão. Alterar novamente o nome do ambiente reativará esses fluxos de dados.
- Por padrão, qualquer membro do ambiente poderá acessar dados do fluxo de dados usando o Conector de Fluxos de Dados do Power Platform. No entanto, somente os proprietários de um fluxo de dados podem acessar os arquivos diretamente no Azure Data Lake Storage Gen2. Para autorizar mais pessoas a acessar dados do fluxos de dados direto no lake, autorize-os na Pasta do CDM do fluxo de dados no data lake ou no próprio data lake.
- Quando um fluxo de dados é excluído, a respectiva Pasta do CDM no lake também é excluída.
- Não há suporte para a tentativa de conectar duas tabelas de fluxo de dados entre dois workspaces de tipos de armazenamento distintos: BYOSA (traga seu próprio armazenamento) e Interno.
Importante
Você não deve alterar os arquivos criados por fluxos de dados no lake da organização, nem adicionar arquivos à Pasta do CDM de um fluxo de dados. A alteração de arquivos poderá danificar os fluxos de dados ou alterar seu comportamento e não tem suporte. Os Fluxos de dados do Power Platform só concedem acesso de leitura aos arquivos que eles criam no lake. Se você autorizar outras pessoas ou serviços no sistema de arquivos usado pelos Fluxos de dados do Power Platform, conceda-lhes apenas acesso de leitura a arquivos ou pastas desse sistema de arquivos.
Aviso de privacidade
Ao habilitar a criação de fluxos de dados com Tabelas analíticas em sua organização por meio do serviço Link do Azure Synapse para Dataverse, os detalhes sobre a conta de armazenamento do Azure Data Lake, como o nome da conta de armazenamento, serão enviados e armazenados no Link do Azure Synapse para o serviço Dataverse, que atualmente está localizado fora do limite de conformidade do PowerApps e poderá empregar medidas de privacidade e segurança menores ou diferentes do que as normalmente usadas no PowerApps. Observe que você pode remover a associação do data lake a qualquer momento para descontinuar o uso dessa funcionalidade e os detalhes da conta de armazenamento do Azure Data Lake serão removidos do serviço Link do Azure Synapse para Dataverse. Há mais informações sobre o Link do Azure Synapse para Dataverse disponíveis neste artigo.
Perguntas frequentes
E se já tivesse criado fluxos de dados antes no Azure Data Lake Storage Gen2 da organização e desejasse alterar o local de armazenamento deles?
Não é possível alterar o local de armazenamento de um fluxo de dados depois que ele foi criado.
Quando posso alterar o local de armazenamento do fluxo de dados de um ambiente?
Atualmente, não há suporte para alterar o local de armazenamento do fluxo de dados do ambiente.
Próximas etapas
Este artigo fornece diretrizes sobre como se conectar uma conta do Azure Data Lake Storage Gen2 para armazenamento de fluxo de dados.
Para obter mais informações sobre fluxos de dados, o Common Data Model e o Azure Data Lake Storage Gen2, acesse estes artigos:
- Preparação de dados de autoatendimento com fluxos de dados
- Criando e usando fluxos de dados no Power Apps
- Adicionar dados a uma tabela no Microsoft Dataverse
Para obter mais informações sobre o armazenamento do Azure, acesse este artigo:
Para obter mais informações sobre o Common Data Model, acesse estes artigos:
Você pode fazer perguntas na Comunidade do Power Apps.