O OneLake é um data lake lógico único e unificado para o Microsoft Fabric armazenar lakehouses, warehouses, bancos de dados KQL e outros itens. Atalhos são referências inseridas no OneLake que apontam para locais de armazenamento de outros arquivos sem mover os dados originais. A referência embutida faz parecer que os arquivos e pastas são armazenados localmente, mas na realidade; eles existem em outro local de armazenamento. Os atalhos podem ser atualizados ou ter seu itens removidos, mas essas alterações não afetam os dados originais e sua origem.
Neste artigo, você aprenderá a criar um atalho do OneLake em um banco de dados KQL que aponta para fontes internas ou externas do Fabric. Esse tipo de atalho é acessado posteriormente para consulta em conjuntos de consultas KQL usando a função external_table(). Os atalhos criados em um banco de dados KQL não podem ser renomeados e apenas um atalho pode ser criado por vez.
Além de criar atalhos a partir de um banco de dados KQL, os atalhos também podem ser criados a partir de outros itens do Fabric. Esses atalhos também apontam para dados armazenados em fontes internas ou externas do Fabric, mas têm limitações diferentes e são acessados de forma diferente. Para obter mais informações, consulte Atalhos do teclado.
Para acessar os dados em seu banco de dados KQL em outras experiências do Microsoft Fabric, consulte Uma cópia lógica.
Criar atalho
Observação
O fluxo a seguir mostra como criar um atalho que aponta para dados em um Lakehouse no Fabric. Da mesma forma, você pode criar atalhos que apontem para Data Warehouses ou outros bancos de dados KQL.
Navegue até um banco de dados KQL existente.
Selecione Novo>Atalho do OneLake.
Selecionar uma fonte
Em Fontes internas, selecione Microsoft OneLake.
Selecione a fonte de dados à qual você deseja se conectar e selecione Avançar.
Expanda Tabelas e selecione uma tabela específica para se conectar.
Selecione Avançar.
Observação
Para habilitar a aceleração de consulta em um novo atalho, alterne o botão Acelerar para Ativado. Para obter mais informações, consulte Acelerar consultas em atalhos do OneLake.
Selecione Criar.
Observação
Você só pode se conectar a uma subpasta ou tabela por atalho. Para se conectar a mais dados, repita essas etapas e crie atalhos adicionais.
Em Fontes externas, selecione Azure Data Lake Storage Gen2.
Insira as Configurações de conexão de acordo com a tabela a seguir:
Campo
Descrição
Valor
URL
A cadeia de conexão para seu contêiner delta.
https://StorageAccountName.dfs.core.windows.net
Conexão
As conexões definidas anteriormente para o local de armazenamento especificado aparecem no menu suspenso. Se não houver conexões, crie uma nova.
Crie uma nova conexão.
Nome da conexão
O nome da conexão do Azure Data Lake Storage Gen2.
Um nome para a conexão.
Tipo de autenticação
O modelo de autorização. Os modelos com suporte são: Conta Organizacional, chave de conta, Assinatura de Acesso Compartilhado (SAS), entidade de serviço e Identidade do Espaço de Trabalho. Para obter mais informações, confira Atalhos do ADLS.
Dependente do modelo de autorização. Depois de selecionar um tipo de autenticação, preencha as credenciais necessárias.
Selecione Avançar.
Navegue até o local de destino para o atalho.
Se você acabou de usar a conta de armazenamento na URL de conexão, todos os contêineres disponíveis aparecerão na exibição de navegação da esquerda. Se você especificou um contêiner na URL de conexão, somente o contêiner especificado e seu conteúdo aparecerão na exibição de navegação.
Navegue pela conta de armazenamento selecionando uma pasta ou clicando na seta de expansão ao lado de uma pasta.
Nessa exibição, você pode selecionar um ou mais locais de destino dos atalhos. Escolha os locais de destino clicando na caixa de seleção ao lado de uma pasta na exibição de navegação da esquerda.
Selecione Avançar
A página de revisão permite que você verifique todas as suas seleções. Aqui você pode ver cada atalho que será criado. Na coluna de ação, você pode clicar no ícone de lápis para editar o nome do atalho. Você pode clicar no ícone da lixeira para excluir o atalho.
Uma conta do Amazon S3. Para obter mais informações, consulte O que é Amazon S3?
Criar atalho
Navegue até um banco de dados KQL existente.
Selecione Novo>Atalho do OneLake.
Selecionar uma fonte
Em Fontes externas, selecione Amazon S3.
Insira as Configurações de conexão de acordo com a tabela a seguir:
Campo
Descrição
Valor
URL
A cadeia de conexão para seu bucket do Amazon S3.
https://BucketName.s3.RegionCode.amazonaws.com
Conexão
As conexões definidas anteriormente para o local de armazenamento especificado aparecem no menu suspenso. Se não houver conexões, crie uma nova.
Criar nova conexão
Nome da conexão
O nome da conexão do Amazon S3.
Um nome para a conexão.
Tipo de autenticação
A política de Gerenciamento de Identidade e Acesso (IAM). A política deve ter permissões de leitura e lista. Para obter mais informações, confira Usuários do IAM.
A chave secreta do Gerenciamento de Identidade e Acesso (IAM).
A chave secreta.
Selecione Avançar.
Navegue até o local de destino para o atalho.
Se você usou o ponto de extremidade global na URL de conexão, todos os buckets disponíveis aparecerão na exibição de navegação da esquerda. Se você usou um ponto de extremidade específico do bucket na URL de conexão, somente o bucket especificado e seu conteúdo aparecerão na exibição de navegação.
Navegue pela conta de armazenamento selecionando uma pasta ou clicando na seta de expansão ao lado de uma pasta.
Nessa exibição, você pode selecionar um ou mais locais de destino dos atalhos. Escolha os locais de destino clicando na caixa de seleção ao lado de uma pasta na exibição de navegação da esquerda.
Selecione Avançar
A página de revisão permite que você verifique todas as suas seleções. Aqui você pode ver cada atalho que será criado. Na coluna de ação, você pode clicar no ícone de lápis para editar o nome do atalho. Você pode clicar no ícone da lixeira para excluir o atalho.
Selecione Criar.
O banco de dados é atualizado automaticamente. O atalho aparece em Atalhos no painel Explorer.
O atalho do OneLake foi criado. Agora você pode consultar esses dados.
No lado mais à direita do banco de dados, selecione Explorar seus dados. A janela é aberta com alguns exemplos de consultas que você pode executar para ter uma análise inicial dos seus dados.
Substitua o espaço reservado do nome da tabela pelo external_table('nome do atalho').
Selecione Executar ou pressione Shift + Enter para executar uma consulta selecionada.
Mapeamento de tipos de dados
Mapeamento de tipos de dados do Delta Parquet para o Eventhouse
Tipos de dados primitivos Delta são mapeados para tipos de dados escalares do Eventhouse usando as regras a seguir. Para obter mais informações sobre tipos de dados do Eventhouse, consulte Tipos de dados escalares.
As tabelas em um lakehouse do Microsoft Fabric são baseadas na tecnologia Delta Lake comumente usada no Apache Spark. Usando os recursos aprimorados de tabelas Delta, é possível criar soluções de análise avançadas.
Como engenheiro de dados do Fabric, você deve ter experiência no assunto com padrões de carregamento de dados, arquiteturas de dados e processos de orquestração.
Saiba como criar um atalho do OneLake dentro de um lakehouse do Fabric usando um lakehouse, data warehouse ou banco de dados da Linguagem de Consulta Kusto como origem.