Partilhar via


Criar atalhos para dados locais

Com o OneLake Shortcuts, você pode criar referências virtuais para reunir dados de várias fontes em nuvens, regiões, sistemas e domínios – tudo sem movimentação ou duplicação de dados. Usando um gateway de dados local de malha (OPDG), agora você também pode criar atalhos para fontes de dados locais, como armazenamento compatível com o S3 hospedado localmente. Com esse recurso, você também pode criar atalhos para outras fontes de dados restritas à rede, como buckets do Amazon S3 ou do Google Cloud Storage configurados atrás de um firewall ou Virtual Private Cloud (VPC).

Os gateways de dados locais são agentes de software que você instala em uma máquina Windows e configura para se conectar aos seus pontos de extremidade de dados. Ao selecionar um OPDG ao criar um atalho, você pode estabelecer conectividade de rede entre o OneLake e sua fonte de dados.

Esse recurso está disponível para atalhos compatíveis com Amazon S3, Google Cloud Storage e S3. Você pode usar esse recurso em qualquer espaço de trabalho habilitado para malha.

Neste documento, mostramos como instalar e usar esses gateways de dados locais para criar atalhos para dados locais ou restritos à rede.

Importante

Este recurso está em pré-visualização.

Pré-requisitos

  • Crie ou identifique uma casa de lago de tecido que conterá o(s) seu(s) atalho(s).
  • Identifique o URL do endpoint associado ao seu local compatível com o Amazon S3, o Google Cloud Storage ou o S3.
    • Para compatível com o S3, o ponto de extremidade é a URL do serviço, não um bucket específico. Por exemplo:
      • https://mys3api.contoso.com
      • http://10.0.1.4:9000
    • Para o Amazon S3, o endpoint é o URL de um bucket específico. Por exemplo:
      • https://BucketName.s3.us-east.amazonaws.com
    • Para o Google Cloud Storage, o endpoint é o URL do bucket ou do serviço. Por exemplo:
      • https://storage.googleapis.com
      • https://bucketname.storage.googleapis.com
    • Identifique as credenciais de usuário ou identidade que atendem aos requisitos de acesso e autorização necessários para sua fonte de dados. Suas credenciais geralmente precisam ser capazes de listar buckets, listar objetos e ler dados.
    • Identifique uma máquina física ou virtual que:
      • Tem conectividade de rede com seu endpoint de armazenamento. Este artigo explica como você pode confirmar essa conectividade antes de criar seu atalho.
      • Permite instalar software.
    • Siga as instruções para instalar um Gateway de Dados Local padrão na máquina que você identificou. Certifique-se de instalar a versão mais recente.
    • Se o ponto de extremidade de armazenamento usa um certificado autoassinado para conexões HTTPS, confie nesse certificado na máquina que hospeda o gateway.

Verificar a conectividade do host do gateway

Antes de configurar o atalho, siga estas etapas para confirmar se o gateway pode se conectar ao endpoint de armazenamento.

  1. Faça login na máquina que hospeda o gateway.
  2. Instale um aplicativo cliente que possa consultar fontes de dados compatíveis com o S3, como a interface de linha de comando da Amazon Web Services, WinSCP ou outra ferramenta de escolha.
  3. Conecte-se ao URL do ponto de extremidade e forneça as credenciais identificadas nas etapas de pré-requisito.
  4. Certifique-se de que pode explorar e ler dados a partir da sua localização de armazenamento.

Criar um atalho

Consulte as instruções para criar um atalho compatível com o Amazon S3, o Google Cloud Storage ou o S3.

Durante a criação de atalhos, selecione seu gateway de dados local (OPDG) no campo suspenso Gateway de dados .

Captura de tela mostrando onde selecionar um gateway de dados local durante a criação de atalho do OneLake.

Nota

Se você não vir seu OPDG no campo suspenso Gateway de dados e outra pessoa tiver criado o gateway, peça-lhe para compartilhar o gateway com você a partir da interface Gerenciar conexões e gateways .

Resolução de Problemas

Se você encontrar algum problema de conectividade durante a criação do atalho, tente as seguintes etapas de solução de problemas.

  • Conforme necessário, certifique-se de que a máquina que hospeda seu gateway possa se conectar ao seu endpoint de armazenamento. Siga as etapas para verificar a conectividade.
  • Se você estiver usando HTTPS e precisar usar um certificado autoassinado, verifique se a máquina que hospeda seu gateway confia no certificado. Talvez seja necessário instalar o certificado autoassinado na máquina.