Recomendações de rede para a Federação do Lakehouse

Esse artigo fornece diretrizes para configurar um caminho de rede viável entre seus clusters do Azure Databricks ou SQL warehouses e o sistema de banco de dados externo ao qual você está se conectando usando a Federação do Lakehouse.

Lembre-se das informações importantes a seguir:

  • Todo o tráfego de rede é diretamente entre clusters do Azure Databricks (ou SQL warehouses) e o sistema de banco de dados externo. Nem o Catálogo do Unity nem o painel de controle do Azure Databricks estão no caminho da rede.
  • A computação do Azure Databricks (ou seja, clusters e SQL warehouses) sempre é implantada na nuvem, mas o sistema de banco de dados externo pode ser local ou hospedado em qualquer provedor de nuvem, desde que haja um caminho de rede viável entre a computação do Azure Databricks e o banco de dados externo.
  • Se houver restrições de rede de entrada ou de saída na computação do Azure Databricks ou no sistema de banco de dados externo, consulte as seções a seguir para acessar as diretrizes gerais para ajudar você a criar um caminho de rede viável.

Para obter mais informações sobre sistema de rede nos workspaces do Azure Databricks, confira Rede.

O sistema de banco de dados e a computação do Azure Databricks podem ser acessados pela Internet

A conexão deve funcionar sem nenhuma configuração.

O sistema de banco de dados tem restrições de acesso à rede

Se o sistema de banco de dados externo tiver restrições de acesso à rede de entrada ou de saída e o cluster do Azure Databricks ou o SQL warehouse estiver acessível pela Internet, defina as seguintes configurações, dependendo do tipo da computação:

Recursos de computação clássicos:

Configure uma das seguintes soluções de rede:

  • IP de saída estável na computação do Azure Databricks.

    Configure um endereço IP estável junto com um balanceador de carga, Gateway da NAT, gateway de Internet ou equivalente e conecte-o à sub-rede em que a computação do Azure Databricks é implantada. Isso permite que a computação compartilhe um endereço IP público estável que pode ser incluído na lista de permitidos no lado do banco de dados externo.

    O sistema de banco de dados externo deve incluir na lista de permitidos o IP estável de computação do Azure Databricks para o tráfego de entrada e de saída.

    • Link Privado (somente quando o banco de dados externo estiver na mesma nuvem que a computação do Azure Databricks)

      Configure uma conexão do Link Privado entre a rede em que o banco de dados está implantado e a rede em que a computação do Azure Databricks está implantada.

    Recursos de computação sem servidor:

    Entre em contato com sua equipe de conta do Azure Databricks para saber mais sobre os planos para dar suporte ao acesso seguro à rede a bancos de dados externos por meio da computação sem servidor.

A computação do Azure Databricks tem restrições de acesso à rede

Se o sistema de banco de dados externo estiver acessível pela Internet e a computação do Azure Databricks tiver restrições de acesso à rede de entrada ou de saída (o que só será possível se você estiver em uma rede gerenciada pelo cliente), defina uma das seguintes configurações:

  • Incluir na lista de permitidos o nome do host do banco de dados externo nas regras de firewall da sub-rede em que a computação do Azure Databricks está implantada.

    Se você optar por incluir na lista de permitidos o endereço IP do banco de dados externo em vez do nome do host, verifique se o banco de dados externo tem um endereço IP estável.

  • Link Privado (somente quando o banco de dados externo estiver na mesma nuvem que a computação do Azure Databricks)

    Configure uma conexão do Link Privado entre a rede em que o banco de dados está implantado e a rede em que a computação do Azure Databricks está implantada.

A computação do Azure Databricks tem um servidor DNS personalizado

Se o sistema de banco de dados externo estiver acessível pela Internet e a computação do Azure Databricks tiver um servidor DNS personalizado (o que só será possível se você estiver em uma rede gerenciada pelo cliente), adicione o nome do host do sistema de banco de dados ao servidor DNS personalizado para que ele possa ser resolvido.