Recomendações de rede para a Federação do Lakehouse
Esse artigo fornece diretrizes para configurar um caminho de rede viável entre seus clusters do Azure Databricks ou SQL warehouses e o sistema de banco de dados externo ao qual você está se conectando usando a Federação do Lakehouse.
Lembre-se das informações importantes a seguir:
- Todo o tráfego de rede é diretamente entre clusters do Azure Databricks (ou SQL warehouses) e o sistema de banco de dados externo. Nem o Catálogo do Unity nem o painel de controle do Azure Databricks estão no caminho da rede.
- A computação do Azure Databricks (ou seja, clusters e SQL warehouses) sempre é implantada na nuvem, mas o sistema de banco de dados externo pode ser local ou hospedado em qualquer provedor de nuvem, desde que haja um caminho de rede viável entre a computação do Azure Databricks e o banco de dados externo.
- Se houver restrições de rede de entrada ou de saída na computação do Azure Databricks ou no sistema de banco de dados externo, consulte as seções a seguir para acessar as diretrizes gerais para ajudar você a criar um caminho de rede viável.
Para obter mais informações sobre sistema de rede nos workspaces do Azure Databricks, confira Rede.
O sistema de banco de dados e a computação do Azure Databricks podem ser acessados pela Internet
A conexão deve funcionar sem nenhuma configuração.
O sistema de banco de dados tem restrições de acesso à rede
Se o sistema de banco de dados externo tiver restrições de acesso à rede de entrada ou de saída e o cluster do Azure Databricks ou o SQL warehouse estiver acessível pela Internet, defina as seguintes configurações, dependendo do tipo da computação:
Recursos de computação clássicos:
Configure uma das seguintes soluções de rede:
IP de saída estável na computação do Azure Databricks.
Configure um endereço IP estável junto com um balanceador de carga, Gateway da NAT, gateway de Internet ou equivalente e conecte-o à sub-rede em que a computação do Azure Databricks é implantada. Isso permite que a computação compartilhe um endereço IP público estável que pode ser incluído na lista de permitidos no lado do banco de dados externo.
O sistema de banco de dados externo deve incluir na lista de permitidos o IP estável de computação do Azure Databricks para o tráfego de entrada e de saída.
Link Privado (somente quando o banco de dados externo estiver na mesma nuvem que a computação do Azure Databricks)
Configure uma conexão do Link Privado entre a rede em que o banco de dados está implantado e a rede em que a computação do Azure Databricks está implantada.
Recursos de computação sem servidor:
Entre em contato com sua equipe de conta do Azure Databricks para saber mais sobre os planos para dar suporte ao acesso seguro à rede a bancos de dados externos por meio da computação sem servidor.
A computação do Azure Databricks tem restrições de acesso à rede
Se o sistema de banco de dados externo estiver acessível pela Internet e a computação do Azure Databricks tiver restrições de acesso à rede de entrada ou de saída (o que só será possível se você estiver em uma rede gerenciada pelo cliente), defina uma das seguintes configurações:
Incluir na lista de permitidos o nome do host do banco de dados externo nas regras de firewall da sub-rede em que a computação do Azure Databricks está implantada.
Se você optar por incluir na lista de permitidos o endereço IP do banco de dados externo em vez do nome do host, verifique se o banco de dados externo tem um endereço IP estável.
Link Privado (somente quando o banco de dados externo estiver na mesma nuvem que a computação do Azure Databricks)
Configure uma conexão do Link Privado entre a rede em que o banco de dados está implantado e a rede em que a computação do Azure Databricks está implantada.
A computação do Azure Databricks tem um servidor DNS personalizado
Se o sistema de banco de dados externo estiver acessível pela Internet e a computação do Azure Databricks tiver um servidor DNS personalizado (o que só será possível se você estiver em uma rede gerenciada pelo cliente), adicione o nome do host do sistema de banco de dados ao servidor DNS personalizado para que ele possa ser resolvido.