Udostępnij za pośrednictwem


Zalecenia dotyczące sieci dla usługi Lakehouse Federation

Ten artykuł zawiera wskazówki dotyczące konfigurowania realnej ścieżki sieciowej między klastrami usługi Azure Databricks lub magazynami SQL oraz zewnętrznym systemem baz danych, z którym nawiązujesz połączenie przy użyciu usługi Lakehouse Federation.

Pamiętaj o następujących ważnych informacjach:

  • Cały ruch sieciowy odbywa się bezpośrednio między klastrami usługi Azure Databricks (lub magazynami SQL) i zewnętrznym systemem bazy danych. Ani wykaz aparatu Unity, ani płaszczyzna sterowania usługi Azure Databricks nie znajdują się na ścieżce sieciowej.
  • Zasoby obliczeniowe usługi Azure Databricks (czyli klastry i magazyny SQL) są zawsze wdrażane w chmurze, ale zewnętrzny system baz danych może być lokalnie lub hostowany u dowolnego dostawcy chmury, o ile istnieje realna ścieżka sieciowa między obliczeniami usługi Azure Databricks a zewnętrzną bazą danych.
  • Jeśli masz ograniczenia dotyczące ruchu przychodzącego lub wychodzącego sieci obliczeniowej usługi Azure Databricks lub zewnętrznego systemu bazy danych, zapoznaj się z poniższymi sekcjami, aby uzyskać ogólne wskazówki ułatwiające utworzenie realnej ścieżki sieciowej.

Aby uzyskać więcej informacji na temat sieci w obszarach roboczych usługi Azure Databricks, zobacz Sieć.

System baz danych i usługa Azure Databricks obliczają zarówno dostępne z Internetu, jak i z Internetu

Połączenie powinno działać bez żadnej konfiguracji.

System bazy danych ma ograniczenia dostępu do sieci

Jeśli zewnętrzny system bazy danych ma ograniczenia dostępu do sieci przychodzącej lub wychodzącej, a klaster usługi Azure Databricks lub usługa SQL Warehouse jest dostępna z Internetu, skonfiguruj jedno z następujących rozwiązań sieciowych w celu nawiązania połączenia z klasycznych zasobów obliczeniowych:

  • Stabilny adres IP ruchu wychodzącego w obliczeniach usługi Azure Databricks.

    Skonfiguruj stabilny adres IP obok modułu równoważenia obciążenia, bramy translatora adresów sieciowych, bramy internetowej lub równoważnej i połącz go z podsiecią, w której są wdrażane obliczenia usługi Azure Databricks. Dzięki temu środowisko obliczeniowe może współużytkować stabilny publiczny adres IP, który może być dozwolony po stronie zewnętrznej bazy danych.

    Zewnętrzny system baz danych powinien zezwalać na listę stabilnych adresów IP obliczeniowych usługi Azure Databricks dla ruchu przychodzącego i wychodzącego.

  • Usługa Private Link (tylko wtedy, gdy zewnętrzna baza danych znajduje się w tej samej chmurze co obliczenia usługi Azure Databricks)

    Skonfiguruj połączenie usługi Private Link między siecią, w której jest wdrażana baza danych, a siecią, w której jest wdrażane środowisko obliczeniowe usługi Azure Databricks.

Skontaktuj się z zespołem konta usługi Azure Databricks, aby dowiedzieć się więcej o planach obsługi bezpiecznego dostępu sieciowego do zewnętrznych baz danych z zasobów obliczeniowych bezserwerowych.

Środowisko obliczeniowe usługi Azure Databricks ma ograniczenia dostępu do sieci

Jeśli zewnętrzny system bazy danych jest dostępny z Internetu, a środowisko obliczeniowe usługi Azure Databricks ma ograniczenia dostępu do sieci przychodzącej lub wychodzącej (co jest możliwe tylko w przypadku korzystania z sieci zarządzanej przez klienta), wykonaj jedną z następujących konfiguracji:

  • Lista dozwolonych nazwy hosta zewnętrznej bazy danych w regułach zapory podsieci, w której jest wdrażana usługa Azure Databricks.

    Jeśli zdecydujesz się na listę dozwolonych zewnętrznego adresu IP bazy danych zamiast nazwy hosta, upewnij się, że zewnętrzna baza danych ma stabilny adres IP.

  • Usługa Private Link (tylko wtedy, gdy zewnętrzna baza danych znajduje się w tej samej chmurze co środowisko obliczeniowe usługi Azure Databricks)

    Skonfiguruj połączenie usługi Private Link między siecią, w której jest wdrażana baza danych, a siecią, w której jest wdrażane środowisko obliczeniowe usługi Azure Databricks.

Obliczenia usługi Azure Databricks mają niestandardowy serwer DNS

Jeśli zewnętrzny system baz danych jest dostępny z Internetu, a środowisko obliczeniowe usługi Azure Databricks ma niestandardowy serwer DNS (który jest możliwy tylko w przypadku korzystania z sieci zarządzanej przez klienta), dodaj nazwę hosta systemu bazy danych do niestandardowego serwera DNS, aby można było go rozpoznać.