Uruchamianie zapytań federacyjnych w programie Microsoft SQL Server

Na tej stronie opisano sposób konfigurowania usługi Lakehouse Federation w celu uruchamiania zapytań federacyjnych na danych programu SQL Server, które nie są zarządzane przez usługę Azure Databricks. Aby dowiedzieć się więcej o federacji Lakehouse, zobacz Łączenie z zewnętrznymi bazami danych i katalogami

Aby nawiązać połączenie z bazą danych serwera SQL Server przy użyciu Lakehouse Federation, należy utworzyć następujące elementy w metabazie katalogu Unity w Azure Databricks (obszary robocze utworzone po 9 listopada 2023 r. mają już automatycznie skonfigurowany metabazę katalogu Unity):

Połączenie z bazą danych programu SQL Server.
Wykaz obcy, który odzwierciedla bazę danych programu SQL Server w Unity Catalog, dzięki czemu można użyć składni zapytań Unity Catalog i narzędzi do zarządzania danymi w celu zarządzania dostępem użytkowników usługi Azure Databricks do bazy danych.

Usługa Lakehouse Federation obsługuje programy SQL Server, Azure SQL Database i Azure SQL Managed Instance.

Zanim rozpoczniesz

Wymagania dotyczące obszaru roboczego:

Obszar roboczy z dostępem do Unity Catalog. Obszary robocze utworzone po 9 listopada 2023 r. są automatycznie włączane dla Unity Catalog, w tym automatyczne aprowizowanie metastore. Nie musisz tworzyć metastore'u ręcznie, chyba że obszar roboczy został stworzony przed automatycznym włączeniem i nie został włączony dla Unity Catalog. Zobacz Rozpocznij pracę z Unity Catalog.

Wymagania dotyczące obliczeń:

Łączność sieciowa od zasobu obliczeniowego do docelowych systemów baz danych. Zobacz Zalecenia dotyczące sieci dla usługi Lakehouse Federation.
Środowisko obliczeniowe usługi Azure Databricks musi używać środowiska Databricks Runtime 13.3 LTS lub nowszego oraz standardowego trybu dostępu lub dedykowanego trybu dostępu .
Magazyny SQL muszą być w wersji pro lub bezserwerowej i muszą używać wersji 2023.40 lub nowszej.

Wymagane uprawnienia:

Aby utworzyć połączenie, musisz być administratorem magazynu metadanych lub użytkownikiem z uprawnieniami CREATE CONNECTION w magazynie metadanych Unity Catalog dołączonym do obszaru roboczego. W obszarach roboczych, które zostały automatycznie włączone do katalogu Unity, administratorzy obszaru roboczego mają domyślnie uprawnienie CREATE CONNECTION.
Aby utworzyć katalog zagraniczny, musisz mieć uprawnienie CREATE CATALOG w metastore i być właścicielem połączenia lub mieć uprawnienia CREATE FOREIGN CATALOG dla połączenia. W obszarach roboczych, które zostały automatycznie włączone do katalogu Unity, administratorzy obszaru roboczego mają domyślnie uprawnienie CREATE CATALOG.

Dodatkowe wymagania dotyczące uprawnień są określone w każdej sekcji odnoszącej się do zadań.

Jeśli planujesz uwierzytelnić się w programie SQL Server przy użyciu identyfikatora Entra firmy Microsoft, ukończ konfigurację w temacie Konfigurowanie identyfikatora entra firmy Microsoft na potrzeby federacji programu SQL Server.

Tworzenie połączenia

Połączenie określa ścieżkę dostępu i dane uwierzytelniające do zewnętrznego systemu bazodanowego. Aby utworzyć połączenie, możesz użyć Eksploratora wykazu lub polecenia CREATE CONNECTION SQL w notesie usługi Azure Databricks lub edytorze zapytań SQL usługi Databricks.

Note

Do utworzenia połączenia można również użyć interfejsu API REST usługi Databricks lub interfejsu wiersza polecenia usługi Databricks. Zobacz POST /api/2.1/unity-catalog/connections oraz polecenia Unity Catalog.

Wymagane uprawnienia: administrator magazynu metadanych lub użytkownik z uprawnieniami CREATE CONNECTION .

Eksplorator wykazu

W obszarze roboczym usługi Azure Databricks kliknij Wykaz.
W górnej części okienka Wykaz kliknij Ikona Dodaj i wybierz pozycję Utwórz połączenie z menu.
Na stronie Podstawy połączenia w kreatorze Konfigurowanie połączenia, wprowadź nazwę połączenia przyjazną dla użytkownika .
Wybierz typ połączenia programu SQL Server.
Wybierz typ uwierzytelniania: OAuth, OAuth maszyna do maszyny lub nazwę użytkownika i hasło (uwierzytelnianie podstawowe).
(Opcjonalnie) Dodaj komentarz.
Kliknij przycisk Dalej.
Na stronie Authentication (Uwierzytelnianie) wprowadź następujące właściwości połączenia dla wystąpienia programu SQL Server. Właściwości specyficzne dla wybranej metody uwierzytelniania są poprzedzone Auth type w nawiasach.
- Host: Serwer SQL.
- (Uwierzytelnianie podstawowe) Port
- (Uwierzytelnianie podstawowe) trustServerCertificate: wartość domyślna to false. W przypadku ustawienia na true, warstwa transportu używa protokołu SSL do szyfrowania kanału i omija łańcuch certyfikatów w celu zweryfikowania ufności. Pozostaw to ustawienie domyślne, chyba że istnieje określona potrzeba obejścia weryfikacji zaufania.
- (Uwierzytelnianie podstawowe) userProvidedServerCertificate: opcjonalnie. Certyfikat publiczny Twojej instancji SQL Server w formacie PEM. Połączenie jest zawsze szyfrowane za pomocą SSL; ten certyfikat służy do weryfikacji tożsamości serwera podczas uzgadniania połączenia TLS, dzięki czemu sterownik potwierdza, że łączy się z serwerem, z którym chcesz się połączyć, zamiast ufać mu bez weryfikacji. Podaj ten certyfikat, jeśli serwer przedstawia certyfikat wystawiony przez prywatny lub wewnętrzny urząd certyfikacji, którego nie ma w domyślnym magazynie zaufanych certyfikatów. Jest to alternatywa dla ustawienia trustServerCertificate na true (co pomija weryfikację tożsamości); jeśli podano certyfikat, ma on pierwszeństwo przed trustServerCertificate.
- (Uwierzytelnianie podstawowe) Użytkownik
- (Uwierzytelnianie podstawowe) Hasło
- (OAuth) Wprowadź szczegóły połączenia zebrane w Konfiguracja Microsoft Entra ID dla federacji SQL Server.
Kliknij pozycję Utwórz połączenie.
(Uwierzytelnianie podstawowe) Na stronie Szczegóły połączenia określ następujące informacje:
- certyfikat serwera zaufania: jest to domyślnie zaznaczone. Po wybraniu warstwa transportu używa protokołu SSL do szyfrowania kanału i pomija łańcuch certyfikatów w celu zweryfikowania zaufania. Pozostaw to ustawienie domyślne, chyba że istnieje określona potrzeba obejścia weryfikacji zaufania.
- Certyfikat serwera dostarczonego przez użytkownika: opcjonalnie. Certyfikat publiczny instancji programu SQL Server zakodowany w formacie PEM. Połączenie jest zawsze szyfrowane przy użyciu protokołu SSL. Ten certyfikat służy do weryfikowania tożsamości serwera podczas uzgadniania protokołu TLS. Potwierdza to, że sterownik łączy się z docelowym serwerem, zamiast bezkrytycznie mu ufać. Podaj tę wartość, gdy serwer używa certyfikatu od prywatnego lub wewnętrznego urzędu certyfikacji, którego nie ma w domyślnym magazynie zaufanych certyfikatów. Jest to alternatywa dla wybrania certyfikatu serwera zaufania, który pomija walidację tożsamości. Gdy podano certyfikat, ma on pierwszeństwo przed opcją Ufaj certyfikatowi serwera.
- intencja aplikacji: typ obciążenia aplikacji podczas nawiązywania połączenia z serwerem.
Kliknij przycisk Dalej.
Na stronie Podstawy katalogu wprowadź nazwę katalogu obcego. Wykaz obcy odzwierciedla bazę danych w zewnętrznym systemie danych, dzięki czemu można wykonywać zapytania o dostęp do danych w tej bazie danych i zarządzać nimi przy użyciu usług Azure Databricks i Unity Catalog.
Kliknij pozycję Utwórz katalog.
Na stronie Access wybierz obszary robocze, w których użytkownicy mogą uzyskiwać dostęp do utworzonego katalogu. Możesz wybrać opcję Wszystkie obszary robocze mają dostęplub kliknij Przypisać do obszarów roboczych, wybierz obszary robocze, a następnie kliknij Przypisz.
Zmień właściciela , który będzie mógł zarządzać dostępem do wszystkich obiektów w katalogu. Zacznij wpisywać główny element w polu tekstowym, a następnie kliknij ten element w zwróconych wynikach.
Nadaj przywileje w katalogu. Kliknij Zezwól:
1. Określ podmioty, które będą miały dostęp do obiektów w katalogu. Zacznij wpisywać główny element w polu tekstowym, a następnie kliknij ten element w zwróconych wynikach.
2. Wybierz ustawienia wstępne przywilejów, aby przyznać każdemu podmiotowi. Wszyscy użytkownicy konta mają przyznane BROWSE domyślnie.
  - Wybierz Czytnik danych z menu rozwijanego, aby nadać read uprawnienia do obiektów w katalogu.
  - Wybierz pozycję Edytor danych z menu rozwijanego, aby przyznać read i modify uprawnienia do obiektów w wykazie.
  - Ręcznie wybierz uprawnienia do udzielenia.
3. Kliknij Grant.
Kliknij przycisk Dalej.
Na stronie Metadane określ pary klucz-wartość tagów. Aby uzyskać więcej informacji, zobacz Zastosuj tagi do obiektów zabezpieczalnych w Unity Catalog.
(Opcjonalnie) Dodaj komentarz.
Kliknij przycisk Zapisz.

Note

(OAuth) Punkt końcowy OAuth dla identyfikatora Azure Entra ID musi być dostępny z adresów IP wykorzystywanych przez płaszczyznę sterowania usługi Azure Databricks. Zobacz Regiony usługi Azure Databricks.

SQL

Uruchom następujące polecenie w notesie lub edytorze zapytań SQL usługi Databricks.

CREATE CONNECTION <connection-name> TYPE sqlserver
OPTIONS (
  host '<hostname>',
  port '<port>',
  user '<user>',
  password '<password>'
);

Zalecamy używanie tajnych danych usługi Azure Databricks zamiast ciągów w postaci zwykłego tekstu dla poufnych wartości, takich jak dane uwierzytelniające. Przykład:

CREATE CONNECTION <connection-name> TYPE sqlserver
OPTIONS (
  host '<hostname>',
  port '<port>',
  user secret ('<secret-scope>','<secret-key-user>'),
  password secret ('<secret-scope>','<secret-key-password>')
)

Aby uzyskać informacje na temat konfigurowania wpisów tajnych, zobacz Zarządzanie wpisami tajnymi.

Aby zweryfikować tożsamość serwera podczas uzgadniania połączenia TLS (na przykład gdy SQL Server przedstawia certyfikat z prywatnego lub wewnętrznego urzędu certyfikacji, którego nie ma w domyślnym magazynie zaufania), przekaż certyfikat serwera zakodowany w formacie PEM w opcji userProvidedServerCertificate. Połączenie jest zawsze szyfrowane przy użyciu protokołu SSL. Ten certyfikat potwierdza, że sterownik łączy się z zamierzonym serwerem zamiast ufać mu ślepo. Ta opcja jest alternatywą trustServerCertificate i ma pierwszeństwo przed nią.

CREATE CONNECTION <connection-name> TYPE sqlserver
OPTIONS (
  host '<hostname>',
  port '<port>',
  user secret ('<secret-scope>','<secret-key-user>'),
  password secret ('<secret-scope>','<secret-key-password>'),
  userProvidedServerCertificate '<pem-encoded-certificate>'
)

Tworzenie wykazu obcego

Note

Jeśli używasz interfejsu użytkownika do utworzenia połączenia ze źródłem danych, uwzględnione jest tworzenie katalogu zewnętrznego i możesz pominąć ten krok.

Wykaz obcy odzwierciedla bazę danych w zewnętrznym systemie danych, dzięki czemu można wykonywać zapytania o dostęp do danych w tej bazie danych i zarządzać nimi przy użyciu usług Azure Databricks i Unity Catalog. Aby utworzyć wykaz obcy, należy użyć połączenia ze źródłem danych, które zostało już zdefiniowane.

Aby utworzyć wykaz obcy, możesz użyć Eksploratora wykazu lub polecenia CREATE FOREIGN CATALOG SQL w notesie usługi Azure Databricks lub edytorze zapytań SQL. Do utworzenia katalogu można również użyć interfejsu API REST usługi Databricks lub interfejsu wiersza polecenia usługi Databricks. Zobacz POST /api/2.1/unity-catalog/catalogs i polecenia Katalogu Unity.

Wymagane uprawnienia:CREATE CATALOG uprawnienie do magazynu metadanych i własność połączenia lub CREATE FOREIGN CATALOG uprawnienia do połączenia.

Eksplorator wykazu

W obszarze roboczym usługi Azure Databricks kliknij Wykaz do otwierania Eksploratora wykazu.
W górnej części okienka Katalogu, kliknij ikonę Dodaj i wybierz Dodaj katalog z menu.

Alternatywnie na stronie Szybki dostęp kliknij na przycisk Wykazy, a następnie kliknij na przycisk Utwórz katalog.
Postępuj zgodnie z instrukcjami dotyczącymi tworzenia katalogów obcych w Tworzenie katalogów.

SQL

Uruchom następujące polecenie SQL w notesie lub edytorze zapytań SQL. Elementy w nawiasach kwadratowych są opcjonalne. Zastąp wartości zastępcze:

<catalog-name>: nazwa wykazu w usłudze Azure Databricks.
<connection-name>: obiekt połączenia określający źródło danych, ścieżkę i poświadczenia dostępu.
<database-name>: nazwa bazy danych, którą chcesz dublować jako wykaz w usłudze Azure Databricks.

CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>
OPTIONS (database '<database-name>');

Obsługiwane funkcje wypychania

W poniższej tabeli wymieniono operacje wypychania obsługiwane dla programu SQL Server wraz z obliczeniami wymaganymi dla każdego z nich.

Wypychanie	Obsługiwane zasoby obliczeniowe
Filters	Wszystkie obliczenia
Zawiera, Rozpoczyna się od, Kończy się na	Wszystkie obliczenia
Limit	Wszystkie obliczenia
Funkcje matematyczne (tylko częściowe, wyrażenia filtru)	Wszystkie obliczenia
Różne funkcje (na przykład Alias, Cast, SortOrder; częściowe, tylko wyrażenia filtrujące)	Wszystkie obliczenia
Projections	Wszystkie obliczenia
Funkcje łańcuchów znakowych (tylko częściowe, wyrażenia filtru)	Wszystkie obliczenia
Aggregates	Środowisko Databricks Runtime 13.3 LTS i nowsze oraz magazyny SQL
Operatory arytmetyczne (na przykład +, -, *, %, /; nieobsługiwane, jeśli usługa ANSI jest wyłączona)	Środowisko Databricks Runtime 13.3 LTS i nowsze oraz magazyny SQL
Operatory Boolowskie (na przykład =, <=>, <, <=, >, >=)	Środowisko Databricks Runtime 13.3 LTS i nowsze oraz magazyny SQL
Operatory bitowe (&, \|, ^ i ~)	Środowisko Databricks Runtime 13.3 LTS i nowsze oraz magazyny SQL
Sortowanie, gdy jest używane z limitem	Środowisko Databricks Runtime 13.3 LTS i nowsze oraz magazyny SQL
Joins	Środowisko Databricks Runtime w wersji 17.2 lub nowszej oraz środowisko obliczeniowe usługi SQL Warehouse. Ta funkcja pushdown jest w publicznej wersji zapoznawczej; włącz przełącznik Join Pushdown for Federated Queries na stronie Wersje zapoznawcze.
Funkcje okna	Nieobsługiwane

Mapowanie typu danych

Podczas odczytywania z programu SQL Server do platformy Spark typy danych są mapowe w następujący sposób:

Typ programu SQL Server	Typ Spark
`bigint`(bez znaku), `decimal`, `money`, , `numericsmallmoney`	`DecimalType`
`smallint`, `tinyint`	`ShortType`
`int`	`IntegerType`
`bigint` (w przypadku podpisania)	`LongType`
`real`	`FloatType`
`float`	`DoubleType`
`char`, `nchar`, `uniqueidentifier`	`CharType`
`nvarchar`, `varchar`	`VarcharType`
`text`, `xml`	`StringType`
`binary`, `geography`, , `geometry`, `image`, `timestamp`, , `udtvarbinary`	`BinaryType`
`bit`	`BooleanType`
`date`	`DateType`
`datetime`, , `datetime2`, , `smalldatetimetime`	`TimestampType`/`TimestampNTZType`

Podczas odczytywania z serwera SQL Server, SQL Server datetimes jest mapowany na Spark TimestampType, jeśli preferTimestampNTZ = false (wartość domyślna). SQL Server datetimes jest mapowany na TimestampNTZType jeśli preferTimestampNTZ = true.

Dodatkowe zasoby

Opinia

Czy ta strona była pomocna?

Last updated on 2026-07-07