Udostępnij za pomocą


Często zadawane pytania w programie PolyBase

Dotyczy: SQL Server 2016 (13.x) i nowsze wersje

Program PolyBase a serwery połączone

W poniższej tabeli przedstawiono różnice między funkcjami programu PolyBase i połączonymi serwerami:

PolyBase Linked Servers
Obiekt o zakresie bazy danych Obiekt o zakresie wystąpienia
Używa sterowników ODBC Używa dostawców OLEDB
Obsługuje operacje tylko do odczytu dla wszystkich źródeł danych i zapisu w niektórych zewnętrznych źródłach danych Obsługuje operacje odczytu i zapisu
Zapytania do zdalnego źródła danych z jednego połączenia można skalować w poziomie Zapytania do zdalnego źródła danych z jednego połączenia nie mogą być skalowane w poziomie
Obsługiwane jest wypychanie predykatów Obsługiwane jest wypychanie predykatów
Dla grupy dostępności nie jest wymagana żadna oddzielna konfiguracja Oddzielna konfiguracja wymagana dla każdego wystąpienia w grupie dostępności
Tylko uwierzytelnianie podstawowe Uwierzytelnianie podstawowe i zintegrowane
Nadaje się do analizy zapytań przetwarzających dużą liczbę wierszy Odpowiednie dla zapytań OLTP zwracających pojedyncze lub kilka wierszy
Zapytania korzystające z tabeli zewnętrznej nie mogą uczestniczyć w transakcji rozproszonej Zapytania rozproszone mogą uczestniczyć w transakcji rozproszonej

Co nowego w programie PolyBase w programie SQL Server 2022?

Program SQL Server 2022 (16.x) obsługuje teraz pliki CSV, Parquet i Delta przechowywane na koncie usługi Azure Storage w wersji 2, usłudze Azure Data Lake Storage Gen2 lub dowolnym magazynie obiektów zgodnym z protokołem S3 przy użyciu interfejsu API REST S3, lokalnego lub w chmurze.

Program SQL Server 2022 (16.x) może teraz używać polecenia CREATE EXTERNAL TABLE jako SELECT (CETAS) wraz z poleceniami takimi jak OPENROWSET, CREATE EXTERNAL TABLE (CET) i wszystkimi nowymi ulepszeniami języka T-SQL.

Obecnie obsługa zewnętrznych źródeł danych hadoop została usunięta w programie SQL Server 2022 (16.x).

Aktualizacja zbiorcza 2 programu SQL Server 2022 (16.x) wprowadza teraz obsługę plików TNS Oracle. Aby uzyskać więcej informacji i przykładów, zapoznaj się z CREATE EXTERNAL DATA SOURCE.

Przeczytaj więcej na temat wirtualizacji danych za pomocą technologii PolyBase dla programu SQL Server 2022 i zapoznaj się z ulepszeniami programu SQL Server 2022 PolyBase.

Co nowego w programie PolyBase w programie SQL Server 2019?

Program PolyBase w programie SQL Server 2019 (15.x) może teraz odczytywać dane z większej gamy źródeł danych. Dane z tych zewnętrznych źródeł danych mogą być przechowywane jako tabele zewnętrzne w programie SQL Server. Technologia PolyBase obsługuje również obliczenia wypychane do tych zewnętrznych źródeł danych, z wyłączeniem typów ogólnych ODBC.

Zgodne źródła danych

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Zgodne typy ogólne ODBC

Aktualizacja zbiorcza 19 programu SQL Server 2019 (15.x) wprowadza teraz obsługę plików TNS Oracle. Aby uzyskać więcej informacji i przykładów, zapoznaj się z CREATE EXTERNAL DATA SOURCE.

Note

Technologia PolyBase umożliwia nawiązywanie połączenia z zewnętrznymi źródłami danych przy użyciu sterowników ODBC innych firm. Te sterowniki nie są dostarczane wraz z technologią PolyBase i mogą nie działać zgodnie z oczekiwaniami. Aby uzyskać więcej informacji, zobacz Configure PolyBase to access external data with ODBC generic types (Konfigurowanie technologii PolyBase w celu uzyskiwania dostępu do danych zewnętrznych przy użyciu typów ogólnych ODBC).

Jakie CONNECTION_OPTIONS można określić dla połączenia ze źródłami danych innych firm?

Zapoznaj się z artykułem CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS, aby uzyskać informacje o obsługiwanych opcjach połączenia dostawcy danych dla programu SQL Server, Oracle, Teradata, interfejsu API bazy danych MongoDB dla usługi Cosmos DB i ogólnych dostawców danych ODBC.

Jak wyświetlić zdalny plan wykonywania zapytań obliczeń wypychanych programu PolyBase?

Jest to możliwe za pośrednictwem kilku metod w zależności od wersji programu SQL Server. Zobacz Rozwiązywanie problemów z technologią PolyBase — aby wyświetlić plan zapytania programu PolyBase.

Jak sprawdzić, czy odbywa się obliczanie wypychania polyBase?

Czy technologia PolyBase jest obsługiwana w usłudze Azure SQL Database?

Nie, ale możesz wykonywać zapytania o dane w plikach umieszczonych w usłudze Azure Blob Storage przy użyciu funkcji OPENROWSET lub użyć funkcji CREATE EXTERNAL TABLE do odczytu z bezserwerowej puli SQL w usłudze Synapse Analytics. Aby uzyskać więcej informacji, zobacz Azure SQL can read Azure Data Lake storage files using Synapse SQL external tables (Usługa Azure SQL może odczytywać pliki usługi Azure Data Lake Storage przy użyciu tabel zewnętrznych usługi Synapse SQL).

Czy technologia PolyBase jest obsługiwana w usłudze Azure SQL Managed Instance?

Usługa Azure SQL Managed Instance ma własne możliwości wirtualizacji danych dla usług Azure Data Lake Storage (ADLS) i Azure Blob Storage jako źródeł danych. Aby uzyskać więcej informacji, zobacz Wirtualizacja danych za pomocą usługi Azure SQL Managed Instance.

Które porty należy zezwolić za pośrednictwem zapory dla programu PolyBase?

Nie trzeba otwierać dodatkowych portów dla samej technologii PolyBase, z wyjątkiem grupy skalowania w poziomie programu PolyBase. Bez grupy skalowania w poziomie sama usługa PolyBase nie powinna wymagać żadnej reguły zapory.

Na serwerach z systemem Windows technologia PolyBase będzie korzystać z portów używanych przez program SQL Server w sekcji IPWszystkie ustawienia protokołu TCP/IP w programie SQL Server Configuration Manager. Aby uzyskać więcej informacji, zobacz Właściwości protokołu TCP/IP. Na serwerach z systemem Linux technologia PolyBase będzie korzystać z ustawienia network.tcpport . Aby uzyskać więcej informacji, zobacz Port TCP.

W przypadku grup skalowanych w poziomie programu PolyBase na wielu serwerach z systemem Windows zobacz informacje o porcie w następnym pytaniu.

Należy jednak zezwolić innym portom na komunikację z różnymi zewnętrznymi źródłami danych używanymi przez program PolyBase. Zapoznaj się z dokumentacją konfiguracji ODBC, konfiguracji zasobów platformy Azure lub konkretnej dokumentacji źródła danych. For example:

Source platform Reference
Microsoft SQL Server Porty używane przez program SQL Server
Hortonworks HDP Administering HDFS
Cloudera CDH Porty używane przez składniki CDH

Jakie porty są używane dla grupy skalowania w poziomie technologii PolyBase?

Domyślnie usługa przenoszenia danych PolyBase łączy się z węzłem głównym grupy skalowania w poziomie na wielu portach z portu TCP 16450-16460, zazwyczaj przy użyciu 16450-16453 oraz portu 17001. Te porty są używane tylko w przypadku skonfigurowania grupy skalowania w poziomie programu PolyBase i powinny być dozwolone za pośrednictwem zapór serwera. Instalator programu SQL Server powinien automatycznie utworzyć lokalną regułę zapory zezwalającą na te porty podczas instalacji funkcji. Aby uzyskać więcej informacji, zobacz Konfigurowanie grup skalowanych w poziomie programu PolyBase w systemie Windows.

Note

Grupy skalowania w poziomie programu Microsoft SQL Server PolyBase zostaną wycofane. Funkcje grupy skalowalnego w poziomie zostaną usunięte z produktu w programie SQL Server 2022 (16.x).

Technologia PolyBase w klastrach danych big data a technologia PolyBase w wystąpieniach autonomicznych

Aby uzyskać więcej informacji na temat połączeń przy użyciu łącznika ogólnego ODBC, odwiedź nasz przewodnik Jak skonfigurować typy ogólne ODBC.

W poniższej tabeli przedstawiono funkcje technologii PolyBase dostępne w autonomicznym klastrze danych big data programu SQL Server 2019 (15.x):

Feature Klaster danych big data Wystąpienie autonomiczne
Tworzenie zewnętrznego źródła danych dla programów SQL Server, Oracle, Teradata i Mongo DB X X
Tworzenie zewnętrznego źródła danych przy użyciu zgodnego sterownika ODBC innej firmy X
Tworzenie zewnętrznego źródła danych dla źródła danych USŁUGI HADOOP X X
Tworzenie zewnętrznego źródła danych dla usługi Azure Blob Storage X X
Tworzenie tabeli zewnętrznej w puli danych programu SQL Server X
Tworzenie tabeli zewnętrznej w puli magazynów programu SQL Server X
Skalowanie w poziomie wykonywania zapytań X X (tylko system Windows)

Important

Klastry danych big data programu Microsoft SQL Server 2019 są wycofane. Aby uzyskać więcej informacji, zobacz post ogłoszeniowy na blogu i opcje big data na platformie Microsoft SQL Server.