Dotyczy: SQL Server 2016 (13.x) i nowsze wersje
Program PolyBase a serwery połączone
W poniższej tabeli przedstawiono różnice między funkcjami programu PolyBase i połączonymi serwerami:
| PolyBase | Linked Servers |
|---|---|
| Obiekt o zakresie bazy danych | Obiekt o zakresie wystąpienia |
| Używa sterowników ODBC | Używa dostawców OLEDB |
| Obsługuje operacje tylko do odczytu dla wszystkich źródeł danych i zapisu w niektórych zewnętrznych źródłach danych | Obsługuje operacje odczytu i zapisu |
| Zapytania do zdalnego źródła danych z jednego połączenia można skalować w poziomie | Zapytania do zdalnego źródła danych z jednego połączenia nie mogą być skalowane w poziomie |
| Obsługiwane jest wypychanie predykatów | Obsługiwane jest wypychanie predykatów |
| Dla grupy dostępności nie jest wymagana żadna oddzielna konfiguracja | Oddzielna konfiguracja wymagana dla każdego wystąpienia w grupie dostępności |
| Tylko uwierzytelnianie podstawowe | Uwierzytelnianie podstawowe i zintegrowane |
| Nadaje się do analizy zapytań przetwarzających dużą liczbę wierszy | Odpowiednie dla zapytań OLTP zwracających pojedyncze lub kilka wierszy |
| Zapytania korzystające z tabeli zewnętrznej nie mogą uczestniczyć w transakcji rozproszonej | Zapytania rozproszone mogą uczestniczyć w transakcji rozproszonej |
Co nowego w programie PolyBase w programie SQL Server 2022?
Program SQL Server 2022 (16.x) obsługuje teraz pliki CSV, Parquet i Delta przechowywane na koncie usługi Azure Storage w wersji 2, usłudze Azure Data Lake Storage Gen2 lub dowolnym magazynie obiektów zgodnym z protokołem S3 przy użyciu interfejsu API REST S3, lokalnego lub w chmurze.
Program SQL Server 2022 (16.x) może teraz używać polecenia CREATE EXTERNAL TABLE jako SELECT (CETAS) wraz z poleceniami takimi jak OPENROWSET, CREATE EXTERNAL TABLE (CET) i wszystkimi nowymi ulepszeniami języka T-SQL.
Obecnie obsługa zewnętrznych źródeł danych hadoop została usunięta w programie SQL Server 2022 (16.x).
Aktualizacja zbiorcza 2 programu SQL Server 2022 (16.x) wprowadza teraz obsługę plików TNS Oracle. Aby uzyskać więcej informacji i przykładów, zapoznaj się z CREATE EXTERNAL DATA SOURCE.
Przeczytaj więcej na temat wirtualizacji danych za pomocą technologii PolyBase dla programu SQL Server 2022 i zapoznaj się z ulepszeniami programu SQL Server 2022 PolyBase.
Co nowego w programie PolyBase w programie SQL Server 2019?
Program PolyBase w programie SQL Server 2019 (15.x) może teraz odczytywać dane z większej gamy źródeł danych. Dane z tych zewnętrznych źródeł danych mogą być przechowywane jako tabele zewnętrzne w programie SQL Server. Technologia PolyBase obsługuje również obliczenia wypychane do tych zewnętrznych źródeł danych, z wyłączeniem typów ogólnych ODBC.
Zgodne źródła danych
- SQL Server
- Oracle
- Teradata
- MongoDB
- Zgodne typy ogólne ODBC
Aktualizacja zbiorcza 19 programu SQL Server 2019 (15.x) wprowadza teraz obsługę plików TNS Oracle. Aby uzyskać więcej informacji i przykładów, zapoznaj się z CREATE EXTERNAL DATA SOURCE.
Note
Technologia PolyBase umożliwia nawiązywanie połączenia z zewnętrznymi źródłami danych przy użyciu sterowników ODBC innych firm. Te sterowniki nie są dostarczane wraz z technologią PolyBase i mogą nie działać zgodnie z oczekiwaniami. Aby uzyskać więcej informacji, zobacz Configure PolyBase to access external data with ODBC generic types (Konfigurowanie technologii PolyBase w celu uzyskiwania dostępu do danych zewnętrznych przy użyciu typów ogólnych ODBC).
Jakie CONNECTION_OPTIONS można określić dla połączenia ze źródłami danych innych firm?
Zapoznaj się z artykułem CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS, aby uzyskać informacje o obsługiwanych opcjach połączenia dostawcy danych dla programu SQL Server, Oracle, Teradata, interfejsu API bazy danych MongoDB dla usługi Cosmos DB i ogólnych dostawców danych ODBC.
Jak wyświetlić zdalny plan wykonywania zapytań obliczeń wypychanych programu PolyBase?
Jest to możliwe za pośrednictwem kilku metod w zależności od wersji programu SQL Server. Zobacz Rozwiązywanie problemów z technologią PolyBase — aby wyświetlić plan zapytania programu PolyBase.
Jak sprawdzić, czy odbywa się obliczanie wypychania polyBase?
Czy technologia PolyBase jest obsługiwana w usłudze Azure SQL Database?
Nie, ale możesz wykonywać zapytania o dane w plikach umieszczonych w usłudze Azure Blob Storage przy użyciu funkcji OPENROWSET lub użyć funkcji CREATE EXTERNAL TABLE do odczytu z bezserwerowej puli SQL w usłudze Synapse Analytics. Aby uzyskać więcej informacji, zobacz Azure SQL can read Azure Data Lake storage files using Synapse SQL external tables (Usługa Azure SQL może odczytywać pliki usługi Azure Data Lake Storage przy użyciu tabel zewnętrznych usługi Synapse SQL).
Czy technologia PolyBase jest obsługiwana w usłudze Azure SQL Managed Instance?
Usługa Azure SQL Managed Instance ma własne możliwości wirtualizacji danych dla usług Azure Data Lake Storage (ADLS) i Azure Blob Storage jako źródeł danych. Aby uzyskać więcej informacji, zobacz Wirtualizacja danych za pomocą usługi Azure SQL Managed Instance.
Które porty należy zezwolić za pośrednictwem zapory dla programu PolyBase?
Nie trzeba otwierać dodatkowych portów dla samej technologii PolyBase, z wyjątkiem grupy skalowania w poziomie programu PolyBase. Bez grupy skalowania w poziomie sama usługa PolyBase nie powinna wymagać żadnej reguły zapory.
Na serwerach z systemem Windows technologia PolyBase będzie korzystać z portów używanych przez program SQL Server w sekcji IPWszystkie ustawienia protokołu TCP/IP w programie SQL Server Configuration Manager. Aby uzyskać więcej informacji, zobacz Właściwości protokołu TCP/IP. Na serwerach z systemem Linux technologia PolyBase będzie korzystać z ustawienia network.tcpport . Aby uzyskać więcej informacji, zobacz Port TCP.
W przypadku grup skalowanych w poziomie programu PolyBase na wielu serwerach z systemem Windows zobacz informacje o porcie w następnym pytaniu.
Należy jednak zezwolić innym portom na komunikację z różnymi zewnętrznymi źródłami danych używanymi przez program PolyBase. Zapoznaj się z dokumentacją konfiguracji ODBC, konfiguracji zasobów platformy Azure lub konkretnej dokumentacji źródła danych. For example:
| Source platform | Reference |
|---|---|
| Microsoft SQL Server | Porty używane przez program SQL Server |
| Hortonworks HDP | Administering HDFS |
| Cloudera CDH | Porty używane przez składniki CDH |
Jakie porty są używane dla grupy skalowania w poziomie technologii PolyBase?
Domyślnie usługa przenoszenia danych PolyBase łączy się z węzłem głównym grupy skalowania w poziomie na wielu portach z portu TCP 16450-16460, zazwyczaj przy użyciu 16450-16453 oraz portu 17001. Te porty są używane tylko w przypadku skonfigurowania grupy skalowania w poziomie programu PolyBase i powinny być dozwolone za pośrednictwem zapór serwera. Instalator programu SQL Server powinien automatycznie utworzyć lokalną regułę zapory zezwalającą na te porty podczas instalacji funkcji. Aby uzyskać więcej informacji, zobacz Konfigurowanie grup skalowanych w poziomie programu PolyBase w systemie Windows.
Note
Grupy skalowania w poziomie programu Microsoft SQL Server PolyBase zostaną wycofane. Funkcje grupy skalowalnego w poziomie zostaną usunięte z produktu w programie SQL Server 2022 (16.x).
Technologia PolyBase w klastrach danych big data a technologia PolyBase w wystąpieniach autonomicznych
Aby uzyskać więcej informacji na temat połączeń przy użyciu łącznika ogólnego ODBC, odwiedź nasz przewodnik Jak skonfigurować typy ogólne ODBC.
W poniższej tabeli przedstawiono funkcje technologii PolyBase dostępne w autonomicznym klastrze danych big data programu SQL Server 2019 (15.x):
| Feature | Klaster danych big data | Wystąpienie autonomiczne |
|---|---|---|
| Tworzenie zewnętrznego źródła danych dla programów SQL Server, Oracle, Teradata i Mongo DB | X | X |
| Tworzenie zewnętrznego źródła danych przy użyciu zgodnego sterownika ODBC innej firmy | X | |
| Tworzenie zewnętrznego źródła danych dla źródła danych USŁUGI HADOOP | X | X |
| Tworzenie zewnętrznego źródła danych dla usługi Azure Blob Storage | X | X |
| Tworzenie tabeli zewnętrznej w puli danych programu SQL Server | X | |
| Tworzenie tabeli zewnętrznej w puli magazynów programu SQL Server | X | |
| Skalowanie w poziomie wykonywania zapytań | X | X (tylko system Windows) |
Important
Klastry danych big data programu Microsoft SQL Server 2019 są wycofane. Aby uzyskać więcej informacji, zobacz post ogłoszeniowy na blogu i opcje big data na platformie Microsoft SQL Server.