Funkcje i ograniczenia technologii PolyBase
Dotyczy: SQL Server 2016 (13.x) i nowsze wersje
Azure SQL Database
Azure Synapse Analytics
Analytics Platform System (PDW)
Ten artykuł zawiera podsumowanie funkcji technologii PolyBase dostępnych dla produktów i usług programu SQL Server.
Podsumowanie funkcji dla wydań produktów
W tej tabeli wymieniono najważniejsze funkcje technologii PolyBase i produktów, w których są dostępne.
Funkcja | SQL Server (począwszy od 2016 r.) | Azure SQL Database | Azure Synapse Analytics | Równoległy Magazyn Danych |
---|---|---|---|---|
Wykonywanie zapytań dotyczących danych usługi Hadoop przy użyciu Transact-SQL | Tak | Nie | Nie | Tak |
Importowanie danych z usługi Hadoop | Tak | Nie | Nie | Tak |
Eksportowanie danych do usługi Hadoop | Tak | Nie | Nie | Tak |
Wykonywanie zapytań, importowanie i eksportowanie do usługi Azure HDInsight | Nie | Nie | Nie | Nie |
Wypychanie obliczeń zapytań do usługi Hadoop | Tak | Nie | Nie | Tak |
Importowanie danych z usługi Azure Blob Storage | Tak | Tak 1 | Tak | Tak |
Eksportowanie danych do usługi Azure Blob Storage | Tak | Nie | Tak | Tak |
Importowanie danych z usługi Azure Data Lake Store | Nie | Nie | Tak | Nie |
Eksportowanie danych do usługi Azure Data Lake Store | Nie | Nie | Tak | Nie |
Uruchamianie zapytań PolyBase z narzędzi usługi Microsoft BI | Tak | Nie | Tak | Tak |
1 wprowadzona w programie SQL Server 2017 (14.x), zobacz Przykłady zbiorczego dostępu do danych w usłudze Azure Blob Storage.
Znane ograniczenia
Technologia PolyBase ma następujące ograniczenia:
Przed programem SQL Server 2019 (15.x) maksymalny możliwy rozmiar wiersza, który obejmuje pełną długość kolumn o zmiennej długości, nie może przekroczyć 32 KB w programie SQL Server lub 1 MB w usłudze Azure Synapse Analytics. W programie SQL Server 2019 (15.x) i nowszych wersjach to ograniczenie zostanie zniesione. Limit pozostaje 1 MB dla źródeł danych hadoop, ale jest ograniczony tylko przez maksymalny limit programu SQL Server dla innych źródeł danych.
W przypadku eksportowania danych do formatu pliku ORC z programu SQL Server lub usługi Azure Synapse Analytics kolumny tekstowe mogą być ograniczone. Mogą być ograniczone do maksymalnie 50 kolumn z powodu komunikatów o błędach braku pamięci języka Java. Aby obejść ten problem, wyeksportuj tylko podzbiór kolumn.
Program PolyBase nie może nawiązać połączenia z żadnym wystąpieniem Hadoop, jeśli włączony jest system Knox.
Jeśli używasz tabel Hive z ustawieniem transactional = true, PolyBase nie może uzyskać dostępu do danych w katalogu tej tabeli Hive.
Usługi PolyBase wymagają, aby usługa SQL Server miała włączony protokół sieciowy TCP/IP dla poprawnego działania. Ponadto jeśli ustawienie konfiguracji protokołu TCP/IP Nasłuchuj wszystko jest ustawione na wartość Nie, należy zastosować następujące konfiguracje protokołu TCP/IP:
- Wpis prawidłowego portu odbiornika w portów dynamicznych TCP lub portów TCP w obszarze IPWszystkie. Jest to wymagane ze względu na sposób, w jaki usługi PolyBase rozpoznają port nasłuchujący silnika SQL Server.
- Włącz żądany adres IP w właściwości protokołu TCP/IP > adresów IP; W przeciwnym razie aparat programu SQL Server nie zaakceptuje żadnych połączeń TCP/IP, a usługi PolyBase nadal nie będą łączyć się z aparatem programu SQL Server.
Program PolyBase w programie SQL Server w systemie Linux nie działa, jeśli protokół IPv6 jest wyłączony w jądrze. Aby uzyskać więcej informacji, zobacz SQL Server na systemie Linux: znane problemy i kwestie.
Usługi PolyBase wymagają włączenia protokołu pamięci udostępnionej w celu poprawnego działania.
Jeśli masz domyślne wystąpienie programu SQL Server skonfigurowane do nasłuchiwania na porcie TCP innym niż 1433, nie można używać go jako węzła nadrzędnego w grupie rozszerzania poziomego programu PolyBase. Podczas wykonywania
sp_polybase_join_group
, jeśli przekażesz wartość "MSSQLSERVER" jako nazwę wystąpienia, program SQL Server zakłada, że port 1433 jest portem odbiornika, więc usługa przenoszenia danych nie może nawiązać połączenia z węzłem głównym podczas uruchamiania.Synonimy Oracle nie są obsługiwane w przypadku użycia za pomocą technologii PolyBase.
Sortowania UTF-8 nie są obsługiwane w przypadku zewnętrznych źródeł danych usługi Hadoop.
Usługa Hadoop nie jest już obsługiwana w programie SQL Server 2022 (16.x) i nowszych wersjach.
Grupy skalowania w poziomie programu PolyBase nie są obsługiwane w przypadku grup dostępności Always On.
Długość nazwy serwera jest powiązana z 15-znakowym ograniczeniem długości nazw NetBIOS. Jeśli zmienisz nazwę serwera po utworzeniu go na 16 znaków lub dłużej, usługa polyBase Data Movement nie zostanie uruchomiona.