Domande frequenti in PolyBase

Si applica a: SQL Server 2016 (13.x) e versioni successive

PolyBase e server collegati a confronto

Nella tabella seguente vengono evidenziate le differenze tra PolyBase e le funzionalità per server collegati:

PolyBase Server collegati
Oggetto con ambito di database Oggetto con ambito di istanza
Usa driver ODBC Usa provider OLEDB
Supporta operazioni di sola lettura per tutte le origini dati e di scrittura in alcune origini dati esterne Supporta sia operazioni di lettura che di scrittura
Le query a un'origine dati remota da una singola connessione possono essere scalate orizzontalmente Le query a un'origine dati remota da una singola connessione non possono essere scalate orizzontalmente
È supportata la distribuzione dei predicati È supportata la distribuzione dei predicati
Non è richiesta una configurazione separata per il gruppo di disponibilità È richiesta una configurazione separata per ogni istanza nel gruppo di disponibilità
Solo autenticazione di base Autenticazione di base e integrata
Adatto per le query analitiche che elaborano un numero elevato di righe Adatta per le query OLTP che restituiscono singole righe o poche righe
Le query che usano una tabella esterna non possono partecipare alle transazioni distribuite Le query distribuite possono partecipare alle transazioni distribuite

Novità di PolyBase in SQL Server 2022

SQL Server 2022 (16.x) supporta ora file CSV, Parquet e Delta archiviati in Archiviazione di Azure v2, Azure Data Lake Storage Gen2 o qualsiasi semplice servizio di archiviazione di oggetti compatibile con S3 tramite API REST S3, locale o nel cloud.

SQL Server 2022 (16.x) può ora usare CREATE EXTERNAL TABLE come SELECT (CETAS), insieme ai comandi come OPENROWSET, CREATE EXTERNAL TABLE (CET) e tutti i nuovi miglioramenti di T-SQL.

Attualmente, il supporto per le origini dati esterne hadoop è stato rimosso in SQL Server 2022 (16.x).

L'aggiornamento cumulativo 2 di SQL Server 2022 (16.x) ha introdotto il supporto per i file Oracle TNS. Per altre informazioni e campioni, fare riferimento a CREATE EXTERNAL DATA SOURCE.

Consultare la virtualizzazione dei dati con PolyBase per SQL Server 2022 ed esaminare i miglioramenti di PolyBase di SQL Server 2022.

Novità di PolyBase in SQL Server 2019

PolyBase in SQL Server 2019 (15.x) ora può leggere i dati da una più ampia varietà di origini dati. I dati di queste origini dati esterne possono essere archiviati come tabelle esterne in SQL Server. PolyBase supporta anche il calcolo con distribuzione verso queste origini dati esterne, con l'esclusione dei tipi generici ODBC.

Origini dati compatibili

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Tipi generici ODBC compatibili

L'aggiornamento cumulativo 19 di SQL Server 2019 (15.x) ha introdotto il supporto per i file Oracle TNS. Per altre informazioni e campioni, fare riferimento a CREATE EXTERNAL DATA SOURCE.

Nota

PolyBase consente la connessione a origini dati esterne tramite i driver ODBC di terzi. Questi driver non sono forniti con PolyBase e potrebbero non funzionare come previsto. Per ulteriori informazioni, vedere Configurare PolyBase per l'accesso a dati esterni con i tipi generici ODBC.

Quali CONNECTION_OPTIONS è possibile specificare per la connessione a origini dati di terzi?

Vedere CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS per le opzioni di connessione del provider di dati supportate per SQL Server, Oracle, Teradata, l'API MongoDB per Cosmos DB e i provider di dati ODBC generici.

Come è possibile visualizzare il piano di esecuzione delle query remote del calcolo con distribuzione di PolyBase?

Ciò è possibile tramite un paio di metodi in base alla versione di SQL Server. Vedere Risoluzione dei problemi di PolyBase - Per visualizzare il piano di query PolyBase.

Come è possibile stabilire se si sta verificando il calcolo con distribuzione di PolyBase?

La tecnologia Polybase è supportata nel database SQL di Azure?

No, non è possibile eseguire query sui dati nei file inseriti in Archiviazione BLOB di Azure usando la funzione OPENROWSET o usare CREATE EXTERNAL TABLE per leggere da un pool SQL serverless in Synapse Analytics. Per altre informazioni, vedere Azure SQL può leggere i file di archiviazione di Azure Data Lake usando le tabelle esterne di Synapse SQL.

PolyBase è supportato nell’Istanza gestita di SQL di Azure.

Istanza gestita di SQL di Azure ha le proprie funzionalità di virtualizzazione dei dati per l’archiviazione di Azure Data Lake (ADLS) e Archiviazione BLOB di Azure come origini dati. Per altre informazioni, vedere Virtualizzazione dei dati con Istanza gestita di SQL di Azure.

Quali porte è necessario consentire tramite il firewall per PolyBase?

Non sono necessarie porte aggiuntive per l'apertura per PolyBase, tranne nel caso di un gruppo con scalabilità orizzontale polyBase. Senza un gruppo con scalabilità orizzontale, il solo servizio PolyBase non deve richiedere alcuna regola del firewall.

Nei server Windows, PolyBase sfrutterà le porte usate da SQL Server nella IPAll sezione delle impostazioni TCP/IP in Gestione configurazione SQL Server. Per ulteriori informazioni, vedere Proprietà TCP/IP. Nei server Linux, PolyBase sfrutterà l'impostazione network.tcpport . Per altre informazioni, vedere porta TCP.

Per i gruppi con scalabilità orizzontale polyBase, su più server Windows, vedere le informazioni sulla porta nella domanda successiva.

Tuttavia, è necessario consentire altre porte per la comunicazione con le varie origini dati esterne usate da PolyBase. Fare riferimento alla configurazione ODBC, alla configurazione delle risorse di Azure o alla documentazione specifica dell'origine dati. Ad esempio:

Piattaforma di origine Riferimento
Microsoft SQL Server Porte usate da SQL Server
Hortonworks HDP Amministrazione di HDFS
Cloudera CDH Porte usate dai componenti CDH

Quali porte vengono usate per il gruppo con scalabilità orizzontale PolyBase?

Per impostazione predefinita, il servizio PolyBase Data Movement si connette al nodo head di un gruppo con scalabilità orizzontale su un intervallo di porte da TCP 16450-16460, in genere usando 16450-16453, più la porta 17001. Queste porte vengono usate solo quando un gruppo con scalabilità orizzontale PolyBase è configurato e deve essere consentito tramite firewall server. Il programma di installazione di SQL Server deve creare automaticamente una regola del firewall locale che conceda il consenso a queste porte al momento dell'installazione delle funzionalità. Per altre informazioni, vedere Configurare gruppi con scalabilità orizzontale PolyBase in Windows.

Nota

I gruppi con scalabilità orizzontale PolyBase di Microsoft SQL Server verranno ritirati. La funzionalità dei gruppi con scalabilità orizzontale verrà rimossa dal prodotto in SQL Server 2022 (16.x).

PolyBase nei cluster Big Data e PolyBase nelle istanze autonome a confronto

Per altre informazioni sulle connessioni tramite il connettore ODBC generico, vedere la guida pratica alla configurazione dei tipi generici ODBC.

Nella tabella seguente sono evidenziate le funzionalità di PolyBase disponibili nel cluster Big Data di SQL Server 2019 (15.x) autonomo e SQL Server 2019 (15.x):

Funzionalità Cluster Big Data Istanza autonoma
Creare un'origine dati esterna per SQL Server, Oracle, Teradata e Mongo DB X X
Creare origine dati esterna usando un driver ODBC di terze parti compatibile X
Creare un'origine dati esterna per l'origine dati HADOOP X X
Creare un'origine dati esterna per Archiviazione BLOB di Azure X X
Creare una tabella esterna in un pool di dati di SQL Server X
Creare una tabella esterna in un pool di archiviazione di SQL Server X
Esecuzione di query con scalabilità orizzontale X X (solo Windows)

Importante

Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025. Tutti gli utenti esistenti di SQL Server 2019 con Software Assurance saranno completamente supportati nella piattaforma e fino a quel momento il software continuerà a ricevere aggiornamenti cumulativi di SQL Server. Per altre informazioni, vedere il post di blog relativo all'annuncio e Opzioni per i Big Data nella piattaforma Microsoft SQL Server.