Panoramica di PolyBase

Si applica a:SQL Server Azure Synapse Analytics Piattaforma di analisi (PDW)

PolyBase abilita la virtualizzazione dei dati per SQL Server.

Per una guida dettagliata alla scelta dell'approccio PolyBase corretto, al confronto delle funzionalità tra piattaforme SQL e alla compilazione di query T-SQL con dati esterni, vedere Virtualizzazione dei dati con PolyBase.

Che cos'è PolyBase?

PolyBase consente all'istanza di SQL Server di eseguire query sui dati con Transact-SQL (T-SQL) direttamente da SQL Server, Oracle, Teradata, MongoDB, cluster Hadoop, Cosmos DB e archiviazione oggetti compatibili con S3 senza installare separatamente il software di connessione client. È anche possibile usare il connettore ODBC generico per connettersi a provider aggiuntivi tramite driver ODBC di terzi. PolyBase consente alle query T-SQL di unire i dati di origini esterne a tabelle relazionali in un'istanza di SQL Server.

PolyBase supporta anche l'esecuzione di query su formati di dati basati su file semistrutturati e strutturati, ad esempio file CSV, Parquet, JSON e Delta Lake. In questo modo è possibile integrare facilmente i dati basati su file nei flussi di lavoro T-SQL.

Un caso d'uso chiave per la virtualizzazione dei dati con la funzionalità PolyBase consiste nel consentire ai dati di rimanere nella posizione e nel formato originali. È possibile virtualizzare i dati esterni tramite un'istanza di SQL Server in modo da potervi eseguire query sul posto come per qualsiasi altra tabella in SQL Server. Questo processo riduce sensibilmente la necessità di ricorrere a processi ETL per lo spostamento dati. Questo scenario di virtualizzazione dati è possibile grazie all'uso di connettori Polybase.

Prodotti e servizi SQL supportati

PolyBase offre queste stesse funzionalità per i prodotti SQL seguenti di Microsoft:

SQL Server 2016 (13.x) e versioni successive (Windows)
SQL Server 2019 (15.x) e versioni successive (Windows e Linux)
Istanza gestita di SQL di Azure, per informazioni dettagliate, vedere Virtualizzazione dei dati con Istanza gestita di SQL di Azure
Database SQL di Azure, per informazioni dettagliate, vedere Virtualizzazione dei dati con il database SQL di Azure (anteprima)
Piattaforma di strumenti analitici (PDW) di SQL Server
Azure Synapse Analytics (per pool SQL dedicato)
- La virtualizzazione dei dati in Azure Synapse Analytics è disponibile in due modalità, PolyBase e nativa. Per altre informazioni, consultare Usare tabelle esterne con Synapse SQL.

Miglioramenti di PolyBase per SQL Server 2025

Novità di SQL Server 2025 (17.x)	dettagli
Supporto nativo per CSV, Parquet e Delta ¹	Il servizio di query PolyBase per dati esterni non è più necessario per usare `OPENROWSET`, `CREATE EXTERNAL TABLE` o `CREATE EXTERNAL TABLE AS SELECT` con i seguenti tipi di dati esterni: Parquet, Delta, Archiviazione BLOB di Azure (ABS), Azure Data Lake Storage (ADLS) o Archiviazione oggetti compatibile con S3.
Usare origini dati ODBC generica in Linux	Per altre informazioni, vedere Configurare PolyBase per accedere ai dati esterni con tipi generici ODBC.
Supporto TDS 8.0	PolyBase usa una configurazione predefinita sicura con ODBC Driver for SQL Server versione 18 e `Encrypt=Yes` (obbligatorio). A differenza di altre funzionalità di SQL Server, PolyBase consente `TrustServerCertificate=True` scenari di certificato autofirmato. Per applicare TLS 1.3 e la crittografia rigorosa con TDS 8.0, impostare `Encrypt=Strict` e `TrustServerCertificate=No`. Per altre informazioni, vedere CREATE EXTERNAL DATA SOURCE - CONNECTION_OPTIONS. Vedere Modifiche di rilievo apportate alle funzionalità del motore di database in SQL Server 2025.
Identità gestita	L'identità gestita è disponibile per SQL Server abilitato da Azure Arc e SQL Server 2025 nelle macchine virtuali di Azure.

¹ In SQL Server 2025 (17.x), il servizio query PolyBase per i dati esterni è comunque necessario per connettersi ad altri database. Ad esempio: SQL Server, Oracle, DB2, Teradata, MongoDB o ODBC.

Miglioramenti di PolyBase in SQL Server 2022

Novità di SQL Server 2022 (16.x)	dettagli
Archiviazione di oggetti compatibile con S3	SQL Server 2022 (16.x) aggiunge un nuovo connettore, l'archiviazione di oggetti compatibile con S3, usando l'API REST S3. È possibile usare sia OPENROWSET che CREATE EXTERNAL TABLE per eseguire query sui file di dati nell'archiviazione oggetti compatibile con S3.
Alcuni connettori si separano dai servizi PolyBase	Il connettore di archiviazione di oggetti compatibile con S3, ADSL Gen2 e l'archiviazione BLOB di Azure non dipendono più dai servizi PolyBase. I servizi PolyBase devono comunque essere eseguiti per supportare la connettività con Oracle, Teradata, MongoDB e ODBC generico. La funzionalità PolyBase deve ancora essere installata nell'istanza di SQL Server.
Formato di file Parquet	PolyBase è ora in grado di eseguire query sui dati dai file Parquet archiviati nell'archivio oggetti compatibile con S3. Per ulteriori informazioni, consulta Virtualizzare un file Parquet in uno storage di oggetti compatibile con S3 usando PolyBase.
Formato della tabella Delta	PolyBase è ora in grado di eseguire query sui dati (di sola lettura) dal formato tabella Delta memorizzato nelle risorse di archiviazione oggetti compatibili con S3, archiviazione account Azure V2 e Azure Data Lake Storage Gen2. Per altre informazioni, vedere Virtualizzare la tabella delta con PolyBase
Creare una Tabella Esterna come SELECT (CETAS)	PolyBase può ora usare CETAS per creare una tabella esterna e quindi esportare, in parallelo, il risultato di un'istruzione Transact-SQL `SELECT` in Azure Data Lake Storage Gen2, nell'account di archiviazione di Azure V2 e nell'archiviazione oggetti compatibile con S3. Per altre informazioni, vedere CREATE EXTERNAL TABLE AS SELECT (CETAS).

Per altre nuove funzionalità di SQL Server 2022 (16.x), vedere Novità di SQL Server 2022.

Suggerimento

Per un'esercitazione sulle funzionalità e sulle capacità di PolyBase in SQL Server 2022 (16.x), vedere Introduzione a PolyBase in SQL Server 2022.

Connettori PolyBase

La funzionalità PolyBase offre connettività alle origini dati esterne seguenti:

Origini dati esterne	SQL Server 2016-2019 con PolyBase	SQL Server 2022 (16.x) con PolyBase	APS PDW	Azure Synapse Analytics
Oracle, MongoDB, Teradata	Leggi	Leggi	No	No
ODBC generico	Lettura (solo Windows)	Lettura (disponibile solo su Windows)	No	No
Azure Storage	Lettura/scrittura	Lettura/scrittura	Lettura/scrittura	Lettura/scrittura
Hadoop	Lettura/scrittura	No	Lettura/scrittura	No
SQL Server	Leggi	Leggi	No	No
Archiviazione di oggetti compatibile con S3	No	Lettura/scrittura	No	No

SQL Server 2022 (16.x) e versioni successive non supportano Hadoop.
SQL Server 2016 (13.x) ha introdotto PolyBase con supporto per le connessioni a Hadoop e all'Archiviazione BLOB di Azure.
SQL Server 2019 (15.x) ha introdotto più connettori, tra cui SQL Server, Oracle, Teradata e MongoDB.
SQL Server 2022 (16.x) ha introdotto il connettore di archiviazione compatibile con S3.
L'aggiornamento cumulativo 19 di SQL Server 2019 (15.x) ha introdotto il supporto per Oracle TNS.
L'aggiornamento cumulativo 2 di SQL Server 2022 (16.x) ha introdotto il supporto per Oracle TNS.

Esempi di connettori esterni sono i seguenti:

¹ PolyBase supporta due provider Hadoop, Hortonworks Data Platform (HDP) e Cloudera Distributed Hadoop (CDH), tramite SQL Server 2019. Il supporto di SQL Server per le origini dati esterne HDFS Cloudera (CDP) e Hortonworks (HDP) è stato ritirato e non è incluso in SQL Server 2022 (16.x) e versioni successive. Per altre informazioni, vedere Opzioni per i Big Data nella piattaforma Microsoft SQL Server.

Per usare PolyBase in un'istanza di SQL Server:

Installare PolyBase su Windows o installare PolyBase su Linux.
A partire da SQL Server 2019 (15.x), abilitare PolyBase in sp_configure, se necessario.
Creare un'origine dati esterna.
Creare una tabella esterna.

Integrazione con Azure

Con il supporto sottostante di PolyBase, le query T-SQL possono anche importare ed esportare dati da Archiviazione BLOB di Azure. PolyBase consente inoltre ad Azure Synapse Analytics di importare ed esportare dati da Azure Data Lake Store e da Archiviazione BLOB di Azure.

Perché usare PolyBase

PolyBase consente di unire dati da un'istanza di SQL Server con dati esterni. Prima che PolyBase consentisse l'aggiunta di dati a origini dati esterne, è possibile:

Trasferire la metà dei dati in modo che tutti i dati fossero in una posizione.
Eseguire query su entrambe le origini dati, quindi scrivere logica di query personalizzata per creare i join e integrare i dati a livello di client.

PolyBase consente di usare Transact-SQL per unire i dati.

PolyBase non richiede l'installazione di software aggiuntivo nell'ambiente Hadoop. Si possono eseguire query sui dati esterni usando la stessa sintassi T-SQL usata per eseguire query su una tabella di database. Le azioni di supporto implementate da PolyBase vengono tutte eseguite in modo trasparente. L'autore della query non necessita di alcuna conoscenza dell'origine esterna.

PolyBase utilizza

PolyBase rende possibili gli scenari seguenti in SQL Server:

Accesso facile ai dati: Eseguire query su altri file RDBM o esterni come tabelle CSV, Parquet e Delta Lake usando T-SQL come se fossero tabelle native.
Scaricamento dei dati freddi: mantenendoli facilmente accessibili.
Produttività migliorata: Ridurre il tempo e il lavoro necessari per integrare e analizzare i dati da più origini.
Efficienza dei costi: Ridurre al minimo la necessità di replica dei dati e costi di archiviazione associati ai metodi di integrazione dei dati tradizionali.
Informazioni dettagliate in tempo reale: Abilitare l'esecuzione di query e informazioni dettagliate sui dati in tempo reale senza ritardi causati dallo spostamento o dalla sincronizzazione dei dati.
Sicurezza: Usare le funzionalità di sicurezza di SQL Server per autorizzazioni granulari, gestione delle credenziali e controllo.

Prestazioni

Non esiste un limite rigido al numero di file o alla quantità di dati su cui è possibile eseguire query. Le prestazioni delle query dipendono dalla quantità di dati, dal formato dei dati, dalla modalità di organizzazione dei dati e dalla complessità delle query e dei join.

Per altre informazioni sulle indicazioni sulle prestazioni e per consigli su PolyBase, vedere Considerazioni sulle prestazioni in PolyBase per SQL Server.

Aggiornare a SQL Server 2022

A partire da SQL Server 2022 (16.x), Hortonworks Data Platform (HDP) e Cloudera Distributed Hadoop (CDH) non sono più supportati. A causa di queste modifiche, è necessario eliminare manualmente origini dati esterne PolyBase create nelle versioni precedenti di SQL Server che usano TYPE = HADOOP o Archiviazione di Azure prima di eseguire la migrazione a SQL Server 2022 (16.x) o versioni successive. L'eliminazione di origini dati esterne richiede anche l'eliminazione degli oggetti database associati, ad esempio le credenziali con ambito database e le tabelle esterne.

I connettori di Archiviazione di Azure devono essere modificati in base alla tabella di riferimento seguente:

Origine dati esterna	Da	Per
Azure Blob Storage (Servizio di archiviazione Blob di Azure)	`wasb[s]`	`abs`
ADLS Gen 2	`abfs[s]`	`adls`

Inizia subito

Prima di usare PolyBase, è necessario installare PolyBase in Windows o installare PolyBase in Linux e abilitare PolyBase in sp_configure, se necessario.

Per un'esercitazione sulle funzionalità e sulle capacità di PolyBase, vedere Introduzione a PolyBase in SQL Server 2022.

Per altre esercitazioni su varie origini dati esterne, vedere:

Virtualizzazione dei dati in altre piattaforme

Le funzionalità di virtualizzazione dei dati sono disponibili anche su altre piattaforme:

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-03-19