Introduzione
La virtualizzazione dei dati in SQL Server 2025 è la possibilità di accedere ai dati in cui si trovano. La virtualizzazione dei dati integra i dati in fase di query, senza replicare o spostare i dati originali.
La figura seguente illustra l'estensione completa del supporto per la virtualizzazione dei dati in SQL Server 2025.
Questo modulo di training esamina le opzioni di virtualizzazione dei dati in SQL Server 2025, tra cui:
- Servizi PolyBase
- Connettori API REST come Azure Data Lake Storage, Archiviazione BLOB di Azure e Archiviazione di oggetti compatibili con Amazon S3 che consentono un accesso avanzato tramite la virtualizzazione dei dati.
- Transact-SQL (T-SQL) usato per la virtualizzazione dei dati, tra cui OPENROWSET, CREATE EXTERNAL TABLE (CET) e CREATE EXTERNAL TABLE AS SELECT (CETAS)
Principi della virtualizzazione dei dati
La virtualizzazione dei dati si basa su tre principi:
Astrazione dei dati: L'astrazione dei dati nasconde le complessità dell'accesso ai dati dal sistema dati, dai formati e dalle strutture sottostanti.
Replica zero: A differenza di ETL (Extract Transform-Load), la virtualizzazione dei dati non deve raccogliere i dati in un repository separato per trasformarli nel formato di destinazione, ma gestisce la trasformazione e l'aggregazione in tempo reale.
Dati in tempo reale: Poiché la virtualizzazione dei dati si connette all'origine dati in tempo reale, usa sempre i dati disponibili più recenti.
Vantaggi della virtualizzazione dei dati
La virtualizzazione dei dati offre i vantaggi principali seguenti:
Nessun spostamento dei dati: Accede ai dati nella posizione corrente.
Linguaggio T-SQL: Usa tutti i vantaggi del linguaggio T-SQL, dei relativi comandi, miglioramenti e familiarità.
Un'origine per tutti i dati: Usa SQL Server 2025 come singola origine dati e hub dati per tutti i dati necessari, nascondendo la complessità dei dati dalle applicazioni. Gli amministratori di database e i data engineer possono gestire un singolo ambiente.
Sicurezza: usa le funzionalità di sicurezza di SQL Server per autorizzazioni granulari, gestione delle credenziali e controllo.
Flessibilità dei costi: È disponibile in tutte le edizioni di SQL Server 2025.
Casi d'uso di virtualizzazione dei dati
SQL Server 2025 offre i casi d'uso principali di virtualizzazione dei dati seguenti:
Analisi nel database: Usare e combinare tutte le capacità di SQL Server e sfruttare la familiarità con la virtualizzazione dei dati.
Scaricamento o esportazione dei dati verso altre origini dati.
Hub dati: Usare SQL Server come hub centralizzato per connettersi, proteggere ed eseguire query su origini dati e file diversi, nascondendo la complessità delle applicazioni. Non è necessario usare uno strumento ETL per aggregare, copiare o spostare i dati in un'area di gestione temporanea.
Obiettivi di apprendimento
Dopo aver completato questo modulo, è possibile:
- Comprendere i vantaggi e i principi della virtualizzazione dei dati.
- Informazioni su PolyBase e su come usare le relative funzionalità.
- Si ha familiarità con le soluzioni di archiviazione degli oggetti e il supporto di SQL Server 2025 per l'archiviazione di oggetti compatibile con S3.
- Informazioni su come installare e configurare PolyBase in SQL Server 2025.
- Informazioni su come accedere ai dati esterni ed eseguire query usando PolyBase in SQL Server 2025.
Prerequisiti
- Conoscenza di base di SQL Server 2025
- Conoscenza di base dell'esecuzione di query T-SQL e SQL
- SQL Server 2025 installato
- SQL Server Management Studio (SSMS) installato