Funzionamento di Azure Synapse Analytics

Completato

Per supportare le esigenze di analisi delle organizzazioni odierne, Azure Synapse Analytics combina un servizio centralizzato per l'archiviazione e l'elaborazione dei dati con un'architettura estendibile, tramite cui i servizi collegati consentono di integrare archivi dati, piattaforme di elaborazione e strumenti di visualizzazione di uso comune.

Creazione e uso di un'area di lavoro di Azure Synapse Analytics

Un’area di lavoro Synapse Analytics definisce un'istanza del servizio Synapse Analytics in cui è possibile gestire i servizi e le risorse dati necessarie per la soluzione di analisi. È possibile creare un'area di lavoro Synapse Analytics in una sottoscrizione di Azure in modo interattivo usando il portale di Azure oppure automatizzare la distribuzione usando Azure PowerShell, l'interfaccia della riga di comando di Azure o un modello di Azure Resource Manager o Bicep.

Dopo aver creato un'area di lavoro Synapse Analytics è possibile gestire i servizi in esso contenuti ed eseguire attività di analisi dei dati usando Synapse Studio, un portale basato sul Web per Azure Synapse Analytics.

Screenshot of Azure Synapse Studio.

Uso dei file in un data lake

Una delle risorse principali in un'area di lavoro Synapse Analytics è un data lake, in cui i file di dati possono essere archiviati ed elaborati su larga scala. Un'area di lavoro ha in genere un data lake predefinito, implementato come servizio collegato a un contenitore di Azure Data Lake Storage Gen2. È possibile aggiungere servizi collegati per più data lake basati su piattaforme di archiviazione diverse in base alle esigenze.

Screenshot of a data lake linked service in Azure Studio.

Inserimento e trasformazione dei dati con pipeline

Nella maggior parte delle soluzioni di analisi dei dati aziendali, i dati vengono estratti da più origini operative e trasferiti in un data lake centrale o in un data warehouse per l'analisi. Azure Synapse Analytics include il supporto predefinito per la creazione, l'esecuzione e la gestione di pipeline che orchestrano le attività necessarie per recuperare i dati da un'ampia gamma di origini, trasformare i dati in base alle esigenze e caricare i conseguenti dati trasformati in un archivio analitico.

Screenshot of a pipeline in Azure Synapse Studio.

Nota

Le pipeline in Azure Synapse Analytics si basano sulla stessa tecnologia sottostante di Azure Data Factory. Se si ha già familiarità con Azure Data Factory, è possibile sfruttare le competenze esistenti per creare soluzioni di inserimento e trasformazione dei dati in Azure Synapse Analytics.

Esecuzione di query e modifica dei dati con SQL

Structured Query Language (SQL) è un linguaggio comune per l'esecuzione di query e la modifica dei dati ed è la base per i database relazionali, incluso Microsoft SQL Server, la piattaforma di database più diffusa. Azure Synapse Analytics supporta l'esecuzione di query e la manipolazione di dati basati su SQL tramite due tipi di pool SQL basati sul motore di database relazionale SQL Server:

  • Un pool serverless predefinito ottimizzato per l'uso della semantica SQL relazionale per eseguire query sui dati basati su file in un data lake.
  • Pool SQL dedicati personalizzati che ospitano data warehouse relazionali.

Il sistema SQL di Azure Synapse usa un modello di elaborazione di query distribuito per abbinare in parallelo le operazioni SQL, ottenendo una soluzione altamente scalabile per l'elaborazione dei dati relazionali. È possibile usare il pool serverless predefinito per l'analisi e l'elaborazione efficiente dei dati di file nel data lake e pool SQL dedicati per creare data warehouse relazionali per la modellazione e la creazione di report dei dati aziendali.

Screenshot of a SQL query and databases in Azure Synapse Studio.

Elaborazione e analisi dei dati con Apache Spark

Apache Spark è una piattaforma open source per l'analisi dei Big Data. Spark esegue l'elaborazione distribuita dei file in un data lake eseguendo processi che possono essere implementati usando qualsiasi gamma di linguaggi di programmazione supportati. I linguaggi supportati in Spark includono Python, Scala, Java, SQL e C#.

In Azure Synapse Analytics è possibile creare uno o più pool di Spark e usare notebook interattivi per combinare codice e note durante la creazione di soluzioni per l'analisi dei dati, l'apprendimento automatico e la visualizzazione dei dati.

Screenshot of a Spark notebook in Azure Synapse Studio.

Esplorazione dei dati con Esplora dati

Azure Synapse Esplora dati è un motore di elaborazione dati in Azure Synapse Analytics basato sul servizio Azure Esplora dati. Esplora dati usa una sintassi di query intuitiva denominata Linguaggio di query Kusto (KQL) per consentire prestazioni elevate, analisi a bassa latenza dei dati batch e di flusso.

Screenshot of a Kusto Query Language script in Azure Synapse Studio.

Integrazione con altri servizi dati di Azure

Azure Synapse Analytics può essere integrato con altri servizi dati di Azure per soluzioni di analisi end-to-end. Le soluzioni integrate includono:

  • Collegamento a Azure Synapse consente la sincronizzazione quasi in tempo reale tra i dati operativi in Azure Cosmos DB, il database SQL di Azure, SQL Server, Microsoft Power Platform Dataverse e la risorsa di archiviazione dei dati analitici, su cui è possibile eseguire query in Azure Synapse Analytics.
  • L'integrazione di Microsoft Power BI consente agli analisti dei dati di integrare un'area di lavoro di Power BI in un'area di lavoro Synapse ed visualizzare in modo interattivo i dati in Azure Synapse Studio.
  • L'integrazione di Microsoft Purview consente alle organizzazioni di catalogare gli asset di dati in Azure Synapse Analytics e semplifica l'individuazione degli asset di dati e il tracciamento della derivazione dei dati durante l'implementazione di pipeline di dati che inseriscono i dati in Azure Synapse Analytics.
  • L'integrazione di Azure Machine Learning consente agli analisti dei dati e ai data scientist di integrare il training e l'utilizzo dei modelli predittivi in soluzioni analitiche.