Che cos'è Azure Data Factory?
Si inizierà con una panoramica di Azure Data Factory per determinare se è una scelta ottimale per organizzare i dati necessari a creare informazioni aziendali dettagliate.
Azure Data Factory è un servizio di estrazione, trasformazione, caricamento (ETL) e integrazione dei dati basato sul cloud che consente di creare flussi di lavoro basati sui dati per:
- Orchestrare lo spostamento dei dati.
- Trasformare i dati su larga scala.
Nota
I flussi di lavoro guidati dai dati sono noti anche come pipeline.
Usando Azure Data Factory, è possibile riorganizzare i dati non elaborati in archivi dati e data lake significativi, offrendo una base per prendere decisioni aziendali migliori.
Che cos'è l'analisi dei dati aziendali?
L'analisi dei dati è il processo con cui si raccolgono i dati non elaborati e si esaminano tali dati per trarre delle conclusioni. Questo processo può essere difficile se i dati si trovano in più posizioni, ad esempio database ospitati e posizioni locali.
Suggerimento
I dati non elaborati sono dati raccolti da un'origine e non elaborati. A volte vengono definiti dati non organizzati.
Azure offre diverse tecnologie che è possibile implementare per facilitare l'analisi dei dati dell'organizzazione, tra cui:
- Azure Synapse Analytics
- Archiviazione BLOB di Azure
- Azure Data Lake Storage
- Azure Data Lake Analytics.
- Azure Analysis Services
- Azure HDInsight
- Azure Databricks
- Azure Machine Learning
È possibile usare alcuni o tutti questi servizi, in base alle esigenze, per analizzare i dati dell'organizzazione. Tuttavia, nessuno di questi servizi gestisce l'integrazione dei dati. L'integrazione dei dati consente di raccogliere dati da più origini e quindi di caricare i dati combinati in una posizione adatta per l'analisi. Se necessario, è possibile trasformare i dati durante questo processo. Sebbene sia possibile eseguire queste attività manualmente, si può prendere in considerazione l'uso di Azure Data Factory.
Definizione di Azure Data Factory
Azure Data Factory è un servizio di integrazione dei dati basato sul cloud progettato per soddisfare le esigenze di due community specifiche, come descritto nella tabella seguente:
Community | Descrizione delle esigenze delle community |
---|---|
Community di Big Data | Questa community si basa su tecnologie per la gestione di grandi quantità di dati di diverso tipo. Per questa community, Azure Data Factory è un modo per creare ed eseguire pipeline nel cloud. Queste pipeline possono accedere ai servizi dati sia cloud che locali. Queste pipeline in genere funzionano con tecnologie come Azure Synapse Analytics, BLOB di Azure e Azure Data Lake. Azure HDInsight, Azure Databricks e Azure Machine Learning. |
Community di data warehouse relazionale | Questa community si affida in genere a tecnologie come Microsoft SQL Server. SQL Server Integration Services (SSIS) viene spesso usato per creare pacchetti SSIS. Azure Data Factory offre a questa community la possibilità di eseguire pacchetti SSIS in Azure, offrendo loro l'accesso sia ai servizi dati cloud che locali. |
Nota
Un pacchetto è simile a una pipeline di Azure Data Factory. Ogni pacchetto definisce un processo per estrarre, caricare, trasformare o usare in altro modo i dati.
Il punto principale è che Azure Data Factory è un singolo servizio cloud per l'integrazione dei dati. Offre un unico set di strumenti e un'interfaccia di gestione comune per tutta l'integrazione dei dati, supportando tutte le origini dati, ovunque si trovino:
- Azure
- Locale
- Una piattaforma cloud pubblica di terze parti
In che modo Azure Data Factory può essere utile per l'analisi dei dati
Usando Azure Data Factory è possibile:
Creare processi ETL complessi. Questi processi possono trasformare visivamente i dati usando flussi di dati o servizi di calcolo, ad esempio:
- Azure HDInsight Hadoop
- Azure Databricks
- Database SQL di Azure
Pubblicare questi dati trasformati negli archivi dati in modo che vengano usati dalle app di business intelligence.
Nell'immagine seguente le origini dati esterne sono connesse ad Azure Data Factory. Viene usato un BLOB di archiviazione per inserire i dati e come archiviazione si usa Azure Synapse Analytics. Questi elementi offrono l'orchestrazione. Anche i componenti di analisi e visualizzazione, Azure Analysis Service e Power BI sono connessi ad Azure Data Factory.
Suggerimento
Azure Data Factory offre oltre 90 connettori predefiniti che non richiedono manutenzione.