Che cos'è Azure Data Factory?

Completato

Si inizierà con una panoramica di Azure Data Factory. In questo modo è possibile determinare se è una buona scelta per organizzare i dati e creare informazioni aziendali dettagliate.

Azure Data Factory è un servizio ETL e di integrazione dei dati basato sul cloud che consente di creare flussi di lavoro guidati dai dati per:

  • Orchestrare lo spostamento dei dati.
  • Trasformare i dati su larga scala.

Nota

I flussi di lavoro guidati dai dati sono noti anche come pipeline.

Usando Azure Data Factory, è possibile riorganizzare i dati non elaborati in archivi dati e data lake significativi. Ciò consente di prendere decisioni migliori in ambito aziendale.

Che cos'è l'analisi dei dati aziendali?

L'analisi dei dati è il processo con cui si raccolgono i dati non elaborati e si esaminano tali dati per trarre delle conclusioni. Il processo può essere difficile se i dati si trovano in più posizioni, ad esempio database ospitati e percorsi locali.

Suggerimento

I dati non elaborati sono dati raccolti da un'origine e non elaborati. A volte vengono definiti dati non organizzati.

Azure offre diverse tecnologie che è possibile implementare per facilitare l'analisi dei dati dell'organizzazione. tra cui:

  • Azure Synapse Analytics
  • Archiviazione BLOB di Azure
  • Azure Data Lake Storage
  • Azure Data Lake Analytics.
  • Azure Analysis Services
  • Azure HDInsight
  • Azure Databricks
  • Azure Machine Learning

È possibile usare alcuni o tutti questi servizi, in base alle esigenze, per analizzare i dati dell'organizzazione. Tuttavia, nessuno di questi servizi gestisce l'integrazione dei dati. L'integrazione dei dati consente di raccogliere dati da più origini e quindi di caricare i dati combinati in una posizione adatta per l'analisi. Se necessario, è possibile trasformare i dati durante questo processo. Sebbene sia possibile eseguire queste attività manualmente, si può prendere in considerazione l'uso di Azure Data Factory.

Definizione di Azure Data Factory

Azure Data Factory è un servizio di integrazione dei dati basato sul cloud progettato per soddisfare le esigenze di due community specifiche, come descritto nella tabella seguente:

Community Descrizione delle esigenze delle community
Community di Big Data Questa community si basa su tecnologie per la gestione di grandi quantità di dati di diverso tipo. Per questa community, Azure Data Factory è un modo per creare ed eseguire pipeline nel cloud. Queste pipeline possono accedere ai servizi dati sia cloud che locali. In genere funzionano con tecnologie come Azure Synapse Analytics, BLOB di Azure, Azure Data Lake, Azure HDInsight, Azure Databricks e Azure Machine Learning.
Community di data warehouse relazionale Questa community si affida in genere a tecnologie come Microsoft SQL Server. SQL Server Integration Services (SSIS) viene spesso usato per creare pacchetti SSIS. Per questa community, Azure Data Factory offre la possibilità di eseguire pacchetti SSIS in Azure, consentendo in tal modo l'accesso ai servizi dati sia cloud che locali.

Nota

Un pacchetto è simile a una pipeline di Azure Data Factory. Ogni pacchetto definisce un processo per estrarre, caricare, trasformare o usare in altro modo i dati.

Il punto principale è che Azure Data Factory è un singolo servizio cloud per l'integrazione dei dati. Offre un unico set di strumenti e un'interfaccia di gestione comune per tutta l'integrazione dei dati e supporta tutte le origini dati, ovunque si trovino:

  • Azure
  • Locale
  • Una piattaforma cloud pubblica di terze parti

In che modo Azure Data Factory può essere utile per l'analisi dei dati

Usando Azure Data Factory è possibile:

  • Creare processi ETL complessi. Questi processi possono trasformare visivamente i dati usando flussi di dati o servizi di calcolo, ad esempio:

    • Azure HDInsight Hadoop
    • Azure Databricks
    • Database SQL di Microsoft Azure
  • Pubblicare questi dati trasformati negli archivi dati in modo che vengano usati dalle app di business intelligence.

Nell'immagine seguente le origini dati esterne sono connesse ad Azure Data Factory. Viene usato un BLOB di archiviazione per inserire i dati e come archiviazione si usa Azure Synapse Analytics. Questi elementi offrono l'orchestrazione. Anche i componenti di analisi e visualizzazione, Azure Analysis Service e Power BI sono connessi ad Azure Data Factory.

Graphic depicting a possible architecture for using Azure Data Factory.

Suggerimento

Azure Data Factory offre oltre 90 connettori predefiniti che non richiedono manutenzione.