Che cos'è Data Factory in Microsoft Fabric?

Data Factory offre un'esperienza moderna di integrazione dei dati per l'inserimento, la preparazione e la trasformazione dei dati da un set completo di origini dati, ad esempio database, data warehouse, Lakehouse, dati in tempo reale e altro ancora. Sia che si sia un cittadino o uno sviluppatore professionale, sarà possibile trasformare i dati con trasformazioni intelligenti e sfruttare una vasta gamma di attività. Con Data Factory in Microsoft Fabric, vengono offerte funzionalità di copia rapida (spostamento dei dati) sia ai flussi di dati che alle pipeline di dati. Con La copia rapida è possibile spostare i dati tra gli archivi dati preferiti in modo rapido. Soprattutto, Fast Copy consente di trasferire i dati in Lakehouse e Data Warehouse in Microsoft Fabric per l'analisi.

Data Factory implementa due funzionalità principali: flussi di dati e pipeline.

  • I flussi di dati consentono di sfruttare più di 300 trasformazioni nella finestra di progettazione dei flussi di dati, consentendo di trasformare i dati più facilmente e con maggiore flessibilità rispetto a qualsiasi altro strumento, incluse le trasformazioni dei dati basate su intelligenza artificiale intelligente.
  • Le pipeline di dati consentono di sfruttare le funzionalità predefinite di orchestrazione dei dati per comporre flussi di lavoro di dati flessibili che soddisfano le esigenze aziendali.

Flussi di dati

I flussi di dati offrono un'interfaccia a basso codice per l'inserimento di dati da centinaia di origini dati, trasformando i dati tramite trasformazioni di dati di oltre 300. È quindi possibile caricare i dati risultanti in più destinazioni, ad esempio i database SQL di Azure e altro ancora. I flussi di dati possono essere eseguiti ripetutamente usando l'aggiornamento manuale o pianificato o come parte di un'orchestrazione della pipeline di dati.

I flussi di dati vengono creati usando l'esperienza familiare di Power Query attualmente disponibile in diversi prodotti e servizi Microsoft, ad esempio Excel, Power BI, Power Platform, applicazioni Dynamics 365 Insights e altro ancora. Power Query consente a tutti gli utenti, dai cittadini ai dataintegrator professionali, di eseguire l'inserimento dati e le trasformazioni dei dati nel proprio patrimonio di dati. Eseguire join, aggregazioni, pulizia dei dati, trasformazioni personalizzate e molto altro ancora da un'interfaccia utente di facile utilizzo, altamente visiva e con poco codice.

Screenshot of the Power BI user interface showing the dataflow experience.

Pipeline di dati

Le pipeline di dati consentono potenti funzionalità del flusso di lavoro su scala cloud. Con le pipeline di dati, è possibile creare flussi di lavoro complessi in grado di aggiornare il flusso di dati, spostare i dati di dimensioni PB e definire pipeline di flusso di controllo sofisticate.

Usare le pipeline di dati per creare flussi di lavoro ETL e data factory complessi che possono eseguire molte attività diverse su larga scala. Le funzionalità del flusso di controllo sono integrate in pipeline di dati che consentono di compilare la logica del flusso di lavoro, che fornisce cicli e condizionali.

Aggiungere un'attività di copia guidata dalla configurazione insieme all'aggiornamento del flusso di dati con poco codice in una singola pipeline per una pipeline di dati ETL end-to-end. È anche possibile aggiungere attività code-first per notebook Spark, script SQL, stored procedure e altro ancora.

Screenshot of the user interface showing copy activity.

Per iniziare a usare Microsoft Fabric, vedere Avvio rapido: Creare il primo dataflow Gen2 per ottenere e trasformare i dati.