Pipeline di distribuzione Lakehouse e integrazione git (anteprima)

Lakehouse si integra con le funzionalità di gestione del ciclo di vita in Microsoft Fabric, offrendo una collaborazione standardizzata tra tutti i membri del team di sviluppo per tutta la vita del prodotto. La gestione del ciclo di vita facilita un processo efficace di controllo delle versioni e rilascio dei prodotti offrendo continuamente funzionalità e correzioni di bug in più ambienti. Per altre informazioni, vedere Che cos'è la gestione del ciclo di vita in Microsoft Fabric?.

Importante

Questa funzionalità è disponibile in anteprima.

Integrazione git lakehouse

Lakehouse è un elemento che contiene sia i metadati che i dati a cui si fa riferimento in più oggetti nell'area di lavoro. Lakehouse contiene tabelle, cartelle e collegamenti come elementi principali del contenitore di dati gestibili. Dal punto di vista del flusso di lavoro di sviluppo, gli oggetti dipendenti seguenti potrebbero fare riferimento a un Lakehouse:

Il modello semantico predefinito e i metadati dell'endpoint di analisi SQL sono correlati a un Lakehouse e gestiti dal processo di aggiornamento Git per impostazione predefinita. Poiché i dati di principio non vengono rilevati in Git, vengono rilevati solo i metadati.

Rappresentazione Git

Le informazioni lakehouse seguenti vengono serializzate e rilevate in un'area di lavoro connessa a Git:

  • Display name
  • Descrizione
  • GUID logico

Nota

Il GUID logico rilevato è un identificatore dell'area di lavoro incrociata generato automaticamente che rappresenta un elemento e la relativa rappresentazione del controllo del codice sorgente.

Importante

Solo l'artefatto del contenitore Lakehouse viene rilevato in Git nell'esperienza corrente. Tabelle, cartelle, collegamenti e altre modifiche ai metadati non vengono rilevate e con controllo delle versioni in Git.

Funzionalità di integrazione git di Lakehouse

Sono disponibili le seguenti funzionalità:

  • Serializzazione dei metadati dell'oggetto Lakehouse in una rappresentazione JSON Git.
  • Applicare le modifiche direttamente o usare la richiesta pull per controllare le modifiche apportate a aree di lavoro e rami upstream o downstream.
  • La ridenominazione dei lakehouse viene rilevata in Git. L'aggiornamento di un lakehouse rinominato rinomina anche il modello di dati semantico predefinito e l'endpoint di Analisi SQL.
  • Nessuna azione viene applicata a tabelle, cartelle e collegamenti, metadati e dati di tali elementi viene sempre mantenuta.

Lakehouse nelle pipeline di distribuzione

Lakehouse è supportato nelle pipeline di distribuzione della gestione del ciclo di vita di Microsoft Fabric. Abilita le procedure consigliate per la segmentazione dell'ambiente.

Funzionalità di integrazione delle pipeline di distribuzione Lakehouse:

  • Distribuzione tra aree di lavoro di sviluppo, test e produzione.

  • Lakehouse può essere rimosso come oggetto dipendente durante la distribuzione. È supportato anche il mapping di diversi lakehouse all'interno del contesto della pipeline di distribuzione.

    • Se non viene specificato nulla durante la configurazione della pipeline di distribuzione, nell'area di lavoro di destinazione viene creato un nuovo oggetto Lakehouse vuoto con lo stesso nome. Le definizioni dei processi Spark e del notebook vengono mappate per fare riferimento al nuovo oggetto Lakehouse nella nuova area di lavoro.

    • Se la dipendenza Lakehouse è configurata per fare riferimento a un'altra Lakehouse durante il tempo di configurazione della pipeline di distribuzione, ad esempio upstream Lakehouse, un nuovo oggetto Lakehouse vuoto con lo stesso nome viene ancora creato nell'area di lavoro di destinazione, ma i riferimenti a Notebook e definizioni dei processi Spark vengono mantenuti in un'altra Lakehouse come richiesto.

    • Il provisioning degli endpoint e dei modelli semantici di Analisi SQL viene eseguito come parte della distribuzione di Lakehouse.

  • Nessun oggetto all'interno di Lakehouse viene sovrascritto.

  • Aggiornamenti al nome lakehouse può essere sincronizzato tra aree di lavoro in un contesto della pipeline di distribuzione.