Condividi tramite


Esperimenti di Machine Learning e modelli di pipeline di integrazione e distribuzione Git (anteprima)

Gli esperimenti e i modelli di Machine Learning si integrano con le funzionalità di gestione del ciclo di vita in Microsoft Fabric, offrendo una collaborazione standardizzata tra tutti i membri del team di sviluppo per tutta la vita del prodotto. La gestione del ciclo di vita facilita un processo efficace di controllo delle versioni e rilascio dei prodotti offrendo continuamente funzionalità e correzioni di bug in più ambienti. Per altre informazioni, vedere Che cos'è la gestione del ciclo di vita in Microsoft Fabric?.

Importante

Questa funzionalità si trova in Anteprima.

Integrazione git di esperimenti e modelli di Machine Learning

Gli esperimenti e i modelli di Machine Learning contengono sia metadati che dati. Gli esperimenti di Machine Learning contengono runs mentre i modelli di Machine Learning contengono model versions. Dal punto di vista del flusso di lavoro di sviluppo, i notebook possono fare riferimento a un esperimento di Machine Learning o a un modello di Machine Learning.

In linea di principio, i dati non vengono archiviati in Git. Vengono rilevati solo i metadati degli artefatti. Per impostazione predefinita, gli esperimenti e i modelli di Machine Learning vengono gestiti tramite il processo di sincronizzazione/aggiornamento Git, ma experiment runsmodel versions non vengono rilevati o sottoposti a controllo delle versioni in Git e i relativi dati vengono mantenuti nell'archiviazione dell'area di lavoro. La derivazione tra notebook, esperimenti e modelli viene ereditata dall'area di lavoro connessa a Git.

Rappresentazione Git

Le informazioni seguenti vengono serializzate e rilevate in un'area di lavoro connessa Git per l'esperimento e i modelli di Machine Learning:

  • Nome visualizzato.
  • versione.
  • GUID logico. Il GUID logico rilevato è un identificatore dell'area di lavoro incrociata generato automaticamente che rappresenta un elemento e la relativa rappresentazione del controllo del codice sorgente.
  • Dipendenze. La derivazione tra notebook, esperimenti e modelli viene mantenuta tra aree di lavoro connesse a Git, mantenendo una chiara tracciabilità tra gli artefatti correlati.

Importante

Solo l'esperimento di Machine Learning e i metadati dell'artefatto del modello vengono rilevati in Git nell'esperienza corrente. Le esecuzioni dell'esperimento e le versioni del modello (gli output di esecuzione e i dati del modello) non vengono archiviate o con versione in Git; i dati rimangono nell'archiviazione dell'area di lavoro.

Funzionalità di integrazione Git

Sono disponibili le seguenti funzionalità:

  • Serializzare i metadati dell'esperimento e dell'artefatto del modello ml in una rappresentazione JSON con rilevamento Git.
  • Supportare più aree di lavoro collegate allo stesso ramo Git, consentendo la sincronizzazione dei metadati rilevati tra aree di lavoro.
  • Consentire l'applicazione diretta o controllata degli aggiornamenti tramite richieste pull per gestire le modifiche tra aree di lavoro/rami upstream e downstream.
  • Tenere traccia delle ridenominazione di esperimenti e modelli in Git per mantenere l'identità tra aree di lavoro.
  • Non vengono eseguite azioni su experiment runs o model versions. I dati vengono mantenuti nell'archiviazione dell'area di lavoro e non vengono archiviati o sovrascritti da Git.

Esperimenti e modelli di Machine Learning nelle pipeline di distribuzione

Gli esperimenti e i modelli di Machine Learning (ML) sono supportati nelle pipeline di distribuzione della gestione del ciclo di vita di Microsoft Fabric. Abilita le procedure consigliate per la segmentazione dell'ambiente.

Importante

Solo gli artefatti dell'esperimento e del modello di Machine Learning vengono rilevati nelle pipeline di distribuzione nell'esperienza corrente. Le esecuzioni dell'esperimento e le versioni del modello non vengono rilevate o con controllo delle versioni dalle pipeline; i dati rimangono nell'archiviazione dell'area di lavoro.

Funzionalità di integrazione delle pipeline di distribuzione di ML per esperimenti e modelli:

  • Supporto per la distribuzione di esperimenti e modelli di Machine Learning tra aree di lavoro di sviluppo, test e produzione.
  • Le distribuzioni sincronizzano solo i metadati degli artefatti; experiment runs e model versions (i relativi dati) vengono conservati e non vengono sovrascritti.
  • Le ridenominazione di esperimenti e modelli vengono propagate tra aree di lavoro quando incluse in una pipeline di distribuzione.
  • La derivazione tra notebook, esperimenti e modelli viene mantenuta tra aree di lavoro durante le distribuzioni della pipeline, mantenendo la tracciabilità tra gli artefatti correlati.