Maskininlärningsexperiment och modeller Git-integrerings- och distributionspipelines (förhandsversion)

Maskininlärningsexperimenten och modellerna integreras med livscykelhanteringsfunktionerna i Microsoft Fabric, vilket ger ett standardiserat samarbete mellan alla medlemmar i utvecklingsteamet under hela produktens livslängd. Livscykelhantering underlättar en effektiv produktversions- och lanseringsprocess genom att kontinuerligt leverera funktioner och felkorrigeringar till flera miljöer. Mer information finns i Vad är livscykelhantering i Microsoft Fabric?.

Viktigt!

Den här funktionen är i förhandsversion.

Git-integrering med maskininlärningsexperiment och modeller

Maskininlärningsexperiment (ML) och modeller innehåller både metadata och data. ML-experiment innehåller runs medan ML-modeller innehåller model versions. Ur ett utvecklingsarbetsflödesperspektiv kan notebook-filer referera till ett ML-experiment eller en ML-modell.

Som princip lagras inte data i Git – endast artefaktmetadata spåras. Som standard hanteras ML-experiment och modeller via Git-synkroniserings-/uppdateringsprocessen, men experiment runs de model versions spåras inte eller är versionerna i Git och deras data bevaras i arbetsytelagringen. Ursprung mellan notebook-filer, experiment och modeller ärvs från den Git-anslutna arbetsytan.

Git-representation

Följande information serialiseras och spåras på en Git-ansluten arbetsyta för maskininlärningsexperiment och modeller:

  • Visningsnamn.
  • Version.
  • Logiskt guid. Det spårade logiska guid-objektet är en automatiskt genererad identifierare för flera arbetsytor som representerar ett objekt och dess källkontrollrepresentation.
  • Beroenden. Ursprung mellan notebook-filer, experiment och modeller bevaras mellan Git-anslutna arbetsytor, vilket upprätthåller tydlig spårbarhet mellan relaterade artefakter.

Viktigt!

Endast maskininlärningsexperiment och modellartefaktmetadata spåras i Git i den aktuella upplevelsen. Experimentkörningar och modellversioner (körningsutdata och modelldata) lagras eller är inte versionerade i Git. deras data finns kvar i arbetsytans lagring.

Git-integreringsfunktioner

Följande funktioner är tillgängliga:

  • Serialisera ML-experiment och modellartefaktmetadata till en Git-spårad JSON-representation.
  • Stöd för flera arbetsytor som är länkade till samma Git-gren, vilket gör att spårade metadata kan synkroniseras mellan arbetsytor.
  • Tillåt att uppdateringar tillämpas direkt eller kontrolleras via pull-begäranden för att hantera ändringar mellan uppströms- och nedströmsarbetsytor/grenar.
  • Spåra namnbyten för experiment och modeller i Git för att bevara identiteter mellan arbetsytor.
  • Inga åtgärder vidtas på experiment runs eller model versions. Deras data bevaras i arbetsytelagringen och lagras inte eller skrivs över av Git.

Maskininlärningsexperiment och modeller i distributionspipelines

Maskininlärningsexperiment och modeller stöds i distributionspipelines för livscykelhantering i Microsoft Fabric. Det möjliggör metodtips för miljösegmentering.

Viktigt!

Endast maskininlärningsexperiment och modellartefakter spåras i distributionspipelines i den aktuella upplevelsen. Experimentkörningar och modellversioner spåras inte eller versionshanteras inte av pipelines. deras data finns kvar i arbetsytans lagring.

Integreringsfunktioner för ML-experiment och -modeller för distributionspipelines:

  • Stöd för att distribuera ML-experiment och modeller i arbetsytor för utveckling, testning och produktion.
  • Distributioner synkroniserar endast artefaktmetadata. experiment runs och model versions (deras data) bevaras och skrivs inte över.
  • Namnbyten på experiment och modeller sprids över arbetsytor när de ingår i en distributionspipeline.
  • Ursprunget mellan notebook-filer, experiment och modeller underhålls mellan arbetsytor under pipelinedistributioner, vilket bevarar spårbarheten mellan relaterade artefakter.