Uppgradera ML-arbetsflöden till målmodeller i Unity Catalog

2025-01-23

Den här artikeln beskriver hur du migrerar och uppgraderar befintliga Databricks-arbetsflöden att använda modeller i Unity Catalog.

Krav

Privilegier som krävs

Om du vill köra ett arbetsflöde för modellträning, distribution eller slutsatsdragning i Unity Catalog måste huvudkontot som kör arbetsflödet ha USE CATALOG och USE SCHEMA behörigheter i katalogen och schemat som innehåller modellen.

Följande behörigheter krävs också:

För att skapa en modell måste huvudkontot ha behörigheten CREATE MODEL .
För att kunna läsa in eller distribuera en modell måste huvudkontot ha behörigheten EXECUTE för den registrerade modellen.

Endast ägaren av en registrerad modell kan göra följande:

Skapa en ny modellversion.
Ange ett alias för en registrerad modell.

Beräkningskrav

Den beräkningsresurs som angetts för arbetsflödet måste ha åtkomst till Unity Catalog. Se Åtkomstlägen.

Skapa parallella arbetsflöden för träning, distribution och slutsatsdragning

För att uppgradera modelltränings- och slutsatsdragningsarbetsflöden till Unity Catalog rekommenderar Databricks en inkrementell metod där du skapar en parallell pipeline för träning, distribution och slutsatsdragning som utnyttjar modeller i Unity Catalog. När du är nöjd med resultatet med Unity Catalog kan du växla nedströmsanvändare för att läsa batchinferensutdata eller öka trafiken som dirigeras till modeller i Unity Catalog i serverslutpunkter.

Arbetsflöde för modellträning

Klona arbetsflödet för modellträning. Bekräfta att huvudkontot som kör arbetsflödet och den beräkning som angetts för arbetsflödet uppfyller kraven.

Ändra sedan modellträningskoden i det klonade arbetsflödet. Du kan behöva klona anteckningsboken som körs av arbetsflödet eller skapa och rikta in dig på en ny git-gren i det klonade arbetsflödet. Följ de här stegen för att installera den nödvändiga versionen av MLflow och konfigurera klienten så att den riktar in sig på Unity Catalog i träningskoden. Uppdatera sedan modellträningskoden för att registrera modeller till Unity Catalog. Se även Träna och registrera Unity Catalog-kompatibla modeller.

Arbetsflöde för modelldistribution

Klona arbetsflödet för modelldistribution. Bekräfta att huvudkontot som kör arbetsflödet och den beräkning som angetts för arbetsflödet uppfyller kraven.

Om du har modellverifieringslogik i ditt distributionsarbetsflöde, uppdatera det så att det läser in modellversioner från UC . Använd alias för att hantera distributioner av produktionsmodeller.

Arbetsflöde för modellinferens

Arbetsflöde för batchinferens

Klona arbetsflödet för batchinferens. Bekräfta att huvudkontot som kör arbetsflödet och den beräkning som angetts för arbetsflödet uppfyller kraven.

Arbetsflöde för modellservering

Om du använder Mosaic AI Model Serving behöver du inte klona din befintliga slutpunkt. Använd i stället funktionen trafikdelning för att börja dirigera en liten del av trafiken till modeller i Unity Catalog. När du granskar resultaten med Unity Catalog ökar du mängden trafik tills all trafik omdirigeras.

Höja upp en modell mellan miljöer

Att marknadsföra en modell mellan miljöer fungerar annorlunda med modeller i Unity Catalog. Mer information finns i Flytta upp en modell mellan miljöer.

Använda jobbwebbhooks för manuellt godkännande för modelldistribution

Databricks rekommenderar att du automatiserar modelldistributionen om möjligt med hjälp av lämpliga kontroller och tester under modelldistributionsprocessen. Men om du behöver utföra manuella godkännanden för att distribuera produktionsmodeller kan du använda jobbmeddelanden för att anropa externa CI/CD-system för att begära manuellt godkännande för att distribuera en modell när modellträningsjobbet har slutförts. När manuellt godkännande har angetts kan ditt CI/CD-system sedan distribuera modellversionen för att hantera trafik, till exempel genom att ange aliaset "Champion" på den.

Dela via