Share via


ML-werkstromen upgraden naar doelmodellen in Unity Catalog

In dit artikel wordt uitgelegd hoe u bestaande Databricks-werkstromen kunt migreren en upgraden voor het gebruik van modellen in Unity Catalog.

Vereisten

Vereiste bevoegdheden

Als u een modeltraining, implementatie of deductiewerkstroom in Unity Catalog wilt uitvoeren, moet de principal die de werkstroom uitvoert over de bevoegdheden USE CATALOG en USE SCHEMA beschikken voor de catalogus en het schema waarin het model is opgeslagen.

De volgende bevoegdheden zijn ook vereist:

  • Als u een model wilt maken, moet de principal over de CREATE MODEL bevoegdheid beschikken.
  • Om een model te laden of te implementeren, moet de principal de EXECUTE privilege hebben op het geregistreerde model.

Alleen de eigenaar van een geregistreerd model kan het volgende doen:

  • Maak een nieuwe modelversie.
  • Stel een alias in op een geregistreerd model.

Computatievereisten

De rekenresource die is opgegeven voor de werkstroom, moet toegang hebben tot Unity Catalog. Zie Accessmodi.

Parallelle trainings-, implementatie- en deductiewerkstromen maken

Als u modeltrainings- en deductiewerkstromen wilt upgraden naar Unity Catalog, raadt Databricks een incrementele benadering aan waarin u een parallelle trainings-, implementatie- en deductiepijplijn maakt die gebruikmaakt van modellen in Unity Catalog. Als u tevreden bent met de resultaten via Unity Catalog, kunt u downstream gebruikers overschakelen om de uitvoer van batch-inferentie te lezen, of het verkeer dat naar modellen in Unity Catalog wordt geleid bij het bedienen van eindpunten verhogen.

Werkstroom voor modeltraining

Kloon uw workflow voor het trainen van modellen. Controleer of de principal die de werkstroom uitvoert en de rekenkracht die is opgegeven voor de werkstroom voldoen aan de vereisten.

Wijzig vervolgens de modeltrainingscode in de gekloonde werkstroom. Mogelijk moet u het notebook dat door de workflow wordt uitgevoerd klonen of een nieuwe git-branch aanmaken en targeten in de gekloonde workflow. Volg deze stappen om de benodigde versie van MLflow te installeren en de client zo te configureren dat deze gericht op Unity Catalog in je trainingscode. Werk vervolgens de modeltrainingscode bij om modellen te registreren bij Unity Catalog. Zie Train en registreer modellen die compatibel zijn met Unity Catalog.

Werkstroom voor modelinzet

Kloon de werkstroom voor de implementatie van uw model. Controleer of de verantwoordelijke entiteit voor de uitvoering van de werkstroom en de opgegeven computercapaciteit voor de werkstroom voldoen aan de vereisten.

Als u modelvalidatielogica in uw implementatiewerkstroom hebt, werkt u deze bij om modelversies van UC te laden. Gebruik aliassen om de uitrol van productiemodellen te beheren.

Werkstroom voor modelinference

Werkstroom voor batch-inferentie

Kloon de werkstroom voor Batch-inferentie. Controleer of de principal die de werkstroom uitvoert en de computerbronnen die zijn opgegeven voor de werkstroom voldoen aan de vereisten.

Model voor werkstroom

Als u Mosaic AI Model Serving gebruikt, hoeft u uw bestaande eindpunt niet te klonen. Gebruik in plaats daarvan de traffic split-functie om te beginnen met het routeren van een klein deel van het verkeer naar modellen in Unity Catalog. Wanneer u de resultaten bekijkt met behulp van Unity Catalog, verhoogt u de hoeveelheid verkeer totdat al het verkeer wordt omgeleid.

Een model promoten over omgevingen heen

Het promoten van een model in omgevingen werkt anders met modellen in Unity Catalog. Zie Een model promoten tussen omgevingen voor details.

Gebruik webhooks voor taakhandmatige goedkeuring bij modelimplementatie

Databricks raadt u aan om modelimplementatie indien mogelijk te automatiseren met behulp van de juiste controles en tests tijdens het implementatieproces van het model. Als u echter handmatige goedkeuringen moet uitvoeren om productiemodellen te implementeren, kunt u taakmeldingen gebruiken om externe CI/CD-systemen te benaderen om handmatige goedkeuring te vragen voor het implementeren van een model, nadat uw modeltraining succesvol is voltooid. Nadat handmatige goedkeuring is opgegeven, kan uw CI/CD-systeem vervolgens de modelversie implementeren om verkeer te leveren, bijvoorbeeld door de alias 'Kampioen' erop in te stellen.