Share via


Machine Learning-regisztrációs adatbázisok MLOpshoz

Ebből a cikkből megtudhatja, hogyan méretezheti az MLOps-t a fejlesztési, tesztelési és éles környezetek között. A környezetek az informatikai környezet összetettségétől függően néhánytól többig változhatnak, és olyan tényezők befolyásolják, mint például:

  • Biztonsági és megfelelőségi szabályzatok – El kell különíteni az éles környezeteket a fejlesztési környezetektől a hozzáférés-vezérlés, a hálózati architektúra, az adatexpozíció stb. szempontjából?
  • Előfizetések – A fejlesztési környezetek egy előfizetésben és éles környezetben vannak egy másik előfizetésben? Gyakran külön előfizetéseket használnak számlázási, költségvetési és költségkezelési célokra.
  • Régiók – Különböző Azure-régiókban kell üzembe helyeznie a késési és redundanciakövetelményeket?

Ilyen esetekben előfordulhat, hogy különböző Azure Machine Learning-munkaterületeket használ fejlesztéshez, teszteléshez és éles környezethez. Ez a konfiguráció a következő kihívásokat mutatja be a modell betanításához és üzembe helyezéséhez:

  • Be kell tanítania egy modellt egy fejlesztési munkaterületen, de üzembe kell helyeznie egy végpontot egy éles munkaterületen, esetleg egy másik Azure-előfizetésben vagy -régióban. Ebben az esetben vissza kell tudnia követni a betanítási feladatot. Elemezheti például a modell betanítása során használt metrikákat, naplókat, kódot, környezetet és adatokat, ha pontossági vagy teljesítménybeli problémákat tapasztal az éles környezettel kapcsolatban.
  • Ki kell fejlesztenie egy betanítási folyamatot tesztadatokkal vagy anonimizált adatokkal a fejlesztési munkaterületen, de újra be kell tanítania a modellt éles adatokkal az éles munkaterületen. Ebben az esetben előfordulhat, hogy össze kell hasonlítania a minta és az éles adatok betanítási metrikáit, hogy a betanítási optimalizálások megfelelően működjenek a tényleges adatokkal.

Munkaterületek közötti MLOps adatbázisokkal

A git-adattárhoz hasonlóan a regisztrációs adatbázisok is leválasztják az ML-objektumokat a munkaterületekről, és központi helyen üzemeltetik őket, így elérhetővé válnak a szervezet összes munkaterülete számára.

Ha a modelleket környezetek (dev, test, prod) között szeretné népszerűsíteni, kezdje a modell iteratív fejlesztésével a devben. Ha jó jelölt modellel rendelkezik, közzéteheti egy beállításjegyzékben. Ezután telepítheti a modellt a beállításjegyzékből a különböző munkaterületek végpontjaira.

Tipp

Ha már regisztrált modelleket egy munkaterületen, előléptetheti őket egy beállításjegyzékbe. A modellt közvetlenül a regisztrációs adatbázisban is regisztrálhatja egy betanítási feladat kimenetéből.

Ha egy folyamatot egy munkaterületen szeretne fejleszteni, majd más munkaterületen futtatni, először regisztrálja a folyamat építőelemeit alkotó összetevőket és környezeteket. A folyamatfeladat elküldésekor az általa futtatott munkaterületet a számítási és betanítási adatok választják ki, amelyek egyediek az egyes munkaterületeken.

Az alábbi ábra a feltáró és fejlesztői munkaterületek közötti folyamatok előléptetését, majd a fejlesztési, tesztelési és éles modellek közötti előléptetést szemlélteti.

A folyamatok és a modellek környezetek közötti használatának diagramja.

Következő lépések