Megosztás a következőn keresztül:


Gépi tanulási műveletek

Ez a cikk három Azure-architektúrát ismertet olyan gépi tanulási műveletekhez, amelyek végpontok közötti folyamatos integrációval és folyamatos kézbesítési (CI/CD) folyamatokkal és újratanítási folyamatokkal rendelkeznek. Az architektúrák az alábbi AI-alkalmazásokhoz tartoznak:

  • Klasszikus gépi tanulás
  • Számítógépes látás (CV)
  • Természetes nyelvek feldolgozása

Ezek az architektúrák az MLOps v2 projekt terméke. Ezek olyan ajánlott eljárásokat tartalmaznak, amelyeket a megoldástervezők a különböző gépi tanulási megoldások fejlesztése során azonosítottak. Az eredmény üzembe helyezhető, megismételhető és karbantartható minták. Mindhárom architektúra az Azure Machine Learning szolgáltatást használja.

Az MLOps v2-hez készült minta üzembehelyezési sablonokat tartalmazó implementációt az Azure MLOps v2 GitHub-adattárban talál.

Lehetséges használati esetek

  • Klasszikus gépi tanulás: A táblázatos strukturált adatok idősoros előrejelzése, regressziója és besorolása a leggyakoribb használati esetek ebben a kategóriában. Ide sorolhatóak például a kövekezők:

    • Bináris és többcímkés besorolás.

    • Lineáris, polinomiális, gerinc, lasszó, kvantilis és Bayes-regresszió.

    • ARIMA, autoregresszív, SARIMA, VAR, SES, LSTM.

  • CV: A cikkben szereplő MLOps-keretrendszer elsősorban a szegmentálás és a képbesorolás CV-használati eseteire összpontosít.

  • Természetes nyelvi feldolgozás: Ezt az MLOps-keretrendszert használhatja a következő implementáláshoz:

    • Elnevezett entitásfelismerés:

    • Szövegbesorolás

    • Szöveg létrehozása

    • Hangulatelemzés

    • Fordítás

    • Kérdésmegválaszolás

    • Összegzés

    • Mondatészlelés

    • Nyelvfelismerés

    • Beszédrészlet-címkézés

A jelen cikkben nem ismertetjük az AI-szimulációkat, a mély megerősítéses tanulást és az AI egyéb formáit.

Architektúra

Az MLOps v2 architektúraminta az MLOps életciklusának négy fő moduláris összetevőjét vagy fázisát tartalmazza:

  • Adatvagyon
  • Felügyelet és beállítás
  • Modellfejlesztés vagy a belső ciklus fázisa
  • Modell üzembe helyezése vagy a külső ciklus fázisa

A fenti összetevők, a köztük lévő kapcsolatok és az érintett tipikus személyek minden MLOps v2-es forgatókönyv-architektúrában szabványosak. Az egyes összetevők részleteinek variációi a forgatókönyvtől függenek.

Az MLOps v2 for Machine Learning alaparchitektúrája a táblázatos adatok klasszikus gépi tanulási forgatókönyve. A CV- és NLP-architektúrák erre az alaparchitektúrára épülnek, és módosítják azt.

Az MLOps v2 a cikkben ismertetett alábbi architektúrákat ismerteti:

Klasszikus gépi tanulási architektúra

A klasszikus gépi tanulási architektúrát bemutató ábra.

Töltse le az architektúra Visio-fájlját.

A klasszikus gépi tanulási architektúra munkafolyamata

  1. Adatvagyon

    Ez az összetevő bemutatja a szervezet adattulajdonát, valamint egy adatelemzési projekt lehetséges adatforrásait és céljait. Az MLOps v2 életciklus ezen összetevőjének elsődleges tulajdonosai az adatmérnökök. A diagramban szereplő Azure-adatplatformok nem teljesek vagy előírók. A zöld pipa azokat az adatforrásokat és célokat jelöli, amelyek az ajánlott eljárásokat jelölik, amelyek az ügyfél használati esetén alapulnak.

  2. Felügyelet és beállítás

    Ez az összetevő az MLOps v2-megoldás üzembe helyezésének első lépése. Ez a projekthez társított erőforrások és szerepkörök létrehozásával és kezelésével kapcsolatos összes tevékenységből áll. Az infrastruktúra-csapat például a következő lehet:

    1. Projekt forráskódtárak létrehozása.
    2. Machine Learning-munkaterületek létrehozása a Bicep vagy a Terraform használatával.
    3. Adathalmazok és számítási erőforrások létrehozása vagy módosítása modellfejlesztéshez és üzembe helyezéshez.
    4. A projektcsapat felhasználóinak, szerepköreinek és hozzáférés-vezérlőinek meghatározása más erőforrásokhoz.
    5. CI-/CD-folyamatok létrehozása.
    6. Monitorozási összetevők létrehozása a modell- és infrastruktúrametrikák riasztásainak gyűjtéséhez és létrehozásához.

    Az ehhez a fázishoz társított elsődleges személy az infrastruktúra-csapat, de egy szervezet adatmérnökökkel, gépi tanulási mérnökökkel vagy adattudósokkal is rendelkezhet.

  3. Modellfejlesztés (belső ciklus fázis)

    A belső ciklus fázisa egy iteratív adatelemzési munkafolyamatból áll, amely egy dedikált és biztonságos Machine Learning-munkaterületen belül működik. Az előző diagram egy tipikus munkafolyamatot mutat be. A folyamat az adatbetöltéssel kezdődik, feltáró adatelemzésen, kísérletezésen, modellfejlesztésen és -kiértékelésen megy keresztül, majd regisztrál egy modellt éles használatra. Ez a moduláris összetevő agnosztikus és alkalmazkodik ahhoz a folyamathoz, amelyet az adatelemzési csapat a modellek fejlesztéséhez használ.

    Az ehhez a fázishoz társított személyek közé tartoznak az adattudósok és a gépi tanulási mérnökök.

  4. Machine Learning-regisztrációs adatbázisok

    Miután az adatelemzési csapat kifejlesztett egy modellt, amelyet üzembe helyezhetnek az éles környezetben, regisztrálják a modellt a Machine Learning-munkaterület beállításjegyzékében. A modellregisztráció vagy a cikluson belüli emberi jóváhagyás által automatikusan aktivált CI-folyamatok előléptetik a modellt és minden más modellfüggőséget a modell üzembehelyezési fázisához.

    Az ehhez a fázishoz társított személyek általában gépi tanulási mérnökök.

  5. Modell üzembe helyezése (külső ciklus fázisa)

    A modell üzembe helyezésének vagy külső ciklusának fázisa a gyártás előtti előkészítésből és tesztelésből, az éles üzembe helyezésből és a modell, az adatok és az infrastruktúra figyeléséből áll. Ha a modell megfelel a szervezet és a használati eset feltételeinek, a CD-folyamatok a modell és a kapcsolódó eszközök használatát támogatják az éles környezet, a monitorozás és a lehetséges újratanítás révén.

    Az ehhez a fázishoz társított személyek elsősorban gépi tanulási mérnökök.

  6. Előkészítés és tesztelés

    Az előkészítési és tesztelési fázis az ügyfél gyakorlatától függően változik. Ez a fázis általában olyan műveleteket foglal magában, mint a modelljelölt újratanítása és tesztelése az éles adatokon, a végpontok teljesítményének tesztelése, az adatminőség-ellenőrzések, az egységtesztelés, valamint a modell és az adat elfogultságáért felelős AI-ellenőrzések. Ez a fázis egy vagy több dedikált és biztonságos Machine Learning-munkaterületen zajlik.

  7. Éles üzembe helyezés

    Miután egy modell átment az előkészítési és tesztelési fázison, a gépi tanulási mérnökök emberi jóváhagyással előléptethetik azt az éles környezetben. A modellterjesztési lehetőségek közé tartozik egy felügyelt kötegvégpont kötegelt forgatókönyvekhez, vagy felügyelt online végpont vagy Kubernetes-üzembe helyezés, amely az Azure Arcot használja online, közel valós idejű forgatókönyvekhez. Az éles üzem általában egy vagy több dedikált és biztonságos Machine Learning-munkaterületen történik.

  8. Figyelés

    A gépi tanulási mérnökök figyelik az előkészítés, a tesztelés és az éles környezet összetevőit, hogy összegyűjtsék a modell, az adatok és az infrastruktúra teljesítményváltozásával kapcsolatos metrikákat. Ezeket a metrikákat használhatják a műveletek végrehajtásához. A modell- és adatmonitorozás magában foglalhatja a modell és az adateltolódás ellenőrzését, az új adatok modellteljesítményét és a felelős AI-problémákat. Az infrastruktúra monitorozása lassú végpontválaszt, nem megfelelő számítási kapacitást vagy hálózati problémákat azonosíthat.

  9. Adatok és modellek monitorozása: események és műveletek

    Modell- és adatfeltételek, például metrikaküszöbök vagy ütemezések alapján az automatizált eseményindítók és értesítések megfelelő műveleteket hajthatnak végre. Az eseményindítók például újratanítanak egy modellt új éles adatok használatára, majd visszacsatolást végeznek a modellen az előkészítéshez és a teszteléshez az előkészületi értékeléshez. Vagy egy modell- vagy adatproblémák olyan műveletet indíthatnak el, amely visszalépést igényel a modellfejlesztési fázishoz, ahol az adatelemzők megvizsgálhatják a problémát, és potenciálisan új modellt fejleszthetnek.

  10. Infrastruktúra monitorozása: események és műveletek

    Az automatizált eseményindítók és -értesítések az infrastruktúra feltételei alapján megfelelő műveleteket hajthatnak végre, például a végpontok válaszának késése vagy az üzembe helyezés nem megfelelő számítási kapacitása alapján. Az automatikus triggerek és értesítések visszacsatolást válthatnak ki a beállítási és adminisztrációs fázisra, ahol az infrastruktúra-csapat kivizsgálhatja a problémát, és esetleg újrakonfigurálhatja a számítási és hálózati erőforrásokat.

Machine Learning CV-architektúra

A számítógépes látás architektúrát bemutató ábra.

Töltse le az architektúra Visio-fájlját.

A CV-architektúra munkafolyamata

A Machine Learning CV architektúrája a klasszikus gépi tanulási architektúrán alapul, de a felügyelt CV-forgatókönyvekre jellemző módosításokkal rendelkezik.

  1. Adatvagyon

    Ez az összetevő bemutatja a szervezet adattulajdonát, valamint egy adatelemzési projekt lehetséges adatforrásait és céljait. Ennek az összetevőnek az elsődleges tulajdonosai az adatmérnökök az MLOps v2 életciklusában. A diagramban szereplő Azure-adatplatformok nem teljesek vagy előírók. A CV-forgatókönyvek képei különböző adatforrásokból származhatnak. A Machine Learning cv-modelljeinek fejlesztése és üzembe helyezése során a hatékonyság érdekében az Azure Blob Storage és az Azure Data Lake Storage használatát javasoljuk.

  2. Felügyelet és beállítás

    Ez az összetevő az MLOps v2 üzembe helyezésének első lépése. Ez a projekthez társított erőforrások és szerepkörök létrehozásával és kezelésével kapcsolatos összes tevékenységből áll. Cv-forgatókönyvek esetén az MLOps v2 környezet felügyelete és beállítása nagyrészt megegyezik a klasszikus gépi tanulással, de egy további lépést is tartalmaz. Az infrastruktúra-csapat a Machine Learning vagy egy másik eszköz címkézési funkcióját használja képfelirat- és széljegyzetprojektek létrehozásához.

  3. Modellfejlesztés (belső ciklus fázis)

    A belső ciklus fázisa egy iteratív adatelemzési munkafolyamatból áll, amelyet egy dedikált és biztonságos Machine Learning-munkaterületen hajtanak végre. A munkafolyamat és a klasszikus gépi tanulási forgatókönyv közötti elsődleges különbség az, hogy a képfeliratok és a széljegyzetek a fejlesztési ciklus kulcsfontosságú összetevői.

  4. Machine Learning-regisztrációs adatbázisok

    Miután az adatelemzési csapat kifejlesztett egy modellt, amelyet üzembe helyezhetnek az éles környezetben, regisztrálják a modellt a Machine Learning-munkaterület beállításjegyzékében. A modellregisztráció vagy a cikluson belüli emberi jóváhagyás által automatikusan aktivált CI-folyamatok előléptetik a modellt és minden más modellfüggőséget a modell üzembehelyezési fázisához.

  5. Modell üzembe helyezése (külső ciklus fázisa)

    A modell üzembe helyezésének vagy külső ciklusának fázisa a gyártás előtti előkészítésből és tesztelésből, az éles üzembe helyezésből és a modell, az adatok és az infrastruktúra figyeléséből áll. Ha a modell megfelel a szervezet és a használati eset feltételeinek, a CD-folyamatok a modell és a kapcsolódó eszközök használatát támogatják az éles környezet, a monitorozás és a lehetséges újratanítás révén.

  6. Előkészítés és tesztelés

    Az előkészítési és tesztelési fázis az ügyfél gyakorlatától függően változik. Ez a fázis általában olyan műveleteket foglal magában, mint a végpontteljesítmény tesztelése, az adatminőség-ellenőrzések, az egységtesztelés, valamint a modell és az adat elfogultságáért felelős AI-ellenőrzések. Cv-forgatókönyvek esetén a gépi tanulási mérnököknek erőforrás- és időkorlátok miatt nem kell újratanulnia a modelljelöltet az éles adatokon. Az adatelemzési csapat ehelyett éles adatokat használhat a modellfejlesztéshez. A fejlesztési ciklusból regisztrált jelölt modell éles környezetben lesz kiértékelve. Ez a fázis egy vagy több dedikált és biztonságos Machine Learning-munkaterületen zajlik.

  7. Éles üzembe helyezés

    Miután egy modell átment az előkészítési és tesztelési fázison, a gépi tanulási mérnökök emberi jóváhagyással előléptethetik azt az éles környezetben. A modellterjesztési lehetőségek közé tartozik egy felügyelt kötegvégpont kötegelt forgatókönyvekhez, vagy felügyelt online végpont vagy Kubernetes-üzembe helyezés, amely az Azure Arcot használja online, közel valós idejű forgatókönyvekhez. Az éles üzem általában egy vagy több dedikált és biztonságos Machine Learning-munkaterületen történik.

  8. Figyelés

    A gépi tanulási mérnökök figyelik az előkészítés, a tesztelés és az éles környezet összetevőit, hogy összegyűjtsék a modell, az adatok és az infrastruktúra teljesítményváltozásával kapcsolatos metrikákat. Ezeket a metrikákat használhatják a műveletek végrehajtásához. A modell- és adatmonitorozás magában foglalhatja a modell teljesítményének ellenőrzését az új képeken. Az infrastruktúra monitorozása lassú végpontválaszt, nem megfelelő számítási kapacitást vagy hálózati problémákat azonosíthat.

  9. Adatok és modellek monitorozása: események és műveletek

    Az MLOps adat- és modellmonitorozási, esemény- és műveleti fázisai a természetes nyelvi feldolgozáshoz a klasszikus gépi tanulás fő különbségei. Az automatikus újratanítás általában nem történik meg cv-forgatókönyvekben, ha a modell teljesítménye romlik az új képeken. Ebben az esetben emberi folyamatra van szükség a rosszul teljesítő modell új szöveges adatainak áttekintéséhez és megjegyzéséhez. A következő művelet gyakran visszatér a modellfejlesztési ciklushoz, hogy frissítse a modellt az új rendszerképekkel.

  10. Infrastruktúra monitorozása: események és műveletek

    Az automatizált eseményindítók és -értesítések az infrastruktúra feltételei alapján megfelelő műveleteket hajthatnak végre, például a végpontok válaszának késése vagy az üzembe helyezés nem megfelelő számítási kapacitása alapján. Az automatikus eseményindítók és értesítések visszacsatolást válthatnak ki a beállítási és adminisztrációs fázisra, ahol az infrastruktúra-csapat kivizsgálhatja a problémát, és esetleg újrakonfigurálhatja a környezetet, a számítási és a hálózati erőforrásokat.

Machine Learning természetes nyelvfeldolgozási architektúra

A természetes nyelvi feldolgozási architektúra ábrája.

Töltse le az architektúra Visio-fájlját.

A természetes nyelvi feldolgozási architektúra munkafolyamata

A Machine Learning természetes nyelvfeldolgozási architektúrája a klasszikus gépi tanulási architektúrán alapul, de néhány, az NLP-forgatókönyvekre jellemző módosítással rendelkezik.

  1. Adatvagyon

    Ez az összetevő egy adatelemzési projekt szervezeti adattulajdonát, lehetséges adatforrásait és céljait mutatja be. Ennek az összetevőnek az elsődleges tulajdonosai az adatmérnökök az MLOps v2 életciklusában. A diagramban szereplő Azure-adatplatformok nem teljesek vagy előírók. A zöld pipa olyan forrásokat és célokat jelöl, amelyek az ajánlott eljárásokat jelölik, amelyek az ügyfél használati esetén alapulnak.

  2. Felügyelet és beállítás

    Ez az összetevő az MLOps v2 üzembe helyezésének első lépése. Ez a projekthez társított erőforrások és szerepkörök létrehozásával és kezelésével kapcsolatos összes tevékenységből áll. A természetes nyelvi feldolgozási forgatókönyvek esetében az MLOps v2 környezet felügyelete és beállítása nagyrészt megegyezik a klasszikus gépi tanuláséval, de egy további lépéssel: a Machine Learning vagy egy másik eszköz címkézési funkciójával képfelirat- és széljegyzetprojekteket hozhat létre.

  3. Modellfejlesztés (belső ciklus fázis)

    A belső ciklus fázisa egy iteratív adatelemzési munkafolyamatból áll, amelyet egy dedikált és biztonságos Machine Learning-munkaterületen hajtanak végre. A tipikus NLP-modell fejlesztési ciklusa abban különbözik a klasszikus gépi tanulási forgatókönyvtől, hogy a forgatókönyv tipikus fejlesztési lépései közé tartoznak a mondatok és jogkivonatok jegyzetei, a normalizálás és a szöveges adatok beágyazása.

  4. Machine Learning-regisztrációs adatbázisok

    Miután az adatelemzési csapat kifejlesztett egy modellt, amelyet üzembe helyezhetnek az éles környezetben, regisztrálják a modellt a Machine Learning-munkaterület beállításjegyzékében. A modellregisztráció vagy a cikluson belüli emberi jóváhagyás által automatikusan aktivált CI-folyamatok előléptetik a modellt és minden más modellfüggőséget a modell üzembehelyezési fázisához.

  5. Modell üzembe helyezése (külső ciklus fázisa)

    A modell üzembe helyezésének vagy külső ciklusának fázisa a gyártás előtti előkészítésből és tesztelésből, az éles üzembe helyezésből és a modell, az adatok és az infrastruktúra figyeléséből áll. Ha a modell megfelel a szervezet és a használati eset feltételeinek, a CD-folyamatok a modell és a kapcsolódó eszközök használatát támogatják az éles környezet, a monitorozás és a lehetséges újratanítás révén.

  6. Előkészítés és tesztelés

    Az előkészítési és tesztelési fázis az ügyfél gyakorlatától függően változik. Ez a fázis általában olyan műveleteket foglal magában, mint a modelljelölt újratanítása és tesztelése az éles adatokon, a végpontok teljesítményének tesztelése, az adatminőség-ellenőrzések, az egységtesztelés, valamint a modell és az adat elfogultságáért felelős AI-ellenőrzések. Ez a fázis egy vagy több dedikált és biztonságos Machine Learning-munkaterületen zajlik.

  7. Éles üzembe helyezés

    Miután egy modell átment az előkészítési és tesztelési fázison, a gépi tanulási mérnökök emberi jóváhagyással előléptethetik azt az éles környezetben. A modellterjesztési lehetőségek közé tartozik egy felügyelt kötegvégpont kötegelt forgatókönyvekhez, vagy felügyelt online végpont vagy Kubernetes-üzembe helyezés, amely az Azure Arcot használja online, közel valós idejű forgatókönyvekhez. Az éles üzem általában egy vagy több dedikált és biztonságos Machine Learning-munkaterületen történik.

  8. Figyelés

    A gépi tanulási mérnökök figyelik az előkészítés, a tesztelés és az éles környezet összetevőit, hogy összegyűjtsék a modell, az adatok és az infrastruktúra teljesítményváltozásával kapcsolatos metrikákat. Ezeket a metrikákat használhatják a műveletek végrehajtásához. A modell- és adatmonitorozás magában foglalhatja a modell és az adateltolódás ellenőrzését, az új szöveges adatok modellteljesítményét és a felelős AI-problémákat. Az infrastruktúra monitorozása azonosíthatja a problémákat, például a lassú végpontok válaszát, a nem megfelelő számítási kapacitást és a hálózati problémákat.

  9. Adatok és modellek monitorozása: események és műveletek

    A CV architektúrához hasonlóan az MLOps adat- és modellmonitorozási, esemény- és műveleti fázisai is a klasszikus gépi tanulás fő különbségei. Az automatikus újratanítás általában nem természetes nyelvi feldolgozási forgatókönyvekben történik, amikor a modell teljesítménycsökkenését észleli az új szövegen. Ebben az esetben emberi folyamatra van szükség a rosszul teljesítő modell új szöveges adatainak áttekintéséhez és megjegyzéséhez. A következő művelet gyakran az, hogy visszatér a modell fejlesztési ciklusához, hogy frissítse a modellt az új szöveges adatokkal.

  10. Infrastruktúra monitorozása: események és műveletek

    Az automatizált eseményindítók és -értesítések az infrastruktúra feltételei alapján megfelelő műveleteket hajthatnak végre, például a végpontok válaszának késése vagy az üzembe helyezés nem megfelelő számítási kapacitása alapján. Az automatikus triggerek és értesítések visszacsatolást válthatnak ki a beállítási és adminisztrációs fázisra, ahol az infrastruktúra-csapat kivizsgálhatja a problémát, és esetleg újrakonfigurálhatja a számítási és hálózati erőforrásokat.

Összetevők

  • A Machine Learning egy felhőalapú szolgáltatás, amellyel nagy léptékű gépi tanulási modelleket taníthat be, értékelhet, helyezhet üzembe és kezelhet.

  • Az Azure Pipelines egy azure DevOpson alapuló buildelési és tesztelési rendszer, amely a buildelési és kiadási folyamatokhoz használatos. Az Azure Pipelines ezeket a folyamatokat tevékenységeknek nevezett logikai lépésekre osztja fel.

  • A GitHub egy kódtárplatform verziókövetési, együttműködési és CI/CD-munkafolyamatokhoz.

  • Az Azure Arc egy olyan platform, amely az Azure Resource Manager használatával kezeli az Azure-erőforrásokat és a helyszíni erőforrásokat. Az erőforrások tartalmazhatnak virtuális gépeket, Kubernetes-fürtöket és adatbázisokat.

  • A Kubernetes egy nyílt forráskódú rendszer, amellyel automatizálhatja a tárolóalapú alkalmazások üzembe helyezését, méretezését és felügyeletét.

  • Az Azure Data Lake Storage egy Hadoop-kompatibilis fájlrendszer. Integrált hierarchikus névtérrel, valamint a Blob Storage nagy léptékű és gazdaságosságával rendelkezik.

  • Az Azure Synapse Analytics egy korlátlan elemzési szolgáltatás, amely egyesíti az adatintegrációt, a nagyvállalati adattárházakat és a big data elemzéseket.

  • Az Azure Event Hubs egy szolgáltatás, amely betölti az ügyfélalkalmazások által létrehozott adatfolyamokat. Ezután betölti és tárolja a streamelési adatokat, ami megőrzi a fogadott események sorrendjét. Az ügyfelek csatlakozhatnak a központi végpontokhoz az üzenetek feldolgozásához. Ez az architektúra a Data Lake Storage-integrációt használja.

Egyéb szempontok

Az előző MLOps v2 architekturális minta számos kritikus összetevővel rendelkezik, beleértve a szerepköralapú hozzáférés-vezérlést (RBAC), amely igazodik az üzleti érdekelt felekhez, a hatékony csomagkezelést és a robusztus monitorozási mechanizmusokat. Ezek az összetevők együttesen hozzájárulnak a gépi tanulási munkafolyamatok sikeres végrehajtásához és kezeléséhez.

Persona-alapú RBAC

Fontos, hogy kezelje a gépi tanulási adatokhoz és erőforrásokhoz való hozzáférést. Az RBAC egy robusztus keretrendszert biztosít, amellyel felügyelheti, hogy ki hajthat végre konkrét műveleteket, és milyen területekhez férhet hozzá a megoldáson belül. Az identitásszegmentálási stratégiát úgy tervezheti meg, hogy igazodjon a Machine Learning gépi tanulási modelljeinek életciklusához és a folyamathoz tartozó személyekhez. Minden személynek van egy meghatározott feladatköre, amely tükröződik az RBAC-szerepkörökben és a csoporttagságban.

Példaszemélyek

A gépi tanulási számítási feladatok megfelelő szegmentálásának támogatásához vegye figyelembe az alábbi gyakori személyeket, amelyek tájékoztatják az identitásalapú RBAC-csoport kialakítását.

Adatelemző és gépi tanulási mérnök

Az adattudósok és gépi tanulási mérnökök különböző gépi tanulási és adatelemzési tevékenységeket végeznek a projekt szoftverfejlesztési életciklusa során. Feladataik közé tartozik a feltáró jellegű adatelemzés és az adatok előfeldolgozása. Az adattudósok és a gépi tanulási mérnökök felelősek a modellek betanításáért, kiértékeléséért és üzembe helyezéséért. Ezek a szerepkörök feladatai közé tartoznak a gépi tanulási modellek, csomagok és adatok törésjavítási tevékenységei is. Ezek a feladatok nem tartoznak a platform technikai támogatási csapatának hatókörébe.

Típus: Személy
Projektspecifikus: Igen

Adatelemző

Az adatelemzők biztosítják a szükséges bemenetet az adatelemzési tevékenységekhez, például sql-lekérdezések üzleti intelligenciához való futtatásához. A szerepkör feladatai közé tartozik az adatokkal való munka, az adatelemzés elvégzése, valamint a modellfejlesztés és a modelltelepítés támogatása.

Típus: Személy
Projektspecifikus: Igen

Modelltesztelő

A modelltesztelők teszteket végeznek tesztelési és előkészítési környezetekben. Ez a szerepkör funkcionális elkülönítést biztosít a CI/CD-folyamatoktól.

Típus: Személy
Projektspecifikus: Igen

Üzleti érdekelt felek

Az üzleti érdekelt felek a projekthez kapcsolódnak, például egy marketingmenedzserhez.

Típus: Személy
Projektspecifikus: Igen

Projekt érdeklődője vagy adatelemzési érdeklődője

Az adatelemzési érdeklődő a Machine Learning-munkaterület projektfelügyeleti szerepköre. Ez a szerepkör a gépi tanulási modellekhez és csomagokhoz is elvégzi a törésjavítási tevékenységeket.

Típus: Személy
Projektspecifikus: Igen

Projekt- vagy terméktulajdonos (üzleti tulajdonos)

Az üzleti érdekelt felek az adatok tulajdonjoga alapján felelősek a Machine Learning-munkaterületért.

Típus: Személy
Projektspecifikus: Igen

Platform technikai támogatása

A platform technikai támogatása a platformon belüli törésjavítási tevékenységekért felelős technikai támogatási személyzet. Ez a szerepkör az infrastruktúrára vagy szolgáltatásra vonatkozik, a gépi tanulási modellekre, csomagokra vagy adatokra nem. Ezek az összetevők az adatelemző vagy gépi tanulási mérnök szerepkör alatt maradnak, és a projektvezető felelőssége.

Típus: Személy
Projektspecifikus: Nem

Modell végfelhasználója

A modell végfelhasználói a gépi tanulási modell végfelhasználói.

Típus: Személy vagy folyamat
Projektspecifikus: Igen

CI/CD-folyamatok

A CI/CD-folyamatok a platformkörnyezetek változásainak kiadását vagy visszaállítását hajtják végre.

Típus: Folyamat
Projektspecifikus: Nem

Machine Learning-munkaterület

A Machine Learning-munkaterületek felügyelt identitásokat használnak az Azure más részeivel való interakcióhoz. Ez a személy képviseli a Machine Learning implementációját alkotó különböző szolgáltatásokat. Ezek a szolgáltatások a platform más részeivel, például a fejlesztési adattárral csatlakozó fejlesztési munkaterülettel működnek együtt.

Típus: Folyamat
Projektspecifikus: Nem

Monitorozási folyamatok

A monitorozási folyamatok olyan számítási folyamatok, amelyek platformtevékenységek alapján figyelik és riasztást küldenek.

Típus: Folyamat
Projektspecifikus: Nem

Adatkezelési folyamatok

Az adatszabályozási folyamatok a gépi tanulási projektet és az adattárakat adatszabályozási célokra keresik.

Típus: Folyamat
Projektspecifikus: Nem

Microsoft Entra-csoporttagság

Az RBAC implementálásakor a Microsoft Entra-csoportok rugalmas és méretezhető módot biztosítanak a hozzáférési engedélyek különböző személyek közötti kezelésére. A Microsoft Entra-csoportokkal kezelheti azokat a felhasználókat, amelyeknek ugyanazzal a hozzáféréssel és engedélyekkel kell rendelkeznie az erőforrásokhoz, például a korlátozott alkalmazásokhoz és szolgáltatásokhoz. Ahelyett, hogy speciális engedélyeket ad hozzá az egyes felhasználókhoz, létrehoz egy csoportot, amely a csoport minden tagjára alkalmazza a speciális engedélyeket.

Ebben az architektúramintában ezeket a csoportokat összekapcsolhatja egy Machine Learning-munkaterület beállításával, például projekttel, csapattal vagy részleggel. A felhasználókat adott csoportokkal társítva részletes hozzáférési szabályzatokat határozhat meg. A szabályzatok különböző Machine Learning-munkaterületekhez biztosítanak vagy korlátoznak engedélyeket feladatfüggvények, projektkövetelmények vagy egyéb feltételek alapján. Létrehozhat például egy csoportot, amely minden adatelemző számára hozzáférést biztosít egy fejlesztési munkaterülethez egy adott használati esethez.

Identity RBAC

Fontolja meg, hogyan használhatja az alábbi beépített Azure RBAC-szerepköröket az RBAC éles és termelési környezetekre való alkalmazásához. A cikkben szereplő architektúra esetében az éles környezetek közé tartoznak az előkészítési, tesztelési és éles környezetek. Az előkészületi környezetek a fejlesztési környezeteket is magukban foglalják. Az alábbi RBAC-szerepkörök a cikkben korábban ismertetett személyeken alapulnak.

Standard szerepkörök

Összetevőspecifikus szerepkörök

Ezek az Azure RBAC-szerepkör rövidítések az alábbi tábláknak felelnek meg.

Éles környezet
Persona Machine Learning-munkaterület Azure Key Vault Container Registry Azure Storage-fiók Azure DevOps Azure Artifacts Log Analytics-munkaterület Azure Monitor
Adattudós R LAR MR
Adatelemző
Modelltesztelő
Üzleti érdekelt felek MR
Projekt érdeklődője (adatelemzési érdeklődő) R R, KVR R LAR MR
Projekt/termék tulajdonosa MR
Platform technikai támogatása O O, KVA DOPCA O O O
Modell végfelhasználója
CI/CD-folyamatok O O, KVA AcrPush DOPCA O O O
Machine Learning-munkaterület R C C
Monitorozási folyamatok R LAR MR
Adatkezelési folyamatok R R R R R
Gyártás előtti környezet
Persona Machine Learning-munkaterület Key Vault Container Registry Tárfiók Azure DevOps Azure Artifacts Log Analytics-munkaterület Azure Monitor
Adattudós HIRDETÉSEK R, KVA C C C C LAKKGUMI MC
Adatelemző R C LAR MC
Modelltesztelő R R, KVR R R R R LAR MR
Üzleti érdekelt felek R R R R R
Projekt érdeklődője (adatelemzési érdeklődő) C C, KVA C C C C LAKKGUMI MC
Projekt/termék tulajdonosa R R MR
Platform technikai támogatása O O, KVA O O DOPCA O O O
Modell végfelhasználója
CI/CD-folyamatok O O, KVA AcrPush O DOPCA O O O
Machine Learning-munkaterület R, KVR C C
Monitorozási folyamatok R R R R R R LAKKGUMI
Adatkezelési folyamatok R R R

Feljegyzés

Minden személy fenntartja a hozzáférést a projekt időtartamára, kivéve a platform technikai támogatását, amely ideiglenes vagy igény szerinti Microsoft Entra Privileged Identity Management (PIM) hozzáféréssel rendelkezik.

Az RBAC nélkülözhetetlen szerepet játszik az MLOps-munkafolyamatok biztonságossá tételében és streamében. Az RBAC a hozzárendelt szerepkörök alapján korlátozza a hozzáférést, és megakadályozza, hogy illetéktelen felhasználók hozzáférjenek a bizalmas adatokhoz, ami csökkenti a biztonsági kockázatokat. A bizalmas adatok közé tartoznak a betanítási adatok vagy modellek, valamint a kritikus infrastruktúra, például az éles folyamatok. Az RBAC használatával biztosíthatja az adatvédelmi előírásoknak való megfelelést. Az RBAC emellett a hozzáférés és az engedélyek egyértelmű nyilvántartását is biztosítja, ami leegyszerűsíti a naplózást, megkönnyíti a biztonsági rések azonosítását és a felhasználói tevékenységek nyomon követését.

Csomagkezelés

A különböző csomagoktól, kódtáraktól és bináris fájloktól való függőségek gyakoriak az MLOps életciklusában. Ezek a gyakran közösségi fejlesztésű és gyorsan fejlődő függőségek a megfelelő használathoz és megértéshez szakértelmet igényelnek. Gondoskodnia kell arról, hogy a megfelelő személyek biztonságosan hozzáférhessenek a különböző eszközökhöz, például csomagokhoz és kódtárakhoz, de meg kell akadályoznia a biztonsági réseket is. Az adattudósok ezt a problémát akkor tapasztalják, amikor speciális építőelemeket szerelnek össze gépi tanulási megoldásokhoz. A hagyományos szoftverkezelési megközelítések költségesek és nem hatékonyak. Más megközelítések több értéket biztosítanak.

A függőségek kezeléséhez használhat biztonságos, önkiszolgáló, csomagkezelési folyamatot a Karantén minta alapján. Ezt a folyamatot úgy tervezheti meg, hogy lehetővé tegye az adatelemzők számára, hogy önkiszolgálók legyenek a csomagok válogatott listájából, és biztosíthassák, hogy a csomagok biztonságosak és megfeleljenek a szervezeti szabványoknak.

Ez a megközelítés három, iparági szabványnak megfelelő gépi tanulási csomagtárat tartalmaz: Microsoft Eszközjegyzék, Python-csomagindex (PyPI) és Conda. A biztonságos listázás lehetővé teszi az önálló kiszolgálást az egyes Machine Learning-munkaterületekről. Ezután az üzembe helyezés során használjon automatizált tesztelési folyamatot az eredményként kapott megoldástárolók vizsgálatához. A hibák elegánsan kilépnek az üzembe helyezési folyamatból, és eltávolítják a tárolót. A következő diagram és folyamat ezt a folyamatot mutatja be:

A biztonságos Machine Learning-csomag megközelítését bemutató ábra.

Folyamat

  1. A hálózatkonfigurációval rendelkező Machine Learning-munkaterületen dolgozó adattudósok igény szerint önkiszolgáló gépi tanulási csomagokat is kiszolgálhatnak a gépi tanulási csomagtárakból. Kivételi folyamat szükséges minden máshoz a privát tárolási minta használatával, amelyet központi függvény használatával szórnak ki és tartanak karban.

  2. A Machine Learning Docker-tárolókként biztosít gépi tanulási megoldásokat. A megoldások fejlesztésekor a rendszer feltölti őket a Container Registrybe. A Microsoft Defender for Containers biztonságirés-felméréseket hoz létre a tárolólemezképhez.

  3. A megoldás üzembe helyezése CI/CD-folyamaton keresztül történik. A Microsoft Defender for DevOps a veremen keresztül biztosítja a biztonsági helyzet kezelését és a veszélyforrások elleni védelmet.

  4. A megoldástároló csak akkor lesz üzembe helyezve, ha az áthalad az egyes biztonsági folyamatokon. Ha a megoldástároló meghiúsul egy biztonsági folyamaton, az üzembe helyezés hibaértesítésekkel és teljes auditnaplókkal meghiúsul. A megoldástároló el lesz vetve.

Az előző folyamat biztonságos, önkiszolgáló csomagkezelési folyamatot biztosít az adatelemzők számára, és biztosítja, hogy a csomagok biztonságosak és megfeleljenek a szervezeti szabványoknak. Az innováció és a biztonság egyensúlya érdekében önkiszolgáló hozzáférést biztosíthat az adatelemzőknek a gyakori gépi tanulási csomagokhoz, kódtárakhoz és bináris fájlokhoz az előkészítési környezetekben. A kevésbé gyakori csomagok kivételeinek megkövetelése. Ez a stratégia biztosítja, hogy az adattudósok produktívak maradjanak a fejlesztés során, ami megakadályozza a teljesítés során jelentkező jelentős szűk keresztmetszetet.

A kiadási folyamatok egyszerűsítése érdekében tárolóba kell tenni az éles környezetekben használható környezeteket. A tárolóalapú környezetek csökkentik a veszélyhelyzetet, és biztonsági rések vizsgálatán keresztül biztosítják a folyamatos biztonságot. Ez a folyamat egy megismételhető megközelítést biztosít, amelyet a használat során a teljesítés időpontjáig használhat. Csökkenti a gépi tanulási megoldások vállalaton belüli kiépítésének és üzembe helyezésének általános költségét.

Figyelés

Az MLOpsban a monitorozás elengedhetetlen a gépi tanulási rendszerek állapotának és teljesítményének fenntartásához, valamint annak biztosításához, hogy a modellek hatékonyak maradjanak, és igazodjanak az üzleti célokhoz. A monitorozás a belső ciklus fázisában támogatja a szabályozást, a biztonságot és a költségvezérlést. A külső ciklus fázisában a megoldások üzembe helyezésekor megfigyelhető a teljesítmény, a modell romlása és a használat. A monitorozási tevékenységek olyan személyek számára fontosak, mint a adattudós, az üzleti érdekelt felek, a projektvezetők, a projekttulajdonosok, a platform technikai támogatása, a CI/CD-folyamatok és a monitorozási folyamatok.

Válassza ki a monitorozási és ellenőrzési platformot a Machine Learning-munkaterület beállításától függően, például projekttől, csapattól vagy részlegtől függően.

A modell teljesítménye

A modell teljesítményének monitorozása a modellproblémák és a teljesítmény korai romlásának észleléséhez. A teljesítmény nyomon követése annak érdekében, hogy a modellek pontosak, megbízhatóak és igazodjanak az üzleti célkitűzésekhez.

Adateltolódás

Az adateltolódás nyomon követi a modell bemeneti adatainak eloszlásában bekövetkező változásokat a modell betanítási adataival vagy a legutóbbi üzemi adatokkal való összehasonlításával. Ezek a változások a piaci dinamika, a funkcióátalakítás változásai vagy a felsőbb rétegbeli adatváltozások eredményeként jönnek létre. Az ilyen módosítások csökkenthetik a modell teljesítményét, ezért fontos figyelni a sodródást az időben történő szervizelés biztosítása érdekében. Az összehasonlítás elvégzéséhez az adateltolódás újrabontásához a legutóbbi éles adatkészletek és kimenetek szükségesek.

Környezet: Éles környezet
Azure-beli facilitálás: Machine Learning – Modellfigyelés

Előrejelzési eltérés

Az előrejelzési eltérés nyomon követi a modell előrejelzési kimeneteinek eloszlásában bekövetkező változásokat az érvényesítési, a tesztcímkézett vagy a legutóbbi éles adatok összehasonlításával. Az összehasonlítás elvégzéséhez az adateltolódás újrabontásához a legutóbbi éles adatkészletek és kimenetek szükségesek.

Környezet: Éles környezet
Azure-beli facilitálás: Machine Learning – Modellfigyelés

Erőforrás

Használjon több végpontmetrikát kiszolgáló modellt a minőség és a teljesítmény jelzésére, például a processzor- vagy memóriahasználatra. Ez a megközelítés segít tanulni az éles környezetből, hogy elősegítse a jövőbeli beruházásokat vagy változásokat.

Környezet: Minden
Azure-beli könnyítés: Monitorozás – Online végpontok metrikái

Használati metrikák

A végpontok használatának figyelése annak biztosítása érdekében, hogy megfeleljen a szervezetspecifikus vagy számítási feladatspecifikus fő teljesítménymutatóknak, nyomon kövesse a használati mintákat, és diagnosztizálja és elhárítsa a felhasználók által tapasztalt problémákat.

Ügyfelek kérései

A modellvégpont felé irányuló ügyfélkérések számának nyomon követése a végpontok aktív használati profiljának megismeréséhez, ami hatással lehet a skálázási vagy költségoptimalizálási erőfeszítésekre.

Környezet: Éles környezet
Azure-egyszerűsítés: Monitorozás – Online végpontok metrikái, például RequestsPerMinute. Megjegyzések:

  • Az elfogadható küszöbértékeket a számítási feladat igényeihez igazított pólóméretekhez vagy anomáliákhoz igazíthatja.
  • Kivonja az éles környezetből már nem használt modelleket.
Szabályozási késések

A szabályozás késleltetése az adatátvitel kérésének és válaszának lassulása. A szabályozás a Resource Manager és a szolgáltatás szintjén történik. A metrikák nyomon követése mindkét szinten.

Környezet: Éles környezet
Az Azure megkönnyítése:

  • Monitor – Resource Manager, RequestThrottlingDelayMs, ResponseThrottlingDelayMs összeg.
  • Machine Learning – A végpontok kéréseiről szóló információk ellenőrzéséhez engedélyezheti az online végpontforgalmi naplókat. Log Analytics-munkaterület használatával feldolgozhatja a naplókat.

Megjegyzés: Elfogadható küszöbértékek igazítása a számítási feladat szolgáltatásiszint-célkitűzéseihez (SLA-k) vagy szolgáltatásiszint-szerződésekhez (SLA-k) és a megoldás nem funkcionális követelményeihez (NFR-ekhez).

A létrehozott hibák

A válaszkód hibáinak nyomon követése a szolgáltatás megbízhatóságának méréséhez és a szolgáltatásproblémák korai észleléséhez. Például az 500 kiszolgálói hibaválasz hirtelen növekedése olyan kritikus problémát jelezhet, amely azonnali figyelmet igényel.

Környezet: Éles környezet
Azure-beli facilitálás: Machine Learning – Az online végpont forgalmi naplóinak engedélyezése a kéréssel kapcsolatos információk ellenőrzéséhez. Az XRequestId számát például a ModelStatusCode vagy a ModelStatusReason használatával ellenőrizheti. Log Analytics-munkaterület használatával feldolgozhatja a naplókat.
Megjegyzések:

  • A 400 és az 500 tartomány minden HTTP-válaszkódja hibaként van besorolva.

Költségoptimalizálás

A felhőkörnyezetek költségkezelése és optimalizálása kulcsfontosságú, mivel segítenek a számítási feladatoknak a költségek szabályozásában, az erőforrások hatékony lefoglalásában és a felhőszolgáltatások értékének maximalizálásában.

Munkaterület számítása

Ha a havi működési költségek elérik vagy túllépik az előre meghatározott összeget, riasztásokat hozhat létre, amelyek értesítik az érintett érdekelt feleket, például a projekt érdeklődőit vagy a projekttulajdonosokat a munkaterület beállítási határai alapján. A munkaterület beállítását a projekthez, a csapathoz vagy a részleghez kapcsolódó határok alapján határozhatja meg.

Környezet: Minden
Azure-beli facilitálás: Microsoft Cost Management – Költségvetési riasztások
Megjegyzések:

  • A kezdeti NFR-ek és költségbecslések alapján állítsa be a költségvetési küszöbértékeket.
  • Több küszöbértékszint használata. Több küszöbértékszint biztosítja, hogy az érdekelt felek megfelelő figyelmeztetést kapnak a költségvetés túllépése előtt. Ezek az érdekelt felek lehetnek üzleti érdeklődők, projekttulajdonosok vagy projekt érdeklődők a szervezettől vagy a számítási feladattól függően.
  • A konzisztens költségvetési riasztások a nagyobb igényeket támogató újrabontás eseményindítói is lehetnek.
Munkaterület elavultsága

Ha egy Machine Learning-munkaterület nem mutat aktív használat jeleit a tervezett használati esethez kapcsolódó számítási használat alapján, a projekt tulajdonosa le fogja szerelni a munkaterületet, ha már nincs rá szükség egy adott projekthez.

Környezet: Gyártás előtti
Az Azure megkönnyítése:

Megjegyzések:

  • Az aktív magoknak nullával kell egyenlőnek lennie a darabszám összesítésével.
  • Dátumküszöbök igazítása a projektütemezéshez.

Biztonság

Monitorozza a megfelelő biztonsági vezérlőktől és alapkonfigurációktól való eltérések észlelését, hogy a Machine Learning-munkaterületek megfeleljenek a szervezet biztonsági szabályzatainak. Előre definiált és egyénileg definiált szabályzatok kombinációját is használhatja.

Környezet: Minden
Azure-beli facilitálás: Azure Policy for Machine Learning

Végpontbiztonság

Az üzleti szempontból kritikus API-k megismerése érdekében implementáljon célzott biztonsági monitorozást az összes Machine Learning-végponton. Megvizsgálhatja és javíthatja az API biztonsági helyzetét, rangsorolhatja a sebezhetőségi javításokat, és gyorsan észlelheti az aktív valós idejű fenyegetéseket.

Környezet: Éles környezet
Azure-támogatás: A Microsoft Defender for API-k széles körű életciklus-védelmet, észlelést és reagálási lefedettséget nyújtanak az API-k számára. Megjegyzés: Az API-khoz készült Defender az Azure API Managementben közzétett API-k biztonságát biztosítja. Az API-khoz készült Defendert a Felhőhöz készült Microsoft Defender portálon vagy az Azure Portal API Management-példányán belül is előkészítheti. A Machine Learning online végpontjait integrálnia kell az API Managementtel.

Üzembe helyezés monitorozása

Az üzembe helyezés monitorozása biztosítja, hogy a létrehozott végpontok betartsák a számítási feladatra vagy a szervezeti szabályzatokra vonatkozó szabályokat, és mentesek legyenek a biztonsági résektől. Ehhez a folyamathoz megfelelőségi szabályzatokat kell kikényszerítenie az Azure-erőforrásokon az üzembe helyezés előtt és után, folyamatos biztonságot kell biztosítania a biztonsági rések vizsgálatával, és gondoskodnia kell arról, hogy a szolgáltatás működés közben megfeleljen az SLO-knak.

Szabványok és szabályozás

Monitorozza a megfelelő szabványoktól való eltéréseket, és győződjön meg arról, hogy a számítási feladat betartja a védőkorlátokat.

Környezet: Minden
Az Azure megkönnyítése:

  • Felügyelt szabályzat hozzárendelése és életciklusa az Azure Pipelineson keresztül a szabályzat kódként való kezeléséhez.
  • Az Azure-hoz készült PSRule egy tesztelési keretrendszert biztosít az Azure-infrastruktúrához kódként.
  • Az Enterprise Azure-szabályzatot kódként használhatja a CI/CD-alapú rendszer üzembe helyezésére szolgáló szabályzatokban, szabályzatkészletekben, hozzárendelésekben, szabályzatmentességekben és szerepkör-hozzárendelésekben.

Megjegyzések: További információ: Azure-útmutató a Machine Learning jogszabályi megfelelőségéhez.

Biztonsági vizsgálat

Automatizált biztonsági vizsgálatok implementálása az automatizált integrációs és üzembehelyezési folyamatok részeként.

Környezet: Minden
Azure-támogatás: Defender for DevOps
Megjegyzések: Az Azure Marketplace-en lévő alkalmazásokkal kibővítheti ezt a folyamatot a nem Microsoft biztonsági tesztelési modulok esetében.

Folyamatban lévő szolgáltatás

Monitorozza az API folyamatos szolgáltatását a teljesítményoptimalizálás, a biztonság és az erőforrás-használat érdekében. Gondoskodjon az időszerű hibaészlelésről, a hatékony hibaelhárításról és a szabványoknak való megfelelésről.

Környezet: Éles környezet
Az Azure megkönnyítése:

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerzők:

Egyéb közreműködők:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

Következő lépések