Gépi tanulási műveletek

2025-06-21

Ez a cikk három Azure-architektúrát ismertet olyan gépi tanulási műveletekhez, amelyek végpontok közötti folyamatos integrációval és folyamatos kézbesítési (CI/CD) folyamatokkal és újratanítási folyamatokkal rendelkeznek. Az architektúrák az alábbi AI-alkalmazásokhoz tartoznak:

Klasszikus gépi tanulás
Számítógépes látás (CV)
Természetes nyelvek feldolgozása

Ezek az architektúrák az MLOps v2 projekt terméke. Ezek olyan ajánlott eljárásokat tartalmaznak, amelyeket a megoldástervezők a különböző gépi tanulási megoldások fejlesztése során azonosítottak. Az eredmény üzembe helyezhető, megismételhető és karbantartható minták. Mindhárom architektúra az Azure Machine Learning szolgáltatást használja.

Az MLOps v2-hez készült minta üzembehelyezési sablonokat tartalmazó implementációt az Azure MLOps v2 GitHub-adattárban talál.

Lehetséges használati esetek

Klasszikus gépi tanulás: A táblázatos strukturált adatok idősoros előrejelzése, regressziója és besorolása a leggyakoribb használati esetek ebben a kategóriában. Ide sorolhatóak például a következők:
- Bináris és többcímkés besorolás.
- Lineáris, polinomiális, gerinc, lasszó, kvantilis és Bayes-regresszió.
- ARIMA, autoregresszív, SARIMA, VAR, SES, LSTM.
CV: A cikkben szereplő MLOps-keretrendszer elsősorban a szegmentálás és a képbesorolás CV-használati eseteire összpontosít.
Természetes nyelvi feldolgozás: Ezt az MLOps-keretrendszert használhatja a következő implementáláshoz:
- Elnevezett entitásfelismerés
- Szövegbesorolás
- Szöveg létrehozása
- Hangulatelemzés
- Fordítás
- Kérdésmegválaszolás
- Összegzés
- Mondatészlelés
- Nyelvfelismerés
- Beszédrészlet-címkézés

A jelen cikkben nem ismertetjük az AI-szimulációkat, a mély megerősítéses tanulást és az AI egyéb formáit.

Az MLOps mint az AI-számítási feladatok kulcsfontosságú tervezési területe

Az MLOps és a GenAIOps tervezése és megvalósítása alapvető tervezési terület az Azure-beli AI-számítási feladatokban. Ha szeretné megtudni, hogy ezek a gépi tanulási számítási feladatok miért igényelnek speciális műveleteket, tekintse meg az MLOps és a GenAIOps for AI-számítási feladatokat az Azure Well-Architected-keretrendszerben.

Architektúra

Az MLOps v2 architektúraminta az MLOps életciklusának négy fő moduláris összetevőjét vagy fázisát tartalmazza:

Adatvagyon
Felügyelet és beállítás
Modellfejlesztés vagy a belső ciklus fázisa
Modell üzembe helyezése vagy a külső ciklus fázisa

A fenti összetevők, a köztük lévő kapcsolatok és az érintett tipikus személyek minden MLOps v2-es forgatókönyv-architektúrában szabványosak. Az egyes összetevők részleteinek variációi a forgatókönyvtől függenek.

Az MLOps v2 for Machine Learning alaparchitektúrája a táblázatos adatok klasszikus gépi tanulási forgatókönyve. A CV- és NLP-architektúrák erre az alaparchitektúrára épülnek, és módosítják azt.

Az MLOps v2 a cikkben ismertetett alábbi architektúrákat ismerteti:

Klasszikus gépi tanulási architektúra
Machine Learning CV-architektúra
Machine Learning természetes nyelvfeldolgozási architektúra

Klasszikus gépi tanulási architektúra

Töltse le az architektúra Visio-fájlját .

A klasszikus gépi tanulási architektúra munkafolyamata

Adatvagyon

Ez az összetevő bemutatja a szervezet adattulajdonát, valamint egy adatelemzési projekt lehetséges adatforrásait és céljait. Az MLOps v2 életciklus ezen összetevőjének elsődleges tulajdonosai az adatmérnökök. A diagramban szereplő Azure-adatplatformok nem teljesek vagy előírók. A zöld pipa jel azokat az adatforrásokat és célokat jelzi, amelyek az ajánlott legjobb gyakorlatokat jelzik, és az ügyfél használati esetére alapulnak.
Felügyelet és beállítás

Ez az összetevő az MLOps v2-megoldás üzembe helyezésének első lépése. Ez a projekthez társított erőforrások és szerepkörök létrehozásával és kezelésével kapcsolatos összes tevékenységből áll. Az infrastruktúra-csapat például a következő lehet:
1. Projekt forráskódtárak létrehozása.
2. Machine Learning-munkaterületek létrehozása a Bicep vagy a Terraform használatával.
3. Adathalmazok és számítási erőforrások létrehozása vagy módosítása modellfejlesztéshez és üzembe helyezéshez.
4. A projektcsapat felhasználóinak, szerepköreinek és hozzáférés-vezérlőinek meghatározása más erőforrásokhoz.
5. CI/CD-pipeline-ek létrehozása.
6. Monitorozási összetevők létrehozása a modell- és infrastruktúrametrikák riasztásainak gyűjtéséhez és létrehozásához.
Az ehhez a fázishoz társított elsődleges személy az infrastruktúra-csapat, de egy szervezet adatmérnökökkel, gépi tanulási mérnökökkel vagy adattudósokkal is rendelkezhet.
Modellfejlesztés (belső ciklus fázis)

A belső ciklus fázisa egy iteratív adatelemzési munkafolyamatból áll, amely egy dedikált és biztonságos Machine Learning-munkaterületen belül működik. Az előző diagram egy tipikus munkafolyamatot mutat be. A folyamat az adatbetöltéssel kezdődik, feltáró adatelemzésen, kísérletezésen, modellfejlesztésen és -kiértékelésen megy keresztül, majd regisztrál egy modellt éles használatra. Ez a moduláris összetevő agnosztikus és alkalmazkodik ahhoz a folyamathoz, amelyet az adatelemzési csapat a modellek fejlesztéséhez használ.

Az ehhez a fázishoz társított személyek közé tartoznak az adattudósok és a gépi tanulási mérnökök.
Machine Learning-regisztrációs adatbázisok

Miután az adatelemzési csapat kifejlesztett egy modellt, amelyet üzembe helyezhetnek az éles környezetben, regisztrálják a modellt a Machine Learning-munkaterület beállításjegyzékében. A modellregisztráció vagy egy kontrollált emberi jóváhagyási folyamat által automatikusan aktivált CI-folyamatok előléptetik a modellt és minden más modellfüggőséget a modell üzembe helyezési fázisába.

Az ehhez a fázishoz társított személyek általában gépi tanulási mérnökök.
Modell üzembe helyezése (külső ciklus fázisa)

A modell üzembe helyezésének vagy külső ciklusának fázisa a gyártás előtti előkészítésből és tesztelésből, az éles üzembe helyezésből és a modell, az adatok és az infrastruktúra figyeléséből áll. Ha a modell megfelel a szervezet és a használati eset feltételeinek, a CD csővezetékkel a modellt és a kapcsolódó eszközöket az éles környezetbe való bevezetés, a monitorozás és a lehetséges újratanítás során támogatják.

Az ehhez a fázishoz társított személyek elsősorban gépi tanulási mérnökök.
Előkészítés és tesztelés

Az előkészítési és tesztelési fázis az ügyfél gyakorlatától függően változik. Ez a fázis általában olyan műveleteket foglal magában, mint a modelljelölt újratanítása és tesztelése az éles adatokon, a végpontok teljesítményének tesztelése, az adatminőség-ellenőrzések, az egységtesztelés, valamint a modell és az adat elfogultságáért felelős AI-ellenőrzések. Ez a fázis egy vagy több dedikált és biztonságos Machine Learning-munkaterületen zajlik.
Éles üzembe helyezés

Miután egy modell átment az előkészítési és tesztelési fázison, a gépi tanulási mérnökök egy emberi közreműködéssel végzett jóváhagyási folyamat segítségével bevezethetik azt az éles környezetbe. A modellterjesztési lehetőségek közé tartozik egy felügyelt kötegvégpont kötegelt forgatókönyvekhez, vagy felügyelt online végpont vagy Kubernetes-üzembe helyezés, amely az Azure Arcot használja online, közel valós idejű forgatókönyvekhez. A gyártás általában egy vagy több dedikált és biztonságos gépi tanulás-munkaterületen történik.
Figyelés

A gépi tanulási mérnökök figyelik az előkészítés, a tesztelés és az éles környezet összetevőit, hogy összegyűjtsék a modell, az adatok és az infrastruktúra teljesítményváltozásával kapcsolatos metrikákat. Ezeket a metrikákat használhatják a műveletek végrehajtásához. A modell- és adatmonitorozás magában foglalhatja a modell és az adateltolódás ellenőrzését, az új adatok modellteljesítményét és a felelős AI-problémákat. Az infrastruktúra monitorozása lassú végpontválaszt, nem megfelelő számítási kapacitást vagy hálózati problémákat azonosíthat.
Adatok és modellek monitorozása: események és műveletek

Modell- és adatfeltételek, például metrikaküszöbök vagy ütemezések alapján az automatizált eseményindítók és értesítések megfelelő műveleteket hajthatnak végre. Az indító például újrataníthat egy modellt az új éles adatok használatára, majd visszaállítja a modellt az előkészítési és tesztelési fázisba egy preprodukciós értékeléshez. Vagy egy modell- vagy adatproblémák olyan műveletet indíthatnak el, amely visszalépést igényel a modellfejlesztési fázishoz, ahol az adatelemzők megvizsgálhatják a problémát, és potenciálisan új modellt fejleszthetnek.
Infrastruktúra monitorozása: események és műveletek

Az automatizált eseményindítók és -értesítések az infrastruktúra feltételei alapján megfelelő műveleteket hajthatnak végre, például a végpontok válaszának késése vagy az üzembe helyezés nem megfelelő számítási kapacitása alapján. Az automatikus triggerek és értesítések visszacsatolást válthatnak ki a beállítási és adminisztrációs fázisra, ahol az infrastruktúra-csapat kivizsgálhatja a problémát, és esetleg újrakonfigurálhatja a számítási és hálózati erőforrásokat.

Machine Learning CV-architektúra

Töltse le az architektúra Visio-fájlját .

A CV-architektúra munkafolyamata

A Machine Learning CV architektúrája a klasszikus gépi tanulási architektúrán alapul, de a felügyelt CV-forgatókönyvekre jellemző módosításokkal rendelkezik.

Adatvagyon

Ez az összetevő bemutatja a szervezet adattulajdonát, valamint egy adatelemzési projekt lehetséges adatforrásait és céljait. Ennek az összetevőnek az elsődleges tulajdonosai az adatmérnökök az MLOps v2 életciklusában. A diagramban szereplő Azure-adatplatformok nem teljesek vagy előírók. A CV-forgatókönyvek képei különböző adatforrásokból származhatnak. A Machine Learning cv-modelljeinek fejlesztése és üzembe helyezése során a hatékonyság érdekében az Azure Blob Storage és az Azure Data Lake Storage használatát javasoljuk.
Felügyelet és beállítás

Ez az összetevő az MLOps v2 üzembe helyezésének első lépése. Ez a projekthez társított erőforrások és szerepkörök létrehozásával és kezelésével kapcsolatos összes tevékenységből áll. Cv-forgatókönyvek esetén az MLOps v2 környezet felügyelete és beállítása nagyrészt megegyezik a klasszikus gépi tanulással, de egy további lépést is tartalmaz. Az infrastruktúra-csapat a Machine Learning vagy egy másik eszköz címkézési funkcióját használja képfelirat- és széljegyzetprojektek létrehozásához.
Modellfejlesztés (belső ciklus fázis)

A belső ciklus fázisa egy iteratív adatelemzési munkafolyamatból áll, amelyet egy dedikált és biztonságos Machine Learning-munkaterületen hajtanak végre. A munkafolyamat és a klasszikus gépi tanulási forgatókönyv közötti elsődleges különbség az, hogy a képfeliratok és a széljegyzetek a fejlesztési ciklus kulcsfontosságú összetevői.
Machine Learning-regisztrációs adatbázisok

Miután az adatelemzési csapat kifejlesztett egy modellt, amelyet üzembe helyezhetnek az éles környezetben, regisztrálják a modellt a Machine Learning-munkaterület beállításjegyzékében. A modellregisztrációval vagy az emberi közreműködéssel kontrollált jóváhagyással automatikusan aktivált CI-pipeline-ek előléptetik a modellt és bármely más modellfüggőséget a modell üzembe helyezési fázisába.
Modell üzembe helyezése (külső ciklus fázisa)

A modell üzembe helyezésének vagy külső ciklusának fázisa a gyártás előtti előkészítésből és tesztelésből, az éles üzembe helyezésből és a modell, az adatok és az infrastruktúra figyeléséből áll. Ha a modell megfelel a szervezet és a használati eset feltételeinek, a CD csővezetékkel a modellt és a kapcsolódó eszközöket az éles környezetbe való bevezetés, a monitorozás és a lehetséges újratanítás során támogatják.
Előkészítés és tesztelés

Az előkészítési és tesztelési fázis az ügyfél gyakorlatától függően változik. Ez a fázis általában olyan műveleteket foglal magában, mint a végpontteljesítmény tesztelése, az adatminőség-ellenőrzések, az egységtesztelés, valamint a modell és az adat elfogultságáért felelős AI-ellenőrzések. Cv-forgatókönyvek esetén a gépi tanulási mérnököknek erőforrás- és időkorlátok miatt nem kell újratanulnia a modelljelöltet az éles adatokon. Az adatelemzési csapat ehelyett éles adatokat használhat a modellfejlesztéshez. A fejlesztési ciklusból regisztrált jelölt modellt élesítés céljából értékelik ki. Ez a fázis egy vagy több dedikált és biztonságos Machine Learning-munkaterületen zajlik.
Éles üzembe helyezés

Miután egy modell átment az előkészítési és tesztelési fázison, a gépi tanulási mérnökök egy emberi közreműködéssel végzett jóváhagyási folyamat segítségével bevezethetik azt az éles környezetbe. A modellterjesztési lehetőségek közé tartozik egy felügyelt kötegvégpont kötegelt forgatókönyvekhez, vagy felügyelt online végpont vagy Kubernetes-üzembe helyezés, amely az Azure Arcot használja online, közel valós idejű forgatókönyvekhez. A gyártás általában egy vagy több dedikált és biztonságos gépi tanulás-munkaterületen történik.
Figyelés

A gépi tanulási mérnökök figyelik az előkészítés, a tesztelés és az éles környezet összetevőit, hogy összegyűjtsék a modell, az adatok és az infrastruktúra teljesítményváltozásával kapcsolatos metrikákat. Ezeket a metrikákat használhatják a műveletek végrehajtásához. A modell- és adatmonitorozás magában foglalhatja a modell teljesítményének ellenőrzését az új képeken. Az infrastruktúra monitorozása lassú végpontválaszt, nem megfelelő számítási kapacitást vagy hálózati problémákat azonosíthat.
Adatok és modellek monitorozása: események és műveletek

Az MLOps adat- és modellmonitorozási, esemény- és műveleti fázisai a természetes nyelvi feldolgozáshoz a klasszikus gépi tanulás fő különbségei. Az automatikus újratanítás általában nem történik meg CV-forgatókönyvekben, amikor detektálják, hogy a modell teljesítménye romlik az új képeken. Ebben az esetben elengedhetetlen egy ember-közreműködésű folyamat, amely során egy ember áttekinti és jegyzeteli a rosszul teljesítő modell új képeit. A következő művelet gyakran visszatér a modellfejlesztési ciklushoz, hogy frissítse a modellt az új rendszerképekkel.
Infrastruktúra monitorozása: események és műveletek

Az automatizált eseményindítók és -értesítések az infrastruktúra feltételei alapján megfelelő műveleteket hajthatnak végre, például a végpontok válaszának késése vagy az üzembe helyezés nem megfelelő számítási kapacitása alapján. Az automatikus eseményindítók és értesítések visszacsatolást válthatnak ki a beállítási és adminisztrációs fázisra, ahol az infrastruktúra-csapat kivizsgálhatja a problémát, és esetleg újrakonfigurálhatja a környezetet, a számítási és a hálózati erőforrásokat.

Machine Learning természetes nyelvfeldolgozási architektúra

Töltse le az architektúra Visio-fájlját .

A természetes nyelvi feldolgozási architektúra munkafolyamata

A Machine Learning természetes nyelvfeldolgozási architektúrája a klasszikus gépi tanulási architektúrán alapul, de néhány, az NLP-forgatókönyvekre jellemző módosítással rendelkezik.

Adatvagyon

Ez az összetevő egy adatelemzési projekt szervezeti adattulajdonát, lehetséges adatforrásait és céljait mutatja be. Ennek az összetevőnek az elsődleges tulajdonosai az adatmérnökök az MLOps v2 életciklusában. A diagramban szereplő Azure-adatplatformok nem teljesek vagy előírók. A zöld pipa azokat a forrásokat és célállomásokat jelöli, amelyek az ügyfelek használati esetein alapuló ajánlott eljárásokat képviselik.
Felügyelet és beállítás

Ez az összetevő az MLOps v2 üzembe helyezésének első lépése. Ez a projekthez társított erőforrások és szerepkörök létrehozásával és kezelésével kapcsolatos összes tevékenységből áll. A természetes nyelvi feldolgozási forgatókönyvek esetében az MLOps v2 környezet felügyelete és beállítása nagyrészt megegyezik a klasszikus gépi tanuláséval, de egy további lépéssel: szövegfeliratozási és jegyzetelési projekteket hozhat létre a Machine Learning címkézési funkciójával vagy egy másik eszközzel.
Modellfejlesztés (belső ciklus fázis)

A belső ciklus fázisa egy iteratív adatelemzési munkafolyamatból áll, amelyet egy dedikált és biztonságos Machine Learning-munkaterületen hajtanak végre. A tipikus NLP-modell fejlesztési ciklusa abban különbözik a klasszikus gépi tanulási forgatókönyvtől, hogy a forgatókönyv tipikus fejlesztési lépései közé tartoznak a mondatok és jogkivonatok jegyzetei, a normalizálás és a szöveges adatok beágyazása.
Machine Learning-regisztrációs adatbázisok

Miután az adatelemzési csapat kifejlesztett egy modellt, amelyet üzembe helyezhetnek az éles környezetben, regisztrálják a modellt a Machine Learning-munkaterület beállításjegyzékében. A modellregisztrációval vagy az emberi közreműködéssel kontrollált jóváhagyással automatikusan aktivált CI-pipeline-ek előléptetik a modellt és bármely más modellfüggőséget a modell üzembe helyezési fázisába.
Modell üzembe helyezése (külső ciklus fázisa)

A modell üzembe helyezésének vagy külső ciklusának fázisa a gyártás előtti előkészítésből és tesztelésből, az éles üzembe helyezésből és a modell, az adatok és az infrastruktúra figyeléséből áll. Ha a modell megfelel a szervezet és a használati eset feltételeinek, a CD csővezetékkel a modellt és a kapcsolódó eszközöket az éles környezetbe való bevezetés, a monitorozás és a lehetséges újratanítás során támogatják.
Előkészítés és tesztelés

Az előkészítési és tesztelési fázis az ügyfél gyakorlatától függően változik. Ez a fázis általában olyan műveleteket foglal magában, mint a modelljelölt újratanítása és tesztelése az éles adatokon, a végpontok teljesítményének tesztelése, az adatminőség-ellenőrzések, az egységtesztelés, valamint a modell és az adat elfogultságáért felelős AI-ellenőrzések. Ez a fázis egy vagy több dedikált és biztonságos Machine Learning-munkaterületen zajlik.
Éles üzembe helyezés

Miután egy modell átment az előkészítési és tesztelési fázison, a gépi tanulási mérnökök egy emberi közreműködéssel végzett jóváhagyási folyamat segítségével bevezethetik azt az éles környezetbe. A modellterjesztési lehetőségek közé tartozik egy felügyelt kötegvégpont kötegelt forgatókönyvekhez, vagy felügyelt online végpont vagy Kubernetes-üzembe helyezés, amely az Azure Arcot használja online, közel valós idejű forgatókönyvekhez. A gyártás általában egy vagy több dedikált és biztonságos gépi tanulás-munkaterületen történik.
Figyelés

A gépi tanulási mérnökök figyelik az előkészítés, a tesztelés és az éles környezet összetevőit, hogy összegyűjtsék a modell, az adatok és az infrastruktúra teljesítményváltozásával kapcsolatos metrikákat. Ezeket a metrikákat használhatják a műveletek végrehajtásához. A modell- és adatmonitorozás magában foglalhatja a modell és az adateltolódás ellenőrzését, az új szöveges adatok modellteljesítményét és a felelős AI-problémákat. Az infrastruktúra monitorozása azonosíthatja a problémákat, például a lassú végpontok válaszát, a nem megfelelő számítási kapacitást és a hálózati problémákat.
Adatok és modellek monitorozása: események és műveletek

A CV architektúrához hasonlóan az MLOps adat- és modellmonitorozási, esemény- és műveleti fázisai is a klasszikus gépi tanulás fő különbségei. Az automatikus újratanítás általában nem természetes nyelvi feldolgozási forgatókönyvekben történik, amikor a modell teljesítménycsökkenését észleli az új szövegen. Ebben az esetben emberi folyamatra van szükség a rosszul teljesítő modell új szöveges adatainak áttekintéséhez és megjegyzéséhez. A következő művelet gyakran az, hogy visszatér a modell fejlesztési ciklusához, hogy frissítse a modellt az új szöveges adatokkal.
Infrastruktúra monitorozása: események és műveletek

Az automatizált eseményindítók és -értesítések az infrastruktúra feltételei alapján megfelelő műveleteket hajthatnak végre, például a végpontok válaszának késése vagy az üzembe helyezés nem megfelelő számítási kapacitása alapján. Az automatikus triggerek és értesítések visszacsatolást válthatnak ki a beállítási és adminisztrációs fázisra, ahol az infrastruktúra-csapat kivizsgálhatja a problémát, és esetleg újrakonfigurálhatja a számítási és hálózati erőforrásokat.

Összetevők

A Machine Learning egy felhőalapú szolgáltatás, amellyel nagy léptékű gépi tanulási modelleket taníthat be, értékelhet, helyezhet üzembe és kezelhet.
Az Azure Pipelines egy azure DevOpson alapuló buildelési és tesztelési rendszer, amely a buildelési és kiadási folyamatokhoz használatos. Az Azure Pipelines ezeket a folyamatokat tevékenységeknek nevezett logikai lépésekre osztja fel.
A GitHub egy kódtárplatform verziókövetési, együttműködési és CI/CD-munkafolyamatokhoz.
Az Azure Arc egy olyan platform, amely az Azure Resource Manager használatával kezeli az Azure-erőforrásokat és a helyszíni erőforrásokat. Az erőforrások tartalmazhatnak virtuális gépeket, Kubernetes-fürtöket és adatbázisokat.
A Kubernetes egy nyílt forráskódú rendszer, amellyel automatizálhatja a tárolóalapú alkalmazások üzembe helyezését, méretezését és felügyeletét.
Az Azure Data Lake Storage egy Hadoop-kompatibilis fájlrendszer. Integrált hierarchikus névtérrel, valamint a Blob Storage nagy léptékű és gazdaságosságával rendelkezik.
Az Azure Synapse Analytics egy korlátlan elemzési szolgáltatás, amely egyesíti az adatintegrációt, a nagyvállalati adattárházakat és a big data elemzéseket.
Az Azure Event Hubs egy szolgáltatás, amely betölti az ügyfélalkalmazások által létrehozott adatfolyamokat. Ezután betölti és tárolja a streamelési adatokat, ami megőrzi a fogadott események sorrendjét. Az ügyfelek csatlakozhatnak a központi végpontokhoz az üzenetek feldolgozásához. Ez az architektúra a Data Lake Storage-integrációt használja.

Egyéb szempontok

Az előző MLOps v2 architekturális minta számos kritikus összetevővel rendelkezik, beleértve a szerepköralapú hozzáférés-vezérlést (RBAC), amely igazodik az üzleti érdekelt felekhez, a hatékony csomagkezelést és a robusztus monitorozási mechanizmusokat. Ezek az összetevők együttesen hozzájárulnak a gépi tanulási munkafolyamatok sikeres végrehajtásához és kezeléséhez.

Persona-alapú RBAC (szerepkör alapú hozzáférés-vezérlés)

Fontos, hogy kezelje a gépi tanulási adatokhoz és erőforrásokhoz való hozzáférést. Az RBAC egy robusztus keretrendszert biztosít, amellyel felügyelheti, hogy ki hajthat végre konkrét műveleteket, és milyen területekhez férhet hozzá a megoldáson belül. Az identitásszegmentálási stratégiát úgy tervezheti meg, hogy igazodjon a Machine Learning gépi tanulási modelljeinek életciklusához és a folyamathoz tartozó személyekhez. Minden személynek van egy meghatározott feladatköre, amely tükröződik az RBAC-szerepkörökben és a csoporttagságban.

Példaszemélyek

A gépi tanulási számítási feladatok megfelelő szegmentálásának támogatásához vegye figyelembe az alábbi gyakori személyeket, amelyek tájékoztatják az identitásalapú RBAC-csoport kialakítását.

Adatelemző és gépi tanulási mérnök

Az adattudósok és gépi tanulási mérnökök különböző gépi tanulási és adatelemzési tevékenységeket végeznek a projekt szoftverfejlesztési életciklusa során. Feladataik közé tartozik a feltáró jellegű adatelemzés és az adatok előfeldolgozása. Az adattudósok és a gépi tanulási mérnökök felelősek a modellek betanításáért, kiértékeléséért és üzembe helyezéséért. Ezek a szerepkörök feladatai közé tartoznak a gépi tanulási modellek, csomagok és adatok törésjavítási tevékenységei is. Ezek a feladatok nem tartoznak a platform technikai támogatási csapatának hatókörébe.