Szerepkörök és feladatok a csapat Adattudomány folyamatában
A Team Adattudomány Process (TDSP) a Microsoft által kifejlesztett keretrendszer, amely strukturált módszertant biztosít a prediktív elemzési megoldások és intelligens alkalmazások hatékony létrehozásához. Ez a cikk az adatelemzési csapat fő személyzeti szerepköreit és kapcsolódó feladatait ismerteti, amelyek szabványosítják ezt a folyamatot.
Egy Git-kompatibilis környezet javasolt az Azure Machine Learningben tárolt MLflow-összetevők kiegészítéséhez. Az Azure Machine Learning integrálható a Git-adattárakkal, így számos Git-kompatibilis szolgáltatást használhat, például a GitHubot, a GitLabet, a Bitbucketet, az Azure DevOpsot vagy bármely más Git-kompatibilis szolgáltatást.
Adatelemzési csoportok és csoportok felépítése
A vállalatok adatelemzési funkciói gyakran a következő hierarchiában vannak rendszerezve:
- Adatelemzési csoport
- A csoport adatelemzési csapatai
Ilyen struktúrában csoportos érdeklődők és csoportvezetők vannak. Az adatelemzési csapat általában adatelemzési projektet végez. Az adatelemzési csapatok projektvezetőkkel rendelkeznek a projektirányítási és -szabályozási feladatokhoz, valamint egyéni adattudósok és mérnökök, akik elvégzik a projekt adatelemzési és adatmérnöki részeit. A csoport, a csapat vagy a projekt érdeklődői végrehajtják a kezdeti projektbeállítást és -szabályozást.
A négy TDSP-szerepkör definíciója és feladatai
Azzal a feltételezéssel, hogy az adatelemzési egység csoporton belüli csapatokból áll, a TDSP-személyzet négy különböző szerepkörrel rendelkezik:
Csoportmenedzser: Egy vállalat teljes adatelemzési egységét kezeli. Egy adatelemzési egység több csapatból állhat, amelyek mindegyike több adatelemzési projekten dolgozik különböző üzleti területeken. Előfordulhat, hogy a csoportmenedzser helyettesnek delegálja a feladatait, de a szerepkörhöz társított feladatok nem változnak.
Csapatvezető: Egy vállalat adatelemzési egységében lévő csapatot felügyel. A csapat adattudósokból áll. Egy kis adatelemzési egység esetében a csoportmenedzser és a csoportvezető ugyanaz a személy lehet.
Projektvezető: Egy adott adatelemzési projekt egyes adatelemzőinek napi tevékenységeit kezeli.
Egyéni közreműködők: Adattudósok, üzleti elemzők, adatmérnökök, építészek és más adatelemzési projekteket végrehajtó személyek.
Feljegyzés
A vállalat szerkezetétől és méretétől függően egyetlen személy több szerepkörrel is rendelkezhet, vagy egynél több személy tölthet be egy szerepkört.
A négy szerepkör feladatai
Az alábbi ábrán az egyes TDSP-szerepkörök legfelső szintű feladatai láthatók. Ez az áttekintés és az egyes TDSP-szerepkörök tevékenységeinek alábbi részletes vázlata segíthet kiválasztani a szükséges oktatóanyagot a feladatai alapján.
Csoportmenedzseri feladatok
A csoportmenedzser vagy a kijelölt TDSP-rendszergazda a következő feladatokat hajtja végre a TDSP bevezetéséhez:
Létrehoz egy Azure DevOps-szervezetet és egy csoportprojektet a szervezeten belül.
Létrehoz egy projektsablon-adattárat az Azure DevOps-csoport projektjében, és a Microsoft TDSP csapata által kifejlesztett projektsablon-adattárból magozza. A Microsoft TDSP-projektsablon-adattár a következőt biztosítja:
- Szabványosított címtárstruktúra, beleértve az adatok, kódok és dokumentumok könyvtárait.
- Szabványosított dokumentumsablonok halmaza, amely hatékony adatelemzési folyamatot mutat be.
Létrehoz egy segédprogram-adattárat, amelyet a Microsoft TDSP csapata által kifejlesztett segédprogram-adattárból hoz létre. A Microsoft TDSP segédprogram-adattára hasznos segédprogramok készletét biztosítja az adattudósok munkájának hatékonyabbá tétele érdekében. A Microsoft segédprogram-adattára interaktív adatfeltárási, elemzési, jelentéskészítési és alapkonfigurációs modellezési és jelentéskészítési segédprogramokat tartalmaz.
Beállítja a szervezeti fiók biztonsági vezérlési szabályzatát .
További információ: Csoportmenedzseri feladatok egy adatelemzési csapat számára.
Csapatvezetői feladatok
A csapatvezető vagy egy kijelölt projektadminisztrátor a következő feladatokat hajtja végre a TDSP bevezetéséhez:
Csoportprojektet hoz létre a csoport Azure DevOps-szervezetében.
Létrehozza a projektsablon-adattárat a projektben, és a csoportmenedzser vagy delegált által beállított csoportprojektsablon-adattárból hozza létre.
Létrehozza a csoport segédprogram-adattárát, magozza a csoport segédprogram-adattárából, és hozzáadja a csoportspecifikus segédprogramokat az adattárhoz.
Ha szeretné, létrehozhat azure-fájltárolót, hogy hasznos adategységeket tároljon a csapat számára. A többi csapattag csatlakoztathatja ezt a megosztott felhőbeli fájltárolót az elemzési asztalaikra.
Opcionálisan csatlakoztatja az Azure Filest a csapat adatelemzési virtuális gépére, és hozzáadja a csapat adategységeit.
Beállítja a biztonsági vezérlést a csapattagok hozzáadásával és az engedélyek konfigurálásával.
További információ: Csapatvezetői feladatok egy adatelemzési csapat számára.
Projektvezetési tevékenységek
A projektvezető a következő feladatokat hajtja végre a TDSP bevezetéséhez:
Létrehoz egy projektadattárat a csapatprojektben, és a projektsablon-adattárból magozza.
Igény szerint létrehoz egy Azure-fájltárolót a projekt adategységeinek tárolásához.
Opcionálisan csatlakoztatja az Azure Filest az adatelemzési virtuális géphez , és hozzáadja hozzá a projektadat-objektumokat.
A biztonsági vezérlés beállítása a projekttagok hozzáadásával és az engedélyük konfigurálásával.
További információ: Project lead tasks for a data science team.
Egyéni közreműködői tevékenységek projektje
A projekt egyéni közreműködője, általában adatelemző, a következő feladatokat végzi a TDSP használatával:
Klónozza a projekt érdeklődője által beállított projektadattárat .
Opcionálisan csatlakoztatja a megosztott csapatot és az Azure-fájltárolót az adatelemzési virtuális gépükre.
Végrehajtja a projektet.
További információ: Project individual contributor tasks for a data science team.
Adatelemzési projekt végrehajtási munkafolyamata
Az adattudósok, a projektvezetők és a csapatvezetők munkaelemeket hozhatnak létre a projekt összes tevékenységének és fázisának nyomon követéséhez az elejétől a végéig. Az alábbi ábra a projektvégrehajtás TDSP-munkafolyamatát mutatja be:
A munkafolyamat lépései három tevékenységbe csoportosíthatók:
A projektvezetők sprinttervezést végeznek.
Az adattudósok munkaelemek kezelésére fejlesztenek összetevőket az ágakon
git
.A projektvezetők vagy más csapattagok kód-felülvizsgálatokat végeznek, és munkaágakat egyesítenek az elsődleges ággal.
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerző:
- Mark Tabladillo | Vezető felhőmegoldás-tervező
A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.