Csapat Adattudomány folyamat adatszakértőknek
Ez a cikk útmutatást nyújt az Azure-technológiákkal végzett átfogó adatelemzési megoldások megvalósításakor meghatározott célkitűzésekhez. Végigvezetjük a következőn:
- Az elemzési számítási feladatok ismertetése.
- A Team Adattudomány Process (TDSP) használata.
- Az Azure Machine Tanulás használata.
- Az adatátvitel és a tárolás alapjainak megismerése.
- Adatforrás dokumentációja.
- Elemzésfeldolgozási eszközök használata.
Ezek a képzési anyagok a Team Adattudomány Process (TDSP) és a Microsoft nyílt forráskódú szoftvereihez és eszközkészleteihez kapcsolódnak, amelyek segítenek az adatelemzési megoldások megvalósításában, végrehajtásában és megvalósításában.
Lecke útvonala
Az alábbi táblázatban szereplő elemeket használhatja saját öntanulásához. Olvassa el a Leírást az elérési út követéséhez, válassza ki a témakört a tanulmányi hivatkozások megtekintéséhez, és a Tudáspróba használatával ellenőrizze készségeit.
Cél | Téma | Leírás | Tudásteszt |
---|---|---|---|
Analitikus projektek fejlesztésének folyamatainak megismerése | Bevezetés a csapat Adattudomány folyamatába | Kezdjük a TDSP áttekintésével. Ez a folyamat végigvezeti egy elemzési projekt minden lépésén. A folyamatról és annak implementálásáról az alábbi szakaszokban olvashat bővebben. | Tekintse át és töltse le a TDSP-projektszerkezet összetevőit a projekt helyi gépére . |
Rugalmas fejlesztés | A TDSP számos különböző programozási módszertannal működik jól. Ebben a Tanulás pathban agilis szoftverfejlesztést használunk. Olvassa el a "Mi az Agile Development?" és "Building Agile Culture" című cikkeket, amelyek az Agile használatának alapjait ismertetik. Ezen a webhelyen további referenciák is találhatók, amelyekről bővebben is olvashat. | A munkatársak folyamatos integrációjának és folyamatos kézbesítésének (CI/CD) ismertetése. | |
DevOps adatelemzéshez | A fejlesztői műveletek (DevOps) olyan személyeket, folyamatokat és platformokat foglalnak magukba, amelyekkel egy projekten keresztül dolgozhat, és a megoldást integrálhatja a szervezet szabványos informatikai rendszerébe. Ez az integráció elengedhetetlen a bevezetéshez, a biztonsághoz és a biztonsághoz. Ebben az online kurzusban megismerheti a DevOps-gyakorlatokat, és megismerheti a rendelkezésre álló eszközlánc-lehetőségek némelyikét. | Készítsen 30 perces bemutatót a technikai közönségnek arról, hogy a DevOps hogyan nélkülözhetetlen az elemzési projektekhez. | |
Az adattárolás és -feldolgozás technológiáinak megismerése | Microsoft business analytics és AI | Ebben a Tanulás elérési úton néhány olyan technológiára összpontosítunk, amelyekkel elemzési megoldást hozhat létre, de a Microsoftnak még sok más funkciója van. A lehetőségek megismeréséhez fontos áttekinteni a Microsoft Azure-ban elérhető platformokat és funkciókat, az Azure Stacket és a helyszíni beállításokat. Tekintse át ezt az erőforrást, és ismerje meg az elemzési kérdések megválaszolásához rendelkezésre álló különféle eszközöket. | Töltse le és tekintse át a bemutató anyagát ebből a műhelyből. |
Betanítási, fejlesztési és éles környezetek beállítása és konfigurálása | Microsoft Azure | Most hozzunk létre egy fiókot a Microsoft Azure-ban a betanításhoz, és tanuljuk meg, hogyan hozhat létre fejlesztési és tesztelési környezeteket. Ezek az ingyenes betanítási források az első lépések. Végezze el a kezdő és a köztesútvonalat. | Ha nem rendelkezik Azure-fiókkal, hozzon létre egyet. Jelentkezzen be az Azure Portalra, és hozzon létre egy erőforráscsoportot a betanításhoz. |
Az Azure parancssori felülete (CLI) | Az Azure-ral többféleképpen is dolgozhat, a grafikus eszközöktől, például a Visual Studio Code-tól és a Visual Studiótól kezdve az olyan webes felületekig, mint az Azure Portal, valamint a parancssorból, például az Azure PowerShell-parancsoktól és függvényektől. Ebben a cikkben bemutatjuk a parancssori felületet, amelyet helyileg használhat a munkaállomásán, a Windowsban és más operációs rendszerekben, valamint az Azure Portalon. | Állítsa be alapértelmezett előfizetését az Azure CLI-vel. | |
Azure Storage | Szüksége van egy helyre az adatok tárolásához. Ebben a cikkben megismerheti az Azure Storage lehetőségeit, a tárfiókok létrehozását, valamint az adatok felhőbe másolását vagy áthelyezését. További információért olvassa el ezt a bevezetést. | Hozzon létre egy Storage-fiókot a betanítási erőforráscsoportban, hozzon létre egy tárolót egy blobobjektumhoz, és töltsön fel és töltsön le adatokat. | |
Microsoft Entra ID | A Microsoft Entra ID képezi az alkalmazás biztonságossá tételének alapját. Ebben a cikkben többet is megtudhat a fiókokról, a jogosultságokról és az engedélyekről. Az Active Directory és a biztonság összetett témakörök, ezért olvassa el ezt az erőforrást az alapok megértéséhez. | Adjon hozzá egy felhasználót a Microsoft Entra-azonosítóhoz. MEGJEGYZÉS: Előfordulhat, hogy nem rendelkezik engedélyekkel ehhez a művelethez, ha nem Ön az előfizetés rendszergazdája. Ha ez a helyzet, tekintse át ezt az oktatóanyagot, és tudjon meg többet. | |
Az Azure Adattudomány PyTorch virtuális gépe | Az adatelemzési eszközök helyileg több operációs rendszeren is telepíthetők. A PyTorch Adattudomány virtuális gépe azonban tartalmazza az összes szükséges eszközt és rengeteg projektmintát, amellyel dolgozhat. Ebben a cikkben többet is megtudhat a PyTorch Adattudomány virtuális gépéről, és arról, hogyan dolgozhat a példákon. Ez az erőforrás bemutatja a PyTorch Adattudomány virtuális gépét, azt, hogyan hozhat létre egyet, és néhány lehetőséget a kód fejlesztésére. Emellett tartalmazza a képzési terv elvégzéséhez szükséges összes szoftvert, ezért győződjön meg arról, hogy a témakörhöz tartozó tudásanyagot is elvégezte. | Hozzon létre egy Adattudomány virtuális gépet a PyTorch számára, és dolgozzon legalább egy laboron. | |
Az adatelemzési megoldásokhoz szükséges eszközök és technológiák telepítése és megismerése | A Git használata | Ahhoz, hogy a DevOps-folyamatot a TDSP-vel követhessük, verziókövetési rendszerrel kell rendelkeznünk. A gépi Tanulás a Gitet, egy népszerű nyílt forráskódú elosztott adattárrendszert használja. Ebben a cikkben többet is megtudhat a Git és a GitHub központi adattárának telepítéséről, konfigurálásáról és használatáról. | Klónozza ezt a GitHub-projektet a képzési terv projektstruktúrájához. |
Visual Studio Code | A Visual Studio Code egy platformfüggetlen integrált fejlesztési környezet (IDE), amelyet több nyelvvel és Azure-eszközökkel is használhat. Ezzel az egyetlen környezettel hozhatja létre a teljes megoldást. Első lépésként tekintse meg ezeket a bevezető videókat. | Telepítse a Visual Studio Code-ot, és dolgozzon a Visual Studio Code funkcióin az interaktív szerkesztőtéren. | |
Programozás Pythonnal | Ebben a megoldásban a Pythont, az adatelemzés egyik legnépszerűbb nyelvét használjuk. Ez a cikk az analitikus kód Pythonnal való írásának alapjait és a további információkhoz szükséges erőforrásokat ismerteti. A hivatkozás 1–9. szakaszában végezze el a munkát, majd ellenőrizze tudását. | Adjon hozzá egy entitást egy Azure-táblához a Python használatával. | |
A Jupyter Notebook használata | A jegyzetfüzetek használatával be lehet vezetni a szöveget és a kódot ugyanabban a dokumentumban. A gépi Tanulás működnek a jegyzetfüzetekkel, ezért érdemes megérteni a használatukat. Olvassa el ezt az oktatóanyagot, és próbálja ki a tudáspróba szakaszban. | Nyissa meg a Jupyter weblapját, és válassza az Üdvözli a Python.ipynb lehetőséget. Az oldalon található példákon keresztül haladva. | |
Gépi tanulás | A fejlett elemzési megoldások létrehozása magában foglalja az adatok gépi tanulással történő használatát, amely az AI-vel és a mély tanulással való munka alapját is képezi. Ez a kurzus a gépi tanulásról tanít. Az adatelemzéssel kapcsolatos átfogó tanfolyamért tekintse meg ezt a minősítést. | Erőforrás keresése gépi tanulási algoritmusokon. (Tipp: Keresés az "Azure Machine Learning-algoritmus csalási lapja" kifejezésben) | |
scikit-learn | A scikit-learn eszközökkel adatelemzési feladatokat végezhet a Pythonban. Ezt a keretrendszert a megoldásunkban használjuk. Ez a cikk az alapokat ismerteti, és ismerteti, hogy hol tudhat meg többet. | Az Írisz-adatkészlet használatával őrizze meg az SVM-modellt a Pickle használatával. | |
A Docker használata | A Docker egy elosztott platform, amellyel alkalmazásokat hozhat létre, szállíthat és futtathat, és gyakran használják a gépi tanulásban. Ez a cikk a technológia alapjait ismerteti, és ismerteti, hogy hol találhat további információkat. | Nyissa meg a Visual Studio Code-ot, és telepítse a Docker-bővítményt. Hozzon létre egy egyszerű Node Docker-tárolót. | |
Azure HDInsight | A HDInsight egy nyílt forráskódú Hadoop-infrastruktúra, amely szolgáltatásként érhető el az Azure-ban. A gépi tanulási algoritmusok nagy adatkészleteket tartalmazhatnak, és a HDInsight használatával nagy méretű adatokat tárolhat, továbbíthat és feldolgozhat. Ez a cikk a HDInsighttal való munkát ismerteti. | Hozzon létre egy kis HDInsight-fürtöt. A HiveQL-utasítások használatával oszlopokat vetíthet egy /example/data/sample.log fájlba. Másik lehetőségként elvégezheti ezt a tudáspróba elvégzését a helyi rendszerben. | |
Adatfeldolgozási folyamat létrehozása üzleti követelményekből | A TDSP-t követő kérdés meghatározása | A telepített és konfigurált fejlesztői környezet, valamint a technológiák és folyamatok megértése miatt itt az ideje, hogy a TDSP használatával mindent összefogjunk az elemzés elvégzéséhez. Először meg kell határoznunk a kérdést, ki kell választanunk az adatforrásokat és a TDSP többi lépését. Tartsa szem előtt a DevOps-folyamatot, miközben dolgozunk ezen a folyamaton. Ebből a cikkből megtudhatja, hogyan veheti át a szervezet követelményeit, és hogyan hozhat létre adatfolyam-térképet az alkalmazáson keresztül a megoldás TDSP használatával történő definiálásához. | Keresse meg az erőforrást az "5 adatelemzési kérdés" területen, és írja le a szervezet által e területeken esetleg felmerülő kérdéseket. Mely algoritmusokra kell összpontosítania erre a kérdésre? |
Prediktív megoldás létrehozása a Machine Tanulás használatával | Machine Learning | A gépi Tanulás AI-t használ az adatszervezéshez és a funkciófejlesztéshez, kezeli a kísérleteket és nyomon követi a modellfuttatásokat. Egyetlen környezetet használ, és a legtöbb függvény helyileg vagy az Azure-ban is futtatható. A kísérletek létrehozásához használhatja a PyTorch-keretrendszert, a TensorFlow-keretrendszert vagy más keretrendszereket. Ebben a cikkben a folyamat teljes példájára összpontosítunk, az eddig tanultak alapján. | |
Eredmények megjelenítése a Power BI-ban | Power BI | A Power BI egy adatvizualizációs eszköz. Több platformon is elérhető, például webeszközökön, mobileszközökön és asztali számítógépeken. Ebben a cikkben megtudhatja, hogyan használhatja a létrehozott megoldás kimenetét az Azure Storage eredményeinek elérésével és vizualizációk Power BI használatával történő létrehozásával. | Végezze el ezt az oktatóanyagot a Power BI-ban. Ezután csatlakoztassa a Power BI-t a kísérletfuttatásban létrehozott blob CSV-hez. |
A megoldás figyelése | Application Insights | A végső megoldás monitorozásához több eszköz is használható. Az alkalmazás Elemzések megkönnyíti a beépített monitorozás integrálását a megoldásba. | Alkalmazásfigyelési Elemzések beállítása. |
Azure Monitor-naplók | Egy másik módszer az alkalmazás monitorozására, ha integrálja azt a DevOps-folyamatba. Az Azure Monitor-naplók számos funkcióval segítik a elemzési megoldások monitorozását az üzembe helyezésük után. | Végezze el ezt az oktatóanyagot az Azure Monitor-naplók használatáról. | |
A képzési terv befejezése | Gratulálunk! Elvégezte ezt a képzési tervet. |
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerző:
- Mark Tabladillo | Vezető felhőmegoldás-tervező
A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.
Következő lépések
Folytassa AI-útját az AI-tanulási központban.
Kapcsolódó erőforrások
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: