Adatelemzési és jelentéskészítési technológia kiválasztása az Azure-ban
A legtöbb big data-megoldás célja az, hogy elemzéssel és jelentéskészítéssel betekintést nyújtson az adatokba. Ez lehet előre konfigurált jelentések és vizualizációk, vagy interaktív adatfeltárás.
Milyen lehetőségei vannak az adatelemzési technológia kiválasztásakor?
Az Azure-ban az igényeitől függően számos lehetőség áll rendelkezésre az elemzésre, a vizualizációkra és a jelentéskészítésre:
Power BI
A Power BI egy üzleti elemzési eszközcsomag. Több száz adatforráshoz csatlakozhat, és alkalmi elemzésre is használható. Tekintse meg a jelenleg elérhető adatforrások listáját . A Power BI Embedded használatával további licencelés nélkül integrálhatja a Power BI-t a saját alkalmazásaiba.
A szervezetek a Power BI használatával jelentéseket készíthetnek és tehetnek közzé a szervezetben. Mindenki létrehozhat személyre szabott irányítópultokat, beépített irányítással és biztonsággal. A Power BI a Microsoft Entra-azonosítóval hitelesíti a Power BI szolgáltatás bejelentkező felhasználókat, és a Power BI bejelentkezési hitelesítő adatait használja, amikor egy felhasználó megpróbál hozzáférni a hitelesítést igénylő erőforrásokhoz.
Jupyter-notebookok
A Jupyter Notebooks egy böngészőalapú felületet biztosít, amellyel az adattudósok Python-, Scala- vagy R-kódot és Markdown-szöveget tartalmazó jegyzetfüzetfájlokat hozhatnak létre, így hatékonyan együttműködhetnek a kód megosztásával és dokumentálásával, valamint egyetlen dokumentum eredményeivel.
A HDInsight-fürtök legtöbb fajtája, például a Spark vagy a Hadoop, előre konfigurálva van Jupyter-notebookokkal az adatok kezeléséhez és a feladatok feldolgozásához. A használt HDInsight-fürt típusától függően a rendszer egy vagy több kernelt biztosít a kód értelmezéséhez és futtatásához. A HDInsighton futó Spark-fürtök például Spark-hoz kapcsolódó kerneleket biztosítanak, amelyek közül választhat a Python- vagy Scala-kód Spark-motorral való végrehajtásához.
A Jupyter-jegyzetfüzetek nagyszerű környezetet biztosítanak az adatok elemzéséhez, vizualizációjához és feldolgozásához, mielőtt fejlettebb vizualizációkat készítenének egy olyan BI-/jelentéskészítő eszközzel, mint a Power BI.
Zeppelin-jegyzetfüzetek
A Zeppelin Notebooks egy másik lehetőség a böngészőalapú rendszerhéjhoz, hasonlóan a Jupyter funkcióhoz. Egyes HDInsight-fürtök előre konfigurálva vannak Zeppelin-jegyzetfüzetekkel. Ha azonban HDInsight Interaktív lekérdezési (Hive LLAP) fürtöt használ, a Zeppelin jelenleg az egyetlen jegyzetfüzet, amellyel interaktív Hive-lekérdezéseket futtathat. Ha tartományhoz csatlakoztatott HDInsight-fürtöt használ, a Zeppelin-jegyzetfüzetek az egyetlen olyan típus, amely lehetővé teszi különböző felhasználói bejelentkezések hozzárendelését a jegyzetfüzetekhez és a mögöttes Hive-táblákhoz való hozzáférés szabályozásához.
Jupyter-jegyzetfüzetek a VS Code-ban
A VS Code egy ingyenes kódszerkesztő és fejlesztői platform, amelyet helyileg vagy távoli számításhoz csatlakoztatva használhat. A Jupyter bővítménnyel kombinálva teljes környezetet biztosít a Jupyter-fejlesztéshez, amely további nyelvi bővítményekkel bővíthető. Ha egy kategóriájában legjobb, ingyenes Jupyter-élményt szeretne, amely képes kihasználni a választott számítást, ez egy nagyszerű lehetőség. A VS Code használatával jegyzetfüzeteket fejleszthet és futtathat távoli számítógépeken és tárolókon. Az Azure Notebooksról való áttérés megkönnyítése érdekében elérhetővé tettük a tárolórendszerképet, hogy a VS Code-tal is használható legyen.
A Jupyter (korábbi nevén IPython Notebook) egy nyílt forráskódú projekt, amellyel egyszerűen kombinálhatja a Markdown-szöveget és a végrehajtható Python-forráskódot egy jegyzetfüzetnek nevezett vásznon. A Visual Studio Code támogatja a Jupyter Notebookok natív és Python-kódfájlokon keresztüli használatát.
Kulcsválasztási feltételek
A lehetőségek szűkítéséhez először válaszoljon az alábbi kérdésekre:
Számos adatforráshoz kell csatlakoznia, hogy központosított helyen hozzon létre jelentéseket az egész tartományon átterjedő adatokhoz? Ha igen, válasszon egy lehetőséget, amely lehetővé teszi, hogy 100-100 adatforráshoz csatlakozzon.
Dinamikus vizualizációkat szeretne beágyazni egy külső webhelybe vagy alkalmazásba? Ha igen, válasszon egy olyan lehetőséget, amely beágyazási képességeket biztosít.
Offline állapotban szeretné megtervezni a vizualizációkat és jelentéseket? Ha igen, válasszon egy offline képességekkel rendelkező lehetőséget.
Nagy feldolgozási teljesítményre van szüksége a nagy vagy összetett AI-modellek betanítása vagy a nagyon nagy adatkészletek használata érdekében? Ha igen, válasszon egy lehetőséget, amely csatlakozni tud egy big data-fürthöz.
Képességmátrix
Az alábbi táblázatok összefoglalják a képességek főbb különbségeit.
Általános képességek
Funkció | Power BI | Jupyter-notebookok | Zeppelin-jegyzetfüzetek | Jupyter-jegyzetfüzetek a VS Code-ban |
---|---|---|---|---|
Csatlakozás big data-fürtre speciális feldolgozás céljából | Igen | Igen | Igen | Nem |
Felügyelt szolgáltatás | Igen | Igen 1 | Igen 1 | Igen |
Csatlakozás-100-100-ás adatforrások | Igen | Nem | Nem | Nem |
Offline képességek | Igen 2 | Nem | Nem | Nem |
Beágyazási képességek | Igen | Nem | Nem | Nem |
Automatikus adatfrissítés | Igen | Nem | Nem | Nem |
Hozzáférés számos nyílt forráskód csomaghoz | Nem | Igen 3 | Igen 3 | Igen 4 |
Adatátalakítási/tisztítási lehetőségek | Power Query, R | 40 nyelv, köztük Python, R, Julia és Scala | Több mint 20 értelmező, beleértve a Pythont, a JDBC-t és az R-t | Python, F#, R |
Díjszabás | Ingyenes a Power BI Desktophoz (létrehozás), lásd az üzemeltetési lehetőségek díjszabását | Ingyenes | Ingyenes | Ingyenes |
Többfelhasználós együttműködés | Igen | Igen (megosztással vagy többfelhasználós kiszolgálóval, például a JupyterHubbal) | Igen | Igen (megosztással) |
[1] Felügyelt HDInsight-fürt részeként használva.
[2] A Power BI Desktop használatával.
[2] Kereshet a Maven-adattárban a közösség által létrehozott csomagok között.
[3] A Python-csomagok pip vagy conda használatával telepíthetők. Az R-csomagok a CRAN-ból vagy a GitHubról telepíthetők. Az F# csomagjai nuget.org a Paket függőségkezelőjével telepíthetők.
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerző:
- Zoiner Tejada | vezérigazgató és tervező
Következő lépések
- Ismerkedés a Pythonhoz készült Jupyter-notebookokkal
- Jegyzetfüzetek
- Azure Databricks-jegyzetfüzetek futtatása az Azure Data Factoryvel
- Jupyter-jegyzetfüzetek futtatása a munkaterületen
- Mi az a Power BI?
Kapcsolódó erőforrások
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: