Adatelemzési és jelentéskészítési technológia kiválasztása az Azure-ban

A legtöbb big data-megoldás célja az, hogy elemzéssel és jelentéskészítéssel betekintést nyújtson az adatokba. Ez lehet előre konfigurált jelentések és vizualizációk, vagy interaktív adatfeltárás.

Milyen lehetőségei vannak az adatelemzési technológia kiválasztásakor?

Az Azure-ban az igényeitől függően számos lehetőség áll rendelkezésre az elemzésre, a vizualizációkra és a jelentéskészítésre:

Power BI

A Power BI egy üzleti elemzési eszközcsomag. Több száz adatforráshoz csatlakozhat, és alkalmi elemzésre is használható. Tekintse meg a jelenleg elérhető adatforrások listáját . A Power BI Embedded használatával további licencelés nélkül integrálhatja a Power BI-t a saját alkalmazásaiba.

A szervezetek a Power BI használatával jelentéseket készíthetnek és tehetnek közzé a szervezetben. Mindenki létrehozhat személyre szabott irányítópultokat, beépített irányítással és biztonsággal. A Power BI a Microsoft Entra-azonosítóval hitelesíti a Power BI szolgáltatás bejelentkező felhasználókat, és a Power BI bejelentkezési hitelesítő adatait használja, amikor egy felhasználó megpróbál hozzáférni a hitelesítést igénylő erőforrásokhoz.

Jupyter-notebookok

A Jupyter Notebooks egy böngészőalapú felületet biztosít, amellyel az adattudósok Python-, Scala- vagy R-kódot és Markdown-szöveget tartalmazó jegyzetfüzetfájlokat hozhatnak létre, így hatékonyan együttműködhetnek a kód megosztásával és dokumentálásával, valamint egyetlen dokumentum eredményeivel.

A HDInsight-fürtök legtöbb fajtája, például a Spark vagy a Hadoop, előre konfigurálva van Jupyter-notebookokkal az adatok kezeléséhez és a feladatok feldolgozásához. A használt HDInsight-fürt típusától függően a rendszer egy vagy több kernelt biztosít a kód értelmezéséhez és futtatásához. A HDInsighton futó Spark-fürtök például Spark-hoz kapcsolódó kerneleket biztosítanak, amelyek közül választhat a Python- vagy Scala-kód Spark-motorral való végrehajtásához.

A Jupyter-jegyzetfüzetek nagyszerű környezetet biztosítanak az adatok elemzéséhez, vizualizációjához és feldolgozásához, mielőtt fejlettebb vizualizációkat készítenének egy olyan BI-/jelentéskészítő eszközzel, mint a Power BI.

Zeppelin-jegyzetfüzetek

A Zeppelin Notebooks egy másik lehetőség a böngészőalapú rendszerhéjhoz, hasonlóan a Jupyter funkcióhoz. Egyes HDInsight-fürtök előre konfigurálva vannak Zeppelin-jegyzetfüzetekkel. Ha azonban HDInsight Interaktív lekérdezési (Hive LLAP) fürtöt használ, a Zeppelin jelenleg az egyetlen jegyzetfüzet, amellyel interaktív Hive-lekérdezéseket futtathat. Ha tartományhoz csatlakoztatott HDInsight-fürtöt használ, a Zeppelin-jegyzetfüzetek az egyetlen olyan típus, amely lehetővé teszi különböző felhasználói bejelentkezések hozzárendelését a jegyzetfüzetekhez és a mögöttes Hive-táblákhoz való hozzáférés szabályozásához.

Jupyter-jegyzetfüzetek a VS Code-ban

A VS Code egy ingyenes kódszerkesztő és fejlesztői platform, amelyet helyileg vagy távoli számításhoz csatlakoztatva használhat. A Jupyter bővítménnyel kombinálva teljes környezetet biztosít a Jupyter-fejlesztéshez, amely további nyelvi bővítményekkel bővíthető. Ha egy kategóriájában legjobb, ingyenes Jupyter-élményt szeretne, amely képes kihasználni a választott számítást, ez egy nagyszerű lehetőség. A VS Code használatával jegyzetfüzeteket fejleszthet és futtathat távoli számítógépeken és tárolókon. Az Azure Notebooksról való áttérés megkönnyítése érdekében elérhetővé tettük a tárolórendszerképet, hogy a VS Code-tal is használható legyen.

A Jupyter (korábbi nevén IPython Notebook) egy nyílt forráskódú projekt, amellyel egyszerűen kombinálhatja a Markdown-szöveget és a végrehajtható Python-forráskódot egy jegyzetfüzetnek nevezett vásznon. A Visual Studio Code támogatja a Jupyter Notebookok natív és Python-kódfájlokon keresztüli használatát.

Kulcsválasztási feltételek

A lehetőségek szűkítéséhez először válaszoljon az alábbi kérdésekre:

  • Számos adatforráshoz kell csatlakoznia, hogy központosított helyen hozzon létre jelentéseket az egész tartományon átterjedő adatokhoz? Ha igen, válasszon egy lehetőséget, amely lehetővé teszi, hogy 100-100 adatforráshoz csatlakozzon.

  • Dinamikus vizualizációkat szeretne beágyazni egy külső webhelybe vagy alkalmazásba? Ha igen, válasszon egy olyan lehetőséget, amely beágyazási képességeket biztosít.

  • Offline állapotban szeretné megtervezni a vizualizációkat és jelentéseket? Ha igen, válasszon egy offline képességekkel rendelkező lehetőséget.

  • Nagy feldolgozási teljesítményre van szüksége a nagy vagy összetett AI-modellek betanítása vagy a nagyon nagy adatkészletek használata érdekében? Ha igen, válasszon egy lehetőséget, amely csatlakozni tud egy big data-fürthöz.

Képességmátrix

Az alábbi táblázatok összefoglalják a képességek főbb különbségeit.

Általános képességek

Funkció Power BI Jupyter-notebookok Zeppelin-jegyzetfüzetek Jupyter-jegyzetfüzetek a VS Code-ban
Csatlakozás big data-fürtre speciális feldolgozás céljából Igen Igen Igen Nem
Felügyelt szolgáltatás Igen Igen 1 Igen 1 Igen
Csatlakozás-100-100-ás adatforrások Igen Nem Nem Nem
Offline képességek Igen 2 Nem Nem Nem
Beágyazási képességek Igen Nem Nem Nem
Automatikus adatfrissítés Igen Nem Nem Nem
Hozzáférés számos nyílt forráskód csomaghoz Nem Igen 3 Igen 3 Igen 4
Adatátalakítási/tisztítási lehetőségek Power Query, R 40 nyelv, köztük Python, R, Julia és Scala Több mint 20 értelmező, beleértve a Pythont, a JDBC-t és az R-t Python, F#, R
Díjszabás Ingyenes a Power BI Desktophoz (létrehozás), lásd az üzemeltetési lehetőségek díjszabását Ingyenes Ingyenes Ingyenes
Többfelhasználós együttműködés Igen Igen (megosztással vagy többfelhasználós kiszolgálóval, például a JupyterHubbal) Igen Igen (megosztással)

[1] Felügyelt HDInsight-fürt részeként használva.

[2] A Power BI Desktop használatával.

[2] Kereshet a Maven-adattárban a közösség által létrehozott csomagok között.

[3] A Python-csomagok pip vagy conda használatával telepíthetők. Az R-csomagok a CRAN-ból vagy a GitHubról telepíthetők. Az F# csomagjai nuget.org a Paket függőségkezelőjével telepíthetők.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

Következő lépések