A Python használata a Power Query-szerkesztőben

A statisztikusok, adattudósok és adatelemzők által széles körben használt Python programozási nyelvet a Power BI Desktop Power Query-szerkesztőjében használhatja. A Pythonnak a Power Query-szerkesztőbe való integrálása lehetővé teszi az adattisztítást a Python használatával, és speciális adatformázást és elemzést végezhet az adathalmazokban, beleértve a hiányzó adatok, előrejelzések és fürtözés befejezését, csak hogy csak néhányat említsünk. A Python hatékony nyelv, és a Power Query-szerkesztőben használható az adatmodell előkészítéséhez és jelentések létrehozásához.

Előfeltételek

A kezdés előtt telepítenie kell a Pythont és a pandast.

  • A Python telepítése – Ha a Pythont a Power BI Desktop Power Query-szerkesztőjében szeretné használni, telepítenie kell a Pythont a helyi gépére. A Pythont számos helyről ingyenesen letöltheti és telepítheti, beleértve a Python hivatalos letöltési oldalát és az Anacondát.

  • Pandas telepítése – Ha a Pythont a Power Query-szerkesztővel szeretné használni, telepítenie kell a pandast is. A Pandas használatával adatokat helyezhet át a Power BI és a Python-környezet között.

A Python használata a Power Query-szerkesztővel

Ha be szeretné mutatni, hogyan használhatja a Pythont a Power Query-szerkesztőben, ezt a példát egy tőzsdei adatkészletből készítheti el egy CSV-fájl alapján, amelyet innen tölthet le és követhet. Ennek a példának a lépései a következők:

  1. Először töltse be az adatokat a Power BI Desktopba. Ebben a példában töltse be a EuStockMarkets_NA.csv fájlt, és válassza az Adatszöveg>/CSV lekérése lehetőséget a Power BI DesktopKezdőlap menüszalagjáról.

    Képernyőkép a Power BI Desktop Adatok lekérése menüszalagjáról, amelyen a CSV-kijelölés látható.

  2. Jelölje ki a fájlt, és válassza a Megnyitás lehetőséget, és a CSV megjelenik a CSV-fájl párbeszédpanelen.

    Képernyőkép a CSV-fájl párbeszédpanelről, amelyen a kijelölt CSV látható.

  3. Az adatok betöltése után megjelenik a Power BI DesktopMezők paneljén.

    Képernyőkép a Mezők panelről, amelyen a betöltött adatok láthatók.

  4. Nyissa meg a Power Query-szerkesztőt az Adatok átalakítása gombra kattintva a Power BI DesktopKezdőlap lapján.

    A Power BI Desktop Power Query-szerkesztőjének képernyőképe, amelyen az Adatok átalakítása lehetőség látható.

  5. Az Átalakítás lapon válassza a Python-szkript futtatása lehetőséget, és a Python-szkript futtatása szerkesztő a következő lépésben látható módon jelenik meg. A 15. és a 20. sorból hiányoznak adatok, ahogy az alábbi képen nem látható többi sor is. Az alábbi lépések bemutatják, hogyan hajtja végre a Python ezeket a sorokat.

    Képernyőkép az Átalakítás lapról, amelyen az adatsorok láthatók.

  6. Ebben a példában adja meg a következő szkriptkódot:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Megjegyzés:

    Az előző szkriptkód megfelelő működéséhez telepítenie kell a Pandas-kódtárat a Python-környezetben. A pandas telepítéséhez futtassa a következő parancsot a Python-telepítésben: pip install pandas

    Amikor a Python-szkript futtatása párbeszédpanelre kerül, a kód a következő példához hasonlóan néz ki:

    Képernyőkép a Python-szkript futtatása párbeszédpanelről, amelyen a szkriptkód látható.

  7. Az OK gomb kiválasztása után a Power Query-szerkesztő figyelmeztetést jelenít meg az adatvédelmet illetően.

    Képernyőkép a Power Query-szerkesztő panelről, amelyen az adatvédelemre vonatkozó figyelmeztetés látható.

  8. Ahhoz, hogy a Python-szkriptek megfelelően működjenek a Power BI szolgáltatásban, minden adatforrást nyilvánosra kell állítani. Az adatvédelmi beállításokról és azok következményeiről további információt az Adatvédelmi szintek című témakörben talál.

    Képernyőkép az Adatvédelmi szintek párbeszédpanelről, amelyen látható, hogy a Nyilvános beállítás be van állítva.

    Figyelje meg, hogy a Mezők panelen egy új oszlop található, amelynek neve completedValues. Figyelje meg, hogy néhány adatelem hiányzik, például a 15. és a 18. sorban. Tekintse meg, hogyan kezeli ezt a Python a következő szakaszban.

Mindössze három sornyi Python-szkripttel a Power Query-szerkesztő egy prediktív modellel töltötte ki a hiányzó értékeket.

Vizualizációk létrehozása Python-szkriptadatokból

Most létrehozhatunk egy vizualizációt, amelyből megtudhatjuk, hogy a Python-szkriptkód a pandas-kódtár használatával hogyan teljesítette a hiányzó értékeket, ahogyan az az alábbi képen látható:

Képernyőkép a vizualizációról, amelyen az eredeti adatok és a pandas-kódtár hiányzó értékei láthatók.

Ha elkészült a vizualizáció, és minden más vizualizáció, amelyet a Power BI Desktop használatával szeretne létrehozni, mentheti a Power BI Desktop-fájlt . A Power BI Desktop-fájlok mentése a .pbix fájlnévkiterjesztéssel. Ezután használja az adatmodellt, beleértve a részét képező Python-szkripteket is a Power BI szolgáltatásban.

Megjegyzés:

Szeretne látni egy befejezett .pbix-fájlt a következő lépésekkel? Szerencséd van. Itt töltheti le az ezekben a példákban használt kész Power BI Desktop-fájlt.

Miután feltöltötte a .pbix-fájlt a Power BI szolgáltatásba, néhány további lépésre van szükség ahhoz, hogy az adatok frissüljenek a szolgáltatásban, és hogy a vizualizációk frissíthetők legyenek a szolgáltatásban. Az adatoknak hozzá kell férnie a Pythonhoz a vizualizációk frissítéséhez. A többi lépés a következő:

  • Az adathalmaz ütemezett frissítésének engedélyezése. Ha engedélyezni szeretné az adathalmazt Python-szkriptekkel tartalmazó munkafüzet ütemezett frissítését, olvassa el az Ütemezett frissítés konfigurálása című témakört, amely a Személyes átjáróval kapcsolatos információkat is tartalmazza.
  • Telepítse a Személyes átjárót. Telepítenie kell egy személyes átjárót arra a gépre, amelyen a fájl található, és ahol a Python telepítve van. A Power BI szolgáltatásnak hozzá kell férnie a munkafüzethez, és újra kell renderelnie a frissített vizualizációkat. További információ: Személyes átjáró telepítése és konfigurálása.

Megfontolások és korlátok

A Power Query-szerkesztőben létrehozott Python-szkripteket tartalmazó lekérdezésekre bizonyos korlátozások vonatkoznak:

  • Minden Python-adatforrás-beállítást nyilvánosra kell állítani, és a Power Query-szerkesztőben létrehozott lekérdezés összes többi lépésének is nyilvánosnak kell lennie. Az adatforrás beállításainak eléréséhez a Power BI Desktopban válassza a Fájlbeállítások > és beállítások > adatforrásbeállítások lehetőséget.

    Képernyőkép a Power BI Desktop Fájl menüjéről, amelyen az adatforrás beállításainak kiválasztása látható.

    Az Adatforrás beállításai párbeszédpanelen jelölje ki az adatforrásokat, majd válassza az Engedélyek szerkesztése lehetőséget, és győződjön meg arról, hogy az adatvédelmi szintnyilvánosra van állítva.

    Képernyőkép az Adatforrás beállításai párbeszédpanelről, amelyen az Adatvédelmi szint nyilvános értékre van állítva.

  • A Python-vizualizációk vagy adatkészletek ütemezett frissítésének engedélyezéséhez engedélyeznie kell az ütemezett frissítést , és telepítenie kell egy Személyes átjárót a munkafüzetet és a Python-telepítést tartalmazó számítógépre. A kettőről a cikk előző szakaszában talál további információt, amely hivatkozásokat tartalmaz az egyes elemekről.

  • A beágyazott táblák, azaz táblák a táblákban, jelenleg nem támogatottak.

A Pythonnal és az egyéni lekérdezésekkel sokféleképpen elvégezheti a műveleteket, ezért az adatokat úgy tárhatja fel és alakíthatja, ahogyan meg szeretné jeleníteni.