Megosztás a következőn keresztül:


Ajánlott eljárások összetett adatfolyamok tervezéséhez és fejlesztéséhez

Ha a fejlesztendő adatfolyam egyre nagyobb és összetettebb lesz, az alábbiakban bemutatunk néhányat, amelyekkel javíthatja az eredeti kialakítást.

Több adatfolyamra bonthatja

Ne tegyen meg mindent egyetlen adatfolyamban. Nem csupán egyetlen, összetett adatfolyam teszi hosszabbá az adatátalakítási folyamatot, hanem megnehezíti az adatfolyam megértését és újrafelhasználását is. Az adatfolyam több adatfolyamra való feltöréséhez különböző adatfolyamokban lévő táblákat, vagy akár egy táblát is több adatfolyamba kell szétválasztani. Egy számított tábla vagy csatolt tábla koncepciója alapján az átalakítás egy részét egy adatfolyamban építheti fel, és felhasználhatja más adatfolyamokban is.

Adatfolyamok felosztása előkészítési/kinyerési adatfolyamokból

Az adatfolyamok csak az adatok kinyerésére (vagyis az adatfolyamok átmeneti tárolására) és más, csak az adatok átalakítására szolgáló adatfolyamok használata nem csak a többrétegű architektúra létrehozásához hasznos, hanem az adatfolyamok összetettségének csökkentéséhez is hasznos. Néhány lépésben egyszerűen kinyerheti az adatokat az adatforrásból, például adatokat kérhet le, navigálást és adattípus-módosításokat hajthat végre. Az átmeneti adatfolyamok és az átalakítási adatfolyamok elkülönítésével egyszerűbbé teheti az adatfolyamok fejlesztését.

Multilayered dataflow architecture.

Az adatforrásból az átmeneti adatfolyamokbe kinyert adatokat ábrázoló kép, ahol a táblák a Dataverse-ben vagy az Azure Data Lake Storage-ban vannak tárolva. Ezután az adatok át lesznek helyezve az átalakítási adatfolyamokra, ahol az adatok át lesznek alakítva, és az adattárház struktúrába lesznek konvertálva. Ezután az adatok átkerülnek a szemantikai modellbe.

Egyéni függvények használata

Az egyéni függvények olyan helyzetekben hasznosak, amikor bizonyos számú lépést kell elvégezni a különböző forrásokból származó lekérdezésekhez. Az egyéni függvények a Power Query-szerkesztő grafikus felületén vagy egy M-szkripttel fejleszthetők. A függvények tetszőleges számú táblában újra felhasználhatók egy adatfolyamban.

Ha egyéni függvényt használ, azzal segít, ha a forráskódnak csak egyetlen verziója van, így nem kell duplikálnia a kódot. Ennek eredményeképpen a Power Query átalakítási logikájának és a teljes adatfolyamnak a fenntartása sokkal egyszerűbb. További információt a következő blogbejegyzésben talál: Custom Functions Made Easy in Power BI Desktop.

Screenshot of the Queries pane with the Get Holidays custom function and its data emphasized.

Feljegyzés

Előfordulhat, hogy értesítést kap arról, hogy az adatfolyamok egyéni függvényekkel való frissítéséhez prémium szintű kapacitásra van szükség. Ezt az üzenetet figyelmen kívül hagyhatja, és újra megnyithatja az adatfolyam-szerkesztőt. Ez általában akkor oldja meg a problémát, ha a függvény nem hivatkozik a "terhelést engedélyező" lekérdezésre.

Lekérdezések elhelyezése mappákba

A mappák lekérdezésekhez való használata segít a kapcsolódó lekérdezések csoportosításában. Az adatfolyam fejlesztésekor töltsön egy kicsit több időt a lekérdezések logikus mappákba rendezésére. Ezzel a módszerrel a jövőben könnyebben megtalálhatja a lekérdezéseket, és a kód karbantartása sokkal egyszerűbb.

Számított táblák használata

A számított táblák nemcsak érthetőbbé teszik az adatfolyamot, hanem jobb teljesítményt is biztosítanak. Számított tábla használatakor a többi hivatkozott tábla egy "már feldolgozott és tárolt" táblából kap adatokat. Az átalakítás sokkal egyszerűbb és gyorsabb.

Használja ki a továbbfejlesztett számítási motor előnyeit

A Power BI felügyeleti portálon fejlesztett adatfolyamok esetében győződjön meg arról, hogy a továbbfejlesztett számítási motort úgy használja, hogy először illesztéseket hajt végre, és először szűri az átalakításokat egy számított táblában, mielőtt más típusú átalakításokat végez.

Több lépés megszakítása több lekérdezésre

Nehéz nyomon követni számos lépést egy táblában. Ehelyett nagy számú lépést kell több táblára bontania. Használhatja a Terhelés engedélyezése más lekérdezésekhez, és letilthatja őket köztes lekérdezések esetén, és csak az adatfolyamon keresztül töltheti be a végleges táblát. Ha több, egyenként kisebb lépésekkel rendelkező lekérdezéssel rendelkezik, könnyebben használhatja a függőségi diagramot, és nyomon követheti az egyes lekérdezéseket további vizsgálat céljából, ahelyett, hogy egy lekérdezés több száz lépésébe ásnál.

Tulajdonságok hozzáadása lekérdezésekhez és lépésekhez

A könnyen karbantartható kód használatához a dokumentáció a kulcs. A Power Queryben tulajdonságokat adhat a táblákhoz és a lépésekhez is. A tulajdonságokban hozzáadott szöveg elemleírásként jelenik meg, amikor az adott lekérdezésre vagy lépésre mutat. Ez a dokumentáció segít a modell jövőbeni karbantartásában. Egy táblázat vagy lépés áttekintésével megértheti, mi történik ott, ahelyett, hogy újragondolja és megjegyzi, hogy mit tett ebben a lépésben.

Győződjön meg arról, hogy a kapacitás ugyanabban a régióban van

Az adatfolyamok jelenleg nem támogatnak több országot vagy régiót. A prémium szintű kapacitásnak ugyanabban a régióban kell lennie, mint a Power BI-bérlő.

Helyszíni források elkülönítése a felhőforrásoktól

Javasoljuk, hogy hozzon létre egy külön adatfolyamot minden forrástípushoz, például a helyszíni, a felhőbeli, az SQL Serverhez, a Sparkhoz és a Dynamics 365-höz. Az adatfolyamok forrástípus szerinti elkülönítése gyors hibaelhárítást tesz lehetővé, és elkerüli a belső korlátokat az adatfolyamok frissítésekor.

Adatfolyamok elkülönítése a táblákhoz szükséges ütemezett frissítés alapján

Ha van egy értékesítési tranzakciós táblája, amely óránként frissül a forrásrendszerben, és hetente frissül egy termékleképezési táblázat, akkor ezt a két táblát két különböző adatfrissítési ütemezésű adatfolyamra bonthatja.

A frissítés ütemezésének elkerülése ugyanazon a munkaterületen lévő csatolt táblák esetében

Ha rendszeresen ki van zárva a csatolt táblákat tartalmazó adatfolyamaiból, azt okozhatja egy megfelelő, függő adatfolyam ugyanazon a munkaterületen, amely az adatfolyam frissítése során zárolva van. Az ilyen zárolás tranzakciós pontosságot biztosít, és biztosítja mindkét adatfolyam sikeres frissítését, de megakadályozhatja a szerkesztést.

Ha külön ütemezést állít be a csatolt adatfolyamhoz, az adatfolyamok szükségtelenül frissíthetők, és megakadályozhatják az adatfolyam szerkesztését. A probléma elkerülésére két javaslat létezik:

  • Ne állítson be frissítési ütemezést egy csatolt adatfolyamhoz ugyanabban a munkaterületen, mint a forrás adatfolyam.
  • Ha külön szeretné konfigurálni a frissítési ütemezést, és el szeretné kerülni a zárolási viselkedést, helyezze át az adatfolyamot egy külön munkaterületre.