Megosztás a következőn keresztül:


Ajánlott eljárások az adatfolyamok környezetek és munkaterületek közötti újrafelhasználására

Ez a cikk az adatfolyamok hatékony és hatékony újrafelhasználására vonatkozó ajánlott eljárások gyűjteményét ismerteti. Ebből a cikkből elkerülheti a tervezési buktatókat és a lehetséges teljesítményproblémákat az adatfolyamok újrafelhasználásra való fejlesztése során.

Adatfolyamok elkülönítése az előkészítési/kinyerési adatfolyamoktól

Ha egy adatfolyam végrehajtja az összes műveletet, nehéz újra felhasználni a tábláit más adatfolyamokban vagy más célokra. A legjobban újrafelhasználható adatfolyamok azok az adatfolyamok, amelyek csak néhány műveletet hajtanak végre. Az egy adott feladatra specializálódott adatfolyamok létrehozása az egyik legjobb módszer az újrafelhasználásukra. Ha olyan adatfolyamkészlettel rendelkezik, amelyet átmeneti adatfolyamként használ, az egyetlen művelet az adatok forrásrendszerből való kinyerése. Ezek az adatfolyamok több más adatfolyamban is újra felhasználhatók.

Ha adatfolyamokkal rendelkezik, feloszthatja őket olyan adatfolyamokra, amelyek gyakori átalakításokat hajtanak végre. Minden adatfolyam csak néhány műveletet hajthat végre. Ez a néhány művelet adatfolyamonként biztosítja, hogy az adatfolyam kimenete más adatfolyamok által újra felhasználható legyen.

Dataflow doing only a few actions.

Kép egy adatforrásból az átmeneti adatfolyamok felé, ahol a táblák a Dataverse-ben vagy az Azure Data Lake Storage-ban vannak tárolva. Ezután az adatok át lesznek helyezve az átalakítási adatfolyamokra, ahol az adatok át lesznek alakítva, és az adattárház struktúrába lesznek konvertálva. Végül az adatok egy Power BI szemantikai modellbe töltődnek be.

Több munkaterület használata

Minden munkaterület (vagy környezet) csak a munkaterület tagjai számára érhető el. Ha az összes adatfolyamot egy munkaterületen hozza létre, minimalizálja az adatfolyamok újrafelhasználását. Lehetnek általános munkaterületek olyan adatfolyamokhoz, amelyek vállalati szintű táblákat dolgoznak fel. Emellett több részleg tábláit feldolgozó adatfolyamok munkaterülete is lehet. Emellett rendelkezhet olyan munkaterületekkel is, amelyeken az adatfolyamok csak bizonyos részlegekben használhatók.

Image showing the separate workspaces.

A megfelelő hozzáférési szintek beállítása a munkaterületeken

Ahhoz, hogy más munkaterületeken lévő adatfolyamokhoz hozzáférést biztosítson egy munkaterületen lévő adatfolyam kimenetének használatához, csak megtekintési hozzáférést kell adnia nekik a munkaterületen. Ha többet szeretne megtudni a Power BI-munkaterület más szerepköreiről, lépjen az új munkaterületek szerepkörei közé.

Screenshot showing how to access to the Power BI workspace.

Az adatfolyam támogatása a Power BI-ban

A bérlői szervezetben számos adatfolyam hozható létre, és a felhasználók nehezen tudják, melyik adatfolyam a legmegbízhatóbb. Az adatfolyam szerzői vagy azok a felhasználók, akik szerkesztési hozzáféréssel rendelkeznek, három szinten támogathatják az adatfolyamot: nincs jóváhagyás, előléptetés vagy minősítés.

Ezek a jóváhagyási szintek segítenek a felhasználóknak a megbízható adatfolyamok könnyebb és gyorsabb megtalálásában. Először a magasabb jóváhagyási szintű adatfolyam jelenik meg. A Power BI-rendszergazda delegálhatja az adatfolyamok hitelesített szintre történő jóváhagyásának képességét másoknak. További információ: Támogatás – Power BI-tartalom népszerűsítése és minősítése

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Táblák elkülönítése több adatfolyamban

Egy adatfolyamban több tábla is lehet. A táblák több adatfolyamban való felosztásának egyik oka az, amit a cikk korábbi, az adatbetöltési és adatátalakítási adatfolyamok elkülönítéséről tanult. Egy másik jó ok arra, hogy a táblák több adatfolyamban is szerepeljenek, ha más frissítési ütemezést szeretne, mint a többi táblában.

Az alábbi képen látható példában az értékesítési táblát négy óránként kell frissíteni. A dátumtáblát naponta csak egyszer kell frissíteni az aktuális dátumrekord frissítéséhez. Egy termékleképezési táblát pedig csak hetente egyszer kell frissíteni. Ha az összes tábla egy adatfolyamban található, csak egy frissítési lehetőség áll rendelkezésére. Ha azonban ezeket a táblákat több adatfolyamra osztja fel, az egyes adatfolyamok frissítését külön ütemezheti.

Image showing dataflows with different schedules for the refresh.

Jó táblajelöltek adatfolyamtáblákhoz

Amikor az asztali eszközökben a Power Query használatával fejleszt megoldásokat, felteheti magának a kérdést; ezek közül melyik jó jelölt egy adatfolyamba való áthelyezésre? Az adatfolyamba áthelyezendő legjobb táblák azok a táblák, amelyeket több megoldásban, vagy több környezetben vagy szolgáltatásban kell használni. Az alábbi képen látható Dátum táblát például két különálló Power BI-fájlban kell használni. Ahelyett, hogy az egyes fájlokban duplikálja a táblát, létrehozhatja a táblát egy adatfolyamban táblázatként, és újra felhasználhatja azokban a Power BI-fájlokban.

Image showing a shared table used in a dataflow.