Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Feljegyzés
Ez a cikk a Power BI implementációtervezési cikksorozatának része. A sorozat a Power BI-élmény Microsoft Fabricen belüli implementálásának megtervezésére összpontosít. Tekintse meg a sorozat bemutatóját.
Az adat-előkészítés (más néven ETL, amely a kinyerés, átalakítás és betöltés rövidítése) gyakran jelentős mennyiségű munkát igényel a forrásadatok minőségétől és szerkezetétől függően. Az önkiszolgáló adat-előkészítés használati forgatókönyve az adatelőkészítési tevékenységek üzleti elemzők általi újrafelhasználására összpontosít. Ezt a célt úgy éri el, hogy az adat-előkészítési munkát áthelyezi a Power Queryből (az egyes Power BI Desktop-fájlokon belül) a Power Query Online-ba (Power BI-adatfolyam használatával). A logika központosítása segít elérni az igazság egyetlen forrását, és csökkenti a többi tartalomkészítő által igényelt erőfeszítést.
Az adatfolyamok a Power Query Online használatával hozhatók létre a Power BI szolgáltatás, a Power Apps vagy a Dynamics 365 Customer Insights segítségével. A Power BI-ban létrehozott adatfolyamokat elemzési adatfolyamnak nevezzük. A Power Appsben létrehozott adatfolyamok kétféle típusúak lehetnek: standard vagy elemzési. Ez a forgatókönyv csak a Power BI szolgáltatás belül létrehozott és felügyelt Power BI-adatfolyamok használatát ismerteti.
Feljegyzés
Az önkiszolgáló adat-előkészítési forgatókönyv az önkiszolgáló BI-forgatókönyvek egyike. Az önkiszolgáló forgatókönyvek teljes listáját a Power BI használati forgatókönyveit ismertető cikkben találja.
A rövidség kedvéért a jelen cikk nem foglalkozik a tartalom-együttműködési és kézbesítési forgatókönyvek témakörében ismertetett néhány szempontmal. A teljes lefedettség érdekében először olvassa el ezeket a cikkeket.
Forgatókönyv-diagram
Az alábbi ábra az önkiszolgáló adatok előkészítését támogató leggyakoribb felhasználói műveletek és Power BI-összetevők magas szintű áttekintését mutatja be. Az elsődleges cél egy adatfolyam létrehozása a Power Query Online-ban, amely több szemantikai modell adatforrásává válik. A cél az, hogy sok szemantikai modell kihasználja az adatfolyam által egyszer elvégzett adatelőkészítést.
Tipp.
Javasoljuk, hogy töltse le a forgatókönyv-diagramot , ha be szeretné ágyazni a bemutatóba, a dokumentációba vagy a blogbejegyzésbe, vagy nyomtassa ki fali plakátként. Mivel ez egy méretezhető vektorgrafika (SVG) kép, minőségromlás nélkül skálázhatja fel vagy le.
A forgatókönyv-diagram a következő felhasználói műveleteket, eszközöket és funkciókat ábrázolja:
Termék | Leírás |
---|---|
|
Az adatfolyam létrehozója táblák gyűjteményét fejleszti ki egy Power BI-adatfolyamon belül. Az újrafelhasználásra szánt adatfolyamok esetében gyakori (de nem kötelező), hogy a létrehozó egy olyan központosított csapathoz tartozjon, amely a szervezet határain (például az informatikai részlegen, a vállalati BI-n vagy a Kiválósági központon) keresztül támogatja a felhasználókat. |
|
Az adatfolyam egy vagy több adatforrásból származó adatokhoz csatlakozik. |
|
Egyes adatforrásokhoz helyszíni adatátjáróra vagy VNet-átjáróra lehet szükség az adatfrissítéshez, például a magánhálózaton belül találhatóakhoz. Ezek az átjárók az adatfolyamok power query online, a Power Query webes verziójának létrehozásához és az adatfolyam frissítéséhez is használhatók. |
|
Az adatfolyamok a Power Query Online használatával lettek kifejlesztve. A Power Query Online jól ismert Power Query felülete egyszerűvé teszi a Power BI Desktopról való áttérést. |
|
Az adatfolyam egy olyan munkaterületen található elemként lesz mentve, amely az adatfolyamok tárolására és védelmére szolgál. Az adatfolyam frissítési ütemezése szükséges az adatok naprakészen tartásához (a forgatókönyv-diagramon nem látható). |
|
Az adatfolyamot a tartalomkészítők és más szemantikai modellek is felhasználhatják adatforrásként, amelyek különböző munkaterületeken lehetnek. |
|
A szemantikai modell létrehozója egy új adatmodellt fejleszt a Power BI Desktop használatával. A szemantikai modell létrehozója a Power Query teljes képességeit használhatja a Power BI Desktopban. Opcionálisan más lekérdezési lépéseket is alkalmazhatnak az adatfolyam-adatok további átalakításához vagy az adatfolyam kimenetének egyesítése érdekében. |
|
Ha elkészült, a szemantikai modell létrehozója közzéteszi az adatmodellt tartalmazó Power BI Desktop-fájlt (.pbix) a Power BI szolgáltatás. A szemantikai modell frissítését az adatfolyamtól elkülönítve kezeli a rendszer (a forgatókönyv-diagramon nem látható). |
|
Más önkiszolgáló szemantikai modellek létrehozói az adatfolyam adatforrásként való használatával új adatmodelleket hozhatnak létre a Power BI Desktopban. |
|
A Felügyeleti portálon a Power BI-rendszergazdák Azure-kapcsolatokat állíthatnak be az adatfolyam-adatok Azure Data Lake Storage Gen2 -fiókjukban (ADLS Gen2) való tárolásához. A beállítások közé tartozik a bérlőszintű tárfiók hozzárendelése és a munkaterületszintű tárolási engedélyek engedélyezése. |
|
A Power BI-rendszergazdák a felügyeleti portálon kezelhetik a beállításokat. |
|
Alapértelmezés szerint az adatfolyamok az Power BI szolgáltatás által felügyelt belső tároló használatával tárolják az adatokat. Az adatfolyam által előállított adatok tárolhatók a szervezet ADLS Gen2-fiókjában . Ezt a tárolótípust néha saját data lake-nek is nevezik. Az adatfolyam-adatok data lake-ben való tárolásának egyik előnye, hogy más BI-eszközök is elérhetik és felhasználhatják. |
|
Az adatfolyam-adatok az ADLS Gen2-ben egy Power BI-specifikus tárolóban, más néven fájlrendszerben tárolódnak. Ebben a tárolóban minden munkaterülethez tartozik egy mappa. Minden adatfolyamhoz és minden táblához létrejön egy almappá. A Power BI minden egyes adatfolyam-adatfrissítéskor pillanatképet hoz létre. A pillanatképek önleíróak, metaadatokból és adatfájlokból állnak. |
|
Az Azure-rendszergazdák kezelik a szervezet ADLS Gen2-fiókjához tartozó engedélyeket. |
|
A Power BI-rendszergazdák felügyelik és figyelik a Power BI szolgáltatás tevékenységeit. |
Tipp.
Javasoljuk, hogy tekintse át a speciális adat-előkészítési használati forgatókönyvet is. Az ebben a forgatókönyvben bevezetett fogalmakra épül.
Kulcsfontosságú pontok
Az alábbiakban néhány fontos szempontot emelünk ki az önkiszolgáló adat-előkészítési forgatókönyvről.
Adatfolyamok
Az adatfolyam táblák (más néven entitások) gyűjteményéből áll. Az adatfolyamok létrehozásához szükséges összes munka a Power Query Online-ban történik. Adatfolyamokat több termékben is létrehozhat, például a Power Appsben, a Dynamics 365 Customer Insightsban és a Power BI-ban.
Feljegyzés
A Power BI szolgáltatás személyes munkaterületén nem hozhat létre adatfolyamokat.
Szemantikai modellek létrehozóinak támogatása
A forgatókönyv-diagram egy Power BI-adatfolyamot ábrázol, amely előkészített adatokat biztosít más önkiszolgáló szemantikai modellek létrehozóinak.
Feljegyzés
A szemantikai modell adatforrásként használja az adatfolyamot. A jelentések nem tudnak közvetlenül csatlakozni egy adatfolyamhoz.
A Power BI-adatfolyamok használatának néhány előnye:
- A szemantikai modellek létrehozói ugyanazt a jól ismert Power Query-felületet használják, amely a Power BI Desktopban található.
- Az adatfolyamok által definiált adat-előkészítési és adatátalakítási logika sokszor újra felhasználható, mert központosított.
- Az adatfolyam adatelőkészítési logikájának módosításakor előfordulhat, hogy nem szükséges frissíteni a függő adatmodelleket. Az oszlopok eltávolításához vagy átnevezéséhez, illetve az oszlop adattípusainak módosításához szükség lesz a függő adatmodellek frissítésére.
- Az előre elkészített adatok könnyen elérhetővé tehetők a Power BI szemantikai modellkészítői számára. Az újrafelhasználás különösen hasznos a gyakran használt táblákhoz – különösen a dimenziótáblákhoz, például a dátumhoz, az ügyfélhez és a termékhez.
- A szemantikai modellek létrehozói által igényelt munkamennyiség csökken, mivel az adat-előkészítési munka leválasztva lett az adatmodellezési munkáról.
- Kevesebb szemantikai modellkészítőnek kell közvetlen hozzáférést biztosítani a forrásrendszerekhez. A forrásrendszerek lekérdezése összetett lehet, és speciális hozzáférési engedélyeket igényelhet.
- A forrásrendszereken végrehajtott frissítések száma csökken, mert a szemantikai modell frissítései adatfolyamokhoz csatlakoznak, és nem azokhoz a forrásrendszerekhez, amelyekből az adatfolyamok adatokat nyernek ki.
- Az adatfolyam-adatok egy pillanatképet jelölnek időben, és számos szemantikai modell használata esetén elősegítik a konzisztenciát.
- Az adatelőkészítési logika adatfolyamokra való leválasztása javíthatja a szemantikai modell frissítésének sikerességét. Ha egy adatfolyam frissítése sikertelen, a szemantikai modellek az utolsó sikeres adatfolyam-frissítéssel frissülnek.
Tipp.
Adatfolyamtáblák létrehozása csillagséma-tervezési alapelvek alkalmazásával. A csillagséma-kialakítás kiválóan alkalmas Power BI szemantikai modellek létrehozására. Emellett finomítsa az adatfolyam kimenetét, hogy felhasználóbarát neveket alkalmazzon, és meghatározott adattípusokat használjon. Ezek a technikák elősegítik a függő szemantikai modellek konzisztenciáját, és segítenek csökkenteni a szemantikai modellek létrehozóinak szükséges munka mennyiségét.
Szemantikai modellkészítő rugalmassága
Amikor egy szemantikai modell létrehozója csatlakozik egy adatfolyamhoz a Power BI Desktopban, a létrehozó nem korlátozódik a pontos adatfolyam-kimenet használatára. A Power Query teljes funkcionalitása továbbra is elérhető számukra. Ez a funkció akkor hasznos, ha további adat-előkészítési munkára van szükség, vagy ha az adatok további átalakítást igényelnek.
Adatfolyamok speciális funkciói
Számos olyan tervezési technika, minta és ajánlott eljárás létezik az adatfolyamokhoz, amelyek az önkiszolgálótól a nagyvállalati használatra készig tarthatnak. Az olyan munkaterületek adatfolyamai, amelyek licencmódja felhasználónkénti Premium, prémium szintű kapacitás vagy Háló kapacitásra van beállítva, speciális funkciókra is használhatók.
Fontos
Ez a cikk a Power BI Premiumra vagy annak kapacitás-előfizetésére (P termékváltozatokra) hivatkozik. A Microsoft jelenleg összevonja a vásárlási lehetőségeket, és visszavonul a Power BI Premium kapacitásonkénti termékváltozataitól. Az új és a meglévő ügyfeleknek érdemes megfontolni a Fabric-kapacitás-előfizetések (F SKU-k) megvásárlását.
További információ: Fontos frissítés a Power BI Premium licenceléséhez és a Power BI Premiumhoz – gyakori kérdések.
Feljegyzés
Az egyik speciális funkció az adatfolyamok növekményes frissítése. Bár a szemantikai modellek növekményes frissítése Power BI Pro-funkció, az adatfolyamok növekményes frissítése prémium szintű szolgáltatás.
Az adatfolyamok speciális funkcióival kapcsolatos további információkért tekintse meg a speciális adat-előkészítési használati forgatókönyvet.
Adatfolyam és szemantikai modell frissítése
Ahogy korábban említettük, az adatfolyamok a szemantikai modellek adatforrásai. A legtöbb esetben több adatfrissítési ütemezésről van szó: egy az adatfolyamhoz és egy minden szemantikai modellhez. Azt is megteheti, hogy a DirectQueryt a szemantikai modelltől az adatfolyamig használja, amely egy Prémium funkció (a forgatókönyv-diagramon nem látható).
Azure Data Lake Storage Gen2
A Microsoft Azure-ban az ADLS Gen2-fiók egy adott típusú Azure Storage-fiók, amely engedélyezve van a hierarchikus névtérrel . Az ADLS Gen2 teljesítménybeli, felügyeleti és biztonsági előnyökkel rendelkezik az elemzési számítási feladatok üzemeltetéséhez. A Power BI-adatfolyamok alapértelmezés szerint belső tárolót használnak, amely egy beépített data lake-fiók, amelyet a Power BI szolgáltatás kezel. A szervezetek igény szerint saját data lake-t is hozhatnak, ha a szervezet ADLS Gen2-fiókjához csatlakoznak.
A szervezet Data Lake-fiókjának használatának néhány előnye:
- A Power BI-adatfolyamok által tárolt adatokat (opcionálisan) más felhasználók vagy folyamatok is elérhetik a data lake-ből. Ez akkor hasznos, ha az adatfolyamok újrafelhasználása a Power BI-on kívül történik. Az adatokat például az Azure Data Factory érheti el.
- A data lake-ben lévő adatokat (opcionálisan) más eszközök vagy rendszerek is kezelhetik. Ebben az esetben a Power BI felhasználhatja az adatokat a kezelés helyett (a forgatókönyv-diagramon nem látható).
Bérlőszintű tárolás
A Felügyeleti portál Azure-kapcsolatok szakasza tartalmaz egy ADLS Gen2-fiókhoz való kapcsolat konfigurálására vonatkozó beállítást. A beállítás konfigurálásával saját data lake-t hozhat létre. A beállítás után beállíthatja, hogy a munkaterületek ezt a data lake-fiókot használják.
Fontos
Az Azure-kapcsolatok beállítása nem jelenti azt, hogy a Power BI-bérlő összes adatfolyama alapértelmezés szerint ebben a fiókban van tárolva. Ahhoz, hogy explicit tárfiókot használhasson (a belső tároló helyett), minden munkaterületet külön kell csatlakoztatni.
Kritikus fontosságú, hogy a munkaterület Azure-kapcsolatait a munkaterületen lévő adatfolyamok létrehozása előtt állítsa be. Ugyanez az Azure Storage-fiók használatos a Power BI szemantikai modell biztonsági mentéséhez.
Munkaterületszintű tárolás
A Power BI-rendszergazdák konfigurálhatnak egy beállítást a munkaterületszintű tárolási engedélyek engedélyezéséhez (a Felügyeleti portál Azure-kapcsolatok szakaszában). Ha engedélyezve van, ez a beállítás lehetővé teszi a munkaterület-rendszergazdák számára, hogy a bérlői szinten definiált tárfióktól eltérő tárfiókot használjanak. Ennek a beállításnak az engedélyezése különösen hasznos a decentralizált üzleti egységek számára, akik saját data lake-t kezelnek az Azure-ban.
Feljegyzés
A felügyeleti portál munkaterületszintű tárolási engedélye a Power BI-bérlő összes munkaterületére érvényes.
Common Data Model formátum
Az ADLS Gen2-fiók adatai a Common Data Model (CDM) struktúrában találhatók. A CDM-struktúra egy metaadat-formátum, amely meghatározza az önleíró séma és az adatok tárolási módját. A CDM-struktúra lehetővé teszi a szemantikai konzisztenciát olyan formátumban, amely szabványosított adatok megosztására számos alkalmazás között (a forgatókönyv-diagramon nem látható).
Közzététel külön munkaterületeken
Az adatfolyamok olyan munkaterületen való közzétételének számos előnye van, amelyek eltérnek a függő szemantikai modellek tárolási helyétől. Az egyik előny az egyértelműség, hogy ki felelős a tartalomtípusok kezeléséért (ha különböző személyek kezelik a különböző feladatokat). Egy másik előnye, hogy az egyes tartalomtípusokhoz adott munkaterületi engedélyek rendelhetők hozzá.
Feljegyzés
A Power BI szolgáltatás személyes munkaterületén nem hozhat létre adatfolyamokat.
A speciális adatelőkészítési használati forgatókönyv leírja, hogyan állíthat be több munkaterületet, hogy nagyobb rugalmasságot biztosítson a nagyvállalati szintű önkiszolgáló létrehozók támogatása során.
Átjáró beállítása
Általában helyszíni adatátjáróra van szükség a magánhálózaton vagy virtuális hálózaton belül található adatforrásokhoz való csatlakozáshoz.
Adatátjáróra akkor van szükség, ha:
- Adatfolyam létrehozása a Power Query Online-ban, amely privát szervezeti adatokhoz csatlakozik.
- Privát szervezeti adatokhoz csatlakozó adatfolyam frissítése.
Tipp.
Az adatfolyamok központi adatátjárót igényelnek standard módban. A személyes módban lévő átjárók nem támogatottak adatfolyamok használatakor.
Rendszerfelügyelet
A tevékenységnapló rögzíti a Power BI szolgáltatás előforduló felhasználói tevékenységeket. A Power BI-rendszergazdák az összegyűjtött tevékenységnapló-adatokkal naplózást végezhetnek, hogy könnyebben megértsék a használati mintákat és a bevezetést. A tevékenységnapló hasznos az irányítási erőfeszítések, a biztonsági auditok és a megfelelőségi követelmények támogatásához is. Önkiszolgáló adat-előkészítési forgatókönyv esetén különösen hasznos az adatfolyamok használatának nyomon követése.
Kapcsolódó tartalom
A sorozat következő cikkében megismerheti a speciális adat-előkészítési használati forgatókönyvet.