Megosztás a következőn keresztül:


Power BI használati forgatókönyvek: Önkiszolgáló adatok előkészítése

Feljegyzés

Ez a cikk a Power BI implementációtervezési cikksorozatának része. A sorozat a Power BI-élmény Microsoft Fabricen belüli implementálásának megtervezésére összpontosít. Tekintse meg a sorozat bemutatóját.

Az adat-előkészítés (más néven ETL, amely a kinyerés, átalakítás és betöltés rövidítése) gyakran jelentős mennyiségű munkát igényel a forrásadatok minőségétől és szerkezetétől függően. Az önkiszolgáló adat-előkészítés használati forgatókönyve az adatelőkészítési tevékenységek üzleti elemzők általi újrafelhasználására összpontosít. Ezt a célt úgy éri el, hogy az adat-előkészítési munkát áthelyezi a Power Queryből (az egyes Power BI Desktop-fájlokon belül) a Power Query Online-ba (Power BI-adatfolyam használatával). A logika központosítása segít elérni az igazság egyetlen forrását, és csökkenti a többi tartalomkészítő által igényelt erőfeszítést.

Az adatfolyamok a Power Query Online használatával hozhatók létre a Power BI szolgáltatás, a Power Apps vagy a Dynamics 365 Customer Insights segítségével. A Power BI-ban létrehozott adatfolyamokat elemzési adatfolyamnak nevezzük. A Power Appsben létrehozott adatfolyamok kétféle típusúak lehetnek: standard vagy elemzési. Ez a forgatókönyv csak a Power BI szolgáltatás belül létrehozott és felügyelt Power BI-adatfolyamok használatát ismerteti.

Feljegyzés

Az önkiszolgáló adat-előkészítési forgatókönyv az önkiszolgáló BI-forgatókönyvek egyike. Az önkiszolgáló forgatókönyvek teljes listáját a Power BI használati forgatókönyveit ismertető cikkben találja.

A rövidség kedvéért a jelen cikk nem foglalkozik a tartalom-együttműködési és kézbesítési forgatókönyvek témakörében ismertetett néhány szempontmal. A teljes lefedettség érdekében először olvassa el ezeket a cikkeket.

Forgatókönyv-diagram

Az alábbi ábra az önkiszolgáló adatok előkészítését támogató leggyakoribb felhasználói műveletek és Power BI-összetevők magas szintű áttekintését mutatja be. Az elsődleges cél egy adatfolyam létrehozása a Power Query Online-ban, amely több szemantikai modell adatforrásává válik. A cél az, hogy sok szemantikai modell kihasználja az adatfolyam által egyszer elvégzett adatelőkészítést.

Az ábrán az önkiszolgáló adat-előkészítés látható, amely az adattisztítási és átalakítási munka központosítására szolgáló adatfolyamokról szól. A diagram elemeit az alábbi táblázat ismerteti.

Tipp.

Javasoljuk, hogy töltse le a forgatókönyv-diagramot , ha be szeretné ágyazni a bemutatóba, a dokumentációba vagy a blogbejegyzésbe, vagy nyomtassa ki fali plakátként. Mivel ez egy méretezhető vektorgrafika (SVG) kép, minőségromlás nélkül skálázhatja fel vagy le.

A forgatókönyv-diagram a következő felhasználói műveleteket, eszközöket és funkciókat ábrázolja:

Termék Leírás
1. elem. Az adatfolyam létrehozója táblák gyűjteményét fejleszti ki egy Power BI-adatfolyamon belül. Az újrafelhasználásra szánt adatfolyamok esetében gyakori (de nem kötelező), hogy a létrehozó egy olyan központosított csapathoz tartozjon, amely a szervezet határain (például az informatikai részlegen, a vállalati BI-n vagy a Kiválósági központon) keresztül támogatja a felhasználókat.
2. elem. Az adatfolyam egy vagy több adatforrásból származó adatokhoz csatlakozik.
3. elem. Egyes adatforrásokhoz helyszíni adatátjáróra vagy VNet-átjáróra lehet szükség az adatfrissítéshez, például a magánhálózaton belül találhatóakhoz. Ezek az átjárók az adatfolyamok power query online, a Power Query webes verziójának létrehozásához és az adatfolyam frissítéséhez is használhatók.
4. elem. Az adatfolyamok a Power Query Online használatával lettek kifejlesztve. A Power Query Online jól ismert Power Query felülete egyszerűvé teszi a Power BI Desktopról való áttérést.
5. elem. Az adatfolyam egy olyan munkaterületen található elemként lesz mentve, amely az adatfolyamok tárolására és védelmére szolgál. Az adatfolyam frissítési ütemezése szükséges az adatok naprakészen tartásához (a forgatókönyv-diagramon nem látható).
6. elem. Az adatfolyamot a tartalomkészítők és más szemantikai modellek is felhasználhatják adatforrásként, amelyek különböző munkaterületeken lehetnek.
7. elem. A szemantikai modell létrehozója egy új adatmodellt fejleszt a Power BI Desktop használatával. A szemantikai modell létrehozója a Power Query teljes képességeit használhatja a Power BI Desktopban. Opcionálisan más lekérdezési lépéseket is alkalmazhatnak az adatfolyam-adatok további átalakításához vagy az adatfolyam kimenetének egyesítése érdekében.
8. elem. Ha elkészült, a szemantikai modell létrehozója közzéteszi az adatmodellt tartalmazó Power BI Desktop-fájlt (.pbix) a Power BI szolgáltatás. A szemantikai modell frissítését az adatfolyamtól elkülönítve kezeli a rendszer (a forgatókönyv-diagramon nem látható).
9. elem. Más önkiszolgáló szemantikai modellek létrehozói az adatfolyam adatforrásként való használatával új adatmodelleket hozhatnak létre a Power BI Desktopban.
10. tétel. A Felügyeleti portálon a Power BI-rendszergazdák Azure-kapcsolatokat állíthatnak be az adatfolyam-adatok Azure Data Lake Storage Gen2 -fiókjukban (ADLS Gen2) való tárolásához. A beállítások közé tartozik a bérlőszintű tárfiók hozzárendelése és a munkaterületszintű tárolási engedélyek engedélyezése.
11. tétel. A Power BI-rendszergazdák a felügyeleti portálon kezelhetik a beállításokat.
12. elem. Alapértelmezés szerint az adatfolyamok az Power BI szolgáltatás által felügyelt belső tároló használatával tárolják az adatokat. Az adatfolyam által előállított adatok tárolhatók a szervezet ADLS Gen2-fiókjában . Ezt a tárolótípust néha saját data lake-nek is nevezik. Az adatfolyam-adatok data lake-ben való tárolásának egyik előnye, hogy más BI-eszközök is elérhetik és felhasználhatják.
13. tétel. Az adatfolyam-adatok az ADLS Gen2-ben egy Power BI-specifikus tárolóban, más néven fájlrendszerben tárolódnak. Ebben a tárolóban minden munkaterülethez tartozik egy mappa. Minden adatfolyamhoz és minden táblához létrejön egy almappá. A Power BI minden egyes adatfolyam-adatfrissítéskor pillanatképet hoz létre. A pillanatképek önleíróak, metaadatokból és adatfájlokból állnak.
14. tétel. Az Azure-rendszergazdák kezelik a szervezet ADLS Gen2-fiókjához tartozó engedélyeket.
15. tétel. A Power BI-rendszergazdák felügyelik és figyelik a Power BI szolgáltatás tevékenységeit.

Tipp.

Javasoljuk, hogy tekintse át a speciális adat-előkészítési használati forgatókönyvet is. Az ebben a forgatókönyvben bevezetett fogalmakra épül.

Kulcsfontosságú pontok

Az alábbiakban néhány fontos szempontot emelünk ki az önkiszolgáló adat-előkészítési forgatókönyvről.

Adatfolyamok

Az adatfolyam táblák (más néven entitások) gyűjteményéből áll. Az adatfolyamok létrehozásához szükséges összes munka a Power Query Online-ban történik. Adatfolyamokat több termékben is létrehozhat, például a Power Appsben, a Dynamics 365 Customer Insightsban és a Power BI-ban.

Feljegyzés

A Power BI szolgáltatás személyes munkaterületén nem hozhat létre adatfolyamokat.

Szemantikai modellek létrehozóinak támogatása

A forgatókönyv-diagram egy Power BI-adatfolyamot ábrázol, amely előkészített adatokat biztosít más önkiszolgáló szemantikai modellek létrehozóinak.

Feljegyzés

A szemantikai modell adatforrásként használja az adatfolyamot. A jelentések nem tudnak közvetlenül csatlakozni egy adatfolyamhoz.

A Power BI-adatfolyamok használatának néhány előnye:

  • A szemantikai modellek létrehozói ugyanazt a jól ismert Power Query-felületet használják, amely a Power BI Desktopban található.
  • Az adatfolyamok által definiált adat-előkészítési és adatátalakítási logika sokszor újra felhasználható, mert központosított.
  • Az adatfolyam adatelőkészítési logikájának módosításakor előfordulhat, hogy nem szükséges frissíteni a függő adatmodelleket. Az oszlopok eltávolításához vagy átnevezéséhez, illetve az oszlop adattípusainak módosításához szükség lesz a függő adatmodellek frissítésére.
  • Az előre elkészített adatok könnyen elérhetővé tehetők a Power BI szemantikai modellkészítői számára. Az újrafelhasználás különösen hasznos a gyakran használt táblákhoz – különösen a dimenziótáblákhoz, például a dátumhoz, az ügyfélhez és a termékhez.
  • A szemantikai modellek létrehozói által igényelt munkamennyiség csökken, mivel az adat-előkészítési munka leválasztva lett az adatmodellezési munkáról.
  • Kevesebb szemantikai modellkészítőnek kell közvetlen hozzáférést biztosítani a forrásrendszerekhez. A forrásrendszerek lekérdezése összetett lehet, és speciális hozzáférési engedélyeket igényelhet.
  • A forrásrendszereken végrehajtott frissítések száma csökken, mert a szemantikai modell frissítései adatfolyamokhoz csatlakoznak, és nem azokhoz a forrásrendszerekhez, amelyekből az adatfolyamok adatokat nyernek ki.
  • Az adatfolyam-adatok egy pillanatképet jelölnek időben, és számos szemantikai modell használata esetén elősegítik a konzisztenciát.
  • Az adatelőkészítési logika adatfolyamokra való leválasztása javíthatja a szemantikai modell frissítésének sikerességét. Ha egy adatfolyam frissítése sikertelen, a szemantikai modellek az utolsó sikeres adatfolyam-frissítéssel frissülnek.

Tipp.

Adatfolyamtáblák létrehozása csillagséma-tervezési alapelvek alkalmazásával. A csillagséma-kialakítás kiválóan alkalmas Power BI szemantikai modellek létrehozására. Emellett finomítsa az adatfolyam kimenetét, hogy felhasználóbarát neveket alkalmazzon, és meghatározott adattípusokat használjon. Ezek a technikák elősegítik a függő szemantikai modellek konzisztenciáját, és segítenek csökkenteni a szemantikai modellek létrehozóinak szükséges munka mennyiségét.

Szemantikai modellkészítő rugalmassága

Amikor egy szemantikai modell létrehozója csatlakozik egy adatfolyamhoz a Power BI Desktopban, a létrehozó nem korlátozódik a pontos adatfolyam-kimenet használatára. A Power Query teljes funkcionalitása továbbra is elérhető számukra. Ez a funkció akkor hasznos, ha további adat-előkészítési munkára van szükség, vagy ha az adatok további átalakítást igényelnek.

Adatfolyamok speciális funkciói

Számos olyan tervezési technika, minta és ajánlott eljárás létezik az adatfolyamokhoz, amelyek az önkiszolgálótól a nagyvállalati használatra készig tarthatnak. Az olyan munkaterületek adatfolyamai, amelyek licencmódja felhasználónkénti Premium, prémium szintű kapacitás vagy Háló kapacitásra van beállítva, speciális funkciókra is használhatók.

Fontos

Ez a cikk a Power BI Premiumra vagy annak kapacitás-előfizetésére (P termékváltozatokra) hivatkozik. A Microsoft jelenleg összevonja a vásárlási lehetőségeket, és visszavonul a Power BI Premium kapacitásonkénti termékváltozataitól. Az új és a meglévő ügyfeleknek érdemes megfontolni a Fabric-kapacitás-előfizetések (F SKU-k) megvásárlását.

További információ: Fontos frissítés a Power BI Premium licenceléséhez és a Power BI Premiumhoz – gyakori kérdések.

Feljegyzés

Az egyik speciális funkció az adatfolyamok növekményes frissítése. Bár a szemantikai modellek növekményes frissítése Power BI Pro-funkció, az adatfolyamok növekményes frissítése prémium szintű szolgáltatás.

Az adatfolyamok speciális funkcióival kapcsolatos további információkért tekintse meg a speciális adat-előkészítési használati forgatókönyvet.

Adatfolyam és szemantikai modell frissítése

Ahogy korábban említettük, az adatfolyamok a szemantikai modellek adatforrásai. A legtöbb esetben több adatfrissítési ütemezésről van szó: egy az adatfolyamhoz és egy minden szemantikai modellhez. Azt is megteheti, hogy a DirectQueryt a szemantikai modelltől az adatfolyamig használja, amely egy Prémium funkció (a forgatókönyv-diagramon nem látható).

Azure Data Lake Storage Gen2

A Microsoft Azure-ban az ADLS Gen2-fiók egy adott típusú Azure Storage-fiók, amely engedélyezve van a hierarchikus névtérrel . Az ADLS Gen2 teljesítménybeli, felügyeleti és biztonsági előnyökkel rendelkezik az elemzési számítási feladatok üzemeltetéséhez. A Power BI-adatfolyamok alapértelmezés szerint belső tárolót használnak, amely egy beépített data lake-fiók, amelyet a Power BI szolgáltatás kezel. A szervezetek igény szerint saját data lake-t is hozhatnak, ha a szervezet ADLS Gen2-fiókjához csatlakoznak.

A szervezet Data Lake-fiókjának használatának néhány előnye:

  • A Power BI-adatfolyamok által tárolt adatokat (opcionálisan) más felhasználók vagy folyamatok is elérhetik a data lake-ből. Ez akkor hasznos, ha az adatfolyamok újrafelhasználása a Power BI-on kívül történik. Az adatokat például az Azure Data Factory érheti el.
  • A data lake-ben lévő adatokat (opcionálisan) más eszközök vagy rendszerek is kezelhetik. Ebben az esetben a Power BI felhasználhatja az adatokat a kezelés helyett (a forgatókönyv-diagramon nem látható).

Bérlőszintű tárolás

A Felügyeleti portál Azure-kapcsolatok szakasza tartalmaz egy ADLS Gen2-fiókhoz való kapcsolat konfigurálására vonatkozó beállítást. A beállítás konfigurálásával saját data lake-t hozhat létre. A beállítás után beállíthatja, hogy a munkaterületek ezt a data lake-fiókot használják.

Fontos

Az Azure-kapcsolatok beállítása nem jelenti azt, hogy a Power BI-bérlő összes adatfolyama alapértelmezés szerint ebben a fiókban van tárolva. Ahhoz, hogy explicit tárfiókot használhasson (a belső tároló helyett), minden munkaterületet külön kell csatlakoztatni.

Kritikus fontosságú, hogy a munkaterület Azure-kapcsolatait a munkaterületen lévő adatfolyamok létrehozása előtt állítsa be. Ugyanez az Azure Storage-fiók használatos a Power BI szemantikai modell biztonsági mentéséhez.

Munkaterületszintű tárolás

A Power BI-rendszergazdák konfigurálhatnak egy beállítást a munkaterületszintű tárolási engedélyek engedélyezéséhez (a Felügyeleti portál Azure-kapcsolatok szakaszában). Ha engedélyezve van, ez a beállítás lehetővé teszi a munkaterület-rendszergazdák számára, hogy a bérlői szinten definiált tárfióktól eltérő tárfiókot használjanak. Ennek a beállításnak az engedélyezése különösen hasznos a decentralizált üzleti egységek számára, akik saját data lake-t kezelnek az Azure-ban.

Feljegyzés

A felügyeleti portál munkaterületszintű tárolási engedélye a Power BI-bérlő összes munkaterületére érvényes.

Common Data Model formátum

Az ADLS Gen2-fiók adatai a Common Data Model (CDM) struktúrában találhatók. A CDM-struktúra egy metaadat-formátum, amely meghatározza az önleíró séma és az adatok tárolási módját. A CDM-struktúra lehetővé teszi a szemantikai konzisztenciát olyan formátumban, amely szabványosított adatok megosztására számos alkalmazás között (a forgatókönyv-diagramon nem látható).

Közzététel külön munkaterületeken

Az adatfolyamok olyan munkaterületen való közzétételének számos előnye van, amelyek eltérnek a függő szemantikai modellek tárolási helyétől. Az egyik előny az egyértelműség, hogy ki felelős a tartalomtípusok kezeléséért (ha különböző személyek kezelik a különböző feladatokat). Egy másik előnye, hogy az egyes tartalomtípusokhoz adott munkaterületi engedélyek rendelhetők hozzá.

Feljegyzés

A Power BI szolgáltatás személyes munkaterületén nem hozhat létre adatfolyamokat.

A speciális adatelőkészítési használati forgatókönyv leírja, hogyan állíthat be több munkaterületet, hogy nagyobb rugalmasságot biztosítson a nagyvállalati szintű önkiszolgáló létrehozók támogatása során.

Átjáró beállítása

Általában helyszíni adatátjáróra van szükség a magánhálózaton vagy virtuális hálózaton belül található adatforrásokhoz való csatlakozáshoz.

Adatátjáróra akkor van szükség, ha:

  • Adatfolyam létrehozása a Power Query Online-ban, amely privát szervezeti adatokhoz csatlakozik.
  • Privát szervezeti adatokhoz csatlakozó adatfolyam frissítése.

Tipp.

Az adatfolyamok központi adatátjárót igényelnek standard módban. A személyes módban lévő átjárók nem támogatottak adatfolyamok használatakor.

Rendszerfelügyelet

A tevékenységnapló rögzíti a Power BI szolgáltatás előforduló felhasználói tevékenységeket. A Power BI-rendszergazdák az összegyűjtött tevékenységnapló-adatokkal naplózást végezhetnek, hogy könnyebben megértsék a használati mintákat és a bevezetést. A tevékenységnapló hasznos az irányítási erőfeszítések, a biztonsági auditok és a megfelelőségi követelmények támogatásához is. Önkiszolgáló adat-előkészítési forgatókönyv esetén különösen hasznos az adatfolyamok használatának nyomon követése.

A sorozat következő cikkében megismerheti a speciális adat-előkészítési használati forgatókönyvet.