Sdílet prostřednictvím


Konfigurace úložiště toku dat pro použití Azure Data Lake Gen2

Data používaná s Power BI jsou ve výchozím nastavení uložená v interním úložišti poskytovaném Power BI. Díky integraci toků dat a Azure Data Lake Storage Gen2 (ADLS Gen2) můžete toky dat ukládat do účtu Azure Data Lake Storage Gen2 ve vaší organizaci. Tato funkce v podstatě umožňuje použít vlastní úložiště v tocích dat Power BI a navázat připojení na úrovni tenanta nebo pracovního prostoru.

Důvody použití pracovního prostoru ADLS Gen2 nebo připojení tenanta

Po připojení toku dat Power BI nakonfiguruje a uloží odkaz, abyste teď mohli číst a zapisovat data do vlastního ADLS Gen2. Power BI ukládá data ve formátu CDM (Common Data Model), který zachycuje metadata o vašich datech kromě skutečných dat generovaných samotným tokem dat. Tato funkce nabízí mnoho výkonných funkcí a umožňuje vašim datům a přidruženým metadatům ve formátu CDM nyní poskytovat rozšiřitelnost, automatizaci, monitorování a scénáře zálohování. Když tato data zpřístupníte a široce zpřístupníte ve svém vlastním prostředí, umožní vám demokratizovat přehledy a data vytvořená ve vaší organizaci. Nabízí také možnost vytvářet další řešení s širokou škálou složitosti. Vaše řešení můžou být vlastní aplikace a řešení pracující s CDM v Power Platform, Azure a řešení dostupná prostřednictvím ekosystémů nezávislých dodavatelů softwaru (ISV). Nebo můžete vytvořit aplikaci pro čtení CSV. Vaši datoví inženýři, datoví vědci a analytici teď můžou pracovat, používat a opakovaně používat společnou sadu dat kurátorovaných v ADLS Gen2.

Existují dva způsoby konfigurace úložiště ADLS Gen2, které se mají použít: můžete použít účet ADLS Gen2 přiřazený tenantem nebo si můžete přinést vlastní úložiště ADLS Gen2 na úrovni pracovního prostoru.

Požadavky

  • Pokud chcete použít vlastní účet ADLS Gen2, musíte mít oprávnění vlastníka ve vrstvě účtu úložiště. Oprávnění na úrovni skupiny prostředků nebo předplatného nebudou fungovat. Pokud jste správce, musíte si ještě přiřadit oprávnění Vlastník. V současné době nepodporujeme účty úložiště ADLS Gen2 za bránou firewallu.

  • Účet úložiště musí být vytvořen s povoleným hierarchickým oborem názvů (HNS).

  • Účet úložiště musí být vytvořen ve stejném klientovi Microsoft Entra jako klient Power BI.

  • Uživatel musí mít roli Majitel dat úložiště blob, roli Čtenář dat úložiště blob a roli Vlastník na úrovni účtu úložiště (obor by měl být tento prostředek, nikoli zděděný). Synchronizace všech použitých změn rolí může trvat několik minut a před dokončením následujících kroků ve službě Power BI se musí synchronizovat.

  • V případě pracovních prostorů Pro by měl být účet úložiště ve stejné oblasti jako domovská oblast Fabric. U prémiových pracovních prostor by měl být účet úložiště ve stejném regionu jako kapacita Premium.

  • K zabezpečení koncových bodů se vyžaduje protokol TLS (Transport Layer Security) verze 1.2 (nebo vyšší). Webové prohlížeče a další klientské aplikace, které používají verze TLS starší než TLS 1.2, se nebudou moct připojit.

  • Připojení datového toku k ADLS Gen 2 za multifaktorovým ověřováním (MFA) není podporováno.

  • Nakonec se můžete připojit k libovolné službě ADLS Gen2 z portálu pro správu, ale pokud se připojujete přímo k pracovnímu prostoru, musíte nejprve před připojením zajistit, aby v pracovním prostoru nebyly žádné toky dat.

Poznámka:

Používání vlastního úložiště (Azure Data Lake Gen 2) není ve službě Power BI dostupné pro zákazníky americké vlády v rámci GCC. Další informace o tom, které funkce jsou dostupné a které ne, najdete v tématu Dostupnost funkcí Power BI pro zákazníky státní správy USA.

Následující tabulka popisuje oprávnění pro ADLS a Power BI vyžadovaná pro ADLS Gen2 a Power BI:

Činnost Oprávnění ADLS Minimální oprávnění Power BI
Připojení ADLS Gen2 k tenantovi Power BI Vlastník Správce Power BI
Připojení ADLS Gen2 k pracovnímu prostoru Vlastník Správce pracovního prostoru
Vytvoření toků dat Power BI, které se zapisují zpět do připojeného účtu ADLS Není relevantní Přispěvatel pracovního prostoru
Využití toku dat Power BI Není relevantní Prohlížeč pracovních prostorů

Připojení k Azure Data Lake Gen2 na úrovni pracovního prostoru

Přejděte do pracovního prostoru, který neobsahuje žádné toky dat. Vyberte nastavení pracovního prostoru. Zvolte kartu Připojení Azure a pak vyberte oddíl Úložiště .

Snímek obrazovky s podoknem Nastavení pracovního prostoru na kartě Připojení Azure

Možnost Použít výchozí připojení Azure se zobrazí, pokud už správce nakonfiguroval účet ADLS Gen2 přiřazený tenantem. Máte dvě možnosti:

  • Pomocí tenanta nakonfigurovaného účtu ADLS Gen2 vyberte pole s názvem Použít výchozí připojení Azure nebo
  • Výběrem možnosti Připojit k Azure přejděte na nový účet Azure Storage.

Když vyberete Připojit k Azure, Power BI načte seznam předplatných Azure, ke kterým máte přístup. Vyplňte rozevírací seznamy. Pak vyberte platné předplatné Azure, skupinu prostředků a účet úložiště, který má povolenou možnost hierarchického oboru názvů, což je označení ADLS Gen2. Osobní účet použitý k připojení k Azure se používá jenom jednou, k nastavení počátečního připojení a udělení oprávnění účtu služby Power BI ke čtení a zápisu dat, po kterém už původní uživatelský účet není potřeba k udržování připojení aktivní.

Snímek obrazovky s oknem Nastavení po výběru Možnosti Připojení k Azure

Po výběru vybrané možnosti vyberte Uložit a teď jste pracovní prostor úspěšně připojili k vlastnímu účtu ADLS Gen2. Power BI automaticky nakonfiguruje účet úložiště s požadovanými oprávněními a nastaví systém souborů Power BI, kde se data zapíšou. V tomto okamžiku se data všech toků dat v tomto pracovním prostoru zapisují přímo do tohoto systému souborů, který je možné použít s jinými službami Azure. Teď máte jeden zdroj pro všechna data organizace nebo oddělení.

Konfigurace připojení Azure

Konfigurace připojení Azure je volitelné nastavení s dalšími vlastnostmi, které je možné volitelně nastavit:

  • Úložiště na úrovni tenanta, které umožňuje nastavit výchozí a/nebo
  • Úložiště na úrovni pracovního prostoru, které umožňuje zadat připojení pro každý pracovní prostor

Volitelně můžete nakonfigurovat úložiště na úrovni tenanta, pokud chcete použít jenom centralizované datové jezero, nebo chcete, aby toto úložiště bylo výchozí možností. Nezačínáme automaticky pomocí výchozího nastavení, které umožňuje flexibilitu ve vaší konfiguraci, takže máte flexibilitu při konfiguraci pracovních prostorů, které toto připojení používají podle vašich potřeb. Pokud nakonfigurujete účet ADLS Gen2 přiřazený tenantem, musíte nakonfigurovat každý pracovní prostor tak, aby používal tuto výchozí možnost.

Volitelně můžete také nakonfigurovat oprávnění úložiště na úrovni pracovního prostoru jako samostatnou možnost, která poskytuje úplnou flexibilitu pro nastavení konkrétního účtu ADLS Gen2 v pracovním prostoru podle pracovního prostoru.

Pokud jsou povolená oprávnění úložiště na úrovni tenanta a úložiště na úrovni pracovního prostoru, můžou správci pracovního prostoru volitelně použít výchozí připojení ADLS nebo se rozhodnout nakonfigurovat jiný účet úložiště odděleně od výchozího účtu. Nenastaví-li se úložiště tenanta, mohou správci pracovního prostoru volitelně nakonfigurovat účty ADLS pro jednotlivé pracovní prostory. Pokud je vybrané úložiště na úrovni tenanta a není povolené úložiště na úrovni pracovního prostoru, můžou správci pracovního prostoru volitelně nakonfigurovat toky dat tak, aby toto připojení používali.

Struktura a formát připojení pracovních prostorů ADLS Gen2

V účtu úložiště ADLS Gen2 jsou všechny toky dat uložené v kontejneru Powerbi systému souborů.

Struktura kontejneru powerbi vypadá takto: <workspace name>/<dataflow name>/model.json<workspace name>/<dataflow name>/model.json.snapshots/<all snapshots> a<workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Umístění, kde toky dat ukládají data v hierarchii složek pro ADLS Gen2, je stejné, jestli se pracovní prostor nachází ve sdílené kapacitě nebo kapacitě Premium.

Následující příklad využívá tabulku Orders z ukázky Northwind OData.

Snímek obrazovky průzkumníka souborů znázorňující příklad s tabulkou Orders ukázky Northwind Odata

Na předchozím obrázku:

  • model.json je nejnovější verze toku dat.
  • model.json .snapshots jsou všechny předchozí verze toku dat. Tato historie je užitečná, pokud potřebujete předchozí verzi mashupu nebo přírůstkové nastavení.
  • Tablename je složka, která obsahuje výsledná data po dokončení obnovení toku dat.

Do tohoto účtu úložiště pouze zapisujeme a aktuálně data neodstraňujeme. Takže i po odpojení se neodstraníme z účtu ADLS, takže všechny soubory uvedené v předchozím seznamu jsou stále uložené.

Poznámka:

Toky dat umožňují propojení nebo odkazování na tabulky v jiných tocích dat. V takových tocích dat může soubor model.json odkazovat na jiný model.json jiného toku dat ve stejném nebo jiném pracovním prostoru.

Přesouvání souborů mezi účty úložiště ADLS Gen2 a v rámci nich

Když přesunete tok dat z jednoho účtu úložiště ADLS Gen2 do jiného, musíte se ujistit, že se cesty v souborumodel.json aktualizují tak, aby odrážely nové umístění. Důvodem je to, že soubor model.json obsahuje cestu k toku dat a cestu k datům. Pokud cesty neaktualizujete, tok dat nebude moct tato data najít a způsobit chyby oprávnění. Chcete-li aktualizovat cesty, můžete použít následující kroky:

  • Otevřete soubor model.json v textovém editoru.
  • Vyhledejte adresu URL účtu úložiště a nahraďte ji adresou URL nového účtu úložiště.
  • Uložte soubor.
  • Přepište existující soubormodel.json v účtu úložiště ADLS Gen2.

Rozšiřitelnost propojení pracovních prostorů ADLS Gen2

Pokud připojujete ADLS Gen2 k Power BI, můžete tuto akci provést na úrovni pracovního prostoru nebo tenanta. Ujistěte se, že máte správnou úroveň přístupu. Další informace najdete v tématu Předpoklady.

Struktura úložiště dodržuje formát Common Data Model. Další informace o struktuře úložiště a CDM najdete v tématu Co je struktura úložiště pro analytické toky dat a použití modelu Common Data Model k optimalizaci Azure Data Lake Storage Gen2.

Po správné konfiguraci jsou data a metadata ve vašem ovládacím prvku. Mnoho aplikací o CDM a data je možné rozšířit pomocí Azure, PowerApps a Power Automate. Také můžete využít ekosystémy třetích stran buď dodržováním formátu, nebo čtením surových dat.

Odpojení Azure Data Lake Gen2 z pracovního prostoru nebo tenanta

Pokud chcete odebrat připojení na úrovni pracovního prostoru, musíte nejprve zajistit odstranění všech toků dat v pracovním prostoru. Po odebrání všech toků dat vyberte v nastavení pracovního prostoru možnost Odpojit . Totéž platí pro tenanta, ale musíte nejdřív zajistit, aby se všechny pracovní prostory odpojily i od účtu úložiště tenanta, než se budete moct odpojit na úrovni tenanta.

Zakázání Azure Data Lake Gen2

Na portálu pro správu můžete v rámci toků dat zakázat přístup uživatelům, kteří mají tuto funkci používat, a zakázat správcům pracovního prostoru používání vlastní služby Azure Storage.

Vrácení z Azure Data Lake Gen2

Jakmile je úložiště toku dat nakonfigurované tak, aby používalo Azure Data Lake Gen2, neexistuje způsob, jak se automaticky vrátit. Proces návratu do úložiště spravovaného Power BI je ruční.

Pokud chcete vrátit migraci, kterou jste provedli na Gen2, musíte odstranit toky dat a znovu je vytvořit ve stejném pracovním prostoru. Poté, jelikož data z ADLS Gen 2 neodstraníme, přejdeme k samotnému prostředku a vyčistíme data. Tato akce by zahrnovala následující kroky.

  1. Exportujte kopii toku dat z Power BI. Nebo zkopírujte soubor model.json. Soubor model.json je uložen v ADLS.

  2. Odstraňte toky dat.

  3. Odpojte ADLS.

  4. Znovu vytvořte toky dat pomocí importu. Data z přírůstkové aktualizace (pokud je k dispozici) musí být odstraněna před importem. Tuto akci můžete provést odstraněním příslušných oddílů v souboru model.json.

  5. Nakonfigurujte zásady pro přírůstkovou aktualizaci nebo jejich opětovné vytvoření.

Připojení k datům pomocí konektoru ADLS Gen2

Rozsah tohoto dokumentu popisuje připojení toků dat ADLS Gen2, nikoli konektor Power BI ADLS Gen2. Práce s konektorem ADLS Gen2 je samostatný, případně doplňkový scénář. Konektor ADLS jednoduše používá ADLS jako zdroj dat. Takže použití Power Query Online k dotazování na tato data nemusí být ve formátu CDM, může to být jakýkoli formát dat, který zákazník chce. Další informace najdete v tématu Azure Data Lake Storage Gen2.

Následující články obsahují další informace o tocích dat a Power BI: