Konfigurace úložiště toku dat pro použití Azure Data Lake Gen2

Data používaná s Power BI jsou ve výchozím nastavení uložená v interním úložišti poskytovaném Power BI. Díky integraci toků dat a Azure Data Lake Storage Gen2 (ADLS Gen2) můžete toky dat ukládat do účtu Azure Data Lake Storage Gen2 ve vaší organizaci. Tato funkce v podstatě umožňuje "přineste si vlastní úložiště" do toků dat Power BI a navázat připojení na úrovni tenanta nebo pracovního prostoru.

Důvody použití pracovního prostoru ADLS Gen2 nebo připojení tenanta

Po připojení toku dat Power BI nakonfiguruje a uloží odkaz, abyste teď mohli číst a zapisovat data do vlastního ADLS Gen2. Power BI ukládá data ve formátu CDM (Common Data Model), který zachycuje metadata o vašich datech kromě skutečných dat generovaných samotným tokem dat. Tato funkce nabízí mnoho výkonných funkcí a umožňuje vašim datům a přidruženým metadatům ve formátu CDM nyní poskytovat rozšiřitelnost, automatizaci, monitorování a scénáře zálohování. Když tato data zpřístupníte a široce zpřístupníte ve svém vlastním prostředí, umožní vám demokratizovat přehledy a data vytvořená ve vaší organizaci. Nabízí také možnost vytvářet další řešení s širokou škálou složitosti. Vaše řešení můžou být vlastní aplikace a řešení pracující s CDM v Power Platform, Azure a řešení dostupná prostřednictvím ekosystémů nezávislých dodavatelů softwaru (ISV). Nebo můžete vytvořit aplikaci pro čtení sdíleného svazku clusteru. Vaši datoví inženýři, datoví vědci a analytici teď můžou pracovat, používat a opakovaně používat společnou sadu dat kurátorovaných v ADLS Gen2.

Existují dva způsoby konfigurace úložiště ADLS Gen2, které se mají použít: můžete použít účet ADLS Gen2 přiřazený tenantem nebo si můžete přinést vlastní úložiště ADLS Gen2 na úrovni pracovního prostoru.

Požadavky

  • Pokud chcete použít vlastní účet ADLS Gen2, musíte mít oprávnění vlastníka ve vrstvě účtu úložiště. Oprávnění na úrovni skupiny prostředků nebo předplatného nebudou fungovat. Pokud jste správce, musíte stále přiřadit oprávnění vlastníka. V současné době nepodporuje účty úložiště ADLS Gen2 za bránou firewall.

  • Účet úložiště musí být vytvořen s povoleným hierarchickým oborem názvů (HNS).

  • Účet úložiště musí být vytvořen ve stejném tenantovi Microsoft Entra jako tenant Power BI.

  • Uživatel musí mít roli Vlastník dat objektu blob služby Storage, roli Čtenář dat objektů blob služby Storage a roli Vlastník na úrovni účtu úložiště (obor by měl být tento prostředek , nikoli zděděný). Synchronizace všech použitých změn rolí může trvat několik minut a před dokončením následujících kroků v služba Power BI se musí synchronizovat.

  • Oblast tenanta pracovního prostoru Power BI by měla být stejná jako oblast účtu úložiště.

  • K zabezpečení koncových bodů se vyžaduje protokol TLS (Transport Layer Security) verze 1.2 (nebo vyšší). Webové prohlížeče a další klientské aplikace, které používají verze TLS starší než TLS 1.2, se nebudou moct připojit.

  • Připojení toku dat pomocí ADLS Gen2 za vícefaktorovým ověřováním (MFA) se nepodporuje.

  • Nakonec se můžete z portálu Správa připojit k libovolné službě ADLS Gen2, ale pokud se připojujete přímo k pracovnímu prostoru, musíte nejprve před připojením zajistit, aby v pracovním prostoru nebyly žádné toky dat.

Poznámka:

Používání vlastního úložiště (Azure Data Lake Gen 2) není v služba Power BI k dispozici pro zákazníky GCC státní správy USA. Další informace o tom, které funkce jsou dostupné a které nejsou, najdete v tématu Dostupnost funkcí Power BI pro zákazníky státní správy USA.

Následující tabulka popisuje oprávnění pro ADLS a Power BI vyžadovaná pro ADLS Gen2 a Power BI:

Akce Oprávnění ADLS Minimální oprávnění Power BI
Připojení tenanta ADLS Gen2 do tenanta Power BI Vlastník Správce Power BI
Připojení ADLS Gen2 do pracovního prostoru Vlastník Správce pracovního prostoru
Vytvoření toků dat Power BI, které se zapisují zpět do připojeného účtu ADLS Nelze použít Přispěvatel pracovního prostoru
Využívání toku dat Power BI Nelze použít Prohlížeč pracovních prostorů

Připojení do Azure Data Lake Gen2 na úrovni pracovního prostoru

Přejděte do pracovního prostoru, který neobsahuje žádné toky dat. Vyberte nastavení pracovního prostoru. Zvolte kartu Azure Připojení ions a pak vyberte oddíl Úložiště.

Screenshot of the Workspace settings pane on the Azure connections tab.

Možnost Použít výchozí připojení Azure se zobrazí, pokud už správce nakonfiguroval účet ADLS Gen2 přiřazený tenantem. K dispozici jsou dvě možnosti:

  • Pomocí tenanta nakonfigurovaného účtu ADLS Gen2 vyberte pole s názvem Použít výchozí připojení Azure nebo
  • Výběrem Připojení do Azure přejděte na nový účet Azure Storage.

Když vyberete Připojení do Azure, Power BI načte seznam předplatných Azure, ke kterým máte přístup. Vyplňte rozevírací seznamy. Pak zvolte platné předplatné Azure, skupinu prostředků a účet úložiště s povolenou možností hierarchického oboru názvů, což je příznak ADLS Gen2. Osobní účet použitý pro připojení k Azure se používá jenom jednou, k nastavení počátečního připojení a udělení oprávnění k služba Power BI účtu ke čtení a zápisu dat, po kterých už původní uživatelský účet není potřeba k tomu, aby bylo připojení aktivní.

Screenshot of the Settings window after choosing Connecting to Azure.

Po výběru vybrané možnosti vyberte Uložit a teď jste pracovní prostor úspěšně připojili k vlastnímu účtu ADLS Gen2. Power BI automaticky nakonfiguruje účet úložiště s požadovanými oprávněními a nastaví systém souborů Power BI, kde se data zapíšou. V tomto okamžiku se data všech toků dat v tomto pracovním prostoru zapisují přímo do tohoto systému souborů, který je možné použít s jinými službami Azure. Teď máte jeden zdroj pro všechna data organizace nebo oddělení.

Konfigurace připojení Azure

Konfigurace připojení Azure je volitelné nastavení s dalšími vlastnostmi, které je možné volitelně nastavit:

  • Úložiště na úrovni tenanta, které umožňuje nastavit výchozí nebo
  • Úložiště na úrovni pracovního prostoru, které umožňuje zadat připojení pro každý pracovní prostor

Volitelně můžete nakonfigurovat úložiště na úrovni tenanta, pokud chcete použít jenom centralizované datové jezero, nebo chcete, aby toto úložiště bylo výchozí možností. Nezačínáme automaticky pomocí výchozího nastavení, které umožňuje flexibilitu ve vaší konfiguraci, takže máte flexibilitu při konfiguraci pracovních prostorů, které toto připojení používají podle vašich potřeb. Pokud nakonfigurujete účet ADLS Gen2 přiřazený tenantem, musíte nakonfigurovat každý pracovní prostor tak, aby používal tuto výchozí možnost.

Volitelně můžete také nakonfigurovat oprávnění úložiště na úrovni pracovního prostoru jako samostatnou možnost, která poskytuje úplnou flexibilitu pro nastavení konkrétního účtu ADLS Gen2 v pracovním prostoru podle pracovního prostoru.

Pokud jsou povolená oprávnění úložiště na úrovni tenanta a úložiště na úrovni pracovního prostoru, můžou správci pracovního prostoru volitelně použít výchozí připojení ADLS nebo se rozhodnout nakonfigurovat jiný účet úložiště odděleně od výchozího účtu. Pokud není nastavené úložiště tenanta, můžou správci pracovního prostoru volitelně nakonfigurovat účty ADLS v pracovním prostoru podle pracovního prostoru. Pokud je vybrané úložiště na úrovni tenanta a není povolené úložiště na úrovni pracovního prostoru, můžou správci pracovního prostoru volitelně nakonfigurovat toky dat tak, aby toto připojení používali.

Struktura a formát připojení pracovních prostorů ADLS Gen2

V účtu úložiště ADLS Gen2 jsou všechny toky dat uložené v kontejneru Powerbi systému souborů.

Struktura kontejneru powerbi vypadá takto: <workspace name>/<dataflow name>/model.json<workspace name>/<dataflow name>/model.json.snapshots/<all snapshots> a<workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Umístění, kde toky dat ukládají data v hierarchii složek pro ADLS Gen2, je stejné, jestli se pracovní prostor nachází ve sdílené kapacitě nebo kapacitě Premium.

Následující příklad používá tabulku Orders ukázky Northwind Odata.

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

Na předchozím obrázku:

  • Model.json je nejnovější verze toku dat.
  • Model.json.snapshots jsou všechny předchozí verze toku dat. Tato historie je užitečná, pokud potřebujete předchozí verzi mashupu nebo přírůstkové nastavení.
  • Název tabulky je složka obsahující výsledná data po dokončení aktualizace toku dat.

Do tohoto účtu úložiště zapisujeme jenom a aktuálně neodstraňovat data. Takže i po odpojení se neodstraníme z účtu ADLS, takže všechny soubory uvedené v předchozím seznamu jsou stále uložené.

Poznámka:

Toky dat umožňují propojení nebo odkazování na tabulky v jiných tocích dat. V takových tocích dat může soubor model.json odkazovat na jiný model.json jiného toku dat ve stejném nebo jiném pracovním prostoru.

Přesouvání souborů mezi účty úložiště ADLS Gen2 a v rámci nich

Když přesunete tok dat z jednoho účtu úložiště ADLS Gen2 do jiného, musíte se ujistit, že se cesty v souboru model.json aktualizují tak, aby odrážely nové umístění. Důvodem je to, že soubor model.json obsahuje cestu k toku dat a cestu k datům. Pokud cesty neaktualizujete, tok dat nebude moct tato data najít a způsobit chyby oprávnění. Chcete-li aktualizovat cesty, můžete použít následující kroky:

  • Otevřete soubor model.json v textovém editoru.
  • Vyhledejte adresu URL účtu úložiště a nahraďte ji adresou URL nového účtu úložiště.
  • Uložte soubor.
  • Přepište existující soubor model.json v účtu úložiště ADLS Gen2.

Rozšiřitelnost připojení pracovních prostorů ADLS Gen2

Pokud připojujete ADLS Gen2 k Power BI, můžete tuto akci provést na úrovni pracovního prostoru nebo tenanta. Ujistěte se, že máte správnou úroveň přístupu. Další informace najdete v požadavcích.

Struktura úložiště dodržuje formát Common Data Model. Další informace o struktuře úložiště a CDM najdete v tématu Co je struktura úložiště pro analytické toky dat a použití modelu Common Data Model k optimalizaci Azure Data Lake Storage Gen2.

Po správné konfiguraci jsou data a metadata ve vašem ovládacím prvku. Mnoho aplikací o CDM a data je možné rozšířit pomocí Azure, PowerApps a PowerAutomate. Ekosystémy třetích stran můžete použít také tak, že odpovídají formátu, nebo čtením nezpracovaných dat.

Odpojení Azure Data Lake Gen2 z pracovního prostoru nebo tenanta

Pokud chcete odebrat připojení na úrovni pracovního prostoru, musíte nejprve zajistit odstranění všech toků dat v pracovním prostoru. Po odebrání všech toků dat vyberte v nastavení pracovního prostoru možnost Odpojit . Totéž platí pro tenanta, ale musíte nejdřív zajistit, aby se všechny pracovní prostory odpojily i od účtu úložiště tenanta, než se budete moct odpojit na úrovni tenanta.

Zakázání Azure Data Lake Gen2

Na portálu Správa můžete v rámci toků dat zakázat přístup uživatelům, kteří tuto funkci používají, a zakázat správcům pracovního prostoru používání vlastního úložiště Azure Storage.

Vrácení z Azure Data Lake Gen2

Jakmile je úložiště toku dat nakonfigurované tak, aby používalo Azure Data Lake Gen2, neexistuje způsob, jak se automaticky vrátit. Proces, který se má vrátit do úložiště spravovaného Power BI, je ruční.

Pokud chcete vrátit migraci, kterou jste provedli na Gen2, musíte odstranit toky dat a znovu je vytvořit ve stejném pracovním prostoru. Proto, že data z ADLS Gen2 neodstraníme, přejdeme k samotnému prostředku a vyčistíme data. Tato akce by zahrnovala následující kroky.

  1. Exportujte kopii toku dat z Power BI. Nebo zkopírujte soubor model.json. Soubor model.json je uložený v ADLS.

  2. Odstraňte toky dat.

  3. Odpojte ADLS.

  4. Znovu vytvořte toky dat pomocí importu. Data přírůstkové aktualizace (pokud je k dispozici) je potřeba před importem odstranit. Tuto akci můžete provést odstraněním příslušných oddílů v souboru model.json.

  5. Nakonfigurujte zásady přírůstkové aktualizace nebo znovu vytvořte aktualizace.

Připojení k datům pomocí konektoru ADLS Gen2

Rozsah tohoto dokumentu popisuje připojení toků dat ADLS Gen2, nikoli konektor Power BI ADLS Gen2. Práce s konektorem ADLS Gen2 je samostatný scénář, který se může sloučit. Konektor ADLS jednoduše používá ADLS jako zdroj dat. Takže použití Power Query Online k dotazování na tato data nemusí být ve formátu CDM, může to být jakýkoli formát dat, který zákazník chce. Další informace najdete v tématu Azure Data Lake Storage Gen2.

Následující články obsahují další informace o tocích dat a Power BI: