Sdílet prostřednictvím


Kurz: Konfigurace zrcadlených databází Microsoft Fabric z Azure Databricks

Zrcadlení databáze v Microsoft Fabric je podniková cloudová technologie SaaS, která je založená na nule ETL. Tato příručka vám pomůže vytvořit zrcadlenou databázi z Azure Databricks, která vytvoří nepřetržitě replikovanou kopii dat Azure Databricks jen pro čtení ve OneLake.

Požadavky

  • V metastoru musíte povolit přístup k externím datům. Další informace najdete v tématu Povolení přístupu k externím datům v metastoru.
  • Vytvořte nebo použijte existující pracovní prostor Azure Databricks s povoleným katalogem Unity.
  • Musíte mít EXTERNAL USE SCHEMA oprávnění ke schématu v katalogu Unity, která obsahuje tabulky, ke kterým se budou přistupovat z prostředků infrastruktury.
  • K nastavení řízení přístupu pro katalogy, schémata a tabulky v Prostředcích infrastruktury musíte použít model oprávnění fabric.
  • Pracovní prostory Azure Databricks nemůžou být za privátním koncovým bodem.

Vytvoření zrcadlené databáze z Azure Databricks

Pomocí těchto kroků vytvořte novou zrcadlenou databázi z katalogu Azure Databricks Unity.

  1. Přejděte na https://powerbi.com.

  2. Vyberte + Nový a pak zrcadlený katalog Azure Databricks.

    Snímek obrazovky z portálu Fabric nové položky se zrcadlenou položkou Azure Databricks

  3. Pokud máte nakonfigurované připojení, vyberte existující připojení.

    • Pokud nemáte existující připojení, vytvořte nové připojení a zadejte všechny podrobnosti. V pracovním prostoru Azure Databricks se můžete ověřit pomocí účtu organizace nebo instančního objektu. Pokud chcete vytvořit připojení, musíte být buď uživatel, nebo správce pracovního prostoru Azure Databricks.
    • Pokud chcete získat přístup k účtům Azure Data Lake Storage (ADLS) Gen2 za bránou firewall, musíte postupovat podle kroků pro povolení přístupu k zabezpečení sítě pro účet Azure Data Lake Storage Gen2 dále v tomto článku.
  4. Jakmile se připojíte k pracovnímu prostoru Azure Databricks, můžete na stránce Vybrat tabulky ze stránky katalogu Databricks vybrat katalog, schémata a tabulky prostřednictvím seznamu zahrnutí a vyloučení, který chcete přidat a získat přístup z Microsoft Fabric. Vyberte katalog a související schémata a tabulky, které chcete přidat do pracovního prostoru Fabric.

    • Můžete zobrazit pouze katalogy, schémata nebo tabulky, ke kterým máte přístup podle oprávnění udělených podle modelu oprávnění popsaného v oprávněních a zabezpečitelných objektech.
    • Ve výchozím nastavení je povolená možnost Automaticky synchronizovat budoucí změny katalogu pro vybrané schéma . Další informace najdete v tématu Zrcadlení katalogu Azure Databricks Unity.
    • Až vyberete požadované možnosti, vyberte Další.
  5. Ve výchozím nastavení bude název položky název katalogu, který se pokoušíte přidat do prostředků infrastruktury. Na stránce Zkontrolovat a vytvořit můžete zkontrolovat podrobnosti a volitelně změnit název zrcadlené položky databáze, který musí být v pracovním prostoru jedinečný. Vyberte Vytvořit.

  6. Vytvoří se položka katalogu Databricks a pro každou tabulku se vytvoří také odpovídající zástupce typu Databricks.

    • Schémata, která nemají žádné tabulky, se nezobrazují.
  7. Náhled dat můžete zobrazit také při přístupu ke zástupce výběrem koncového bodu analýzy SQL. Otevřete položku koncového bodu analýzy SQL a spusťte stránku Průzkumníka a editoru dotazů. Zrcadlené tabulky Azure Databricks můžete dotazovat pomocí T-SQL v editoru SQL.

Vytvoření zástupců Lakehouse pro položku katalogu Databricks

Můžete také vytvořit zástupce ze služby Lakehouse k položce katalogu Databricks, abyste mohli používat data Lakehouse a používat poznámkové bloky Sparku.

  1. Nejdřív vytvoříme jezerní dům. Pokud už v tomto pracovním prostoru máte jezerní dům, můžete použít existující jezev.
    1. V navigační nabídce vyberte svůj pracovní prostor.
    2. Vyberte + New>Lakehouse.
    3. Do pole Název zadejte název jezera a vyberte Vytvořit.
  2. V zobrazení Průzkumníka jezera v nabídce Získat data v nabídce lakehouse v části Načíst data do jezera vyberte tlačítko Nová zkratka .
  3. Vyberte Microsoft OneLake. Vyberte katalog. Toto je datová položka, kterou jste vytvořili v předchozích krocích. Pak vyberte Další.
  4. Vyberte tabulky v rámci schématu a vyberte Další.
  5. Vyberte Vytvořit.
  6. Ve službě Lakehouse jsou teď k dispozici klávesové zkratky, které můžete použít s ostatními daty Lakehouse. Pomocí poznámkových bloků a Sparku můžete také provádět zpracování dat u těchto tabulek katalogu, které jste přidali z pracovního prostoru Azure Databricks.

Vytvoření sémantického modelu

Sémantický model Power BI můžete vytvořit na základě zrcadlené položky a ručně přidávat nebo odebírat tabulky. Další informace o vytváření a správě sémantických modelů najdete v tématu Vytvoření sémantického modelu Power BI.

Pro co nejlepší prostředí doporučujeme použít prohlížeč Microsoft Edge pro úlohy sémantického modelování.

Správa sémantických relací modelu

Jakmile vytvoříte nový sémantický model založený na zrcadlené databázi,

  1. V Průzkumníku v pracovním prostoru vyberte rozložení modelu.
  2. Jakmile vyberete rozložení modelu, zobrazí se grafika tabulek, které byly zahrnuty jako součást sémantického modelu.
  3. Pokud chcete vytvořit relace mezi tabulkami, přetáhněte název sloupce z jedné tabulky do jiné tabulky. Zobrazí se místní nabídka, která identifikuje relaci a kardinalitu tabulek.

Povolení přístupu k zabezpečení sítě pro váš účet Azure Data Lake Storage Gen2

Tato část vás provede konfigurací zabezpečení sítě pro účet Azure Data Lake Storage (ADLS) Gen2 při konfiguraci brány firewall služby Azure Storage

Požadavky

  • Vytvořte nebo použijte existující pracovní prostor Azure Databricks s povoleným katalogem Unity.
  • Pokud chcete povolit typ ověřování identit pracovního prostoru (doporučeno), musí být pracovní prostor Prostředků infrastruktury přidružený k jakékoli kapacitě F. Pokud chcete vytvořit identitu pracovního prostoru, přečtěte si téma Ověřování pomocí identity pracovního prostoru.
  • Tato část se používá k dosažení účtu úložiště Azure Data Lake Storage (ADLS) Gen2 za bránou firewall služby Azure Storage. Úložiště pracovního prostoru Azure Databricks za bránou firewall služby Azure Storage se nepodporuje.
  • Katalog musí být přidružený k jednomu účtu úložiště.

Povolení přístupu k zabezpečení sítě

  1. Při vytváření nového zrcadleného katalogu Azure Databricks vyberte v kroku Zvolit data kartu Zabezpečení sítě .

    Snímek obrazovky s kartou Zabezpečení sítě v Databricks

  2. Pokud máte nakonfigurované existující připojení k účtu úložiště. 

    • Pokud nemáte existující připojení ADLS, vytvořte nové připojení.  
    • Adresa URL koncového bodu úložiště je místo, kde jsou uložena data vybraného katalogu. Koncový bod by měl být konkrétní složkou, ve které jsou uložená data, a neměl by zadávat koncový bod, který má být na úrovni účtu úložiště. Zadejte například https://<storage account>.dfs.core.windows.net/container1/folder1 místo https://<storage account>.dfs.core.windows.net/.
    • Zadejte přihlašovací údaje pro připojení. Podporované typy ověřování jsou účet organizace, instanční objekt a identita pracovního prostoru (doporučeno).
  3. Na webu Azure Portal zadejte přístupová práva k účtu úložiště na základě typu ověřování, který jste vybrali v předchozím kroku. Na webu Azure Portal přejděte k účtu úložiště. Vyberte Řízení přístupu (IAM). Vyberte +Přidat a přidat přiřazení role. Další informace viz Přiřazení rolí Azure pomocí webu Azure Portal.

    • Pokud jste jako součást připojení zadali účet úložiště, musí mít vybraný objekt ověřování roli Čtenář dat objektů blob služby Storage v účtu úložiště. 
    • Pokud jste jako součást připojení zadali konkrétní kontejner, musí mít vybraný objekt ověřování v kontejneru roli Čtenář dat objektů blob služby Storage .  
    • Pokud jste zadali konkrétní složku v rámci kontejneru (doporučeno), musí vybraný objekt ověřování mít na úrovni složky oprávnění Číst (R) a Execute (E ). Pokud jako typ ověřování používáte identitu instančního objektu nebo pracovního prostoru, musíte udělit oprávnění instančnímu objektu nebo identitě pracovního prostoru spouštět ke kořenové složce kontejneru a ke každé složce v hierarchii složek, které vedou ke složce, kterou jste zadali. 

    Další informace a postup udělení přístupu ADLS najdete v tématu Řízení přístupu ADLS.

  4. Zabezpečeným způsobem povolte přístup k účtům Azure Data Lake Storage (ADLS) Gen2 s podporou důvěryhodného pracovního prostoru . Důvěryhodný přístup k pracovnímu prostoru vyžaduje vytvoření připojení přímo k účtu úložiště ADLS, který lze použít nezávisle na připojení pracovního prostoru Azure Databricks. Další informace najdete v tématu Zabezpečení databází zrcadlených prostředků infrastruktury z Azure Databricks.

  5. Pro tabulky, jejichž název účtu úložiště odpovídá účtu úložiště zadanému v připojení ADLS, se vytvoří zástupce tabulek katalogu Unity. U všech tabulek, jejichž název účtu úložiště neodpovídá účtu úložiště zadanému v připojení ADLS, se zástupce těchto tabulek nevytvořili. 

Důležité

Pokud plánujete použít připojení ADLS mimo scénáře zrcadlených položek katalogu Azure Databricks, musíte také udělit roli delegátoru objektů blob služby Storage v účtu úložiště.

Povolení zabezpečení OneLake u položky Mirrored Databricks

Zásady katalogu Unity (UC) namapují na zabezpečení Microsoft OneLake pomocí následujícího postupu:

  1. Synchronizujte skupinu Entra a použijte oprávnění v katalogu Unity. V Azure Databricks pomocí automatické správy identit synchronizujte skupinu ID Microsoft Entra a udělte jí potřebná oprávnění katalogu Unity, například USE, BROWSE, SELECT v příslušném katalogu nebo tabulkách.
  2. Přiřaďte roli přístupu k datům OneLake. V pracovním prostoru Fabric vytvořte roli přístupu k datům pro nově zrcadlená data. Přidejte do této role stejnou skupinu Entra a udělte jí přístup ke čtení zástupcům OneLake odpovídajícím tabulkám Azure Databricks. Zabezpečení na úrovni tabulky můžete začít hned na pásu karet pomocí tlačítka Spravovat zabezpečení OneLake . Ujistěte se, že se konfigurace přístupu synchronizují s tím, jak se vyvíjejí struktury a oprávnění katalogu. Další informace najdete v modelu řízení přístupu k datům OneLake (Preview).