Zdieľať cez


Zrkadlenie katalógu Azure Databricks Unity

Mnoho organizácií dnes registruje svoje údaje v katalógu Unity v rámci služby Azure Databricks. Zrkadlový katalóg Unity v službe Fabric umožňuje zákazníkom čítať údaje spravované katalógom Unity z vyťažení služby Fabric. Azure Databricks a Fabric sú lepšie spolu.

Kurz na konfiguráciu pracovného priestoru Azure Databricks na zrkadlenie katalógu Unity do služby Fabric nájdete v téme Kurz: Konfigurácia zrkadlových databáz Microsoft Fabric zo služby Azure Databricks.

Zrkadlové databázy v službe Fabric umožňujú používateľom využívať vysoko integrovaný, komplexný a ľahko použiteľný produkt, ktorý je navrhnutý tak, aby zjednodušil vaše analytické potreby. Môžete si vychutnať ľahko použiteľný produkt navrhnutý tak, aby zjednodušil vaše analytické potreby a bol vytvorený pre otvorenosť a spoluprácu medzi Microsoft Fabric a Azure Databricks.

Keď používate Fabric na čítanie údajov, ktoré sú zaregistrované v katalógu Unity, nedochádza k žiadnemu presunu údajov ani k replikácii údajov. Do služby Fabric sa zrkadlí iba štruktúra katalógu Azure Databricks a k základným údajom katalógu sa pristupuje prostredníctvom odkazov. Zmeny základných údajov sa nemusia v službe Fabric zobraziť okamžite. Šírenie môže trvať od niekoľkých sekúnd do niekoľkých minút, ako je popísané v dokumentácii k výkonu koncového bodu služby SQL Analytics.

V čom sú analytické funkcie zabudované

Zrkadlené katalógy sú položkou v dátových skladoch tkaniny, ktorá sa líši od koncového bodu Warehouse a SQL analytics.

Keď zrkadlíte katalóg Azure Databricks Unity, Fabric vytvorí tieto položky:

K zrkadleným údajom Azure Databricks môžete pristupovať viacerými spôsobmi:

  • Každá zrkadlená položka Azure Databricks má automaticky generovaný koncový bod analýzy SQL, ktorý poskytuje bohaté analytické prostredie vytvorené procesom zrkadlenia. Pomocou príkazov T-SQL môžete definovať a dotazovať dátové objekty z koncového bodu analýzy SQL iba na čítanie.
  • Použite Power BI s režimom Direct Lake na vytváranie zostáv pre položku Azure Databricks.

Synchronizácia metaúdajov

Keď vytvoríte novú zrkadlenú databázu zo služby Azure Databricks v službe Fabric, predvolene je povolená možnosť Automaticky synchronizovať budúce zmeny katalógu pre vybratú schému . Nasledujúce zmeny metaúdajov sa prejavia z pracovného priestoru Azure Databricks do Fabric, ak je povolená automatická synchronizácia:

  • Pridanie schém do katalógu.
  • Vymazanie schém z katalógu.
  • Pridanie tabuliek do schémy.
  • Odstránenie tabuliek zo schémy.

Výber schémy/tabuľky:

  • V predvolenom nastavení sa pri pridaní katalógu používateľom vyberie celý katalóg.
  • Používateľ môže vylúčiť určité tabuľky v rámci schémy.
  • Zrušením výberu schémy sa zruší výber všetkých tabuliek v rámci schémy.
  • Ak sa používateľ vráti a vyberie schému, znova sa vyberú všetky tabuľky v rámci schémy.
  • Rovnaké správanie pri výbere platí aj pre schémy v rámci katalógu.

Existujú aj ďalšie podmienky filtrácie, ktoré sa vzťahujú na katalógy/schémy/tabuľky:

  • Materializované zobrazenia a streamovacie tabuľky sa nezobrazia.
  • Externé tabuľky, ktoré nepodporujú rozdielový formát, sa nezobrazia.