Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Zobrazení je objekt pouze pro čtení, který je výsledkem dotazu na jednu nebo více tabulek a zobrazení v katalogu Unity metastore. Můžete vytvořit zobrazení z tabulek a z jiných zobrazení ve více schématech a katalogech.
Tento článek popisuje zobrazení, která můžete vytvořit v Azure Databricks, a poskytuje vysvětlení oprávnění a výpočetních prostředků potřebných k jejich dotazování.
Pro informace o vytváření zobrazení se podívejte na:
Zobrazení v katalogu Unity
V katalogu Unity jsou zobrazení umístěna na třetí úrovni tříúrovňového oboru názvů (catalog.schema.view):
Zobrazení ukládá text dotazu obvykle do jednoho nebo více zdrojů dat nebo tabulek v metastoru. V Azure Databricks je zobrazení ekvivalentní datovému rámci Sparku, který je trvalý jako objekt ve schématu. Na rozdíl od datových rámců můžete dotazovat zobrazení odkudkoli v Azure Databricks za předpokladu, že k tomu máte oprávnění. Vytvoření zobrazení nezpracuje ani nezapisuje žádná data. V přidruženém schématu se k metastoru zaregistruje pouze text dotazu.
Poznámka:
Zobrazení můžou mít jinou sémantiku spouštění, pokud jsou zálohovaná jinými zdroji dat než tabulkami Delta. Databricks doporučuje vždy definovat zobrazení odkazováním na zdroje dat pomocí názvu tabulky nebo zobrazení. Definování zobrazení pro datové sady zadáním cesty nebo identifikátoru URI může vést k matoucím požadavkům zásad správného řízení dat.
Zobrazení metrik
Zobrazení metrik v katalogu Unity definují opakovaně použitelné obchodní metriky, které jsou centrálně udržované a přístupné všem uživatelům ve vašem pracovním prostoru. Pohled na metriky abstrahuje logiku běžně používaných klíčových ukazatelů výkonu, jako jsou výnosy, počet zákazníků nebo míra konverze, tak, aby bylo možné je konzistentně dotazovat napříč dashboardy, poznámkovými bloky a zprávami. Každé zobrazení metrik určuje sadu měr a dimenzí na základě zdrojové tabulky, zobrazení nebo dotazu SQL. Zobrazení metrik jsou definována v YAML a dotazována pomocí SQL.
Použití zobrazení metrik pomáhá snižovat nekonzistence v definicích metrik, které by jinak mohly být duplikovány napříč několika nástroji a pracovními postupy. Podívejte se na zobrazení metrik, kde se dozvíte více.
Materializovaná zobrazení
Materializovaná zobrazení přírůstkově vypočítají a aktualizují výsledky vrácené definujícím dotazem. Materializovaná zobrazení v Azure Databricks jsou speciálním druhem tabulky Delta. Zatímco všechna ostatní zobrazení v Azure Databricks počítají výsledky vyhodnocením logiky, která definuje zobrazení při jeho dotazování, materializovaná zobrazení zpracovávají výsledky a ukládají je do podkladové tabulky, když jsou aktualizace zpracovávány buď pomocí plánu aktualizací, nebo spuštěním aktualizace prostřednictvím kanálu.
Materializovaná zobrazení můžete v katalogu Unity zaregistrovat pomocí Databricks SQL nebo je definovat jako součást deklarativních kanálů Sparku Lakeflow. Viz Použití materializovaných zobrazení vdeklarativních kanálech Databricks SQL a Lakeflow Spark.
Dočasná zobrazení
Dočasné zobrazení má omezený rozsah a trvalost a není zaregistrované ve schématu nebo katalogu. Životnost dočasného zobrazení se liší v závislosti na prostředí, které používáte:
- V poznámkových blocích a úlohách jsou dočasná zobrazení vymezená na úroveň poznámkového bloku nebo skriptu. Nelze na nich odkazovat mimo poznámkový blok, ve kterém jsou deklarovány, a již neexistují, když se poznámkový blok oddělí od clusteru.
- V Databricks SQL jsou dočasná zobrazení vymezená na úroveň dotazu. Dočasné zobrazení může použít více příkazů v rámci stejného dotazu, ale nelze na něj odkazovat v jiných dotazech, a to ani v rámci stejného řídicího panelu.
Dynamická zobrazení
Dynamická zobrazení se dají použít k zajištění řízení přístupu na úrovni řádků a sloupců kromě maskování dat. Viz Vytvoření dynamického zobrazení.
Zobrazení v Hive metastore (starší verze)
Můžete definovat tradiční zobrazení Hive pro libovolný zdroj dat a zaregistrovat je v tradičním úložišti metadat Hive. Databricks doporučuje migrovat všechna starší zobrazení Hive do katalogu Unity. Viz Zobrazení v metastoru Hive.
Globální zobrazení temp Hive (starší verze)
Globální dočasná zobrazení jsou starší funkce Azure Databricks, která umožňuje zaregistrovat dočasné zobrazení, které je k dispozici pro všechny úlohy spuštěné na výpočetním prostředku. Globální dočasná zobrazení jsou historickým pozůstatkem Hive a HDFS. Databricks nedoporučuje používat globální dočasná zobrazení.
Požadavky pro dotazování na zobrazení
Ke čtení zobrazení zaregistrovaných v katalogu Unity závisí požadovaná oprávnění na výpočetním typu, verzi Databricks Runtime a režimu přístupu.
Poznámka:
U všech zobrazení se kontroly oprávnění provádějí na samotném zobrazení i v podkladových tabulkách a zobrazeních, na které je zobrazení postaveno. Uživatel, jehož oprávnění se kontrolují pro podkladové tabulky a zobrazení, závisí na použitých výpočetních prostředcích. Pro následující katalog Unity zkontroluje oprávnění vlastníka zobrazení k podkladovým datům:
- SQL Warehouses.
- Standardní výpočetní prostředky (dříve sdílené výpočetní prostředky)
- Vyhrazené výpočetní prostředky (dříve výpočetní prostředky jednoho uživatele) v Databricks Runtime 15.4 LTS a vyšší s povoleným jemně odstupňovaným řízením přístupu.
Pro vyhrazené výpočetní prostředky v Databricks Runtime 15.3 a níže katalog Unity kontroluje oprávnění vlastníka zobrazení i oprávnění uživatele zobrazení k podkladovým datům.
Toto chování se odráží v níže uvedených požadavcích. V obou případech musí vlastník zobrazení udržovat oprávnění k podkladovým datům, aby uživatelé mohli přistupovat k zobrazení.
- U všech výpočetních prostředků musíte mít
SELECTna samotném zobrazení,USE CATALOGv nadřazeném katalogu aUSE SCHEMAv nadřazeném schématu. To platí pro všechny typy výpočetních prostředků, které podporují katalog Unity, včetně SQL Warehouse, clusterů ve standardním režimu přístupu a clusterů ve vyhrazeném režimu přístupu ve službě Databricks Runtime 15.4 a vyšší. - U clusterů v Databricks Runtime 15.3 a níže, které používají režim vyhrazeného přístupu, musíte mít také
SELECTu všech tabulek a zobrazení, na která toto zobrazení odkazuje, kroměUSE CATALOGjejich nadřazených katalogů aUSE SCHEMAv nadřazených schématech.
Poznámka:
Pokud ve službě Databricks Runtime 15.4 LTS a novější používáte vyhrazený cluster a chcete se vyhnout požadavku SELECT na podkladové tabulky a zobrazení, ověřte, že je váš pracovní prostor povolený pro bezserverové výpočetní prostředky.
Bezserverové výpočetní prostředí zpracovává filtrování dat, které umožňuje přístup k zobrazení bez nutnosti oprávnění k podkladovým tabulkám a zobrazením. Mějte na paměti, že při použití vyhrazeného výpočetního prostředí k dotazování se můžou účtovat poplatky za výpočetní prostředky bez serveru. Další informace najdete v tématu Jemně odstupňované řízení přístupu k vyhrazeným výpočetním prostředkům.