Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek poskytuje přehled tabulek, zobrazení, streamovaných tabulek a materializovaných zobrazení v Azure Databricks.
Stůl
Tabulka je strukturovaná datová sada uložená v určitém umístění. Výchozí typ tabulky vytvořený v Azure Databricks je spravovaná tabulka služby Unity Catalog. Tabulky je možné dotazovat a manipulovat s nimi pomocí příkazů SQL nebo rozhraní API datového rámce, podpůrných operací, jako jsou INSERT, UPDATE, DELETEa MERGE INTO. Zobrazení tabulek Azure Databricks
Zobrazit
Zobrazení je virtuální tabulka definovaná dotazem, který neukládá data a může prezentovat data z jedné nebo více tabulek v určitém formátu nebo abstrakci. Zobrazení jsou užitečná pro zjednodušení složitých dotazů, zapouzdření obchodní logiky a zajištění konzistentního rozhraní pro podkladová data bez duplikování úložiště. Podívejte se co je to zobrazení?
Materializované zobrazení
Podobně jako v zobrazení je materializované zobrazení definováno dotazem. Na rozdíl od zobrazení ale materializované zobrazení předkomputuje a uloží výsledek dotazu. Dotazy mohou běžet rychleji na materializovaném zobrazení než na běžných zobrazeních, ale zabírají dodatečné úložiště. Databricks SQL můžete použít k vytvoření a aktualizaci samostatného materializovaného zobrazení nebo použití deklarativních kanálů Sparku Lakeflow k vytvoření a aktualizaci jednoho nebo více materializovaných zobrazení, streamovaných tabulek a zobrazení. Viz Použití materializovaných zobrazení v Databricks SQL a materializovaných zobrazeních.
Streamovaná tabulka
Streamovaná tabulka je typ spravované tabulky Katalogu Unity, která zahrnuje logiku zpracování pomocí toků k jejímu definování. You can use Databricks SQL to create and refresh a standalone streaming table or use Lakeflow Spark Declarative Pipelines to create and refresh one or more streaming tables, materialized views, and views. Databricks SQL můžete použít k vytvoření a aktualizaci samostatné streamované tabulky nebo k použití deklarativních kanálů Spark Lakeflow k vytvoření a aktualizaci jedné nebo více streamovaných tabulek, materializovaných zobrazení a výhledů. Viz Použijte streamované tabulky v Databricks SQL a streamované tabulky.
Materializované zobrazení vs. streamovací tabulka
Materializovaná zobrazení a streamované tabulky jsou dva běžné datové objekty používané pro přípravu dat. Materializovaná zobrazení používají sémantiku dávky a streamované tabulky používají sémantiku streamování. Porovnání dávkového a streamovaného zpracování a úvahy o jejich výběru pro úlohy datového inženýrství najdete v článku Porovnání dávkového a streamovaného zpracování dat v Azure Databricks.