Sdílet prostřednictvím


Interoperabilita formátů tabulek Delta Lake

V Microsoft Fabric je formát tabulky Delta Lake standardem pro analýzy. Delta Lake je opensourcová vrstva úložiště, která přináší transakce ACID (Atomicity, Consistency, Isolation, Durability) do úloh pro velké objemy dat a analýzy.

Všechna prostředí v rámci platformy Fabric nativně generují a využívají tabulky Delta Lake, což poskytuje jednotný zážitek z produktu. Tabulky Delta Lake vytvořené jedním výpočetním strojem, jako je Datový sklad Fabric nebo Synapse Spark, může využívat jakýkoli jiný stroj, jako je Power BI. Při příjmu dat do Fabric je ukládá ve výchozím nastavení jako tabulky Delta. Externí data obsahující tabulky Delta Lake můžete snadno integrovat pomocí klávesových zkratek OneLake.

Funkce Delta Lake a zkušenosti Fabric

Aby bylo dosaženo interoperability, všechna prostředí Fabric jsou v souladu s funkcemi Delta Lake a možnostmi Fabric. Některá prostředí mohou zapisovat pouze do tabulek Delta Lake, zatímco jiná z nich mohou číst.

  • Zapisovači: Datové sklady, datové toky událostí a exportované sémantické modely Power BI do OneLake
  • Čtenáři: Koncový bod analýzy SQL a sémantické modely Power BI Direct Lake
  • Autoři a čtenáři: Fabric Spark runtime, datové toky, kanály a databáze jazyka dotazů Kusto (KQL)

Následující matice ukazuje klíčové funkce Delta Lake a její dostupnost v jednotlivých prostředích Fabric.

Síťové možnosti Mapování sloupců Vektory odstranění Psaní ve formátu V-order Optimalizace a údržba tabulek Oddíly Klasifikace kapalin TIMESTAMP_NTZ Verze delta reader/writer a výchozí funkce tabulek
Export datového skladu Delta Lake Název: Ano
ID: Žádné
Ano Ano Ano Čtení: Není k dispozici (není k dispozici)
Napsat: Ne
Ne Ne Čtenář: 3
Autor: 7
Vektory odstranění,
Mapování sloupců (název)
Koncový bod analýzy SQL Název: Ano
ID: Žádné
Ano Neplatí Neplatí Číst: Ano
Napište: N/A (není použitelné)
Ano Ne Neplatí
Průzkumník Lakehouse a náhled Název: Ano
ID: Žádné
Ano Neplatí Ano Číst: Ano
Napište: N/A (není použitelné)
Ano Ano Neplatí
Fabric Spark Runtime 1.3 Název: Ano
ID: Ano
Ano Ano Ano Číst: Ano
Napsat: Ano
Ano Ano Čtenář: 1
Autor: 2
Prostředí Fabric Spark Runtime 1.2 Název: Ano
ID: Ano
Ano Ano Ano Číst: Ano
Napsat: Ano
Ano, jen pro čtení Ano Čtenář: 1
Autor: 2
Fabric Spark Runtime 1.1 Název: Ano
ID: Ano
Ne Ano Ano Číst: Ano
Napsat: Ano
Ano, jen pro čtení Ne Čtenář: 1
Autor: 2
Datové toky Gen2 Název: Ano
ID: Žádné
Ano Ano Ne Číst: Ano
Napsat: Ano
Ano, jen pro čtení Ne Čtenář: 1
Autor: 2
Pipelines Název: Ne
ID: Žádné
Ne Ano Ne Číst: Ano
Napsat: Ano, pouze přepsat
Ano, jen pro čtení Ne Čtenář: 1
Autor: 2
Sémantické modely Power BI Direct Lake Název: Ano
ID: Žádné
Ano Neplatí Neplatí Číst: Ano
Napište: N/A (není použitelné)
Ano Ne Neplatí
Export sémantických modelů Power BI do OneLake Název: Ano
ID: Žádné
Neplatí Ano Ne Čtení: Není k dispozici (není k dispozici)
Napsat: Ne
Ne Ne Čtenář: 2
Spisovatel: 5
Mapování sloupců (název)
Databáze KQL Název: Ano
ID: Žádné
Ano Ne Žádné* Číst: Ano
Napsat: Ano
Ne Ne Čtenář: 1
Zapisovač: 1
Eventstreams Název: Ne
ID: Žádné
Ne Ne Ne Čtení: Není k dispozici (není k dispozici)
Napsat: Ano
Ne Ne Čtenář: 1
Autor: 2

* Databáze KQL poskytují určité možnosti údržby tabulek, jako je uchovávání. Data se odeberou na konci doby uchovávání z OneLake. Další informace naleznete v tématu Jedna logická kopie.

Poznámka

  • Fabric ve výchozím nastavení nezapisuje mapování sloupců, s výjimkou případů, kdy je to uvedeno. Výchozí prostředí Fabric generuje tabulky, které jsou kompatibilní napříč službou. Tabulky Delta Lake vytvořené službami třetích stran můžou mít nekompatibilní funkce tabulek.
  • Některé prostředí infrastruktury nenabízí možnosti optimalizace a údržby tabulek, jako jsou bin-compaction, V-order, odstranění vektoru sloučení (PURGE) a vyčištění starých neodkazovaných souborů (VACUUM). Pokud chcete tabulky Delta Lake udržovat optimální pro analýzy, postupujte podle technik v funkci pro údržbu tabulek pro správu delta tabulek v prostředí Fabric u tabulek ingestovaných pomocí těchto zkušeností.

Aktuální omezení

Fabric v současné době nepodporuje tyto funkce Delta Lake:

  • Kontrolní body V2 nejsou jednotně dostupné ve všech prostředích. Jen poznámkové bloky Sparku a úlohy Sparku můžou číst a zapisovat do tabulek s kontrolními body V2. Lakehouse a SQL Analytics správně nevypisují tabulky obsahující soubory kontrolních bodů V2 ve __delta_log složce.
  • Delta Lake 3.x Uniform. Tato funkce se podporuje jenom ve výpočetních prostředcích Sparku pro přípravu dat (poznámkové bloky, úlohy Sparku).
  • Zápis identitních sloupců (funkce Azure Databricks)
  • Deklarativní kanály Lakeflow Spark (funkce Azure Databricks)
  • Funkce Delta Lake 4.x: Rozšíření typu, uspořádání, variantní typ, koordinované závazky.

Speciální znaky v názvech tabulek

Microsoft Fabric podporuje speciální znaky jako součást názvů tabulek. Tato funkce umožňuje použití znaků Unicode k vytváření názvů tabulek v prostředí Microsoft Fabric.

Následující speciální znaky jsou buď vyhrazené, nebo nejsou kompatibilní s alespoň jednou z technologií Microsoft Fabric a nesmí být použity jako součást názvu tabulky: " (dvojité uvozovky), ' (jednoduchá uvozovka), #, %, +, :, ?, ' (backtick).