Sdílet prostřednictvím


Co jsou datové sklady v Microsoft Fabric?

Platí pro:✅ Koncový bod sql Analytics a sklad v Microsoft Fabric

Fabric Data Warehouse je relační sklad v podnikovém měřítku na základu Data Lake.

  • Ideální případy použití pro Službu Fabric Data Warehouse jsou hvězdicová nebo sněhová schémata, kurátorovaná firemní datová tržiště, řízené sémantické modely pro business intelligence.
  • Data datového skladu Fabric, stejně jako všechna data fabric, se ukládají v tabulkách Delta, což jsou datové soubory Parquet s transakčním protokolem založeným na souborech. Založený na otevřeném datovém formátu Fabric umožňuje sklad sdílení a spolupráci mezi datovými inženýry a firemními uživateli bez ohrožení zabezpečení nebo zásad správného řízení.
  • Služba Fabric Data Warehouse se primárně vyvíjí s T-SQL a sdílí velkou plochu založenou na databázovém stroji SQL s plnou podporou transakcí ACID s více tabulkami, materializovanými zobrazeními, funkcemi a uloženými procedurami.
  • Hromadné načítání datového skladu Prostředků infrastruktury je možné provést prostřednictvím připojení T-SQL a TDS nebo přes Spark s hromadným zápisem dat přímo do tabulek Delta.
  • Snadno použitelné prostředí SaaS je také úzce integrované s Power BI pro snadnou analýzu a vytváření sestav.

Zákazníci datového skladu využívají:

  • Dotazy napříč databázemi můžou používat více zdrojů dat pro rychlé přehledy s nulovou duplikací dat.
  • Snadné ingestování, načítání a transformace dat ve velkém měřítku prostřednictvím kanálů, toků dat, dotazů napříč databázemi nebo příkazu COPY INTO.
  • Autonomní správa pracovního zatížení s špičkovým distribuovaným enginem pro zpracování dotazů znamená, že není třeba upravovat žádné parametry, aby bylo dosaženo nejlepšího výkonu ve své třídě.
  • Škálujte téměř okamžitě tak, aby splňovaly obchodní požadavky. Úložiště a výpočetní prostředky jsou oddělené.
  • Data se automaticky replikují do OneLake Files pro externí přístup.
  • Vytvořené pro libovolnou úroveň dovedností od občanského vývojáře po DBA nebo datového inženýra.

Položky datového skladu

Datový sklad Fabric není tradičním podnikovým datovým skladem, je to sklad lake, který podporuje dvě různé skladové položky: položku skladu Fabric a položku koncového bodu analýzy SQL. Obě jsou účelově vytvořené tak, aby splňovaly obchodní potřeby zákazníků a současně poskytovaly nejlepší výkon třídy, minimalizovaly náklady a snížily administrativní režii.

Datový sklad fabricu

V pracovním prostoru Microsoft Fabric je sklad Fabric označený jako Sklad ve sloupci Typ . Pokud potřebujete plné možnosti napájení a transakcí (podpora dotazů DDL a DML) datového skladu, jedná se o rychlé a jednoduché řešení.

Snímek obrazovky znázorňující typ skladu v pracovním prostoru

Sklad lze naplnit některou z podporovaných metod příjmu dat, jako je COPY INTO, Pipelines, Dataflows nebo možnosti příjmu dat mezi databázemi, jako CREATE TABLE AS SELECT (CTAS), INSERT..SELECT nebo SELECT INTO.

Chcete-li začít s provozem skladu, přečtěte si:

Koncový bod analýzy SQL pro Lakehouse

V pracovním prostoru Microsoft Fabric má každý Lakehouse automaticky generovaný "SQL analytický koncový bod", který se dá použít k přechodu z "Lake" pohledu Lakehouse (který podporuje přípravu dat a Apache Spark) do "SQL" pohledu stejného Lakehouse k vytváření zobrazení, funkcí, uložených procedur a aplikaci zabezpečení SQL.

Snímek obrazovky znázorňující typ koncového bodu SQL Analytics v pracovním prostoru

Pomocí podobné technologie, skladu, databáze SQL a Fabric OneLake se při vytváření automaticky zřídí koncový bod analýzy SQL.

Pomocí koncového bodu analýzy SQL můžou příkazy T-SQL definovat a dotazovat datové objekty, ale ne manipulovat s daty ani je upravovat. V koncovém bodu analýzy SQL můžete provést následující akce:

  • Dotazujte se na tabulky, které odkazují na data ve složkách Delta Lake v jezeře.
  • Vytvářejte zobrazení, vložené TVF a procedury pro zapouzdření vaší sémantiky a obchodní logiky v T-SQL.
  • Umožňuje spravovat oprávnění k objektům. Další informace o zabezpečení v koncovém bodu sql anlaytics najdete v tématu Zabezpečení OneLake pro koncové body analýzy SQL.

Pokud chcete začít s koncovým bodem sql Analytics, přečtěte si:

Sklad nebo jezero

Při rozhodování mezi používáním skladu nebo jezera je důležité zvážit konkrétní potřeby a kontext požadavků na správu a analýzu dat.

  • Datový sklad vyberte, když potřebujete řešení na podnikové úrovni s otevřeným standardním formátem, bez výkonu uzlů a minimálního nastavení.  Nejvhodnější pro částečně strukturované a strukturované formáty dat je datový sklad vhodný pro začátečníky i zkušené odborníky na data a nabízí jednoduché a intuitivní prostředí.

  • Pokud potřebujete velké úložiště vysoce nestrukturovaných dat z heterogenních zdrojů a chcete spark používat jako primární vývojový nástroj, zvolte jezero . Jako "jednoduchý" datový sklad máte vždy možnost používat koncový bod sql Analytics a nástroje T-SQL k poskytování scénářů generování sestav a analýzy dat ve vašem jezeře.

Kdykoli budete mít příležitost přidat jeden nebo druhý v pozdějším okamžiku, pokud se vaše obchodní potřeby změní a bez ohledu na to, kde začnete, bude sklad i lakehouse používat stejný výkonný modul SQL pro všechny dotazy T-SQL.

Podrobnější pokyny k rozhodování najdete v průvodci rozhodováním Microsoft Fabric: Volba mezi skladem a lakehousem.

Migration

Pomocí nástroje Fabric Migration Assistant pro Data Warehouse můžete migrovat z Azure Synapse Analytics, SQL Serveru a dalších platforem databázového stroje SQL. Projděte si metody plánování migrace a migrace pro vyhrazené fondy SQL služby Azure Synapse Analytics do služby Fabric Data Warehouse.

Pokyny k migraci napříč Microsoft Fabric najdete v přehledu nástrojů a odkazů v přehledu migrace Microsoft Fabric.