Zdieľať cez


Čo je skladovanie údajov v službe Microsoft Fabric?

Vzťahuje sa na:✅ koncový bod analýzy SQL a sklad v službe Microsoft Fabric

Microsoft Fabric je riešenie novej generácie na skladovanie údajov v rámci služby Microsoft Fabric.

Sklad zameraný na jazero je postavený na nástroji na distribuované spracovanie na podnikovej úrovni, ktorý umožňuje špičkové škálovanie výkonu a zároveň minimalizuje potrebu konfigurácie a správy. Vďaka službe Data Lake a navrhnutej na natívne podporu formátov otvorených údajov umožňuje sklad údajov služby Fabric bezproblémovú spoluprácu medzi dátovými inžiniermi a podnikovými používateľmi bez vplyvu na zabezpečenie alebo riadenie.

Jednoducho použiteľný spôsob práce so systémom SaaS je tiež úzko integrovaný so službou Power BI pre jednoduchú analýzu a vytváranie zostáv, zlučovanie sveta dátových jazier a skladov a výrazne zjednodušenie investícií organizácií do ich analytického majetku. 

Zákazníci skladu údajov môžu využívať:

  • Údaje uložené vo formáte Delta-parquet umožňujú transakcie ACID a interoperabilitu s inými službami Fabric znamená, že nepotrebujete viac kópií údajov.
  • Dotazy krížovej databázy môžu na rýchle prehľady s duplikáciami nulových údajov použiť viacero zdrojov údajov.
  • Jednoducho ingestujte, načítajte a transformujte údaje na škálovanie prostredníctvom kanálov, tokov údajov, dotazu krížovej databázy alebo príkazu COPY INTO.
  • Autonómna správa vyťaženia s popredným distribuovaným spracovacím strojom dotazov znamená, že žiadne gombíky na dosiahnutie najlepšieho výkonu v triede.
  • Škálovanie takmer okamžite na splnenie požiadaviek podniku. Úložisko a výpočet sú oddelené.
  • Skrátený čas na prehľady s ľahko použiteľným a vždy prepojeným sémantickým modelom, ktorý je integrovaný so službou Power BI v režime Direct Lake. Zostavy majú vždy najnovšie údaje na analýzu a vytváranie zostáv.
  • Vytvorené pre ľubovoľnú úroveň zručností – od občianskych vývojárov až po databázu DBA alebo dátového inžiniera.

Položky skladu údajov

Fabric Warehouse nie je tradičným podnikovým skladom údajov. Ide o sklad jazier, ktorý podporuje dve odlišné skladové položky: sklad údajov služby Fabric a koncový bod analýzy SQL. Oba nástroje sú účelovo vytvorené na splnenie obchodných potrieb zákazníkov a zároveň poskytujú najlepší výkon v triede, minimalizujú náklady a znižujú administratívne náklady.

Synapse – sklad údajov

V pracovnom priestore služby Microsoft Fabric je v stĺpci Type (Typ) označený ako Warehouse (Sklad údajov služby Synapse). Keď potrebujete plnú silu a transakčné možnosti (podpora dotazov DDL a DML) skladu údajov, ide o rýchle a jednoduché riešenie.

Snímka obrazovky zobrazujúca typ skladu v pracovnom priestore.

Sklad môže byť vyplnený niektorou z podporovaných metód príjmu údajov, ako napríklad KOPÍROVAŤ DO, Kanály, Toky údajov alebo krížové možnosti príjmu databázy, ako napríklad VYTVORIŤ TABUĽKU AKO SELECT (CTAS)alebo VLOŽIŤ.. VYBERTE POLOŽKU ALEBO VYBERTE POLOŽKU DO.

Ak chcete začať pracovať so skladom, pozrite si tému:

Vytvorenie skladu v službe Microsoft Fabric

Koncový bod analýzy SQL služby Lakehouse

V pracovnom priestore služby Microsoft Fabric má každý lakehouse automaticky generovaný koncový bod analýzy SQL, ktorý možno použiť na prechod zo zobrazenia Lakehouse (ktoré podporuje dátové inžinierstvo a Apache Spark) na zobrazenie SQL pre ten istý Lakehouse na vytváranie zobrazení, funkcií, uložených procedúr a použitia zabezpečenia SQL.

Snímka obrazovky znázorňujúca typ koncového bodu analýzy SQL v pracovnom priestore.

Pomocou koncového bodu analýzy SQL v službe Lakehouse môžu príkazy T-SQL definovať a dotazovať údajové objekty, ale nemanipulovať ani upravovať údaje. V koncovom bode analýzy SQL môžete vykonávať nasledujúce akcie:

  • Dotazujte tabuľky, ktoré odkazujú na údaje v priečinkoch Delta Lake v jazere.
  • Vytvorte zobrazenia, vnorené súbory TVFS a postupy na zapuzdrenie sémantiky a obchodnej logiky v T-SQL.
  • Spravovať povolenia pre objekty.

Ak chcete začať pracovať s koncovým bodom analýzy SQL, pozrite si tému:

Warehouse alebo lakehouse

Pri rozhodovaní medzi používaním skladu alebo jazera je dôležité zohľadniť konkrétne potreby a kontext vašich požiadaviek na správu údajov a analýzu. Rovnako dôležité je, že to nie je jednosmerné rozhodnutie!

Ak by sa vaša firma mala zmeniť, vždy budete mať možnosť pridať jednu alebo druhú bez ohľadu na to, kde začať, sklad aj lakehouse používajú rovnaký výkonný nástroj SQL pre všetky dotazy T-SQL.

Tu je niekoľko všeobecných pokynov, ktoré vám pomôžu pri rozhodovaní:

  • Vyberte sklad údajov vtedy, keď potrebujete riešenie v podniku s otvoreným štandardným formátom, žiadnymi gombíkmi a minimálnym nastavením.  Sklad údajov je vhodný pre čiastočne štruktúrované a štruktúrované formáty údajov a je vhodný pre začiatočníkov aj skúsených odborníkov na údaje, čo ponúka jednoduché a intuitívne prostredie.

  • Vyberte si úložisko lakehouse, keď potrebujete veľký odkladací priestor s vysoko neštruktúrovanými údajmi z heterogénnych zdrojov, pričom využívate úložisko objektov za nízku cenu a chcete použiť SPARK ako svoj primárny vývojový nástroj. Keďže pôsobíte ako "ľahký" sklad údajov, máte vždy možnosť používať koncový bod SQL a nástroje T-SQL na poskytovanie zostáv a scenárov údajovej inteligencie vo vašom úložisku Lakehouse.

Podrobnejšie rozhodovacie pokyny nájdete v téme Príručka k rozhodnutiam služby Microsoft Fabric: Výber medzi warehouse a Lakehouse.