Mi az adattárház a Microsoft Fabricben?

A következőkre vonatkozik: SQL Analytics-végpont és Warehouse a Microsoft Fabricben

A Microsoft Fabric egy olyan egységes terméket biztosít az ügyfelek számára, amely az adattulajdonuk minden aspektusát kezeli egy teljes, SaaS-ified Data, Analytics és AI platformmal, amely tóközpontú és nyitott. A Microsoft Fabric alapjai lehetővé teszik, hogy a kezdő felhasználó a tapasztalt szakembereken keresztül az adatbázis-, elemzési, üzenetkezelési, adatintegráció- és üzletiintelligencia-számítási feladatokat egy gazdag, könnyen használható, megosztott SaaS-élményben használja a Microsoft OneLake-vel, mint a középpontban.

Tóközpontú SaaS-élmény bármilyen képességszinthez

A Microsoft Fabric egy nagyvállalati szintű elosztott feldolgozási motorra épülő, tóközpontú adattárházat vezet be, amely nagy léptékben teszi lehetővé az iparág vezető teljesítményét, miközben nincs szükség konfigurálásra és felügyeletre. A Power BI-val szorosan integrálható, könnyen használható SaaS-felületnek köszönhetően a Microsoft Fabric warehouse az adattavak és a raktárak világát konvergálja azzal a céllal, hogy jelentősen leegyszerűsítse a szervezeteknek az elemzési tulajdonba történő befektetését. Az adatraktározási számítási feladatok kihasználják az SQL-motor gazdag funkcióit nyílt adatformátumban, így az ügyfelek a Microsoft OneLake-ben tárolt adataik egyetlen példányán keresztül összpontosíthatnak az adatok előkészítésére, elemzésére és jelentésére.

A Warehouse bármilyen képzettségi szinthez készült – a polgári fejlesztőtől a professzionális fejlesztőn át a DBA-n át az adatmérnökig. A Microsoft Fabric-munkaterületbe beépített gazdag szolgáltatáskészlet lehetővé teszi az ügyfelek számára, hogy a DirectLake módban integrálható, könnyen használható, mindig csatlakoztatott szemantikai modellel csökkentsék az elemzési időt. Ez lehetővé teszi az iparág vezető teljesítményét, amely biztosítja, hogy az ügyfél jelentése mindig a legfrissebb adatokkal rendelkezik az elemzéshez és a jelentéskészítéshez. Az adatbázisok közötti lekérdezések segítségével gyorsan és zökkenőmentesen használhat több adatforrást, amelyek több adatbázist is lefednek a gyors elemzésekhez és az adatkettőződések nélküli használathoz.

Adatbázisközi lekérdezéssel rendelkező virtuális raktárak

A Microsoft Fabric lehetővé teszi az ügyfelek számára, hogy billentyűparancsokkal felállíthassa az adatokat tartalmazó virtuális raktárakat, amelyek gyakorlatilag bármilyen forrásból származnak. Az ügyfelek létrehozhatnak egy virtuális raktárat úgy, hogy parancsikonokat hoznak létre az adataikhoz, bárhol is legyenek. A virtuális raktárak a OneLake-ből, az Azure Data Lake Storage-ból vagy bármely más felhőszolgáltatói tárolóból származó adatokat tartalmazhatnak egyetlen határon belül, és nem duplikálás nélkül.

A Microsoft Fabricben az adatbázisok közötti lekérdezések gazdagsága révén zökkenőmentesen feloldhatja a különböző adatforrásokból származó értékeket. Az adatbázisok közötti lekérdezés lehetővé teszi az ügyfelek számára, hogy gyorsan és zökkenőmentesen használjanak több adatforrást a gyors elemzésekhez és az adatok duplikálásának zéró gördülékenységéhez. A különböző forrásokban tárolt adatok egyszerűen összekapcsolhatók, lehetővé téve az ügyfelek számára, hogy olyan gazdag elemzéseket nyújtsanak, amelyek korábban jelentős erőfeszítéseket igényeltek az adatintegráció és a mérnöki csapatok részéről.

Az adatbázisközi lekérdezések a Visual Query-szerkesztőn keresztül hozhatók létre, amely kód nélküli elérési utat biztosít több tábla elemzéséhez. Az SQL Query-szerkesztő vagy más ismerős eszközök, például az SQL Server Management Studio (SSMS) adatbázisközi lekérdezések létrehozásához is használhatók.

Autonóm számítási feladatok kezelése

A Microsoft Fabric raktárai egy iparágvezető elosztott lekérdezésfeldolgozó motort használnak, amely természetes elkülönítési határral rendelkező számítási feladatokat biztosít az ügyfeleknek. Nincsenek olyan gombok, amelyek az erőforrások autonóm kiosztásával és visszaengedésével a lehető legjobb teljesítményt nyújtják az automatikus skálázás és az egyidejűség beépített használatával. A valódi elkülönítés a számítási feladatok különböző jellemzőkkel való elválasztásával érhető el, biztosítva, hogy az ETL-feladatok soha ne zavarják az alkalmi elemzési és jelentéskészítési számítási feladatokat.

Nyílt formátum a zökkenőmentes motor-együttműködéshez

A Warehouse-ban tárolt adatok parquet fájlformátumban vannak tárolva, és Delta Lake-naplókként vannak közzétéve, lehetővé téve az ACID-tranzakciókat és a motorközi együttműködést, amelyeket más Microsoft Fabric-számítási feladatok, például a Spark, a Pipelines, a Power BI és az Azure Data Explorer segítségével lehet kihasználni. Az ügyfeleknek már nem kell több másolatot készíteniük az adataikról, hogy lehetővé tegyék a különböző képességcsoportokkal rendelkező adatszakértők számára. A Pythonban való munkavégzéshez szokott adatmérnökök egyszerűen használhatják ugyanazokat az adatokat, amelyeket egy adattárház-szakember modellezett és szolgált ki, amely az SQL-ben való munkavégzéshez szokott. Ezzel párhuzamosan a BI-szakemberek gyorsan és egyszerűen használhatják ugyanazokat az adatokat a Power BI-vizualizációk gazdag készletének létrehozásához rekordteljesítmény és adatkettőződés nélkül.

A tárolás és a számítás szétválasztása

A számítás és a tárolás leválasztva van egy raktárban, amely lehetővé teszi az ügyfelek számára, hogy szinte azonnal méretezzék a vállalat igényeinek megfelelően. Ez lehetővé teszi, hogy több számítási motor olvasson bármilyen támogatott tárolási forrásból, robusztus biztonsági és teljes ACID tranzakciós garanciával.

Egyszerűen betölthető, betölthető és átalakítható nagy léptékben

Az adatok folyamatokon, adatfolyamokon, adatbázisközi lekérdezéseken vagy a COPY INTO parancson keresztül betölthetők a raktárba. A betöltést követően több üzleti csoport is elemezheti az adatokat olyan funkciókkal, mint a megosztás és az adatbázisok közötti lekérdezés. Az elemzéshez szükséges idő egy teljesen integrált BI-felületen keresztül, grafikus adatmodellezéssel, könnyen használható webes felületen, a Warehouse Editorban történő lekérdezéshez.

Adattárházelemek a Microsoft Fabricben

Két különböző adattárházelem létezik: a Lakehouse SQL Analytics-végpontja és a Warehouse.

A Lakehouse SQL Analytics-végpontja

Az SQL Analytics-végpontok olyan raktárak, amelyek automatikusan létrejönnek a Microsoft Fabric egyik Lakehouse-jából . Az ügyfél áttérhet a Lakehouse "Lake" nézetéről (amely támogatja az adatelemzést és az Apache Sparkot) ugyanazon Lakehouse "SQL" nézetére. Az SQL Analytics-végpont írásvédett, és az adatok csak a Lakehouse "Lake" nézetén keresztül módosíthatók a Spark használatával.

A Lakehouse SQL Analytics-végpontja révén a felhasználó olyan SQL-parancsok egy részhalmazával rendelkezik, amely definiálhat és lekérdezhet adatobjektumokat, de nem módosíthatja az adatokat. Az SQL Analytics-végponton a következő műveleteket hajthatja végre:

  • A tó Delta Lake-mappáiban lévő adatokra hivatkozó táblák lekérdezése.
  • Nézeteket, beágyazott TVF-eket és eljárásokat hozhat létre a szemantika és az üzleti logika beágyazásához a T-SQL-ben.
  • Az objektumok engedélyeinek kezelése.

Egy Microsoft Fabric-munkaterületen az SQL Analytics-végpont "SQL Analytics-végpont" címkével van ellátva a Típus oszlop alatt. Minden Lakehouse rendelkezik egy automatikusan létrehozott SQL Analytics-végpontgal, amely olyan ismert SQL-eszközökkel használható, mint az SQL Server Management Studio, az Azure Data Studio, a Microsoft Fabric SQL Lekérdezésszerkesztő.

Képernyőkép az SQL Analytics-végpont típusról a munkaterületen.

Az SQL Analytics-végpont használatának első lépéseit a Jobb együtt: a Microsoft Fabric tóháza és raktára című témakörben találhatja meg.

Synapse Data Warehouse

Egy Microsoft Fabric-munkaterületen a Synapse-adattárház vagy -raktár a Típus oszlop alatt "Warehouse" címkével van ellátva. A raktárak támogatják a tranzakciókat, a DDL-t és a DML-lekérdezéseket.

Képernyőkép a munkaterület Raktár típusával.

A csak olvasási lekérdezéseket és nézetek és TVF-eket támogató SQL Analytics-végpontokkal ellentétben a Warehouse teljes körű tranzakciós DDL- és DML-támogatással rendelkezik, amelyet egy ügyfél hoz létre. A raktárakat olyan támogatott adatbetöltési módszerek egyikével tölti fel, mint a COPY INTO, a Pipelines, az Dataflows vagy a keresztadatbázis-betöltési lehetőségek, például CREATE TABLE AS Standard kiadás LECT (CTAS), IN Standard kiadás RT.. Standard kiadás LECT vagy Standard kiadás LECT INTO.

A Warehouse használatának megkezdéséhez tekintse meg a Raktár létrehozása a Microsoft Fabricben című témakört.

A Lakehouse Warehouse és az SQL Analytics végpontjának összehasonlítása

Ez a szakasz a Microsoft Fabric Warehouse és AZ SQL Analytics végpontja közötti különbségeket ismerteti.

Az adattárház-háló munkaterületének diagramja, beleértve az SQL Analytics-végpontot és a Warehouse-t.

Az SQL Analytics-végpont egy írásvédett raktár, amely automatikusan létrejön a Microsoft Fabric egyik Lakehouse-jából való létrehozásakor. A Spark által egy Lakehouse-ban létrehozott deltatáblák automatikusan felderíthetők az SQL Analytics-végpontban táblákként. Az SQL Analytics-végpont lehetővé teszi az adatmérnökök számára, hogy relációs réteget építsenek a Lakehouse fizikai adataira, és elérhetővé tegyék azokat az SQL-kapcsolati sztring használó elemzési és jelentéskészítési eszközök számára. Az adatelemzők ezután a T-SQL használatával hozzáférhetnek a Lakehouse-adatokhoz a Synapse Data Warehouse használatával. Az SQL Analytics-végpont használatával tervezheti meg a raktárat a BI igényeihez és az adatok kiszolgálásához.

A Synapse Data Warehouse vagy Warehouse egy "hagyományos" adattárház, és támogatja a teljes tranzakciós T-SQL-képességeket, például egy vállalati adattárházat. Az SQL Analytics-végponttal szemben, ahol a táblák és adatok automatikusan létrejönnek, teljes mértékben szabályozhatja a táblák létrehozását, az adatok betöltését, átalakítását és lekérdezését az adattárházban a Microsoft Fabric portál vagy a T-SQL parancsok használatával.

Az adatok Microsoft Fabricben való lekérdezéséről további információt az SQL Analytics-végpont vagy a Microsoft Fabric warehouse lekérdezése című témakörben talál.

Különböző raktározási képességek összehasonlítása

Az elemzési használati esetek legjobb kiszolgálása érdekében számos különböző képesség áll rendelkezésre. Általában a raktár az összes többi képesség szuperhalmaza, amely szinergikus kapcsolatot biztosít a T-SQL-t biztosító összes többi elemzési ajánlat között.

A hálón belül vannak olyan felhasználók, akiknek el kell dönteniük a Warehouse, a Lakehouse és a Power BI adatmart között.

Microsoft Fabric-ajánlat

Raktár

A Lakehouse SQL Analytics-végpontja

Power BI datamart


Licencek

Fabric vagy Power BI Premium

Fabric vagy Power BI Premium

Csak Power BI Premium


Elsődleges képességek

ACID-kompatibilis, teljes körű adattárház- és tranzakciótámogatás a T-SQL-ben.

Csak olvasható, rendszer által létrehozott SQL Analytics-végpont a Lakehouse-hoz T-SQL-lekérdezéshez és -kiszolgáláshoz. Támogatja a Lakehouse Delta-táblák elemzését, valamint a billentyűparancsokkal hivatkozott Delta Lake-mappákat.

Kód nélküli adatraktározás és T-SQL-lekérdezés


Fejlesztői profil

SQL-fejlesztők vagy civil fejlesztők

adatmérnök vagy SQL-fejlesztők

Csak a polgár fejlesztője


Ajánlott használati eset

  • Adattárolás vállalati használatra
  • Adattárolás részleg, üzleti egység vagy önkiszolgáló használat támogatása
  • Strukturált adatelemzés a T-SQL-ben táblákkal, nézetekkel, eljárásokkal és funkciókkal, valamint speciális SQL-támogatással a BI-hoz
  • Delta-táblák felfedezése és lekérdezése a lakehouse-ból
  • Előkészítési adatok és archiválási zóna elemzéshez
  • Medallion lakehouse architektúra bronz-, ezüst- és aranyelemzési zónákkal
  • Párosítás a Warehouse-ral a nagyvállalati elemzési használati esetekhez
  • Kis részleg- vagy üzletági raktározási használati esetek
  • Önkiszolgáló adattárház-használati esetek
  • A Power BI-adatfolyamok kezdőzónája és a BI egyszerű SQL-támogatása

Fejlesztési tapasztalat

  • A Warehouse Editor teljes mértékben támogatja a T-SQL-adatok betöltését, modellezését, fejlesztését és felhasználói felületének lekérdezését az adatbetöltéshez, modellezéshez és lekérdezéshez
  • Olvasási/írási támogatás 1. és 3. féltől származó eszközökhöz
  • Lakehouse SQL Analytics-végpont korlátozott T-SQL-támogatással a nézetekhez, a táblaértékelt függvényekhez és az SQL-lekérdezésekhez
  • Felhasználói felületi élmények modellezéshez és lekérdezéshez
  • Korlátozott T-SQL-támogatás 1. és 3. féltől származó eszközökhöz
  • A Datamart-szerkesztő felhasználói felülettel és lekérdezésekkel támogatott
  • Felhasználói felületi élmények az adatok betöltéséhez, modellezéséhez és lekérdezéséhez
  • Írásvédett támogatás 1. és 3. féltől származó eszközökhöz

T-SQL-képességek

Teljes DQL-, DML- és DDL T-SQL-támogatás, teljes tranzakciótámogatás

Teljes DQL, Nincs DML, korlátozott DDL T-SQL-támogatás, például SQL-nézetek és TVF-ek

Csak teljes DQL


Az adatok betöltése

SQL, folyamatok, adatfolyamok

Spark, folyamatok, adatfolyamok, billentyűparancsok

Csak adatfolyamok


Delta-tábla támogatása

Delta-táblák olvasása és írása

Delta-táblák olvasása

N.a.


Tárolási réteg

Adatformátum megnyitása – Delta

Adatformátum megnyitása – Delta

N.a.


Automatikusan létrehozott séma a Lakehouse SQL Analytics-végpontjában

Az SQL Analytics-végpont kezeli az automatikusan létrehozott táblákat, hogy a munkaterület felhasználói ne módosíthassák őket. A felhasználók saját SQL-sémák, nézetek, eljárások és egyéb adatbázis-objektumok hozzáadásával bővíthetik az adatbázismodellt.

A Lakehouse minden Delta-táblájához az SQL Analytics-végpont automatikusan létrehoz egy táblát.

Az SQL Analytics-végpont táblái késéssel jönnek létre. Miután létrehozta vagy frissítette a Delta Lake mappát/táblát a tóban, a tóadatokra hivatkozó raktártábla nem lesz azonnal létrehozva/frissítve. A módosítások 5–10 másodperc után lesznek alkalmazva a raktárban.

Az SQL Analytics-végpont automatikus sémaadattípusaiért lásd : Adattípusok a Microsoft Fabricben.