Adattárház oktatóanyag – bevezetés

A következőkre vonatkozik: SQL Analytics-végpont és Warehouse a Microsoft Fabricben

A Microsoft Fabric egy egyablakos webáruházat biztosít minden vállalat elemzési igényeinek kielégítéséhez. Lefedi a szolgáltatások teljes spektrumát, beleértve az adatáthelyezést, a data lake-t, az adatelemzést, az adatintegrációt és az adatelemzést, a valós idejű elemzést és az üzleti intelligenciát. A Microsoft Fabricben nincs szükség több gyártó különböző szolgáltatásainak összefűzésére. Ehelyett az ügyfél egy teljes körű, nagy mértékben integrált, egyetlen átfogó terméket élvez, amely könnyen érthető, előkészíthető, létrehozható és működtethető. A piacon egyetlen más termék sem nyújtja a Microsoft Fabric által kínált integráció szélességét, mélységét és szintjét. Emellett a Microsoft Purview alapértelmezés szerint minden bérlőben megtalálható a megfelelőségi és szabályozási igények kielégítése érdekében.

Az oktatóanyag célja

Bár a Microsoft Fabric számos fogalma ismerős lehet az adat- és elemzési szakemberek számára, nehéz lehet ezeket a fogalmakat egy új környezetben alkalmazni. Ez az oktatóanyag lépésről lépésre végigvezeti a végpontok közötti forgatókönyvet az adatgyűjtéstől az adatfelhasználásig, hogy alapszintű ismereteket nyújtsunk a Microsoft Fabric felhasználói élményéről, a különböző szolgáltatásokról és azok integrációs pontjairól, valamint a Microsoft Fabric szakmai és állampolgári fejlesztői élményéről.

Az oktatóanyagok nem referenciaarchitektúrák, a funkciók és funkciók teljes listája, vagy konkrét ajánlott eljárásokra vonatkozó javaslatok.

Az adattárház végpontok közötti forgatókönyve

Az oktatóanyag előfeltételeként végezze el a következő lépéseket:

  1. Jelentkezzen be a Power BI online fiókjába, vagy ha még nincs fiókja, regisztráljon egy ingyenes próbaverzióra.
  2. Engedélyezze a Microsoft Fabricet a bérlőjében.

Ebben az oktatóanyagban egy warehouse-fejlesztő szerepét veszi át a kitalált Wide World Importers vállalatnál, és végrehajtja a Következő lépéseket a Microsoft Fabric portálon egy teljes körű adattárház-megoldás létrehozásához és implementálásához:

  1. Hozzon létre egy Microsoft Fabric-munkaterületet.
  2. Hozzon létre egy raktárat.
  3. Adatok betöltése a forrásból az adattárház dimenziós modelljébe egy adatfolyammal.
  4. Hozzon létre táblákat a raktárban.
  5. Adatok betöltése a T-SQL-lel az SQL-lekérdezésszerkesztővel.
  6. Alakítsa át az adatokat összesített adathalmazok T-SQL használatával történő létrehozásához.
  7. A vizualizációs lekérdezésszerkesztővel kérdezheti le az adattárházat.
  8. Adatok elemzése jegyzetfüzettel.
  9. Raktárközi lekérdezések létrehozása és végrehajtása az SQL-lekérdezésszerkesztővel.
  10. Power BI-jelentések létrehozása DirectLake módban az adatok helyben történő elemzéséhez.
  11. Készítsen jelentést a Data Hubról.
  12. Törölje az erőforrásokat a munkaterület és más elemek törlésével.

Az adattárház végpontok közötti architektúrája

Az adattárház végpontok közötti architektúrát bemutató diagram.

Adatforrások – A Microsoft Fabric segítségével egyszerűen és gyorsan csatlakozhat az Azure Data Serviceshez, más felhőplatformokhoz és helyszíni adatforrásokhoz az adatok betöltéséhez.

Betöltés – A Microsoft Fabric-folyamat részeként több mint 200 natív összekötővel, valamint az adatfolyamokkal végzett adatátalakítással gyorsan létrehozhat elemzéseket a szervezet számára. A Billentyűparancs a Microsoft Fabric új funkciója, amely lehetővé teszi a meglévő adatokhoz való csatlakozást anélkül, hogy át kellene másolnia vagy áthelyeznie. Az oktatóanyag későbbi részében további részleteket talál a Billentyűparancs funkcióról.

Átalakítás és tárolás – A Microsoft Fabric a Delta Lake formátumot szabványosítja, ami azt jelenti, hogy a Microsoft Fabric minden motorja képes olvasni és dolgozni a OneLake-ben tárolt adatokon – nincs szükség adat-duplikációra. Ez a tároló lehetővé teszi egy adattárház vagy adatháló kiépítését a szervezeti igényeinek megfelelően. Az átalakításhoz választhatja a folyamatok/adatfolyamok alacsony kódszámú vagy kód nélküli felületét, vagy használhatja a T-SQL-t a kód első élményéhez.

Felhasználás – A raktárból származó adatokat a Power BI, az iparág vezető üzletiintelligencia-eszköze használhatja fel jelentéskészítéshez és vizualizációhoz. Minden raktár beépített TDS-végponttal rendelkezik, amellyel szükség esetén egyszerűen csatlakozhat és lekérdezhet adatokat más jelentéskészítő eszközökről. A raktár létrehozásakor a rendszer egy másodlagos elemet, úgynevezett alapértelmezett szemantikai modellt hoz létre egyidejűleg ugyanazzal a névvel. Az alapértelmezett szemantikai modell használatával néhány lépéssel elkezdheti az adatok vizualizációját.

Mintaadatok

A mintaadatokhoz a Wide World Importers (WWI) mintaadatbázist használjuk. Az adattárház végpontok közötti forgatókönyvéhez elegendő adatot hoztunk létre ahhoz, hogy betekintsünk a Microsoft Fabric platform méretezési és teljesítménybeli képességeibe.

A Wide World Importers (WWI) egy nagykereskedelmes termékimportátor és forgalmazó, amely a San Francisco-öböl térségéből működik. Nagykereskedőként a WWI ügyfelei többnyire olyan vállalatok, amelyek magánszemélyeknek adnak el. WWI értékesíti a kiskereskedelmi ügyfelek az egész Egyesült Államok beleértve a speciális üzletek, szupermarketek, számítástechnikai üzletek, turisztikai attrakciós üzletek, és néhány személy. A WWI más nagykereskedőknek is értékesít ügynökök hálózatán keresztül, akik a WWI nevében reklámozzák a termékeket. Ha többet szeretne megtudni a vállalati profiljukról és működésükről, tekintse meg a Wide World Importers mintaadatbázisait a Microsoft SQL-hez.

A tranzakciós rendszerekből (vagy üzletági alkalmazásokból) származó adatokat általában egy adattóba vagy adattárház-előkészítési területre kell vinni. Ebben az oktatóanyagban azonban a WWI által biztosított dimenziómodellt használjuk kezdeti adatforrásként. Forrásként használjuk az adatok adattárházba való betöltéséhez és T-SQL-en keresztüli átalakításához.

Adatmodell

Bár a WWI dimenziómodell több ténytáblát is tartalmaz, ebben az oktatóanyagban csak a fact_sale táblára és annak kapcsolódó dimenzióira összpontosítunk az alábbiak szerint, hogy bemutassuk ezt a végpontok közötti adattárház-forgatókönyvet:

Az oktatóanyagban használt adatmodellt bemutató diagram, amely tartalmazza a fact_sale táblát és annak kapcsolódó dimenzióit.

Következő lépés