Oktatóanyag: Adatok elemzése jegyzetfüzettel

A következőkre vonatkozik: SQL-végpont és -raktár a Microsoft Fabricben

Ebben az oktatóanyagban megtudhatja, hogyan mentheti az adatokat egyszer, majd hogyan használhatja azokat számos más szolgáltatással. A Azure Data Lake Storage-ben és az S3-ban tárolt adatokhoz is létrehozhat billentyűparancsokat, amelyekkel közvetlenül hozzáférhet a külső rendszerekről származó deltatáblákhoz.

Fontos

A Microsoft Fabric előzetes verzióban érhető el.

Tóház létrehozása

Először létrehozunk egy új tóházat. Új lakehouse létrehozása a Microsoft Fabric-munkaterületen:

  1. Válassza ki a Data Warehouse Tutorial munkaterületet a navigációs menüben.

  2. Válassza a + New>Lakehouse (előzetes verzió) lehetőséget.

    Képernyőkép a Háló portálról az + Új menüvel. A Lakehouse (előzetes verzió) pirossal van bekeretezett.

  3. A Név mezőbe írja be ShortcutExercise és válassza a Létrehozás lehetőséget.

    Képernyőkép a Háló portálról, amelyen az új tóház névmezője látható. A megadott név: ShortcutExercise.

  4. Az új tóház betöltődik, és megnyílik az Explorer nézet az Adatok lekérése a tóház menüjében . Az Adatok betöltése a tóházban területen válassza az Új parancsikon gombot.

    Képernyőkép a Háló portálról, amelyen az Adatok betöltése a tóház menüjében látható a kezdőlapon. Az Új parancsikon gomb pirossal van bejelölve.

  5. Az Új parancsikon ablakban válassza a Microsoft OneLake gombot.

    Képernyőkép a Háló portálról az Új parancsikon ablakról. A Microsoft OneLake gombja pirossal van bejelölve.

  6. Az Adatforrástípus kiválasztása ablakban görgessen végig a listán, amíg meg nem találja a korábban létrehozott raktártWideWorldImporters. Jelölje ki, majd válassza a Tovább gombot.

  7. A OneLake objektumböngészőben bontsa ki a Táblák elemet, bontsa ki a dbo sémát, majd válassza a mellette dimension_customerlévő választógombot. Válassza a Létrehozás gombot.

    Képernyőkép a Háló portálról a OneLake objektumböngészőről. A WideWorldImporters, Tables, dbo területen a dimension_customer pirosra van jelölve.

  8. Ha egy nevű mappát Unidentified lát a Táblák területen, válassza a Frissítés ikont a vízszintes menüsávon.

    Képernyőkép a Háló portálról a vízszintes menüsáv frissítés gombjáról, valamint a Lakehouse explorer ShortcutExercise területén található Azonosítatlan táblákról.

  9. dimension_customer Az adatok előnézetének megtekintéséhez válassza ki a Táblázat listában lévő elemet. Figyelje meg, hogy a lakehouse a Raktár táblából dimension_customer származó adatokat jeleníti meg!

    Képernyőkép a Háló portálról, amelyen a dimension_customer tábla adatelőnézete látható.

  10. Ezután hozzon létre egy új jegyzetfüzetet a dimension_customer tábla lekérdezéséhez. A Kezdőlap menüszalagon válassza a Jegyzetfüzet megnyitása legördülő menüt, és válassza az Új jegyzetfüzet lehetőséget.

    Képernyőkép a Háló portálról, amelyen a Jegyzetfüzet megnyitása gomb van lenyomva, és az Új jegyzetfüzet lehetőség van kiválasztva.

  11. Jelölje ki, majd húzza a dimension_customertáblázatot a Táblák listából a megnyitott jegyzetfüzetcellába. Láthatja, hogy egy PySpark-lekérdezés lett megírva, amely az összes adatot lekérdezi a fájlból ShortcutExercise.dimension_customer. Ez a jegyzetfüzet-élmény hasonló a Visual Studio Code Jupyter notebook-élményéhez. A jegyzetfüzetet a VS Code-ban is megnyithatja.

    Képernyőkép a Háló portál jegyzetfüzet nézetéről. A nyíl jelzi a dimension_customer kijelölésének útvonalát, majd húzza a megnyitott jegyzetfüzetcellába.

  12. A Kezdőlap menüszalagon válassza az Összes futtatása gombot. A lekérdezés befejezése után láthatja, hogy a PySpark segítségével egyszerűen lekérdezheti a Warehouse tábláit!

    Képernyőkép a Háló portálról a jegyzetfüzet futtatásának eredményeiről a dimension_customer adatainak megjelenítéséhez.

Következő lépések