Oktatóanyag: KQL-adatbázis lekérdezése jegyzetfüzettel az Apache Spark használatával

Fontos

A Microsoft Fabric jelenleg előzetes verzióban érhető el. Ezek az információk egy előzetes termékre vonatkoznak, amely a kiadás előtt lényegesen módosítható. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát az itt megadott információkra vonatkozóan.

A jegyzetfüzetek egyaránt olvasható dokumentumok, amelyek adatelemzési leírásokat és eredményeket, valamint végrehajtható dokumentumokat tartalmaznak, amelyek adatelemzéshez futtathatók. Ebből a cikkből megtudhatja, hogyan olvashat és írhat adatokat egy KQL-adatbázisba egy Microsoft Fabric-jegyzetfüzet használatával az Apache Spark használatával. Ez az oktatóanyag előre létrehozott adathalmazokat és jegyzetfüzeteket használ a Valós idejű elemzésekben és a Microsoft Fabric adattervezés környezeteiben. További információ a jegyzetfüzetekről: A Microsoft Fabric-jegyzetfüzetek használata.

Pontosabban az alábbiakat sajátíthatja el:

  • KQL-adatbázis létrehozása
  • Jegyzetfüzet importálása
  • Adatok írása KQL-adatbázisba az Apache Spark használatával
  • Adatok lekérdezése KQL-adatbázisból

Előfeltételek

1 – KQL-adatbázis létrehozása

  1. Nyissa meg a felületváltót a navigációs ablak alján, és válassza a Valós idejű elemzés lehetőséget.

  2. Válassza a KQL-adatbázis (előzetes verzió) csempét.

    Képernyőkép a Real-Time Analytics új KQL-adatbáziscsempéiről.

  3. A KQL-adatbázis neve mezőbe írja be a nycGreenTaxi nevet, majd válassza a Létrehozás lehetőséget.

    A KQL-adatbázis a kijelölt munkaterület környezetében lett létrehozva.

  4. Másolja ki a lekérdezési URI-t az adatbázis-irányítópult adatbázis-adatkártyájáról , és illessze be valahova, például egy jegyzettömbbe, hogy egy későbbi lépésben használhassa.

     Képernyőkép az adatbázis részleteit megjelenítő adatbázis-adatkártyáról. Az URI másolása című lekérdezési URI-beállítás ki van emelve.

2 – Az NYC GreenTaxi jegyzetfüzetének letöltése

Létrehoztunk egy mintajegyzetfüzetet, amely végigvezeti Az adatok az adatbázisba a Spark-összekötővel való betöltéséhez szükséges összes lépésen.

  1. Nyissa meg a Fabric-minták adattárát a GitHubon a NYC GreenTaxi KQL-jegyzetfüzet letöltéséhez.

    Képernyőkép a GitHub-adattárról, amelyen az NYC GreenTaxi jegyzetfüzet látható. A Nyers beállítás ki van emelve.

  2. Mentse a jegyzetfüzetet helyileg az eszközére.

    Megjegyzés

    A jegyzetfüzetet fájlformátumban .ipynb kell menteni.

3 – A jegyzetfüzet importálása

A munkafolyamat többi része a termék adattervezés szakaszában történik, és egy Spark-jegyzetfüzet használatával tölti be és kérdezi le az adatokat a KQL-adatbázisban.

  1. Nyissa meg a felületváltót a navigációs ablak alján, és válassza a adattervezés lehetőséget.

  2. Válassza a Jegyzetfüzet importálása lehetőséget.

    Képernyőkép a adattervezés elembeállításairól. A Jegyzetfüzet importálása elem ki van emelve.

  3. Az Importálás állapota ablakban válassza a Feltöltés lehetőséget.

    Képernyőkép az Importálás állapota ablakról. A Feltöltés gomb ki van emelve.

  4. Válassza ki az előző lépésben letöltött NYC GreenTaxi-jegyzetfüzetet.

  5. Az importálás befejezése után térjen vissza a munkaterületre a jegyzetfüzet megnyitásához.

4 – Adatok lekérése

Ha a Spark-összekötővel szeretné lekérdezni az adatbázist, olvasási és írási hozzáférést kell adnia a NYC GreenTaxi blobtárolóhoz.

A lejátszás gombra kattintva futtassa a következő cellákat, vagy jelölje ki a cellát, és nyomja le a Shift+ Enter billentyűkombinációt. Ismételje meg ezt a lépést az egyes kódcellák esetében.

Megjegyzés

Várja meg, amíg a befejezési pipa megjelenik a következő cella futtatása előtt.

  1. Futtassa az alábbi cellát az NYC GreenTaxi blobtárolóhoz való hozzáférés engedélyezéséhez.

    Képernyőkép az első kódcelláról, amelyen a tárelérési adatok láthatók.

  2. A KustoURI-ban illessze be a korábban másoltlekérdezési URI-t a helyőrző szöveg helyett.

  3. Módosítsa a helyőrző adatbázis nevét nycGreenTaxi névre.

  4. Módosítsa a helyőrző tábla nevét GreenTaxiData névre.

    A céladatbázis adatait megjelenítő második kódcella képernyőképe. A lekérdezés URI-ja, az adatbázis neve és a tábla neve ki van emelve.

  5. Futtassa a cellát.

  6. Futtassa a következő cellát az adatok adatbázisba való írásához. A lépés végrehajtása eltarthat néhány percig.

    Képernyőkép a harmadik kódcelláról, amelyen a táblaleképezés és a betöltési parancs látható.

Az adatbázis most már betölti az adatokat egy GreenTaxiData nevű táblába.

5 – A jegyzetfüzet futtatása

Futtassa a fennmaradó két cellát egymás után a tábla adatainak lekérdezéséhez. Az eredmények az év során rögzített 20 legmagasabb és legalacsonyabb taxidíjat és távolságot mutatják.

Képernyőkép a negyedik és az ötödik kódcelláról, amelyen a lekérdezés eredményei láthatók.

6 – Erőforrások törlése

Törölje a létrehozott elemeket, ha arra a munkaterületre navigál, amelyben létrehozták őket.

  1. A munkaterületen vigye az egérmutatót a törölni kívánt jegyzetfüzet fölé, válassza a Továbbiak menüt [...] >Törlés.

    Képernyőkép a munkaterületről, amelyen az NYC GreenTaxi jegyzetfüzet legördülő menüje látható. A Törlés lehetőség ki van emelve.

  2. Válassza a Törlés elemet. A jegyzetfüzet törlése után nem állítható helyre.

Következő lépések