Megosztás a következőn keresztül:


Oktatóanyag: Jegyzetfüzet használata az Apache Spark használatával KQL-adatbázis lekérdezéséhez

A jegyzetfüzetek olvasható dokumentumok, amelyek adatelemzési leírásokat és eredményeket, valamint végrehajtható dokumentumokat tartalmaznak, amelyek adatelemzéshez futtathatók. Ebből a cikkből megtudhatja, hogyan olvashat és írhat adatokat egy KQL-adatbázisba egy Microsoft Fabric-jegyzetfüzet használatával az Apache Spark használatával. Ez az oktatóanyag előre létrehozott adathalmazokat és jegyzetfüzeteket használ a Valós idejű intelligencia és a Microsoft Fabric adatmérnök környezeteiben. A jegyzetfüzetekről további információt a Microsoft Fabric-jegyzetfüzetek használata című témakörben talál.

Pontosabban az alábbiakat sajátíthatja el:

  • KQL-adatbázis létrehozása
  • Jegyzetfüzet importálása
  • Adatok írása KQL-adatbázisba az Apache Spark használatával
  • Adatok lekérdezése KQL-adatbázisból

Előfeltételek

1 – KQL-adatbázis létrehozása

  1. Nyissa meg a felületváltót a navigációs ablak alján, és válassza a Valós idejű intelligencia lehetőséget.

  2. Válassza ki a KQL-adatbázis csempét.

    Képernyőkép az új KQL-adatbázis csempéről a Valós idejű intelligencia szolgáltatásban.

  3. A KQL-adatbázis neve mezőbe írja be a nycGreenTaxi nevet, majd válassza a Létrehozás lehetőséget.

    A KQL-adatbázis a kijelölt munkaterület környezetében lett létrehozva.

  4. Másolja ki a lekérdezési URI-t az adatbázis-adatkártyáról az adatbázis irányítópultján, és illessze be valahová, például egy jegyzettömbbe egy későbbi lépésben való használathoz.

     Képernyőkép az adatbázis részleteit megjelenítő adatbázis-adatkártyáról. Az URI másolása című lekérdezési URI-beállítás ki van emelve.

2 – Az NYC GreenTaxi jegyzetfüzetének letöltése

Létrehoztunk egy mintajegyzetfüzetet, amely végigvezeti az adatok Spark-összekötővel való betöltéséhez szükséges összes lépésen.

  1. Nyissa meg a Fabric-minták adattárát a GitHubon az NYC GreenTaxi KQL-jegyzetfüzet letöltéséhez.

    Képernyőkép a GitHub-adattárról, amelyen az NYC GreenTaxi-jegyzetfüzet látható. A Nyers beállítás ki van emelve.

  2. Mentse a jegyzetfüzetet helyileg az eszközére.

    Feljegyzés

    A jegyzetfüzetet fájlformátumban .ipynb kell menteni.

3 – A jegyzetfüzet importálása

A munkafolyamat többi része a termék adatmérnök szakaszában történik, és egy Spark-jegyzetfüzet használatával tölti be és kérdezi le az adatokat a KQL-adatbázisban.

  1. Nyissa meg az élménykapcsolót a navigációs ablak alján, és válassza a adatmérnök lehetőséget.

  2. Válassza a Jegyzetfüzet importálása lehetőséget.

    Képernyőkép a adatmérnök elembeállításairól. A jegyzetfüzet importálása című elem ki van emelve.

  3. Az Importálás állapotablakban válassza a Feltöltés lehetőséget.

    Képernyőkép az Importálás állapotablakról. A Feltöltés gomb ki van emelve.

  4. Válassza ki az előző lépésben letöltött NYC GreenTaxi-jegyzetfüzetet.

  5. Az importálás befejezése után térjen vissza a munkaterületre a jegyzetfüzet megnyitásához.

4 – Adatok lekérése

Az adatbázis Spark-összekötővel való lekérdezéséhez olvasási és írási hozzáférést kell adnia az NYC GreenTaxi blobtárolóhoz.

A lejátszás gombra kattintva futtassa a következő cellákat, vagy jelölje ki a cellát, és nyomja le a Shift+ Enter billentyűkombinációt. Ismételje meg ezt a lépést minden kódcella esetében.

Feljegyzés

Várja meg, amíg megjelenik a befejezési pipa a következő cella futtatása előtt.

  1. Futtassa a következő cellát az NYC GreenTaxi blobtárolóhoz való hozzáférés engedélyezéséhez.

    Képernyőkép az első kódcelláról, amelyen a tárelérési adatok láthatók.

  2. A KustoURI-ban illessze be a korábban másolt lekérdezési URI-t a helyőrző szöveg helyett.

  3. Módosítsa a helyőrző adatbázis nevét nycGreenTaxi névre.

  4. Módosítsa a helyőrző tábla nevét GreenTaxiData-ra.

    A céladatbázis adatait megjelenítő második kódcella képernyőképe. A lekérdezési URI, az adatbázis neve és a tábla neve ki van emelve.

  5. Futtassa a cellát.

  6. Futtassa a következő cellát az adatok adatbázisba való írásához. A lépés végrehajtása eltarthat néhány percig.

    Képernyőkép a harmadik kódcelláról, amelyen a táblaleképezés és a betöltési parancs látható.

Az adatbázis most már betölti az adatokat egy GreenTaxiData nevű táblába.

5 – A jegyzetfüzet futtatása

Futtassa a fennmaradó két cellát egymás után a tábla adatainak lekérdezéséhez. Az eredmények azt mutatják, hogy az első 20 legmagasabb és legalacsonyabb taxi viteldíjak és távolságok rögzített év.

Képernyőkép a lekérdezés eredményeit megjelenítő negyedik és ötödik kódcelláról.

6 – Erőforrások törlése

Törölje a létrehozott elemeket a munkaterületre való navigálással.

  1. A munkaterületen mutasson a törölni kívánt jegyzetfüzetre, és válassza a Továbbiak menüt [...] >Törlés.

    Képernyőkép a munkaterületről, amelyen a NYC GreenTaxi-jegyzetfüzet legördülő menüje látható. A Törlés lehetőség ki van emelve.

  2. Válassza a Törlés lehetőséget. A jegyzetfüzet törlése után nem állítható helyre.