Oktatóanyag: Jupyter notebook létrehozása az Azure Cosmos DB for NoSQL-ben adatok elemzéséhez és vizualizációihoz (előzetes verzió)
A KÖVETKEZŐRE VONATKOZIK: NoSQL
Figyelmeztetés:
Az Azure Cosmos DB Jupyter Notebooks szolgáltatása 2024. március 30-án megszűnik; az Azure Cosmos DB-fiókból nem használhat beépített Jupyter-jegyzetfüzeteket. Javasoljuk, hogy használja a Visual Studio Code támogatását a Jupyter-notebookokhoz vagy az előnyben részesített jegyzetfüzet-ügyfélhez.
Ez az oktatóanyag bemutatja, hogyan használhatja az Azure Cosmos DB Jupyter Notebooks funkcióját kiskereskedelmi mintaadatok importálásához egy Azure Cosmos DB for NoSQL-fiókba. Megtudhatja, hogyan használhatja az Azure Cosmos DB mágikus parancsait lekérdezések futtatására, az adatok elemzésére és az eredmények megjelenítésére.
Előfeltételek
- Egy meglévő Azure Cosmos DB for NoSQL-fiók.
- Ha már rendelkezik Azure-előfizetéssel, hozzon létre egy új fiókot.
- Nincs Azure-előfizetés? Ingyenesen kipróbálhatja az Azure Cosmos DB-t hitelkártya nélkül.
Új jegyzetfüzet létrehozása
Ebben a szakaszban létrehozza az Azure Cosmos-adatbázist, a tárolót, és importálja a kiskereskedelmi adatokat a tárolóba.
Lépjen az Azure Cosmos DB-fiókjához, és nyissa meg az Adatkezelőt .
Válassza az Új jegyzetfüzet lehetőséget.
A megjelenő megerősítési párbeszédpanelen válassza a Létrehozás lehetőséget.
Megjegyzés:
Létrejön egy ideiglenes munkaterület, amely lehetővé teszi a Jupyter Notebookok használatát. A munkamenet lejárata után a munkaterületen lévő jegyzetfüzetek törlődnek.
Válassza ki a jegyzetfüzethez használni kívánt kernelt.
Tipp.
Most, hogy létrejött az új jegyzetfüzet, átnevezheti a VisualizeRetailData.ipynb fájlhoz hasonlóra.
Adatbázis és tároló létrehozása az SDK használatával
Kezdje az alapértelmezett kódcellával.
Importálja az oktatóanyaghoz szükséges csomagokat.
import azure.cosmos from azure.cosmos.partition_key import PartitionKey
Hozzon létre egy RetailIngest nevű adatbázist a beépített SDK használatával.
database = cosmos_client.create_database_if_not_exists('RetailIngest')
Hozzon létre egy WebsiteMetrics nevű tárolót a következő partíciókulccsal
/CartID
: .container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
Válassza a Futtatás lehetőséget az adatbázis és a tárolóerőforrás létrehozásához.
Adatok importálása varázsparancsokkal
Adjon hozzá egy új kódcellát.
A kódcellában adja hozzá a következő magic parancsot a meglévő tárolóba való feltöltéshez a JSON-adatok ezen URL-címről: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
%%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
Válassza az Aktív cella futtatása lehetőséget, ha csak ebben az adott cellában szeretné futtatni a parancsot.
Megjegyzés:
Az importálási parancs végrehajtása 5–10 másodpercet vesz igénybe.
Figyelje meg a futtatási parancs kimenetét. Győződjön meg arról, hogy 2654 dokumentum lett importálva.
Documents successfully uploaded to WebsiteMetrics Total number of documents imported: Success: 2654 Failure: 0 Total time taken : 00:00:04 hours Total RUs consumed : 27309.660000001593
Adatok vizualizációja
Hozzon létre egy másik új kódcellát.
A kódcellában sql-lekérdezés használatával töltse fel a Pandas DataFrame-et.
%%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
Válassza az Aktív cella futtatása lehetőséget, ha csak ebben az adott cellában szeretné futtatni a parancsot.
Hozzon létre egy másik új kódcellát.
A kódcellában adja ki a 10 legfontosabb elemet az adatkeretből.
df_cosmos.head(10)
Válassza az Aktív cella futtatása lehetőséget, ha csak ebben az adott cellában szeretné futtatni a parancsot.
Figyelje meg a parancs futtatásának kimenetét.
Action ItemRevenue Ország Cikk 0 Vásárolt 19.99 Macedónia Gombos póló 1 Megjelenítve 12.00 Pápua Új-Guinea Nyaklánc 2 Megjelenítve 25.00 Szlovákia (Szlovák Köztársaság) Kardigán pulóver 3 Vásárolt 14.00 Szenegál Papucs cipő 4 Megjelenítve 50.00 Panama Denim Shorts 5 Megjelenítve 14.00 Szenegál Papucs cipő 6 Hozzáadva 14.00 Szenegál Papucs cipő 7 Hozzáadva 50.00 Panama Denim Shorts 8 Vásárolt 33,00 Palesztin területek Piros felül 9 Megjelenítve 30.00 Málta Zöld pulóver Hozzon létre egy másik új kódcellát.
A kódcellában importálja a pandas-csomagot az adatkeret kimenetének testreszabásához.
import pandas as pd pd.options.display.html.table_schema = True pd.options.display.max_rows = None df_cosmos.groupby("Item").size()
Válassza az Aktív cella futtatása lehetőséget, ha csak ebben az adott cellában szeretné futtatni a parancsot.
A kimenetben válassza a Vonaldiagram lehetőséget az adatok eltérő vizualizációjának megtekintéséhez.
A jegyzetfüzet megőrzése
A Jegyzetfüzetek szakaszban nyissa meg az oktatóanyaghoz létrehozott jegyzetfüzet helyi menüjét, és válassza a Letöltés lehetőséget.
Tipp.
A munka végleges mentéséhez mentse a jegyzetfüzeteket egy GitHub-adattárba, vagy töltse le a jegyzetfüzeteket a helyi gépére a munkamenet vége előtt.