Oktatóanyag: Jupyter-jegyzetfüzet létrehozása az Azure Cosmos DB for NoSQL-fiók adatainak a Visual Studio Code Jupyter-jegyzetfüzetek használatával történő elemzéséhez
A KÖVETKEZŐRE VONATKOZIK: NoSQL
Ez az oktatóanyag bemutatja, hogyan használhatja a Visual Studio Code Jupyter-jegyzetfüzeteket az Azure Cosmos DB for NoSQL-fiók kezeléséhez. Megtudhatja, hogyan csatlakozhat a fiókjához, importálhat adatokat, és futtathat lekérdezéseket.
Előfeltételek
- Egy meglévő Azure Cosmos DB for NoSQL-fiók.
- Ha már rendelkezik Azure-előfizetéssel, hozzon létre egy új fiókot.
- Nincs Azure-előfizetés? Ingyenesen kipróbálhatja az Azure Cosmos DB-t hitelkártya nélkül.
- Telepítse a Visual Studio Code-ot , és állítsa be a környezetet jegyzetfüzetek használatára.
Új jegyzetfüzet létrehozása
Ebben a szakaszban létrehozza az Azure Cosmos-adatbázist, a tárolót, és importálja a kiskereskedelmi adatokat a tárolóba.
- Nyissa meg a Visual Studio Code-ot.
- Futtassa a Create: New Jupyter Notebook parancsot a parancskatalógusból (Ctrl+Shift+P), vagy hozzon létre egy új .ipynb fájlt a munkaterületen.
Tipp.
Most, hogy létrejött az új jegyzetfüzet, mentheti és elnevezheti az AnalyzeRetailData.ipynb fájlhoz hasonló nevet.
Adatbázis és tároló létrehozása az SDK használatával
Kezdje az alapértelmezett kódcellával.
Telepítse az Azure.cosmos-csomagot. A folytatás előtt futtassa ezt a cellát.
%pip install azure.cosmos
Importálja az oktatóanyaghoz szükséges csomagokat.
import azure.cosmos from azure.cosmos.partition_key import PartitionKey from azure.cosmos import CosmosClient
Hozzon létre egy új CosmosClient-példányt.
endpoint = "<FILL ME>" key = "<FILL ME>" cosmos_client = CosmosClient(url=endpoint, credential=key)
Hozzon létre egy RetailIngest nevű adatbázist a beépített SDK használatával.
database = cosmos_client.create_database_if_not_exists('RetailIngest')
Hozzon létre egy WebsiteMetrics nevű tárolót a következő partíciókulccsal
/CartID
: .container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
Válassza a Futtatás lehetőséget az adatbázis és a tárolóerőforrás létrehozásához.
Adatok importálása tárolóba
Új kódcella hozzáadása
A kódcellán belül adja hozzá a következő kódot, hogy adatokat töltsön fel ebből az URL-címből: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json.
import urllib.request import json with urllib.request.urlopen("https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json") as url: docs = json.loads(url.read().decode()) for doc in docs: container.upsert_item(doc)
Futtassa a cellát. Ez 45 másodperc és 1 perc között fut.
Az adatok elemzése
Hozzon létre egy másik új kódcellát.
A kódcellában sql-lekérdezés használatával töltse fel a Pandas DataFrame-et. Futtassa ezt a cellát.
import pandas as pd from pandas import DataFrame QUERY = "SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c" results = container.query_items( query=QUERY, enable_cross_partition_query=True ) df_cosmos = pd.DataFrame(results)
Hozzon létre egy másik új kódcellát.
A kódcellában adja ki a 10 legfontosabb elemet az adatkeretből. Futtassa ezt a cellát.
df_cosmos.head(10)
Figyelje meg a parancs futtatásának kimenetét.
Action ItemRevenue Ország Cikk 0 Vásárolt 19.99 Macedónia Gombos póló 1 Megjelenítve 12.00 Pápua Új-Guinea Nyaklánc 2 Megjelenítve 25.00 Szlovákia (Szlovák Köztársaság) Kardigán pulóver 3 Vásárolt 14.00 Szenegál Papucs cipő 4 Megjelenítve 50.00 Panama Denim Shorts 5 Megjelenítve 14.00 Szenegál Papucs cipő 6 Hozzáadva 14.00 Szenegál Papucs cipő 7 Hozzáadva 50.00 Panama Denim Shorts 8 Vásárolt 33,00 Palesztin területek Piros felül 9 Megjelenítve 30.00 Málta Zöld pulóver Hozzon létre egy másik új kódcellát.
A kódcellában importálja a pandas-csomagot az adatkeret kimenetének testreszabásához. Futtassa ezt a cellát.
import pandas as pd df_cosmos.groupby("Item").size().reset_index()
Figyelje meg a parancs futtatásának kimenetét.
Cikk Test 0 Papucs cipő 66 1 Nyaklánc 55 2 Sportcipők 111 ... ... ... 45 Windbreaker Jacket 56