Share via


Oktatóanyag: Jupyter-jegyzetfüzet létrehozása az Azure Cosmos DB for NoSQL-fiók adatainak a Visual Studio Code Jupyter-jegyzetfüzetek használatával történő elemzéséhez

A KÖVETKEZŐRE VONATKOZIK: NoSQL

Ez az oktatóanyag bemutatja, hogyan használhatja a Visual Studio Code Jupyter-jegyzetfüzeteket az Azure Cosmos DB for NoSQL-fiók kezeléséhez. Megtudhatja, hogyan csatlakozhat a fiókjához, importálhat adatokat, és futtathat lekérdezéseket.

Előfeltételek

Új jegyzetfüzet létrehozása

Ebben a szakaszban létrehozza az Azure Cosmos-adatbázist, a tárolót, és importálja a kiskereskedelmi adatokat a tárolóba.

  1. Nyissa meg a Visual Studio Code-ot.
  2. Futtassa a Create: New Jupyter Notebook parancsot a parancskatalógusból (Ctrl+Shift+P), vagy hozzon létre egy új .ipynb fájlt a munkaterületen.

Tipp.

Most, hogy létrejött az új jegyzetfüzet, mentheti és elnevezheti az AnalyzeRetailData.ipynb fájlhoz hasonló nevet.

Adatbázis és tároló létrehozása az SDK használatával

  1. Kezdje az alapértelmezett kódcellával.

  2. Telepítse az Azure.cosmos-csomagot. A folytatás előtt futtassa ezt a cellát.

    %pip install azure.cosmos
    
  3. Importálja az oktatóanyaghoz szükséges csomagokat.

    import azure.cosmos
    from azure.cosmos.partition_key import PartitionKey
    from azure.cosmos import CosmosClient
    
  4. Hozzon létre egy új CosmosClient-példányt.

    endpoint = "<FILL ME>"
    key = "<FILL ME>"
    cosmos_client = CosmosClient(url=endpoint, credential=key)
    
  5. Hozzon létre egy RetailIngest nevű adatbázist a beépített SDK használatával.

    database = cosmos_client.create_database_if_not_exists('RetailIngest')
    
  6. Hozzon létre egy WebsiteMetrics nevű tárolót a következő partíciókulccsal/CartID: .

    container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
    
  7. Válassza a Futtatás lehetőséget az adatbázis és a tárolóerőforrás létrehozásához.

    Screenshot of Execute cell in Visual Studio Code Jupyter notebook.

Adatok importálása tárolóba

  1. Új kódcella hozzáadása

  2. A kódcellán belül adja hozzá a következő kódot, hogy adatokat töltsön fel ebből az URL-címből: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json.

        import urllib.request
        import json
    
        with urllib.request.urlopen("https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json") as url:
            docs = json.loads(url.read().decode())
    
        for doc in docs:
            container.upsert_item(doc)
    
  3. Futtassa a cellát. Ez 45 másodperc és 1 perc között fut.

Az adatok elemzése

  1. Hozzon létre egy másik új kódcellát.

  2. A kódcellában sql-lekérdezés használatával töltse fel a Pandas DataFrame-et. Futtassa ezt a cellát.

    import pandas as pd
    from pandas import DataFrame
    
    QUERY = "SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c"
    results = container.query_items(
        query=QUERY, enable_cross_partition_query=True
    )
    
    df_cosmos = pd.DataFrame(results)
    
  3. Hozzon létre egy másik új kódcellát.

  4. A kódcellában adja ki a 10 legfontosabb elemet az adatkeretből. Futtassa ezt a cellát.

    df_cosmos.head(10)
    
  5. Figyelje meg a parancs futtatásának kimenetét.

    Action ItemRevenue Ország Cikk
    0 Vásárolt 19.99 Macedónia Gombos póló
    1 Megjelenítve 12.00 Pápua Új-Guinea Nyaklánc
    2 Megjelenítve 25.00 Szlovákia (Szlovák Köztársaság) Kardigán pulóver
    3 Vásárolt 14.00 Szenegál Papucs cipő
    4 Megjelenítve 50.00 Panama Denim Shorts
    5 Megjelenítve 14.00 Szenegál Papucs cipő
    6 Hozzáadva 14.00 Szenegál Papucs cipő
    7 Hozzáadva 50.00 Panama Denim Shorts
    8 Vásárolt 33,00 Palesztin területek Piros felül
    9 Megjelenítve 30.00 Málta Zöld pulóver
  6. Hozzon létre egy másik új kódcellát.

  7. A kódcellában importálja a pandas-csomagot az adatkeret kimenetének testreszabásához. Futtassa ezt a cellát.

    import pandas as pd    
    df_cosmos.groupby("Item").size().reset_index()
    
  8. Figyelje meg a parancs futtatásának kimenetét.

    Cikk Test
    0 Papucs cipő 66
    1 Nyaklánc 55
    2 Sportcipők 111
    ... ... ...
    45 Windbreaker Jacket 56

Következő lépések