Dela via


Självstudie: Skapa en Jupyter Notebook i Azure Cosmos DB för NoSQL för att analysera och visualisera data (förhandsversion)

GÄLLER FÖR: NoSQL

Varning

Funktionen Jupyter Notebooks i Azure Cosmos DB dras tillbaka den 30 mars 2024. du kommer inte att kunna använda inbyggda Jupyter-notebook-filer från Azure Cosmos DB-kontot. Vi rekommenderar att du använder Visual Studio Code-stöd för Jupyter Notebooks eller din föredragna notebook-klient.

Den här självstudien beskriver hur du använder funktionen Jupyter Notebooks i Azure Cosmos DB för att importera exempeldata från detaljhandeln till ett Azure Cosmos DB för NoSQL-konto. Du ser hur du använder de magiska Kommandona i Azure Cosmos DB för att köra frågor, analysera data och visualisera resultaten.

Förutsättningar

Skapa en ny notebook

I det här avsnittet skapar du Azure Cosmos-databasen, containern och importerar detaljhandelsdata till containern.

  1. Gå till ditt Azure Cosmos DB-konto och öppna Datautforskaren .

  2. Välj Ny anteckningsbok.

    Skärmbild av Datautforskaren med alternativet

  3. I bekräftelsedialogrutan som visas väljer du Skapa.

    Kommentar

    En tillfällig arbetsyta skapas så att du kan arbeta med Jupyter Notebooks. När sessionen upphör att gälla tas alla anteckningsböcker på arbetsytan bort.

  4. Välj den kernel som du vill använda för notebook-filen.

Dricks

Nu när den nya notebook-filen har skapats kan du byta namn på den till något som VisualizeRetailData.ipynb.

Skapa en databas och container med hjälp av SDK

  1. Starta i standardkodcellen.

  2. Importera alla paket som du behöver för den här självstudien.

    import azure.cosmos
    from azure.cosmos.partition_key import PartitionKey
    
  3. Skapa en databas med namnet RetailIngest med hjälp av det inbyggda SDK:et.

    database = cosmos_client.create_database_if_not_exists('RetailIngest')
    
  4. Skapa en container med namnet WebsiteMetrics med partitionsnyckeln/CartID.

    container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
    
  5. Välj Kör för att skapa databasen och containerresursen.

    Skärmbild av alternativet Kör på menyn.

Importera data med hjälp av magiska kommandon

  1. Lägg till en ny kodcell.

  2. I kodcellen lägger du till följande magiska kommando för att ladda upp JSON-data från den här URL:en till din befintliga container: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json

    %%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
    
  3. Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.

    Skärmbild av alternativet Kör aktiv cell på menyn.

    Kommentar

    Importkommandot bör ta 5–10 sekunder att slutföra.

  4. Observera utdata från körningskommandot. Kontrollera att 2 654 dokument har importerats.

    Documents successfully uploaded to WebsiteMetrics
    Total number of documents imported:
      Success: 2654
      Failure: 0
    Total time taken : 00:00:04 hours
    Total RUs consumed : 27309.660000001593
    

Visualisera dina data

  1. Skapa en ny kodcell.

  2. I kodcellen använder du en SQL-fråga för att fylla i en Pandas DataFrame.

    %%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos
    SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
    
  3. Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.

  4. Skapa en ny kodcell.

  5. I kodcellen matar du ut de 10 översta objekten från dataramen.

    df_cosmos.head(10)
    
  6. Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.

  7. Observera utdata från körningen av kommandot.

    Åtgärd ItemRevenue Land Artikel
    0 Inköpt 19.99 Makedonien Skjorta med knapp
    1 Visat 12,00 Papua Nya Guinea Halsband
    2 Visat 25,00 Slovakien (Slovakien) Kofta tröja
    3 Inköpt 14,00 Senegal Flip Flop skor
    4 Visat 50.00 Panama Jeansshorts
    5 Visat 14,00 Senegal Flip Flop skor
    6 Tillagd 14,00 Senegal Flip Flop skor
    7 Tillagd 50.00 Panama Jeansshorts
    8 Inköpt 33,00 Palestinska territoriet, PS Röd överkant
    9 Visat 30,00 Malta Grön tröja
  8. Skapa en ny kodcell.

  9. Importera Pandas-paketet i kodcellen för att anpassa dataramens utdata.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  10. Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.

  11. I utdata väljer du alternativet Linjediagram för att visa en annan visualisering av data.

    Skärmbild av Visualiseringen av Pandas-dataramen för data som ett linjediagram.

Spara anteckningsboken

  1. I avsnittet Notebooks öppnar du snabbmenyn för anteckningsboken som du skapade för den här självstudien och väljer Ladda ned.

    Skärmbild av snabbmenyn för notebook-filer med alternativet Ladda ned.

    Dricks

    Spara ditt arbete permanent genom att spara dina anteckningsböcker på en GitHub-lagringsplats eller ladda ned anteckningsböckerna till den lokala datorn innan sessionen avslutas.

Nästa steg