Självstudie: Skapa en Jupyter Notebook i Azure Cosmos DB för NoSQL för att analysera och visualisera data (förhandsversion)
GÄLLER FÖR: NoSQL
Varning
Funktionen Jupyter Notebooks i Azure Cosmos DB dras tillbaka den 30 mars 2024. du kommer inte att kunna använda inbyggda Jupyter-notebook-filer från Azure Cosmos DB-kontot. Vi rekommenderar att du använder Visual Studio Code-stöd för Jupyter Notebooks eller din föredragna notebook-klient.
Den här självstudien beskriver hur du använder funktionen Jupyter Notebooks i Azure Cosmos DB för att importera exempeldata från detaljhandeln till ett Azure Cosmos DB för NoSQL-konto. Du ser hur du använder de magiska Kommandona i Azure Cosmos DB för att köra frågor, analysera data och visualisera resultaten.
Förutsättningar
- Ett befintligt Azure Cosmos DB för NoSQL-konto.
- Om du har en befintlig Azure-prenumeration skapar du ett nytt konto.
- Ingen Azure-prenumeration? Du kan prova Azure Cosmos DB kostnadsfritt utan kreditkort.
Skapa en ny notebook
I det här avsnittet skapar du Azure Cosmos-databasen, containern och importerar detaljhandelsdata till containern.
Gå till ditt Azure Cosmos DB-konto och öppna Datautforskaren .
Välj Ny anteckningsbok.
I bekräftelsedialogrutan som visas väljer du Skapa.
Kommentar
En tillfällig arbetsyta skapas så att du kan arbeta med Jupyter Notebooks. När sessionen upphör att gälla tas alla anteckningsböcker på arbetsytan bort.
Välj den kernel som du vill använda för notebook-filen.
Dricks
Nu när den nya notebook-filen har skapats kan du byta namn på den till något som VisualizeRetailData.ipynb.
Skapa en databas och container med hjälp av SDK
Starta i standardkodcellen.
Importera alla paket som du behöver för den här självstudien.
import azure.cosmos from azure.cosmos.partition_key import PartitionKey
Skapa en databas med namnet RetailIngest med hjälp av det inbyggda SDK:et.
database = cosmos_client.create_database_if_not_exists('RetailIngest')
Skapa en container med namnet WebsiteMetrics med partitionsnyckeln
/CartID
.container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
Välj Kör för att skapa databasen och containerresursen.
Importera data med hjälp av magiska kommandon
Lägg till en ny kodcell.
I kodcellen lägger du till följande magiska kommando för att ladda upp JSON-data från den här URL:en till din befintliga container: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
%%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.
Kommentar
Importkommandot bör ta 5–10 sekunder att slutföra.
Observera utdata från körningskommandot. Kontrollera att 2 654 dokument har importerats.
Documents successfully uploaded to WebsiteMetrics Total number of documents imported: Success: 2654 Failure: 0 Total time taken : 00:00:04 hours Total RUs consumed : 27309.660000001593
Visualisera dina data
Skapa en ny kodcell.
I kodcellen använder du en SQL-fråga för att fylla i en Pandas DataFrame.
%%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.
Skapa en ny kodcell.
I kodcellen matar du ut de 10 översta objekten från dataramen.
df_cosmos.head(10)
Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.
Observera utdata från körningen av kommandot.
Åtgärd ItemRevenue Land Artikel 0 Inköpt 19.99 Makedonien Skjorta med knapp 1 Visat 12,00 Papua Nya Guinea Halsband 2 Visat 25,00 Slovakien (Slovakien) Kofta tröja 3 Inköpt 14,00 Senegal Flip Flop skor 4 Visat 50.00 Panama Jeansshorts 5 Visat 14,00 Senegal Flip Flop skor 6 Tillagd 14,00 Senegal Flip Flop skor 7 Tillagd 50.00 Panama Jeansshorts 8 Inköpt 33,00 Palestinska territoriet, PS Röd överkant 9 Visat 30,00 Malta Grön tröja Skapa en ny kodcell.
Importera Pandas-paketet i kodcellen för att anpassa dataramens utdata.
import pandas as pd pd.options.display.html.table_schema = True pd.options.display.max_rows = None df_cosmos.groupby("Item").size()
Välj Kör aktiv cell för att bara köra kommandot i den här specifika cellen.
I utdata väljer du alternativet Linjediagram för att visa en annan visualisering av data.
Spara anteckningsboken
I avsnittet Notebooks öppnar du snabbmenyn för anteckningsboken som du skapade för den här självstudien och väljer Ladda ned.
Dricks
Spara ditt arbete permanent genom att spara dina anteckningsböcker på en GitHub-lagringsplats eller ladda ned anteckningsböckerna till den lokala datorn innan sessionen avslutas.
Nästa steg
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för