Kurz: Vytvoření poznámkového bloku Jupyter ve službě Azure Cosmos DB for NoSQL pro analýzu a vizualizaci dat (Preview)

PLATÍ PRO: NoSQL

Upozorňující

Funkce Jupyter Notebooks služby Azure Cosmos DB bude vyřazena 30. března 2024; Nebudete moct používat integrované poznámkové bloky Jupyter z účtu služby Azure Cosmos DB. Doporučujeme použít podporu editoru Visual Studio Code pro poznámkové bloky Jupyter nebo preferovaného klienta poznámkových bloků.

Tento kurz vás provede použitím funkce Jupyter Notebooks služby Azure Cosmos DB k importu ukázkových maloobchodních dat do účtu Azure Cosmos DB for NoSQL. Uvidíte, jak pomocí příkazů magic Azure Cosmos DB spouštět dotazy, analyzovat data a vizualizovat výsledky.

Předpoklady

  • Existující účet Azure Cosmos DB for NoSQL.

Vytvoření nového poznámkového bloku

V této části vytvoříte databázi Azure Cosmos, kontejner a importujete maloobchodní data do kontejneru.

  1. Přejděte do svého účtu služby Azure Cosmos DB a otevřete Průzkumníka dat.

  2. Vyberte Nový poznámkový blok.

    Screenshot of the Data Explorer with the 'New Notebook' option highlighted.

  3. V potvrzovací dialogovém okně, které se zobrazí, vyberte Vytvořit.

    Poznámka:

    Vytvoří se dočasný pracovní prostor, který vám umožní pracovat s poznámkovými bloky Jupyter. Po vypršení platnosti relace se odeberou všechny poznámkové bloky v pracovním prostoru.

  4. Vyberte jádro, které chcete pro poznámkový blok použít.

Tip

Teď, když je nový poznámkový blok vytvořený, můžete ho přejmenovat na něco jako VisualizeRetailData.ipynb.

Vytvoření databáze a kontejneru pomocí sady SDK

  1. Začněte ve výchozí buňce kódu.

  2. Importujte všechny balíčky, které pro účely tohoto kurzu potřebujete.

    import azure.cosmos
    from azure.cosmos.partition_key import PartitionKey
    
  3. Vytvořte databázi s názvem RetailIngest pomocí integrované sady SDK.

    database = cosmos_client.create_database_if_not_exists('RetailIngest')
    
  4. Vytvořte kontejner s názvem WebsiteMetrics s klíčem oddílu /CartID.

    container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
    
  5. Vyberte Spustit a vytvořte databázi a prostředek kontejneru.

    Screenshot of the 'Run' option in the menu.

Import dat pomocí příkazů magic

  1. Přidejte novou buňku kódu.

  2. Do buňky kódu přidejte následující příkaz magic, který chcete nahrát do existujícího kontejneru, do dat JSON z této adresy URL: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json

    %%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
    
  3. Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.

    Screenshot of the 'Run Active Cell' option in the menu.

    Poznámka:

    Dokončení příkazu importu by mělo trvat 5 až 10 sekund.

  4. Sledujte výstup příkazu run. Ujistěte se, že se importovalo 2 654 dokumentů.

    Documents successfully uploaded to WebsiteMetrics
    Total number of documents imported:
      Success: 2654
      Failure: 0
    Total time taken : 00:00:04 hours
    Total RUs consumed : 27309.660000001593
    

Vizualizace dat

  1. Vytvořte další novou buňku kódu.

  2. V buňce kódu použijte dotaz SQL k naplnění datového rámce Pandas.

    %%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos
    SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
    
  3. Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.

  4. Vytvořte další novou buňku kódu.

  5. V buňce kódu zadejte výstup prvních 10 položek z datového rámce.

    df_cosmos.head(10)
    
  6. Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.

  7. Sledujte výstup spuštění příkazu.

    Akce ItemRevenue Země/oblast Item
    0 Koupeno 19.99 Makedonie Tričko s tlačítkem
    1 Zobrazeno 12,00 Papua-Nová Guinea Náhrdelník
    2 Zobrazeno 25.00 Slovensko (Slovenská republika) Svetr s karganem
    3 Koupeno 14,00 Senegal Flip Flop Boty
    4 Zobrazeno 50.00 Panama Denim Shorts
    5 Zobrazeno 14,00 Senegal Flip Flop Boty
    6 Přidáno 14,00 Senegal Flip Flop Boty
    7 Přidáno 50.00 Panama Denim Shorts
    8 Koupeno 33,00 Palestinská území Červená nahoře
    9 Zobrazeno 30.00 Malta Zelený svetr
  8. Vytvořte další novou buňku kódu.

  9. V buňce kódu importujte balíček pandas a přizpůsobte výstup datového rámce.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  10. Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.

  11. Ve výstupu vyberte možnost Spojnicový graf , abyste zobrazili jinou vizualizaci dat.

    Screenshot of the Pandas dataframe visualization for the data as a line chart.

Zachování poznámkového bloku

  1. V části Poznámkové bloky otevřete místní nabídku poznámkového bloku, který jste vytvořili pro tento kurz, a vyberte Stáhnout.

    Screenshot of the notebook context menu with the 'Download' option.

    Tip

    Pokud chcete práci uložit trvale, uložte poznámkové bloky do úložiště GitHub nebo si poznámkové bloky stáhněte do místního počítače před ukončením relace.

Další kroky