Öğretici: Verileri analiz etmek ve görselleştirmek için NoSQL için Azure Cosmos DB'de Jupyter Not Defteri oluşturma (önizleme)

UYGULANANLAR: NoSQL

Uyarı

Azure Cosmos DB'nin Jupyter Notebooks özelliği 30 Mart 2024'te kullanımdan kaldırılacak; Azure Cosmos DB hesabından yerleşik Jupyter not defterlerini kullanamazsınız. Visual Studio Code'un Jupyter not defterleri veya tercih ettiğiniz not defterleri istemcisi için desteğini kullanmanızı öneririz.

Bu öğreticide, örnek perakende verilerini NoSQL için Azure Cosmos DB hesabına aktarmak için Azure Cosmos DB'nin Jupyter Notebooks özelliğinin nasıl kullanılacağı gösterilmektedir. Sorguları çalıştırmak, verileri analiz etmek ve sonuçları görselleştirmek için Azure Cosmos DB sihirli komutlarını nasıl kullanacağınızı göreceksiniz.

Ön koşullar

Yeni not defteri oluşturma

Bu bölümde Azure Cosmos veritabanını, kapsayıcısını oluşturacak ve perakende verilerini kapsayıcıya aktaracaksınız.

  1. Azure Cosmos DB hesabınıza gidin ve Veri Gezgini açın.

  2. Yeni Not Defteri'ni seçin.

    Screenshot of the Data Explorer with the 'New Notebook' option highlighted.

  3. Görüntülenen onay iletişim kutusunda Oluştur'u seçin.

    Dekont

    Jupyter Notebooks ile çalışmanızı sağlamak için geçici bir çalışma alanı oluşturulur. Oturumun süresi dolduğunda, çalışma alanı içindeki tüm not defterleri kaldırılır.

  4. Not defteri için kullanmak istediğiniz çekirdeği seçin.

Bahşiş

Artık yeni not defteri oluşturulduğuna göre, bunu VisualizeRetailData.ipynb gibi bir şekilde yeniden adlandırabilirsiniz.

SDK kullanarak veritabanı ve kapsayıcı oluşturma

  1. Varsayılan kod hücresinde başlayın.

  2. Bu öğretici için ihtiyacınız olan tüm paketleri içeri aktarabilirsiniz.

    import azure.cosmos
    from azure.cosmos.partition_key import PartitionKey
    
  3. Yerleşik SDK'sını kullanarak RetailIngest adlı bir veritabanı oluşturun.

    database = cosmos_client.create_database_if_not_exists('RetailIngest')
    
  4. bölüm anahtarıyla /CartIDWebsiteMetrics adlı bir kapsayıcı oluşturun.

    container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
    
  5. Veritabanını ve kapsayıcı kaynağını oluşturmak için Çalıştır'ı seçin.

    Screenshot of the 'Run' option in the menu.

Sihirli komutları kullanarak verileri içeri aktarma

  1. Yeni bir kod hücresi ekleyin.

  2. Kod hücresinin içinde, bu url'deki JSON verilerini mevcut kapsayıcınıza yüklemek için aşağıdaki sihirli komutu ekleyin: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json

    %%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
    
  3. Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.

    Screenshot of the 'Run Active Cell' option in the menu.

    Dekont

    İçeri aktarma komutunun tamamlanması 5-10 saniye sürmelidir.

  4. Run komutunun çıkışını gözlemleyin. 2.654 belgenin içeri aktarıldığından emin olun.

    Documents successfully uploaded to WebsiteMetrics
    Total number of documents imported:
      Success: 2654
      Failure: 0
    Total time taken : 00:00:04 hours
    Total RUs consumed : 27309.660000001593
    

Verilerinizi görselleştirme

  1. Başka bir yeni kod hücresi oluşturun.

  2. Kod hücresinde, Pandas DataFrame'i doldurmak için SQL sorgusu kullanın.

    %%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos
    SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
    
  3. Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.

  4. Başka bir yeni kod hücresi oluşturun.

  5. Kod hücresinde, veri çerçevesinden ilk 10 öğenin çıkışını alın.

    df_cosmos.head(10)
    
  6. Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.

  7. komutunu çalıştırmanın çıkışını gözlemleyin.

    Eylem ItemRevenue Ülke Kalem
    0 Satın alınan 19.99 Makedonya Düğmeli Gömlek
    1 Görüntülendi 12,00 Papua Yeni Gine Kolye
    2 Görüntülendi 25.00 Slovakya (Slovakça Cumhuriyeti) Hırka Kazak
    3 Satın alınan 14,00 Senegal Flip Flop Shoes
    4 Görüntülendi 50.00 Panama Denim Şort
    5 Görüntülendi 14,00 Senegal Flip Flop Shoes
    6 Eklendi 14,00 Senegal Flip Flop Shoes
    7 Eklendi 50.00 Panama Denim Şort
    8 Satın alınan 33.00 Filistin Yönetimi Kırmızı Üst
    9 Görüntülendi 30.00 Malta Yeşil Kazak
  8. Başka bir yeni kod hücresi oluşturun.

  9. Veri çerçevesinin çıkışını özelleştirmek için kod hücresinde pandas paketini içeri aktarın.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  10. Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.

  11. Çıktıda, verilerin farklı bir görselleştirmesini görüntülemek için Çizgi Grafik seçeneğini belirleyin.

    Screenshot of the Pandas dataframe visualization for the data as a line chart.

Not defterinizi kalıcı hale getirme

  1. Not Defterleri bölümünde, bu öğretici için oluşturduğunuz not defterinin bağlam menüsünü açın ve İndir'i seçin.

    Screenshot of the notebook context menu with the 'Download' option.

    Bahşiş

    Çalışmanızı kalıcı olarak kaydetmek için, oturum bitmeden önce not defterlerinizi bir GitHub deposuna kaydedin veya not defterlerini yerel makinenize indirin.

Sonraki adımlar