Öğretici: Verileri analiz etmek ve görselleştirmek için NoSQL için Azure Cosmos DB'de Jupyter Not Defteri oluşturma (önizleme)
UYGULANANLAR: NoSQL
Uyarı
Azure Cosmos DB'nin Jupyter Notebooks özelliği 30 Mart 2024'te kullanımdan kaldırılacak; Azure Cosmos DB hesabından yerleşik Jupyter not defterlerini kullanamazsınız. Visual Studio Code'un Jupyter not defterleri veya tercih ettiğiniz not defterleri istemcisi için desteğini kullanmanızı öneririz.
Bu öğreticide, örnek perakende verilerini NoSQL için Azure Cosmos DB hesabına aktarmak için Azure Cosmos DB'nin Jupyter Notebooks özelliğinin nasıl kullanılacağı gösterilmektedir. Sorguları çalıştırmak, verileri analiz etmek ve sonuçları görselleştirmek için Azure Cosmos DB sihirli komutlarını nasıl kullanacağınızı göreceksiniz.
Ön koşullar
- Mevcut bir NoSQL için Azure Cosmos DB hesabı.
- Mevcut bir Azure aboneliğiniz varsa yeni bir hesap oluşturun.
- Azure aboneliği yok mu? Kredi kartı gerektirmeden Azure Cosmos DB'i ücretsiz deneyebilirsiniz.
Yeni not defteri oluşturma
Bu bölümde Azure Cosmos veritabanını, kapsayıcısını oluşturacak ve perakende verilerini kapsayıcıya aktaracaksınız.
Azure Cosmos DB hesabınıza gidin ve Veri Gezgini açın.
Yeni Not Defteri'ni seçin.
Görüntülenen onay iletişim kutusunda Oluştur'u seçin.
Dekont
Jupyter Notebooks ile çalışmanızı sağlamak için geçici bir çalışma alanı oluşturulur. Oturumun süresi dolduğunda, çalışma alanı içindeki tüm not defterleri kaldırılır.
Not defteri için kullanmak istediğiniz çekirdeği seçin.
Bahşiş
Artık yeni not defteri oluşturulduğuna göre, bunu VisualizeRetailData.ipynb gibi bir şekilde yeniden adlandırabilirsiniz.
SDK kullanarak veritabanı ve kapsayıcı oluşturma
Varsayılan kod hücresinde başlayın.
Bu öğretici için ihtiyacınız olan tüm paketleri içeri aktarabilirsiniz.
import azure.cosmos from azure.cosmos.partition_key import PartitionKey
Yerleşik SDK'sını kullanarak RetailIngest adlı bir veritabanı oluşturun.
database = cosmos_client.create_database_if_not_exists('RetailIngest')
bölüm anahtarıyla
/CartID
WebsiteMetrics adlı bir kapsayıcı oluşturun.container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
Veritabanını ve kapsayıcı kaynağını oluşturmak için Çalıştır'ı seçin.
Sihirli komutları kullanarak verileri içeri aktarma
Yeni bir kod hücresi ekleyin.
Kod hücresinin içinde, bu url'deki JSON verilerini mevcut kapsayıcınıza yüklemek için aşağıdaki sihirli komutu ekleyin: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
%%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.
Dekont
İçeri aktarma komutunun tamamlanması 5-10 saniye sürmelidir.
Run komutunun çıkışını gözlemleyin. 2.654 belgenin içeri aktarıldığından emin olun.
Documents successfully uploaded to WebsiteMetrics Total number of documents imported: Success: 2654 Failure: 0 Total time taken : 00:00:04 hours Total RUs consumed : 27309.660000001593
Verilerinizi görselleştirme
Başka bir yeni kod hücresi oluşturun.
Kod hücresinde, Pandas DataFrame'i doldurmak için SQL sorgusu kullanın.
%%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.
Başka bir yeni kod hücresi oluşturun.
Kod hücresinde, veri çerçevesinden ilk 10 öğenin çıkışını alın.
df_cosmos.head(10)
Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.
komutunu çalıştırmanın çıkışını gözlemleyin.
Eylem ItemRevenue Ülke Kalem 0 Satın alınan 19.99 Makedonya Düğmeli Gömlek 1 Görüntülendi 12,00 Papua Yeni Gine Kolye 2 Görüntülendi 25.00 Slovakya (Slovakça Cumhuriyeti) Hırka Kazak 3 Satın alınan 14,00 Senegal Flip Flop Shoes 4 Görüntülendi 50.00 Panama Denim Şort 5 Görüntülendi 14,00 Senegal Flip Flop Shoes 6 Eklendi 14,00 Senegal Flip Flop Shoes 7 Eklendi 50.00 Panama Denim Şort 8 Satın alınan 33.00 Filistin Yönetimi Kırmızı Üst 9 Görüntülendi 30.00 Malta Yeşil Kazak Başka bir yeni kod hücresi oluşturun.
Veri çerçevesinin çıkışını özelleştirmek için kod hücresinde pandas paketini içeri aktarın.
import pandas as pd pd.options.display.html.table_schema = True pd.options.display.max_rows = None df_cosmos.groupby("Item").size()
Komutu yalnızca bu hücrede çalıştırmak için Etkin Hücreyi Çalıştır'ı seçin.
Çıktıda, verilerin farklı bir görselleştirmesini görüntülemek için Çizgi Grafik seçeneğini belirleyin.
Not defterinizi kalıcı hale getirme
Not Defterleri bölümünde, bu öğretici için oluşturduğunuz not defterinin bağlam menüsünü açın ve İndir'i seçin.
Bahşiş
Çalışmanızı kalıcı olarak kaydetmek için, oturum bitmeden önce not defterlerinizi bir GitHub deposuna kaydedin veya not defterlerini yerel makinenize indirin.