Aracılığıyla paylaş


Microsoft Fabric'te Cosmos DB'de örnek veri kümeleri

Microsoft Fabric'in Cosmos DB veritabanı iş yükü, NoSQL veritabanı desenlerini keşfetmenize, öğrenmenize ve denemenize yardımcı olmak için yerleşik örnek veri kümeleri sağlar. Bu veri kümesi, ürünler ve müşteri incelemeleri içeren bir e-ticaret senaryoyu temsil eder ve farklı varlık türlerinin aynı kapsayıcıda nasıl bir arada var olduğunu gösterir.

İki örnek veri kümesi kullanılabilir:

  • Standart örnek veriler: Ürün ve incelemelerle temel e-ticaret verileri
  • Vektör örnek verileri: Anlamsal arama senaryoları için OpenAI'nin text-embedding-ada-002 modeli kullanılarak oluşturulan 1536 boyutlu vektör eklemelerini içeren gelişmiş sürüm.

Veri kümesine genel bakış

Her iki örnek veri kümesi de iki belge türüyle aynı e-ticaret verilerini içerir.

  • Ürün belgeleri (docType: "product") - Adı, açıklaması, envanteri, geçerli fiyatı ve söz konusu ürünün fiyat geçmişinin ekli dizisini içeren tek tek ürünler.
  • Belgeleri İnceleyin (docType: "review") - Ürünlerle bağlantılı müşteri incelemeleri ve derecelendirmeleri productId üzerinden

Vektör örnek veri kümesi, standart örnek veri kümesini temel alır. Vektör veri kümesindeki ürün belgeleri, anlamsal arama özellikleri için 1536 boyutlu eklemeler içeren ek vectors bir özellik içerir.

Uyarı

Hem veri kümelerini hem de OpenAI text-embedding-3-large modeli kullanılarak oluşturulmuş vektörlere sahip 512 boyutlu ek bir veri kümesini Fabric - Örnekler Deposu içerisindeki Cosmos DB Örnek Veri Kümeleri klasöründe bulabilirsiniz.

Belge şemaları

Ürün belgesi şeması

Ürün belgeleri, e-ticaret kataloğundaki tek tek öğeler hakkında ayrıntılı bilgiler içerir:

Mülkiyet Türü Açıklama
id string Ürün için GUID biçiminde benzersiz tanımlayıcı
docType string Belge türü tanımlayıcısı, her zaman "product"
productId string Ürün tanımlayıcısı, ürün belgeleriyle aynı id
name string Ürün görünen adı
description string Ayrıntılı ürün açıklaması
categoryName string Ürün kategorisi (örneğin, "Bilgisayarlar, Dizüstü Bilgisayarlar", "Medya", "Aksesuarlar")
inventory number Şu anda stokta olan ürün sayısı
firstAvailable string Ürünün kullanıma sunulduğu tarih (ISO 8601 biçimi)
currentPrice number Geçerli satış fiyatı
priceHistory array Fiyat değişikliği nesneleri dizisi, date ve price alanları içeren
priceHistory[].date string ISO 8601 biçiminde fiyat değişikliğinin tarih ve saati
priceHistory[].price number Belirtilen tarihteki fiyat
vectors array Yalnızca vektör örnek verileri - 1536 boyutlu vektör ekleme

Belge şemasını gözden geçirme

Gözden geçirme belgeleri, ürünler için müşteri geri bildirimleri ve derecelendirmeleri içerir:

Mülkiyet Türü Açıklama
id string GUID biçiminde gözden geçirme için benzersiz tanımlayıcı
docType string Belge türü tanımlayıcısı, her zaman "review"
productId string İncelenen id ürünü referans alır
categoryName string Ürün kategorisi (gözden geçirilmiş üründen devralındı)
customerName string İncelemeyi yazan müşterinin adı
reviewDate string İncelemenin gönderildiği tarih (ISO 8601 biçimi)
stars number Müşteri tarafından verilen derecelendirme (1-5 ölçek)
reviewText string Müşteriden yazılı inceleme içeriği

Uyarı

Cosmos DB, tüm belgeler için sistem özelliklerini (_rid, _self, _etag, _attachments, _ts) otomatik olarak oluşturur.

Uyarı

ISO 8601 biçimi hakkında daha fazla bilgi için bkz. uluslararası tarih ve saat standardı. GUID biçimi hakkında daha fazla bilgi için bkz. evrensel olarak benzersiz tanımlayıcılar.

Örnek belgeler

Aşağıdaki örneklerde her iki örnek veri kümesindeki belgelerin yapısı gösterilmektedir.

Standart ürün belgesi örneği

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Vektörleştirilmiş ürün belgesi örneği

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Belge örneğini gözden geçirme

Gözden geçirme belgeleri her iki örnek veri kümesinde de aynıdır:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Örnek verileri kullanma

Her iki örnek veri kümesi de Cosmos DB'de verileri sorgulama, filtreleme ve toplama alıştırmaları gerçekleştirmenize yardımcı olur. Karma belge türleri, çeşitli kullanım örnekleri için gerçekçi senaryolar sağlar.

Standart örnek veri senaryoları

  • İlgili verileri birleştirme: productId kullanarak gözden geçirmeleri ürünlere bağlama
  • Kategori analizi: Ürünleri ve incelemeleri sorgulama categoryName
  • İnceleme analizi: Müşteri geri bildirim düzenlerini ve derecelendirmelerini inceleme

Yaygın sorgu desenleri

Bir kategorideki tüm ürünleri alma:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Belirli bir ürün için incelemeler alın:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Vektör örnek veri senaryoları

  • Anlamsal benzerlik araması: Vektör eklemelerini kullanarak benzer özelliklere sahip ürünleri bulma
  • İçerik tabanlı öneriler: Açıklama benzerliğine göre ürün önerileri oluşturma
  • Karma sorgular: Gelişmiş sonuçlar için geleneksel filtreleri vektör benzerliğiyle birleştirme

JSON şemaları

Aşağıdaki JSON şemaları, her iki örnek veri kümesindeki belgelerin yapısını açıklar. Kendi Cosmos DB iş yükleriniz için benzer verileri doğrulamak veya oluşturmak için bu şemaları kullanın.

Standart ürün belgesi şeması

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Vektör özellikli ürün belgesi şeması

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Belge şemasını gözden geçirme

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}