Sdílet prostřednictvím


Ukázkové datové sady ve službě Cosmos DB v Microsoft Fabric

Úloha databáze Cosmos DB v Microsoft Fabric nabízí integrované ukázkové datové sady, které vám pomůžou zkoumat, učit se a experimentovat se vzory databáze NoSQL. Tato datová sada představuje scénář elektronického obchodování s produkty a recenzemi zákazníků a ukazuje, jak různé typy entit existují ve stejném kontejneru.

K dispozici jsou dvě ukázkové datové sady:

  • Standardní ukázková data: Základní data elektronického obchodování s produkty a recenzemi
  • Vektorová ukázková data: Rozšířená verze, která zahrnuje 1536-rozměrné vektorové vnoření vytvořené modelem OpenAI text-embedding-ada-002 pro scénáře sémantického vyhledávání.

Přehled datové sady

Obě ukázkové datové sady obsahují stejná data elektronického obchodování se dvěma typy dokumentů.

  • Dokumenty o produktu (docType: "product") – jednotlivé produkty s názvem, popisem, skladem, aktuální cenou a vloženým polem historie cen pro daný produkt.
  • Recenze dokumentů (docType: "review") – Recenze a hodnocení zákazníků propojená s produkty prostřednictvím productId

Vektorová ukázková datová sada je založená na standardní ukázkové sadě dat. Dokumenty produktů v sadě vektorových dat obsahují další vectors vlastnost obsahující 1536-rozměrné embeddingy pro funkce sémantického vyhledávání.

Poznámka:

Datové sady i další datovou sadu s vektory vygenerovanými pomocí modelu OpenAI text-embedding-3-large s 512 dimenzemi najdete ve složce Ukázkové datové sady v Cosmos DB - Úložiště ukázek.

Schémata dokumentů

Schéma dokumentu produktu

Dokumenty produktů obsahují podrobné informace o jednotlivých položkách v katalogu elektronického obchodování:

Vlastnictví Typ Popis
id string Jedinečný identifikátor produktu ve formátu GUID
docType string Identifikátor typu dokumentu, vždy "product"
productId string Identifikátor produktu, stejný jako id u dokumentů produktů
name string Zobrazovaný název produktu
description string Podrobný popis produktu
categoryName string Kategorie produktu (např. "Počítače, notebooky", "Média", "Příslušenství")
inventory number Počet aktuálně skladových položek
firstAvailable string Datum, kdy byl produkt k dispozici (formát ISO 8601)
currentPrice number Aktuální prodejní cena
priceHistory array Pole objektů změny cen s polem date a polem price
priceHistory[].date string Datum a čas změny ceny ve formátu ISO 8601
priceHistory[].price number Cena za zadané datum
vectors array Pouze vektorová ukázková data – vkládání 1536 dimenzionálních vektorů

Kontrola schématu dokumentu

Recenzní dokumenty obsahují zpětnou vazbu zákazníků a hodnocení produktů.

Vlastnictví Typ Popis
id string Jedinečný identifikátor revize ve formátu GUID
docType string Identifikátor typu dokumentu, vždy "review"
productId string Odkazuje na id produktu, který se kontroluje
categoryName string Kategorie produktu (zděděná z revidovaného produktu)
customerName string Jméno zákazníka, který napsal recenzi
reviewDate string Datum odeslání revize (formát ISO 8601)
stars number Hodnocení zadané zákazníkem (škálování 1–5)
reviewText string Písemné hodnocení obsahu od zákazníka

Poznámka:

Cosmos DB automaticky generuje systémové vlastnosti (_rid, _self, _etag, _attachments, _ts) pro všechny dokumenty.

Poznámka:

Další informace o formátu ISO 8601 naleznete v mezinárodní normě data a času. Další informace o formátu GUID najdete v univerzálních jedinečných identifikátorech.

Ukázkové dokumenty

Následující příklady ukazují strukturu dokumentů v obou ukázkových datových sadách.

Příklad standardního dokumentu produktu

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Příklad vektorizovaného dokumentu produktu

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Příklad revize dokumentu

Recenze dokumentů jsou identické v obou sadách ukázkových dat.

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Jak používat ukázková data

Obě ukázkové sady dat vám pomůžou procvičovat dotazování, filtrování a agregaci dat ve službě Cosmos DB. Smíšené typy dokumentů poskytují realistické scénáře pro různé případy použití.

Standardní ukázkové scénáře dat

  • Připojení souvisejících dat: Propojení recenzí s produkty pomocí productId
  • Analýza kategorií: Dotazování produktů a recenze categoryName
  • Analýza recenzí: Prozkoumání vzorců a hodnocení zákaznické zpětné vazby

Běžné vzory dotazů

Získejte všechny produkty v kategorii:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Získejte recenze pro konkrétní produkt:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Scénáře vektorových ukázkových dat

  • Vyhledávání sémantické podobnosti: Hledání produktů s podobnými funkcemi pomocí vektorových vkládání
  • Doporučení založená na obsahu: Generování návrhů produktů na základě podobnosti popisu
  • Hybridní dotazy: Kombinování tradičních filtrů s podobností vektorů pro vylepšené výsledky

Schémata JSON

Následující schémata JSON popisují strukturu dokumentů v obou ukázkových datových sadách. Tato schémata slouží k ověření nebo generování podobných dat pro vaše vlastní úlohy Cosmos DB.

Standardní schéma dokumentu produktu

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Schéma dokumentu produktu s podporou vektorů

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Kontrola schématu dokumentu

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}