Zdieľať cez


Ukážkové dátové sady v Cosmos DB v Microsoft Fabric

Databázová záťaž Cosmos DB v Microsoft Fabric poskytuje zabudované ukážkové dátové súbory, ktoré vám pomôžu skúmať, učiť sa a experimentovať s NoSQL databázovými vzormi. Táto dátová sada predstavuje scenár e-commerce s produktmi a recenziami zákazníkov, čo ukazuje, ako rôzne typy entít koexistujú v tom istom kontajneri.

K dispozícii sú dve ukážkové dátové sady:

  • Štandardné ukážkové údaje: Základné údaje z e-commerce s produktmi a recenziami
  • Vektorové vzorkové dáta: Vylepšená verzia, ktorá obsahuje 1536-rozmerné vektorové embeddingy generované pomocou OpenAI text-embedding-ada-002 modelu pre sémantické vyhľadávacie scenáre.

Prehľad dátovej sady

Obe ukážkové dátové sady obsahujú rovnaké e-commerce dáta s dvoma typmi dokumentov.

  • Produktové dokumenty (docType: "product") - Jednotlivé produkty s názvom, popisom, zásobami, aktuálnou cenou a vloženým poľom cenovej histórie daného produktu.
  • Recenzné dokumenty (docType: "review") - Recenzie a hodnotenia zákazníkov prepojené s produktmi cez productId

Súbor vektorových vzoriek je založený na štandardnom vzorkovom dátovom súbore. Produktové dokumenty vo vektorovej dátovej množine obsahujú ďalšiu vectors vlastnosť obsahujúcu 1536-rozmerné embeddingy pre schopnosti sémantického vyhľadávania.

Note

Obe dátové sady aj ďalší dataset s vektormi generovanými pomocou OpenAI text-embedding-3-large modelu s 512 rozmermi nájdete v priečinku Sample Datasets v databáze Cosmos v Fabric - Samples Repository

Schémy dokumentov

Schéma produktových dokumentov

Produktové dokumenty obsahujú podrobné informácie o jednotlivých položkách v katalógu e-commerce:

Property Type Description
id string Jedinečný identifikátor produktu vo formáte GUID
docType string Identifikátor typu dokumentu, vždy "product"
productId string Identifikátor produktu, rovnaký ako id pri produktových dokumentoch
name string Názov produktu na displeji
description string Podrobný popis produktu
categoryName string Kategória produktov (napr. "Počítače, notebooky", "Médiá", "Príslušenstvo")
inventory number Počet položiek aktuálne na sklade
firstAvailable string Dátum, kedy sa produkt stal dostupným (formát ISO 8601)
currentPrice number Aktuálna predajná cena
priceHistory array Pole objektov zmeny ceny s date a price poľami
priceHistory[].date string Dátum a čas zmeny ceny vo formáte ISO 8601
priceHistory[].price number Cena v stanovenom dátume
vectors array Iba vektorové vzorky dát - 1536-rozmerné vektorové vkladanie

Schéma revíznych dokumentov

Recenzné dokumenty obsahujú spätnú väzbu zákazníkov a hodnotenia produktov:

Property Type Description
id string Jedinečný identifikátor pre recenziu vo formáte GUID
docType string Identifikátor typu dokumentu, vždy "review"
productId string Odkazy na id hodnotený produkt
categoryName string Kategória produktu (zdedená z recenzovaného produktu)
customerName string Meno zákazníka, ktorý napísal recenziu
reviewDate string Dátum odoslania recenzie (formát ISO 8601)
stars number Hodnotenie od zákazníka (stupnica 1-5)
reviewText string Písaný recenzný obsah od zákazníka

Note

Cosmos DB automaticky generuje systémové vlastnosti (_rid, , _self_etag, , _attachments) _tspre všetky dokumenty.

Note

Ďalšie informácie o formáte ISO 8601 nájdete v medzinárodnom formáte dátumu a času. Ďalšie informácie o formáte GUID nájdete v téme Univerzálne jedinečné identifikátory.

Príklady dokumentov

Nasledujúce príklady ukazujú štruktúru dokumentov v oboch ukážkových dátových súboroch.

Príklad štandardného produktového dokumentu

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Príklad vektorizovaného produktového dokumentu

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Príklad recenzného dokumentu

Prehľadové dokumenty sú identické v oboch vzorkových dátových súboroch:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Ako používať vzorové údaje

Obe vzorkové dátové sady vám pomôžu precvičiť dotazovanie, filtrovanie a agregáciu dát v Cosmos DB. Zmiešané typy dokumentov poskytujú realistické scenáre pre rôzne prípady použitia.

Štandardné scenáre vzorových dát

  • Pripojenie súvisiacich údajov: Odkazujte recenzie na produkty pomocou productId
  • Analýza kategórie: Vyhľadávanie produktov a recenzií categoryName
  • Analýza recenzie: Preskúmajte vzorce spätnej väzby a hodnotenia zákazníkov

Bežné vzory dotazov

Získajte všetky produkty v kategórii:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Získajte recenzie na konkrétny produkt:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Scenáre vektorových vzorkových dát

  • Vyhľadávanie sémantickej podobnosti: Nájdite produkty s podobnými vlastnosťami pomocou vektorových embeddingov
  • Odporúčania založené na obsahu: Generujte návrhy produktov na základe podobnosti opisov
  • Hybridné dotazy: Kombinujte tradičné filtre s vektorovou podobnosťou pre lepšie výsledky

JSON schémy

Nasledujúce JSON schémy popisujú štruktúru dokumentov v oboch ukážkových dátových súboroch. Použite tieto schémy na overenie alebo generovanie podobných dát pre vaše vlastné Cosmos DB workloady.

Schéma štandardného produktového dokumentu

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Schéma produktových dokumentov s podporou vektorov

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Schéma revíznych dokumentov

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}