Del via


Eksempler på datasæt i Cosmos DB i Microsoft Fabric

Microsoft Fabrics Cosmos DB-databasearbejdsbelastning giver indbyggede eksempeldatasæt, der hjælper dig med at udforske, lære og eksperimentere med NoSQL-databasemønstre. Dette datasæt repræsenterer et e-handelsscenarie med produkter og kundeanmeldelser, der demonstrerer, hvordan forskellige enhedstyper sameksisterer i samme container.

To eksempler på datasæt er tilgængelige:

  • Standard eksempeldata: Kernedata fra e-handel med produkter og anmeldelser
  • Vektorprøvedata: Forbedret version, der inkluderer 1536-dimensionelle vektorindlejringer genereret ved brug af OpenAIs tekstindlejring-ada-002-model til semantiske søgescenarier.

Datasæt oversigt

Begge eksempler på datasæt indeholder de samme e-handelsdata med to dokumenttyper.

  • Produktdokumenter (docType: "product") - Individuelle produkter med navn, beskrivelse, lager, aktuel pris og en indlejret array af prishistorikken for det pågældende produkt.
  • Gennemgå dokumenter (docType: "review") - Kundeanmeldelser og vurderinger knyttet til produkter via productId

Vektorprøvedatasættet er baseret på standarddatasættet. Produktdokumenter i vektordatasættet indeholder en yderligere vectors egenskab, der indeholder 1536-dimensionelle embeddings til semantisk søgning.

Note

Du kan finde både datasæt samt et ekstra datasæt med vektorer genereret ved hjælp af OpenAI text-embedding-3-large modellen med 512 dimensioner i mappen Sample Datasets i Cosmos DB i Fabric - Samples Repository

Dokumentskemaer

Produktdokumentskema

Produktdokumenter indeholder detaljerede oplysninger om de enkelte varer i e-handelskataloget:

Property Type Description
id string Unik identifikator for produktet i GUID-format
docType string Dokumenttypeidentifikator, altid "product"
productId string Produktidentifikator, den samme som id for produktdokumenter
name string Produktets visningsnavn
description string Detaljeret produktbeskrivelse
categoryName string Produktkategori (f.eks. "Computere, bærbare computere", "medier", "tilbehør")
inventory number Antal varer på lager i øjeblikket
firstAvailable string Dato hvor produktet blev tilgængeligt (ISO 8601-format)
currentPrice number Nuværende salgspris
priceHistory array Array af prisændringsobjekter med date og price felter
priceHistory[].date string Dato og tidspunkt for prisændringen i ISO 8601-format
priceHistory[].price number Pris på den angivne dato
vectors array Kun vektorprøvedata - 1536-dimensionel vektorindlejring

Gennemgå dokumentskemaet

Anmeldelsesdokumenter indeholder kundefeedback og vurderinger af produkter:

Property Type Description
id string Unik identifikator for gennemgangen i GUID-format
docType string Dokumenttypeidentifikator, altid "review"
productId string Henvisninger til id det produkt, der anmeldes
categoryName string Produktkategori (arvet fra det anmeldte produkt)
customerName string Navnet på kunden, der skrev anmeldelsen
reviewDate string Dato for indsendelsen af anmeldelsen (ISO 8601-format)
stars number Bedømmelse givet af kunden (skala 1-5)
reviewText string Skriftligt anmeldelsesindhold fra kunden

Note

Cosmos DB genererer automatisk systemegenskaber (_rid, _self, , _etag_attachments, ) _tsfor alle dokumenter.

Note

Du kan få flere oplysninger om ISO 8601-formatet i international standard for dato og klokkeslæt. Du kan få flere oplysninger om GUID-formatet under Universelt entydige id'er.

Eksempler på dokumenter

Følgende eksempler viser strukturen af dokumenter i begge eksempeldatasæt.

Eksempel på standardproduktdokument

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Eksempel på et vektoriseret produktdokument

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Gennemgå eksempel på dokumentet

Gennemgangsdokumenter er identiske i begge eksempler på datasæt:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Sådan bruger du eksempeldataene

Begge eksempler på datasæt hjælper dig med at øve forespørgsler, filtrering og aggregering af data i Cosmos DB. De blandede dokumenttyper giver realistiske scenarier for forskellige anvendelsestilfælde.

Standard eksempeldatascenarier

  • Sammenslutning af relaterede data: Link anmeldelser til produkter ved hjælp af productId
  • Kategorianalyse: Søg produkter og anmeldelser efter categoryName
  • Anmeldelsesanalyse: Undersøg kundefeedbackmønstre og vurderinger

Almindelige forespørgselsmønstre

Få alle produkter i en kategori:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Få anmeldelser af et bestemt produkt:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Vektorprøvedatascenarier

  • Semantisk lighedssøgning: Find produkter med lignende egenskaber ved hjælp af vektorindlejringer
  • Indholdsbaserede anbefalinger: Generer produktforslag baseret på beskrivelseslighed
  • Hybridforespørgsler: Kombiner traditionelle filtre med vektorlighed for forbedrede resultater

JSON-skemaer

Følgende JSON-skemaer beskriver strukturen af dokumenter i begge eksempeldatasæt. Brug disse skemaer til at validere eller generere lignende data til dine egne Cosmos DB-arbejdsbelastninger.

Standard produktdokumentskema

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Vektoraktiveret produktdokumentskema

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Gennemgå dokumentskemaet

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}