Del via


Eksempeldatasett i Cosmos DB i Microsoft Fabric

Microsoft Fabrics Cosmos DB-databasearbeidsbelastning gir innebygde eksempeldatasett som hjelper deg å utforske, lære og eksperimentere med NoSQL-databasemønstre. Dette datasettet representerer et e-handelsscenario med produkter og kundeanmeldelser, og demonstrerer hvordan ulike enhetstyper sameksisterer i samme beholder.

To eksempler på datasett er tilgjengelige:

  • Standard eksempeldata: Kjernedata for e-handel med produkter og anmeldelser
  • Vektorprøvedata: Forbedret versjon som inkluderer 1536-dimensjonale vektorinnlegginger generert ved bruk av OpenAIs tekst-embedding-ada-002-modell for semantiske søkescenarier.

Oversikt over datasett

Begge eksempeldatasettene inneholder de samme e-handelsdataene med to dokumenttyper.

  • Produktdokumenter (docType: "product") - Individuelle produkter med navn, beskrivelse, lager, nåværende pris og en innebygd matrise av prishistorikken for det produktet.
  • Gjennomgangsdokumenter (docType: "review") - Kundeanmeldelser og vurderinger knyttet til produkter via productId

Vektorprøvedatasettet er basert på standard prøvedatasett. Produktdokumenter i vektordatasettet inkluderer en tilleggsegenskap vectors som inneholder 1536-dimensjonale innleiringer for semantisk søk.

Note

Du kan finne både datasett og et ekstra datasett med vektorer generert ved bruk av OpenAI text-embedding-3-large modellen med 512 dimensjoner i mappen Sample Datasets i Cosmos DB i Fabric - Samples Repository

Dokumentskjemaer

Produktdokumentskjema

Produktdokumenter inneholder detaljert informasjon om enkeltvarer i e-handelskatalogen:

Property Type Description
id string Unik identifikator for produktet i GUID-format
docType string Dokumenttypeidentifikator, alltid "product"
productId string Produktidentifikator, samme som id for produktdokumenter
name string Produktets visningsnavn
description string Detaljert produktbeskrivelse
categoryName string Produktkategori (f.eks. "Datamaskiner, bærbare datamaskiner", "Medier", "Tilbehør")
inventory number Antall varer som for tiden er på lager
firstAvailable string Dato da produktet ble tilgjengelig (ISO 8601-format)
currentPrice number Nåværende salgspris
priceHistory array Array av prisendringsobjekter med date og price felt
priceHistory[].date string Dato og klokkeslett for prisendringen i ISO 8601-format
priceHistory[].price number Pris på den angitte datoen
vectors array Kun vektorprøvedata – 1536-dimensjonal vektorinnbygging

Gjennomgå dokumentskjemaet

Anmeldelsesdokumenter inneholder kundetilbakemeldinger og vurderinger av produkter:

Property Type Description
id string Unik identifikator for gjennomgangen i GUID-format
docType string Dokumenttypeidentifikator, alltid "review"
productId string Referanser til id produktet som anmeldes
categoryName string Produktkategori (arvet fra det anmeldte produktet)
customerName string Navnet på kunden som skrev anmeldelsen
reviewDate string Dato for når vurderingen ble sendt inn (ISO 8601-format)
stars number Vurdering gitt av kunden (skala 1-5)
reviewText string Skriftlig anmeldelsesinnhold fra kunden

Note

Cosmos DB genererer automatisk systemegenskaper (_rid, _self, _etag, _attachments, ) _tsfor alle dokumenter.

Note

Hvis du vil ha mer informasjon om ISO 8601-formatet, kan du se internasjonal standard for dato og klokkeslett. Hvis du vil ha mer informasjon om GUID-formatet, kan du se universelt unike identifikatorer.

Eksempler på dokumenter

Følgende eksempler viser strukturen til dokumentene i begge eksempeldatasettene.

Eksempel på standard produktdokument

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Eksempel på et vektorisert produktdokument

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Gjennomgå eksempel på dokumentet

Gjennomgangsdokumentene er identiske i begge eksempeldatasettene:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Slik bruker du eksempeldataene

Begge eksempeldatasettene hjelper deg å øve på å spørre, filtrere og aggregere data i Cosmos DB. De blandede dokumenttypene gir realistiske scenarier for ulike bruksområder.

Standard eksempeldatascenarier

  • Sammenslutning av relaterte data: Lenkeanmeldelser til produkter ved bruk av productId
  • Kategorianalyse: Søk produkter og anmeldelser etter categoryName
  • Anmeldelsesanalyse: Undersøk tilbakemeldingsmønstre og vurderinger fra kunder

Vanlige spørringsmønstre

Få alle produktene i en kategori:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Få anmeldelser av et spesifikt produkt:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Vektorprøvedatascenarier

  • Semantisk likhetssøk: Finn produkter med lignende egenskaper ved hjelp av vektorinnlegginger
  • Innholdsbaserte anbefalinger: Generer produktforslag basert på beskrivelseslikhet
  • Hybride spørringer: Kombiner tradisjonelle filtre med vektorlikhet for forbedrede resultater

JSON-skjemaer

Følgende JSON-skjemaer beskriver strukturen til dokumenter i begge eksempeldatasettene. Bruk disse skjemaene til å validere eller generere lignende data for dine egne Cosmos DB-arbeidsbelastninger.

Standard produktdokumentskjema

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Vektoraktivert produktdokumentskjema

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Gjennomgå dokumentskjemaet

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}