Merk
Tilgang til denne siden krever autorisasjon. Du kan prøve å logge på eller endre kataloger.
Tilgang til denne siden krever autorisasjon. Du kan prøve å endre kataloger.
Microsoft Fabrics Cosmos DB-databasearbeidsbelastning gir innebygde eksempeldatasett som hjelper deg å utforske, lære og eksperimentere med NoSQL-databasemønstre. Dette datasettet representerer et e-handelsscenario med produkter og kundeanmeldelser, og demonstrerer hvordan ulike enhetstyper sameksisterer i samme beholder.
To eksempler på datasett er tilgjengelige:
- Standard eksempeldata: Kjernedata for e-handel med produkter og anmeldelser
- Vektorprøvedata: Forbedret versjon som inkluderer 1536-dimensjonale vektorinnlegginger generert ved bruk av OpenAIs tekst-embedding-ada-002-modell for semantiske søkescenarier.
Oversikt over datasett
Begge eksempeldatasettene inneholder de samme e-handelsdataene med to dokumenttyper.
-
Produktdokumenter (
docType: "product") - Individuelle produkter med navn, beskrivelse, lager, nåværende pris og en innebygd matrise av prishistorikken for det produktet. -
Gjennomgangsdokumenter (
docType: "review") - Kundeanmeldelser og vurderinger knyttet til produkter viaproductId
Vektorprøvedatasettet er basert på standard prøvedatasett. Produktdokumenter i vektordatasettet inkluderer en tilleggsegenskap vectors som inneholder 1536-dimensjonale innleiringer for semantisk søk.
Note
Du kan finne både datasett og et ekstra datasett med vektorer generert ved bruk av OpenAI text-embedding-3-large modellen med 512 dimensjoner i mappen Sample Datasets i Cosmos DB i Fabric - Samples Repository
Dokumentskjemaer
Produktdokumentskjema
Produktdokumenter inneholder detaljert informasjon om enkeltvarer i e-handelskatalogen:
| Property | Type | Description |
|---|---|---|
id |
string |
Unik identifikator for produktet i GUID-format |
docType |
string |
Dokumenttypeidentifikator, alltid "product" |
productId |
string |
Produktidentifikator, samme som id for produktdokumenter |
name |
string |
Produktets visningsnavn |
description |
string |
Detaljert produktbeskrivelse |
categoryName |
string |
Produktkategori (f.eks. "Datamaskiner, bærbare datamaskiner", "Medier", "Tilbehør") |
inventory |
number |
Antall varer som for tiden er på lager |
firstAvailable |
string |
Dato da produktet ble tilgjengelig (ISO 8601-format) |
currentPrice |
number |
Nåværende salgspris |
priceHistory |
array |
Array av prisendringsobjekter med date og price felt |
priceHistory[].date |
string |
Dato og klokkeslett for prisendringen i ISO 8601-format |
priceHistory[].price |
number |
Pris på den angitte datoen |
vectors |
array |
Kun vektorprøvedata – 1536-dimensjonal vektorinnbygging |
Gjennomgå dokumentskjemaet
Anmeldelsesdokumenter inneholder kundetilbakemeldinger og vurderinger av produkter:
| Property | Type | Description |
|---|---|---|
id |
string |
Unik identifikator for gjennomgangen i GUID-format |
docType |
string |
Dokumenttypeidentifikator, alltid "review" |
productId |
string |
Referanser til id produktet som anmeldes |
categoryName |
string |
Produktkategori (arvet fra det anmeldte produktet) |
customerName |
string |
Navnet på kunden som skrev anmeldelsen |
reviewDate |
string |
Dato for når vurderingen ble sendt inn (ISO 8601-format) |
stars |
number |
Vurdering gitt av kunden (skala 1-5) |
reviewText |
string |
Skriftlig anmeldelsesinnhold fra kunden |
Note
Cosmos DB genererer automatisk systemegenskaper (_rid, _self, _etag, _attachments, ) _tsfor alle dokumenter.
Note
Hvis du vil ha mer informasjon om ISO 8601-formatet, kan du se internasjonal standard for dato og klokkeslett. Hvis du vil ha mer informasjon om GUID-formatet, kan du se universelt unike identifikatorer.
Eksempler på dokumenter
Følgende eksempler viser strukturen til dokumentene i begge eksempeldatasettene.
Eksempel på standard produktdokument
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2024-08-01T00:00:00",
"price": 363.0
},
{
"date": "2025-04-01T00:00:00",
"price": 408.14
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
]
}
Eksempel på et vektorisert produktdokument
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
],
"vectors": [
-0.02783808670938015,
0.011827611364424229,
-0.04711977392435074,
// ... (1536 dimensions total)
0.04251981899142265
]
}
Gjennomgå eksempel på dokumentet
Gjennomgangsdokumentene er identiske i begge eksempeldatasettene:
{
"id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
"docType": "review",
"productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
"categoryName": "Accessories, Premium Headphones",
"customerName": "Emily Rodriguez",
"reviewDate": "2025-03-02T00:00:00",
"stars": 5,
"reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}
Slik bruker du eksempeldataene
Begge eksempeldatasettene hjelper deg å øve på å spørre, filtrere og aggregere data i Cosmos DB. De blandede dokumenttypene gir realistiske scenarier for ulike bruksområder.
Standard eksempeldatascenarier
-
Sammenslutning av relaterte data: Lenkeanmeldelser til produkter ved bruk av
productId -
Kategorianalyse: Søk produkter og anmeldelser etter
categoryName - Anmeldelsesanalyse: Undersøk tilbakemeldingsmønstre og vurderinger fra kunder
Vanlige spørringsmønstre
Få alle produktene i en kategori:
SELECT *
FROM c
WHERE
c.docType = "product" AND
c.categoryName = "Computers, Laptops"
Få anmeldelser av et spesifikt produkt:
SELECT *
FROM c
WHERE
c.docType = "review" AND
c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"
Vektorprøvedatascenarier
- Semantisk likhetssøk: Finn produkter med lignende egenskaper ved hjelp av vektorinnlegginger
- Innholdsbaserte anbefalinger: Generer produktforslag basert på beskrivelseslikhet
- Hybride spørringer: Kombiner tradisjonelle filtre med vektorlikhet for forbedrede resultater
JSON-skjemaer
Følgende JSON-skjemaer beskriver strukturen til dokumenter i begge eksempeldatasettene. Bruk disse skjemaene til å validere eller generere lignende data for dine egne Cosmos DB-arbeidsbelastninger.
Standard produktdokumentskjema
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
]
}
Vektoraktivert produktdokumentskjema
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
},
"vectors": {
"type": "array",
"items": { "type": "number" },
"minItems": 1536,
"maxItems": 1536
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
]
}
Gjennomgå dokumentskjemaet
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string", "const": "review" },
"productId": { "type": "string" },
"categoryName": { "type": "string" },
"customerName": { "type": "string" },
"reviewDate": { "type": "string" },
"stars": { "type": "number" },
"reviewText": { "type": "string" }
},
"required": [
"id", "docType", "productId", "categoryName", "customerName",
"reviewDate", "stars"
]
}