Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
Microsoft Fabrics Cosmos DB-databasearbejdsbelastning giver indbyggede eksempeldatasæt, der hjælper dig med at udforske, lære og eksperimentere med NoSQL-databasemønstre. Dette datasæt repræsenterer et e-handelsscenarie med produkter og kundeanmeldelser, der demonstrerer, hvordan forskellige enhedstyper sameksisterer i samme container.
To eksempler på datasæt er tilgængelige:
- Standard eksempeldata: Kernedata fra e-handel med produkter og anmeldelser
- Vektorprøvedata: Forbedret version, der inkluderer 1536-dimensionelle vektorindlejringer genereret ved brug af OpenAIs tekstindlejring-ada-002-model til semantiske søgescenarier.
Datasæt oversigt
Begge eksempler på datasæt indeholder de samme e-handelsdata med to dokumenttyper.
-
Produktdokumenter (
docType: "product") - Individuelle produkter med navn, beskrivelse, lager, aktuel pris og en indlejret array af prishistorikken for det pågældende produkt. -
Gennemgå dokumenter (
docType: "review") - Kundeanmeldelser og vurderinger knyttet til produkter viaproductId
Vektorprøvedatasættet er baseret på standarddatasættet. Produktdokumenter i vektordatasættet indeholder en yderligere vectors egenskab, der indeholder 1536-dimensionelle embeddings til semantisk søgning.
Note
Du kan finde både datasæt samt et ekstra datasæt med vektorer genereret ved hjælp af OpenAI text-embedding-3-large modellen med 512 dimensioner i mappen Sample Datasets i Cosmos DB i Fabric - Samples Repository
Dokumentskemaer
Produktdokumentskema
Produktdokumenter indeholder detaljerede oplysninger om de enkelte varer i e-handelskataloget:
| Property | Type | Description |
|---|---|---|
id |
string |
Unik identifikator for produktet i GUID-format |
docType |
string |
Dokumenttypeidentifikator, altid "product" |
productId |
string |
Produktidentifikator, den samme som id for produktdokumenter |
name |
string |
Produktets visningsnavn |
description |
string |
Detaljeret produktbeskrivelse |
categoryName |
string |
Produktkategori (f.eks. "Computere, bærbare computere", "medier", "tilbehør") |
inventory |
number |
Antal varer på lager i øjeblikket |
firstAvailable |
string |
Dato hvor produktet blev tilgængeligt (ISO 8601-format) |
currentPrice |
number |
Nuværende salgspris |
priceHistory |
array |
Array af prisændringsobjekter med date og price felter |
priceHistory[].date |
string |
Dato og tidspunkt for prisændringen i ISO 8601-format |
priceHistory[].price |
number |
Pris på den angivne dato |
vectors |
array |
Kun vektorprøvedata - 1536-dimensionel vektorindlejring |
Gennemgå dokumentskemaet
Anmeldelsesdokumenter indeholder kundefeedback og vurderinger af produkter:
| Property | Type | Description |
|---|---|---|
id |
string |
Unik identifikator for gennemgangen i GUID-format |
docType |
string |
Dokumenttypeidentifikator, altid "review" |
productId |
string |
Henvisninger til id det produkt, der anmeldes |
categoryName |
string |
Produktkategori (arvet fra det anmeldte produkt) |
customerName |
string |
Navnet på kunden, der skrev anmeldelsen |
reviewDate |
string |
Dato for indsendelsen af anmeldelsen (ISO 8601-format) |
stars |
number |
Bedømmelse givet af kunden (skala 1-5) |
reviewText |
string |
Skriftligt anmeldelsesindhold fra kunden |
Note
Cosmos DB genererer automatisk systemegenskaber (_rid, _self, , _etag_attachments, ) _tsfor alle dokumenter.
Note
Du kan få flere oplysninger om ISO 8601-formatet i international standard for dato og klokkeslæt. Du kan få flere oplysninger om GUID-formatet under Universelt entydige id'er.
Eksempler på dokumenter
Følgende eksempler viser strukturen af dokumenter i begge eksempeldatasæt.
Eksempel på standardproduktdokument
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2024-08-01T00:00:00",
"price": 363.0
},
{
"date": "2025-04-01T00:00:00",
"price": 408.14
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
]
}
Eksempel på et vektoriseret produktdokument
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
],
"vectors": [
-0.02783808670938015,
0.011827611364424229,
-0.04711977392435074,
// ... (1536 dimensions total)
0.04251981899142265
]
}
Gennemgå eksempel på dokumentet
Gennemgangsdokumenter er identiske i begge eksempler på datasæt:
{
"id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
"docType": "review",
"productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
"categoryName": "Accessories, Premium Headphones",
"customerName": "Emily Rodriguez",
"reviewDate": "2025-03-02T00:00:00",
"stars": 5,
"reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}
Sådan bruger du eksempeldataene
Begge eksempler på datasæt hjælper dig med at øve forespørgsler, filtrering og aggregering af data i Cosmos DB. De blandede dokumenttyper giver realistiske scenarier for forskellige anvendelsestilfælde.
Standard eksempeldatascenarier
-
Sammenslutning af relaterede data: Link anmeldelser til produkter ved hjælp af
productId -
Kategorianalyse: Søg produkter og anmeldelser efter
categoryName - Anmeldelsesanalyse: Undersøg kundefeedbackmønstre og vurderinger
Almindelige forespørgselsmønstre
Få alle produkter i en kategori:
SELECT *
FROM c
WHERE
c.docType = "product" AND
c.categoryName = "Computers, Laptops"
Få anmeldelser af et bestemt produkt:
SELECT *
FROM c
WHERE
c.docType = "review" AND
c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"
Vektorprøvedatascenarier
- Semantisk lighedssøgning: Find produkter med lignende egenskaber ved hjælp af vektorindlejringer
- Indholdsbaserede anbefalinger: Generer produktforslag baseret på beskrivelseslighed
- Hybridforespørgsler: Kombiner traditionelle filtre med vektorlighed for forbedrede resultater
JSON-skemaer
Følgende JSON-skemaer beskriver strukturen af dokumenter i begge eksempeldatasæt. Brug disse skemaer til at validere eller generere lignende data til dine egne Cosmos DB-arbejdsbelastninger.
Standard produktdokumentskema
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
]
}
Vektoraktiveret produktdokumentskema
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
},
"vectors": {
"type": "array",
"items": { "type": "number" },
"minItems": 1536,
"maxItems": 1536
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
]
}
Gennemgå dokumentskemaet
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string", "const": "review" },
"productId": { "type": "string" },
"categoryName": { "type": "string" },
"customerName": { "type": "string" },
"reviewDate": { "type": "string" },
"stars": { "type": "number" },
"reviewText": { "type": "string" }
},
"required": [
"id", "docType", "productId", "categoryName", "customerName",
"reviewDate", "stars"
]
}