Muistiinpano
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Microsoft Fabricin Cosmos DB -tietokantatyökuorma tarjoaa sisäänrakennettuja näyteaineistoja, joiden avulla voit tutkia, oppia ja kokeilla NoSQL-tietokantamalleja. Tämä tietoaineisto edustaa verkkokauppatilannetta tuotteineen ja asiakasarvosteluineen, osoittaen, miten eri yksikkötyypit esiintyvät samassa kontissa.
Saatavilla on kaksi otosaineistoa:
- Vakioesimerkkidata: Ydinverkkokauppatiedot tuotteineen ja arvosteluineen
- Vektorinäytedata: Parannettu versio, joka sisältää 1536-ulotteiset vektoriupotukset, jotka on tuotettu OpenAI:n tekstin upotus-ada-002-mallilla semanttisiin hakutilanteisiin.
Tietoaineiston yleiskatsaus
Molemmat esimerkkiaineistot sisältävät saman verkkokaupan datan kahdella asiakirjatyypillä.
-
Tuotedokumentit (
docType: "product") - Yksittäiset tuotteet, joissa on nimi, kuvaus, varasto, nykyinen hinta ja upotettu taulukko kyseisen tuotteen hintahistoriasta. -
Tarkastusasiakirjat (
docType: "review") - Asiakasarvostelut ja arvostelut, jotka liittyvät tuotteisiinproductId
Vektorinäyteaineisto perustuu standardiotosaineistoon. Vektoriaineiston tuotedokumentteihin sisältyy lisäominaisuus vectors , joka sisältää 1536-ulotteiset upotukset semanttiseen hakukykyyn.
Note
Löydät molemmat aineistot sekä lisäaineiston, jossa vektorit on generoitu OpenAI:n tekstin upotus-3-large -mallilla, jossa on 512 ulottuvuutta, Cosmos DB:n Sample Datasets -kansiosta Fabric - Samples Repository -kansiossa
Asiakirjaskeemat
Tuotedokumenttiskeema
Tuotedokumentit sisältävät yksityiskohtaista tietoa yksittäisistä tuotteista verkkokauppaluettelossa:
| Property | Type | Description |
|---|---|---|
id |
string |
Tuotteen yksilöllinen tunniste GUID-muodossa |
docType |
string |
Dokumenttityyppitunniste, aina "product" |
productId |
string |
Tuotetunniste, sama kuin id tuotedokumenteissa |
name |
string |
Tuotteen näyttönimi |
description |
string |
Yksityiskohtainen tuotekuvaus |
categoryName |
string |
Tuoteluokka (esim. "Tietokoneet, kannettavat", "Media", "Lisävarusteet") |
inventory |
number |
Varastossa olevien tuotteiden määrä |
firstAvailable |
string |
Päivämäärä, jolloin tuote tuli saataville (ISO 8601 -muoto) |
currentPrice |
number |
Nykyinen myyntihinta |
priceHistory |
array |
Hintamuutosobjektien taulukko, jossa date ja price kentät |
priceHistory[].date |
string |
Hintamuutoksen päivämäärä ja aika ISO 8601 -muodossa |
priceHistory[].price |
number |
Hinta määrättynä päivänä |
vectors |
array |
Vain vektorinäytedata – 1536-ulotteinen vektoriupotus |
Tarkastusasiakirjaskeema
Arviointidokumentit sisältävät asiakaspalautetta ja arvioita tuotteista:
| Property | Type | Description |
|---|---|---|
id |
string |
Yksilöllinen tunniste tarkastelulle GUID-muodossa |
docType |
string |
Dokumenttityyppitunniste, aina "review" |
productId |
string |
Viittaukset id arvioitavaan tuotteeseen |
categoryName |
string |
Tuoteluokka (peritty arvostetusta tuotteesta) |
customerName |
string |
Asiakkaan nimi, joka kirjoitti arvostelun |
reviewDate |
string |
Päivämäärä, jolloin arviointi lähetettiin (ISO 8601 -muoto) |
stars |
number |
Asiakkaan antama arvosana (1–5 asteikko) |
reviewText |
string |
Asiakkaan kirjallinen arvostelusisältö |
Note
Cosmos DB generoi automaattisesti järjestelmäominaisuudet (_rid, _self, _etag_attachments_ts) kaikille asiakirjoille.
Note
Lisätietoja ISO 8601 -muodosta on kohdassa Kansainvälinen päivämäärä ja aika -standardi. Lisätietoja GUID-muodosta on yleisissä tunnisteissa.
Esimerkkidokumentit
Seuraavat esimerkit osoittavat molempien otosaineistojen dokumenttien rakenteen.
Standardituotedokumentin esimerkki
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2024-08-01T00:00:00",
"price": 363.0
},
{
"date": "2025-04-01T00:00:00",
"price": 408.14
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
]
}
Vektoroidun tuotedokumentin esimerkki
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
],
"vectors": [
-0.02783808670938015,
0.011827611364424229,
-0.04711977392435074,
// ... (1536 dimensions total)
0.04251981899142265
]
}
Tarkistusasiakirjan esimerkki
Katsausdokumentit ovat identtisiä molemmissa otosaineistoissa:
{
"id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
"docType": "review",
"productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
"categoryName": "Accessories, Premium Headphones",
"customerName": "Emily Rodriguez",
"reviewDate": "2025-03-02T00:00:00",
"stars": 5,
"reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}
Mallitietojen käyttäminen
Molemmat esimerkkiaineistot auttavat harjoittelemaan kyselyjä, suodatusta ja datan kokoamista Cosmos DB:ssä. Sekadokumenttityypit tarjoavat realistisia tilanteita erilaisiin käyttötarkoituksiin.
Vakiootosskenaariot
-
Liittyvän datan liittäminen: Linkitä arvostelut tuotteisiin käyttämällä
productId -
Kategoria-analyysi: Kysy tuotteita ja arvosteluja
categoryName - Arviointianalyysi: Tarkastele asiakaspalautteen malleja ja arvioita
Yleiset kyselykuviot
Saat kaikki tuotteet kategoriaan:
SELECT *
FROM c
WHERE
c.docType = "product" AND
c.categoryName = "Computers, Laptops"
Hanki arvosteluja tietystä tuotteesta:
SELECT *
FROM c
WHERE
c.docType = "review" AND
c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"
Vektorinäytedatan skenaariot
- Semanttinen samankaltaisuushaku: Etsi samankaltaisia ominaisuuksia omaavia tuotteita vektoriupotusten avulla
- Sisältöön perustuvat suositukset: Luo tuoteehdotuksia kuvauksen samankaltaisuuden perusteella
- Hybridikyselyt: Yhdistä perinteiset suodattimet vektorien samankaltaisuuteen paremman tuloksen saavuttamiseksi
JSON-skeemat
Seuraavat JSON-skeemat kuvaavat dokumenttien rakennetta molemmissa otosaineistoissa. Käytä näitä skeemoja validoidaksesi tai tuottaaksesi samankaltaista dataa omille Cosmos DB -työkuormillesi.
Standardi tuotedokumenttikaavio
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
]
}
Vektoripohjainen tuotedokumenttiskeema
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
},
"vectors": {
"type": "array",
"items": { "type": "number" },
"minItems": 1536,
"maxItems": 1536
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
]
}
Tarkastusasiakirjaskeema
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string", "const": "review" },
"productId": { "type": "string" },
"categoryName": { "type": "string" },
"customerName": { "type": "string" },
"reviewDate": { "type": "string" },
"stars": { "type": "number" },
"reviewText": { "type": "string" }
},
"required": [
"id", "docType", "productId", "categoryName", "customerName",
"reviewDate", "stars"
]
}