Jaa


Esimerkkiaineistoja Cosmos DB:ssä Microsoft Fabricissa

Microsoft Fabricin Cosmos DB -tietokantatyökuorma tarjoaa sisäänrakennettuja näyteaineistoja, joiden avulla voit tutkia, oppia ja kokeilla NoSQL-tietokantamalleja. Tämä tietoaineisto edustaa verkkokauppatilannetta tuotteineen ja asiakasarvosteluineen, osoittaen, miten eri yksikkötyypit esiintyvät samassa kontissa.

Saatavilla on kaksi otosaineistoa:

  • Vakioesimerkkidata: Ydinverkkokauppatiedot tuotteineen ja arvosteluineen
  • Vektorinäytedata: Parannettu versio, joka sisältää 1536-ulotteiset vektoriupotukset, jotka on tuotettu OpenAI:n tekstin upotus-ada-002-mallilla semanttisiin hakutilanteisiin.

Tietoaineiston yleiskatsaus

Molemmat esimerkkiaineistot sisältävät saman verkkokaupan datan kahdella asiakirjatyypillä.

  • Tuotedokumentit (docType: "product") - Yksittäiset tuotteet, joissa on nimi, kuvaus, varasto, nykyinen hinta ja upotettu taulukko kyseisen tuotteen hintahistoriasta.
  • Tarkastusasiakirjat (docType: "review") - Asiakasarvostelut ja arvostelut, jotka liittyvät tuotteisiin productId

Vektorinäyteaineisto perustuu standardiotosaineistoon. Vektoriaineiston tuotedokumentteihin sisältyy lisäominaisuus vectors , joka sisältää 1536-ulotteiset upotukset semanttiseen hakukykyyn.

Note

Löydät molemmat aineistot sekä lisäaineiston, jossa vektorit on generoitu OpenAI:n tekstin upotus-3-large -mallilla, jossa on 512 ulottuvuutta, Cosmos DB:n Sample Datasets -kansiosta Fabric - Samples Repository -kansiossa

Asiakirjaskeemat

Tuotedokumenttiskeema

Tuotedokumentit sisältävät yksityiskohtaista tietoa yksittäisistä tuotteista verkkokauppaluettelossa:

Property Type Description
id string Tuotteen yksilöllinen tunniste GUID-muodossa
docType string Dokumenttityyppitunniste, aina "product"
productId string Tuotetunniste, sama kuin id tuotedokumenteissa
name string Tuotteen näyttönimi
description string Yksityiskohtainen tuotekuvaus
categoryName string Tuoteluokka (esim. "Tietokoneet, kannettavat", "Media", "Lisävarusteet")
inventory number Varastossa olevien tuotteiden määrä
firstAvailable string Päivämäärä, jolloin tuote tuli saataville (ISO 8601 -muoto)
currentPrice number Nykyinen myyntihinta
priceHistory array Hintamuutosobjektien taulukko, jossa date ja price kentät
priceHistory[].date string Hintamuutoksen päivämäärä ja aika ISO 8601 -muodossa
priceHistory[].price number Hinta määrättynä päivänä
vectors array Vain vektorinäytedata – 1536-ulotteinen vektoriupotus

Tarkastusasiakirjaskeema

Arviointidokumentit sisältävät asiakaspalautetta ja arvioita tuotteista:

Property Type Description
id string Yksilöllinen tunniste tarkastelulle GUID-muodossa
docType string Dokumenttityyppitunniste, aina "review"
productId string Viittaukset id arvioitavaan tuotteeseen
categoryName string Tuoteluokka (peritty arvostetusta tuotteesta)
customerName string Asiakkaan nimi, joka kirjoitti arvostelun
reviewDate string Päivämäärä, jolloin arviointi lähetettiin (ISO 8601 -muoto)
stars number Asiakkaan antama arvosana (1–5 asteikko)
reviewText string Asiakkaan kirjallinen arvostelusisältö

Note

Cosmos DB generoi automaattisesti järjestelmäominaisuudet (_rid, _self, _etag_attachments_ts) kaikille asiakirjoille.

Note

Lisätietoja ISO 8601 -muodosta on kohdassa Kansainvälinen päivämäärä ja aika -standardi. Lisätietoja GUID-muodosta on yleisissä tunnisteissa.

Esimerkkidokumentit

Seuraavat esimerkit osoittavat molempien otosaineistojen dokumenttien rakenteen.

Standardituotedokumentin esimerkki

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Vektoroidun tuotedokumentin esimerkki

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Tarkistusasiakirjan esimerkki

Katsausdokumentit ovat identtisiä molemmissa otosaineistoissa:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Mallitietojen käyttäminen

Molemmat esimerkkiaineistot auttavat harjoittelemaan kyselyjä, suodatusta ja datan kokoamista Cosmos DB:ssä. Sekadokumenttityypit tarjoavat realistisia tilanteita erilaisiin käyttötarkoituksiin.

Vakiootosskenaariot

  • Liittyvän datan liittäminen: Linkitä arvostelut tuotteisiin käyttämällä productId
  • Kategoria-analyysi: Kysy tuotteita ja arvosteluja categoryName
  • Arviointianalyysi: Tarkastele asiakaspalautteen malleja ja arvioita

Yleiset kyselykuviot

Saat kaikki tuotteet kategoriaan:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Hanki arvosteluja tietystä tuotteesta:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Vektorinäytedatan skenaariot

  • Semanttinen samankaltaisuushaku: Etsi samankaltaisia ominaisuuksia omaavia tuotteita vektoriupotusten avulla
  • Sisältöön perustuvat suositukset: Luo tuoteehdotuksia kuvauksen samankaltaisuuden perusteella
  • Hybridikyselyt: Yhdistä perinteiset suodattimet vektorien samankaltaisuuteen paremman tuloksen saavuttamiseksi

JSON-skeemat

Seuraavat JSON-skeemat kuvaavat dokumenttien rakennetta molemmissa otosaineistoissa. Käytä näitä skeemoja validoidaksesi tai tuottaaksesi samankaltaista dataa omille Cosmos DB -työkuormillesi.

Standardi tuotedokumenttikaavio

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Vektoripohjainen tuotedokumenttiskeema

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Tarkastusasiakirjaskeema

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}