Condividi tramite


Set di dati di esempio in Cosmos DB in Microsoft Fabric

Il carico di lavoro del database Cosmos DB di Microsoft Fabric offre set di dati di esempio predefiniti che consentono di esplorare, apprendere ed sperimentare modelli di database NoSQL. Questo set di dati rappresenta uno scenario di e-commerce con prodotti e recensioni dei clienti, dimostrando come coesistere tipi di entità diversi nello stesso contenitore.

Sono disponibili due set di dati di esempio:

  • Dati di esempio standard: dati di e-commerce di base con prodotti e recensioni
  • Dati di esempio vettoriali: versione avanzata che include incorporamenti vettoriali 1536 dimensionali generati usando il modello text-embedding-ada-002 di OpenAI per scenari di ricerca semantica.

Panoramica del set di dati

Entrambi i set di dati di esempio contengono gli stessi dati di e-commerce con due tipi di documento.

  • Documenti del prodotto (docType: "product"): singoli prodotti con nome, descrizione, inventario, prezzo corrente e una matrice incorporata della cronologia dei prezzi per tale prodotto.
  • Rivedere i documenti (docType: "review") - Recensioni e valutazioni dei clienti collegate ai prodotti tramite productId

Il set di dati di esempio vettoriale è basato sul set di dati di esempio standard. I documenti di prodotto nel set di dati vettoriali includono una proprietà aggiuntiva vectors contenente embedding a 1536 dimensioni per le funzionalità di ricerca semantica.

Annotazioni

È possibile trovare sia i due set di dati che un set di dati aggiuntivo con vettori generati usando il modello OpenAI text-embedding-3-large con 512 dimensioni nell’archivio di esempi di Cosmos DB in Fabric - Repository di esempi.

Schemi dei documenti

Schema del documento prodotto

I documenti del prodotto contengono informazioni dettagliate sui singoli elementi nel catalogo di e-commerce:

Proprietà TIPO Descrizione
id string Identificatore univoco per il prodotto in formato GUID
docType string Identificatore del tipo di documento, sempre "product"
productId string Identificatore del prodotto, uguale id a per i documenti del prodotto
name string Nome visualizzato del prodotto
description string Descrizione dettagliata del prodotto
categoryName string Categoria di prodotto (ad esempio, "Computers, Laptops", "Media", "Accessories")
inventory number Numero di articoli attualmente in magazzino
firstAvailable string Data di disponibilità del prodotto (formato ISO 8601)
currentPrice number Prezzo di vendita corrente
priceHistory array Matrice di oggetti di modifica dei prezzi con date e price campi
priceHistory[].date string Data e ora della modifica del prezzo nel formato ISO 8601
priceHistory[].price number Prezzo alla data specificata
vectors array Solo dati di esempio vettoriale - Incorporamento di vettori 1536-dimensionali

Esaminare lo schema del documento

I documenti di revisione contengono commenti e suggerimenti dei clienti per i prodotti:

Proprietà TIPO Descrizione
id string Identificatore univoco per la revisione in formato GUID
docType string Identificatore del tipo di documento, sempre "review"
productId string Fa riferimento all'oggetto id del prodotto da rivedere
categoryName string Categoria di prodotto (ereditata dal prodotto esaminato)
customerName string Nome del cliente che ha scritto la recensione
reviewDate string Data di invio della revisione (formato ISO 8601)
stars number Valutazione assegnata dal cliente (scala 1-5)
reviewText string Contenuto della recensione scritta dal cliente

Annotazioni

Cosmos DB genera automaticamente le proprietà di sistema (_rid, _self, _etag_attachments, , _ts) per tutti i documenti.

Annotazioni

Per altre informazioni sul formato ISO 8601, vedere standard di data e ora internazionali. Per altre informazioni sul formato GUID, vedere identificatori univoci universalmente.

Documenti di esempio

Negli esempi seguenti viene illustrata la struttura dei documenti in entrambi i set di dati di esempio.

Esempio di documento di prodotto standard

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Esempio di documento di prodotto vettorializzato

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Esempio di documento di revisione

I documenti di revisione sono identici in entrambi i set di dati di esempio:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Come usare i dati di esempio

Entrambi i set di dati di esempio consentono di eseguire query, filtrare e aggregare dati in Cosmos DB. I tipi di documento misti offrono scenari realistici per vari casi d'uso.

Scenari di dati di esempio standard

  • Unione di dati correlati: collegare le revisioni ai prodotti usando productId
  • Analisi delle categorie: Eseguire query su prodotti e recensioni in base categoryName
  • Analisi delle revisioni: esaminare i modelli di feedback e le valutazioni dei clienti

Modelli di query comuni

Ottenere tutti i prodotti in una categoria:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Ottenere recensioni per un prodotto specifico:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Scenari di esempio di dati vettoriali

  • Ricerca di somiglianza semantica: trovare prodotti con funzionalità simili usando incorporamenti vettoriali
  • Raccomandazioni basate sul contenuto: generare suggerimenti sui prodotti in base alla somiglianza della descrizione
  • Query ibride: combinare filtri tradizionali con somiglianza vettoriale per risultati avanzati

Schemi JSON

Gli schemi JSON seguenti descrivono la struttura dei documenti in entrambi i set di dati di esempio. Usare questi schemi per convalidare o generare dati simili per i carichi di lavoro di Cosmos DB.

Schema del documento di prodotto standard

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Schema del documento del prodotto ottimizzato per vettori

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Esaminare lo schema del documento

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}