Udostępnij przez


Przykładowe zestawy danych w usłudze Cosmos DB w usłudze Microsoft Fabric

Obciążenie bazy danych Cosmos DB usługi Microsoft Fabric udostępnia wbudowane przykładowe zestawy danych, które ułatwiają eksplorowanie, poznawanie i eksperymentowanie z wzorcami baz danych NoSQL. Ten zestaw danych reprezentuje scenariusz handlu elektronicznego z produktami i przeglądami klientów, pokazując, jak różne typy jednostek współistnieją w tym samym kontenerze.

Dostępne są dwa przykładowe zestawy danych:

  • Standardowe przykładowe dane: dane rdzeniowe handlu elektronicznego z produktami i recenzjami
  • Przykładowe dane wektorów: Ulepszona wersja obejmująca wektory osadzania w 1536 wymiarach, generowane przy użyciu modelu OpenAI text-embedding-ada-002 na potrzeby scenariuszy wyszukiwania semantycznego.

Omówienie zestawu danych

Oba przykładowe zestawy danych zawierają te same dane handlu elektronicznego z dwoma typami dokumentów.

  • Dokumenty produktów (docType: "product") — poszczególne produkty o nazwie, opisie, inwentarzu, bieżącej cenie i osadzonej tablicy historii cen tego produktu.
  • Przeglądanie dokumentów (docType: "review") — przeglądy klientów i oceny połączone z produktami za pośrednictwem productId

Przykładowy zestaw danych wektorów jest oparty na standardowym przykładowym zestawie danych. Dokumenty produktów w zestawie danych wektorów zawierają dodatkową vectors właściwość zawierającą 1536-wymiarowe osadzanie na potrzeby funkcji wyszukiwania semantycznego.

Uwaga / Notatka

Oba zestawy danych oraz dodatkowy zestaw danych z wektorami wygenerowanymi przy użyciu modelu text-embedding-3-large OpenAI z 512 wymiarami można znaleźć w Sample Datasets folder of the Cosmos DB in Fabric - Samples Repository

Schematy dokumentów

Schemat dokumentu produktu

Dokumenty produktów zawierają szczegółowe informacje o poszczególnych elementach w katalogu handlu elektronicznego:

Majątek Typ Opis
id string Unikatowy identyfikator produktu w formacie GUID
docType string Identyfikator typu dokumentu, zawsze "product"
productId string Identyfikator produktu, taki sam jak id w przypadku dokumentów produktu
name string Wyświetlana nazwa produktu
description string Szczegółowy opis produktu
categoryName string Kategoria produktu (np. "Komputery, laptopy", "Media", "Akcesoria")
inventory number Liczba elementów aktualnie w magazynie
firstAvailable string Data udostępnienia produktu (format ISO 8601)
currentPrice number Bieżąca cena sprzedaży
priceHistory array Tablica obiektów zmiany ceny z polami date i price
priceHistory[].date string Data i godzina zmiany ceny w formacie ISO 8601
priceHistory[].price number Cena po określonej dacie
vectors array Tylko przykładowe dane wektorowe — 1536-wymiarowe osadzenie wektora

Przeglądanie schematu dokumentu

Przejrzyj dokumenty zawierające opinie klientów i oceny produktów:

Majątek Typ Opis
id string Unikatowy identyfikator przeglądu w formacie GUID
docType string Identyfikator typu dokumentu, zawsze "review"
productId string Odwołuje się do id przeglądanego produktu
categoryName string Kategoria produktu (dziedziczona z przeglądanego produktu)
customerName string Nazwisko klienta, który napisał recenzję
reviewDate string Data przesłania przeglądu (format ISO 8601)
stars number Ocena podana przez klienta (skala 1–5)
reviewText string Napisana treść recenzji od klienta

Uwaga / Notatka

Usługa Cosmos DB automatycznie generuje właściwości systemowe (_rid, _self, _etag, _attachments, _ts) dla wszystkich dokumentów.

Uwaga / Notatka

Aby uzyskać więcej informacji na temat formatu ISO 8601, zobacz międzynarodowy standard daty i godziny. Aby uzyskać więcej informacji na temat formatu GUID, zobacz powszechnie unikatowe identyfikatory.

Przykładowe dokumenty

W poniższych przykładach przedstawiono strukturę dokumentów w obu przykładowych zestawach danych.

Przykład dokumentu standardowego produktu

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Przykład dokumentu produktu wektorowego

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Zapoznaj się z przykładem dokumentu

Dokumenty przeglądowe są identyczne w obu przykładowych zestawach danych.

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Jak używać przykładowych danych

Oba przykładowe zestawy danych ułatwiają ćwiczenie wykonywania zapytań, filtrowania i agregowania danych w usłudze Cosmos DB. Mieszane typy dokumentów zapewniają realistyczne scenariusze dla różnych przypadków użycia.

Standardowe przykładowe scenariusze danych

  • Łączenie powiązanych danych: Połącz recenzje z produktami, używającproductId
  • Analiza kategorii: Zapytania o produkty i recenzje według categoryName
  • Analiza przeglądów: Sprawdzanie wzorców i ocen opinii klientów

Typowe wzorce zapytań

Pobierz wszystkie produkty w kategorii:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Uzyskaj przeglądy dla określonego produktu:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Scenariusze przykładowych danych wektorowych

  • Wyszukiwanie podobieństw semantycznych: znajdowanie produktów z podobnymi funkcjami przy użyciu osadzania wektorów
  • Rekomendacje oparte na zawartości: generowanie sugestii dotyczących produktów na podstawie podobieństwa opisu
  • Zapytania hybrydowe: łączenie tradycyjnych filtrów z podobieństwem wektorów w celu uzyskania rozszerzonych wyników

Schematy JSON

Poniższe schematy JSON opisują strukturę dokumentów w obu przykładowych zestawach danych. Użyj tych schematów, aby zweryfikować lub wygenerować podobne dane dla własnych obciążeń usługi Cosmos DB.

Standardowy schemat dokumentu produktu

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Schemat dokumentu produktu z obsługą wektorów

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Przeglądanie schematu dokumentu

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}