Κοινοποίηση μέσω


Δείγματα συνόλων δεδομένων στο Cosmos DB στο Microsoft Fabric

Ο φόρτος εργασίας βάσης δεδομένων Cosmos DB του Microsoft Fabric παρέχει ενσωματωμένα δείγματα συνόλων δεδομένων για να σας βοηθήσει να εξερευνήσετε, να μάθετε και να πειραματιστείτε με μοτίβα βάσης δεδομένων NoSQL. Αυτό το σύνολο δεδομένων αντιπροσωπεύει ένα σενάριο ηλεκτρονικού εμπορίου με προϊόντα και κριτικές πελατών, δείχνοντας πώς συνυπάρχουν διαφορετικοί τύποι οντοτήτων στο ίδιο κοντέινερ.

Δύο δείγματα συνόλων δεδομένων είναι διαθέσιμα:

  • Τυπικό δείγμα δεδομένων: Βασικά δεδομένα ηλεκτρονικού εμπορίου με προϊόντα και κριτικές
  • Διανυσματικά δείγματα δεδομένων: Βελτιωμένη έκδοση που περιλαμβάνει διανυσματικές ενσωματώσεις 1536 διαστάσεων που δημιουργούνται χρησιμοποιώντας το μοντέλο text-embedding-ada-002 του OpenAI για σενάρια σημασιολογικής αναζήτησης.

Επισκόπηση συνόλου δεδομένων

Και τα δύο σύνολα δειγμάτων δεδομένων περιέχουν τα ίδια δεδομένα ηλεκτρονικού εμπορίου με δύο τύπους εγγράφων.

  • Έγγραφα προϊόντος (docType: "product") - Μεμονωμένα προϊόντα με όνομα, περιγραφή, απόθεμα, τρέχουσα τιμή και έναν ενσωματωμένο πίνακα του ιστορικού τιμών για αυτό το προϊόν.
  • Έγγραφα ελέγχου (docType: "review") - Κριτικές και αξιολογήσεις πελατών που συνδέονται με προϊόντα μέσω productId

Το σύνολο δεδομένων διανυσματικού δείγματος βασίζεται στο τυπικό σύνολο δεδομένων δείγματος. Τα έγγραφα προϊόντων στο σύνολο διανυσματικών δεδομένων περιλαμβάνουν μια πρόσθετη vectors ιδιότητα που περιέχει ενσωματώσεις 1536 διαστάσεων για δυνατότητες σημασιολογικής αναζήτησης.

Note

Μπορείτε να βρείτε και τα δύο σύνολα δεδομένων καθώς και ένα πρόσθετο σύνολο δεδομένων με διανύσματα που δημιουργούνται χρησιμοποιώντας το μοντέλο OpenAI text-embedding-3-large με 512 διαστάσεις στον φάκελο Sample Datasets του Cosmos DB στο Fabric - Samples Repository

Σχήματα εγγράφων

Σχήμα εγγράφου προϊόντος

Τα έγγραφα προϊόντων περιέχουν λεπτομερείς πληροφορίες για μεμονωμένα είδη στον κατάλογο ηλεκτρονικού εμπορίου:

Property Type Description
id string Μοναδικός αναγνωριστικός κωδικός για το προϊόν σε μορφότυπο GUID
docType string Αναγνωριστικό τύπου εγγράφου, πάντα "product"
productId string Αναγνωριστικός κωδικός προϊόντος, όπως και id για τα έγγραφα προϊόντος
name string Εμφανιζόμενο όνομα προϊόντος
description string Λεπτομερής περιγραφή προϊόντος
categoryName string Κατηγορία προϊόντων (π.χ. "Υπολογιστές, φορητοί υπολογιστές", "Μέσα", "Αξεσουάρ")
inventory number Αριθμός ειδών που είναι διαθέσιμα αυτήν τη στιγμή
firstAvailable string Ημερομηνία διάθεσης του προϊόντος (μορφότυπος ISO 8601)
currentPrice number Τρέχουσα τιμή πώλησης
priceHistory array Πίνακας αντικειμένων αλλαγής τιμής με date πεδία και price
priceHistory[].date string Ημερομηνία και ώρα μεταβολής της τιμής σε μορφότυπο ISO 8601
priceHistory[].price number Τιμή στην καθορισμένη ημερομηνία
vectors array Μόνο διανυσματικά δείγματα δεδομένων - Ενσωμάτωση διανυσμάτων 1536 διαστάσεων

Αναθεώρηση σχήματος εγγράφου

Τα έγγραφα κριτικής περιέχουν σχόλια πελατών και αξιολογήσεις για προϊόντα:

Property Type Description
id string Μοναδικό αναγνωριστικό για την κριτική σε μορφότυπο GUID
docType string Αναγνωριστικό τύπου εγγράφου, πάντα "review"
productId string Παραπομπές του id προϊόντος που αξιολογείται
categoryName string Κατηγορία προϊόντος (κληρονομική από το προϊόν που αξιολογήθηκε)
customerName string Όνομα του πελάτη που έγραψε την κριτική
reviewDate string Ημερομηνία υποβολής της αξιολόγησης (μορφότυπος ISO 8601)
stars number Βαθμολογία που δίνεται από τον πελάτη (κλίμακα 1-5)
reviewText string Περιεχόμενο γραπτής κριτικής από τον πελάτη

Note

Το Cosmos DB δημιουργεί αυτόματα ιδιότητες συστήματος (_rid, _self, _etag, _attachments, _ts) για όλα τα έγγραφα.

Note

Για περισσότερες πληροφορίες σχετικά με τη μορφή ISO 8601, ανατρέξτε στο θέμα διεθνές πρότυπο ημερομηνίας και ώρας. Για περισσότερες πληροφορίες σχετικά με τη μορφή GUID, ανατρέξτε στο θέμα Καθολικά μοναδικά αναγνωριστικά.

Παραδείγματα εγγράφων

Τα ακόλουθα παραδείγματα δείχνουν τη δομή των εγγράφων και στα δύο δείγματα συνόλων δεδομένων.

Παράδειγμα τυπικού εγγράφου προϊόντος

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

Παράδειγμα διανυσματικού εγγράφου προϊόντος

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

Παράδειγμα εγγράφου αναθεώρησης

Τα έγγραφα αναθεώρησης είναι πανομοιότυπα και στα δύο δείγματα συνόλων δεδομένων:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

Τρόπος χρήσης του δείγματος δεδομένων

Και τα δύο δείγματα συνόλων δεδομένων σάς βοηθούν να εξασκηθείτε στην υποβολή ερωτημάτων, το φιλτράρισμα και τη συγκέντρωση δεδομένων στο Cosmos DB. Οι μικτοί τύποι εγγράφων παρέχουν ρεαλιστικά σενάρια για διάφορες περιπτώσεις χρήσης.

Τυπικά σενάρια δειγμάτων δεδομένων

  • Σύνδεση σχετικών δεδομένων: Συνδέστε κριτικές με προϊόντα χρησιμοποιώντας productId
  • Ανάλυση κατηγορίας: Αναζήτηση προϊόντων και κριτικών από categoryName
  • Ανάλυση κριτικής: Εξετάστε τα μοτίβα και τις αξιολογήσεις σχολίων πελατών

Κοινά μοτίβα ερωτημάτων

Αποκτήστε όλα τα προϊόντα σε μια κατηγορία:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

Λάβετε κριτικές για ένα συγκεκριμένο προϊόν:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

Σενάρια διανυσματικών δειγμάτων δεδομένων

  • Αναζήτηση σημασιολογικής ομοιότητας: Βρείτε προϊόντα με παρόμοια χαρακτηριστικά χρησιμοποιώντας διανυσματικές ενσωματώσεις
  • Προτάσεις βάσει περιεχομένου: Δημιουργήστε προτάσεις προϊόντων με βάση την ομοιότητα της περιγραφής
  • Υβριδικά ερωτήματα: Συνδυάστε παραδοσιακά φίλτρα με διανυσματική ομοιότητα για βελτιωμένα αποτελέσματα

Σχήματα JSON

Τα ακόλουθα σχήματα JSON περιγράφουν τη δομή των εγγράφων και στα δύο σύνολα δεδομένων δείγματος. Χρησιμοποιήστε αυτά τα σχήματα για να επικυρώσετε ή να δημιουργήσετε παρόμοια δεδομένα για τους δικούς σας φόρτους εργασίας Cosmos DB.

Τυπικό σχήμα εγγράφου προϊόντος

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Σχήμα εγγράφου προϊόντος με δυνατότητα διανύσματος

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

Αναθεώρηση σχήματος εγγράφου

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}