Σημείωση
Η πρόσβαση σε αυτή τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να συνδεθείτε ή να αλλάξετε καταλόγους.
Η πρόσβαση σε αυτή τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να αλλάξετε καταλόγους.
Ο φόρτος εργασίας βάσης δεδομένων Cosmos DB του Microsoft Fabric παρέχει ενσωματωμένα δείγματα συνόλων δεδομένων για να σας βοηθήσει να εξερευνήσετε, να μάθετε και να πειραματιστείτε με μοτίβα βάσης δεδομένων NoSQL. Αυτό το σύνολο δεδομένων αντιπροσωπεύει ένα σενάριο ηλεκτρονικού εμπορίου με προϊόντα και κριτικές πελατών, δείχνοντας πώς συνυπάρχουν διαφορετικοί τύποι οντοτήτων στο ίδιο κοντέινερ.
Δύο δείγματα συνόλων δεδομένων είναι διαθέσιμα:
- Τυπικό δείγμα δεδομένων: Βασικά δεδομένα ηλεκτρονικού εμπορίου με προϊόντα και κριτικές
- Διανυσματικά δείγματα δεδομένων: Βελτιωμένη έκδοση που περιλαμβάνει διανυσματικές ενσωματώσεις 1536 διαστάσεων που δημιουργούνται χρησιμοποιώντας το μοντέλο text-embedding-ada-002 του OpenAI για σενάρια σημασιολογικής αναζήτησης.
Επισκόπηση συνόλου δεδομένων
Και τα δύο σύνολα δειγμάτων δεδομένων περιέχουν τα ίδια δεδομένα ηλεκτρονικού εμπορίου με δύο τύπους εγγράφων.
-
Έγγραφα προϊόντος (
docType: "product") - Μεμονωμένα προϊόντα με όνομα, περιγραφή, απόθεμα, τρέχουσα τιμή και έναν ενσωματωμένο πίνακα του ιστορικού τιμών για αυτό το προϊόν. -
Έγγραφα ελέγχου (
docType: "review") - Κριτικές και αξιολογήσεις πελατών που συνδέονται με προϊόντα μέσωproductId
Το σύνολο δεδομένων διανυσματικού δείγματος βασίζεται στο τυπικό σύνολο δεδομένων δείγματος. Τα έγγραφα προϊόντων στο σύνολο διανυσματικών δεδομένων περιλαμβάνουν μια πρόσθετη vectors ιδιότητα που περιέχει ενσωματώσεις 1536 διαστάσεων για δυνατότητες σημασιολογικής αναζήτησης.
Note
Μπορείτε να βρείτε και τα δύο σύνολα δεδομένων καθώς και ένα πρόσθετο σύνολο δεδομένων με διανύσματα που δημιουργούνται χρησιμοποιώντας το μοντέλο OpenAI text-embedding-3-large με 512 διαστάσεις στον φάκελο Sample Datasets του Cosmos DB στο Fabric - Samples Repository
Σχήματα εγγράφων
Σχήμα εγγράφου προϊόντος
Τα έγγραφα προϊόντων περιέχουν λεπτομερείς πληροφορίες για μεμονωμένα είδη στον κατάλογο ηλεκτρονικού εμπορίου:
| Property | Type | Description |
|---|---|---|
id |
string |
Μοναδικός αναγνωριστικός κωδικός για το προϊόν σε μορφότυπο GUID |
docType |
string |
Αναγνωριστικό τύπου εγγράφου, πάντα "product" |
productId |
string |
Αναγνωριστικός κωδικός προϊόντος, όπως και id για τα έγγραφα προϊόντος |
name |
string |
Εμφανιζόμενο όνομα προϊόντος |
description |
string |
Λεπτομερής περιγραφή προϊόντος |
categoryName |
string |
Κατηγορία προϊόντων (π.χ. "Υπολογιστές, φορητοί υπολογιστές", "Μέσα", "Αξεσουάρ") |
inventory |
number |
Αριθμός ειδών που είναι διαθέσιμα αυτήν τη στιγμή |
firstAvailable |
string |
Ημερομηνία διάθεσης του προϊόντος (μορφότυπος ISO 8601) |
currentPrice |
number |
Τρέχουσα τιμή πώλησης |
priceHistory |
array |
Πίνακας αντικειμένων αλλαγής τιμής με date πεδία και price |
priceHistory[].date |
string |
Ημερομηνία και ώρα μεταβολής της τιμής σε μορφότυπο ISO 8601 |
priceHistory[].price |
number |
Τιμή στην καθορισμένη ημερομηνία |
vectors |
array |
Μόνο διανυσματικά δείγματα δεδομένων - Ενσωμάτωση διανυσμάτων 1536 διαστάσεων |
Αναθεώρηση σχήματος εγγράφου
Τα έγγραφα κριτικής περιέχουν σχόλια πελατών και αξιολογήσεις για προϊόντα:
| Property | Type | Description |
|---|---|---|
id |
string |
Μοναδικό αναγνωριστικό για την κριτική σε μορφότυπο GUID |
docType |
string |
Αναγνωριστικό τύπου εγγράφου, πάντα "review" |
productId |
string |
Παραπομπές του id προϊόντος που αξιολογείται |
categoryName |
string |
Κατηγορία προϊόντος (κληρονομική από το προϊόν που αξιολογήθηκε) |
customerName |
string |
Όνομα του πελάτη που έγραψε την κριτική |
reviewDate |
string |
Ημερομηνία υποβολής της αξιολόγησης (μορφότυπος ISO 8601) |
stars |
number |
Βαθμολογία που δίνεται από τον πελάτη (κλίμακα 1-5) |
reviewText |
string |
Περιεχόμενο γραπτής κριτικής από τον πελάτη |
Note
Το Cosmos DB δημιουργεί αυτόματα ιδιότητες συστήματος (_rid, _self, _etag, _attachments, _ts) για όλα τα έγγραφα.
Note
Για περισσότερες πληροφορίες σχετικά με τη μορφή ISO 8601, ανατρέξτε στο θέμα διεθνές πρότυπο ημερομηνίας και ώρας. Για περισσότερες πληροφορίες σχετικά με τη μορφή GUID, ανατρέξτε στο θέμα Καθολικά μοναδικά αναγνωριστικά.
Παραδείγματα εγγράφων
Τα ακόλουθα παραδείγματα δείχνουν τη δομή των εγγράφων και στα δύο δείγματα συνόλων δεδομένων.
Παράδειγμα τυπικού εγγράφου προϊόντος
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2024-08-01T00:00:00",
"price": 363.0
},
{
"date": "2025-04-01T00:00:00",
"price": 408.14
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
]
}
Παράδειγμα διανυσματικού εγγράφου προϊόντος
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
],
"vectors": [
-0.02783808670938015,
0.011827611364424229,
-0.04711977392435074,
// ... (1536 dimensions total)
0.04251981899142265
]
}
Παράδειγμα εγγράφου αναθεώρησης
Τα έγγραφα αναθεώρησης είναι πανομοιότυπα και στα δύο δείγματα συνόλων δεδομένων:
{
"id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
"docType": "review",
"productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
"categoryName": "Accessories, Premium Headphones",
"customerName": "Emily Rodriguez",
"reviewDate": "2025-03-02T00:00:00",
"stars": 5,
"reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}
Τρόπος χρήσης του δείγματος δεδομένων
Και τα δύο δείγματα συνόλων δεδομένων σάς βοηθούν να εξασκηθείτε στην υποβολή ερωτημάτων, το φιλτράρισμα και τη συγκέντρωση δεδομένων στο Cosmos DB. Οι μικτοί τύποι εγγράφων παρέχουν ρεαλιστικά σενάρια για διάφορες περιπτώσεις χρήσης.
Τυπικά σενάρια δειγμάτων δεδομένων
-
Σύνδεση σχετικών δεδομένων: Συνδέστε κριτικές με προϊόντα χρησιμοποιώντας
productId -
Ανάλυση κατηγορίας: Αναζήτηση προϊόντων και κριτικών από
categoryName - Ανάλυση κριτικής: Εξετάστε τα μοτίβα και τις αξιολογήσεις σχολίων πελατών
Κοινά μοτίβα ερωτημάτων
Αποκτήστε όλα τα προϊόντα σε μια κατηγορία:
SELECT *
FROM c
WHERE
c.docType = "product" AND
c.categoryName = "Computers, Laptops"
Λάβετε κριτικές για ένα συγκεκριμένο προϊόν:
SELECT *
FROM c
WHERE
c.docType = "review" AND
c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"
Σενάρια διανυσματικών δειγμάτων δεδομένων
- Αναζήτηση σημασιολογικής ομοιότητας: Βρείτε προϊόντα με παρόμοια χαρακτηριστικά χρησιμοποιώντας διανυσματικές ενσωματώσεις
- Προτάσεις βάσει περιεχομένου: Δημιουργήστε προτάσεις προϊόντων με βάση την ομοιότητα της περιγραφής
- Υβριδικά ερωτήματα: Συνδυάστε παραδοσιακά φίλτρα με διανυσματική ομοιότητα για βελτιωμένα αποτελέσματα
Σχήματα JSON
Τα ακόλουθα σχήματα JSON περιγράφουν τη δομή των εγγράφων και στα δύο σύνολα δεδομένων δείγματος. Χρησιμοποιήστε αυτά τα σχήματα για να επικυρώσετε ή να δημιουργήσετε παρόμοια δεδομένα για τους δικούς σας φόρτους εργασίας Cosmos DB.
Τυπικό σχήμα εγγράφου προϊόντος
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
]
}
Σχήμα εγγράφου προϊόντος με δυνατότητα διανύσματος
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
},
"vectors": {
"type": "array",
"items": { "type": "number" },
"minItems": 1536,
"maxItems": 1536
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
]
}
Αναθεώρηση σχήματος εγγράφου
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string", "const": "review" },
"productId": { "type": "string" },
"categoryName": { "type": "string" },
"customerName": { "type": "string" },
"reviewDate": { "type": "string" },
"stars": { "type": "number" },
"reviewText": { "type": "string" }
},
"required": [
"id", "docType", "productId", "categoryName", "customerName",
"reviewDate", "stars"
]
}