แชร์ผ่าน


ชุดข้อมูลตัวอย่างใน Cosmos DB ใน Microsoft Fabric

ปริมาณงานฐานข้อมูล Cosmos DB ของ Microsoft Fabric มีชุดข้อมูลตัวอย่างในตัวเพื่อช่วยคุณสํารวจ เรียนรู้ และทดลองกับรูปแบบฐานข้อมูล NoSQL ชุดข้อมูลนี้แสดงถึงสถานการณ์อีคอมเมิร์ซที่มีผลิตภัณฑ์และบทวิจารณ์ของลูกค้า ซึ่งแสดงให้เห็นว่าชนิดเอนทิตีที่แตกต่างกันอยู่ร่วมกันในคอนเทนเนอร์เดียวกันอย่างไร

มีชุดข้อมูลตัวอย่างสองชุด:

  • ข้อมูลตัวอย่างมาตรฐาน: ข้อมูลอีคอมเมิร์ซหลักพร้อมผลิตภัณฑ์และรีวิว
  • ข้อมูลตัวอย่างเวกเตอร์: เวอร์ชันปรับปรุงที่มีการฝังเวกเตอร์ 1536 มิติที่สร้างขึ้นโดยใช้โมเดลการ ฝังข้อความ ada-002 ของ OpenAI สําหรับสถานการณ์การค้นหาเชิงความหมาย

ภาพรวมชุดข้อมูล

ชุดข้อมูลตัวอย่างทั้งสองมีข้อมูลอีคอมเมิร์ซเดียวกันโดยมีเอกสารสองชนิด

  • เอกสารผลิตภัณฑ์ (docType: "product") - ผลิตภัณฑ์แต่ละรายการที่มีชื่อ คําอธิบาย สินค้าคงคลัง ราคาปัจจุบัน และอาร์เรย์ที่ฝังอยู่ของประวัติราคาสําหรับผลิตภัณฑ์นั้น
  • ตรวจสอบเอกสาร (docType: "review") - บทวิจารณ์และการให้คะแนนของลูกค้าที่เชื่อมโยงกับผลิตภัณฑ์ผ่าน productId

ชุดข้อมูลตัวอย่างเวกเตอร์จะขึ้นอยู่กับชุดข้อมูลตัวอย่างมาตรฐาน เอกสารผลิตภัณฑ์ในชุดข้อมูลเวกเตอร์มีคุณสมบัติเพิ่มเติม vectors ที่มีการฝัง 1536 มิติสําหรับความสามารถในการค้นหาความหมาย

Note

คุณสามารถค้นหาชุดข้อมูลทั้งสองและชุดข้อมูลเพิ่มเติมด้วยเวกเตอร์ที่สร้างขึ้นโดยใช้โมเดล OpenAI text-embedding-3-large ที่มีมิติข้อมูล 512 มิติใน โฟลเดอร์ชุดข้อมูลตัวอย่างของ Cosmos DB ใน Fabric - ที่เก็บตัวอย่าง

สคีมาเอกสาร

สคีมาเอกสารผลิตภัณฑ์

เอกสารผลิตภัณฑ์ประกอบด้วยข้อมูลโดยละเอียดเกี่ยวกับสินค้าแต่ละรายการในแค็ตตาล็อกอีคอมเมิร์ซ:

ทรัพย์สิน Type Description
id string ตัวระบุเฉพาะสําหรับผลิตภัณฑ์ในรูปแบบ GUID
docType string ตัวระบุประเภทเอกสารเสมอ "product"
productId string ตัวระบุผลิตภัณฑ์ เช่นเดียวกับ id เอกสารผลิตภัณฑ์
name string ชื่อที่แสดงผลิตภัณฑ์
description string รายละเอียดผลิตภัณฑ์โดยละเอียด
categoryName string หมวดหมู่สินค้า (เช่น "คอมพิวเตอร์ แล็ปท็อป", "สื่อ", "อุปกรณ์เสริม")
inventory number จํานวนสินค้าในสต็อกในปัจจุบัน
firstAvailable string วันที่ผลิตภัณฑ์วางจําหน่าย (รูปแบบ ISO 8601)
currentPrice number ราคาขายปัจจุบัน
priceHistory array อาร์เรย์ของออบเจ็กต์การเปลี่ยนแปลงราคาที่มีdatepriceฟิลด์และ
priceHistory[].date string วันที่และเวลาของการเปลี่ยนแปลงราคาในรูปแบบ ISO 8601
priceHistory[].price number ราคา ณ วันที่ระบุ
vectors array ข้อมูลตัวอย่างเวกเตอร์เท่านั้น - การฝังเวกเตอร์ 1536 มิติ

ตรวจทาน Schema เอกสาร

เอกสารรีวิวประกอบด้วยคําติชมและการให้คะแนนของลูกค้าสําหรับผลิตภัณฑ์:

ทรัพย์สิน Type Description
id string ตัวระบุที่ไม่ซ้ํากันสําหรับการตรวจทานในรูปแบบ GUID
docType string ตัวระบุประเภทเอกสารเสมอ "review"
productId string อ้างอิง id ถึงผลิตภัณฑ์ที่กําลังตรวจสอบ
categoryName string หมวดหมู่สินค้า (สืบทอดมาจากสินค้าที่ตรวจสอบแล้ว)
customerName string ชื่อลูกค้าที่เขียนรีวิว
reviewDate string วันที่ส่งการทบทวนวรรณกรรม (รูปแบบ ISO 8601)
stars number คะแนนที่กําหนดโดยลูกค้า (มาตราส่วน 1-5)
reviewText string เนื้อหารีวิวที่เป็นลายลักษณ์อักษรจากลูกค้า

Note

Cosmos DB จะสร้างคุณสมบัติของระบบ (_rid, , _self, _etag, _attachments) _tsสําหรับเอกสารทั้งหมดโดยอัตโนมัติ

Note

สําหรับข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบ ISO 8601 ให้ดู มาตรฐานวันที่และเวลาระหว่างประเทศ สําหรับข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบ GUID ดูตัวระบุที่ไม่ซ้ํากันโดยสากล

ตัวอย่างเอกสาร

ตัวอย่างต่อไปนี้แสดงโครงสร้างของเอกสารในชุดข้อมูลตัวอย่างทั้งสองชุด

ตัวอย่างเอกสารผลิตภัณฑ์มาตรฐาน

{
  "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "docType": "product",
  "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
  "name": "EchoSphere Pro ANC-X900 Premium Headphones",
  "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
  "categoryName": "Accessories, Premium Headphones",
  "inventory": 772,
  "firstAvailable": "2024-01-01T00:00:00",
  "currentPrice": 454.87,
  "priceHistory": [
    {
      "date": "2024-01-01T00:00:00",
      "price": 349.0
    },
    {
      "date": "2024-08-01T00:00:00",
      "price": 363.0
    },
    {
      "date": "2025-04-01T00:00:00",
      "price": 408.14
    },
    {
      "date": "2025-08-01T00:00:00",
      "price": 454.87
    }
  ]
}

ตัวอย่างเอกสารผลิตภัณฑ์แบบเวกเตอร์

{
    "id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "docType": "product",
    "productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
    "name": "EchoSphere Pro ANC-X900 Premium Headphones",
    "description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
    "categoryName": "Accessories, Premium Headphones",
    "inventory": 772,
    "firstAvailable": "2024-01-01T00:00:00",
    "currentPrice": 454.87,
    "priceHistory": [
      {
        "date": "2024-01-01T00:00:00",
        "price": 349.0
      },
      {
        "date": "2025-08-01T00:00:00",
        "price": 454.87
      }
    ],
    "vectors": [
      -0.02783808670938015,
      0.011827611364424229,
      -0.04711977392435074,
      // ... (1536 dimensions total)
      0.04251981899142265
    ]
}

ตัวอย่างเอกสารการตรวจทาน

เอกสารการตรวจทานจะเหมือนกันในชุดข้อมูลตัวอย่างทั้งสองชุด:

{
  "id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
  "docType": "review",
  "productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
  "categoryName": "Accessories, Premium Headphones",
  "customerName": "Emily Rodriguez",
  "reviewDate": "2025-03-02T00:00:00",
  "stars": 5,
  "reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}

วิธีการใช้ข้อมูลตัวอย่าง

ชุดข้อมูลตัวอย่างทั้งสองช่วยให้คุณฝึกฝนการสืบค้น การกรอง และการรวมข้อมูลใน Cosmos DB ชนิดเอกสารแบบผสมให้สถานการณ์ที่สมจริงสําหรับกรณีการใช้งานต่างๆ

สถานการณ์สมมติข้อมูลตัวอย่างมาตรฐาน

  • การรวมข้อมูลที่เกี่ยวข้อง: ลิงก์รีวิวกับผลิตภัณฑ์โดยใช้ productId
  • การวิเคราะห์ประเภท: สืบค้นผลิตภัณฑ์และบทวิจารณ์โดย categoryName
  • การวิเคราะห์บทวิจารณ์: ตรวจสอบรูปแบบความคิดเห็นและการให้คะแนนของลูกค้า

รูปแบบคิวรีทั่วไป

รับผลิตภัณฑ์ทั้งหมดในหมวดหมู่:

SELECT *
FROM c
WHERE 
  c.docType = "product" AND 
  c.categoryName = "Computers, Laptops"

รับคําวิจารณ์สําหรับผลิตภัณฑ์เฉพาะ:

SELECT *
FROM c
WHERE 
  c.docType = "review" AND 
  c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"

สถานการณ์สมมติข้อมูลตัวอย่างเวกเตอร์

  • การค้นหาความคล้ายคลึงกันทางความหมาย: ค้นหาผลิตภัณฑ์ที่มีคุณสมบัติคล้ายคลึงกันโดยใช้การฝังเวกเตอร์
  • คําแนะนําตามเนื้อหา: สร้างคําแนะนําผลิตภัณฑ์ตามความคล้ายคลึงกันของคําอธิบาย
  • การสืบค้นแบบไฮบริด: รวมตัวกรองแบบดั้งเดิมเข้ากับความคล้ายคลึงกันของเวกเตอร์เพื่อผลลัพธ์ที่ดียิ่งขึ้น

สคีมา JSON

สคีมา JSON ต่อไปนี้อธิบายโครงสร้างของเอกสารในชุดข้อมูลตัวอย่างทั้งสองชุด ใช้สคีมาเหล่านี้เพื่อตรวจสอบหรือสร้างข้อมูลที่คล้ายกันสําหรับปริมาณงาน Cosmos DB ของคุณเอง

สคีมาเอกสารผลิตภัณฑ์มาตรฐาน

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
  ]
}

Schema เอกสารผลิตภัณฑ์ที่เปิดใช้งานเวกเตอร์

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string" },
    "productId": { "type": "string" },
    "name": { "type": "string" },
    "description": { "type": "string" },
    "categoryName": { "type": "string" },
    "inventory": { "type": "number" },
    "firstAvailable": { "type": "string" },
    "currentPrice": { "type": "number" },
    "priceHistory": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "date": { "type": "string" },
          "price": { "type": "number" }
        },
        "required": ["date", "price"]
      }
    },
    "vectors": {
      "type": "array",
      "items": { "type": "number" },
      "minItems": 1536,
      "maxItems": 1536
    }
  },
  "required": [
    "id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
  ]
}

ตรวจทาน Schema เอกสาร

{
  "type": "object",
  "properties": {
    "id": { "type": "string" },
    "docType": { "type": "string", "const": "review" },
    "productId": { "type": "string" },
    "categoryName": { "type": "string" },
    "customerName": { "type": "string" },
    "reviewDate": { "type": "string" },
    "stars": { "type": "number" },
    "reviewText": { "type": "string" }
  },
  "required": [
    "id", "docType", "productId", "categoryName", "customerName", 
    "reviewDate", "stars"
  ]
}