Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
A carga de trabalho da base de dados Cosmos DB do Microsoft Fabric fornece conjuntos de dados de exemplo incorporados para o ajudar a explorar, aprender e experimentar padrões de bases de dados NoSQL. Este conjunto de dados representa um cenário de comércio eletrónico com produtos e avaliações de clientes, demonstrando como diferentes tipos de entidades coexistem no mesmo contentor.
Estão disponíveis dois conjuntos de dados de exemplo:
- Dados de exemplo padrão: Dados centrais de comércio eletrónico com produtos e avaliações
- Dados de amostra vetorial: Versão melhorada que inclui embeddings vetoriais de 1536 dimensões gerados usando o modelo text-embedding-ada-002 da OpenAI para cenários de pesquisa semântica.
Visão geral do conjunto de dados
Ambos os conjuntos de dados de exemplo contêm os mesmos dados de comércio eletrónico com dois tipos de documentos.
-
Documentos do produto (
docType: "product") - Produtos individuais com nome, descrição, inventário, preço atual e um conjunto incorporado do histórico de preços desse produto. -
Documentos de avaliação (
docType: "review") - Avaliações e avaliações de clientes ligadas a produtos através deproductId
O conjunto de dados de amostra vetorial baseia-se no conjunto de dados de amostra padrão. Os documentos de produto no conjunto de dados vetoriais incluem uma propriedade adicional vectors contendo embeddings de dimensão 1536 para capacidades de pesquisa semântica.
Observação
Pode encontrar ambos os conjuntos de dados, bem como um conjunto de dados adicional com vetores gerados usando o modelo OpenAI text-embedding-3-large com 512 dimensões na pasta Sample Datasets do Cosmos DB no Fabric - Samples Repository
Esquemas de documentos
Esquema do documento de produto
Os documentos do produto contêm informações detalhadas sobre itens individuais no catálogo de comércio eletrónico:
| Propriedade | Tipo | Descrição |
|---|---|---|
id |
string |
Identificador único do produto no formato GUID |
docType |
string |
Identificador de tipo de documento, sempre "product" |
productId |
string |
Identificador de produto, igual aos id documentos de produto |
name |
string |
Nome de exibição do produto |
description |
string |
Descrição detalhada do produto |
categoryName |
string |
Categoria de produto (por exemplo, "Computadores, Portáteis", "Media", "Acessórios") |
inventory |
number |
Número de artigos atualmente em stock |
firstAvailable |
string |
Data em que o produto ficou disponível (formato ISO 8601) |
currentPrice |
number |
Preço de venda atual |
priceHistory |
array |
Array de objetos de alteração de preços com date e price campos |
priceHistory[].date |
string |
Data e hora da alteração de preço no formato ISO 8601 |
priceHistory[].price |
number |
Preço na data especificada |
vectors |
array |
Apenas dados de amostra vetorial - imersão vetorial de 1536 dimensões |
Revisão do esquema do documento
Os documentos de revisão contêm o feedback dos clientes e as classificações dos produtos:
| Propriedade | Tipo | Descrição |
|---|---|---|
id |
string |
Identificador único para a revisão em formato GUID |
docType |
string |
Identificador de tipo de documento, sempre "review" |
productId |
string |
Referências ao id produto em análise |
categoryName |
string |
Categoria de produto (herdada do produto avaliado) |
customerName |
string |
Nome do cliente que escreveu a avaliação |
reviewDate |
string |
Data de submissão da revisão (formato ISO 8601) |
stars |
number |
Classificação atribuída pelo cliente (escala 1-5) |
reviewText |
string |
Conteúdo de avaliação escrita pelo cliente |
Observação
O Cosmos DB gera automaticamente propriedades do sistema (_rid, _self, _etag, _attachments, _ts) para todos os documentos.
Observação
Para obter mais informações sobre o formato ISO 8601, consulte Padrão internacional de data e hora. Para obter mais informações sobre o formato GUID, consulte identificadores universalmente exclusivos.
Exemplos de documentos
Os exemplos seguintes mostram a estrutura dos documentos em ambos os conjuntos de dados de exemplo.
Exemplo de documento de produto padrão
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2024-08-01T00:00:00",
"price": 363.0
},
{
"date": "2025-04-01T00:00:00",
"price": 408.14
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
]
}
Exemplo de documento de produto vetorizado
{
"id": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"docType": "product",
"productId": "ae449848-3f15-4147-8eee-fe76cfcc6bb4",
"name": "EchoSphere Pro ANC-X900 Premium Headphones",
"description": "EchoSphere Pro ANC-X900 Premium Headphones deliver immersive sound with advanced 40mm drivers and Adaptive Hybrid Active Noise Cancellation. Bluetooth 5.3 ensures seamless connectivity.",
"categoryName": "Accessories, Premium Headphones",
"inventory": 772,
"firstAvailable": "2024-01-01T00:00:00",
"currentPrice": 454.87,
"priceHistory": [
{
"date": "2024-01-01T00:00:00",
"price": 349.0
},
{
"date": "2025-08-01T00:00:00",
"price": 454.87
}
],
"vectors": [
-0.02783808670938015,
0.011827611364424229,
-0.04711977392435074,
// ... (1536 dimensions total)
0.04251981899142265
]
}
Exemplo de documento de revisão
Os documentos de revisão são idênticos em ambos os conjuntos de dados de exemplo:
{
"id": "fa799013-1746-4a7f-bd0f-2a95b2b76481",
"docType": "review",
"productId": "e847e069-d0f9-4fec-b42a-d37cd5b2f536",
"categoryName": "Accessories, Premium Headphones",
"customerName": "Emily Rodriguez",
"reviewDate": "2025-03-02T00:00:00",
"stars": 5,
"reviewText": "Excellent sound quality! Premium build! This EchoSphere Pro ANC-X900 exceeded hopes."
}
Como usar os dados de exemplo
Ambos os conjuntos de dados de exemplo ajudam-no a praticar consultas, filtragem e agregação de dados no Cosmos DB. Os tipos mistos de documentos fornecem cenários realistas para vários casos de uso.
Cenários padrão de dados de exemplo
-
Juntar dados relacionados: Ligar avaliações a produtos que utilizam
productId -
Análise por categoria: Consultar produtos e avaliações por
categoryName - Análise de avaliações: Analise os padrões de feedback e as avaliações dos clientes
Padrões comuns de consulta
Obtenha todos os produtos numa categoria:
SELECT *
FROM c
WHERE
c.docType = "product" AND
c.categoryName = "Computers, Laptops"
Obtenha avaliações para um produto específico:
SELECT *
FROM c
WHERE
c.docType = "review" AND
c.productId = "77be013f-4036-4311-9b5a-dab0c3d022be"
Cenários de dados de amostra vetorial
- Pesquisa por similaridade semântica: Encontre produtos com características semelhantes usando embeddings vetoriais
- Recomendações baseadas em conteúdo: Gerar sugestões de produtos com base na similaridade da descrição
- Consultas híbridas: Combine filtros tradicionais com similaridade vetorial para obter resultados melhorados
Esquemas JSON
Os seguintes esquemas JSON descrevem a estrutura dos documentos em ambos os conjuntos de dados de exemplo. Use estes esquemas para validar ou gerar dados semelhantes para as suas próprias cargas de trabalho do Cosmos DB.
Esquema padrão de documentos de produto
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory"
]
}
Esquema de documentos de produto com suporte a vetores
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string" },
"productId": { "type": "string" },
"name": { "type": "string" },
"description": { "type": "string" },
"categoryName": { "type": "string" },
"inventory": { "type": "number" },
"firstAvailable": { "type": "string" },
"currentPrice": { "type": "number" },
"priceHistory": {
"type": "array",
"items": {
"type": "object",
"properties": {
"date": { "type": "string" },
"price": { "type": "number" }
},
"required": ["date", "price"]
}
},
"vectors": {
"type": "array",
"items": { "type": "number" },
"minItems": 1536,
"maxItems": 1536
}
},
"required": [
"id", "docType", "productId", "name", "description", "categoryName", "inventory", "firstAvailable", "currentPrice", "priceHistory", "vectors"
]
}
Revisão do esquema do documento
{
"type": "object",
"properties": {
"id": { "type": "string" },
"docType": { "type": "string", "const": "review" },
"productId": { "type": "string" },
"categoryName": { "type": "string" },
"customerName": { "type": "string" },
"reviewDate": { "type": "string" },
"stars": { "type": "number" },
"reviewText": { "type": "string" }
},
"required": [
"id", "docType", "productId", "categoryName", "customerName",
"reviewDate", "stars"
]
}