Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El $sampleRate operador muestra aleatoriamente documentos de una colección en función de una tasa de probabilidad especificada. Este operador es útil para el análisis estadístico, las pruebas con datos de subconjuntos y la optimización del rendimiento cuando se trabaja con grandes conjuntos de datos en los que se necesita un ejemplo representativo.
Syntax
{
$match: {
$sampleRate: <number>
}
}
Parámetros
| Parámetro | Description |
|---|---|
number |
Número de punto flotante entre 0 y 1 que representa la probabilidad de que un documento se incluya en la muestra. Por ejemplo, 0,33 significa que se muestrean aproximadamente 33% de documentos. |
Examples
Considere este documento de ejemplo de la colección de tiendas.
{
"_id": "0fcc0bf0-ed18-4ab8-b558-9848e18058f4",
"name": "First Up Consultants | Beverage Shop - Satterfieldmouth",
"location": {
"lat": -89.2384,
"lon": -46.4012
},
"staff": {
"totalStaff": {
"fullTime": 8,
"partTime": 20
}
},
"sales": {
"totalSales": 75670,
"salesByCategory": [
{
"categoryName": "Wine Accessories",
"totalSales": 34440
},
{
"categoryName": "Bitters",
"totalSales": 39496
},
{
"categoryName": "Rum",
"totalSales": 1734
}
]
},
"promotionEvents": [
{
"eventName": "Unbeatable Bargain Bash",
"promotionalDates": {
"startDate": {
"Year": 2024,
"Month": 6,
"Day": 23
},
"endDate": {
"Year": 2024,
"Month": 7,
"Day": 2
}
},
"discounts": [
{
"categoryName": "Whiskey",
"discountPercentage": 7
},
{
"categoryName": "Bitters",
"discountPercentage": 15
},
{
"categoryName": "Brandy",
"discountPercentage": 8
},
{
"categoryName": "Sports Drinks",
"discountPercentage": 22
},
{
"categoryName": "Vodka",
"discountPercentage": 19
}
]
},
{
"eventName": "Steal of a Deal Days",
"promotionalDates": {
"startDate": {
"Year": 2024,
"Month": 9,
"Day": 21
},
"endDate": {
"Year": 2024,
"Month": 9,
"Day": 29
}
},
"discounts": [
{
"categoryName": "Organic Wine",
"discountPercentage": 19
},
{
"categoryName": "White Wine",
"discountPercentage": 20
},
{
"categoryName": "Sparkling Wine",
"discountPercentage": 19
},
{
"categoryName": "Whiskey",
"discountPercentage": 17
},
{
"categoryName": "Vodka",
"discountPercentage": 23
}
]
}
]
}
Ejemplo 1: Muestreo aleatorio básico
Esta consulta devuelve un tercio de todos los documentos de la colección stores, seleccionada aleatoriamente.
db.stores.aggregate([{
$match: {
$sampleRate: 0.33
}
}])
Ejemplo 2: Muestreo con más filtros
Esta consulta filtra primero los almacenes con ventas superiores a 50 000 y, después, muestra aleatoriamente 50% de esos documentos coincidentes.
db.stores.aggregate([
{ $match: {
"sales.totalSales": { $gt: 50000 },
$sampleRate: 0.5
}}
])
Ejemplo 3: Muestreo para el análisis estadístico
Esta consulta muestra 25% de almacenes y calcula medidas estadísticas en los datos muestreados.
db.stores.aggregate([
{ $match: { $sampleRate: 0.25 } },
{ $group: {
_id: null,
averageSales: { $avg: "$sales.totalSales" },
totalStores: { $sum: 1 },
maxSales: { $max: "$sales.totalSales" },
minSales: { $min: "$sales.totalSales" }
}}
])
El operador $sampleRate es útil para el análisis estadístico y la exploración de datos cuando se trabaja con grandes conjuntos de datos donde el procesamiento de todos los documentos sería costoso a nivel computacional. Crea de forma eficaz ejemplos representativos para pruebas de rendimiento, validación de control de calidad y generación de conjuntos de datos de aprendizaje automático. El operador es ideal para escenarios de informes aproximados en los que la precisión estadística es aceptable y la velocidad de procesamiento tiene prioridad sobre la precisión exacta.