Condividi tramite


$densify

La $densify fase in una pipeline di aggregazione viene usata per compilare i punti dati mancanti all'interno di una sequenza di valori. Consente di creare un set di dati più completo generando valori mancanti in base a un campo, un intervallo e un passaggio specificati. Ciò è utile in scenari come l'analisi dei dati delle serie temporali, in cui è necessario riempire le lacune nei punti dati per garantire un'analisi accurata.

Sintassi

{
  $densify: {
    field: <field>,
    range: {
      step: <number>,
      unit: <string>, // Optional, e.g., "hour", "day", "month", etc.
      bounds: [<lowerBound>, <upperBound>] // Optional
    },
    partitionByFields: [<field1>, <field2>, ...] // Optional
  }
}

Parametri

Parametro Description
field Campo in cui viene eseguita la densificazione.
range.step Dimensioni del passaggio per la generazione di valori mancanti.
range.unit (Facoltativo) Unità delle dimensioni del passaggio, ad esempio unità di tempo ,ad esempio "ora", "giorno".
range.bounds (Facoltativo) Specifica l'intervallo (limiti inferiori e superiori) per la densificazione.
partitionByFields (Facoltativo) Campi utilizzati per raggruppare i dati per la densificazione.

Esempi

Si consideri questo documento di esempio dalla raccolta negozi.

{
    "_id": "0fcc0bf0-ed18-4ab8-b558-9848e18058f4",
    "name": "First Up Consultants | Beverage Shop - Satterfieldmouth",
    "location": {
        "lat": -89.2384,
        "lon": -46.4012
    },
    "staff": {
        "totalStaff": {
            "fullTime": 8,
            "partTime": 20
        }
    },
    "sales": {
        "totalSales": 75670,
        "salesByCategory": [
            {
                "categoryName": "Wine Accessories",
                "totalSales": 34440
            },
            {
                "categoryName": "Bitters",
                "totalSales": 39496
            },
            {
                "categoryName": "Rum",
                "totalSales": 1734
            }
        ]
    },
    "promotionEvents": [
        {
            "eventName": "Unbeatable Bargain Bash",
            "promotionalDates": {
                "startDate": {
                    "Year": 2024,
                    "Month": 6,
                    "Day": 23
                },
                "endDate": {
                    "Year": 2024,
                    "Month": 7,
                    "Day": 2
                }
            },
            "discounts": [
                {
                    "categoryName": "Whiskey",
                    "discountPercentage": 7
                },
                {
                    "categoryName": "Bitters",
                    "discountPercentage": 15
                },
                {
                    "categoryName": "Brandy",
                    "discountPercentage": 8
                },
                {
                    "categoryName": "Sports Drinks",
                    "discountPercentage": 22
                },
                {
                    "categoryName": "Vodka",
                    "discountPercentage": 19
                }
            ]
        },
        {
            "eventName": "Steal of a Deal Days",
            "promotionalDates": {
                "startDate": {
                    "Year": 2024,
                    "Month": 9,
                    "Day": 21
                },
                "endDate": {
                    "Year": 2024,
                    "Month": 9,
                    "Day": 29
                }
            },
            "discounts": [
                {
                    "categoryName": "Organic Wine",
                    "discountPercentage": 19
                },
                {
                    "categoryName": "White Wine",
                    "discountPercentage": 20
                },
                {
                    "categoryName": "Sparkling Wine",
                    "discountPercentage": 19
                },
                {
                    "categoryName": "Whiskey",
                    "discountPercentage": 17
                },
                {
                    "categoryName": "Vodka",
                    "discountPercentage": 23
                }
            ]
        }
    ]
}

Esempio 1: Densify un set di dati time series

Questa query compila i giorni mancanti nel campo data.

db.aggregate([
    {
      $documents: [
        { date: new ISODate("2024-01-01"), value: 10 },
        { date: new ISODate("2024-01-03"), value: 15 }
      ]
    },
    {
      $densify: {
        field: "date",
        range: {
          step: 1,
          unit: "day",
          bounds: "full"
        }
      }
    }
  ]);

Questa query restituisce i risultati seguenti:

[
    {
        "date": "ISODate('2024-01-01T00:00:00.000Z')",
        "value": 10
    },
    {
        "date": "ISODate('2024-01-02T00:00:00.000Z')"
    },
    {
        "date": "ISODate('2024-01-03T00:00:00.000Z')",
        "value": 15
    }
]

Esempio 2: Densify numeric data

Questa query compila i valori numerici mancanti nel sales.fullSales campo:

db.aggregate([
    {
      $documents: [
        { level: 1, score: 10 },
        { level: 3, score: 30 }
      ]
    },
    {
      $densify: {
        field: "level",
        range: {
          step: 1,
          bounds: [1, 5] 
        }
      }
    }
  ]);

Questa query restituisce i risultati seguenti:

[
    {
        "level": 1,
        "score": 10
    },
    {
        "level": 2
    },
    {
        "level": 3,
        "score": 30
    },
    {
        "level": 4
    }
]

Limitazioni

La tabella seguente riepiloga le restrizioni e i comportamenti principali associati alla fase di $densify nelle pipeline di aggregazione:

Categoria Condizione/Comportamento
Restrizioni dei campi - Errori se un documento ha un valore di data e unitnon è specificato.
- Errori se un documento ha un valore numerico e unit viene specificato.
- Il nome del campo inizia con $. Usare $project per rinominarlo.
partitionByFields - Qualsiasi campo restituisce un valore non stringa .
- Il nome del campo inizia con $.
range.bounds - Il limite inferiore definisce il valore iniziale, indipendentemente dai documenti esistenti.
- Il limite inferiore è inclusivo.
- Il limite superiore è esclusivo.
- $densify non filtra i documenti all'esterno dei limiti.