$bucket 집계 파이프라인의 단계는 지정된 경계에 따라 입력 문서를 버킷으로 그룹화합니다. 이는 히스토그램을 만들거나 데이터를 범위로 분류하는 데 특히 유용합니다. 사용자 지정 버킷 경계를 정의할 수 있으며 이러한 범위 내에서 데이터를 요약하는 방법을 제공합니다.
문법
{
$bucket: {
groupBy: <expression>,
boundaries: [ <lowerBoundary>, <upperBoundary>, ... ],
default: <defaultBucket>,
output: {
<outputField1>: { <accumulator1> },
...
}
}
}
매개 변수
| 매개 변수 | Description |
|---|---|
groupBy |
문서를 그룹화할 식입니다. |
boundaries |
버킷을 정의할 경계 값의 배열입니다. 배열은 오름차순으로 정렬되어야 하며 두 개 이상의 값을 포함해야 합니다. |
default |
지정된 경계에 속하지 않는 문서의 버킷 이름입니다. |
output |
각 버킷에 대해 계산된 필드를 지정하는 선택적 필드입니다. |
예시
스토어 컬렉션에서 이 샘플 문서를 고려합니다.
{
"_id": "0fcc0bf0-ed18-4ab8-b558-9848e18058f4",
"name": "First Up Consultants | Beverage Shop - Satterfieldmouth",
"location": {
"lat": -89.2384,
"lon": -46.4012
},
"staff": {
"totalStaff": {
"fullTime": 8,
"partTime": 20
}
},
"sales": {
"totalSales": 75670,
"salesByCategory": [
{
"categoryName": "Wine Accessories",
"totalSales": 34440
},
{
"categoryName": "Bitters",
"totalSales": 39496
},
{
"categoryName": "Rum",
"totalSales": 1734
}
]
},
"promotionEvents": [
{
"eventName": "Unbeatable Bargain Bash",
"promotionalDates": {
"startDate": {
"Year": 2024,
"Month": 6,
"Day": 23
},
"endDate": {
"Year": 2024,
"Month": 7,
"Day": 2
}
},
"discounts": [
{
"categoryName": "Whiskey",
"discountPercentage": 7
},
{
"categoryName": "Bitters",
"discountPercentage": 15
},
{
"categoryName": "Brandy",
"discountPercentage": 8
},
{
"categoryName": "Sports Drinks",
"discountPercentage": 22
},
{
"categoryName": "Vodka",
"discountPercentage": 19
}
]
},
{
"eventName": "Steal of a Deal Days",
"promotionalDates": {
"startDate": {
"Year": 2024,
"Month": 9,
"Day": 21
},
"endDate": {
"Year": 2024,
"Month": 9,
"Day": 29
}
},
"discounts": [
{
"categoryName": "Organic Wine",
"discountPercentage": 19
},
{
"categoryName": "White Wine",
"discountPercentage": 20
},
{
"categoryName": "Sparkling Wine",
"discountPercentage": 19
},
{
"categoryName": "Whiskey",
"discountPercentage": 17
},
{
"categoryName": "Vodka",
"discountPercentage": 23
}
]
}
]
}
예제 1: fullSales을(를) 범위별로 분류하기
이 쿼리는 필드를 세 개의 fullSales 버킷으로 분류합니다. [0, 1000)[1000, 5000)[5000, 10000) 이러한 범위에 속하지 않는 문서는 기본 버킷으로 그룹화됩니다.
db.stores.aggregate([
{
$bucket: {
groupBy: "$sales.fullSales",
boundaries: [0, 1000, 5000, 10000],
default: "Other",
output: {
count: { $sum: 1 },
totalSales: { $sum: "$sales.fullSales" }
}
}
}
])
이 쿼리는 다음 결과를 반환합니다.
[
{ "_id": 1000, "count": 1, "totalSales": 3700 },
{ "_id": "Other", "count": 41504, "totalSales": 0 }
]