통계 요약 살펴보기

완료됨

데이터는 종종 밀접하게 관련되어 있습니다. 통계는 데이터를 살펴볼 수 있는 한 가지 방법이기 때문입니다. 통계는 데이터의 분포를 보여 주며 핵심 내용과 추세를 식별하고 이상값이 있는지 파악하는 데에도 도움을 줍니다.

통계 요약은 데이터에 대한 빠르고 간단한 설명을 제공하는 정보입니다. Power BI에는 통계 분석을 수행하는 데 도움을 주는 DAX(Data Analysis Expressions) 함수를 포함한 많은 함수와 히스토그램 및 종 모양 곡선, 고급 분석 시각적 개체와 같은 시각적 개체 그리고 Python 및 R 등의 통계 프로그래밍 언어가 있습니다.

통계 요약을 살펴보면 클러스터, 동작 데이터 패턴, 데이터 평균 등을 볼 수 있는 가용 데이터 개략적인 보기가 사용자에게 제공됩니다. 사용자는 비즈니스 의사 결정에 도움이 되는 데이터 관련 인사이트를 얻을 수 있습니다.

예를 들어, 공급망 팀에서 여러분에게 특정 제품에 대한 주문 빈도와 판매 측면의 상위 10개 제품을 보여 주는 보고서를 만들어 달라고 요청할 수 있습니다.

통계 함수

Power BI Desktop에는 데이터를 기반으로 빠른 통계를 얻는데 데 사용할 수 있는 다수의 DAX 함수가 있습니다. 다음 이미지에 나온 것처럼 시각화 창에서 필드를 마우스 오른쪽 단추로 클릭하여 이러한 빠른 함수에 액세스할 수 있습니다.

하지만 성능 문제를 방지하려면 DAX 함수를 사용하여 평균, 합계, 최솟값, 최댓값 등을 계산하는 통계 측정을 직접 만드는 것이 더 좋습니다. 예를 들어 제품당 평균 주문 수량을 찾기 위해 인벤토리 데이터를 분석하려면 다음 수식을 사용할 수 있습니다.

Average Qty =
AVERAGE ( Sales[Order Qty] )

히스토그램

히스토그램과 종형 곡선은 의미 체계 모델에 대한 통계를 표시하는 가장 일반적인 방법입니다. Power BI 용어로 다음 이미지에 나온 것처럼 가로 막대형 또는 세로 막대형 차트 시각적 개체 중 하나를 사용하여 히스토그램을 나타내고 영역 차트 시각적 개체를 사용하여 종 모양 곡선을 나타낼 수 있습니다. 질문과 답변 시각적 개체를 사용하여 목록의 맨 위 또는 맨 아래 항목에 대한 직접적인 질문을 할 수도 있습니다.

Power BI의 일반적인 가로 막대형 또는 세로 막대형 차트 시각적 개체는 측정과 차원의 두 데이터 요소를 연결합니다. 히스토그램은 단일 데이터 요소만 시각화한다는 점에서 표준 가로 막대형 차트와 약간 다릅니다.

이 예제에서는 묶은 세로 막대형 차트 시각적 개체를 사용하여 주문 크기에 따라 주문 수량을 결정하는 히스토그램을 나타냅니다.

먼저 시각화 창에서 묶은 세로 막대형 차트 아이콘을 선택합니다. 그런 다음 x축에 대한 새 그룹화를 만듭니다. 그룹화 및 범주화는 이 모듈의 뒷부분에서 자세히 알아보겠지만 이 상황에서도 유용합니다.

그룹을 만들려면 필드 창에서 분석할 데이터 필드를 마우스 오른쪽 단추로 클릭한 다음, 새 그룹을 선택합니다. 이 경우에는 OrderQty 필드를 사용합니다. 표시되는 그룹 창에서 다음과 같이 bin 그룹을 설정합니다.

  1. 그룹 이름을 Order Bins(Buckets)로 바꿉니다.

  2. 그룹 유형 옵션을 Bin으로 설정하고 bin 형식 옵션을 bin 개수로 설정합니다.

  3. bin 개수5를, 최솟값으로 1을, 최댓값으로 44를 입력합니다.

이제 다음과 같이 시각적 개체를 채웁니다.

  1. 필드 창에서 OrderQty 필드를 시각화 창의 Value 필드로 끌어서 놓습니다.

  2. 필드 창에서 Order Bins(Buckets) 그룹을 시각화 창의 Axis 필드로 끌어서 놓습니다.

이제 시각적 개체에 데이터가 X축에서 버킷으로 그룹화되어 표시되고 해당 변수의 주문 수량이 Y축에 표시된 것을 볼 수 있습니다.

이제 주문 크기 버킷별로 주문 수량(OrderQty 필드)을 표시하는 히스토그램을 공급망 팀용으로 만들었습니다.

상위 N 분석

TOPN DAX 함수는 지정된 테이블의 상위 N개 행을 반환합니다. 상위 N 분석은 상위 10개 최다 판매 제품, 조직의 상위 10명 성과자 또는 상위 10명 고객과 같이 중요할 수 있는 데이터를 제공하는 좋은 방법입니다. 또는 다른 관점에서 이러한 데이터를 살펴볼 수도 있습니다. 즉, 최저 성과자와 같이 목록의 하위 10개 항목을 제공할 수 있습니다. 요구 사항에 따라 이 옵션 중 하나 또는 두 옵션 모두를 사용할 수 있습니다.

이 예제에서 공급망 팀은 상위 10개 최다 판매 제품이 무엇인지 알려고 합니다. 그러려면 질문과 답변 시각적 개체를 사용하거나, 상위 N 필터를 사용하거나, DAX 수식을 작성하는 등 세 가지 방법을 사용할 수 있습니다.

질문과 답변 시각적 개체를 사용하여 상위 N 찾기

여러분은 공급망 팀을 위한 보고서를 만들었는데, 이제 공급망 팀원이 관심 있는 다양한 다른 견해나 인사이트에 대한 질문이 있다고 합니다. Power BI에는 사용자가 고유한 질문을 하고 답변을 받을 수 있는 기본 제공 질문과 답변 시각적 개체가 있으므로, 개별 질문을 직접 해결할 필요가 없습니다. 질문과 답변 시각적 개체는 효과적인 도구입니다. 사용자가 독립적으로 데이터에 대한 답변을 빠르게 얻게 하여 모든 관련자의 시간을 절약하기 때문입니다. 질문과 답변 시각적 개체는 시각적 개체를 사용하기 위해 Power BI에 대한 지식이 필요하지 않다는 점에서 고유합니다. 사용자는 질문할 수 있으며 통찰력 있는 시각적 개체를 만들 수도 있습니다.

질문과 답변 시각화를 보고서에 추가한 다음, 필요에 따라 시각적 개체의 위치를 변경하고 서식을 사용자 지정합니다.

이제 시각적 개체를 사용하여 답변을 얻을 수 있습니다. 이 경우에는 상위 10개 최다 판매 제품이 무엇인지 알려고 하므로 “판매 기준으로 나의 상위 10개 제품”과 같은 질문을 입력합니다. Power BI에서 해당 결과가 자동으로 표시됩니다.

상위 N 필터 형식 사용

상위 N은 필터 창에서 사용할 수 있는 필터링 옵션입니다. 보고서 페이지에서 분석할 필드를 선택합니다. 이 예제에서는 Product Name 필드입니다. 필터 창에서 필터 형식 목록을 확장하고 상위 N을 선택합니다. 항목 표시 설정에서 상위10을 선택합니다. 그런 다음 필드를 필터링할 기준값으로 판매 비용을 선택합니다. 이에 따라 시각적 개체가 업데이트됩니다.

TOPN DAX 함수 사용

DAX에서 TOPN 함수를 사용하여 상위 10개 제품을 계산할 수도 있습니다. 이 옵션은 10대 최다 판매 제품이 전체 총 매출에 기여한 정도를 표시하려는 경우 매우 유용할 수 있습니다.

Top 10 Products라는 새 측정을 만드는 것으로 시작합니다. 그런 다음 SUMX 함수와 함께 TOPN 함수를 사용하여 총 매출을 기준으로 상위 10개 제품을 계산합니다.

Top 10 Products =
SUMX ( TOPN ( 10, Product, Product[Total Sales]), [Total Sales] )

다음 이미지는 상위 10개 제품과 총 매출을 비교하여 보여 줍니다.

DAX 수식을 조정하여 동일한 결과를 백분율로 표시할 수 있습니다.

Power BI의 통계 기능에 대해 자세히 알아보려면 통계 함수 - DAX를 참조하세요.