다음을 통해 공유


Power BI 치트 시트

이 페이지에서는 쿼리 성능을 최적화하고 효율적인 대시보드를 만들기 위해 Power BI 및 Azure Databricks에서 데이터를 효율적으로 관리하기 위한 명확하고 의견 있는 지침을 제공합니다.

Azure Databricks 및 Power BI 연결

모범 사례 Impact Docs
다른 Azure Databricks 환경에 연결할 때 Power BI 매개 변수 사용 다른 Azure Databricks 작업 영역 또는 다른 Azure Databricks SQL 웨어하우스에 연결할 때 유연성을 허용합니다.
Azure Databricks의 발행 기능을 Power BI 서비스에서 사용하십시오. Azure Databricks UI를 종료하지 않고도 원활한 카탈로그 통합 및 데이터 모델 동기화를 사용하도록 설정합니다.
Power BI에 Azure Databricks 자동 게시 사용 데이터 파이프라인에서 직접 Unity 카탈로그에서 Power BI로 데이터 세트를 게시합니다.

가장 적합한 스토리지 모드 선택

모범 사례 Impact Docs
Fact 테이블에 DirectQuery를 사용하고 차원 테이블에는 이중을 사용합니다(가져오기 아님). 가장 적합한 스토리지 모드를 사용하여 보다 효율적인 SQL 쿼리를 생성합니다.
가능하면 가져오기보다 DirectQuery를 선호합니다. 거버넌스 및 청각성을 유지할 수 있습니다.
혼합 스토리지 모드에 복합 모델 사용 DirectQuery, 이중, 가져오기 모드 테이블, 집계 및 하이브리드 테이블의 혼합 사용을 허용합니다.
실시간 데이터를 사용하여 집계된 기록 데이터에 하이브리드 테이블 사용 효율적인 메모리 내 쿼리를 사용하도록 설정합니다.

데이터 액세스 최적화

모범 사례 Impact Docs
사용자 정의 집계 사용 사전 집계된 데이터를 캐싱하여 대규모 DirectQuery 의미 체계 모델에 대한 쿼리 성능을 향상시킵니다.
자동 집계 사용 최대 보고서 성능을 위해 쿼리 기록을 기반으로 집계를 작성하여 DirectQuery 의미 체계 모델을 지속적으로 최적화합니다.
테이블 분할을 사용하거나 증분 새로 고침을 사용하십시오. 특히 매우 작고 정적이며 성능이 중요한(2초 미만) 보고서의 경우 데이터를 더 빠르게 가져오고 더 큰 데이터 세트를 관리할 수 있습니다.
모든 슬라이서 적용모든 슬라이서 지우기 단추 추가 사용자가 보고서 필터와 상호 작용할 때 쿼리 감소 설정을 활용하여 불필요한 쿼리를 방지합니다.
업스트림 수집에서 참조 무결성이 유효성 검사된 경우, 테이블 관계를 정의할 때 참조 무결성을 가정하여 사용하십시오. SQL 쿼리에서 보다 효율적인 조인 전략을 사용하도록 설정합니다.

데이터 모델 미세 조정

모범 사례 Impact Docs
"왼쪽으로 이동" 변환 SQL 뷰는 PowerQuery 변환 및 DAX 수식에 비해 보다 효율적인 보고서 실행을 위해 Databricks SQL 엔진의 기능을 활용합니다.
DAX 수식을 사용해야 하는 경우 DAX 수식을 최적화하고 큰 결과 집합을 방지합니다. 성능 저하로 이어지는 비효율적인 계산 방지
의미 체계 모델에서 DAX 계산 열 및 계산 테이블을 사용하지 말고 Gold 테이블에서 직접 이 데이터를 정의합니다. 사전 계산 측정값은 골드 계층에서 가장 잘 수행됩니다.
DirectQuery의 경우 쿼리 병렬 처리 구성 설정을 확인합니다. 쿼리 병렬 처리를 개선하고 SQL 웨어하우스의 사용률을 최대화하여 전반적인 성능을 향상시킵니다.
DirectQuery의 경우 Power BI에서 Azure Databricks와 병렬로 보낼 수 있는 쿼리 수를 확인합니다. Databricks SQL 웨어하우스가 필요한 병렬 처리 수준을 수용할 수 있도록 적절하게 크기가 조정되어 쿼리가 대기 상태에 처하지 않아 보고서가 느려지는 것을 방지합니다.

성능 및 메트릭 모니터링

모범 사례 Impact Docs
Power BI 성능 분석기를 사용하여 보고서 요소 성능 검사 로드하는 데 가장 많은 시간이 걸리고 병목 상태가 있는 시각화를 식별합니다.
Power BI 의미 체계 모델의 다음 속성을 평가합니다.
  • 데이터 원본당 최대 연결 수
  • 최대 동시 평가 수
  • 최대 동시 작업 수
  • MaxParallelismPerQuery
모델의 성능을 미세 조정합니다.