이 페이지에서는 쿼리 성능을 최적화하고 효율적인 대시보드를 만들기 위해 Power BI 및 Azure Databricks에서 데이터를 효율적으로 관리하기 위한 명확하고 의견 있는 지침을 제공합니다.
Azure Databricks 및 Power BI 연결
| 모범 사례 | Impact | Docs |
|---|---|---|
| 다른 Azure Databricks 환경에 연결할 때 Power BI 매개 변수 사용 | 다른 Azure Databricks 작업 영역 또는 다른 Azure Databricks SQL 웨어하우스에 연결할 때 유연성을 허용합니다. | |
| Azure Databricks의 발행 기능을 Power BI 서비스에서 사용하십시오. | Azure Databricks UI를 종료하지 않고도 원활한 카탈로그 통합 및 데이터 모델 동기화를 사용하도록 설정합니다. | |
| Power BI에 Azure Databricks 자동 게시 사용 | 데이터 파이프라인에서 직접 Unity 카탈로그에서 Power BI로 데이터 세트를 게시합니다. |
가장 적합한 스토리지 모드 선택
| 모범 사례 | Impact | Docs |
|---|---|---|
| Fact 테이블에 DirectQuery를 사용하고 차원 테이블에는 이중을 사용합니다(가져오기 아님). | 가장 적합한 스토리지 모드를 사용하여 보다 효율적인 SQL 쿼리를 생성합니다. | |
| 가능하면 가져오기보다 DirectQuery를 선호합니다. | 거버넌스 및 청각성을 유지할 수 있습니다. | |
| 혼합 스토리지 모드에 복합 모델 사용 | DirectQuery, 이중, 가져오기 모드 테이블, 집계 및 하이브리드 테이블의 혼합 사용을 허용합니다. | |
| 실시간 데이터를 사용하여 집계된 기록 데이터에 하이브리드 테이블 사용 | 효율적인 메모리 내 쿼리를 사용하도록 설정합니다. |
데이터 액세스 최적화
| 모범 사례 | Impact | Docs |
|---|---|---|
| 사용자 정의 집계 사용 | 사전 집계된 데이터를 캐싱하여 대규모 DirectQuery 의미 체계 모델에 대한 쿼리 성능을 향상시킵니다. | |
| 자동 집계 사용 | 최대 보고서 성능을 위해 쿼리 기록을 기반으로 집계를 작성하여 DirectQuery 의미 체계 모델을 지속적으로 최적화합니다. | |
| 테이블 분할을 사용하거나 증분 새로 고침을 사용하십시오. | 특히 매우 작고 정적이며 성능이 중요한(2초 미만) 보고서의 경우 데이터를 더 빠르게 가져오고 더 큰 데이터 세트를 관리할 수 있습니다. | |
| 모든 슬라이서 적용 및 모든 슬라이서 지우기 단추 추가 | 사용자가 보고서 필터와 상호 작용할 때 쿼리 감소 설정을 활용하여 불필요한 쿼리를 방지합니다. | |
| 업스트림 수집에서 참조 무결성이 유효성 검사된 경우, 테이블 관계를 정의할 때 참조 무결성을 가정하여 사용하십시오. | SQL 쿼리에서 보다 효율적인 조인 전략을 사용하도록 설정합니다. |
데이터 모델 미세 조정
| 모범 사례 | Impact | Docs |
|---|---|---|
| "왼쪽으로 이동" 변환 | SQL 뷰는 PowerQuery 변환 및 DAX 수식에 비해 보다 효율적인 보고서 실행을 위해 Databricks SQL 엔진의 기능을 활용합니다. | |
| DAX 수식을 사용해야 하는 경우 DAX 수식을 최적화하고 큰 결과 집합을 방지합니다. | 성능 저하로 이어지는 비효율적인 계산 방지 | |
| 의미 체계 모델에서 DAX 계산 열 및 계산 테이블을 사용하지 말고 Gold 테이블에서 직접 이 데이터를 정의합니다. | 사전 계산 측정값은 골드 계층에서 가장 잘 수행됩니다. | |
| DirectQuery의 경우 쿼리 병렬 처리 구성 설정을 확인합니다. | 쿼리 병렬 처리를 개선하고 SQL 웨어하우스의 사용률을 최대화하여 전반적인 성능을 향상시킵니다. | |
| DirectQuery의 경우 Power BI에서 Azure Databricks와 병렬로 보낼 수 있는 쿼리 수를 확인합니다. | Databricks SQL 웨어하우스가 필요한 병렬 처리 수준을 수용할 수 있도록 적절하게 크기가 조정되어 쿼리가 대기 상태에 처하지 않아 보고서가 느려지는 것을 방지합니다. |
성능 및 메트릭 모니터링
| 모범 사례 | Impact | Docs |
|---|---|---|
| Power BI 성능 분석기를 사용하여 보고서 요소 성능 검사 | 로드하는 데 가장 많은 시간이 걸리고 병목 상태가 있는 시각화를 식별합니다. | |
Power BI 의미 체계 모델의 다음 속성을 평가합니다.
|
모델의 성능을 미세 조정합니다. |