Power BI Desktop의 스토리지 모드 관리

Microsoft Power BI Desktop에서는 테이블의 스토리지 모드를 지정할 수 있습니다. 스토리지 모드를 사용하면 Power BI Desktop이 보고서용 메모리 내 테이블 데이터를 캐시하는지 여부를 제어할 수 있습니다. 캐싱은 일시적으로 메모리에 데이터를 저장하는 것을 의미합니다.

스토리지 모드를 설정하면 많은 이점이 제공됩니다. 모델에서 각 테이블에 대한 스토리지 모드를 개별적으로 설정할 수 있습니다. 이 작업을 수행하면 다음과 같은 이점을 제공하는 단일 의미 체계 모델을 사용할 수 있습니다.

  • 쿼리 성능: 사용자가 Power BI 보고서에서 시각적 개체를 조작할 때 DAX(Data Analysis Expressions) 쿼리가 의미 체계 모델에 제출됩니다. 스토리지 모드를 제대로 설정하여 데이터를 메모리에 캐시하면 보고서의 쿼리 성능과 대화형 작업이 향상될 수 있습니다.

  • 대규모 의미 체계 모델: 캐시되지 않은 테이블이 캐싱을 위해 메모리를 사용하지 않습니다. 너무 크거나 비용이 많이 드는 대규모 의미 체계 모델에 대한 대화형 분석을 메모리에 완전히 캐시할 수 있습니다. 캐시할 테이블과 캐시하지 않을 테이블을 선택할 수 있습니다.

  • 데이터 새로 고침 최적화: 캐시되지 않은 테이블을 새로 고칠 필요가 없습니다. 서비스 수준 계약 및 비즈니스 요구 사항을 충족하는 데 필요한 데이터만 캐시하여 새로 고침 시간을 줄일 수 있습니다.

  • 근 실시간 요구 사항: 근 실시간 요구 사항이 있는 테이블이 캐시되지 않아 데이터 대기 시간을 줄이는 이점이 있습니다.

  • 쓰기 저장: 쓰기 저장을 사용하면 비즈니스 사용자가 셀 값을 변경하여 what-if 시나리오를 살펴볼 수 있습니다. 사용자 지정 애플리케이션이 변경 내용을 데이터 원본에 적용할 수 있습니다. 캐시되지 않은 테이블이 즉시 변경 내용을 표시하므로 효과를 즉시 분석할 수 있습니다.

Power BI Desktop의 스토리지 모드 설정은 다음 세 가지 관련 기능 중 하나입니다.

  • 복합 모델: 보고서에 DirectQuery 연결 또는 가져오기를 비롯한 두 개 이상의 데이터 연결을 다양한 조합으로 포함할 수 있습니다. 자세한 내용은 Power BI Desktop에서 복합 모델 사용을 참조하세요.

  • 다 대 다 관계: 복합 모델을 사용하면 테이블 간에 다 대 다 관계를 설정할 수 있습니다. 다 대 다 관계에서는 테이블의 고유한 값에 대한 요구 사항이 제거됩니다. 또한 관계 설정 목적으로만 새 테이블을 도입하는 것과 같은 이전 해결 방법을 제거합니다. 자세한 내용은 Power BI Desktop의 다 대 다 관계를 참조하세요.

  • 스토리지 모드: 스토리지 모드에서 이제 백 엔드 데이터 원본에 대한 쿼리가 필요한 시각적 개체를 지정할 수 있습니다. 쿼리가 필요 없는 시각적 개체는 DirectQuery를 기반으로 하는 경우에도 가져옵니다. 이 기능은 성능을 개선하고 백 엔드 로드를 줄이는 데 도움이 됩니다. 이전에는 슬라이서와 같은 간단한 시각적 개체도 백 엔드 원본으로 전송되는 쿼리를 시작했습니다.

스토리지 모드 속성 사용

스토리지 모드 속성은 모델의 각 테이블에서 설정할 수 있는 속성이며, Power BI가 테이블 데이터를 캐시하는 방법을 제어합니다.

스토리지 모드 속성을 설정하거나 현재 설정을 보려면 다음을 수행합니다.

  1. 모델 뷰에서 속성을 보거나 설정하려는 테이블을 선택합니다.

  2. 속성 창에서 고급 섹션을 확장하고 스토리지 모드 드롭다운을 확장합니다.

    Screenshot of Relationship view highlight the option drop-down to change the storage mode.

스토리지 모드 속성을 다음 세 값 중 하나로 설정합니다.

  • 가져오기: 이 설정이 있는 가져온 테이블은 캐시됩니다. 가져오기 테이블의 데이터를 반환하는 Power BI 의미 체계 모델에 제출된 쿼리는 캐시된 데이터에서만 수행할 수 있습니다.

  • DirectQuery: 이 설정이 있는 테이블은 캐시되지 않습니다. Power BI 의미 체계 모델을 제출하는 쿼리(예: DAX 쿼리)와 DirectQuery 테이블에서 데이터를 반환하는 쿼리를 수행하려면 데이터 원본에 대한 주문형 쿼리를 실행해야 합니다. 데이터 원본에 제출하는 쿼리는 해당 데이터 원본의 쿼리 언어(예: SQL)를 사용합니다.

  • 이중: 이 설정이 있는 테이블은 Power BI 의미 체계 모델에 제출된 쿼리의 컨텍스트에 따라 캐시되거나 캐시되지 않은 상태로 작동할 수 있습니다. 경우에 따라 캐시된 데이터의 쿼리를 수행합니다. 데이터 원본에 대한 주문형 쿼리를 실행하여 쿼리를 수행하는 경우도 있습니다.

테이블의 스토리지 모드가져오기로 변경하는 작업은 되돌릴 수 없는 작업입니다. 이 속성을 설정한 후에는 나중에 이 속성을 DirectQuery 또는 이중으로 변경할 수 없습니다.

참고 항목

Power BI Desktop 및 Power BI 서비스에서 둘 다 이중 스토리지 모드를 사용할 수 있습니다.

DirectQuery 및 이중 테이블에 대한 제약 조건

이중 테이블에는 DirectQuery 테이블과 동일한 함수 제약 조건이 있습니다. 이러한 제약 조건에는 제한된 M 변환 및 계산 열의 제한된 DAX 함수가 포함됩니다. 자세한 내용은 DirectQuery의 제한 사항을 참조하세요.

이중 전파 설정

가져오기 및 DirectQuery를 지원하는 단일 원본에서 모든 테이블을 가져오는 경우 다음 모델을 사용하는 것이 좋습니다.

Screenshot of the example Relationship view for storage mode.

처음에 이 모델의 모든 테이블이 DirectQuery로 설정된다고 가정해보겠습니다. SurveyResponse 테이블의 스토리지 모드가져오기로 변경하면 다음 경고 창이 표시됩니다.

Screenshot showing a warning window that describes the results of changing the storage mode to Import.

의미 체계 모델의 제한된 관계 수를 줄이고 성능을 향상하기 위해 차원 테이블(Customer, Geography, Date)을 이중으로 설정할 수 있습니다. 제한된 관계에는 일반적으로 원본 시스템에 조인 논리를 밀어넣을 수 없는 DirectQuery 테이블이 하나 이상 포함됩니다. 이중 테이블은 DirectQuery 또는 가져오기 테이블로 작동할 수 있으므로 이 상황을 방지할 수 있습니다.

전파 논리는 많은 테이블을 포함하는 모델에 도움이 되도록 디자인되었습니다. 50개 테이블이 포함된 모델이 있고 특정 팩트(트랜잭션) 테이블만 캐시해야 한다고 가정해보겠습니다. Power BI Desktop의 논리가 이중으로 설정해야 하는 최소 차원 테이블 집합을 계산하므로 사용자가 계산할 필요가 없습니다.

전파 논리는 일 대 다 관계의 한쪽으로만 이동합니다.

스토리지 모드 사용 예제

다음 스토리지 모드 속성 설정을 적용하는 경우를 상상해 보세요.

테이블 스토리지 모드
Sales DirectQuery
SurveyResponse 가져오기
날짜 이중
고객 이중
지역 이중

해당 스토리지 모드 속성을 설정하면 Sales 테이블에 중요한 데이터 볼륨이 있다고 가정하여 다음 동작이 발생합니다.

  • Power BI Desktop은 차원 테이블(Date, CustomerGeography)을 캐시하므로 표시할 슬라이서 값을 검색할 때 초기 보고서 로드 시간이 빠릅니다.

  • Power BI Desktop은 Sales 테이블을 캐시하지 않습니다. 이 테이블을 캐시하지 않으므로 Power BI Desktop은 다음 결과를 제공합니다.

    • 데이터 새로 고침 시간이 개선되고 메모리 소비가 감소합니다.
    • 보고서 쿼리가 DirectQuery 모드에서 실행되는 Sales 테이블을 기반으로 합니다. 해당 쿼리는 시간이 더 오래 걸리지만 캐싱 대기 시간이 도입되지 않으므로 실시간에 더 가깝습니다.
  • SurveyResponse 테이블을 기반으로 하는 보고서 쿼리는 메모리 내 캐시에서 반환되므로 비교적 빠릅니다.

캐시를 적중 또는 무시하는 쿼리

Power BI Desktop의 진단 포트에 SQL 프로파일러를 연결하면 다음 이벤트에 따라 추적을 수행하여 메모리 내 캐시를 적중 또는 누락하는 쿼리를 확인할 수 있습니다.

  • Queries Events\Query Begin
  • Query Processing\Vertipaq SE Query Begin
  • Query Processing\DirectQuery Begin

Query Begin 이벤트의 경우 동일한 ActivityID를 가진 다른 이벤트를 확인합니다. 예를 들어 DirectQuery Begin 이벤트가 없지만 Vertipaq SE Query Begin 이벤트가 있는 경우에는 쿼리가 캐시에서 응답된 것입니다.

이중 테이블을 참조하는 쿼리는 가능한 경우 캐시에서 데이터를 반환하고, 가능하지 않으면 DirectQuery로 되돌립니다.

다음 쿼리는 이전 테이블에서 계속됩니다. 이중 모드인 Date 테이블의 열만 참조합니다. 따라서 쿼리는 캐시를 적중해야 합니다.

Screenshot showing the text of query that refers to the Date table.

다음 쿼리는 DirectQuery 모드인 Sales 테이블의 열만 참조합니다. 따라서 캐시를 적중하지 않아야 합니다.

Screenshot showing the text of query that refers the Sales table.

다음 쿼리는 두 열을 결합하므로 흥미롭습니다. 이 쿼리는 캐시를 적중하지 않습니다. 초기에는 캐시에서 CalendarYear 값을 검색하고 원본에서 SalesAmount 값을 검색한 후 결과를 결합할 것으로 기대할 수 있지만, 이 방법은 SUM/GROUP BY 작업을 원본 시스템에 제출하는 것보다 덜 효율적입니다. 작업이 원본으로 푸시다운된 경우 반환되는 행 수가 훨씬 더 적을 수 있습니다.

Screenshot showing the text of query that refers to both the Date table and the Sales table.

참고 항목

이 동작은 캐시된 테이블과 캐시되지 않은 테이블을 결합할 때 Power BI Desktop의 다 대 다 관계와 다릅니다.

캐시는 동기화되어야 합니다.

이전 섹션에 표시된 쿼리는 이중 테이블이 때때로 캐시를 적중하고 때때로 캐시를 적중하지 않음을 보여 줍니다. 따라서 캐시가 오래된 경우 다른 값이 반환될 수 있습니다. 예를 들어 쿼리 실행은 캐시된 값과 일치하도록 DirectQuery 결과를 필터링하여 데이터 문제를 마스크하려고 시도하지 않습니다. 데이터 흐름을 알고 있어야 하며 이에 따라 디자인해야 합니다. 필요한 경우 원본에서 이러한 경우를 처리하도록 설정된 방법이 있습니다.

이중 스토리지 모드는 성능 최적화입니다. 이 모드는 비즈니스 요구 사항을 충족하는 기능을 손상하지 않는 방식으로만 사용해야 합니다. 대체 동작의 경우 Power BI Desktop의 다 대 다 관계에 설명된 방법을 사용하는 것이 좋습니다.

데이터 뷰

의미 체계 모델에 있는 하나 이상 테이블의 스토리지 모드가 가져오기 또는 이중으로 설정된 경우 데이터 뷰 탭이 표시될 수 있습니다.

Screenshot highlighting the Data view icon.

데이터 뷰에서 이중 및 가져오기 테이블을 선택하면 캐시된 데이터가 표시됩니다. DirectQuery 테이블에 데이터가 표시되지 않고 DirectQuery 테이블의 상태를 표시할 수 없다는 메시지가 표시됩니다.

고려 사항 및 제한 사항

현재 스토리지 모드 릴리스와 복합 모델과의 상관 관계에는 몇 가지 제한 사항이 있습니다.

다음 라이브 연결(다차원) 원본은 복합 모델과 함께 사용할 수 없습니다.

  • SAP HANA
  • SAP Business Warehouse

DirectQuery를 사용하여 해당 다차원 원본에 연결하는 경우 다른 DirectQuery 원본에 연결하거나 가져온 데이터와 결합할 수 없습니다.

복합 모델을 사용하면 DirectQuery 사용의 기존 제한 사항이 여전히 적용됩니다. 이러한 제한 사항 중 대부분은 테이블의 스토리지 모드에 따라 테이블별로 적용됩니다. 예를 들어 가져온 테이블의 계산 열은 다른 테이블을 참조할 수 있지만, DirectQuery 테이블에서 계산 열은 동일한 테이블의 열만 참조하도록 제한됩니다. 다른 제한 사항은 모델 내의 테이블이 DirectQuery인 경우 모델에 전체적으로 적용됩니다.

복합 모델 및 DirectQuery에 대한 자세한 내용은 다음 문서를 참조하세요.