Microsoft Fabric 웨어하우스에 대한 V 주문 이해
적용 대상:✅ Microsoft Fabric 내 웨어하우스
Microsoft Fabric Storage의 웨어하우스는 모든 사용자 데이터에 Delta Lake 테이블 형식을 사용합니다. 웨어하우스는 델타 형식에서 제공하는 최적화 외에도 스토리지에 최적화를 적용하여 Parquet 형식을 준수하면서 분석 시나리오에서 더 빠른 쿼리 성능을 제공합니다. 이 문서에서는 V 주문 쓰기 최적화, 해당 이점 및 제어 방법에 대해 설명합니다.
V 주문이란?
V-Order는 Power BI, SQL, Spark 등과 같은 Microsoft Fabric 컴퓨팅 엔진에서 빠른 읽기를 가능하게 하는 parquet 파일 형식에 대한 쓰기 시간 최적화입니다.
Power BI 및 SQL 엔진은 Microsoft Verti-Scan 기술 및 V-Order parquet 파일을 사용하여 데이터 액세스 시간과 같은 메모리 내 항목을 달성합니다. Spark 및 Verti-Scan 이외 다른 컴퓨팅 엔진은 읽기 시간이 평균 10% 빠른 V-Order 파일의 이점을 활용하며, 경우에 따라서는 읽기 시간이 최대 50%까지 빠릅니다.
V 주문은 Parquet 파일에 특수 정렬, 행 그룹 배포, 사전 인코딩 및 압축을 적용하여 작동합니다. 따라서 컴퓨팅 엔진은 스토리지에서 데이터를 읽는 데 네트워크, 디스크 및 CPU 리소스가 더 적게 필요하므로 비용 효율성과 성능을 제공합니다. 오픈 소스 parquet 형식을 100% 준수합니다. 모든 parquet 엔진은 일반 parquet 파일로 읽을 수 있습니다.
성능 고려 사항
V 주문을 사용하지 않도록 결정하기 전에 다음을 고려합니다.
- Microsoft Fabric Direct Lake 모드는 V 주문에 따라 달라집니다.
- 웨어하우스에서 성능에 대한 V 주문의 효과는 테이블 스키마, 데이터 볼륨, 쿼리 및 수집 패턴에 따라 달라질 수 있습니다.
- V 주문이 데이터 수집 및 쿼리의 성능에 미치는 영향을 테스트한 후 사용하지 않도록 설정해야 합니다. 소스 제어를 사용하여 테스트 웨어하우스의 복사본을 만들고, 복사본에서 V-Order를 사용하지 않도록 설정하며, 데이터 수집 및 쿼리 작업을 실행하여 성능 영향을 테스트하는 것이 좋습니다.
V 주문이 도움이 되지 않을 수 있는 시나리오
V 주문을 사용하지 않도록 설정하는 것이 적합한지 결정하기 전에 V 주문이 성능에 미치는 영향을 고려합니다.
주의
현재 V-Order 사용 중지는 웨어하우스 수준에서만 수행할 수 있으며 되돌릴 수 없습니다. 한 번 사용 중지하면 다시 사용하도록 설정할 수 없습니다. 사용자가 Fabric 웨어하우스에서 V-Order를 사용하지 않도록 선택하는 경우 성능을 고려해야 합니다.
V-Order를 사용하지 않도록 설정하면 데이터 수집 프로세스의 일부로 데이터를 스테이징하는 데 전용인 웨어하우스와 같이 쓰기 집약적인 웨어하우스에 유용할 수 있습니다. 스테이징 테이블은 새 데이터를 처리하기 위해 종종 삭제되고 다시 만들어지거나 잘립니다. 그런 다음 이러한 스테이징 테이블은 한두 번만 읽을 수 있으므로 V-Order를 적용하여 추가된 수집 시간을 정당화하지 않을 수 있습니다. V-Order를 사용하지 않도록 설정하여 데이터를 수집하는 시간을 줄이면 수집 작업 중에 데이터를 처리하는 전체 시간이 단축될 수 있습니다. 이 경우 분석 쿼리 및 Power BI가 V-Order의 이점을 활용할 수 있도록 주 사용자 연결 웨어하우스에서 스테이징 웨어하우스를 분할해야 합니다.