이 기능은 ReFS 블록 복제를 사용하여 데이터 이동을 줄이고 메타데이터만 작업을 사용하도록 설정합니다. 이 기능은 데이터 블록 수준에서 작동하며 클러스터 크기에 따라 고정 블록 크기를 사용합니다. 압축 엔진은 열 지도를 생성하여 블록이 압축에 적합한지 확인하고 CPU 사용량을 최적화합니다.
ReFS 중복 제거 및 압축을 일회성 작업으로 실행하거나 예약된 작업으로 자동화할 수 있습니다. 이 기능은 모든 플래시 및 하이브리드 시스템에서 작동하며 양방향 미러, 중첩된 양방향 미러, 3방향 미러 및 미러 가속 패리티와 같은 다양한 복원력 설정을 지원합니다.
이점
다음은 ReFS 중복 제거 및 압축을 사용할 때의 이점입니다.
활성 워크로드에 대한 스토리지 절감. VDI와 같은 활성 워크로드를 위해 설계되어 까다로운 환경에서 효율적인 성능을 보장합니다.
여러 모드. 중복 제거 전용, 압축만, 중복 제거 및 압축(기본 모드)의 세 가지 모드로 작동하여 필요에 따라 최적화할 수 있습니다.
증분 중복 제거. 매번 전체 볼륨을 검사하고 작업 기간을 최적화하고 시스템 성능에 미치는 영향을 줄이는 것이 아니라 새 데이터나 변경된 데이터만 중복 제거합니다.
사전 요구 사항
시작하기 전에 다음 필수 구성 요소가 완료되었는지 확인합니다.
배포 및 등록된 Azure Stack HCI 클러스터에 액세스할 수 있습니다.
클러스터에 CSV(클러스터 공유 볼륨)가 만들어지고 액세스할 수 있습니다.
CSV에는 Windows 데이터 중복 제거 기능이 아직 사용하도록 설정되어 있지 않습니다.
ReFS 중복 제거 및 압축 사용
Windows Admin Center 또는 PowerShell을 통해 ReFS 중복 제거 및 압축을 사용할 수 있습니다. PowerShell은 수동 및 자동화된 작업을 모두 허용하는 반면 Windows Admin Center 예약된 작업만 지원합니다. 메서드에 관계없이 작업 설정을 사용자 지정하고 파일 변경 내용 추적을 활용하여 더 빠른 후속 실행을 수행할 수 있습니다.
Windows Admin Center 볼륨을 만드는 동안 기존 볼륨 또는 새 볼륨에서 실행되도록 ReFS 중복 제거 및 압축 일정을 만들 수 있습니다.
다음 단계에 따라 Windows Admin Center 통해 ReFS 중복 제거 및 압축을 사용하도록 설정하고 실행해야 하는 일정을 설정합니다.
클러스터에 연결한 다음 왼쪽의 도구 창에서 볼륨을 선택합니다.
볼륨 페이지에서 인벤토리 탭을 선택하고 적절한 볼륨을 선택한 다음 설정을 선택합니다. 새 볼륨에 대한 ReFS 중복 제거 및 압축을 켜려면 + 만들기를 선택합니다.
오른쪽 볼륨 설정 창의 기타 옵션 드롭다운에서 ReFS 중복 제거 및 압축 사용 확인란을 선택합니다.
ReFS 중복 제거 및 압축이 실행되어야 하는 요일, 작업을 실행할 시간 및 최대 기간(기본값은 무제한)을 선택한 다음 저장을 선택합니다.
다음 스크린샷은 ReFS 중복 제거 및 압축이 2023년 9월 22일부터 최대 2시간 동안 금요일과 토요일 오전 10시 40분에 실행되는 것을 보여줍니다. 시작 날짜가 2023년 9월 21일로 변경된 경우 첫 번째 실행은 2023년 9월 21일 이후의 첫 번째 금요일인 2023년 9월 22일 오전 10:40입니다.
볼륨의 속성 섹션에서 변경 내용을 확인합니다. 일정은 속성 섹션 아래에 표시되고 절감 분석 및 다음 예약된 런타임을 표시합니다. 이러한 절감액은 각 실행 후에 업데이트되며 성능 섹션 아래의 차트에서 성능 영향을 관찰할 수 있습니다.
PowerShell을 통해 ReFS 중복 제거 및 압축을 사용하려면 먼저 기능을 사용하도록 설정한 다음 일회성 수동 작업으로 실행하거나 자동화하여 예약된 작업으로 실행합니다. 작업은 각 클러스터에 대해 CSV 수준에서 설정되며 모드, 기간, 시스템 리소스 사용량 등에 따라 사용자 지정할 수 있습니다.
ReFS 중복 제거 및 압축 사용
PowerShell을 통해 ReFS 중복 제거 및 압축을 사용하도록 설정하려면 다음 단계를 수행합니다.
일정을 일시 중단하면 실행 중인 작업이 취소되고 나중에 예약된 실행이 중지됩니다. 이 옵션은 ReFS 중복 제거 및 압축 관련 메타데이터를 유지하고 최적화된 향후 실행에 대한 파일 변경 내용을 계속 추적합니다. 일정 설정이 유지된 상태에서 언제든지 일정을 다시 시작할 수 있습니다.
ReFS 중복 제거 및 압축과 Windows 데이터 중복 제거를 동시에 사용하도록 설정하는 것은 지원되지 않습니다.
ReFS 중복 제거 및 압축은 최적화 후 성능 영향을 최소화하는 데 중점을 두고 활성 워크로드용으로 설계되었습니다. Windows 데이터 중복 제거와 달리 ReFS 중복 제거 및 압축은 청크 저장소를 사용하여 중복 제거된 데이터를 저장하지 않으며 실제 데이터 이동은 관련되지 않습니다. 이 기능은 ReFS 블록 복제를 사용하여 메타데이터 전용 작업을 사용하도록 설정합니다. Windows 데이터 중복 제거는 가변 블록 크기의 사용으로 인해 더 나은 스토리지 절감을 제공할 수 있으며, GPFS(범용 파일 서버), 백업 대상 등과 같은 광범위한 워크로드 유형에도 적합합니다.
ReFS 중복 제거 및 압축의 단계는 무엇인가요?
최적화 프로세스는 순차적으로 발생하고 지정된 모드에 따라 달라지는 다음 단계로 구성됩니다. 최적화 실행이 기간 제한에 도달하면 압축이 실행되지 않을 수 있습니다.
초기화. 이 단계에서는 스토리지 볼륨을 검사하여 중복 데이터 블록을 식별합니다.
데이터 중복 제거. 이 단계에서 중복 블록은 ReFS 블록 복제를 사용하여 단일 인스턴스화되고 추적됩니다.
압축. 이 단계에서는 블록이 압축에 적합한지 확인하기 위해 열 지도가 생성됩니다. 기본 설정은 자주 액세스하지 않거나 콜드 데이터를 압축하여 크기를 줄입니다. 압축 수준을 변경하여 압축에 적합한 블록 범위를 조정할 수 있습니다.
볼륨이 완전히 최적화되기 전에 기간 제한에 도달하면 어떻게 됩니까?
기간 제한은 업무 시간 동안 최적화 작업으로 인한 고객 워크로드에 대한 성능 영향을 방지하기 위해 적용됩니다. 중복 제거 서비스는 볼륨 및 들어오는 파일 수정의 최적화된 부분을 모니터링합니다. 이 데이터는 최적화 시간을 줄이기 위해 향후 작업에서 활용됩니다. 예를 들어 기간 제한으로 인해 첫 번째 실행에서 볼륨이 30%만 처리되는 경우 후속 실행은 나머지 70%와 새 데이터를 처리합니다.
알려진 문제
다음 섹션에서는 현재 ReFS 중복 제거 및 압축에 존재하는 알려진 문제를 나열합니다.
단일 클러스터 내의 여러 CSV에서 동시에 실행되도록 작업을 예약하면 잠재적으로 CSV 이동을 트리거하고 성능에 부정적인 영향을 미칠 수 있습니다.
상태: 열기.
권장되는 모범 사례로, 겹치지 않도록 작업의 시작 시간을 표시합니다. 그러나 모든 작업을 동시에 실행해야 하는 경우 전체 클러스터 CPU 사용률의 50% 미만이 되도록 모든 CSV에서 작업당 CPU 할당을 조정합니다. CPU 제한을 부과하면 작업 실행 시간이 길어질 수 있습니다.
ReFS 중복 제거 및 압축 작업이 완료되고(성공적으로 또는 취소됨) 스토리지 절감액이 또는 Windows Admin Center 나열 Get-ReFSDedupStatus 되지 않습니다.
상태: 해결.
이 문제에 대한 임시 해결 방법은 일회성 작업을 시작하고 결과를 즉시 업데이트하는 것입니다.
Start-ReFSDedupJob -Volume <path>
볼륨에서 ReFS 중복 제거 및 압축을 사용하지 않도록 설정 한 후 중지된 모니터링 ETW(Windows용 이벤트 추적) 이벤트를 보냅니다.
상태: 해결.
볼륨에서 ReFS 중복 제거 및 압축을 사용하지 않도록 설정하면 ReFS 중복 제거 로그에 대한 ETW 채널이 중지된 모니터링 이벤트를 반복합니다. 그러나 이 문제로 인해 상당한 사용량 영향을 예상하지는 않습니다.
압축하는 동안 볼륨이 다른 노드로 이동되면 작업 실패 이벤트가 기록되지 않습니다.
상태: 해결.
압축이 진행되는 동안 CSV를 클러스터의 다른 서버로 이동하면 작업 실패 이벤트가 ReFS 중복 제거 채널에 기록되지 않습니다. 그러나 이 문제로 인해 상당한 사용량 영향을 예상하지는 않습니다.