데이터 중복 제거 설치 및 사용

적용 대상: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, 버전 21H2 및 20H2

이 항목에서는 데이터 중복 제거를 설치하고, 중복 제거에 대한 워크로드를 평가하고, 특정 볼륨에서 데이터 중복 제거를 사용하도록 설정하는 방법을 설명합니다.

참고 항목

장애 조치(failover) 클러스터에서 데이터 중복 제거를 실행하려는 경우 클러스터의 모든 노드에 데이터 중복 제거 서버 역할이 설치되어 있어야 합니다.

데이터 중복 제거 설치

Important

KB4025334 중요한 안정성 수정 사항을 포함하여 데이터 중복 제거에 대한 수정 사항을 롤업하며 Windows Server 2016에서 데이터 중복 제거를 사용할 때 설치하는 것이 좋습니다.

서버 관리자를 사용하여 데이터 중복 제거 설치

  1. 역할 및 기능 추가 마법사에서 서버 역할을 선택하고 데이터 중복 제거를 선택합니다. Install Data Deduplication via Server Manager: select Data Deduplication from Server Roles
  2. 설치 단추가 활성화될 때까지 다음 을 클릭한 후 설치를 클릭합니다. Install Data Deduplication via Server Manager: click install

PowerShell을 사용하여 데이터 중복 제거 설치

데이터 중복 제거를 설치하려면 관리자 권한으로 다음 PowerShell 명령을 실행합니다. Install-WindowsFeature -Name FS-Data-Deduplication

데이터 중복 제거를 설치하려면:

  • Windows Server 2016 이상을 실행하는 서버 또는 원격 서버 관리사용 도구(RSAT)가 설치된 Windows PC에서 서버 이름에 대한 명시적 참조를 사용하여 데이터 중복 제거를 설치합니다('MyServer'를 서버 인스턴스의 실제 이름으로 바꾸기).

    Install-WindowsFeature -ComputerName <MyServer> -Name FS-Data-Deduplication
    

    또는

  • PowerShell 원격으로 서버 인스턴스에 원격으로 커넥트 DISM을 사용하여 데이터 중복 제거를 설치합니다.

    Enter-PSSession -ComputerName MyServer
    dism /online /enable-feature /featurename:dedup-core /all
    

데이터 중복 제거 사용

데이터 중복 제거할 워크로드를 결정

데이터 중복 제거는 중복된 데이터에서 사용되는 디스크 공간을 줄여 서버 애플리케이션의 데이터 소비 비용을 효과적으로 최소화할 수 있습니다. 중복 제거를 사용하도록 설정하기 전에 스토리지에서 최대 성능을 확보할 수 있도록 워크로드의 특성을 이해해야 합니다. 고려할 두 가지 등급의 워크로드가 있습니다.

  • 중복 제거 효과가 매우 높은 데이터 세트와 데이터 중복 제거의 사후 처리 모델과 일치하는 리소스 소비 패턴이 둘 다 있는 것으로 검증된 권장 워크로드. 이러한 워크로드에서 항상 데이터 중복 제거 를 사용하도록 설정하는 것이 좋습니다.
    • 팀 공유, 사용자 홈 폴더, 작업 폴더 및 소프트웨어 개발 공유 등과 같이 공유 역할을 하는 GPFS(일반용 파일 서버)
    • VDI(가상 데스크톱 인프라) 서버
    • Microsoft DPM(Data Protection Manager)과 같은 가상화된 백업 애플리케이션
  • 중복 제거의 효과가 있을 수 있지만 중복 제거에 적합한 대상이 아닐 때도 있는 워크로드. 예를 들어 다음 워크로드는 중복 제거와 잘 작동할 수 있지만 먼저 중복 제거의 이점을 평가해야 합니다.
    • 일반용 Hyper-V 호스트
    • SQL Server
    • LOB(기간 업무) 서버

데이터 중복 제거를 위한 워크로드 평가

Important

권장 워크로드를 실행 중인 경우 이 섹션을 건너뛰고 데이터 중복 제거 사용으로 이동할 수 있습니다.

워크로드가 중복 제거에 효과적인지 확인하려면 다음 질문에 대답합니다. 워크로드에 대해 잘 모를 경우 워크로드에서 작동 방식을 확인할 수 있도록 테스트 데이터 세트에서 파일럿 데이터 중복 제거 배포를 수행하는 것이 좋습니다.

  1. 워크로드의 데이터 세트가 중복 제거의 이점을 활용할 수 있을 정도로 충분히 중복되어 있습니까? 워크로드 데이터 중복 제거를 사용하기 전에 데이터 중복 제거 절감 평가 도구 또는 DDPEval을 사용하여 워크로드의 데이터 세트가 어느 정도 중복되어 있는지 조사합니다. 데이터 중복 제거를 설치한 후 C:\Windows\System32\DDPEval.exe에서 이 도구를 찾을 수 있습니다. DDPEval은 직접 연결 볼륨(로컬 드라이브 또는 클러스터 공유 볼륨 포함) 및 매핑되거나 매핑되지 않은 네트워크 공유에 대해 최적화 가능성을 평가할 수 있습니다.

    DDPEval.exe를 실행하면 다음과 유사한 출력이 반환됩니다.

     Data Deduplication Savings Evaluation Tool
     Copyright 2011-2012 Microsoft Corporation.  All Rights Reserved.
    
     Evaluated folder: E:\Test
     Processed files: 34
     Processed files size: 12.03MB
     Optimized files size: 4.02MB
     Space savings: 8.01MB
     Space savings percent: 66
     Optimized files size (no compression): 11.47MB
     Space savings (no compression): 571.53KB
     Space savings percent (no compression): 4
     Files with duplication: 2
     Files excluded by policy: 20
     Files excluded by error: 0
    
  2. 해당 데이터 세트에 대한 워크로드의 I/O 패턴은 어떤 형태입니까? 워크로드에 필요한 성능은 무엇입니까? 데이터 중복 제거는 파일을 디스크에 쓸 때가 아니라 정기적으로 파일을 최적화합니다. 따라서 중복 제거된 볼륨에 대해 예상되는 워크로드의 읽기 패턴을 조사해야 합니다. 데이터 중복 제거는 파일 내용을 청크 저장소로 이동하고 가능한 한 많은 파일로 청크 저장소를 구성하려고 하기 때문에 파일의 순차적 범위에 적용했을 때 읽기 작업이 가장 효율적으로 수행됩니다.

    일반적으로 데이터베이스 형태의 워크로드는 순차적 읽기 패턴보다 임의 읽기 패턴에 더 가깝습니다. 데이터베이스는 데이터베이스 레이아웃이 실행될 수 있는 가능한 모든 쿼리에 최적 상태임을 보장하지 않기 때문입니다. 청크 저장소의 섹션은 볼륨의 도처에 존재할 수 있으므로 데이터베이스 쿼리를 위해 청크 저장소의 데이터 범위에 액세스하면 추가 대기 시간이 발생할 수 있습니다. 고성능 워크로드는 이 추가 대기 시간에 특히 민감하지만 다른 데이터베이스 형태의 워크로드는 그렇지 않습니다.

    참고 항목

    이러한 문제는 주로 기존 회전 스토리지 미디어(하드 디스크 드라이브 또는 HDD라고도 함)로 구성된 볼륨의 스토리지 워크로드에 적용됩니다. 모든 플래시 스토리지 인프라(반도체 드라이브 또는 SSD라고도 함)는 임의 I/O 패턴의 영향을 덜 받습니다. 플래시 미디어의 특성상 미디어의 모든 위치에 대해 액세스 시간이 동일하기 때문입니다. 따라서 중복 제거에서는 기존 회전 스토리지 미디어와 달리 모든 플래시 미디어에 저장된 워크로드의 데이터 세트을 읽을 때 대기 시간이 동일하지 않습니다.

  3. 서버에서 워크로드의 리소스 요구 사항은 무엇입니까? 데이터 중복 제거는 사후 처리 모델을 사용하므로 해당 최적화 및 다른 작업을 완료하려면 주기적으로 충분한 시스템 리소스가 필요합니다. 따라서 야간이나 주말과 같이 유휴 시간이 있는 워크로드는 중복 제거에 매우 효과적이지만, 연중무휴 24시간 실행되는 워크로드는 그렇지 않습니다. 유휴 시간이 없는 워크로드도 서버의 리소스 요구 사항이 크지 않은 경우에는 중복 제거에 효과적일 수 있습니다.

데이터 중복 제거 사용

데이터 중복 제거를 사용하기 전에 워크로드와 가장 유사한 사용 유형을 선택해야 합니다. 데이터 중복 제거에 포함되는 세 가지 사용 유형이 있습니다.

  • 기본 - 일반용 파일 서버에 맞게 특별히 조정됩니다.
  • Hyper-V - VDI 서버에 맞게 특별히 조정됩니다.
  • 백업 - Microsoft DPM과 같은 가상화된 백업 애플리케이션에 맞게 특별히 조정됩니다.

서버 관리자를 사용하여 데이터 중복 제거를 사용하도록 설정

  1. 서버 관리자에서 파일 및 스토리지 서비스를 선택합니다. Click File and Storage Services
  2. 파일 및 스토리지 서비스에서 볼륨을 선택합니다. Click Volumes
  3. 원하는 볼륨을 마우스 오른쪽 단추로 클릭하고 데이터 중복 제거 구성을 선택합니다. Click Configure Data Deduplication
  4. 드롭다운 상자에서 원하는 사용 유형을 선택하고 확인을 선택합니다. Select the desired Usage Type from the drop down
  5. 권장 워크로드를 실행 중인 경우 이것으로 작업이 완료되었습니다. 다른 워크로드의 경우 기타 고려 사항을 참조하세요.

참고 항목

이 작업을 수행하는 이유를 포함하여, 파일 확장명 또는 폴더를 제외시키는 방법과 중복 제거 일정을 선택하는 방법에 대한 자세한 내용은 데이터 중복 제거 구성에서 확인할 수 있습니다.

PowerShell을 사용하여 데이터 중복 제거를 사용하도록 설정

  1. 관리자 컨텍스트로 다음 PowerShell 명령을 실행합니다.

     Enable-DedupVolume -Volume <Volume-Path> -UsageType <Selected-Usage-Type>
    
  2. 권장 워크로드를 실행 중인 경우 이것으로 작업이 완료되었습니다. 다른 워크로드의 경우 기타 고려 사항을 참조하세요.

참고 항목

Enable-DedupVolume을 비롯한 데이터 중복 제거 PowerShell cmdlet은 CIM 세션을 통해 -CimSession 매개 변수를 추가하여 원격으로 실행할 수 있습니다. 이는 서버 인스턴스에 대해 원격으로 데이터 중복 제거 PowerShell cmdlet을 실행하는 데 특히 유용합니다. 새 CIM 세션을 만들려면 New-CimSession을 실행합니다.

기타 고려 사항

Important

권장 워크로드를 실행 중인 경우에는 이 섹션을 건너뛸 수 있습니다.

질문과 대답(FAQ)

X 워크로드에 대한 데이터 세트에서 데이터 중복 제거를 실행하려고 합니다. 가능합니까? 데이터 중복 제거와 상호 운용되지 않는 것으로 알려진 워크로드 외에는 모든 워크로드에서 데이터 중복 제거의 데이터 무결성이 완전히 지원됩니다. Microsoft는 성능을 위해 권장 워크로드도 지원합니다. 다른 워크로드의 성능은 서버에서 수행하고 있는 작업에 따라 크게 달라집니다. 워크로드에 대한 데이터 중복 제거가 성능에 미치는 영향, 이 워크로드에 대한 중복 제거 허용 여부를 결정해야 합니다.

중복 제거된 볼륨에 대한 볼륨 크기 조정 요구 사항은 무엇입니까? Windows Server 2012 및 Windows Server 2012 R2에서는 데이터 중복 제거가 볼륨의 변동을 따를 수 있도록 볼륨 크기를 신중하게 조정해야 했습니다. 이는 일반적으로 변동률이 높은 워크로드에 대한 중복 제거된 볼륨의 평균 최대 크기는 1~2TB이고, 권장되는 절대 최대 크기는 10TB였음을 의미합니다. Windows Server 2016에서는 이러한 제한 사항이 제거되었습니다. 자세한 내용은 데이터 중복 제거의 새로운 기능을 참조하세요.

권장 워크로드에 대해 일정 또는 다른 데이터 중복 제거 설정을 수정해야 합니까? 아니요. 제공된 사용 유형은 권장 워크로드에 적합한 기본값을 제공하기 위해 만든 것입니다.

데이터 중복 제거에 대한 메모리 요구 사항은 무엇입니까? 데이터 중복 제거에는 최소한 300MB 외에 추가로 논리 데이터의 TB당 50MB가 있어야 합니다. 예를 들어 10TB 볼륨을 최적화하는 경우 중복 제거에 최소 800MB의 메모리가 할당되어야 합니다(300 MB + 50 MB * 10 = 300 MB + 500 MB = 800 MB). 데이터 중복 제거는 이처럼 적은 메모리로 볼륨을 최적화할 수 있지만 이러한 제한된 리소스를 사용하면 데이터 중복 제거 작업의 속도가 느려집니다.

최적의 경우, 데이터 중복 제거에는 논리 데이터 1TB당 1GB의 메모리가 있어야 합니다. 예를 들어 10TB 볼륨을 최적화하는 경우 데이터 중복 제거에 10GB의 메모리를 할당하는 것이 가장 적절합니다(1 GB * 10). 이 비율을 유지하면 데이터 중복 제거 작업의 성능이 극대화됩니다.

데이터 중복 제거에 대한 스토리지 요구 사항은 무엇입니까? Windows Server 2016에서는 데이터 중복 제거에서 최대 64TB의 볼륨 크기를 지원할 수 있습니다. 자세한 내용은 데이터 중복 제거의 새로운 기능을 참조하세요.