데이터 중복 제거 개요

적용 대상: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, 버전 21H2 및 20H2

데이터 중복 제거란 무엇입니까?

데이터 중복 제거는 중복 데이터가 스토리지 비용에 미치는 영향을 줄이는 데 도움이 되는 기능입니다. 사용하도록 설정된 경우 데이터 중복 제거는 볼륨에서 중복된 부분을 찾기 위해 볼륨의 데이터를 검사하여 볼륨의 여유 공간을 최적화합니다. 볼륨의 데이터 세트에서 중복된 부분이 한 번 저장되며 필요한 경우 추가적인 절약을 위해 압축됩니다. 데이터 중복 제거는 데이터 충실도 또는 무결성을 손상시키지 않고 중복성을 최적화합니다. 데이터 중복 제거 작동 방식에 대한 자세한 내용은 '데이터 중복 제거 작동 방식' 섹션(데이터 중복 제거 이해 페이지)에서 확인할 수 있습니다.

Important

KB4025334 중요한 안정성 수정 사항을 포함하여 데이터 중복 제거에 대한 수정 사항을 롤업하며 Windows Server 2016 및 Windows Server 2019에서 데이터 중복 제거를 사용할 때 설치하는 것이 좋습니다.

데이터 중복 제거가 유용한 이유는 무엇입니까?

데이터 중복 제거를 사용하면 스토리지 관리자가 중복된 데이터와 관련된 비용을 줄일 수 있습니다. 대규모 데이터 세트에는 종종 데이터 저장 비용을 증가시키는 많은 중복 데이터가 있습니다. 예시:

  • 사용자 파일 공유에 같거나 유사한 파일의 여러 복사본이 있을 수 있습니다.
  • 가상화 게스트가 VM 간에 거의 동일할 수 있습니다.
  • 매일 생성되는 백업 스냅샷이 약간의 차이만 있을 수 있습니다.

데이터 중복 제거에서 얻을 수 있는 공간 절약은 볼륨의 데이터 세트 또는 워크로드에 따라 달라집니다. 중복성이 높은 데이터 세트은 최적화 비율이 최대 95%에 이르거나 스토리지 사용률이 20배 감소할 수 있습니다. 다음 표에는 다양한 콘텐츠 유형에 대한 일반적인 중복 제거 절감률이 나와 있습니다.

시나리오 콘텐츠 일반적인 공간 절약 비율
사용자 문서 Office 문서, 사진, 음악, 비디오 등 30~50%
배포 공유 소프트웨어 이진 파일, cab 파일, 기호 등 70~80%
가상화 라이브러리 ISO, 가상 하드 디스크 파일 등 80~95%
일반 파일 공유 위 항목 모두 해당 50~60%

참고 항목

볼륨의 공간을 확보하려는 경우 클라우드 계층화가 사용하도록 설정된 Azure 파일 동기화 사용하는 것이 좋습니다. 이를 통해 가장 자주 액세스하는 파일을 로컬로 캐시하고 가장 자주 액세스하지 않는 파일을 클라우드에 계층화하여 성능을 유지하면서 로컬 스토리지 공간을 절약할 수 있습니다. 자세한 내용은 Azure 파일 동기화 배포 계획을 참조하세요.

데이터 중복 제거는 언제 사용할 수 있나요?

시나리오 그림 설명
Illustration of file servers. 범용 파일 서버: 범용 파일 서버는 다음 유형의 공유를 포함할 수 있는 일반 사용 파일 서버입니다. 일반용 파일 서버는 여러 사용자가 같은 파일의 여러 복사본 또는 버전을 가지고 있는 경향이 많기 때문에 데이터 중복 제거에 적합한 대상입니다. 소프트웨어 개발 공유는 많은 이진 파일이 빌드 간에 기본적으로 변경되지 않은 상태로 유지되기 때문에 데이터 중복 제거의 이점을 활용할 수 있습니다.
Illustration of VDI servers. VDI(가상 데스크톱 인프라) 배포: 원격 데스크톱 서비스와 같은 VDI 서버는 조직에서 사용자에게 데스크톱을 프로비전하는 간단한 옵션을 제공합니다. 조직에서 이러한 기술에 의존하는 데는 여러 가지 이유가 있습니다.
  • 애플리케이션 배포: 엔터프라이즈 전체에 애플리케이션을 신속하게 배포할 수 있습니다. 이는 자주 업데이트되거나, 자주 사용되지 않거나, 관리하기 어려운 애플리케이션이 있는 경우에 특히 유용합니다.
  • 애플리케이션 통합: 중앙에서 관리되는 가상 머신 집합에서 애플리케이션을 설치하고 실행하는 경우 클라이언트 컴퓨터에서 애플리케이션을 업데이트할 필요가 없습니다. 이 옵션은 애플리케이션에 액세스하는 데 필요한 네트워크 대역폭 양도 줄여 줍니다.
  • 원격 액세스: 사용자는 가정용 컴퓨터, 키오스크, 저전력 하드웨어 및 Windows 이외의 운영 체제와 같은 디바이스에서 엔터프라이즈 애플리케이션에 액세스할 수 있습니다.
  • 지점 액세스: VDI 배포는 중앙 집중식 데이터 저장소에 액세스해야 하는 지점 근로자에게 더 나은 애플리케이션 성능을 제공할 수 있습니다. 데이터 사용량이 많은 애플리케이션에는 저속 연결에 최적화된 클라이언트/서버 프로토콜이 없는 경우가 있습니다.
사용자를 위해 원격 데스크톱을 구동하는 가상 하드 디스크는 기본적으로 동일하기 때문에 VDI 배포는 데이터 중복 제거에 적합한 대상입니다. 또한 데이터 중복 제거는 많은 사용자가 데스크톱에 동시에 로그인하여 일과를 시작할 때 스토리지 성능이 저하되는 VDI 부팅 스톰에도 도움이 될 수 있습니다.
Illustration of backup applications. 가상화된 백업 애플리케이션과 같은 백업 대상: DPM(Microsoft Data Protection Manager)과 같은 백업 애플리케이션은 백업 스냅샷 간에 상당한 중복으로 인해 데이터 중복 제거에 적합한 후보입니다.
Illustration of other workloads. 기타 워크로드: 다른 워크로드는 데이터 중복 제거에 적합한 후보일 수도 있습니다.