Visão geral de eliminação de duplicação de dados

Aplica-se a: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, versões 21H2 e 20H2

O que é a Eliminação de Duplicação de Dados?

A Eliminação de Duplicação de Dados, também conhecida como Eliminação de duplicatas, é um recurso que pode ajudar a reduzir o impacto de dados redundantes nos custos de armazenamento. Quando habilitada, a Eliminação de Duplicação de Dados otimiza o espaço livre em um volume examinando os dados no volume para procurar duplicatas no volume. As duplicatas do conjunto de dados do volume são armazenadas uma vez e (opcionalmente) são compactadas para economizar ainda mais espaço. A Eliminação de Duplicação de Dados otimiza redundâncias sem comprometer a fidelidade ou a integridade dos dados. Podem ser encontradas mais informações sobre como a Eliminação de Duplicação de Dados funciona na seção "Como funciona a Eliminação de Duplicação de Dados?" da página Noções básicas sobre Eliminação de Duplicação de Dados.

Importante

O KB4025334 contém um pacote cumulativo de correções para Eliminação de Duplicação de Dados, incluindo correções de confiabilidade importantes; é altamente recomendável a instalação desse pacote durante o uso da Eliminação de Duplicação de Dados com o Windows Server 2016 e Windows Server 2019.

Por que a Eliminação de Duplicação de Dados é útil?

A Eliminação de Duplicação de Dados ajuda os administradores de armazenamento a reduzir os custos associados a dados duplicados. Grandes conjuntos de dados geralmente têm muita duplicação, o que aumenta os custos de armazenamento de dados. Por exemplo:

  • Os compartilhamentos de arquivos do usuário podem ter várias cópias dos mesmos arquivos ou de arquivos semelhantes.
  • Os convidados de virtualização podem ser praticamente idênticos de VM para VM.
  • Os instantâneos de backup podem ter algumas diferenças muito pequenas no dia a dia.

A economia de espaço que pode ser obtida com a Eliminação de Duplicação de Dados depende do conjunto de dados ou da carga de trabalho no volume. Os conjuntos de dados com alta duplicação podem ter taxas de otimização de até 95% ou uma redução de 20x na utilização de armazenamento. A tabela a seguir realça as economias típicas da eliminação de duplicação para vários tipos de conteúdo:

Cenário Conteúdo Economia típica de espaço
Documentos do usuário Documentos do Office, fotos, música, vídeos, etc. 30% a 50%
Compartilhamentos de implantação Binários de software, arquivos cab, símbolos, etc. 70-80%
Bibliotecas de virtualização ISOs, arquivos de disco rígido virtual, etc. 80% a 95%
Compartilhamento geral de arquivos Todas as opções acima 50% a 60%

Observação

Se você estiver apenas procurando liberar espaço em um volume, considere a possibilidade de usar a Sincronização de Arquivos do Azure com a camada de nuvem habilitada. Isso permite armazenar em cache os arquivos acessados com mais frequência localmente e transferir seus arquivos acessados com menos frequência para a nuvem, poupando espaço de armazenamento local, ao mesmo tempo em que mantém o desempenho. Para mais detalhes, confira Planejando uma implantação da Sincronização de Arquivos do Azure.

Quando a Eliminação de Duplicação de Dados pode ser usada?

Ilustração do cenário Descrição
Illustration of file servers. Servidores de arquivo de uso geral: são servidores de arquivo de uso geral que podem conter qualquer um dos seguintes tipos de compartilhamentos:
  • Compartilhamentos de equipe
  • Pastas base de usuários
  • Pastas de trabalho
  • Compartilhamentos de desenvolvimento de software
Servidores de arquivos de finalidade geral são bons candidatos para Eliminação de Duplicação de Dados, porque os vários usuários tendem a ter muitas cópias ou versões do mesmo arquivo. Os compartilhamentos de desenvolvimento de software se beneficiam da Eliminação de Duplicação de Dados, porque muitos binários permanecem essencialmente inalterados de um build para outro.
Illustration of VDI servers. Implantações de VDI (Infraestrutura de Área de Trabalho Virtual): servidores VDI, como Serviços da Área de Trabalho Remota, fornecem uma opção simples para que as organizações provisionem áreas de trabalho para os usuários. Há muitas razões para que uma organização recorra a essa tecnologia:
  • Implantação de aplicativos: você pode implantar rapidamente aplicativos em sua empresa. Isso é particularmente útil quando você tem aplicativos que são atualizados com frequência, são usados raramente ou são difíceis de gerenciar.
  • Consolidação de aplicativos: quando você instala e executa aplicativos em um conjunto de máquinas virtuais gerenciadas centralmente, você acaba com a necessidade de atualizar aplicativos em computadores cliente. Essa opção também reduz a quantidade de largura de banda de rede necessária para acessar os aplicativos.
  • Acesso remoto: os usuários podem acessar aplicativos corporativos por meio de dispositivos, como computadores domésticos, quiosques, hardware que consomem pouca energia e sistemas operacionais diferentes do Windows.
  • Acesso a filial: implantações de VDI podem fornecer melhor desempenho de aplicativos para funcionários de filiais que precisam de acesso a repositórios de dados centralizados. Às vezes, aplicativos que fazem uso intensivo de dados não têm protocolos de cliente/servidor que são otimizados para conexões de baixa velocidade.
As implantações de VDI são ótimas candidatas para Eliminação de Duplicação de Dados, porque os discos rígidos virtuais que controlam as áreas de trabalho remotas para os usuários são essencialmente idênticos. Além disso, a Eliminação de Duplicação de Dados pode ajudar com os problemas de inicialização de VDI, a queda no desempenho de armazenamento quando muitos usuários fazem logon simultaneamente em suas áreas de trabalho para começar o dia.
Illustration of backup applications. Destinos de backup, como aplicativos de backup virtualizados: aplicativos de backup, como o Microsoft DPM (Data Protection Manager), são excelentes candidatos para a Eliminação de Duplicação de Dados devido à duplicação significativa entre os instantâneos de backup.
Illustration of other workloads. Outras cargas de trabalho: outras cargas de trabalho também podem ser excelentes candidatos para a Eliminação de Duplicação de Dados.