Panoramica di Deduplicazione dati

Si applica a: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, versioni 21H2 e 20H2

Che cos’è la deduplicazione dei dati?

La deduplicazione dei dati è una funzionalità che consente di ridurre l'impatto dei dati ridondanti sui costi di archiviazione. Quando è abilitata, la deduplicazione dei dati consente di ottimizzare lo spazio disponibile in un volume cercando parti duplicate nel volume stesso. Le parti duplicate del set di dati del volume vengono archiviate una sola volta e, facoltativamente, possono essere compresse per ottenere un risparmio di spazio aggiuntivo. La deduplicazione dei dati consente di ottimizzare le ridondanze senza compromettere la fedeltà o l'integrità dei dati. Per altre informazioni sul funzionamento della deduplicazione dei dati, vedere la sezione How does Data Deduplication work? (Come funziona la deduplicazione dei dati?) della pagina Understanding Data Deduplication (Informazioni sulla deduplicazione dei dati).

Importante

L'articolo KB4025334 contiene un rollup di correzioni per Deduplicazione dati, incluse correzioni importanti per l'affidabilità ed è consigliabile installarlo quando si usa Deduplicazione dati con Windows Server 2016 e Windows Server 2019.

Perché è utile la deduplicazione dei dati?

La deduplicazione dei dati consente agli amministratori di archiviazione di ridurre i costi associati alla duplicazione dei dati. I set di dati di grandi dimensioni hanno spesso molti dati duplicati, che aumentano i costi di archiviazione. Ad esempio:

  • Le condivisioni file utente possono contenere molte copie dello stesso file o di file simili.
  • I guest di virtualizzazione possono essere quasi identici da una macchina virtuale a un'altra.
  • Gli snapshot di backup possono presentare differenze trascurabili tra un backup giornaliero e un altro.

Il risparmio di spazio ottenibile con la deduplicazione dei dati dipende dal set di dati o dal carico di lavoro del volume. I set di dati con duplicazione elevata potrebbero registrare percentuali di ottimizzazione fino al 95% o una riduzione di 20 volte dell'uso dello spazio di archiviazione. Nella tabella seguente sono illustrati i vantaggi in termini di risparmio di spazio offerti dalla deduplicazione per vari tipi di contenuto:

Scenario Contenuto Risparmio di spazio tipico
Documenti degli utenti Documenti aziendali, foto, musica, video e così via 30-50%
Condivisioni di distribuzione File binari del software, file CAB, simboli e così via 70-80%
Librerie di virtualizzazione File ISO, file disco rigido virtuale e così via 80-95%
Condivisioni file generali Tutte le risposte precedenti 50-60%

Nota

Se si vuole semplicemente liberare spazio in un volume, è consigliabile usare Sincronizzazione file di Azure con il cloud a livelli abilitato. Questa soluzione consente di memorizzare nella cache i file a cui si accede più di frequente in locale e di archiviare i file a cui si accede più raramente in livelli nel cloud, risparmiando spazio di archiviazione locale e garantendo al tempo stesso le prestazioni. Per informazioni dettagliate, vedere Pianificazione della distribuzione di Sincronizzazione file di Azure.

Quando è possibile usare Deduplicazione dati?

Illustrazione dello scenario Descrizione
Illustration of file servers. File server per utilizzo generico: i file server per utilizzo generico sono file server che possono contenere i tipi di condivisioni seguenti:
  • Condivisioni del team
  • Home directory utente
  • Cartelle di lavoro
  • Condivisioni per lo sviluppo del software
I file server per utilizzo generico sono buoni candidati per la deduplicazione dei dati, vista la tendenza degli utenti ad avere molte copie o versioni dello stesso file. Le condivisioni di sviluppo software possono trarre molti vantaggi dalla deduplicazione perché molti file binari restano sostanzialmente invariati da una build all'altra.
Illustration of VDI servers. Distribuzioni VDI (Virtual Desktop Infrastructure): i server VDI, ad esempio Servizi Desktop remoto, offrono alle organizzazioni un’opzione poco impegnativa per effettuare il provisioning di computer desktop per gli utenti. Esistono molti motivi per cui le organizzazioni si affidano a questa tecnologia:
  • Distribuzione di applicazioni: è possibile distribuire rapidamente le applicazioni nell'organizzazione. Ciò è molto utile quando si hanno applicazioni che vengono aggiornate di frequente, usate raramente o difficili da gestire.
  • Consolidamento delle applicazioni: quando si installano ed eseguono applicazioni da un set di macchine virtuali gestite centralmente, si elimina la necessità di aggiornare le applicazioni nei computer client. Questa opzione riduce anche la quantità di larghezza di banda necessaria per accedere alle applicazioni.
  • Accesso remoto: gli utenti possono accedere alle applicazioni aziendali da dispositivi quali computer di casa, chioschi multimediali, hardware a basso consumo e sistemi operativi diversi da Windows.
  • Accesso delle succursali: le distribuzioni VDI possono offrire prestazioni ottimizzate per i dipendenti delle succursali che necessitano dell'accesso agli archivi dati centralizzati. Le applicazioni a elevato uso di dati talvolta non hanno protocolli client/server ottimizzati per connessioni a bassa velocità.
Le distribuzioni VDI sono ottime candidate per la deduplicazione dei dati perché i dischi rigidi virtuali che consentono il funzionamento dei desktop remoti per gli utenti sono essenzialmente identici. La deduplicazione dei dati può essere utile anche per il cosiddetto boot storm della VDI, la riduzione delle prestazioni di archiviazione quando molti utenti eseguono l'accesso al desktop nello stesso momento, all'inizio della giornata.
Illustration of backup applications. Destinazioni di backup, come applicazioni di backup virtualizzate: le applicazioni di backup, ad esempio Microsoft Data Protection Manager (DPM), sono ottime candidate per la deduplicazione dei dati, vista la duplicazione significativa tra gli snapshot di backup.
Illustration of other workloads. Altri carichi di lavoro: anche altri carichi di lavoro possono essere adatti alla deduplicazione dei dati.