Panoramica di Deduplicazione dati

Si applica a: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, versioni 21H2 e 20H2

Che cos’è la deduplicazione dei dati?

Deduplicazione dati, spesso denominata Dedup per brevità, è una funzionalità che consente di ridurre l'impatto dei dati ridondanti sui costi di archiviazione. Quando è abilitata, la deduplicazione dei dati consente di ottimizzare lo spazio disponibile in un volume cercando parti duplicate nel volume stesso. Le parti duplicate del set di dati del volume vengono archiviate una sola volta e, facoltativamente, possono essere compresse per ottenere un risparmio di spazio aggiuntivo. La deduplicazione dei dati consente di ottimizzare le ridondanze senza compromettere la fedeltà o l'integrità dei dati. Per altre informazioni sul funzionamento della deduplicazione dei dati, vedere la sezione How does Data Deduplication work? (Come funziona la deduplicazione dei dati?) della pagina Understanding Data Deduplication (Informazioni sulla deduplicazione dei dati).

Importante

KB4025334 contiene un rollup di correzioni per deduplicazione dati, incluse importanti correzioni di affidabilità, ed è consigliabile installarlo quando si usa deduplicazione dati con Windows Server 2016 e Windows Server 2019.

Perché è utile la deduplicazione dei dati?

La deduplicazione dei dati consente agli amministratori di archiviazione di ridurre i costi associati alla duplicazione dei dati. I set di dati di grandi dimensioni hanno spesso una grande duplicazione, che aumenta i costi di archiviazione dei dati. Ad esempio:

  • Le condivisioni file utente possono contenere molte copie dello stesso file o di file simili.
  • I guest di virtualizzazione possono essere quasi identici da una macchina virtuale a un'altra.
  • Gli snapshot di backup possono presentare differenze trascurabili tra un backup giornaliero e un altro.

Il risparmio di spazio ottenibile con la deduplicazione dei dati dipende dal set di dati o dal carico di lavoro del volume. I set di dati con duplicazione elevata potrebbero registrare percentuali di ottimizzazione fino al 95% o una riduzione di 20 volte dell'uso dello spazio di archiviazione. Nella tabella seguente sono illustrati i vantaggi in termini di risparmio di spazio offerti dalla deduplicazione per vari tipi di contenuto:

Scenario Content Risparmio di spazio tipico
Documenti degli utenti Documenti aziendali, foto, musica, video e così via 30-50%
Condivisioni di distribuzione File binari del software, file CAB, simboli e così via 70-80%
Librerie di virtualizzazione File ISO, file disco rigido virtuale e così via 80-95%
Condivisioni file generali Tutte le opzioni precedenti 50-60%

Nota

Se si sta solo cercando di liberare spazio in un volume, è consigliabile usare Sincronizzazione file di Azure con cloud a livelli abilitato. In questo modo è possibile memorizzare nella cache i file a cui si accede più di frequente in locale e livelli i file a cui si accede meno frequentemente al cloud, risparmiando spazio di archiviazione locale mantenendo al tempo stesso le prestazioni. Per informazioni dettagliate, vedere Pianificazione di una distribuzione di Sincronizzazione file di Azure.

Quando è possibile usare la deduplicazione dei dati?

Illustrazione dello scenario Descrizione
Illustration of file servers. File server per utilizzo generico: i file server per utilizzo generico sono file server che possono contenere uno dei tipi di condivisioni seguenti:
  • Condivisioni del team
  • Home directory utente
  • Cartelle di lavoro
  • Condivisioni per lo sviluppo di software
I file server per utilizzo generico sono buoni candidati per la deduplicazione dei dati, vista la tendenza degli utenti ad avere molte copie o versioni dello stesso file. Le condivisioni di sviluppo software possono trarre molti vantaggi dalla deduplicazione perché molti file binari restano sostanzialmente invariati da una build all'altra.
Illustration of VDI servers. distribuzioni Virtual Desktop Infrastructure (VDI): i server VDI, ad esempio Servizi Desktop remoto, offrono alle organizzazioni un'opzione semplificata per il provisioning dei desktop agli utenti. Esistono molti motivi per cui le organizzazioni si affidano a questa tecnologia:
  • Distribuzione di applicazioni: è possibile distribuire rapidamente le applicazioni nell'azienda. Ciò è molto utile quando si hanno applicazioni che vengono aggiornate di frequente, usate raramente o difficili da gestire.
  • Consolidamento delle applicazioni: quando si installano ed eseguono applicazioni da un set di macchine virtuali gestite centralmente, si elimina la necessità di aggiornare le applicazioni nei computer client. Questa opzione riduce anche la quantità di larghezza di banda necessaria per accedere alle applicazioni.
  • Accesso remoto: gli utenti possono accedere alle applicazioni aziendali da dispositivi come computer domestici, chioschi multimediali, hardware a basso consumo e sistemi operativi diversi da Windows.
  • Accesso alle succursali: le distribuzioni VDI possono offrire prestazioni migliori delle applicazioni per i lavoratori delle succursali che devono accedere agli archivi dati centralizzati. Le applicazioni a elevato uso di dati talvolta non hanno protocolli client/server ottimizzati per connessioni a bassa velocità.
Le distribuzioni VDI sono ottime candidate per la deduplicazione dei dati perché i dischi rigidi virtuali che consentono il funzionamento dei desktop remoti per gli utenti sono essenzialmente identici. La deduplicazione dei dati può essere utile anche per il cosiddetto boot storm della VDI, la riduzione delle prestazioni di archiviazione quando molti utenti eseguono l'accesso al desktop nello stesso momento, all'inizio della giornata.
Illustration of backup applications. Le destinazioni di backup, ad esempio le applicazioni di backup virtualizzate: le applicazioni di backup, ad esempio Microsoft Data Protection Manager (DPM), sono ottimi candidati per deduplicazione dati a causa della duplicazione significativa tra gli snapshot di backup.
Illustration of other workloads. Altri carichi di lavoro: altri carichi di lavoro possono anche essere candidati eccellenti per la deduplicazione dei dati.