Condividi tramite


Panoramica sulla deduplicazione dei dati

Che cos’è la deduplicazione dei dati?

La deduplicazione dei dati, spesso chiamata "dedupe" in breve, è una funzione che può aiutare a ridurre l'impatto dei dati ridondanti sui costi di archiviazione. Quando è abilitata, la deduplicazione dei dati consente di ottimizzare lo spazio disponibile in un volume cercando parti duplicate nel volume stesso. Le parti duplicate del set di dati del volume vengono archiviate una sola volta e, facoltativamente, possono essere compresse per ottenere un risparmio di spazio aggiuntivo. La deduplicazione dei dati consente di ottimizzare le ridondanze senza compromettere la fedeltà o l'integrità dei dati. Altre informazioni su come funziona la deduplicazione dei dati sono disponibili in "Come funziona la deduplicazione dei dati?" sezione della pagina Informazioni sulla deduplicazione dei dati .

Importante

KB4025334 contiene un rollup di correzioni per deduplicazione dati, incluse importanti correzioni di affidabilità e si consiglia vivamente di installarla quando si usa Deduplicazione dati con Windows Server 2016 e Windows Server 2019.

Perché è utile la deduplicazione dei dati?

La deduplicazione dei dati consente agli amministratori di archiviazione di ridurre i costi associati alla duplicazione dei dati. I set di dati di grandi dimensioni hanno spesso molta duplicazione, aumentando così i costi di archiviazione dei dati. Ad esempio:

  • Le condivisioni file utente possono contenere molte copie dello stesso file o di file simili.
  • I guest di virtualizzazione possono essere quasi identici da una macchina virtuale a un'altra.
  • Gli snapshot di backup possono presentare differenze trascurabili tra un backup giornaliero e un altro.

Il risparmio di spazio ottenibile con la deduplicazione dei dati dipende dal set di dati o dal carico di lavoro del volume. I set di dati con duplicazione elevata potrebbero registrare percentuali di ottimizzazione fino al 95% o una riduzione di 20 volte dell'uso dello spazio di archiviazione. Nella tabella seguente sono illustrati i vantaggi in termini di risparmio di spazio offerti dalla deduplicazione per vari tipi di contenuto:

Sceneggiatura Contenuto Risparmio di spazio tipico
Documenti degli utenti Documenti aziendali, foto, musica, video e così via 30-50%
Condivisioni di distribuzione File binari del software, file CAB, simboli e altro 70-80%
Librerie di virtualizzazione File ISO, file disco rigido virtuale e così via 80-95%
Condivisione generale di file Tutte le opzioni sopra 50-60%

Nota

Se vuoi semplicemente liberare spazio su un volume, è consigliabile usare Sincronizzazione file di Azure con il tiering del cloud abilitato. Questa soluzione consente di memorizzare nella cache i file a cui si accede più di frequente in locale e di archiviare i file a cui si accede più raramente in livelli nel cloud, risparmiando spazio di archiviazione locale e garantendo al tempo stesso le prestazioni. Per informazioni dettagliate, vedere Pianificazione di una distribuzione di Sincronizzazione file di Azure.

Quando è possibile usare la deduplicazione dei dati?

Illustrazione dello scenario Descrizione
Illustrazione dei file server. File server per utilizzo generico: i file server per utilizzo generico sono file server che possono contenere uno dei tipi di condivisioni seguenti: I file server per utilizzo generico sono buoni candidati per la deduplicazione dei dati, vista la tendenza degli utenti ad avere molte copie o versioni dello stesso file. Le condivisioni di sviluppo software possono trarre molti vantaggi dalla deduplicazione perché molti file binari restano sostanzialmente invariati da una build all'altra.
Illustrazione dei server VDI. Distribuzioni VDI (Virtual Desktop Infrastructure): i server VDI, ad esempio Servizi Desktop remoto, offrono alle organizzazioni un'opzione leggera per il provisioning di desktop agli utenti. Esistono molti motivi per cui le organizzazioni si affidano a questa tecnologia:
  • Distribuzione di applicazioni: è possibile distribuire rapidamente le applicazioni nell'azienda. Ciò è molto utile quando si hanno applicazioni che vengono aggiornate di frequente, usate raramente o difficili da gestire.
  • Consolidamento delle applicazioni: quando si installano ed eseguono applicazioni da un set di macchine virtuali gestite centralmente, si elimina la necessità di aggiornare le applicazioni nei computer client. Questa opzione riduce anche la quantità di larghezza di banda necessaria per accedere alle applicazioni.
  • Accesso remoto: gli utenti possono accedere alle applicazioni aziendali da dispositivi come computer domestici, chioschi multimediali, hardware a basso consumo e sistemi operativi diversi da Windows.
  • Accesso alle succursali: le distribuzioni VDI possono offrire prestazioni migliori delle applicazioni per i lavoratori delle succursali che devono accedere agli archivi dati centralizzati. Le applicazioni a elevato uso di dati talvolta non hanno protocolli client/server ottimizzati per connessioni a bassa velocità.
Le distribuzioni VDI sono ottime candidate per la deduplicazione dei dati perché i dischi rigidi virtuali che consentono il funzionamento dei desktop remoti per gli utenti sono essenzialmente identici. Inoltre, la Deduplicazione dei dati può essere utile con il cosiddetto storm di avvio VDI, che è il calo delle prestazioni di archiviazione quando molti utenti si connettono simultaneamente ai propri desktop per iniziare la giornata.
Illustrazione delle applicazioni di backup. Le destinazioni di backup, ad esempio le applicazioni di backup virtualizzate: le applicazioni di backup, ad esempio Microsoft Data Protection Manager (DPM), sono ottimi candidati per la deduplicazione dei dati a causa della duplicazione significativa tra gli snapshot di backup.
Illustrazione di altri carichi di lavoro. Altri carichi di lavoro: altri carichi di lavoro possono anche essere candidati eccellenti per la deduplicazione dei dati.