Condividi tramite


Affidabilità in archiviazione su disco di Azure

archiviazione su disco di Azure fornisce dischi gestiti per le macchine virtuali di Azure. Progettato per carichi di lavoro cruciali, garantisce affidabilità e disponibilità di livello aziendale. I dati vengono replicati automaticamente per proteggersi dagli errori hardware, con più opzioni di ridondanza per soddisfare i requisiti di durabilità.

Quando si usa Azure, reliability è una responsabilità condivisa. Microsoft offre una gamma di funzionalità per supportare resilienza e ripristino. L'utente è responsabile della comprensione del funzionamento di tali funzionalità all'interno di tutti i servizi usati e della selezione delle funzionalità necessarie per soddisfare gli obiettivi aziendali e gli obiettivi di tempo di attività.

Questo articolo descrive come rendere archiviazione su disco di Azure resiliente a un'ampia gamma di potenziali interruzioni e problemi, tra cui errori temporanei, errori della zona di disponibilità e errori a livello di area. Descrive anche le opzioni di backup e ripristino ed evidenzia le informazioni chiave sul contratto di servizio archiviazione su disco di Azure.

Importante

Quando si considera l'affidabilità di un disco, è necessario considerare anche l'affidabilità delle macchine virtuali, dell'infrastruttura di rete e delle applicazioni eseguite nelle macchine virtuali. Il miglioramento della resilienza del disco da solo potrebbe avere un impatto limitato se gli altri componenti non sono ugualmente resilienti. A seconda dei requisiti di resilienza, potrebbe essere necessario apportare modifiche alla configurazione in più aree.

Raccomandazioni per la distribuzione di produzione

Il framework Azure Well-Architected offre raccomandazioni su affidabilità, prestazioni, sicurezza, costi e operazioni. Per comprendere in che modo queste aree influiscono tra loro e contribuiscono a una soluzione di archiviazione su disco di Azure affidabile, vedere Architecture consigliate per archiviazione su disco di Azure.

Panoramica dell'architettura di affidabilità

Ogni macchina virtuale usa dischi per scopi diversi:

  • Disco del sistema operativo: un singolo disco del sistema operativo esegue il sistema operativo. Per impostazione predefinita, si tratta di un disco gestito che rende persistenti i dati. È anche possibile usare dischi temporanei del sistema operativo, che non sono gestiti. Evitare di usare il disco del sistema operativo per archiviare applicazioni o dati.
  • Dischi dati: zero o più dischi gestiti per l'archiviazione di applicazioni e dati.
  • Disco temporaneo: disco non persistente non gestito incluso in ogni macchina virtuale.

Questa guida è in particolare incentrata sui dischi gestiti, che consentono di rendere persistenti i dati in modo affidabile. Per altre informazioni sui diversi ruoli del disco, vedere Ruoli del disco.

I dischi gestiti sono progettati per il 99,999% di disponibilità delle macchine virtuali e offrono almeno il 99.9999999999% (11 9) di durabilità. Con i dischi gestiti, i dati vengono replicati tre volte. Se una delle tre copie diventa non disponibile, Azure genera automaticamente una nuova copia dei dati in background. Questo garantisce la persistenza dei dati e una tolleranza elevata agli errori.

Per impostazione predefinita, i dischi gestiti usano l'archiviazione con ridondanza locale. LRS mantiene tre copie dei dati del disco all'interno di un singolo data center, proteggendo da guasti hardware, come problemi dell'unità disco o del rack del server.

Anche se l'archiviazione con ridondanza locale (LRS) protegge i dischi da errori di rack e unità del server, non prende in considerazione disastri come incendi o allagamenti all'interno di un datacenter. Per livelli di protezione più elevati, usare Archiviazione con Ridondanza della Zona (ZRS), che replica i dischi in più zone di disponibilità.

Per le applicazioni in esecuzione in più macchine virtuali, più macchine virtuali hanno il contratto di servizio di disponibilità più elevato quando viene distribuito tra più zone di disponibilità. Per le macchine virtuali e i dischi distribuiti tra più zone di disponibilità, i dischi e le macchine virtuali padre vengono posizionati rispettivamente nella stessa zona, il che impedisce l'interruzione di più macchine virtuali anche in caso di interruzione di un'intera zona.

Quando le zone non sono disponibili o il carico di lavoro è sensibile alla latenza tra macchine virtuali, distribuire macchine virtuali e dischi in più domini di guasto. I domini di errore non forniscono ridondanza della zona, ma riducono l'impatto di errori hardware, interruzioni della rete o interruzioni dell'alimentazione. In questo modo si impedisce il guasto di più macchine virtuali in caso di malfunzionamento di un dominio di errore di archiviazione.

Resilienza a errori temporanei

Gli errori temporanei sono errori brevi e intermittenti nei componenti. Si verificano spesso in un ambiente distribuito come il cloud e fanno parte delle normali operazioni. Gli errori temporanei si correggono dopo un breve periodo di tempo. È importante che le applicazioni possano gestire gli errori temporanei, in genere ritentando le richieste interessate.

Tutte le applicazioni ospitate nel cloud devono seguire le linee guida per la gestione degli errori temporanei Azure quando comunicano con qualsiasi API, database e altri componenti ospitati nel cloud. Per altre informazioni, vedere Raccomandazioni per la gestione degli errori temporanei.

I dischi gestiti vengono ripristinati automaticamente da errori temporanei nell'infrastruttura di Azure.

Resilienza ai guasti delle zone di disponibilità

Zone di disponibilità sono gruppi fisicamente separati di data center all'interno di un'area Azure. In caso di guasto in una zona, i servizi possono passare a una delle zone restanti.

Esistono due modi per usare le zone di disponibilità con dischi gestiti:

  • È possibile distribuire un disco con ridondanza della zona, che si trova in tre zone di disponibilità in una regione. Per ottenere un'affidabilità ottimale, è consigliabile usare dischi ZRS poiché offrono resilienza automatica della zona.
  • È possibile distribuire un disco LRS zonale, che è limitato a una singola zona. Con i dischi LRS zonali, è necessario configurare il carico di lavoro per essere resiliente alle interruzioni zonali. Per fare ciò, distribuisci più macchine virtuali e dischi e spargili tra le zone di disponibilità.

Se non si configura il supporto per la zona di disponibilità, il disco è non zonale o regionale e può essere posizionato in qualsiasi zona di disponibilità nella regione. Questi dischi sono considerati LRS perché vengono replicati all'interno dell'area.

Dischi con ridondanza zonale

L'archiviazione ridondante per zona replica sincronicamente i dati in tre zone di disponibilità all'interno di una regione. Quando si abilita la ridondanza della zona per un disco gestito, Azure garantisce che un errore in qualsiasi singola zona non influisca sulla disponibilità dei dati.

Diagramma di un disco a ridondanza di zona, con le relative repliche distribuite in tre zone di disponibilità nella regione.

I dischi ZRS possono essere condivisi tra macchine virtuali per migliorare la disponibilità di applicazioni in cluster o distribuite, come SQL FCI, SAP ASCS/SCS o GFS2. È possibile collegare un disco ZRS condiviso a macchine virtuali primarie e secondarie in zone diverse, sfruttando sia i dischi ZRS che le macchine virtuali distribuite tra più zone di disponibilità. Se la zona primaria ha esito negativo, è possibile eseguire rapidamente il failover nella macchina virtuale secondaria usando una prenotazione permanente SCSI.

Se un disco ZRS è collegato come disco dati a una singola macchina virtuale in una zona che ha smesso di funzionare, puoi forzare lo scollegamento del disco dalla macchina virtuale guasta e connetterlo a un'altra macchina virtuale.

Requisiti

  • Supporto per le regioni: Per un elenco delle regioni che supportano i dischi gestiti ZRS, vedere le opzioni di ridondanza per i dischi gestiti.

  • Tipi di disco: I dischi con ridondanza della zona sono supportati con dischi gestiti SSD Premium e SSD Standard. La ZRS (Zone Redundant Storage) non è supportata con SSD Premium v2, Ultra Disks o dischi gestiti HDD Standard.

Cost

L'archiviazione ZRS comporta un costo più elevato rispetto all'archiviazione con ridondanza locale (LRS) a causa del sovraccarico di replica aggiuntivo e dell'infrastruttura necessari per gestire i dati in più zone. La differenza esatta dei costi varia in base all'area e al tipo di disco. Per informazioni dettagliate sui prezzi, vedere Azure prezzi del disco gestito.

Configurare il supporto delle zone di disponibilità

  • Creare un nuovo disco ZRS: Per creare un nuovo disco ZRS gestito, consultare il Tutorial - Gestire i dischi Azure con l'interfaccia della riga di comando di Azure per le macchine virtuali Linux, oppure il Tutorial: Gestire i dischi con Azure PowerShell per le macchine virtuali Windows. Selezionare un livello disco ZRS alla creazione del disco.

    L'utente è responsabile del collegamento del disco alle macchine virtuali, inclusa la configurazione di dischi condivisi in più macchine virtuali in zone diverse, se appropriato per il carico di lavoro.

  • Modificare un disco esistente per usare l'archiviazione con ridondanza della zona: È possibile convertire un disco non a livello di area esistente in archiviazione con ridondanza della zona.

    Anche se non è possibile convertire un disco LRS zonale in archiviazione ZRS, è possibile creare un nuovo disco ZRS da uno snapshot. Vedere Convertire un disco dall'archiviazione con ridondanza locale all'archiviazione con ridondanza della zona per informazioni dettagliate sulle procedure e i requisiti di migrazione.

  • Disabilitare il supporto della zona di disponibilità: Non è possibile modificare la configurazione della zona di disponibilità di un disco ZRS esistente. È invece necessario creare un nuovo disco con la nuova configurazione usando uno snapshot del disco precedente ed eliminare quello precedente.

Comportamento quando tutte le zone sono integre

Questa sezione descrive cosa aspettarsi quando i dischi gestiti sono configurati per l'uso di ZRS e tutte le zone di disponibilità sono in funzione.

  • Operazione tra zone: Azure gestisce automaticamente il routing del traffico tra le zone di disponibilità quando si usa una macchina virtuale con un disco a ridondanza di zona. Durante le normali operazioni, le richieste vengono distribuite in modo trasparente tra le zone.

  • Replica dei dati tra zone: I dischi ZRS replicano ogni scrittura in modo sincrono in più zone di disponibilità nella regione. Un'operazione di scrittura viene completata solo dopo che i dati vengono archiviati in cluster in più zone. Questo approccio offre coerenza assoluta e disponibilità elevata, ma può introdurre una latenza di scrittura leggermente superiore rispetto ai dischi con ridondanza locale.

Comportamento durante un errore di zona

Questa sezione descrive cosa aspettarsi quando un disco gestito è configurato per utilizzare l'archiviazione con ridondanza di zona (ZRS) e si verifica un'interruzione della zona di disponibilità.

  • Rilevamento e risposta: Alcune interruzioni della zona potrebbero influire solo su dischi, solo macchine virtuali o entrambi. Il comportamento che si osserverà dipende dal fatto che l'interruzione della zona influisca sulla macchina virtuale collegata al disco.

    Se la macchina virtuale rimane integra ma il disco è interessato dall'interruzione, la macchina virtuale continua a funzionare. Microsoft reindirizza automaticamente le operazioni su disco per lavorare sui dati nelle zone di disponibilità integre e non è necessario eseguire alcuna operazione.

    Se la macchina virtuale è inattiva, è necessario passare il carico di lavoro a un'altra macchina virtuale in una zona di disponibilità diversa.

    • Dischi condivisi: Se la macchina virtuale secondaria è già stata creata in una zona diversa e sono stati configurati dischi condivisi, il disco è disponibile per la macchina virtuale secondaria da usare senza modifiche di configurazione necessarie.

    • Dischi non condivisi: È possibile forzare lo scollegamento del disco dalla VM guasta e quindi collegarlo a una macchina virtuale in una zona funzionante. Per eseguire un distacco forzato:

      • interfaccia della riga di comando di Azure: Usare il comando az vm disk detach con l'argomento --force-detach.
      • Azure PowerShell: usare il cmdlet Remove-AzVMDataDisk con l'argomento -ForceDetach.
  • Notification: Microsoft non invia automaticamente una notifica quando una zona è inattiva. È tuttavia possibile usare Azure Integrità risorse per monitorare l'integrità di una singola risorsa ed è possibile configurare Integrità risorse avvisi per segnalare eventuali problemi. È anche possibile usare integrità dei servizi di Azure per comprendere l'integrità complessiva del servizio, inclusi eventuali errori di zona, ed è possibile configurare gli avvisi di integrità Servizi per notificare i problemi.
  • Perdita di dati prevista: Non si verifica alcuna perdita di dati durante i guasti della zona.

  • Tempo di inattività previsto: Quando il disco viene condiviso tra più macchine virtuali, non è previsto alcun tempo di inattività.

  • Redistribuzione: Azure reindirizza automaticamente il traffico a un'altra copia del tuo disco in una zona sana.

Ripristino della zona

Azure rileva automaticamente quando la zona precedentemente non riuscita è integra e ripristina la sincronizzazione dei dati nella zona ripristinata.

Dischi LRS zonali

I dischi LRS zonali risiedono in una zona di disponibilità specifica e si collegano solo alle VM in tale zona. Tutte le copie dei dati del disco si trovano nella stessa zona. Un singolo disco LRS zonale e una macchina virtuale zonale non garantiscono la resilienza zonale. Se si verifica un'interruzione nella zona contenente il disco, il disco potrebbe diventare non disponibile.

Diagramma che illustra un disco LRS zonale, con tutte le sue repliche in una singola zona di disponibilità.

Per i carichi di lavoro con più macchine virtuali, è possibile ottenere la resilienza della zona distribuendo più macchine virtuali e i dischi di archiviazione con ridondanza locale di zona in zone di disponibilità diverse. Questo approccio è il modo più comune per ottenere la disponibilità elevata per carichi di lavoro come server Web, livelli applicazione e cluster di database. Se una zona non riesce, è possibile configurare il carico di lavoro per garantire il funzionamento continuo usando le macchine virtuali in zone funzionanti.

Diagramma che mostra tre macchine virtuali in zone diverse, ciascuna con il proprio disco LRS zonale.

Questo modello di distribuzione a più zone funziona con tutti i tipi di disco, inclusi i dischi SSD Premium v2 e Ultra, che supportano solo l'archiviazione con ridondanza locale. Per altre informazioni su questo approccio, vedere Distribuire macchine virtuali e dischi tra zone di disponibilità.

Requisiti

Cost

I dischi Zonal LRS vengono addebitati alla stessa tariffa dei dischi non zonali. Per informazioni dettagliate sui prezzi, vedere Azure prezzi del disco gestito.

Configurare il supporto delle zone di disponibilità

  • Creare un nuovo disco con supporto per la zona di disponibilità: Per creare un nuovo disco gestito con ridondanza LRS zonale, vedere Tutorial - Gestire dischi Azure con interfaccia della riga di comando di Azure per le macchine virtuali Linux o Tutorial: Gestire i dischi con Azure PowerShell per le macchine virtuali Windows.

    Selezionare la zona di disponibilità durante la creazione del disco.

    Importante

    Si consiglia di limitarsi a una singola zona di disponibilità solo quando la latenza inter-zona è troppo elevata per le proprie esigenze e dopo aver verificato che la latenza effettivamente non soddisfi i requisiti. Di per sé, una risorsa di zona non fornisce resilienza a un'interruzione della zona di disponibilità. Per migliorare la resilienza di una risorsa di zona, è necessario distribuire in modo esplicito risorse separate in più zone di disponibilità e configurare il routing e il failover del traffico. Per altre informazioni, vedere Risorse di zona e resilienza della zona.

  • Modificare la configurazione della zona di disponibilità di un disco esistente: Non è possibile modificare la configurazione della zona di disponibilità di un disco LRS di zona esistente. È invece necessario creare un nuovo disco con la nuova configurazione usando uno snapshot del disco precedente ed eliminare quello precedente.

Comportamento quando tutte le zone sono integre

Questa sezione descrive cosa aspettarsi quando un disco gestito è configurato per l'uso dell'archiviazione con ridondanza locale di zona e tutte le zone di disponibilità sono operative.

  • Operazione tra zone: Il traffico tra una macchina virtuale di zona e un disco di archiviazione con ridondanza locale di zona nella stessa zona rimane all'interno della zona di disponibilità.

    Quando si distribuiscono più macchine virtuali tra zone, si è responsabili della distribuzione delle richieste in ingresso tra le macchine virtuali. Ogni macchina virtuale legge e scrive nel proprio disco di zona.

  • Replica dei dati tra zone: Tutte le operazioni di scrittura nei dischi di archiviazione con ridondanza locale di zona vengono replicate in modo sincrono all'interno della zona di disponibilità.

    Quando si distribuiscono più macchine virtuali tra zone, se il carico di lavoro richiede la coerenza dei dati tra le macchine virtuali, si è responsabili della sincronizzazione dei dati, ad esempio usando la replica del database o la replica a livello di applicazione.

Comportamento durante un errore di zona

Questa sezione descrive cosa aspettarsi quando un disco gestito è configurato per l'uso di LRS zonale e in caso di un'interruzione della zona di disponibilità.

  • Rilevamento e risposta: Se si dispone di una singola macchina virtuale con un disco LRS zonale, si è responsabili del rilevamento di un'interruzione di zona e dell'attivazione di un failover o di un'altra risposta.

    Quando le macchine virtuali sono distribuite tra più zone, si è responsabili della configurazione del carico di lavoro per rilevare il guasto della zona e continuare a operare nelle macchine virtuali nelle zone integre.

  • Notification: Microsoft non invia automaticamente una notifica quando una zona è inattiva. È tuttavia possibile usare Azure Integrità risorse per monitorare l'integrità di una singola risorsa ed è possibile configurare Integrità risorse avvisi per segnalare eventuali problemi. È anche possibile usare integrità dei servizi di Azure per comprendere l'integrità complessiva del servizio, inclusi eventuali errori di zona, ed è possibile configurare gli avvisi di integrità Servizi per notificare i problemi.
  • Perdita di dati prevista: La replica con ridondanza locale (LRS) garantisce almeno il 99,999999999% (11 nove) di affidabilità, il che significa che il disco conserva i dati e questi possono essere recuperati dopo il ripristino della zona.

    Quando si dispone di macchine virtuali distribuite tra zone, tutti i dati che si trovavano solo sui dischi nella zona di errore non sono temporaneamente disponibili. Se l'applicazione sincronizza i dati tra macchine virtuali, le macchine virtuali nelle zone integre continuano a gestire le richieste usando i propri dati.

  • Tempo di inattività previsto: Un singolo disco LRS zonale non è disponibile fino al ripristino della zona di disponibilità.

    Quando si dispone di macchine virtuali e dischi distribuiti tra zone, il carico di lavoro può continuare a funzionare sulle macchine virtuali in zone integre.

  • Ridistribuzione: Se si dispone di una singola macchina virtuale con un disco con LRS zonale, si è responsabili del reindirizzamento del traffico a un'altra macchina virtuale, se disponibile.

    Quando le macchine virtuali sono distribuite tra zone, è possibile configurare il carico di lavoro per ridistribuire automaticamente il traffico alle macchine virtuali in zone integre.

Ripristino della zona

Quando la zona di disponibilità non riuscita viene ripristinata, i dischi gestiti vengono ripristinati automaticamente. Se la macchina virtuale collegata al disco è stata interessata dall'interruzione, viene riavviata. L'utente è responsabile della risincronizzazione dei dati dell'applicazione in altre macchine virtuali e dischi in altre zone di disponibilità, se vengono usati.

Verifica dei guasti di zona

Non è possibile simulare direttamente gli errori di zona a livello di disco, ma è possibile usare il supporto di Azure Chaos Studio per simulare eventi di inattività della zona in set di scalabilità di macchine virtuali e simulando la perdita di una singola macchina virtuale.

È consigliabile testare la resilienza dell'applicazione in caso di errori della zona e il comportamento del disco gestito durante le interruzioni. Monitorare le prestazioni del disco durante le interruzioni della zona simulate e verificare che le applicazioni gestiscano in modo appropriato una maggiore latenza. Implementare scenari di test automatizzati che verificano che le applicazioni possano gestire ritardi di I/O temporanei e forzare le operazioni di scollegamento per i dischi condivisi.

Resilienza agli errori a livello di area

archiviazione su disco di Azure è un servizio a singola area che opera entro i limiti di un'area Azure specifica. Il servizio non offre funzionalità native multiregione o failover automatico tra regioni. Se un'area non è più disponibile, anche le risorse del disco gestito in tale area non sono disponibili.

Soluzioni personalizzate in più aree per la resilienza

È possibile creare una soluzione in più aree distribuendo macchine virtuali e dischi in ogni area, replicando o eseguendo il backup dei dati tra aree e eseguendo il failover o il ripristino da backup quando necessario. Si è responsabili della gestione delle risorse in ogni area, del coordinamento e della sincronizzazione dei dati e della gestione del failover o del ripristino. Alcuni approcci comuni includono:

Backup e ripristino

Azure i dischi gestiti supportano più approcci di backup per proteggersi dalla perdita e dal danneggiamento dei dati. Azure Backup del disco è una soluzione nativa basata sul cloud che automatizza la gestione del ciclo di vita degli snapshot. Offre backup incrementali compatibili con i crash con politiche di conservazione configurabili. Questo approccio senza agente supporta più backup al giorno senza influire sulle prestazioni dell'applicazione e si integra con Backup di Azure Center per la gestione centralizzata. È possibile usare snapshot incrementali per ridurre i costi di archiviazione e i tempi di backup.

Per la protezione a livello di VM, Backup di Azure offre backup coerenti con l'applicazione per l'intera macchina virtuale, inclusi tutti i dischi collegati. Questo approccio è ideale quando è necessario eseguire il backup coordinato di più dischi o backup in grado di supportare le applicazioni. Per i carichi di lavoro del database, prendere in considerazione soluzioni di backup specifiche dell'applicazione che offrono una protezione coerente con le transazioni e opzioni di ripristino più veloci.

Per i carichi di lavoro critici, implementare una strategia di backup a più livelli combinando Azure Backup del disco, la replica di snapshot tra aree e i backup a livello di applicazione per la coerenza delle transazioni. Configurare i criteri di backup in base ai requisiti di ripristino, alle esigenze di conformità e alle considerazioni sui costi.

Contratto di servizio

Il contratto di servizio (SLA) per Azure servizi descrive la disponibilità prevista di ogni servizio e le condizioni che la soluzione deve soddisfare per ottenere tale aspettativa di disponibilità. Per ulteriori informazioni, vedere Accordi sul livello di servizio (SLA) per i servizi online.

archiviazione su disco di Azure non fornisce un contratto di servizio per la disponibilità, ma è incluso nel contratto di servizio per le macchine virtuali. La configurazione del disco può influire sul contratto di servizio di disponibilità della macchina virtuale.