Condividi tramite


Affidabilità in Azure NetApp Files

Questo articolo descrive il supporto per l'affidabilità in Azure NetApp Files, che copre la resilienza all'interno dell'area tramite zone di disponibilità e distribuzioni in più aree.

Quando si usa Azure, l'affidabilità è una responsabilità condivisa. Microsoft offre una gamma di funzionalità per supportare la resilienza e il ripristino. L'utente è responsabile della comprensione del funzionamento di tali funzionalità all'interno di tutti i servizi usati e della selezione delle funzionalità necessarie per soddisfare gli obiettivi aziendali e gli obiettivi di tempo di attività.

Azure NetApp Files è una soluzione di archiviazione file nativa di livello aziendale che si integra perfettamente in Azure e consente la condivisione di file tra i client tramite protocolli NFS (Network File System) e Server Message Block (SMB). Azure NetApp Files è progettato per prestazioni elevate e offre un'archiviazione file scalabile e sicura gestita come servizio.

Per usare Azure NetApp Files, è necessario configurare un account NetApp contenente pool di capacità che ospitano volumi. È possibile configurare capacità e velocità effettiva in modo indipendente e gestire le opzioni di protezione dei dati che soddisfano diverse esigenze. È possibile abilitare la replica tra volumi, anche se si trovano in posizioni diverse.

Raccomandazioni per la distribuzione di produzione

Per informazioni su come distribuire Azure NetApp Files per supportare i requisiti di affidabilità della soluzione e su come l'affidabilità influisce su altri aspetti dell'architettura, vedere Procedure consigliate per l'architettura per Azure NetApp Files in Well-Architected Framework di Azure.

Errori temporanei

Gli errori temporanei sono errori brevi e intermittenti nei componenti. Si verificano spesso in un ambiente distribuito come il cloud e fanno parte delle normali operazioni. Gli errori temporanei si correggono dopo un breve periodo di tempo. È importante che le applicazioni possano gestire gli errori temporanei, in genere ritentando le richieste interessate.

Tutte le applicazioni ospitate nel cloud devono seguire le indicazioni sulla gestione degli errori temporanei di Azure quando comunicano con qualsiasi API, database e altri componenti ospitati nel cloud. Per altre informazioni, vedere Consigli per la gestione degli errori temporanei.

Oltre ai tipi di errore temporanei che possono influire su qualsiasi soluzione basata sul cloud, la manutenzione pianificata occasionale, ad esempio gli aggiornamenti della piattaforma, gli aggiornamenti del servizio e gli aggiornamenti software, può influire anche su Azure NetApp Files.

Dal punto di vista di un protocollo di file, come NFS e SMB, gli errori temporanei non causano interruzioni se l'applicazione può gestire le pause di input/output (I/O) che potrebbero verificarsi durante questi eventi. Le pause di I/O sono in genere brevi, e variando da pochi secondi a 30 secondi. Alcune applicazioni potrebbero richiedere l'ottimizzazione per gestire le pause di I/O.

Il protocollo NFS è affidabile e le operazioni sui file del server client in genere continuano normalmente. Alcune applicazioni potrebbero richiedere l'ottimizzazione per gestire le pause di I/O fino a 30-45 secondi. Assicurarsi di conoscere le impostazioni di resilienza dell'applicazione per gestire gli eventi di manutenzione del servizio di archiviazione.

Per le applicazioni interattive che usano il protocollo SMB, le impostazioni del protocollo standard sono in genere sufficienti. Azure NetApp Files supporta anche la disponibilità continua SMB, che consente il failover trasparente SMB. Il failover trasparente SMB elimina le interruzioni causate dagli eventi di manutenzione del servizio. Migliora anche l'affidabilità e l'esperienza utente.

La disponibilità continua SMB è disponibile solo per applicazioni specifiche.

Per altre raccomandazioni, vedere Domande frequenti sulla resilienza delle applicazioni per Azure NetApp Files.

Supporto della zona di disponibilità

Le zone di disponibilità sono gruppi di data center separati fisicamente all'interno di un'area di Azure. In caso di guasto in una zona, i servizi possono passare a una delle zone restanti.

Azure NetApp Files supporta distribuzioni di volumi a livello di zona. Usare la funzionalità di posizionamento del volume della zona di disponibilità in Azure NetApp Files per distribuire ogni volume in una singola zona di disponibilità a scelta. È possibile usare questa funzionalità solo se Azure NetApp Files è presente in tale zona di disponibilità e ha capacità sufficiente. Se si dispone di applicazioni sensibili alla latenza, è possibile distribuire un volume nella stessa zona di disponibilità delle risorse di calcolo di Azure e di altri servizi.

Nel diagramma seguente, le frecce arancioni con punte di freccia solide rappresentano come tutte le macchine virtuali (VM) all'interno della regione nelle reti virtuali connesse con peering possano accedere a tutte le risorse di Azure NetApp Files. Le frecce verdi rappresentano il modo in cui le macchine virtuali che accedono ai volumi di Azure NetApp Files nella stessa zona condividono il dominio di errore della zona di disponibilità. Non esiste alcuna replica tra i diversi volumi a livello di piattaforma.

Diagramma che mostra il posizionamento del volume della zona di disponibilità di Azure NetApp Files.

Il diagramma mostra tre zone di disponibilità in un'area di Azure. Le frecce arancioni con frecce continue connettono icone che rappresentano le macchine virtuali e le risorse di Azure NetApp Files tra le zone di disponibilità. Le frecce verdi connettono le macchine virtuali e i volumi di Azure NetApp Files nella stessa zona di disponibilità.

Una distribuzione a zona singola non è sufficiente per soddisfare i requisiti di affidabilità elevata. Per replicare in modo asincrono i dati tra volumi in zone di disponibilità diverse, è possibile usare la replica tra zone. È necessario configurare la replica tra zone separatamente dal posizionamento del volume della zona di disponibilità.

Se una zona di disponibilità ha esito negativo, si è responsabili del rilevamento dell'errore e del passaggio a un volume alternativo in una zona diversa.

Supporto di area

La replica tra zone è disponibile in tutte le aree abilitate per la zona di disponibilità che supportano Azure NetApp Files.

Considerazioni

  • Il posizionamento del volume della zona di disponibilità in Azure NetApp Files offre il posizionamento del volume di zona. Si noterà una bassa latenza quando ci si connette alle macchine virtuali all'interno della stessa zona di disponibilità. Tuttavia, il posizionamento del volume della zona di disponibilità non fornisce posizionamento di prossimità con macchine virtuali o altre risorse e il volume potrebbe trovarsi in una parte fisica diversa del data center.

  • La replica è consentita tra sottoscrizioni di Azure diverse solo se si trovano nello stesso tenant di Microsoft Entra.

  • Per altre considerazioni sulle zone di disponibilità in Azure NetApp Files, vedere Requisiti e considerazioni per l'uso della replica tra zone e Gestire il posizionamento del volume della zona di disponibilità.

Costo

Non sono previsti costi aggiuntivi per abilitare il posizionamento del volume della zona di disponibilità in Azure NetApp Files. Si pagano solo i pool di capacità e le risorse distribuiti all'interno di queste zone.

I volumi replicati sono ospitati in un pool di capacità. Il costo per la replica tra zone si basa sulle dimensioni e sul livello del pool di capacità di cui è stato effettuato il provisioning. Non sono previsti costi aggiuntivi per la replica dei dati.

Configurare il supporto delle zone di disponibilità

È necessario configurare separatamente il posizionamento del volume e la replica tra zone.

Operazioni normali

Questa sezione descrive cosa aspettarsi quando più volumi di Azure NetApp Files vengono distribuiti in zone di disponibilità separate, la replica tra zone è abilitata e tutte le zone di disponibilità sono operative.

  • Routing del traffico tra zone: Le richieste in ingresso vengono instradate al volume specifico, che si trova nella zona di disponibilità selezionata.

  • Replica dei dati tra zone: la replica tra zone di Azure NetApp Files significa che tutte le modifiche apportate al volume di origine vengono replicate in modo asincrono nei volumi di destinazione. È possibile decidere con quale frequenza viene eseguita la replica. La replica tra zone supporta tre pianificazioni di replica: ogni 10 minuti, ogni ora e ogni giorno.

    Importante

    La pianificazione della replica di 10 minuti non è supportata per volumi di grandi dimensioni che usano la replica tra zone.

Esperienza di riduzione della zona

Questa sezione descrive cosa aspettarsi quando più volumi di Azure NetApp Files vengono distribuiti in zone di disponibilità separate, la replica tra zone è abilitata e si verifica un'interruzione della zona di disponibilità.

  • Rilevamento e risposta: si è responsabili del rilevamento della perdita di una zona di disponibilità e dell'avvio di un failover.

    Per monitorare l'integrità del volume di Azure NetApp Files, è possibile usare le metriche di Monitoraggio di Azure. Azure Monitor rileva eventuali anomalie che indicano uno scenario di zona inattiva tramite metriche in tempo reale, come operazioni di input/output al secondo (IOPS), latenza e utilizzo della capacità. È possibile configurare avvisi e notifiche da inviare agli amministratori in modo che possano rispondere immediatamente ribilanciando condivisioni file o avviando il failover o altri protocolli di ripristino di emergenza.

    Il failover è un processo manuale. Quando è necessario attivare il volume di destinazione, ad esempio quando si desidera eseguire il failover nella zona di disponibilità di destinazione, è necessario interrompere il peering di replica e montare il volume di destinazione. Per ulteriori informazioni, consultare failover al volume di destinazione.

  • Richieste attive: durante un evento di arresto della zona, le richieste attive possono riscontrare interruzioni o latenze maggiori.

  • Perdita di dati prevista: La quantità di perdita di dati o l'obiettivo del punto di ripristino (RPO), che è possibile prevedere durante un failover di zona dipende dalla pianificazione della replica tra zone configurata.

    Pianificazione di replica RPO tipico
    Ogni 10 minuti 20 minuti
    Su base oraria Due ore
    Ogni giorno Meno di 48 ore
  • Tempo di inattività previsto: il failover in un'altra zona richiede l'interruzione della relazione di peering per attivare il volume di destinazione e fornire l'accesso ai dati in lettura e scrittura nel secondo sito. Dopo aver attivato l’interruzione del peering, è previsto che il failover venga completato entro un minuto.

    Tuttavia, la quantità totale di tempo di inattività o l'obiettivo del tempo di ripristino (RTO), che è possibile prevedere durante un failover di zona dipende da più fattori, tra cui il tempo necessario per i sistemi o i processi per rilevare la perdita della zona e avviare i processi di failover. È anche importante decidere se automatizzare la risposta o se sono necessari passaggi manuali. Per le configurazioni ben preparate, il processo complessivo richiede in genere da alcuni minuti a un'ora per il completamento.

  • Reindirizzamento del traffico: l'utente è responsabile del reindirizzamento del traffico dell'applicazione per connettersi al nuovo volume di destinazione attivo. Per ulteriori informazioni, consultare failover al volume di destinazione.

Ripristino della zona

Il failback è un processo manuale che richiede di eseguire un'operazione di risincronizzazione, ristabilire la replica e rimontare il volume di origine per consentire al client di accedere. Per altre informazioni, vedere Gestire il ripristino di emergenza con Azure NetApp Files.

Verifica dei guasti di zona

È possibile testare la configurazione della replica tra zone in modo sicuro usando gli snapshot del volume. Per informazioni su un approccio generale per testare la configurazione della replica tra zone, vedere Testare il ripristino di emergenza per Azure NetApp Files.

Supporto multi-regionale

Per impostazione predefinita, Azure NetApp Files è un servizio a singola area. Se l'area non è più disponibile, anche i volumi archiviati in tale area non sono disponibili. Per migliorare la resilienza in caso di interruzione a livello di area, Azure NetApp Files supporta la replica tra aree. È possibile replicare in modo asincrono i dati da un volume di Azure NetApp Files (origine) in un'area a un altro volume di Azure NetApp Files (destinazione) in un'altra area selezionata da Microsoft. Questa funzionalità consente di eseguire il failover dell'applicazione critica se si verifica un'interruzione o un'emergenza a livello di area.

Annotazioni

È anche possibile replicare un singolo volume in un'altra zona di disponibilità e in un'altra area. Per altre informazioni, vedere Informazioni sulla replica di Azure NetApp Files.

Supporto di area

L'area secondaria da cui è possibile replicare i volumi dipende dall'area primaria. Per altre informazioni, vedere coppie di aree supportate.

Considerazioni

La replica è consentita tra sottoscrizioni di Azure diverse solo se si trovano nello stesso tenant di Microsoft Entra.

Per altre considerazioni relative alla replica tra aree in Azure NetApp Files, vedere Requisiti e considerazioni per l'uso della replica tra aree.

Costo

Gli addebiti per la replica tra aree si basano sulla quantità di dati replicati. Per altre informazioni e alcuni scenari di esempio, vedere Modello di costo per la replica tra aree.

Configurare il supporto per più aree

Operazioni normali

Questa sezione descrive cosa aspettarsi quando i volumi di Azure NetApp Files sono configurati per l'uso della replica tra aree e entrambe le aree sono operative.

  • Routing del traffico tra aree: le richieste in ingresso vengono instradate al volume specifico, che si trova nell'area primaria.

  • Replica dei dati tra aree: la replica tra aree di Azure NetApp Files significa che tutte le modifiche apportate al volume di origine vengono replicate in modo asincrono nei volumi di destinazione. È possibile decidere con quale frequenza viene eseguita la replica. La replica tra aree supporta tre pianificazioni di replica: ogni 10 minuti, ogni ora e ogni giorno.

    Importante

    L'intervallo di replica di 10 minuti non è supportato per volumi di grandi dimensioni che utilizzano la replica tra regioni.

  • Monitorare l'integrità della replica: è possibile monitorare l'integrità della relazione di peering ed è possibile configurare avvisi per notificare se il ritardo di replica aumenta oltre la soglia prevista. Per altre informazioni, vedere Visualizzare l'integrità e monitorare lo stato della relazione di replica.

Esperienza di inattività dell'area

Questa sezione descrive cosa aspettarsi quando i volumi di Azure NetApp Files sono configurati per l'uso della replica tra aree ed è presente un'interruzione dell'area primaria.

  • Rilevamento e risposta: si è responsabili del rilevamento della perdita di un'area e dell'avvio di un failover.

    Per monitorare l'integrità del volume di Azure NetApp Files, è possibile usare le metriche di Monitoraggio di Azure. Azure Monitor rileva eventuali anomalie che indicano uno scenario di inattività dell'area tramite metriche in tempo reale, ad esempio operazioni di I/O al secondo, latenza e utilizzo della capacità. È possibile configurare avvisi e notifiche da inviare agli amministratori in modo che possano rispondere immediatamente ribilanciando condivisioni file o avviando il failover o altri protocolli di ripristino di emergenza.

    Il failover è un processo manuale. Quando è necessario attivare il volume di destinazione, ad esempio quando si desidera eseguire il failover nell'area di destinazione, è necessario interrompere il peering di replica e montare il volume di destinazione. Per ulteriori informazioni, consultare failover al volume di destinazione.

  • Richieste attive: durante un evento di arresto dell'area, le richieste attive possono riscontrare interruzioni o latenze maggiori.

  • Perdita di dati prevista: La quantità di perdita di dati o RPO che ci si può attendere durante un failover regionale dipende dalla pianificazione della replica tra le regioni configurate.

    Pianificazione di replica RPO tipico
    Ogni 10 minuti Meno di 20 minuti
    Su base oraria Meno di due ore
    Ogni giorno Meno di 48 ore
  • Tempo di inattività previsto: il failover in un'altra area richiede l'interruzione della relazione di peering per attivare il volume di destinazione e fornire l'accesso ai dati in lettura e scrittura nel secondo sito. Dopo aver attivato l’interruzione del peering, è previsto che il failover venga completato entro un minuto.

    Tuttavia, la quantità totale di tempo di inattività o RTO, che è possibile prevedere durante un failover di zona dipende da più fattori, tra cui il tempo necessario per i sistemi o i processi per rilevare la perdita della zona e avviare i processi di failover. È anche importante decidere se automatizzare la risposta o se sono necessari passaggi manuali. Per le configurazioni ben preparate, il processo complessivo richiede in genere da alcuni minuti a un'ora per il completamento.

  • Reindirizzamento del traffico: l'utente è responsabile del reindirizzamento del traffico dell'applicazione per connettersi al nuovo volume di destinazione attivo. Per ulteriori informazioni, consultare failover al volume di destinazione.

Ripristino della regione

Dopo il ripristino dell'area primaria, si è responsabili del failback. Il failback è un processo manuale che richiede di eseguire un'operazione di risincronizzazione, ristabilire la replica e rimontare il volume di origine per consentire al client di accedere. Per altre informazioni, vedere Gestire il ripristino di emergenza con Azure NetApp Files.

Test per i guasti a livello di area

È possibile testare la configurazione della replica tra aree in modo sicuro usando gli snapshot del volume. Per informazioni su un approccio generale per testare la configurazione della replica tra aree, vedere Testare il ripristino di emergenza per Azure NetApp Files.

Copie di sicurezza

Il backup di Azure NetApp Files amplia le funzionalità di protezione dei dati di Azure NetApp Files, offrendo una soluzione di backup completamente gestita per il ripristino, l'archiviazione e la conformità a lungo termine. I backup creati dal servizio vengono archiviati in Archiviazione di Azure, indipendentemente dagli snapshot di volume disponibili per il ripristino o la clonazione a breve termine. I backup impiegato dal servizio possono essere ripristinati in nuovi volumi di Azure NetApp Files all'interno dell'area. Il backup di Azure NetApp Files supporta backup basati su criteri (pianificati) e backup manuali (su richiesta).

Per una maggiore sicurezza, gli snapshot di Azure NetApp Files aggiungono stabilità, scalabilità e recuperabilità rapida senza influire sulle prestazioni. Forniscono le basi per altre soluzioni di ridondanza, tra cui il backup, la replica tra aree e la replica tra zone.

Per la maggior parte delle soluzioni, non è consigliabile basarsi esclusivamente sui backup. Usare invece le altre funzionalità descritte in questa guida per supportare i requisiti di resilienza. Tuttavia, i backup proteggono da alcuni rischi che altri approcci non comportano. Per altre informazioni, vedere Che cosa sono ridondanza, replica e backup?.

Contratto di servizio

Il contratto di servizio per i servizi di Azure descrive la disponibilità prevista di ogni servizio e le condizioni che la soluzione deve soddisfare per raggiungere tale aspettativa di disponibilità. Per altre informazioni, vedere Contratti di servizio per Servizi online.