Modelli di progettazione dell'architettura che supportano l'affidabilità

Quando si progettano architetture dei carichi di lavoro, è consigliabile usare modelli di settore che affrontano le problematiche comuni. I modelli consentono di ottenere compromessi intenzionali all'interno dei carichi di lavoro e di ottimizzare il risultato desiderato. Possono anche contribuire a mitigare i rischi che derivano da problemi specifici, che possono influire su sicurezza, prestazioni, costi e operazioni. Se non è stato attenuato, questi rischi causeranno alla fine problemi di affidabilità. Questi modelli sono supportati dall'esperienza reale, sono progettati per la scalabilità cloud e i modelli operativi e sono intrinsecamente indipendenti dai fornitori. L'uso di modelli noti come modo per standardizzare la progettazione del carico di lavoro è un componente dell'eccellenza operativa.

Molti modelli di progettazione supportano direttamente uno o più pilastri dell'architettura. Modelli di progettazione che supportano il pilastro Affidabilità classificare in ordine di priorità la disponibilità del carico di lavoro, la conservazione automatica, il ripristino, l'integrità dei dati e l'elaborazione e il contenimento dei malfunzionamenti.

La tabella seguente riepiloga i modelli di progettazione dell'architettura che supportano gli obiettivi di affidabilità.

Modello	Riassunto
Ambasciatore	Incorpora e gestisce le comunicazioni di rete delegando le attività comuni correlate alla comunicazione di rete. I servizi helper risultanti avviano la comunicazione per conto del client. Questo punto di mediazione offre l'opportunità di aggiungere modelli di affidabilità alla comunicazione di rete, ad esempio il ritentare o il buffering.
Backends for Frontends	Individualizza il livello di servizio di un carico di lavoro creando servizi separati esclusivi di un'interfaccia front-end specifica. A causa di questa separazione, un malfunzionamento nel livello di servizio che supporta un client potrebbe non influire sulla disponibilità dell'accesso di un altro client. Quando si gestiscono diversi client in modo diverso, è possibile classificare in ordine di priorità le attività di affidabilità in base ai modelli di accesso client previsti.
Paratia	Introduce la segmentazione intenzionale e completa tra i componenti per isolare il raggio di esplosione di malfunzionamenti. Questa strategia di isolamento dei guasti tenta di contenere i guasti solo alla paratia che riscontra il problema, evitando conseguenze su altre paratie.
Cache-Aside	Ottimizza l'accesso ai dati letti di frequente introducendo una cache popolata su richiesta. La cache viene quindi usata nelle richieste successive per gli stessi dati. La memorizzazione nella cache crea la replica dei dati e, in modi limitati, può essere usata per mantenere la disponibilità dei dati a cui si accede di frequente se l'archivio dati di origine non è temporaneamente disponibile. Inoltre, se si verifica un malfunzionamento nella cache, il carico può tornare all'archivio dati di origine.
Interruttore automatico	Impedisce richieste continue a una dipendenza non funzionante o non disponibile. In questo modo, questo modello impedisce di sovraccaricare una dipendenza problematica. È anche possibile usare questo modello per attivare una riduzione normale del carico di lavoro. Gli interruttori sono spesso associati al recupero automatico per fornire sia l'autopreservazione che l'autoripristino.
Verifica delle richieste	Separa i dati dal flusso di messaggistica, fornendo un modo per recuperare separatamente i dati correlati a un messaggio. I bus di messaggi non forniscono la stessa affidabilità e ripristino in caso di disastro che sono spesso presenti negli archivi di dati dedicati, quindi la separazione dei dati dai messaggi può offrire maggiore affidabilità per i dati sottostanti. Questa separazione consente anche un approccio di ripristino della coda di messaggi dopo un'emergenza.
Transazione di compensazione	Fornisce un meccanismo per il ripristino da errori ripristinando gli effetti delle azioni applicate in precedenza. Questo modello risolve i malfunzionamenti nei percorsi critici del carico di lavoro usando azioni di compensazione, che possono comportare processi come il rollback diretto delle modifiche dei dati, l'interruzione dei blocchi delle transazioni o anche l'esecuzione del comportamento del sistema nativo per invertire l'effetto.
Consumatori concorrenti	Applica l'elaborazione distribuita e simultanea per gestire in modo efficiente gli elementi in una coda. Questo modello crea ridondanza nell'elaborazione delle code considerando i consumatori come repliche, pertanto un guasto dell'istanza non impedisce ad altri consumatori di elaborare i messaggi della coda.
Configurazione del carico di lavoro Edge	Gestisce la configurazione per i carichi di lavoro perimetrali distribuiti considerando il cloud come origine di verità desiderata, garantendo al tempo stesso che la configurazione rimanga disponibile in locale durante le interruzioni della connettività. Questo modello migliora l'affidabilità supportando la riconciliazione della configurazione, il rilevamento della deriva e il rollback per il ripristino da aggiornamenti parziali o configurazioni non valide.
Event Sourcing	Tratta il cambiamento di stato come una serie di eventi, catturandoli in un registro di solo accodamento non modificabile. È possibile usare questo modello quando una cronologia affidabile delle modifiche è fondamentale in un processo aziendale complesso. Facilita inoltre la ricostruzione dello stato se è necessario ripristinare gli archivi di stato.
Identità federata	Delega l'attendibilità a un provider di identità esterno al carico di lavoro per la gestione degli utenti e l'autenticazione per l'applicazione. L'offload della gestione degli utenti e dell'autenticazione sposta l'affidabilità per tali componenti al provider di identità, che in genere ha un contratto di servizio elevato. Inoltre, durante il ripristino di emergenza del carico di lavoro, i componenti di autenticazione probabilmente non devono essere risolti come parte del piano di ripristino del carico di lavoro.
Aggregazione gateway	Semplifica le interazioni client con il carico di lavoro aggregando le chiamate a più servizi back-end in una singola richiesta. Questa topologia consente di spostare la gestione degli errori temporanei da un'implementazione distribuita tra i client a un'implementazione centralizzata.
Scarico del gateway	Trasferisce l'elaborazione delle richieste a un dispositivo gateway prima e dopo l'inoltro della richiesta a un nodo back-end. L'offload di questa responsabilità in un gateway riduce la complessità del codice dell'applicazione nei nodi back-end. In alcuni casi, lo scaricamento sostituisce completamente la funzionalità con una funzionalità fornita dalla piattaforma e affidabile.
Gateway Routing	Instrada le richieste di rete in ingresso a vari sistemi back-end in base alle finalità delle richieste, alla logica di business e alla disponibilità back-end. Il routing del gateway consente di instradare il traffico solo a nodi integri nel sistema.
Geode	Distribuisce sistemi che operano in modalità di disponibilità attiva-attiva in più aree geografiche. Questo modello usa la replica dei dati per supportare l'ideale che qualsiasi client possa connettersi a qualsiasi istanza geografica. Può aiutare il carico di lavoro a resistere a una o più interruzioni a livello di area.
Monitoraggio della salute degli endpoint	Fornisce un modo per monitorare l'integrità o lo stato di un sistema esponendo un endpoint appositamente progettato per tale scopo. È possibile usare questo endpoint per gestire l'integrità del carico di lavoro e per avvisi e dashboard. È anche possibile usarlo come segnale per la remediazione auto-riparativa.
Tabella indice	Ottimizza il recupero dei dati negli archivi dati distribuiti consentendo ai client di cercare metadati in modo che i dati possano essere recuperati direttamente, evitando la necessità di eseguire analisi complete dell'archivio dati. Poiché i client sono indirizzati al loro frammento, partizione o endpoint attraverso un processo di ricerca, è possibile usare questo modello per facilitare un approccio di failover per l'accesso ai dati.
Elezioni leader	Definisce un leader delle istanze di un'applicazione distribuita. Il leader coordina le responsabilità correlate al raggiungimento di un obiettivo. Questo modello riduce l'effetto di malfunzionamenti del nodo reindirizzando in modo affidabile il lavoro. Implementa anche il failover attraverso algoritmi di consenso nel caso di un malfunzionamento del leader.
Pipe e filtri	Suddivide l'elaborazione dei dati complessa in una serie di fasi indipendenti per ottenere un risultato specifico. La responsabilità unica di ciascuna fase consente di focalizzare l'attenzione ed evita la distrazione causata dall'elaborazione dei dati combinata.
Coda prioritaria	Assicura che gli elementi con priorità più alta vengano elaborati e completati prima degli elementi con priorità inferiore. La separazione degli elementi in base alla priorità aziendale consente di concentrare le attività di affidabilità sul lavoro più critico.
Publisher/Sottoscrittore	Separa i componenti di un'architettura sostituendo la comunicazione diretta da client a servizio o da client a servizi con la comunicazione tramite un broker di messaggi intermedio o un bus di eventi.
Livellamento del carico basato su coda	Controlla il livello di richieste o attività in ingresso memorizzandole nel buffer in una coda e consentendo al processore della coda di gestirle a un ritmo controllato. Questo approccio può offrire resilienza contro picchi improvvisi della domanda separando l'arrivo delle attività dalla loro elaborazione. Può anche isolare i malfunzionamenti nell'elaborazione della coda in modo che non influiscano sulla ricezione.
Limitazione della frequenza	Controlla la frequenza delle richieste client per ridurre gli errori di limitazione ed evitare scenari di ritentativi illimitati. Questa tattica protegge il client riconoscendo le limitazioni e i costi di comunicazione con un servizio quando il servizio è progettato per evitare di raggiungere limiti specificati. Funziona controllando il numero e/o le dimensioni delle operazioni inviate al servizio durante un periodo di tempo specifico.
riprovare	Risolve gli errori che potrebbero essere temporanei o intermittenti ritentando determinate operazioni, in modo controllato. La mitigazione degli errori temporanei in un sistema distribuito è una tecnica chiave per migliorare la resilienza di un carico di lavoro.
Transazioni distribuite Saga	Coordina transazioni a esecuzione prolungata e potenzialmente complesse scomponendo il lavoro in sequenze di transazioni più piccole e indipendenti. Ogni transazione deve inoltre disporre di azioni di compensazione per invertire gli errori nell'esecuzione e mantenere l'integrità. Poiché le transazioni monolitiche in più sistemi distribuiti sono in genere impossibili, questo modello fornisce coerenza e affidabilità implementando atomicità e compensazione.
Supervisore agente di pianificazione	Distribuisce e ridistribuisce in modo efficiente le attività in un sistema in base a fattori osservabili nel sistema. Questo modello usa le metriche di integrità per rilevare gli errori e reindirizzare le attività a un agente integro per attenuare gli effetti di un malfunzionamento.
Convoglio sequenziale	Gestisce l'ingresso della messaggistica simultanea, supportando anche l'elaborazione in un ordine definito. Questo modello può eliminare le condizioni di concorrenza difficili da risolvere, la gestione conflittuale dei messaggi o altre soluzioni alternative per i messaggi ordinati in modo errato che possono provocare malfunzionamenti.
Partizionamento orizzontale	Indirizza il carico a una destinazione logica specifica per gestire la richiesta specifica, abilitando la co-locazione per l'ottimizzazione. Poiché i dati o l'elaborazione sono isolati nella partizione, un malfunzionamento in una partizione rimane isolato in tale partizione.
Strangler Fig	Fornisce un approccio per sostituire sistematicamente i componenti di un sistema in esecuzione con nuovi componenti, spesso durante una migrazione o una modernizzazione del sistema. Questo approccio incrementale di questo modello consente di ridurre i rischi durante una transizione.
Limitazione	Impone limiti alla frequenza o alla larghezza di banda delle richieste in ingresso a una risorsa o un componente. È possibile progettare i limiti per evitare l'esaurimento delle risorse che potrebbero causare malfunzionamenti. È anche possibile usare questo modello come meccanismo di controllo in un piano di riduzione delle prestazioni normale.

Passaggi successivi

Esaminare i modelli di progettazione dell'architettura che supportano gli altri pilastri Azure Well-Architected Framework:

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-08-29

Modelli di progettazione dell'architettura che supportano l'affidabilità

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive