Stile dell'architettura orientata agli eventi

Un'architettura basata su eventi è costituita da produttori di eventi che generano un flusso di eventi, consumatori di eventi in ascolto di questi eventi e canali di eventi (spesso implementati come broker di eventi o servizi di inserimento) che trasferiscono eventi dai produttori ai consumatori.

Architecture

Gli eventi vengono recapitati quasi in tempo reale, in modo che i consumer possano rispondere immediatamente agli eventi che si verificano. I produttori sono separati dai consumer, il che significa che un produttore non sa quali consumer sono in ascolto. I consumatori vengono anche disaccoppiati l'uno dall'altro e, in un modello pubblica-sottoscrivi, ogni consumatore vede tutti gli eventi.

Questo processo differisce da uno schema Consumer concorrente. Nel modello Consumatori concorrenti, i consumer estraggono i messaggi da una coda. Ogni messaggio viene elaborato una sola volta, presupponendo che non siano presenti errori. In alcuni sistemi, ad esempio Azure IoT, gli eventi devono essere gestiti in grandi quantità.

Un'architettura basata su eventi può usare un modello di pubblicazione-sottoscrizione o un modello di flusso di eventi.

Pubblicazione-sottoscrizione: L'infrastruttura di messaggistica pubblicazione-sottoscrizione tiene traccia delle sottoscrizioni. Quando viene pubblicato un evento, invia l'evento a ogni sottoscrittore. Dopo aver ricevuto l'evento, non viene archiviato in un log durevole, quindi i nuovi sottoscrittori non visualizzano eventi precedenti. È consigliabile usare Azure Event Grid per gli scenari di pubblicazione-sottoscrizione.
Streaming di eventi: Gli eventi vengono scritti in un log. Gli eventi vengono ordinati rigorosamente all'interno di una partizione e sono durevoli. I clienti non si abbonano al flusso. Un client può invece leggere da qualsiasi parte del flusso. Il cliente è responsabile dell'avanzamento della propria posizione nel flusso, il che significa che un cliente può unirsi in qualsiasi momento e può riprodurre eventi. Questa riusabilità supporta le situazioni di recupero, consumatori in arrivo in ritardo e la rilavorazione dopo una correzione di bug. Azure Event Hubs è progettato per lo streaming di eventi a velocità effettiva elevata.

Sul lato consumer esistono alcune varianti comuni:

Elaborazione semplice di eventi: Un evento attiva immediatamente un'azione nel consumer. Ad esempio, è possibile usare Azure Functions con un trigger Event Grid o Azure Service Bus trigger in modo che il codice venga eseguito quando viene pubblicato un messaggio.
Correlazione di eventi di base: Un consumer elabora alcuni eventi aziendali discreti, li correla in base a un identificatore e rende persistenti le informazioni degli eventi precedenti da usare quando elabora eventi successivi. Le librerie come NServiceBus e MassTransit supportano questo modello.
Complex event processing: Un consumer usa una tecnologia come Azure Stream Analytics per analizzare una serie di eventi e identificare i modelli nei dati dell'evento. Ad esempio, è possibile aggregare le letture da un dispositivo incorporato in un intervallo di tempo e generare una notifica se la media mobile supera una soglia specifica.
Event stream processing: Usare una piattaforma di streaming di dati, ad esempio Azure IoT Hub, hub Event Hub o Event Hub per Apache Kafka, come pipeline per inserire gli eventi e inviarli ai processori di flusso. I processori di flusso agiscono per elaborare o trasformare il flusso. Potrebbero essere presenti più processori di flusso per sottosistemi diversi dell'applicazione. Questo approccio è particolarmente adatto per i carichi di lavoro IoT.

L'origine degli eventi potrebbe essere esterna al sistema, ad esempio i dispositivi fisici in una soluzione IoT. In tal caso, il sistema deve essere in grado di inserire i dati in corrispondenza del volume e della velocità effettiva richiesti dall'origine dati.

Esistono due approcci principali per strutturare i payload degli eventi. Quando hai il controllo sui consumatori di eventi, puoi decidere la struttura del payload per ciascun consumatore. Questa strategia consente di combinare approcci in base alle esigenze all'interno di un singolo carico di lavoro.

Includere tutti gli attributi obbligatori nel payload: Usare questo approccio quando si desidera che i consumer dispongano di tutte le informazioni disponibili senza dover eseguire query su un'origine dati esterna. I payload più grandi aumentano il costo del trasporto e il consumo di larghezza di banda e possono causare problemi di coerenza dei dati a causa di più sistemi di record, in particolare dopo gli aggiornamenti. La gestione dei contratti e il controllo delle versioni possono anche diventare complessi.
Includere solo le chiavi nel payload: In questo approccio, i consumatori recuperano gli attributi necessari, come una chiave primaria, per ottenere in modo indipendente i dati rimanenti da una fonte di dati. Questo metodo offre una migliore coerenza dei dati perché ha un singolo sistema di record. Tuttavia, può avere prestazioni peggiori rispetto al primo approccio perché i consumatori devono interrogare spesso l'origine dati. Per quanto riguarda l'accoppiamento, la larghezza di banda, la gestione dei contratti o il controllo delle versioni, si hanno meno preoccupazioni perché gli eventi più piccoli e i contratti più semplici riducono la complessità. Per altre informazioni, vedi Mettere gli eventi su una dieta.

Nel diagramma precedente ogni tipo di consumer viene visualizzato come una singola casella. Per evitare che il consumatore diventi un punto singolo di guasto nel sistema, è tipico avere più istanze di tale componente. Potrebbero essere necessarie più istanze anche per gestire il volume e la frequenza degli eventi. Un singolo consumer può gestire eventi su più thread. Questa configurazione può creare problemi se gli eventi devono essere elaborati in ordine o richiedono una semantica di una sola volta. Per altre informazioni, vedere Ridurre al minimo il coordinamento.

Esistono due topologie primarie nelle architetture guidate dagli eventi:

Topologia broker: I componenti trasmettono eventi all'intero sistema. Altri componenti agiscono sull'evento o ignorano l'evento. Questa topologia è utile quando il flusso di elaborazione degli eventi è relativamente semplice. Non esiste un coordinamento centrale o un'orchestrazione, quindi questa topologia può essere dinamica.

Questa topologia è altamente disaccoppiata, che consente di garantire scalabilità, velocità di risposta e tolleranza di errore dei componenti. Nessun componente è proprietario o è a conoscenza dello stato di qualsiasi transazione aziendale a più passaggi e le azioni vengono eseguite in modo asincrono. Di conseguenza, le transazioni distribuite sono rischiose perché non esiste alcun meccanismo predefinito per il riavvio o la riproduzione. È necessario considerare attentamente la gestione degli errori e le strategie di intervento manuale perché questa topologia può essere un'origine di incoerenza dei dati.
Topologia mediator: Questa topologia risolve alcune delle carenze della topologia broker. Esiste un mediator di eventi che gestisce e controlla il flusso degli eventi. Il mediatore eventi mantiene lo stato e gestisce il trattamento degli errori e le capacità di riavvio. A differenza della topologia broker, il mediator invia comandi a canali designati anziché trasmettere all'intero sistema. Questi canali sono spesso code di messaggi. Si prevede che i consumatori elaborino questi comandi.

Questa topologia offre un maggiore controllo, una migliore gestione degli errori distribuiti e una coerenza dei dati potenzialmente migliore. Tuttavia, questa topologia introduce un maggiore accoppiamento tra i componenti e il mediatore dell'evento può diventare un collo di bottiglia o un problema di affidabilità.

Quando usare questa architettura

È consigliabile usare questa architettura quando si verificano le condizioni seguenti:

Più sottosistemi devono elaborare gli stessi eventi.
È necessaria l'elaborazione in tempo reale con ritardo di tempo minimo.
È necessaria un'elaborazione complessa degli eventi, come il matching di pattern o l'aggregazione su finestre temporali.
Sono necessari volumi elevati e velocità elevata dei dati, ad esempio con IoT.
È necessario separare produttori e consumer per obiettivi di scalabilità e affidabilità indipendenti.

Questa architettura potrebbe non essere adatta quando:

Il carico di lavoro include flussi di lavoro semplici di risposta alle richieste in cui le chiamate sincrone soddisfano i requisiti di latenza e velocità effettiva. Il sovraccarico operativo dei gestori eventi, la gestione asincrona degli errori e la coerenza eventuale non sono giustificati per interazioni dirette.
Le transazioni aziendali richiedono una coerenza assoluta tra i servizi. Se non è possibile tollerare finestre in cui parti diverse del sistema non sono d'accordo sullo stato corrente, la coerenza finale che l'architettura basata su eventi (EDA) introduce funziona contro di te.
Il team non ha esperienza con sistemi asincroni distribuiti. I modelli di debug, monitoraggio e ripristino degli errori che l'EDA richiede sono significativamente diversi da quelli nelle architetture sincrone, e la curva di apprendimento influisce sulle tempistiche di consegna.

Vantaggi

Questa architettura offre i vantaggi seguenti:

I produttori e i consumatori sono disaccoppiati.
Non sono presenti integrazioni da punto a punto. È possibile aggiungere nuovi consumer senza modificare i producer o gli altri consumer.
I consumer possono rispondere immediatamente agli eventi quando si verificano.
È altamente scalabile, elastico e distribuito.
I sottosistemi hanno visualizzazioni indipendenti del flusso di eventi.

Problematiche

Recapito garantito

In alcuni sistemi, in particolare negli scenari IoT, è fondamentale garantire che gli eventi vengano recapitati.
Coerenza finale

Poiché i producer e i consumer sono separati tramite canali di eventi asincroni, i dati tra i servizi non sono immediatamente coerenti dopo la pubblicazione di un evento. I consumer elaborano gli eventi al proprio ritmo e possono verificarsi ritardi misurabili tra il momento in cui un produttore genera una modifica dello stato e il tempo in cui tutti i consumer riflettono tale cambiamento. Durante questa finestra, diverse parti del sistema hanno una visualizzazione diversa dello stato corrente.

Questo comportamento è un compromesso intenzionale dell'architettura. In molte progettazioni guidate dagli eventi, gli architetti scelgono di favorire la disponibilità e la tolleranza di partizione per determinati flussi di lavoro, accettando la coerenza finale come compromesso, mentre altri flussi di lavoro potrebbero comunque dare priorità alla coerenza più forte. Gli architetti devono progettare consumer e letture downstream per tollerare dati obsoleti o parzialmente aggiornati, in cui la coerenza finale è effettiva. Per altre informazioni, vedere Ridurre al minimo il coordinamento.
Elaborazione di eventi in sequenza o una sola volta

Per resilienza e scalabilità, ogni tipo di consumer viene in genere eseguito in più istanze. L'esecuzione di più istanze può creare una sfida se gli eventi devono assolutamente essere elaborati in ordine all'interno di una tipologia di consumer o se la logica di elaborazione dei messaggi idempotenti non è implementata.
Coordinamento dei messaggi tra i servizi

I processi aziendali hanno spesso più servizi che pubblicano e sottoscrivono i messaggi per ottenere un risultato coerente in un intero carico di lavoro. È possibile usare modelli di flusso di lavoro come Coreografia e Saga Orchestration per gestire in modo affidabile i flussi di messaggi tra vari servizi.
Gestione degli errori

L'architettura basata su eventi si basa principalmente sulla comunicazione asincrona. Una sfida comune che presenta la comunicazione asincrona è la gestione degli errori. Un modo per risolvere questo problema consiste nell'usare un processore del gestore errori dedicato.

Quando un consumer di eventi rileva un errore, invia immediatamente e in modo asincrono l'evento problematico al processore del gestore errori e continua l'elaborazione di altri eventi. Il processore del gestore errori tenta di risolvere il problema. Se ha esito positivo, il processore del gestore errori invia nuovamente l'evento al canale di inserimento originale. In caso di errore, il processore può inoltrare l'evento a una coda di messaggi non recapitabili (DLQ) per l'ispezione dell'amministratore. Quando si usa un processore del gestore degli errori, gli eventi inviati di nuovo vengono trattati fuori sequenza.

Quando un processo aziendale si estende su più servizi, prendere in considerazione l'uso di una transazione di compensazione per invertire logicamente i passaggi completati in caso di esito negativo di un passaggio successivo.
Perdita di dati

Un'altra sfida che presenta la comunicazione asincrona è la perdita di dati. Se uno dei componenti si arresta in modo anomalo prima di elaborare correttamente e consegnare l'evento al componente successivo, l'evento viene eliminato e non raggiunge mai la destinazione finale. Per ridurre al minimo la probabilità di perdita di dati, rendere persistenti gli eventi in transito e rimuovere o annullare la coda degli eventi solo quando il componente successivo riconosce la ricezione dell'evento. Queste funzionalità sono note come modalità di riconoscimento client e supporto dell'ultimo partecipante.
Osservabilità tra componenti disaccoppiati

Nelle architetture sincrone è possibile tracciare una richiesta tramite uno stack di chiamate. Nelle architetture basate su eventi, una singola transazione aziendale può coinvolgere più produttori, canali e consumatori che vengono eseguiti in modo indipendente e asincrono. Quando si verifica un errore o si comporta in modo imprevisto, determinare quale componente ha un comportamento errato e perché è più difficile perché non esiste un contesto di chiamata condiviso.

Per mantenere la visibilità, includere un ID di correlazione in ogni evento in modo che tutti i consumer downstream e i sistemi di registrazione possano connettere le operazioni correlate in una singola traccia. Pianificare questa strumentazione fin dall'inizio della progettazione, perché integrare l'osservabilità in un sistema disaccoppiato successivamente è sostanzialmente più difficile rispetto a farlo durante la fase di costruzione.

Questa stessa complessità influisce sui test. La verifica del comportamento end-to-end tra componenti asincroni e disaccoppiati richiede strategie di test più intenzionali rispetto alle catene di chiamate sincrone.
Implementazione di un modello tradizionale di richiesta-risposta

A volte, il produttore di eventi richiede una risposta immediata dal consumatore di eventi, ad esempio per verificare l'idoneità del cliente prima di procedere con un ordine. In un'architettura basata su eventi è possibile ottenere una comunicazione sincrona usando la messaggistica request-response.

Questo modello viene implementato con una coda di richieste e una coda di risposte. Il produttore di eventi invio una richiesta asincrona a una coda di richieste, sospende altre operazioni su quella attività e aspetta una risposta nella coda di risposta. Questo approccio trasforma questo modello in modo efficace in un processo sincrono. I consumer di eventi elaborano quindi la richiesta e inviano la risposta tramite una coda di risposta. Questo approccio usa in genere un ID sessione per il rilevamento, quindi il producer di eventi sa quale messaggio nella coda di risposta è correlato alla richiesta specifica. La richiesta originale può anche specificare il nome della coda di risposta, potenzialmente effimera, in un'intestazione reply-to o un altro attributo personalizzato concordato di comune accordo.
Manutenzione del numero appropriato di eventi

La generazione di un numero eccessivo di eventi con granularità fine può saturare e sovraccaricare il sistema. Un volume eccessivo di eventi rende difficile analizzare efficacemente il flusso complessivo degli eventi. Questo problema è esacerbato quando è necessario eseguire il rollback delle modifiche. Al contrario, il consolidamento eccessivo degli eventi può anche creare problemi, che comportano l'elaborazione e le risposte non necessarie da parte dei consumer di eventi.

Per ottenere il giusto equilibrio, prendere in considerazione le conseguenze degli eventi e se i consumatori devono esaminare i payload dell'evento per determinare le risposte. Ad esempio, se si dispone di un componente di controllo della conformità, potrebbe essere sufficiente pubblicare solo due tipi di eventi: conforme e non conforme. Questo approccio consente di garantire che ogni evento venga elaborato solo dai consumatori pertinenti, impedendo l'elaborazione non necessaria.
Evoluzione dello schema di eventi

I producer e i consumer vengono distribuiti in modo indipendente, quindi non è possibile aggiornarli tutti contemporaneamente. Quando un producer modifica la struttura di un evento, i consumer che non conoscono ancora il nuovo schema possono interrompersi. Definire in anticipo una strategia di versionamento dello schema e progettare i *consumer* per gestire le versioni degli eventi che non riconoscono.

Altre considerazioni

Una richiesta è visibile solo al componente di gestione delle richieste. Tuttavia, gli eventi sono spesso visibili a più componenti in un carico di lavoro, anche se tali componenti non li usano o non sono destinati a utilizzarli. Per operare con una mentalità "presupporre la violazione", tenere presente quali informazioni includere negli eventi per evitare l'esposizione imprevista delle informazioni.
Molte applicazioni usano l'architettura basata su eventi come architettura primaria. È possibile combinare questo approccio con altri stili architetturali per creare un'architettura ibrida. Le combinazioni tipiche includono microservizi, pipe e filtri e event sourcing. Integrare un'architettura guidata dagli eventi per migliorare le prestazioni del sistema eliminando i colli di bottiglia e fornendo contrappressione durante periodi di elevato volume di richieste.
Domini specifici spesso si estendono su più produttori di eventi, consumatori o canali di eventi. Le modifiche apportate a un dominio specifico potrebbero influire su molti componenti.

Passo successivo

Opzioni di messaggistica asincrona

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-03-07