Modello Cache-Aside

Cache Redis di Azure

Con questo modello i dati vengono caricati su richiesta in una cache da un archivio dati. In questo modo è possibile migliorare le prestazioni, nonché garantire la coerenza tra i dati memorizzati nella cache e quelli presenti nell'archivio dati sottostante.

Contesto e problema

Le applicazioni usano una cache per migliorare l'accesso ripetuto alle informazioni presenti in un archivio dati. Tuttavia, non è realistico aspettarsi che i dati memorizzati nella cache siano sempre coerenti con l'archivio dati. Le applicazioni devono implementare una strategia che garantisce che i dati nella cache siano il più up-topossibile. La strategia deve anche essere in grado di rilevare quando i dati memorizzati nella cache diventano obsoleti e gestirli in modo appropriato.

Soluzione

Molti sistemi di memorizzazione nella cache disponibili in commercio offrono operazioni di read-through e write-through/write-behind. In questi sistemi un'applicazione fa riferimento alla cache per recuperare i dati. Se i dati non si trovano nella cache, l'applicazione lo recupera dall'archivio dati e lo aggiunge alla cache. Tutte le modifiche apportate ai dati memorizzati nella cache vengono scritte automaticamente anche nell'archivio dati.

Per le cache che non offrono questa funzionalità, la conservazione dei dati viene gestita dalle applicazioni che usano la cache.

Un'applicazione può emulare la funzionalità di memorizzazione nella cache di read-through implementando la strategia di cache-aside. Con questa strategia i dati vengono caricati nella cache su richiesta. La figura illustra l'uso del modello cache-aside per l'archiviazione dei dati nella cache.

Screenshot che mostra l'uso del modello di Cache-Aside per leggere e archiviare i dati nella cache.

L'applicazione determina se l'elemento è attualmente contenuto nella cache tentando di leggere dalla cache.
Se l'elemento non è corrente nella cache (mancata presenza nella cache), l'applicazione recupera l'elemento dall'archivio dati.
L'applicazione aggiunge l'elemento alla cache e quindi lo restituisce al chiamante.

Un'applicazione che aggiorna le informazioni può seguire la strategia di write-through in modo da apportare la modifica all'archivio dati e invalidare l'elemento corrispondente nella cache.

Quando l'elemento è di nuovo necessario, la strategia cache-aside recupera i dati aggiornati dall'archivio dati e lo aggiunge alla cache.

Considerazioni e problemi

Prima di decidere come implementare questo modello, considerare quanto segue:

Durata dei dati memorizzati nella cache. Molte cache usano un criterio di scadenza per invalidare i dati e rimuoverli dalla cache se non è accessibile per un periodo impostato. Per rendere effettiva la strategia di cache-aside, assicurarsi che i criteri di scadenza corrispondano al criterio di accesso per le applicazioni che usano i dati. Non rendere troppo breve il periodo di scadenza perché la scadenza prematura può causare continuamente il recupero dei dati dall'archivio dati e l'aggiunta alla cache da parte delle applicazioni. Analogamente, non impostare un periodo di scadenza troppo lungo per evitare che i dati memorizzati nella cache diventino obsoleti. Tenere presente che la memorizzazione nella cache è più efficace per i dati relativamente statici o per dati letti frequentemente.

Rimozione dei dati. La maggior parte delle cache ha una dimensione limitata rispetto all'archivio dati in cui hanno origine i dati. Se la cache supera il limite di dimensioni, rimuove i dati. La maggior parte delle cache adotta un criterio usato meno di recente per la selezione degli elementi da rimuovere, ma potrebbe essere personalizzabile.

Configurazione. La configurazione della cache può essere impostata sia a livello globale che per ogni elemento memorizzato nella cache. Un singolo criterio di rimozione globale potrebbe non essere adatto a tutti gli elementi. Una configurazione in un elemento della cache potrebbe essere appropriata se un elemento è costoso da recuperare. In questo caso, è opportuno mantenere l'elemento nella cache, anche se viene eseguito l'accesso meno frequentemente rispetto agli elementi più economici.

Inizializzazione della cache. In molte soluzioni la cache viene prepopolata con i dati che saranno probabilmente necessari durante il processo di avvio di un'applicazione. Il modello cache-aside può risultare comunque utile se alcuni di questi dati scadono o sono stati rimossi.

Coerenza. L'implementazione del modello cache-aside non garantisce la coerenza tra l'archivio dati e la cache. Ad esempio, un processo esterno può modificare un elemento nell'archivio dati in qualsiasi momento. Questa modifica non viene visualizzata nella cache finché l'elemento non viene caricato di nuovo. In un sistema che replica i dati tra archivi dati, la coerenza può risultare complessa se la sincronizzazione si verifica di frequente.

Memorizzazione nella cache locale (in memoria). Una cache può essere locale per un'istanza dell'applicazione ed essere archiviata in memoria. Il modello cache-aside può essere utile in questo ambiente se un'applicazione accede ripetutamente agli stessi dati. Una cache locale è però privata, di conseguenza istanze diverse dell'applicazione potrebbero contenere una copia degli stessi dati memorizzati nella cache. Tali dati potrebbero diventare rapidamente incoerenti tra le cache, di conseguenza potrebbe essere necessario far scadere i dati contenuti in una cache privata e aggiornarli più frequentemente. In questi scenari provare ad analizzare l'uso di un meccanismo di memorizzazione nella cache condivisa o distribuita.

Memorizzazione nella cache semantica. Alcuni carichi di lavoro possono trarre vantaggio dall'eseguire il recupero della cache in base al significato semantico anziché alle chiavi esatte. In questo modo si riduce il numero di richieste e token inviati ai modelli linguistici. Assicurarsi che i dati memorizzati nella cache traggono vantaggio dall'equivalenza semantica e non rischino di restituire risposte non correlate o contenere dati privati e sensibili. Ad esempio, "Qual è il mio stipendio annuale da portare a casa?" è semanticamente simile a "Qual è il mio pagamento annuale a casa?" ma se richiesto da due utenti diversi in modo che la risposta non debba essere la stessa, né si desidera includere questi dati sensibili nella cache.

Quando usare questo modello

Usare questo modello quando:

Una cache non offre operazioni native di read-through e write-through.
La richiesta di risorse è imprevedibile. Questo modello consente alle applicazioni di caricare dati su richiesta. Non presuppone quali dati un'applicazione richiede in anticipo.

Questo modello potrebbe non essere adatto:

Se i dati sono sensibili o correlati alla sicurezza. Potrebbe non essere appropriato archiviarlo in una cache, in particolare se la cache è condivisa tra più applicazioni o utenti. Passare sempre all'origine primaria dei dati.
Quando il set di dati memorizzati nella cache è statico. Se i dati rientrano nello spazio della cache disponibile, primere la cache con i dati all'avvio e applicare un criterio che impedisce la scadenza dei dati.
Quando la maggior parte delle richieste non riscontra un riscontro nella cache. In questo caso, il sovraccarico di controllo della cache e del caricamento dei dati in potrebbe superare i vantaggi della memorizzazione nella cache.
Quando si memorizzano nella cache le informazioni sullo stato della sessione in un'applicazione Web ospitata in una web farm. In questo ambiente è consigliabile evitare di introdurre dipendenze basate sull'affinità client-server.

Progettazione del carico di lavoro

Un architetto deve valutare come usare il modello di Cache-Aside in una progettazione per soddisfare gli obiettivi e i principi trattati nei pilastri di Azure Well-Architected Framework. Ad esempio:

Concetto fondamentale	Come questo modello supporta gli obiettivi di pilastro
Le decisioni di progettazione dell'affidabilità consentono al carico di lavoro di diventare resilienti a malfunzionamenti e di assicurarsi che venga ripristinato in uno stato completamente funzionante dopo che si verifica un errore.	La memorizzazione nella cache crea la replica dei dati e, in modi limitati, può essere usata per mantenere la disponibilità dei dati a cui si accede di frequente se l'archivio dati di origine non è temporaneamente disponibile. Inoltre, se si verifica un malfunzionamento nella cache, il carico di lavoro può eseguire il fallback all'archivio dati di origine. - Ridondanza RE:05
L'efficienza delle prestazioni consente al carico di lavoro di soddisfare in modo efficiente le richieste tramite ottimizzazioni in termini di scalabilità, dati, codice.	L'uso di un cab della cache migliora le prestazioni per i dati con un numero elevato di operazioni di lettura che cambiano raramente e possono tollerare un certo decadimento. - Prestazioni dei dati PE:08 - Ottimizzazione continua delle prestazioni PE:12

Come per qualsiasi decisione di progettazione, prendere in considerazione eventuali compromessi rispetto agli obiettivi degli altri pilastri che potrebbero essere introdotti con questo modello.

Esempio

Prendere in considerazione l'uso di Redis gestito di Azure per creare una cache distribuita che più istanze dell'applicazione possono condividere.

Questo esempio di codice seguente usa il client StackExchange.Redis , ovvero una libreria client Redis scritta per .NET. Per connettersi a un'istanza di Redis gestita di Azure, chiamare il metodo statico ConnectionMultiplexer.Connect e passare la stringa di connessione. Il metodo restituisce un elemento ConnectionMultiplexer che rappresenta la connessione. Un approccio per la condivisione di un'istanza di ConnectionMultiplexer nell'applicazione prevede una proprietà statica che restituisce un'istanza connessa, simile a quanto illustrato nell'esempio seguente. Questo approccio costituisce un modo thread-safe per inizializzare solo una singola istanza connessa.

private static ConnectionMultiplexer Connection;

// Redis connection string information
private static Lazy<ConnectionMultiplexer> lazyConnection = new Lazy<ConnectionMultiplexer>(() =>
{
    string cacheConnection = ConfigurationManager.AppSettings["CacheConnection"].ToString();
    return ConnectionMultiplexer.Connect(cacheConnection);
});

public static ConnectionMultiplexer Connection => lazyConnection.Value;

Il metodo GetMyEntityAsync nell'esempio di codice seguente illustra un'implementazione del modello cache-aside. Questo metodo recupera un oggetto dalla cache usando l'approccio read-through.

Per l'identificazione di un oggetto viene usato come chiave un ID di tipo Integer. Il metodo GetMyEntityAsync prova a recuperare un elemento dalla cache usando questa chiave. Se viene trovato un elemento corrispondente, la cache la restituisce. Se la cache non contiene alcun elemento corrispondente, il metodo GetMyEntityAsync recupera l'oggetto da un archivio dati, lo aggiunge alla cache e quindi lo restituisce. Il codice che legge i dati dall'archivio dati non viene visualizzato qui, perché dipende dall'archivio dati. L'elemento memorizzato nella cache è configurato per scadere per impedire che diventi obsoleto se un altro servizio o lo aggiorna.

// Set five minute expiration as a default
private const double DefaultExpirationTimeInMinutes = 5.0;

public async Task<MyEntity> GetMyEntityAsync(int id)
{
  // Define a unique key for this method and its parameters.
  var key = $"MyEntity:{id}";
  var cache = Connection.GetDatabase();

  // Try to get the entity from the cache.
  var json = await cache.StringGetAsync(key).ConfigureAwait(false);
  var value = string.IsNullOrWhiteSpace(json)
                ? default(MyEntity)
                : JsonConvert.DeserializeObject<MyEntity>(json);

  if (value == null) // Cache miss
  {
    // If there's a cache miss, get the entity from the original store and cache it.
    // Code has been omitted because it is data store dependent.
    value = ...;

    // Avoid caching a null value.
    if (value != null)
    {
      // Put the item in the cache with a custom expiration time that
      // depends on how critical it is to have stale data.
      await cache.StringSetAsync(key, JsonConvert.SerializeObject(value)).ConfigureAwait(false);
      await cache.KeyExpireAsync(key, TimeSpan.FromMinutes(DefaultExpirationTimeInMinutes)).ConfigureAwait(false);
    }
  }

  return value;
}

Gli esempi usano Redis gestito di Azure per accedere all'archivio e recuperare informazioni dalla cache. Per altre informazioni, vedere Creare un Redis gestito di Azure e usare Azure Redis in .NET Core.

Il UpdateEntityAsync metodo illustrato di seguito illustra come invalidare un oggetto nella cache quando l'applicazione modifica il valore. Il codice aggiorna l'archivio dati originale e quindi rimuove dalla cache l'elemento memorizzato nella cache.

public async Task UpdateEntityAsync(MyEntity entity)
{
    // Update the object in the original data store.
    await this.store.UpdateEntityAsync(entity).ConfigureAwait(false);

    // Invalidate the current cache object.
    var cache = Connection.GetDatabase();
    var id = entity.Id;
    var key = $"MyEntity:{id}"; // The key for the cached object.
    await cache.KeyDeleteAsync(key).ConfigureAwait(false); // Delete this key from the cache.
}

Nota

L'ordine dei passaggi è importante. Aggiornare l'archivio dati prima di rimuovere l'elemento dalla cache. Se si rimuove prima di tutto l'elemento memorizzato nella cache, si verifica un piccolo intervallo di tempo in cui un client potrebbe recuperare l'elemento prima dell'aggiornamento dell'archivio dati. In questo caso, il recupero genera un mancato riscontro nella cache (perché l'elemento è stato rimosso dalla cache). Il mancato riscontro nella cache causa il recupero della versione precedente dell'elemento dall'archivio dati e l'aggiunta nella cache. Il risultato è dati della cache non aggiornati.

Quando si implementa questo modello, potrebbero essere rilevanti le informazioni seguenti:

Modello di app Web affidabile illustra come applicare il modello cache-aside alle applicazioni Web convergenti nel cloud.
Informazioni aggiuntive sulla memorizzazione nella cache. Include maggiori informazioni su come memorizzare nella cache i dati in una soluzione cloud ed esamina gli aspetti da considerare quando si implementa una cache.
Nozioni di base sulla coerenza dei dati. Le applicazioni cloud in genere archiviano i dati in più archivi dati e posizioni. La gestione e la gestione della coerenza dei dati in questo ambiente è un aspetto critico del sistema, in particolare la concorrenza e i problemi di disponibilità che possono verificarsi. Questo documento illustra i problemi relativi alla coerenza tra dati distribuiti e spiega in che modo un'applicazione può implementare controlli di coerenza per garantire la disponibilità dei dati.
Usare Redis gestito di Azure come cache semantica. Questa esercitazione illustra come implementare la memorizzazione nella cache semantica usando Redis gestito di Azure.

Commenti e suggerimenti

Questa pagina è stata utile?