Il lavoro è adatto per Azure Cache HPC?

Articolo
10/26/2023

Azure Cache HPC può velocizzare l'accesso ai dati per processi di elaborazione ad alte prestazioni in un'ampia gamma di discipline. Ma non è perfetto per tutti i tipi di flussi di lavoro. Questo articolo fornisce linee guida per decidere se Cache HPC è una buona opzione per le proprie esigenze.

L'articolo Panoramica offre anche una breve descrizione di quando usare Azure Cache HPC e alcuni esempi di casi d'uso.

Leggere anche questo articolo su come usare in modo efficace l'archiviazione BLOB montata su NFS.

Applicazioni NFS versione 3.0

Azure Cache HPC supporta solo i client NFS 3.0.

Rapporto di lettura/scrittura elevato

I carichi di lavoro in cui i client di calcolo eseguono una lettura maggiore rispetto alla scrittura sono in genere candidati validi per una cache. Ad esempio, se il rapporto di lettura-scrittura è 80/20 o 70/30, Azure Cache HPC può essere utile servendo i file richiesti di frequente dalla cache invece di dover recuperarli dall'archiviazione remota oltre e oltre.

Il recupero di un file e l'archiviazione nella cache per la prima volta ha una latenza aggiuntiva ridotta rispetto a una normale richiesta client direttamente all'archiviazione, quindi l'aumento dell'efficienza arriva alla successiva richiesta dello stesso file da parte di un client. Questo vale soprattutto per i file di grandi dimensioni. Se ogni richiesta client è univoca, l'impatto Cache HPC è limitato. Ma più grande è il file, migliori sono le prestazioni nel tempo dopo il primo accesso.

Carico di lavoro analitico basato su file

Azure Cache HPC è ideale per una pipeline che usa dati basati su file e viene eseguito in un numero elevato di client di calcolo, soprattutto se i client di calcolo sono macchine virtuali di Azure. Può aiutare a correggere le prestazioni lente o incoerenti causate da lunghi tempi di accesso ai file.

Accesso remoto ai dati

Azure Cache HPC può contribuire a ridurre la latenza se il carico di lavoro deve accedere ai dati remoti che non possono essere spostati più vicino alle risorse di calcolo. Ad esempio, i record potrebbero trovarsi alla fine di un ambiente WAN, in un'area di Azure diversa o in un data center dei clienti. Questa operazione è talvolta denominata "bursting di file".

Carico elevato delle richieste

Se un numero elevato di client richiede dati dall'origine contemporaneamente, Azure Cache HPC può velocizzare l'accesso ai file. Ad esempio, quando viene usato con un cluster di elaborazione ad alte prestazioni, Azure Cache HPC offre scalabilità per un numero elevato di richieste simultanee tramite la cache.

Le risorse di calcolo si trovano in Azure

Le macchine virtuali di Azure sono una risposta scalabile e conveniente al carico di lavoro di elaborazione ad alte prestazioni. Azure Cache HPC consente di avvicinare le informazioni necessarie, soprattutto se i dati originali vengono archiviati in un sistema remoto.

Se un cliente vuole eseguire la pipeline corrente "così com'è" nelle macchine virtuali di Azure, Azure Cache HPC può fornire una soluzione di archiviazione condivisa basata su POSIX (o memorizzazione nella cache) per la scalabilità.

Usando Azure Cache HPC, non è necessario riprogettare la pipeline di lavoro per effettuare chiamate native all'archiviazione BLOB di Azure. È possibile accedere ai dati nel sistema originale o usare Cache HPC per spostarli in un nuovo contenitore BLOB.

Passaggi successivi

Altre informazioni su come pianificare e configurare una cache negli articoli Panoramica e Prerequisiti
Leggere le considerazioni sull'uso dell'archiviazione BLOB abilitata per NFS con Azure Cache HPC