Passar ditt jobb bra för Azure HPC Cache?

Azure HPC Cache kan påskynda åtkomsten till data för databehandlingsjobb med höga prestanda inom en mängd olika områden. Men det är inte perfekt för alla typer av arbetsflöden. Den här artikeln innehåller riktlinjer för hur du avgör om HPC Cache är ett bra alternativ för dina behov.

Artikeln Översikt innehåller också en kort beskrivning av när du ska använda Azure HPC Cache och några exempel på användningsfall.

Läs även den här artikeln om hur du effektivt använder NFS-monterad bloblagring.

NFS version 3.0-program

Azure HPC Cache stöder endast NFS 3.0-klienter.

Högt läs-till-skriv-förhållande

Arbetsbelastningar där beräkningsklienterna läser mer än de skriver är vanligtvis bra kandidater för en cache. Om ditt läs-till-skriv-förhållande till exempel är 80/20 eller 70/30 kan Azure HPC Cache hjälpa till genom att hantera filer som efterfrågas ofta från cacheminnet i stället för att behöva hämta dem från fjärrlagring om och om igen.

Att hämta en fil och lagra den i cacheminnet för första gången har en liten ytterligare svarstid jämfört med en normal klientbegäran direkt till lagringen, så effektivitetsökningen kommer nästa gång en klient begär samma fil. Detta gäller särskilt för stora filer. Om varje klientbegäran är unik är HPC Caches inverkan begränsad. Men ju större filen är, desto bättre prestanda är över tid efter den första åtkomsten.

Filbaserad analysarbetsbelastning

Azure HPC Cache är perfekt för en pipeline som använder filbaserade data och körs över ett stort antal beräkningsklienter, särskilt om beräkningsklienterna är virtuella Azure-datorer. Det kan hjälpa dig att åtgärda långsamma eller inkonsekventa prestanda som orsakas av långa filåtkomsttider.

Fjärråtkomst till data

Azure HPC Cache kan bidra till att minska svarstiden om din arbetsbelastning behöver komma åt fjärrdata som inte kan flyttas närmare databehandlingsresurserna. Dina poster kan till exempel finnas längst ut i en WAN-miljö, i en annan Azure-region eller i ett kunddatacenter. (Detta kallas ibland "file-bursting".)

Tung begärandebelastning

Om ett stort antal klienter begär data från källan samtidigt kan Azure HPC Cache påskynda filåtkomsten. När det till exempel används med ett högpresterande databehandlingskluster ger Azure HPC Cache skalbarhet för ett stort antal samtidiga begäranden via cachen.

Beräkningsresurser finns i Azure

Virtuella Azure-datorer är ett skalbart och kostnadseffektivt svar på databehandlingsarbetsbelastningar med höga prestanda. Azure HPC Cache kan hjälpa till genom att föra den information de behöver närmare dem, särskilt om de ursprungliga data lagras i ett fjärrsystem.

Om en kund vill köra sin aktuella pipeline "som den är" på virtuella Azure-datorer kan Azure HPC Cache tillhandahålla en POSIX-baserad lösning för delad lagring (eller cachelagring) för skalbarhet.

Genom att använda Azure HPC Cache behöver du inte skapa om arbetspipelinen för att göra interna anrop till Azure Blob Storage. Du kan komma åt dina data i det ursprungliga systemet eller använda HPC Cache för att flytta dem till en ny blobcontainer.

Nästa steg