Inzicht in cachegebruiksmodellen

Met cachegebruiksmodellen kunt u aanpassen hoe uw Azure HPC Cache bestanden opslaat om uw werkstroom te versnellen.

Basisconcepten voor het opslaan van bestanden in cache

Bestandscaching is de wijze waarop Azure HPC Cache clientaanvragen versnelt. Deze basisprocedures worden gebruikt:

  • Leescaching : Azure HPC Cache bewaart een kopie van bestanden die clients van het opslagsysteem aanvragen. De volgende keer dat een client hetzelfde bestand aanvraagt, kan HPC Cache de versie in de cache opgeven in plaats van het bestand opnieuw op te halen uit het back-endopslagsysteem. Schrijfaanvragen worden doorgegeven aan het back-endopslagsysteem.

  • Opslaan in cache- Optioneel kan Azure HPC Cache een kopie opslaan van gewijzigde bestanden die worden verzonden vanaf de clientcomputers. Als meerdere clients gedurende een korte periode wijzigingen aanbrengen in hetzelfde bestand, kan de cache alle wijzigingen in de cache verzamelen in plaats van elke wijziging afzonderlijk naar het back-endopslagsysteem te schrijven. Na een opgegeven hoeveelheid tijd zonder wijzigingen verplaatst de cache het bestand naar het langetermijnopslagsysteem.

  • Verificatietimer : de instelling voor de verificatietimer bepaalt hoe vaak de lokale kopie van een bestand wordt vergeleken met de externe versie op het back-endopslagsysteem. Als de back-endkopie nieuwer is dan de kopie in de cache, haalt de cache de externe kopie op en slaat deze op voor toekomstige aanvragen.

    De instelling voor de verificatietimer wordt weergegeven wanneer de cache de bestanden automatisch vergelijkt met bronbestanden in externe opslag. U kunt echter afdwingen dat Azure HPC Cache bestanden vergelijkt door een mapbewerking uit te voeren die een readdirplus-aanvraag bevat. Readdirplus is een standaard NFS-API (ook wel uitgebreide leesbewerking genoemd) die mapmetagegevens retourneert, waardoor de cache bestanden vergelijkt en bijwerkt.

  • Timer voor terugschrijven : voor een cache met cache voor lezen/schrijven is de timer voor terugschrijven de maximale hoeveelheid tijd in seconden die de cache wacht voordat een gewijzigd bestand naar het back-endopslagsysteem wordt gekopieerd.

De gebruiksmodellen die zijn ingebouwd in Azure HPC Cache hebben verschillende waarden voor deze instellingen, zodat u de beste combinatie voor uw situatie kunt kiezen.

Het juiste gebruiksmodel voor uw werkstroom kiezen

U moet een gebruiksmodel kiezen voor elk NFS-protocolopslagdoel dat u gebruikt. Azure Blob Storage-doelen hebben een ingebouwd gebruiksmodel dat niet kan worden aangepast.

Met HPC Cache-gebruiksmodellen kunt u kiezen hoe u snel kunt reageren met het risico dat verouderde gegevens worden opgehaald. Als u de snelheid voor het lezen van bestanden wilt optimaliseren, is het misschien niet belangrijk of de bestanden in de cache worden gecontroleerd op de back-endbestanden. Als u er echter voor wilt zorgen dat uw bestanden altijd up-to-date zijn met de externe opslag, kiest u een model en stelt u de verificatietimer in op een laag aantal om regelmatig te controleren.

Dit zijn de opties voor het gebruiksmodel:

  • Alleen-lezen caching : gebruik deze optie als u de leestoegang tot bestanden wilt versnellen. Kies deze optie wanneer uw werkstroom minimale schrijfbewerkingen omvat, zoals 0% tot 5%.

    Met deze optie worden leesbewerkingen van clients in de cache opgeslagen, maar worden schrijfbewerkingen niet in de cache opgeslagen. Schrijfbewerkingen worden doorgegeven aan de back-endopslag.

    Bestanden die in de cache zijn opgeslagen, worden niet automatisch vergeleken met de bestanden op het NFS-opslagvolume. (Lees de beschrijving van de verificatietimer hierboven voor meer informatie over hoe u deze handmatig kunt vergelijken.)

    Wanneer u de optie Alleen-lezencache kiest, kunt u de verificatietimer wijzigen. De standaardwaarde is 30 seconden. De waarde moet een geheel getal zijn (geen decimalen) tussen 1 en 31536000 seconden (1 jaar).

  • Opslaan in cache voor lezen/schrijven: met deze optie worden lees- en schrijfbewerkingen in de cache opgeslagen. Wanneer u deze optie gebruikt, krijgen de meeste clients naar verwachting toegang tot bestanden via de Azure HPC Cache in plaats van de back-endopslag rechtstreeks te koppelen. De bestanden in de cache hebben recente wijzigingen die nog niet naar de back-end zijn gekopieerd.

    In dit gebruiksmodel worden bestanden in de cache standaard alleen elke acht uur gecontroleerd op de bestanden in back-endopslag. De versie in de cache van het bestand wordt ervan uitgegaan dat deze actueler is. Een gewijzigd bestand in de cache wordt standaard naar het back-endopslagsysteem geschreven nadat het gedurende een uur in de cache is geweest.

    Wanneer u de optie Lezen/schrijven in cache kiest, kunt u zowel de verificatietimer als de timer Voor terugschrijven wijzigen. De standaardwaarde voor de verificatietimer is 28.800 seconden (8 uur). De waarde moet een geheel getal zijn (geen decimalen) tussen 1 en 31536000 inclusief. De standaardwaarde voor de timer voor terugschrijven is 3600 seconden (1 uur). De waarde moet een geheel getal zijn (geen decimalen) tussen 1 en 31536000 seconden (1 jaar).

Deze tabel bevat een overzicht van de verschillen in het gebruiksmodel:

Gebruiksmodel Cachemodus Verificatietimer Timer voor terugschrijven
Alleen-lezen opslaan in cache Read 30 seconden Geen
Opslaan in cache voor lezen/schrijven Lezen/schrijven 8 uur 1 uur

Waarschuwing

Het wijzigen van gebruiksmodellen veroorzaakt een serviceonderbreking. HPC Cache-clients ontvangen geen antwoorden tijdens de overgang van het gebruiksmodel. Als u gebruiksmodellen moet wijzigen, is het raadzaam dat de wijziging wordt aangebracht tijdens een gepland onderhoudsvenster om onderbreking van de client te voorkomen.

Als u vragen hebt over het beste gebruiksmodel voor uw Azure HPC Cache-werkstroom, neemt u contact op met uw Azure-vertegenwoordiger of opent u een ondersteuningsaanvraag voor hulp.

Tip

Er is een hulpprogramma beschikbaar om specifieke afzonderlijke bestanden terug te schrijven naar een opslagdoel zonder de volledige inhoud van de cache te schrijven. Meer informatie over het flush_file.py script in Write-back van bestanden aanpassen in Azure HPC Cache.

Volgende stappen