Descripción de los modelos de uso de caché

Los modelos de uso de caché permiten personalizar cómo Azure HPC Cache almacena los archivos para agilizar el flujo de trabajo.

Conceptos básicos del almacenamiento en caché de archivos

El almacenamiento en caché de archivos es la forma en que Azure HPC Cache agiliza las solicitudes de cliente. Usa estas prácticas básicas:

  • Almacenamiento en caché de lectura: Azure HPC Cache conserva una copia de los archivos que los clientes solicitan del sistema de almacenamiento. La próxima vez que un cliente solicite el mismo archivo, HPC Cache puede proporcionar la versión de su memoria caché, en lugar de tener que recuperar el archivo del sistema de almacenamiento de back-end. Las solicitudes de escritura se pasan al sistema de almacenamiento de back-end.

  • Almacenamiento en caché de escritura: opcionalmente, Azure HPC Cache puede almacenar una copia de los archivos modificados que se enviaron desde los equipos cliente. Si varios clientes realizan cambios en el mismo archivo durante un breve período de tiempo, la memoria caché puede recopilar todos los cambios en la memoria caché, en lugar de que deba escribir cada cambio individualmente en el sistema de almacenamiento de back-end. Después de un período de tiempo especificado sin cambios, la memoria caché mueve el archivo al sistema de almacenamiento a largo plazo.

  • Temporizador de comprobación: la configuración del temporizador de comprobación determina la frecuencia con la que la memoria caché compara su copia local de un archivo con la versión remota en el sistema de almacenamiento de back-end. Si la copia de back-end es más reciente que la copia almacenada en caché, la memoria caché recupera la copia remota y la almacena para futuras solicitudes.

    La configuración del temporizador de comprobación muestra cuándo la caché compara automáticamente sus archivos con los archivos de origen que están en el almacenamiento remoto. Sin embargo, puede forzar que Azure HPC Cache compare los archivos mediante una operación de directorio que incluye una solicitud readdirplus. Readdirplus es una API NFS estándar (también llamada lectura extendida) que devuelve metadatos de directorio, lo que hace que la caché compare y actualice los archivos.

  • Temporizador de escritura diferida: para caché con almacenamiento en caché de lectura y escritura, el temporizador de escritura diferida es la cantidad máxima de tiempo en segundos que la caché espera antes de copiar un archivo cambiado en el sistema de almacenamiento de back-end.

Los modelos de uso integrados en Azure HPC Cache tienen diferentes valores para esta configuración, de modo que puede elegir la mejor combinación para su situación.

Elección del modelo de uso correcto para el flujo de trabajo

Debe elegir un modelo de uso para cada destino de almacenamiento con protocolo NFS que use. Los destinos de Azure Blob Storage tienen un modelo de uso integrado que no se puede personalizar.

Los modelos de uso de HPC Cache permiten elegir cómo equilibrar una respuesta rápida con el riesgo de obtener datos obsoletos. Si quiere optimizar la velocidad de lectura de los archivos, es posible que no le interese si los archivos de la memoria caché se comparan con los archivos de back-end. Por otro lado, si desea asegurarse de que los archivos estén siempre actualizados con el almacenamiento remoto, elija un modelo y establezca el temporizador de comprobación en un número bajo para realizar la comprobación con frecuencia.

Estas son las opciones del modelo de uso:

  • Almacenamiento en caché de solo lectura: use esta opción si quiere acelerar el acceso de lectura a los archivos. Elija esta opción cuando el flujo de trabajo implique operaciones de escritura mínimas, como el 0 % al 5 %.

    Esta opción almacena en caché las lecturas del cliente, pero no almacena en caché las escrituras. Las escrituras pasan al almacenamiento de back-end.

    Los archivos almacenados en la memoria caché no se comparan automáticamente con los archivos del volumen de almacenamiento NFS. (Lea la descripción del temporizador de comprobación anterior para obtener información sobre cómo compararlos manualmente).

    Al elegir la opción Almacenamiento en caché de solo lectura, puede cambiar el temporizador de comprobación. El valor predeterminado es 30 segundos. El valor debe ser un entero (sin decimales) comprendido entre 1 y 31 536 000 segundos (1 año).

  • Almacenamiento en caché de lectura y escritura: esta opción almacena en caché las operaciones de lectura y escritura. Al usar esta opción, la mayoría de los clientes deben acceder a los archivos mediante Azure HPC Cache en lugar de montar el almacenamiento de back-end directamente. Los archivos almacenados en caché contendrán cambios recientes que todavía no se han copiado en el back-end.

    En este modelo de uso, los archivos de la caché solo se comparan de manera predeterminada con los archivos del almacenamiento de back-end cada ocho horas. Se supone que la versión en caché del archivo es más actual. Un archivo modificado en la caché se escribe en el sistema de almacenamiento de back-end después de que esté en la caché durante 20 minutos

    Al elegir la opción Almacenamiento en caché de lectura y escritura, puede cambiar tanto el temporizador de comprobación como el temporizador de escritura diferida. El valor predeterminado del temporizador de comprobación es de 28 800 segundos (8 horas). El valor debe ser un entero (sin decimales) entre 1 y 31 536 000 inclusive. El valor predeterminado del temporizador de escritura diferida es de 3600 segundos (1 hora). El valor debe ser un entero (sin decimales) comprendido entre 1 y 31 536 000 segundos (1 año).

En esta tabla se resumen las diferencias de los modelos de uso:

Modelo de uso Modo de almacenamiento en caché Temporizador de comprobación Temporizador de escritura diferida
Almacenamiento en caché de solo lectura Lectura 30 segundos None
Almacenamiento en caché de lectura y escritura Lectura/escritura 8 horas 1 hora

Advertencia

Cambiar los modelos de uso provoca una interrupción del servicio. Los clientes de HPC Cache no recibirán respuestas mientras se realiza la transición del modelo de utilización. Si debe cambiar los modelos de uso, se recomienda que el cambio se realice durante una ventana de mantenimiento programado para evitar la interrupción del cliente.

Si tiene alguna pregunta sobre el mejor modelo de uso para su flujo de trabajo de Azure HPC Cache, hable con su representante de Azure o abra una solicitud de soporte técnico para obtener ayuda.

Sugerencia

Hay una utilidad está disponible para volver a escribir archivos individuales específicos en un destino de almacenamiento sin tener que escribir todo el contenido de la caché. Obtenga más información sobre el script de flush_file.py en Personalización de la escritura diferida de archivos en Azure HPC Cache.

Pasos siguientes