¿Azure HPC Cache es una opción adecuada para su trabajo?

Azure HPC Cache puede acelerar el acceso a los datos para los trabajos de informática de alto rendimiento en diversas materias. Pero no es perfecto para todo tipo de flujo de trabajo. En este artículo se dan instrucciones sobre cómo decidir si HPC Cache es una buena opción según sus necesidades.

En el artículo de Información general también se ofrece un breve resumen de cuándo usar Azure HPC Cache y algunos ejemplos de casos de uso.

Consulte también este artículo acerca de cómo usar de manera eficaz el almacenamiento de blobs montado en NFS.

Aplicaciones NFS versión 3.0

Azure HPC Cache solo es compatible con los clientes NFS 3.0.

Proporción lectura-escritura elevada

Las cargas de trabajo en las que los clientes de proceso realizan más operaciones de lectura que de escritura suelen ser buenas candidatas para una caché. Por ejemplo, si la proporción lectura-escritura es 80/20 o 70/30, Azure HPC Cache puede ayudar al proporcionar los archivos solicitados con frecuencia desde la memoria caché, en lugar de que sea necesario recuperarlos desde el almacenamiento remoto una y otra vez.

Recuperar un archivo y almacenarlo en la memoria caché por primera vez tiene una pequeña latencia adicional en comparación con una solicitud de cliente normal directamente al almacenamiento, por lo que la mejora de la eficacia se producirá la próxima vez que un cliente solicite el mismo archivo. Esto sucede en particular con los archivos de gran tamaño. Si cada solicitud de cliente es única, el impacto de HPC Cache será limitado. Pero cuanto mayor sea el tamaño del archivo, mejor será el rendimiento con el tiempo después de ese primer acceso.

Carga de trabajo analítica basada en archivos

Azure HPC Cache es la opción ideal para una canalización que usa datos basados en archivos y se ejecuta en un gran número de clientes de proceso, sobre todo si los clientes de proceso son máquinas virtuales de Azure. Puede ayudar a corregir un rendimiento lento o incoherente causado por los tiempos prolongados de acceso a archivos.

Acceso a datos remotos

Azure HPC Cache puede ayudar a reducir la latencia si la carga de trabajo necesita acceder a datos remotos que no se pueden trasladar más cerca de los recursos de informática. Por ejemplo, los registros pueden estar en el extremo de un entorno WAN, en otra región de Azure o en un centro de datos del cliente. (A veces a esto se le denomina "expansión de archivos").

Sobrecarga de solicitudes

Si un gran número de clientes solicitan datos del origen al mismo tiempo, Azure HPC Cache agiliza el acceso a los archivos. Por ejemplo, cuando se usa con un clúster de informática de alto rendimiento, Azure HPC Cache ofrece escalabilidad para un gran número de solicitudes simultáneas a través de la caché.

Los recursos de proceso se encuentran en Azure

Las máquinas virtuales de Azure son una solución escalable y rentable para las cargas de trabajo de informática de alto rendimiento. Azure HPC Cache acerca la información necesaria a las cargas, sobre todo si los datos originales se almacenan en un sistema remoto.

Si un cliente quiere ejecutar la canalización actual "tal cual" en máquinas virtuales de Azure, Azure HPC Cache puede proporcionarle una solución de almacenamiento compartido (o almacenamiento en caché) basada en POSIX para la escalabilidad.

Al usar Azure HPC Cache, no es necesario rediseñar la canalización de trabajo para hacer llamadas nativas a Azure Blob Storage. Puede acceder a los datos en su sistema original o usar HPC Cache para moverlos a un nuevo contenedor de blobs.

Pasos siguientes