Compartir a través de


Optimiza las particiones de blobs

Si sus clientes cargan datos utilizando tamaños de bloque pequeños, puede mejorar el rendimiento al elegir un esquema de nomenclatura eficaz. Un tamaño de bloque pequeño es menor que 256 KiB. Los bloques más grandes no se ven afectados por la nomenclatura de particiones.

Claves de partición y esquemas de nomenclatura eficaces

La clave de partición de un blob es el nombre de cuenta + nombre del contenedor + nombre del blob. La clave de partición se usa para dividir los datos en intervalos y estos intervalos están equilibrados de carga en todo el sistema.

Para ayudar a los datos de partición del sistema de forma más eficaz, evite esquemas de nomenclatura secuenciales como log20160101, log20160102, log20160103. Estos esquemas concentran el tráfico en un servidor, lo que puede superar los objetivos de escalabilidad y causar problemas de latencia.

En su lugar, agregue una secuencia de caracteres hash (como tres dígitos) lo antes posible en la clave de partición de un blob. Si planea usar marcas de tiempo en nombres, considere la posibilidad de agregar un valor de segundos al principio de esa marca de tiempo (por ejemplo: ssyyyymmdd).

Si usa marcas de tiempo o identificadores numéricos, evite patrones de solo adjunción o solo adición anterior. Estos patrones enrutan todo el tráfico a una sola partición, lo que impide el equilibrio de carga. Sin embargo, si planea usar estos patrones, considere la posibilidad de dividir los datos en varios blobs. Aplique un prefijo hash a cada blob que represente un intervalo de tiempo, como segundos (ss) o minutos (mm). De este modo, el tráfico no se dirige repetidamente a un único blob en un único servidor de particiones que podría superar los límites de escalabilidad.

Pasos siguientes