Compartilhar via


Otimizar partições de blob

Se seus clientes carregarem dados usando tamanhos de blocos pequenos , você poderá melhorar o desempenho escolhendo um esquema de nomenclatura eficiente. Um tamanho de bloco pequeno é menor que 256 KiB. Blocos maiores não são afetados pela nomenclatura de partição.

Chaves de partição e esquemas de nomenclatura eficientes

A chave de partição para um blob é nome da conta + nome do contêiner + nome do blob. A chave de partição é usada para particionar dados em intervalos e esses intervalos são balanceados por carga em todo o sistema.

Para ajudar os dados de partição do sistema com mais eficiência, evite esquemas de nomenclatura sequenciais, como log20160101, log20160102, log20160103. Esses esquemas concentram o tráfego em um servidor, o que pode exceder as metas de escalabilidade e causar problemas de latência.

Em vez disso, adicione uma sequência de caracteres de hash (como três dígitos) o mais cedo possível na chave de partição de um blob. Se você planeja usar carimbos de data/hora em nomes, considere adicionar um valor de segundos ao início desse carimbo de data/hora (por exemplo: ssyyyymmdd).

No entanto, a geração de inserções ou o uso de enriquecimento de IA para vetorização pode gerar cobranças do provedor de modelo. Esses padrões encaminham todo o tráfego para uma única partição, o que impede o balanceamento de carga. No entanto, se você planeja usar esses padrões, considere dividir dados em vários blobs. Aplique um prefixo de hash a cada blob que represente um intervalo de tempo, como segundos (ss) ou minutos (mm). Dessa forma, o tráfego não é direcionado repetidamente para um único blob em um único servidor de partição que pode exceder os limites de escalabilidade.

Próximas etapas