Compartilhar via


Características de desempenho do inventário de blobs

O inventário de blobs do Armazenamento do Azure é uma ferramenta essencial para gerenciar e acompanhar os objetos armazenados em sua conta de Armazenamento de Blobs do Azure. Ele oferece uma visão geral abrangente dos recursos de armazenamento, permitindo que você tome decisões informadas sobre gerenciamento de dados e otimização de custos.

Depois de habilitar relatórios de inventário de blob, os objetos em sua conta de armazenamento são verificados periodicamente usando as regras definidas na política de inventário. O tempo necessário para gerar um relatório de inventário depende de vários fatores. Esses fatores incluem o número de objetos, a estrutura do diretório, os filtros aplicados por meio de subtipos de regra, a carga de trabalho do cliente na conta de armazenamento, a disponibilidade dos recursos de armazenamento e muito mais. Em alguns casos, dependendo desses fatores, pode levar vários dias para concluir o processamento de todos os objetos na conta de armazenamento. O desempenho do inventário também pode variar entre verificações e, às vezes, durante a verificação também.

Fatores que influenciam o desempenho do inventário de blobs

Ao usar o inventário de blobs para gerar um relatório de inventário, vários fatores-chave podem afetar seu desempenho. Entender esses fatores pode ajudá-lo a otimizar os processos de inventário e habilitar o gerenciamento eficiente de dados.

Distribuição de objetos em contas hierárquicas habilitadas para namespace

A distribuição de objetos em uma conta hierárquica habilitada para namespace pode afetar significativamente o desempenho do inventário. O inventário de blobs examina um diretório de cada vez e conclui essa verificação antes de passar para o próximo diretório. Portanto, um alto número de diretórios, especialmente com distribuição de objetos esparsos e aninhamento profundo, pode aumentar o tempo necessário para gerar o relatório de inventário.

Número de objetos processados para a regra de inventário

O número total de objetos verificados com base em uma regra de inventário é um fator-chave no desempenho do processamento. As regras direcionadas a um grande volume de objetos exigem mais tempo e recursos para gerar um relatório de inventário. O número de objetos a serem processados aumentará se a regra de inventário incluir versões, instantâneos e objetos excluídos suavemente. Quando esses subtipos existem em grandes volumes, eles podem estender ainda mais o tempo de processamento necessário para gerar o relatório de inventário.

Formato de exportação do relatório de inventário

O formato de exportação escolhido para um relatório de inventário (CSV ou Apache Parquet) pode influenciar o desempenho. Embora o Parquet seja otimizado para processamento rápido de dados, ele apresenta uma sobrecarga que pode diminuir a geração de relatórios em comparação com o CSV.

Grande número de objetos com exclusão reversível

Objetos excluídos suavemente, embora não permanentemente removidos, ainda estão incluídos em verificações de inventário. Um alto volume desses objetos pode adicionar ao tempo de processamento e reduzir o desempenho. Considerando esses fatores, você pode melhorar o desempenho de suas execuções de inventário e ter uma experiência de gerenciamento de dados mais eficiente.

Práticas recomendadas para melhorar o desempenho do inventário de blobs

O gerenciamento eficiente do Armazenamento de Blobs do Azure é essencial para manter o desempenho ideal e o custo-efetividade. Aqui estão algumas práticas recomendadas para aprimorar o desempenho do inventário de blobs do Armazenamento do Azure:

Evitar contas esparsas em contas hierárquicas habilitadas para namespace

Contas esparsas são aquelas que contêm um grande número de objetos espalhados por vários diretórios. Esses diretórios podem ou não incluir estruturas profundamente aninhadas. Contas esparsas resultam em uma taxa muito baixa de arquivo para diretório, o que pode causar ineficiências na geração de relatórios de inventário e até levar a falhas. Para atenuar essas ineficiências, verifique se sua conta de armazenamento hierárquica habilitada para namespace está bem organizada e evite ter uma distribuição esparsa de objetos.

Usar CSV para o formato de exportação

Ao gerar relatórios de inventário, opte pelo formato csv se o caso de uso não exigir processamento rápido de dados. Parquet é um formato de arquivo de armazenamento columnar otimizado para desempenho e um dos formatos mais rápidos a serem lidos para processamento de dados. No entanto, um formato parquet pode aumentar o tempo necessário para gerar relatórios devido à sua sobrecarga, o que o torna mais lento do que gerar um relatório no formato csv. Se você precisar do formato parquet para pós-processar seu relatório, poderá utilizar ferramentas de software livre disponíveis que convertem O CSV no formato parquet.

Escopo de sua regra de inventário usando um prefixo

Em vez de executar o inventário em toda a conta de armazenamento, use um filtro de correspondência de prefixo para gerar um relatório de inventário para subconjuntos específicos de seus dados.

  • Incluir Prefixo: esse filtro destina-se a um conjunto de contêineres ou caminhos dentro de um contêiner. Essa abordagem ajuda a restringir o escopo do relatório de inventário, tornando o processo mais rápido e eficiente.

  • Excluir Prefixo: use este filtro para excluir algum subconjunto específico dele. Essa abordagem também ajuda a restringir o escopo do relatório de inventário. Para saber mais, confira os filtros de regra

Selecionar campos relevantes

Personalize seus relatórios de inventário selecionando apenas os campos relevantes necessários. Fazer isso reduz a quantidade de dados processados e exportados, levando a uma geração de relatórios mais rápida e uma análise mais fácil. Para saber mais sobre os campos de esquema de inventário, consulte campos de esquema personalizados com suporte para inventário de blobs

Inclusão de subtipo: objetos excluídos, instantâneos e versões

Embora a inclusão desses subtipos possa fornecer uma visão mais abrangente da sua conta de armazenamento, é importante avaliar se eles são essenciais para suas necessidades de auditoria e gerenciamento. Se elas não forem críticas, excluí-las poderá ajudar a melhorar o desempenho e a eficiência do processo de geração de relatórios. Para identificar objetos excluídos em execuções de inventário recentes, compare os nomes de blob da execução atual com os de uma execução anterior. A diferença pode fornecer uma lista de objetos excluídos recentemente.

Assinar eventos de inventário de blob

Mantenha-se informado sobre erros induzidos pelo usuário assinando eventos de inventário de blob. Essa abordagem proativa ajuda você a resolver rapidamente os problemas. Para saber mais sobre como assinar eventos de inventário, consulte Assinar o evento concluído da política de inventário de blob.

Monitorar aumentos inesperados na capacidade

Preste atenção aos picos inesperados na capacidade da sua conta de armazenamento, pois eles podem sinalizar o acúmulo de versões de blob, instantâneos ou objetos excluídos suavemente. Monitorar essas alterações pode ajudá-lo a detectar e resolver possíveis problemas antes que elas afetem o desempenho. Além disso, o gerenciamento do ciclo de vida desses objetos pode impedir o acúmulo desnecessário e melhorar o desempenho do Inventário de Blobs. Para saber mais sobre o gerenciamento do ciclo de vida do blob, confira a visão geral do gerenciamento do ciclo de vida do Armazenamento de Blobs do Azure

Seguindo essas práticas recomendadas, você pode aprimorar o desempenho do inventário de blobs, garantindo um gerenciamento eficiente e eficaz do Armazenamento de Blobs do Azure.

Próximas etapas