Partilhar via


Características de desempenho do inventário de blobs

O inventário de blob do Armazenamento do Azure é uma ferramenta essencial para gerenciar e controlar os objetos armazenados em sua conta de Armazenamento de Blob do Azure. Ele oferece uma visão geral abrangente de seus recursos de armazenamento, permitindo que você tome decisões informadas sobre gerenciamento de dados e otimização de custos.

Depois de habilitar os relatórios de inventário de blob, os objetos em sua conta de armazenamento são verificados periodicamente usando as regras definidas na política de inventário. O tempo necessário para gerar um relatório de inventário depende de vários fatores. Esses fatores incluem o número de objetos, a estrutura de diretórios, os filtros aplicados por meio de subtipos de regras, a carga de trabalho do cliente na conta de armazenamento, a disponibilidade de recursos de armazenamento e muito mais. Em alguns casos, dependendo desses fatores, pode levar vários dias para concluir o processamento de todos os objetos na conta de armazenamento. O desempenho do inventário também pode variar entre varreduras e, às vezes, durante a varredura também.

Fatores que influenciam o desempenho do inventário de blob

Ao usar o inventário de blob para gerar um relatório de inventário, vários fatores-chave podem afetar seu desempenho. Compreender esses fatores pode ajudá-lo a otimizar os processos de inventário e permitir o gerenciamento eficiente de dados.

Distribuição de objetos em contas hierárquicas habilitadas para namespace

A distribuição de objetos em uma conta habilitada para namespace hierárquico pode afetar significativamente o desempenho do inventário. O inventário de Blob verifica um diretório de cada vez e conclui essa verificação antes de passar para o próximo diretório. Portanto, um alto número de diretórios, especialmente com distribuição de objetos esparsa e aninhamento profundo, pode aumentar o tempo necessário para gerar o relatório de inventário.

Número de objetos processados para a regra de inventário

O número total de objetos digitalizados com base em uma regra de inventário é um fator-chave no desempenho do processamento. As regras destinadas a um grande volume de objetos exigem mais tempo e recursos para gerar um relatório de inventário. O número de objetos a serem processados aumenta se a regra de inventário incluir versões, instantâneos e objetos excluídos por software. Quando esses subtipos existem em grandes volumes, eles podem estender ainda mais o tempo de processamento necessário para gerar o relatório de inventário.

Formato de exportação do relatório de inventário

O formato de exportação escolhido para um relatório de inventário (CSV ou Apache Parquet) pode influenciar o desempenho. Embora o Parquet seja otimizado para processamento rápido de dados, ele introduz sobrecarga que pode retardar a geração de relatórios em comparação com o CSV.

Grande número de objetos excluídos suavemente

Objetos excluídos por software, embora não sejam removidos permanentemente, ainda estão incluídos nas verificações de inventário. Um alto volume desses objetos pode aumentar o tempo de processamento e reduzir o desempenho. Ao considerar esses fatores, você pode melhorar o desempenho de suas execuções de inventário e ter uma experiência de gerenciamento de dados mais eficiente.

Práticas recomendadas para melhorar o desempenho do inventário de blob

O gerenciamento eficiente do Armazenamento de Blobs do Azure é essencial para manter o desempenho ideal e a relação custo-benefício. Aqui estão algumas práticas recomendadas para aprimorar o desempenho do inventário de blob do Armazenamento do Azure:

Evite contas esparsas em contas hierárquicas habilitadas para namespace

Contas esparsas são aquelas que contêm um grande número de objetos espalhados por muitos diretórios. Esses diretórios podem ou não incluir estruturas profundamente aninhadas. Contas esparsas resultam em uma relação arquivo/diretório muito baixa, o que pode causar ineficiências na geração de relatórios de inventário e até mesmo levar a falhas. Para atenuar essas ineficiências, certifique-se de que sua conta de armazenamento hierárquica habilitada para namespace esteja bem organizada e evite ter uma distribuição esparsa de objetos.

Usar CSV para o formato de exportação

Ao gerar relatórios de inventário, opte pelo formato csv se o seu caso de uso não exigir processamento rápido de dados. O Parquet é um formato de arquivo de armazenamento colunar otimizado para desempenho e um dos formatos mais rápidos de leitura para processamento de dados. No entanto, um formato parquet pode aumentar o tempo necessário para gerar relatórios devido à sua sobrecarga que o torna mais lento do que gerar um relatório em formato csv. Se você precisar do formato parquet para pós-processar seu relatório, poderá utilizar ferramentas de código aberto disponíveis que convertem CSV para o formato parquet.

Definir o escopo da regra de inventário usando um prefixo

Em vez de executar o inventário em toda a conta de armazenamento, use um filtro de correspondência de prefixo para gerar um relatório de inventário para subconjuntos específicos de seus dados.

  • Prefixo de inclusão: esse filtro tem como alvo um conjunto de contêineres ou caminhos dentro de um contêiner. Essa abordagem ajuda a reduzir o escopo do relatório de inventário, tornando o processo mais rápido e eficiente.

  • Prefixo de exclusão: use este filtro para excluir algum subconjunto específico dele. Essa abordagem também ajuda a restringir o escopo do relatório de inventário. Para saber mais, consulte Filtros de regra

Selecione campos relevantes

Personalize seus relatórios de inventário selecionando apenas os campos relevantes de que você precisa. Isso reduz a quantidade de dados processados e exportados, levando a uma geração de relatórios mais rápida e a uma análise mais fácil. Para saber mais sobre os campos do esquema de inventário, consulte Campos de esquema personalizados suportados para inventário de blob

Inclusão de subtipo: objetos excluídos, instantâneos e versões

Embora a inclusão desses subtipos possa fornecer uma visão mais abrangente da sua conta de armazenamento, é importante avaliar se eles são essenciais para suas necessidades de auditoria e gerenciamento. Se não forem críticos, excluí-los pode ajudar a melhorar o desempenho e a eficiência do seu processo de geração de relatórios. Para identificar objetos excluídos em execuções de inventário recentes, compare os nomes de blob da execução atual com os de uma execução anterior. A diferença pode fornecer uma lista de objetos excluídos recentemente.

Inscrever-se em eventos de inventário de blob

Mantenha-se informado sobre erros induzidos pelo usuário assinando eventos de inventário de blob. Esta abordagem proativa ajuda-o a resolver rapidamente os problemas. Para saber mais sobre como se inscrever em eventos de inventário, consulte Inscrever-se no evento concluído da política de inventário de blobs.

Monitore aumentos inesperados na capacidade

Preste atenção a picos inesperados na capacidade da sua conta de armazenamento, pois eles podem sinalizar o acúmulo de versões de blob, instantâneos ou objetos excluídos por software. O monitoramento dessas alterações pode ajudá-lo a detetar e resolver possíveis problemas antes que eles afetem o desempenho. Além disso, o gerenciamento do ciclo de vida desses objetos pode evitar acúmulo desnecessário e melhorar o desempenho do Inventário de Blobs. Para saber mais sobre o gerenciamento do ciclo de vida do blob, consulte Visão geral do gerenciamento do ciclo de vida do Armazenamento de Blob do Azure

Seguindo essas práticas recomendadas, você pode aprimorar o desempenho do seu inventário de blobs, garantindo um gerenciamento eficiente e eficaz do seu Armazenamento de Blobs do Azure.

Próximos passos