Compartir a través de


Características de rendimiento del inventario de blobs

El inventario de blobs de Azure Storage es una herramienta esencial para administrar y realizar el seguimiento de los objetos almacenados en la cuenta de Azure Blob Storage. Ofrece una visión general completa de los recursos de almacenamiento, lo que le permite tomar decisiones fundamentadas sobre la administración de datos y la optimización de costos.

Después de habilitar los informes de inventario de blobs, los objetos de la cuenta de almacenamiento se examinan periódicamente mediante las reglas definidas en la directiva de inventario. El tiempo necesario para generar un informe de inventario depende de varios factores. Estos factores incluyen el número de objetos, la estructura de directorios, los filtros aplicados a través de subtipos de regla, la carga de trabajo del cliente en la cuenta de almacenamiento, la disponibilidad de los recursos de almacenamiento y mucho más. En algunos casos, dependiendo de estos factores, puede tardar varios días en finalizar el procesamiento de todos los objetos de la cuenta de almacenamiento. El rendimiento del inventario también puede variar entre exámenes y a veces también durante el examen.

Factores que influyen en el rendimiento del inventario de blobs

Al usar el inventario de blobs para generar un informe de inventario, varios factores clave pueden afectar a su rendimiento. Comprender estos factores puede ayudarle a optimizar los procesos de inventario y a habilitar la administración eficaz de datos.

Distribución de objetos en cuentas jerárquicas habilitadas para el espacio de nombres

La distribución de objetos dentro de una cuenta jerárquica habilitada para el espacio de nombres puede afectar significativamente al rendimiento del inventario. El inventario de blobs examina un directorio cada vez y completa ese examen antes de pasar al siguiente directorio. Por lo tanto, un gran número de directorios, especialmente con distribución dispersa de objetos y anidamiento profundo, puede aumentar el tiempo necesario para generar el informe de inventario.

Número de objetos procesados para la regla de inventario

El número total de objetos examinados en función de una regla de inventario es un factor clave en el rendimiento del procesamiento. Las reglas destinadas a un gran volumen de objetos requieren más tiempo y recursos para generar un informe de inventario. El número de objetos que se van a procesar aumenta si la regla de inventario incluye versiones, instantáneas y objetos eliminados temporalmente. Cuando estos subtipos existen en grandes volúmenes, pueden ampliar aún más el tiempo de procesamiento necesario para generar el informe de inventario.

Formato de exportación del informe de inventario

El formato de exportación elegido para un informe de inventario (CSV o Apache Parquet) puede influir en el rendimiento. Aunque Parquet está optimizado para el procesamiento rápido de datos, presenta una sobrecarga que puede ralentizar la generación de informes en comparación con CSV.

Gran número de objetos eliminados temporalmente

Los objetos eliminados temporalmente, aunque no se quitan permanentemente, se siguen incluyendo en los exámenes de inventario. Un gran volumen de estos objetos puede agregar al tiempo de procesamiento y reducir el rendimiento. Teniendo en cuenta estos factores, puede mejorar el rendimiento de las ejecuciones de inventario y tener una experiencia de administración de datos más eficaz.

Procedimientos recomendados para mejorar el rendimiento del inventario de blobs

La administración eficaz de Azure Blob Storage es esencial para mantener un rendimiento y una rentabilidad óptimos. Estos son algunos procedimientos recomendados para mejorar el rendimiento del inventario de blobs de Azure Storage:

Evitar cuentas dispersas en cuentas jerárquicas habilitadas para el espacio de nombres

Las cuentas dispersas son aquellas que contienen un gran número de objetos distribuidos entre muchos directorios. Estos directorios podrían incluir o no estructuras profundamente anidadas. Las cuentas dispersas dan lugar a una relación de archivos a directorios muy baja, lo que puede provocar ineficiencias en la generación de informes de inventario e incluso provocar errores. Para mitigar estas ineficiencias, asegúrese de que la cuenta de almacenamiento jerárquica habilitada para el espacio de nombres esté bien organizada y evite tener una distribución dispersa de objetos.

Uso de CSV para el formato de exportación

Al generar informes de inventario, opte por el formato csv si el caso de uso no requiere un procesamiento rápido de datos. Parquet es un formato de archivo de almacenamiento en columnas optimizado para el rendimiento y uno de los formatos más rápidos para leer para el procesamiento de datos. Sin embargo, un formato parquet puede aumentar el tiempo necesario para generar informes debido a su sobrecarga, lo que hace que sea más lento que generar un informe en formato csv. Si necesita el formato parquet para posprocesar el informe, puede usar herramientas de código abierto disponibles que conviertan CSV a formato parquet.

Ámbito de la regla de inventario mediante un prefijo

En lugar de ejecutar el inventario en toda la cuenta de almacenamiento, use un filtro de coincidencia de prefijo para generar un informe de inventario para subconjuntos específicos de los datos.

  • Incluir prefijo: este filtro tiene como destino un conjunto de contenedores o rutas de acceso dentro de un contenedor. Este enfoque ayuda a reducir el ámbito del informe de inventario, lo que hace que el proceso sea más rápido y eficaz.

  • Excluir prefijo: use este filtro para excluir algún subconjunto específico de él. Este enfoque también ayuda a restringir el ámbito del informe de inventario. Para más información, consulte Filtros de reglas.

Selección de campos relevantes

Personalice los informes de inventario seleccionando solo los campos pertinentes que necesita. Esto reduce la cantidad de datos procesados y exportados, lo que conduce a una generación de informes más rápida y un análisis más sencillo. Para más información sobre los campos de esquema de inventario, consulte Campos de esquema personalizados compatibles con el inventario de blobs.

Inclusión de subtipos: objetos eliminados, instantáneas y versiones

Aunque incluir estos subtipos puede proporcionar una vista más completa de la cuenta de almacenamiento, es importante evaluar si son esenciales para sus necesidades de auditoría y administración. Si no son críticos, excluirlos puede ayudar a mejorar el rendimiento y la eficacia del proceso de generación de informes. Para identificar los objetos eliminados en ejecuciones de inventario recientes, compare los nombres de blob de la ejecución actual con los de una ejecución anterior. La diferencia puede proporcionar una lista de objetos eliminados recientemente.

Suscripción a eventos de inventario de blobs

Manténgase informado sobre los errores provocados por el usuario mediante la suscripción a eventos de inventario de blobs. Este enfoque proactivo le ayuda a solucionar rápidamente los problemas. Para más información sobre cómo suscribirse a eventos de inventario, consulte Suscripción al evento completado de la directiva de inventario de blobs.

Supervisión de aumentos inesperados de la capacidad

Preste atención a picos inesperados en la capacidad de la cuenta de almacenamiento, ya que podrían indicar la acumulación de versiones de blobs, instantáneas o objetos eliminados temporalmente. La supervisión de estos cambios puede ayudarle a detectar y resolver posibles problemas antes de que afecten al rendimiento. Además, administrar el ciclo de vida de estos objetos puede evitar la compilación innecesaria y mejorar el rendimiento del inventario de blobs. Para más información sobre la administración del ciclo de vida de los blobs, consulte Introducción a la administración del ciclo de vida de Azure Blob Storage.

Siguiendo estos procedimientos recomendados, puede mejorar el rendimiento del inventario de blobs, lo que garantiza una administración eficaz y eficaz de Azure Blob Storage.

Pasos siguientes