Compartir a través de


Eficiencia del rendimiento del almacén de lago de datos

En este artículo se tratan los principios arquitectónicos del pilar de eficiencia del rendimiento, que se refiere a la capacidad de un sistema para adaptarse a los cambios de carga.

Diagrama de arquitectura del almacén de lago de eficiencia del rendimiento para Databricks.

Principios de eficiencia del rendimiento

  1. Usar arquitecturas sin servidor

    Las arquitecturas sin servidor no requieren que los clientes operen y mantengan la infraestructura informática en la nube. Esto elimina la sobrecarga operativa que supone administrar la infraestructura en la nube y reduce los costos de transacción porque los servicios administrados funcionan a escala de nube. También proporcionan disponibilidad inmediata, seguridad integrada y requieren una configuración o administración mínimas.

  2. Diseño de cargas de trabajo para el rendimiento

    En el caso de cargas de trabajo repetidas, como las canalizaciones de ingeniería de datos, el rendimiento nunca debe ser una reflexión posterior. Los datos se deben:

    • Leer de la memoria del objeto de forma eficiente.
    • Transformar de forma eficiente.
    • Publicar de forma eficiente para su consumo.

    Además, la mayoría de las canalizaciones o patrones de consumo usan una cadena de sistemas. Para lograr el mejor rendimiento posible, se debe tener en cuenta toda la cadena y seleccionarla para obtener el mejor rendimiento.

  3. Ejecución de pruebas de rendimiento en el ámbito del desarrollo

    Cada carga de trabajo de desarrollo debe someterse a pruebas de rendimiento continuas. Las pruebas garantizan que cualquier cambio en la base de código no afecte negativamente al rendimiento de la carga de trabajo. Establezca una programación periódica para efectuar las pruebas. Ejecute la prueba como parte de un evento programado o como parte de una canalización de compilación de integración continua (CI).

    Establezca las bases de referencia del rendimiento y determine la eficiencia actual de las cargas de trabajo y su infraestructura de apoyo. La medición del rendimiento en comparación con las bases de referencia puede proporcionar estrategias de mejora y determinar si la aplicación cumple los objetivos de negocio.

    Identifique los cuellos de botella que pueden afectar al rendimiento. Estos cuellos de botella pueden deberse a errores de código o a una configuración errónea de un servicio. Normalmente, los cuellos de botella empeoran a medida que aumenta la carga.

  4. Supervisión del rendimiento

    Asegúrese de que los recursos y servicios sigan siendo accesibles y que el rendimiento cumpla las expectativas del usuario o los requisitos de carga de trabajo. La supervisión puede ayudarle a identificar cuellos de botella o recursos insuficientes, optimizar las configuraciones y detectar errores de canalización o carga de trabajo.

Siguiente: Procedimientos recomendados de eficiencia de rendimiento

Consulte Procedimientos recomendados de eficiencia del rendimiento.