Compartir a través de


Virtualización: Físicas vs. Clústeres virtuales

Implementar varias máquinas virtuales en clústeres requiere algunas técnicas de administración y configuración.

Kai Hwang, Jack Dongarra y Geoffrey Fox

Adaptado de "distribuido y Cloud Computing: De procesamiento paralelo a la Internet de las cosas"(Syngress, un sello editorial de Elsevier, 2011)

Agrupación es una técnica efectiva para asegurar la alta disponibilidad. Es aún más eficaz, flexible y rentable cuando se combina con la tecnología de virtualización. Clústeres virtuales están construidos con máquinas virtuales (VMs) instaladas en servidores distribuidos de uno o más clústeres físicos. Las máquinas virtuales en un cluster virtual están interconectadas lógicamente por una red virtual a través de varias redes físicas.

Clústeres virtuales están formados con máquinas físicas o una VM conducido por múltiples clusters físicos. Provisioning de VMs a un clúster virtual se realiza dinámicamente a tienen las siguientes propiedades:

  • Los nodos del clúster virtual pueden ser máquinas físicas o VMs. Puede implementar múltiples máquinas virtuales que ejecutan sistemas operativos diferentes en el mismo nodo físico.
  • Una máquina virtual se ejecuta con un invitado OS (a menudo diferentes desde el sistema operativo del host) que administra los recursos de la máquina física donde se implementa la VM.
  • La finalidad de utilizar las máquinas virtuales es consolidar múltiples funcionalidades en el mismo servidor. Esto aumentará en gran medida flexibilidad de utilización y aplicación de servidor.
  • Puede colonizar o replicar VM en varios servidores con el fin de promover el paralelismo distribuido, tolerancia y recuperación ante desastres.
  • El tamaño (número de nodos) de un clúster virtual puede crecer o achicarse dinámicamente, similar a cómo una red de superposición varía en tamaño dentro de una red peer-to-peer.
  • Si se produce un error en cualquier nodo físico, podría desactivar algunas de las VMs instaladas en los nodos de falla. Sin embargo, cualquier fallo VM no extraerá el sistema host.

Tienes que administrar de manera eficaz las máquinas virtuales que se ejecutan en una masa de nodos computacionales físicos (también llamado clústeres virtuales) en un entorno informático virtualizado de alto rendimiento. Esto implica implementación de clústeres virtuales, monitoreo y administración en clústeres a gran escala. También deberás aplicar programación de recursos, balanceo de carga, consolidación de servidores, tolerancia y otras técnicas. En un sistema virtual de clúster, es importante almacenar eficientemente la gran cantidad de imágenes de máquina virtual.

Hay instalaciones comunes para la mayoría de usuarios o aplicaciones, tales como OS usuario nivel o bibliotecas de programación. Puede preinstalar estos paquetes de software como plantillas (llamadas VMs de plantilla). Con estas plantillas, los usuarios pueden crear sus propias pilas de software. También pueden copiar nuevas instancias de OS de la plantilla de VM. Puede tener componentes específicos del usuario tales como programación de bibliotecas y aplicaciones instaladas a las instancias de antemano.

Las máquinas físicas (sistemas de host) y VMs (sistemas de invitado) pueden ejecutarse con sistemas operativos diferentes. Puede tener cada VM instalado en un servidor remoto o replicado en varios servidores pertenecientes a los clusters físicos igual o diferentes. El límite de un clúster virtual puede cambiar, agregar, quitar o migrar dinámicamente nodos VM en el tiempo.

Implementación rápida y eficaz de programación

El entorno virtual que diseño debe ser capaz de despliegue rápido. En este caso, implementación significa dos cosas: para construir y distribuir software pilas (sistemas operativos, aplicaciones y bibliotecas) a un nodo físico dentro de los clusters como rápido como sea posible y a cambiar rápidamente los entornos de tiempo de ejecución de clúster virtual de un usuario a otro. Si un usuario termina con su sistema, el clúster virtual correspondiente debe apagar o suspender rápidamente operaciones para guardar los recursos para ejecutar otras VMs para otros usuarios.

El concepto de "computación verde" recientemente ha atraído mucha atención. Sin embargo, los enfoques anteriores se han centrado en energía ahorro a nivel del única estación de trabajo. Carecían de una visión más amplia. En consecuencia, ellos no necesariamente reduciría el consumo de energía de todo el clúster.

Sólo puede aplicar técnicas eficientes de todo el clúster para estaciones de trabajo homogéneos y aplicaciones específicas. Vivo migrar máquinas virtuales permite transferir las cargas de trabajo de un nodo a otro. Sin embargo, no garantiza que las máquinas virtuales pueden migrar al azar entre sí.

No puede ignorar el potencial sobrecarga provocado por las migraciones vivos VM. Esa sobrecarga podría tener graves efectos negativos sobre la utilización del clúster, el rendimiento y la calidad de los problemas de servicio. Por lo tanto, el reto es determinar cómo diseñar estrategias de migración para aplicar la computación verde sin influir en el rendimiento del clúster.

Otra ventaja para clústeres transmitieron por la virtualización es equilibrio de carga de aplicaciones en un clúster virtual. Puede utilizar el índice de carga y la frecuencia de inicios de sesión de usuario para lograr un Estado de equilibrio de carga. Puede implementar el mecanismo automático de escala arriba y abajo de la escala de un clúster virtual basado en este modelo.

En consecuencia, puede aumentar la utilización de recursos de modo y acortar el tiempo de respuesta del sistema. Asignación de VMs al nodo físico más adecuado debe promover el rendimiento. Ajustar dinámicamente cargas entre nodos por vivos migrar VMs es útil cuando las cargas de trabajo de nodo de clúster ser desequilibrados.

Almacenamiento Virtual de alto rendimiento

Puede distribuir la plantilla VM a varios hosts físicos en el clúster para personalizar las VMs. También puede utilizar los paquetes de software existente para reducir el tiempo para la personalización. Es importante administrar eficientemente el espacio en disco ocupado por sus paquetes de software de plantilla. Cuidadosamente puede diseñar la arquitectura de almacenamiento para reducir bloques duplicados en un sistema de archivos distribuido de clústeres virtuales y utilizar los valores hash para comparar el contenido de los bloques de datos.

Los usuarios tendrán sus propios perfiles que almacenan datos bloque identificación para VMs correspondientes en un clúster virtual específica del usuario. Cuando los usuarios modificar los datos correspondientes, se crean nuevos bloques de datos. Bloques recién creados se identifican dentro de los perfiles de usuario.

Básicamente, hay cuatro pasos para implementar un grupo de máquinas virtuales en un clúster de destino:

  1. Preparar la imagen de disco.
  2. Configurar las VMs.
  3. Seleccionar nodos de destino.
  4. Ejecute el comando de despliegue de VM en cada host.

Muchos sistemas utilizan plantillas para simplificar el proceso de preparación de imagen de disco. Una plantilla es una imagen de disco que incluye un sistema operativo preinstalado con o sin cierto software de aplicación. Los usuarios elegir una plantilla adecuada de acuerdo a sus necesidades y realizar un duplicado como su propia imagen de disco.

Plantillas pueden usar la copia en formato de escritura (vaca). Un nuevo archivo de copia de seguridad de vaca es muy pequeño y fácil de crear y transferir. Por lo tanto, definitivamente reduce el consumo de espacio de disco. También acorta el tiempo de implementación de VM, haciéndolo mucho más eficiente que copiar el archivo de imagen raw de todo.

Cada VM está configurado con un nombre, imagen de disco, configuración de red asignado CPU y memoria. Es necesario registrar cada configuración de máquina virtual en un archivo. Sin embargo, esto es ineficaz cuando se administra un gran número de máquinas virtuales. VM con las mismas configuraciones podrían utilizar perfiles preeditados para simplificar el proceso. El sistema configurar las VMs segun el perfil seleccionado.

La mayoría de elementos de configuración usan la misma configuración. Algunos de ellos — como UUID, VM nombre y dirección IP — se asignan automáticamente con los valores calculados. Normalmente, los usuarios no importa qué host está ejecutando su VM.

Al examinar su estrategia para elegir el host de destino de VM, tenga en cuenta el principio de despliegue general, que es satisfacer sus necesidades de capacidad de la máquina virtual, sino también equilibrio de cargas de trabajo a través de la red de host. De este modo, podrá llegar a un equilibrio eficiente entre sus recursos disponibles y su carga de trabajo.

Kai Hwang

Kai Hwang es un profesor del equipo de ingeniería en la Universidad de California del Sur y un catedrático visitante de la Universidad de Tsinghua, China. Obtuvo un doctorado en B.S. de la Universidad de California, Berkeley. Ha publicado extensamente en arquitectura de computadores, aritmética digital, sistemas distribuidos, procesamiento, seguridad de Internet en paralelo y la computación en nube.

Jack Dongarra

Jack Dongarra es un profesor distinguido de la Universidad de ingeniería eléctrica y Ciencias de la computación en la Universidad de Tennessee, un personal de investigación distinguido en Oak Ridge National Laboratory y becario girando en la Universidad de Manchester. Dongarra pionera en las áreas de puntos de referencia de supercomputadora, análisis numérico, álgebra lineal solucionadores e informática de alto rendimiento y ha publicado extensamente en estas áreas.

Geoffrey Fox

Geoffrey Fox es un distinguido profesor de informática, computación y física y socio decano de estudios de postgrado y la investigación en la escuela de informática y computación en la Universidad de Indiana. Recibió su Ph.d. de la Universidad de Cambridge, Reino Unido Fox es conocida por su amplio trabajo y extensas publicaciones en arquitectura paralela, programación distribuida, grid computing, servicios Web y aplicaciones de Internet.

© 2011 Elsevier Inc. Todos los derechos reservados. Impreso con el permiso de Syngress, un imprint de Elsevier. Copyright 2011. "Distribuido y Cloud Computing: De procesamiento a la Internet de las cosas en paralelo"por Kai Hwang, Jack Dongarra, Geoffrey Fox. Para obtener más información sobre este título y otros libros similares, visite elsevierdirect.com.

 

Contenido relacionado