Conceptos clave de Operations Manager
Operations Manager, un componente de Microsoft System Center, es un software que te ayuda a supervisar servicios, dispositivos y operaciones para muchos equipos desde una única consola. En este artículo se explican los conceptos básicos sobre Operations Manager para el administrador que administra la infraestructura de Operations Manager y el operador que supervisa y presta servicios de TI a tu empresa.
Qué hace Operations Manager
Las empresas, pequeñas y grandes, suelen depender de los servicios y aplicaciones proporcionados por su entorno informático. Los departamentos de TI son responsables de garantizar el rendimiento y la disponibilidad de esos servicios y aplicaciones críticos. Esto significa que los departamentos de TI deben saber cuándo hay un problema, identificar dónde está y averiguar lo que lo está causando, idealmente antes de que los usuarios de las aplicaciones lo encuentren. Cuantos más equipos y dispositivos haya en la empresa, más difícil será esta tarea.
El uso de Operations Manager en el entorno facilita la supervisión de varios equipos, dispositivos, servicios y aplicaciones. La consola del operador, que se muestra en la siguiente imagen, te permite comprobar el estado, el rendimiento y la disponibilidad de todos los objetos supervisados en el entorno y te ayuda a identificar y resolver problemas.
Nota:
Para obtener más información sobre las consolas de Operations Manager, consulta Comparación de las consolas de Operations Manager en la Guía de operaciones.
Operations Manager te indicará, qué objetos supervisados no son correctos, enviará alertas cuando se identifiquen los problemas y proporcionará información para ayudarte a identificar la causa de un problema y las posibles soluciones. Como administrador, debes configurar lo que se va a supervisar seleccionando los equipos y dispositivos que se van a supervisar e importando módulos de administración que proporcionan supervisión para características y aplicaciones específicas. Para decidir qué objetos vas a supervisar y qué vas a supervisar, debes conocer las características que componen la infraestructura de Operations Manager y cómo funciona.
La infraestructura de Operations Manager
En la instalación de Operations Manager se crea un grupo de administración. El grupo de administración es la unidad básica de funcionalidad. Como mínimo, un grupo de administración consta de un servidor de administración, la base de datos operativa y la base de datos de almacenamiento de datos de informes.
El servidor de administración es el punto focal para administrar el grupo de administración y comunicarse con la base de datos. Cuando abres la consola del operador y te conectas a un grupo de administración, te conectas a un servidor de administración para ese grupo de administración. Según el tamaño del entorno informático, un grupo de administración puede contener un solo servidor de administración o varios servidores de administración.
La base de datos operativa es una base de datos de SQL Server que contiene todos los datos de configuración del grupo de administración y almacena todos los datos de supervisión que se recopilan y se procesan para el grupo de administración. La base de datos operativa conserva los datos a corto plazo, de forma predeterminada 7 días.
La base de datos de almacenamiento de datos es una base de datos de SQL Server que almacena datos de supervisión y alertas con fines históricos. Los datos que se escriben en la base de datos de Operations Manager también se escriben en la base de datos de almacenamiento de datos, por lo que los informes siempre contienen datos actuales. La base de datos de almacenamiento de datos conserva los datos a largo plazo.
Cuando se instala la funcionalidad de informes de Operations Manager, el grupo de administración también contiene un Servidor de informes, que compila y presenta informes a partir de datos de la base de datos de almacenamiento de datos.
Estos componentes principales de un grupo de administración pueden existir en un solo servidor o se pueden distribuir entre varios servidores, como se muestra en la imagen siguiente.
Para obtener información sobre cómo instalar las características del grupo de administración, consulta la Guía de implementación de Operations Manager.
Servidores de administración
El rol del servidor de administración es administrar la configuración del grupo de administración, administrar y comunicarse con los agentes y comunicarse con las bases de datos del grupo de administración.
El grupo de administración puede contener varios servidores de administración para proporcionar capacidad adicional y disponibilidad continua. Cuando se agregan dos o más servidores de administración a un grupo de administración, los servidores de administración forman parte de un grupo de recursos y el trabajo se distribuye entre los miembros del grupo. Cuando se produce un error en un miembro del grupo de recursos, otros miembros del grupo se encargan de asumir la carga de trabajo de ese miembro. Cuando se agrega un nuevo servidor de administración, el nuevo servidor de administración retoma automáticamente parte del trabajo de los miembros existentes del grupo de recursos. Todos los miembros del grupo de recursos administrarán un conjunto distinto de objetos remotos; en un momento dado, dos miembros del mismo grupo no administrarán el mismo objeto al mismo tiempo.
Un tipo especializado de servidor de administración es el servidor de puerta de enlace. Un servidor de puerta de enlace habilita la supervisión de equipos en dominios que no son de confianza. Para obtener más información, consulta Planificación de un diseño de grupo de administración.
Agentes
Un agente de Operations Manager es un servicio que se instala en un equipo. El agente recopila datos, compara los datos de ejemplo con valores predefinidos, crea alertas y ejecuta respuestas. Un servidor de administración recibe y distribuye configuraciones a agentes en equipos supervisados.
Cada agente informa a un servidor de administración en el grupo de administración. Este servidor de administración se conoce como servidor de administración principal del agente.
Los agentes supervisan los orígenes de datos en el equipo supervisado y recopilan información según la configuración que se le envía desde su servidor de administración. El agente también calcula el estado de mantenimiento del equipo supervisado y los objetos en el equipo supervisado e informa de nuevo al servidor de administración. Cuando el estado de mantenimiento de un objeto que se está supervisando cambia, o cuando se cumplen otras condiciones, el agente puede generar una alerta. Esto permite a los operadores saber que algo requiere su atención. Al proporcionar datos de mantenimiento sobre el objeto supervisado al servidor de administración, el agente proporciona una imagen actualizada del estado del dispositivo y de todas las aplicaciones que hospeda.
Un agente se puede configurar para que actúe como agente proxy. Un agente proxy es un agente que puede reenviar datos a un servidor de administración en nombre de un equipo o dispositivo de red distinto de su equipo host. Por ejemplo, un agente instalado en el nodo físico de un clúster de SQL se puede habilitar para que actúe como proxy para supervisar el recurso del clúster. Los agentes proxy habilitan la supervisión de equipos y dispositivos en los que no se puede instalar un agente. Para obtener más información, ve Supervisión sin agente.
Servicios
En un equipo supervisado, el agente de Operations Manager aparece como el servicio de Microsoft Monitoring Agent. El servicio Microsoft Monitoring Agent recopila datos de rendimiento, ejecuta tareas, etc. Incluso cuando el servicio no puede comunicarse con el servidor de administración al que debe informar, este continúa ejecutándose y pone en cola los datos y eventos recopilados en el disco del equipo supervisado. Cuando se restaura la conexión, el servicio Microsoft Monitoring Agent envía los datos y eventos recopilados al servidor de administración.
Nota:
Nota: el servicio Microsoft Monitoring Agent se conoce a veces como servicio de mantenimiento.
El servicio Microsoft Monitoring Agent también se ejecuta en servidores de administración. En un servidor de administración, el servicio ejecuta flujos de trabajo de supervisión y administra las credenciales. Para ejecutar flujos de trabajo, el servicio inicia procesos MonitoringHost.exe mediante credenciales especificadas. Estos procesos supervisan y recopilan datos de registro de eventos, datos de contador de rendimiento y datos de Instrumental de administración de Windows (WMI), y ejecutan acciones como scripts.
Los servidores de administración también ejecutan el servicio de acceso a datos de System Center y el servicio de configuración de administración de System Center.
El servicio de acceso a datos de System Center da acceso a la consola del operador a la base de datos operativa y escribe datos en la base de datos.
El servicio de configuración de la administración de System Center administra las relaciones y la topología del grupo de administración. También distribuye módulos de administración a objetos supervisados.
Módulos de administración
Los flujos de trabajo que ejecuta el servicio de administración de System Center se definen por módulos de administración. Los módulos de administración definen la información que el agente recopila y devuelve al servidor de administración para una aplicación o tecnología específica. Por ejemplo, el módulo de administración de BizTalk Server contiene reglas y monitores que recopilan y evalúan eventos y operaciones que son importantes para garantizar el estado y la eficacia de la aplicación de BizTalk Server.
Una vez que Operations Manager instala un agente en un equipo, envía una configuración inicial al agente. La configuración inicial incluye detecciones de objetos de módulos de administración. El módulo de administración define los tipos de objetos, como aplicaciones y características que se supervisarán en equipos detectados por Operations Manager. Los agentes envían datos al servidor de administración que identifica las instancias de objetos detectados en el equipo. Luego, el servidor de administración envía a los agentes los elementos de los módulos de administración que se aplican a los objetos detectados para cada equipo, como reglas y monitores.
Una regla define los eventos y los datos de rendimiento para recopilar de los equipos y qué debe hacerse con la información después de recopilarla. Una manera sencilla de pensar en las reglas es como una instrucción If/Then. Por ejemplo, un módulo de administración para una aplicación puede contener reglas como las siguientes:
Si un mensaje que indica que la aplicación se está cerrando aparece en el registro de eventos, crea una alerta.
Si se produce un error en la carga de un archivo de origen, recopila el evento que indica este error.
Como se muestra en estos ejemplos, las reglas pueden crear alertas y recopilar eventos o datos de rendimiento, que el agente envía al servidor de administración. Las reglas también pueden ejecutar scripts, como permitir que una regla intente reiniciar una aplicación con errores.
Los objetos detectados tienen un estado de mantenimiento, que se refleja en la consola del operador como verde (correcto), amarillo (advertencia) o rojo (crítico o incorrecto). Los monitores definen los estados de mantenimiento de determinados aspectos del objeto supervisado. Por ejemplo, un monitor para la capacidad de la unidad de disco podría definir verde como menos del 85 por ciento lleno, amarillo como superior al 85 por ciento lleno y rojo como superior al 90 por ciento lleno. Un monitor se puede configurar para que genere una alerta cuando se produce un cambio de estado.
Cómo se detectan y supervisan los objetos
La imagen siguiente es una ilustración simplificada de cómo se detectan y supervisan los objetos.
El administrador configura Operations Manager para buscar equipos que administrar. Para obtener más información sobre cómo detectar equipos, consulta Planificación de la implementación del agente.
Los equipos que cumplen los criterios especificados y que aún no están administrados se identifican.
Un agente de Operations Manager se instala en el equipo detectado.
El agente solicita datos de configuración y luego el servidor de administración envía los datos de configuración del agente desde módulos de administración instalados, que incluyen clases que se van a detectar. Por ejemplo, si se instalan los módulos de administración del sistema operativo Windows Server, el servidor de administración enviará al agente las clases del sistema operativo.
El agente compara los datos de configuración con el equipo, identifica los objetos que detecta y devuelve la información al servidor de administración. Por ejemplo, el agente devolverá al servidor de administración que existe una instancia del sistema operativo Windows Server 2019 en el equipo.
El servidor de administración envía al agente toda la lógica de supervisión desde los módulos de administración instalados que se aplica a los objetos detectados. Por ejemplo, el agente recibirá toda la lógica de supervisión válida para Windows Server 2019.
El agente aplica la lógica de supervisión, como reglas y monitores, ejecuta flujos de trabajo y devuelve datos al servidor de administración.
A medida que se producen cambios en los objetos detectados, como las aplicaciones que se agregan o desinstalan, el agente envía la información actualizada al servidor de administración, que luego envía la lógica de supervisión actualizada.
Nota:
Operations Manager también puede detectar y supervisar dispositivos de red, equipos que ejecutan sistemas operativos UNIX y Linux, y ofrece una supervisión sin agente. Para obtener más información, ve Escenarios de supervisión de Operations Manager en la Guía de operaciones.
Comunicación entre agentes y servidores de administración
El agente de Operations Manager envía datos de alerta y detección a su servidor de administración principal, el cual escribe los datos en la base de datos operativa. El agente también envía datos de eventos, rendimiento y estados al servidor de administración principal para ese agente, que escribe los datos en las bases de datos operativas y de almacenamiento de datos simultáneamente.
El agente envía datos según los parámetros de programación de cada regla y monitor. En el caso de las reglas de recopilación optimizadas, los datos solo se transmiten si una muestra de un contador difiere de la muestra anterior en una tolerancia especificada, como el 10 %. Esto ayuda a reducir el tráfico de red y el volumen de datos almacenados en la base de datos operativa.
Además, todos los agentes envían un paquete de datos, denominado latido al servidor de administración según una programación normal, que es cada 60 segundos de forma predeterminada. El propósito del latido es validar la disponibilidad del agente y la comunicación entre el agente y el servidor de administración. Para obtener más información sobre los latidos, vea Cómo funcionan los latidos en Operations Manager.
Para cada agente, Operations Manager ejecuta un monitor de servicio de mantenimiento, el cual supervisa el estado del servicio de mantenimiento remoto desde la perspectiva del servidor de administración.
Otros recursos para Operations Manager
Revisa las consideraciones y recomendaciones de diseño e implementación de Operations Manager en la Guía de planeamiento.
Para obtener información sobre cómo instalar Operations Manager e implementar un grupo de administración, consulta Implementación de System Center Operations Manager.
Para obtener información sobre cómo usar Operations Manager después de configurar el grupo de administración, consulta Guía de operaciones de System Center - Operations Manager.
Para obtener información sobre cómo crear un módulo de administración, consulta Creación de plantillas de módulo de administración.