Procedimientos recomendados para la recuperación ante desastres de Project Server 2007
Actualizado: marzo de 2009
Última modificación del tema: 2009-03-02
Un plan de recuperación ante desastres debe garantizar que todos los sistemas y datos podrán restaurar su funcionamiento normal de manera rápida en caso de desastre natural (como un incendio) o de desastre técnico (como un error de doble disco en una matriz RAID 5). Cuando se crea un plan de recuperación ante desastres, deben identificarse todas las acciones que deben realizarse en respuesta al evento catastrófico.
Antes de implementar Microsoft Office Project Server 2007 en un entorno de producción, debe probar rigurosamente el plan de copia de seguridad y restauración. Durante las pruebas, simule el mayor número de escenarios de error posibles para buscar áreas vulnerables. Para comprobar el plan de recuperación, se recomienda simular un evento catastrófico.
Durante la planeación de la estrategia de recuperación ante desastres, tenga en cuenta las siguientes preguntas:
¿A qué medio enviará la copia de seguridad (cinta o disco)?
¿Realizará las copias de seguridad manualmente o las programará para que se realicen automáticamente?
Si las copias de seguridad son automáticas, ¿cómo comprobará que se han realizado correctamente?
¿Cómo se asegurará de que las copias de seguridad son utilizables?
¿Durante cuánto tiempo guardará las copias de seguridad antes de volver a usar el medio?
En caso de error, ¿cuánto tiempo tardará en restaurar desde la copia de seguridad más reciente? ¿Es una cantidad de tiempo de inactividad aceptable?
¿Dónde almacenará las copias de seguridad? ¿Tienen las personas adecuadas acceso a ellas?
Si el administrador del sistema responsable no está disponible, ¿hay otra persona que conozca las contraseñas y los procedimientos adecuados para realizar las copias de seguridad y, si es necesario, restaurar el sistema?
Como parte de cualquier plan de recuperación ante desastres, se recomienda hacer lo siguiente:
Usar el visor de eventos de Microsoft Windows a diario para buscar cualquier error o advertencia en el registro del sistema o el registro de aplicaciones de los servidores de producción.
Conservar siempre un disco de reparación de emergencia de Windows o un conjunto de Recuperación automática del sistema (ASR) para cada servidor de la implementación. Vea la ayuda de Windows para obtener más información.
Asegúrese de que todos los servidores están protegidos con el software antivirus adecuado. Mantenga el software actualizado con los archivos de firma de virus más actualizados. Use la característica de actualización automática de la aplicación antivirus para mantener actualizadas las firmas de virus.
Tipos de eventos
Los administradores del sistema deben proteger sus redes de la pérdida de datos y del tiempo de inactividad del sistema. Esto implica realizar procedimientos rutinarios con regularidad y pasos no rutinarios para la prevención o recuperación de un tiempo de inactividad inesperado.
Algunas de las causas potenciales del tiempo de inactividad del sistema son las siguientes:
Error del subsistema de disco duro
Error de alimentación
Error de software del sistema
Uso accidental o malintencionado de comandos de eliminación o modificación
Virus destructivos
Desastres naturales
Robo o sabotaje
La probabilidad de que ocurran estos eventos varía según la organización, pero todos ellos pueden afectar gravemente a la implementación de Office Project Server 2007. Se recomienda evaluar la vulnerabilidad de varios tipos de eventos y realizar los pasos adecuados para minimizar la exposición de la organización a ellos.
Consideraciones sobre el espacio en disco duro
Debe tener suficiente espacio en el disco duro para restaurar la base de datos y los archivos de registro en los equipos que ejecutan SQL Server. Podría tener una copia de seguridad demasiado grande para restaurarla a su ubicación original. Por ejemplo, una copia de seguridad normal realizada una vez a la semana más seis días de copias de seguridad diferenciales podrían requerir más espacio en disco durante una restauración del que dispone su servidor.
Además, nunca debe permitir que la unidad de base de datos se llene más de la mitad de su capacidad. Aunque una unidad de base de datos que está llena a menos de la mitad de su capacidad suponga desaprovechar espacio en disco, puede reducir el tiempo de inactividad de servidor extendido por los siguientes motivos:
Puede restaurar bases de datos con mayor rapidez que cuando la unidad está llena (sobre todo si el sistema de archivos está fragmentado).
Puede realizar una copia de seguridad de una copia de las bases de datos en el mismo disco físico antes de restaurarlas, lo que le permite intentar reparar las bases de datos si se produce un problema durante el proceso de restauración (por ejemplo, si la copia de seguridad existente contiene errores).
Uso de estándares de hardware
Adopte un estándar de hardware y aplíquelo tanto como sea posible. Use los mismos tipos de componentes, como tarjetas de red, controladores de disco y tarjetas gráficas en todos los equipos. Use este perfil de equipo estándar para todas las aplicaciones, incluso si es más de lo que necesita para algunas de ellas. Las únicas modificaciones que deberá realizar en el hardware son la cantidad de memoria, el número de CPU y las configuraciones de disco duro.
Los estándares de hardware ofrecen las siguientes ventajas para la organización:
Se tiene una única plataforma, lo que reduce la cantidad de pruebas necesarias.
Cuando se aplican actualizaciones de controlador o de software de aplicación, sólo es necesario realizar una prueba antes de implementarlas en todos los equipos.
Dado que se debe prestar servicio técnico a un solo tipo de sistema, el personal de soporte técnico requiere menos aprendizaje.
No es necesario disponer de tantas piezas de recambio en una ubicación, lo que reduce costes para la organización.
Disponga de repuestos y piezas de recambio en las instalaciones, e incluya todo tipo de piezas de recambio en el presupuesto para hardware. El número de piezas de recambio del que disponga en una ubicación dependerá de la configuración y las condiciones de error que los usuarios y el personal de operaciones puedan tolerar.
Algunos componentes, como la memoria y la CPU, se encuentran fácilmente unos años después de haber adquirido los componentes originales. Sin embargo, otros componentes, como los discos duros, a menudo son difíciles de encontrar tan sólo pasados unos pocos años. Para esos componentes difíciles de encontrar, y en los casos en los que es necesario sustituirlos por otros idénticos, planee comprar componentes de repuesto cuando compre el equipamiento. Considere la posibilidad de contratar los servicios de compañías de servicio técnico o de un proveedor para delegar esta responsabilidad, o conserve un ejemplar o dos de los componentes críticos en una ubicación central.
Mantenimiento de los registros de hardware
Para limitar la cantidad de tiempo dedicada a solucionar problemas de configuración de hardware durante una recuperación ante desastres, mantenga actualizados los registros de configuración de hardware, entre los que se incluye:
Una lista con todos los datos de contacto del proveedor de hardware, que incluya números de teléfono, direcciones de correo electrónico y páginas web para el soporte técnico en línea.
Una lista del hardware de cada servidor, con versiones de actualización de firmware y versiones de controlador de hardware (esta información del hardware puede encontrarse en el Administrador de dispositivos de Windows).
Una lista con la información del sistema básico de entrada y salida de red (BIOS), de la configuración del disco duro y la configuración del puente en el hardware del servidor.
Importante: |
---|
Conserve una copia de esta información en un lugar externo como medida de precaución en caso de que se produzca un accidente en las instalaciones y necesite recuperar los sistemas en otra ubicación. |
Mantenimiento de registros de software
Para limitar la cantidad de tiempo dedicada a solucionar los problemas relacionados con el software durante la recuperación ante desastres, mantenga actualizaciones los registros del software, entre los que se incluye:
La información de contacto del proveedor de software, incluidos números de teléfono, direcciones de correo electrónico y páginas web para el soporte técnico en línea.
Una lista cronológica de todas las actualizaciones de software (como los Service Pack) y las revisiones de software que se han instalado en los servidores. Al mantener esta lista, podrá instalar las actualizaciones de software en el mismo orden en que se instalaron originalmente.
Un registro de la configuración de cada servidor, que incluya:
Nombre de servidor.
Nombre del grupo administrativo al que pertenece el servidor.
Información de configuración del disco duro, incluida una lista de cada partición de disco duro con los nombres de volumen y los tamaños de las particiones, y un resumen de lo que se ha instalado en cada partición.
Una lista de las direcciones de protocolo de Internet, máscaras de subred y puertas de enlace predeterminadas usadas por el servidor.
Un registro de la información de configuración del clúster, si la topología incluye clústeres.
Cualquier personalización que haya realizado en el servidor, como las personalizaciones de Project Web Access.
Información de configuración de cualquier proveedor de servicios compartidos, aplicaciones web, sitios u otros valores.
Importante: Conserve una copia de esta información en un lugar externo como medida de precaución en caso de que se produzca un accidente en las instalaciones y necesite recuperar los sistemas en otra ubicación.
Planeación de contingencias de hardware
Para minimizar los costes por tiempo de inactividad, incluidas las pérdidas en las ventas y la productividad, tenga disponible el hardware de repuesto de manera inmediata para los servidores de producción. Entre los tipos de hardware de repuesto que debe considerar tener a disposición inmediata se incluyen servidores de copia de seguridad, adaptadores de red, tarjetas de controlador de disco duro y vídeo, enrutadores, cables, discos duros, placas base y sistemas de alimentación.
Aprendizaje y documentación
Asegúrese de que los administradores, los operadores y el personal de soporte técnico de la organización tienen acceso a distintas oportunidades de aprendizaje y documentación en lo que se refiere a problemas de recuperación ante desastres.
Si tiene problemas en un servidor o en varios de ellos, el tiempo de inactividad que se producirá posteriormente puede resultar costoso. Sin embargo, si realiza una inversión en cursos de aprendizaje de calidad y manuales técnicos actualizados para los administradores de servidores, operadores y personal de soporte técnico, la organización estará preparada y el tiempo de inactividad será menor.
También puede realizar ocasionalmente simulaciones de recuperación ante desastres en dominios independientes que no sean de producción. Estas simulaciones ayudan a los administradores, operadores y personal de soporte técnico a familiarizarse con los procedimientos de recuperación, además de indicar cualquier deficiencia en las estrategias de copia de seguridad y recuperación. Actualice la documentación con nuevos procedimientos o prácticas que vaya desarrollando durante estas simulaciones.
Descarga de este libro
Este tema se incluye en el siguiente libro descargable para facilitar la lectura y la impresión:
Vea la lista completa de libros disponibles en la sección de contenido descargable de Office Project Server 2007.