- Fallos de hardware: fallos de hardware pueden ser descritos como los fracasos que se producen en los mecanismos de almacenamiento, como discos o medios de comunicación. Fallos de hardware tienden a compensar otros fracasos. Se recomienda utilizar las plataformas que pueden controlar la temperatura interna, así como activar las alarmas en consecuencia. Con memorias de acceso aleatorio, los códigos de corrección de error (CEC) se puede utilizar para identificar y corregir errores y único para identificar los errores de dos bits.
- Los fallos de software: La determinación de la causa de un sistema de corte de luz puede ser muy compleja. Protección contra virus puede causar defectos de sistema de cortes. A menudo, incorrecta configuración del sistema también puede dar lugar a fallos en el sistema.
- Fallos de red: Los cambios de diseño a la red o la topología de una capa de la pila de protocolos puede tener un impacto en toda la red. Por lo tanto, es mejor para evaluar cada una de las capas de red al hacer cualquier cambio.
- Fallas operacionales: La utilización de estrictos procesos operativos se reducen en gran medida los fallos de funcionamiento. Estrategias y procesos de copia de seguridad deben ser definidas y aplicadas.
-
Fracasos son fracasos del medio ambiente que resultan en la pérdida de datos o la pérdida de servicios que son provocados por cortes de energía causados por desastres como huracanes y tormentas de nieve.
Porque los sistemas cambian continuamente, la planificación para situaciones de desastre es un proceso continuo que debe ocurrir dentro de una organización. Un plan de recuperación de desastres es normalmente formulado para esbozar los procedimientos que deben llevarse a cabo cuando se producen desastres.
Una buena recuperación en casos de desastre es un plan que incorpore las siguientes:
- Identifica los riesgos potenciales para la organización, y el costo o las consecuencias asociadas a cada riesgo identificado.
- Identifica los recursos que pueden ser utilizados para hacer frente a cada riesgo identificado. Recursos pueden incluir los siguientes datos, y de ser interna o externa:
- De hardware y software
- Sistemas
- Gente
- Determinar las respuestas o procedimientos que deben aplicarse cuando ocurre una situación de desastre.
- Prueba de los elementos del plan de recuperación de desastres que pueden ser probados, en un entorno controlado. La estructura de su organización que afectan a la forma en que se realiza la prueba.
- Mejorar constantemente su actual plan de recuperación de desastres.
Algunas estrategias que puede emplear para prepararse para los desastres se enumeran a continuación:
-
Configurar, o la creación de un sistema tolerante a fallos: Un sistema de tolerancia a fallos es un sistema que está configurado de tal manera que pueda seguir funcionando cuando ciertos componentes del sistema de experiencia fracasos. Tolerancia a fallos se refiere a la utilización de hardware y software para evitar la pérdida de datos en la ocurrencia de un fracaso, como un sistema o un fallo de hardware. Configuración de una tolerancia a fallos del sistema se hace vital cuando tiene servidores que ejecutan aplicaciones de misión crítica. Componentes redundantes, caminos y servicios pueden ser incluidos en la topología de la red para dirigir clara de los puntos de fallo, y para garantizar una alta disponibilidad de topología.
-
Copias de seguridad del sistema: Usted debe hacer una copia de seguridad del estado del sistema de datos sobre una base regular. Debido a que los archivos que se incluyen en el estado del sistema tienen ciertas dependencias, debe hacer una copia de seguridad de sus datos del estado del sistema como una sola unidad. Recuerde que los archivos de datos del estado del sistema son únicos para un equipo que ejecuta Windows Server 2003. Lo que esto significa es que usted no puede intercambiar archivos de datos del estado del sistema entre los diferentes servidores.
- Crear un disco de arranque: Se trata de crear un disco de arranque que se utiliza para recuperarse de una situación en la que un archivo está dañado en el disco duro. Añadir o instalar la Consola de recuperación, una nueva característica de Windows Server 2003, para el menú de arranque se considera un sustituto a la creación de un disco de arranque. Un disco de arranque le permitirá arrancar el sistema cuando las condiciones siguientes están presentes:
- Dañado o falta, o Ntldr Ntdetect.com archivos
-
Sector de arranque dañado
- Corrompido Master Boot Record (MBR)
- El Master Boot Record (MBR) está infectado con un virus.
> - Instalar la consola de recuperación: La consola de recuperación es una nueva característica de Windows Server 2003 que puede ser utilizada para realizar ciertas tareas de recuperación cuando no están en condiciones de uso de Windows Server 2003 en Modo a prueba de arranque del sistema, tales como:
- Iniciar y detener servicios
- Copia de archivos
- Crear Recuperación automática del sistema (ASR) establece disco Copia de seguridad de Windows a través de la utilidad. El ASR disco incluye los datos importantes que pueden ser utilizados para la reparación de los siguientes componentes:
- El sector de arranque
- Sistema de archivos
- El entorno de inicio
- Configurar Opciones de recuperación en la herramienta Sistema en el Panel de control que define la manera en que Windows debe manejar los fallos del sistema / accidentes.
Algunas estrategias que puede emplear para garantizar la tolerancia a fallos en el sistema se resumen a continuación:
- A fin de que sus servidores de apagar correctamente cuando se produce un fallo de alimentación, utilice un sistema de alimentación ininterrumpida (SAI).
-
Con el fin de garantizar que no se pierden cuando un fallo de disco duro, desplegar una o múltiples arrays RAID para ambos sistemas y el almacenamiento de datos. Esto asegura que sólo el disco no debe ser sustituida cuando se produce un fallo de disco. RAID básicamente añade tolerancia a fallos para sistemas de archivos, y aumentar la integridad de los datos y la disponibilidad, ya que crea copias redundantes de los datos. RAID se puede utilizar para mejorar el rendimiento del disco también.
- Para proporcionar redundancia para la controladora SCSI fracasos, se debe utilizar múltiples adaptadores SCSI.
- Para proporcionar redundancia para la tarjeta de red fracasos, utilizar varias tarjetas de red.
- Para atender a los fallos del servidor que tiene un servidor de datos de misión crítica, o ejecuta las aplicaciones de misión critica, utilizar grupos para proporcionar redundancia y la tolerancia a fallos.
La comprensión de la media hora de Incumplimiento y media de tiempo para recuperarse métrica
Las métricas utilizadas para medir la tolerancia a fallos son los siguientes:
- Mientras tanto, al fracaso (MTTF): Este es el tiempo medio para un dispositivo no
- La media de tiempo para recuperarse (MTTR): Este es el tiempo medio que se necesita para recuperarse después de un fallo ha tenido lugar.
El cálculo suele utilizarse para medir el tiempo es la siguiente:
Hay tres fases para los dispositivos de ciclo de vida con cada fase se clasifican por un comportamiento particular:
- Burn-en la fase: En esta fase, los fracasos se producen con bastante frecuencia. Quemaduras en los fracasos suelen disminuir bastante rápido también.
-
Fase de envejecimiento normal: Dispositivos raramente fracasan en esta fase. Un dispositivo de atributos pueden ser controlados una vez en la fase de envejecimiento normal para determinar el comportamiento definido asociado con tasas de fracaso. La tasa de fracaso de los dispositivos también pueden ser controlados y seguidos de forma que puedan ser cambiados antes de la fase de modo de falla.
- Modo de Fallo: Los fracasos tienden a aumentar más rápidamente los dispositivos de vida aumenta.
Algunos factores a considerar cuando se trabaja con la métrica MTTR MTTF y se enumeran a continuación:
- Componentes electrónicos suelen tener una alta tasa de fracasos durante su combustión en la fase temprana o período de vida útil. Después de este período, la tasa de fracaso del componente se mantiene constantemente bajo, y sólo cambia significativamente cuando el componente se acerca el final de su vida útil. En este momento, la tasa de fracaso del componente aumenta.
- El común de una mercancía MTTF disco duro es generalmente de 35 a 50 años. Servidor específico para unidades de disco duro, es 134 años.
-
Para los puntos de fracaso que usted ha identificado en su plan de recuperación en caso de ser más costoso, tratar de reducir el MTTR. La agrupación se pueden aplicar para disminuir MTTF
Salvaguardia de la fuente de alimentación
La fuente de alimentación se considera el mayor fracaso de una red punto, simplemente porque los ordenadores no pueden funcionar sin el poder. Una red debe ser protegido de la fuente de alimentación los siguientes temas:
-
Local o la falta de suministro de alimentación interna: Debido a que el fallo de la fuente de alimentación interna o en un servidor, router, o componente de hardware de red tiene consecuencias catastróficas, la mayoría de los servidores son una fuente de alimentación redundante. Para los servidores que no incluyen una fuente de alimentación redundante, normalmente existe la opción de incluir uno. Se recomienda encarecidamente utilizar esta opción para sus servidores. También debe incluir la sustitución de fuentes de alimentación de cualquier crítica de hardware como parte del plan de recuperación de desastres.
- Variaciones de voltaje: las variaciones de tensión son las siguientes:
- Espigas: Estos son más bien breve grandes aumentos de tensión que suelen ser causados por factores externos (rayo). Sin embargo, los picos pueden ser causados por factores internos, como cuando se inicia un gran pedazo de equipo. Para proteger su red de espigas, compra protectores que están diseñados para proteger la red. Trabajan por la detección de un gran aumento de la tensión y, a continuación, crear otra ruta de esta eléctrica de voltaje. De esta manera, el aumento de la tensión no llega a los servidores.
- Oleadas: Sobretensión normalmente no son tan grandes como los picos de tensión, pero duran más. La mayoría de los transformadores de voltaje constante puede hacer frente a los aumentos repentinos.
- Hunda: hunda ocurrir cuando hay reducción temporal de la tensión que puede dar lugar a un servidor que no está protegido de la tensión hunda, reiniciar. Usted puede proteger sus servidores de daños causados por hunda por la utilización de una buena UPS o un transformador de voltaje constante.
-
Brownouts: Estos están previstas reducciones en la tensión, normalmente de 5 a 20 por ciento del valor normal, que son iniciados por la compañía eléctrica. Para proteger contra los efectos de brownouts, use un UPS o un transformador de voltaje constante. Un transformador de tensión constante que puede soportar todos los dispositivos críticos y servidores pueden ofrecer protección contra brownouts ampliado.
- A corto plazo cortes de energía: se trata de su fuente de alimentación externa fallos que duran desde unas pocas fracciones de segundo a unos pocos minutos. A corto plazo cortes de energía puede ser causada por factores tanto internos como externos. Rara vez se puede planificar a corto plazo cortes de energía - sin protección alguna, ya sea simplemente reiniciar los servidores, o no. Para proteger sus servidores de corto plazo cortes de energía, uso de UPS junto con un buen pico de protección.
- Largo plazo de los cortes de energía: se trata de su suministro eléctrico, que duran desde unos pocos minutos hasta varias horas o incluso varios días. Largo plazo de los cortes de energía son típicamente causadas por factores externos tales como terremotos, tormentas, o incendios.
Proporcionar a través de la tolerancia a fallos de RAID Arrays
El fallo de hardware que normalmente se produce con más frecuencia es un disco duro fracaso. Para proteger los datos de la unidad y los fracasos para añadir a su tolerancia a fallos de sistemas de archivos, utilice la tecnología RAID. Windows Server 2003 proporciona un buen sistema RAID tolerante a fallos de sistemas. Windows Server 2003 también soporta soluciones RAID basada en hardware.
Se puede aplicar como tolerancia a fallos de RAID basada en hardware o software basado en RAID. Windows Server 2003 proporciona una aplicación de software RAID para mantener el acceso a los datos cuando un fallo de disco. Redundancia de datos se produce cuando un ordenador escribe los datos a más de un disco. Esto, a su vez los datos de seguridad de un único disco duro fracaso. La distinción entre RAID por software y hardware RAID RAID por software es que se ponga en funcionamiento únicamente a través de software y no requiere ningún hardware especial para que sea implementada. RAID de hardware usos especiales de controladores de discos y unidades. RAID de hardware es más tolerante a fallos de software RAID. También es más sencillo para recuperar de un fallo de RAID cuando se ejecuta en el hardware que el software RAID proporcionados por Windows Server 2003. Mientras que el software RAID es simple de instalar y configurar, tiene deficiencias. Un sistema RAID de hardware se puede reconstruir lo más rápidamente que el software RAID puede. Cuando una unidad tiene un fallo, el servidor no tiene que ser derribado para sustituir a la unidad especial. Caliente puede no cambiar la unidad. Con el software RAID, si una de las unidades en una cinta tiene un fallo, el servidor tiene que ser derribado antes de que usted no puede reemplazar la unidad.
Windows Server 2003 admite tres niveles de RAID, es decir, RAID 0, RAID 1 y RAID 5.
Los niveles de RAID para permitir tolerancia a fallos se enumeran a continuación:
-
RAID 0: puede utilizar el vaciado del disco sin paridad, RAID 0, si desea utilizar el espacio en un disco y al mismo tiempo mejorar el rendimiento de lectura y escritura. En Windows Server 2003, un volumen RAID 0 se conoce como volumen. RAID 0 no proporciona ninguna tolerancia a fallos. Los datos de todo el volumen se pierde si un disco en un volumen no.
- RAID 1: Un volumen RAID 1 es conocido como un volumen reflejado. Dos discos de participar en un volumen reflejado. Esta configuración también se conoce como un espejo conjunto. Con espejo, dos copias de todos los datos se escriben en volúmenes separados en dos discos. En el caso de que un disco falla, el disco restante en el espejo de volumen se ha establecido una copia idéntica de los datos. Es una buena práctica para reflejar el volumen de inicio y de sistema para asegurarse de que puede arrancar el servidor en el caso de una única unidad fracaso. Disk Mirroring proporciona casi el mismo fallo de la tolerancia como el vaciado del disco con paridad (RAID 5).
-
RAID 3: Con RAID 3, a nivel de byte o de paridad, los datos se divide en el nivel de byte y rayas a través de múltiples unidades con la información de paridad por escrito a una sola unidad dedicada. La paridad de la información se almacena en una sola unidad en lugar de rayas en todas las unidades. La pérdida de datos no se produce cuando un disco falla. La paridad de la información y los datos sobre el resto de las unidades de explotación se utilizan en un cálculo matemático para reconstruir los datos que se pierde. Sin embargo, hay una pérdida significativa de rendimiento.
- RAID 4: RAID de 4 o de nivel de bloque de paridad es similar al RAID 3, con la diferencia de que los datos son más de un disco rayado en bloques. Un disco de paridad dedicado se utiliza para la información de paridad. Un controlador RAID de hardware se necesita para RAID 4.
- RAID 5: RAID 5, o el vaciado del disco con la paridad, utiliza el vaciado del disco con la paridad. RAID 5 necesita al menos 3 discos duros para aplicar la tolerancia a fallos. Para permitir tolerancia a fallos, RAID 5 escribe información de paridad con los bloques de datos. Cuando se escriben datos en los volúmenes RAID 5, está escrito en todos los discos rayados en el volumen RAID 5, y la información de paridad de los datos también se escriben en el disco. Información de paridad se escribe en un disco independiente del disco que se pongan en venta la explotación de datos. La información de paridad se utiliza para recuperar los datos cuando un disco rayado en el conjunto falla. El RAID 5 conjunto sigue funcionando en este momento, ya el resto de discos se refiere a las funciones de disco. Sin embargo, cuando dos discos RAID 5 en el volumen conjunto falla, la información de paridad no es suficiente para recuperar los datos.
-
Niveles jerárquicos de RAID: RAID de niveles anidados hacer uso de una única agrupación de los niveles de RAID. Un ejemplo de un nivel RAID anidados se RAID 1 +0, que es comúnmente conocido también como nivel de RAID 10. Con nivel RAID 10, los datos se reflejan a través de conjuntos de rayas, combinando así la tolerancia a fallos de RAID 1, con la rapidez de lectura y escritura proporcionados por el rendimiento de RAID 0.
Los factores que deben incluirse cuando se determine qué solución RAID suites la tolerancia a fallos de los requisitos de su organización son:
- El uso de sus aplicaciones juega un papel importante en determinar qué solución RAID de aplicar. Elementos para incluir en uso son si las aplicaciones que se están ejecutando se leen o escriben intensivo intensivo, y si utiliza las aplicaciones de datos secuencialmente o al azar.
- El rendimiento de cada nivel de RAID se ve afectada por el uso. Factores para aclarar bajo rendimiento son para determinar si el servidor es demasiado utilizado o no, y si sus aplicaciones son de E / S intensiva.
- El nivel de tolerancia a fallos de los diferentes niveles de RAID es otro elemento importante a considerar. Todos los niveles de RAID, que no sea RAID 0, proporcionar alguna forma de tolerancia a fallos. Lo que hay que considerar es la forma en que cada nivel puede manejar cualquier fracasos.
- El nivel de disponibilidad que proporciona cada nivel de RAID es también importante. Usted debe decidir si exigen sus servidores de alta disponibilidad, o si puede darse el lujo de estar fuera de línea.
-
Los costos asociados con la aplicación de los diferentes niveles de RAID diferente. Como se mencionó anteriormente, basada en hardware RAID soluciones cuestan más que las soluciones de software basadas en RAID. RAID de software basado en Windows Server 2003 es considerablemente más barato que la aplicación de soluciones de hardware basado en RAID.
Agrupación de Tecnologías de la comprensión
Microsoft ofrece las siguientes dos agrupaciones de tecnologías que son compatibles con Windows 2000 y Windows Server 2003.
- El Servicio de Microsoft Cluster - Cluster Server
- El Equilibrio de carga de red (NLB) de servicios
Microsoft Clustering Server (MSCS), lanzado inicialmente en el Windows NT Server Enterprise Edition, ha permitido a las organizaciones incrementar la disponibilidad de servidores de misión crítica para los recursos de la agrupación de múltiples servidores físicos en un grupo. Servidores en el cluster se denominan nodos, mientras que los servicios y aplicaciones se denominan recursos. Un grupo puede definirse como la agrupación de dos o múltiples servidores físicos que se presentan como, y funcionar como un servidor de red. Estos servidores proporcionan redundancia de la red de la empresa mediante la reanudación de las operaciones de un fallo en el servidor de clúster. Este procedimiento se conoce como tolerancia a fallos. El proceso de recuperación no se produce cuando un servidor se reanude automáticamente la realización de sus operaciones una vez que el ex está en línea otra vez. El grupo también se puede configurar para proporcionar equilibrio de carga características. Con la introducción de esta tecnología de Windows 2000 que se conoce como Microsoft Cluster Service. Microsoft Cluster Service es el más adecuado para los servicios de red que requieren un alto grado de disponibilidad. Windows Server 2003 puede soportar ocho agrupaciones nodo servidor.
DLL de recursos de gestión de los recursos del clúster, y proporcionar el mecanismo de Servicio de Cluster Server para mantener las comunicaciones con sus aplicaciones. El quórum de recursos ha de existir para que un nodo del clúster para llevar a cabo sus funciones. Este recurso común que tiene el grupo de la base de datos que almacena la versión sincronizada de gestión de datos para el grupo. El quórum de recursos se encuentra en el disco físico de la unidad compartida del clúster. La agrupación de recursos de software, como se hace posible que el grupo funcione. Administrativo de software es el software utilizado para administrar el grupo, tales como el Administrador de clústeres.
Algunas ventajas asociadas a la implementación de clúster de servidores son:
- La agrupación de la tecnología proporciona redundancia de fallos de red porque es otro nodo del clúster se reanuda los servicios del servidor no. Esto aumenta la disponibilidad del servidor para aplicaciones de misión crítica y servicios de red.
- Tiempo de respuesta de aplicación puede ser mejorada por la dispersión de aplicaciones a través de múltiples servidores.
- No hay ninguna configuración manual asociada con la recuperación porque no tiene servidor automáticamente sobre las operaciones de su ex.
-
Servicio de Cluster Server también reduce el tiempo de inactividad asociados con el mantenimiento programado de inactividad. Cuando un servidor del clúster está prevista para una actualización, sus servicios y aplicaciones puede ser movido manualmente a otro nodo del clúster.
- Una red que utiliza Servicio de Cluster Server tiene la mejora de la escalabilidad de servidores ya que se puede ampliar el acceso de los clientes, mientras que aún está garantizada.
- Los nodos, servicios y aplicaciones en el cluster puede ser gestionado, controlado y administrado a distancia, y de la misma manera como si se tratase de todos los alojados en un servidor.
Los requisitos de instalación del Servicio de Cluster Server se enumeran a continuación:
- Para la instalación del Servicio de Cluster Server, es necesario que usted tenga permisos administrativos en cada uno de los nodos del clúster.
- Debe haber suficiente espacio en disco en la unidad del sistema y dispositivo compartido para la instalación del Servicio de Cluster Server.
- Compruebe que los adaptadores de red tienen el buen TCP / IP de configuraciones, y que los controladores de adaptadores de red apropiados se están utilizando.
- Compartir archivos e impresoras para redes Microsoft debe estar instalado en un nodo, a fin de configurar el Servicio de Cluster Server.
- Los nodos deben ser configurados con el mismo hardware y los controladores de dispositivo.
- Cada nodo de clúster tiene que ser parte del mismo dominio, y utilizaron la cuenta de dominio debe ser idéntico en cada nodo de clúster.
- Antes de instalar cualquier otra de los nodos del clúster, en primer lugar garantizar que el nodo instalado previamente se está ejecutando.
-
El sistema de archivo de paginación debe tener espacio suficiente para evitar una disminución del rendimiento. Cuando el archivo tiene suficiente espacio, puede resultar en un sistema de bloqueo en la instalación.
- Es una buena práctica para examinar el sistema y los registros de sucesos antes y después de la instalación del Servicio de Cluster Server.
- Puede utilizar Monitor de sistema para solucionar problemas de memoria virtual.
Al determinar las aplicaciones para el grupo y la tolerancia a fallos, considere lo siguiente:
- La aplicación tiene que utilizar Transmission Control Protocol / Internet Protocol (TCP / IP), o Modelo de objetos componentes distribuido (DCOM) y Canalizaciones con nombre, o de llamada a procedimiento remoto (RPC) a través de TCP / IP para la función de la agrupación.
- La autenticación NTLM deben ser apoyadas por la aplicación.
- Que se incluirán en el proceso de conmutación por error, una aplicación tiene que ser capaz de almacenar sus datos en los discos conectados al bus compartido.
-
Aplicaciones instaladas en el cluster se clasifican ya sea como grupo consciente de las aplicaciones, o grupo desconoce las aplicaciones. Cuando una aplicación que soporta TCP / IP y transacciones, y almacena sus datos en la forma convencional, es aplicado como un grupo consciente de la aplicación. Presentar solicitudes y aplicaciones de bases de datos de clientes se clasifican en el grupo consciente de las aplicaciones. De Cluster desconocen las aplicaciones no se interrelacionan con el grupo, aunque puede ser configurado para el grupo capacidades básicas. Esto se hace creando un archivo DLL de recursos específicos de la aplicación de la agrupación desconoce aplicación. Esto garantizaría que el grupo desconocía la aplicación se inicia y termina correctamente cuando el grupo no.
Implementaciones de cluster ofrecer la posibilidad de elegir entre cinco modelos de configuración. El modelo escogido afecta a la configuración de clúster de rendimiento y el grado de disponibilidad garantizada durante un fracaso. Los diferentes modelos de configuración son:
- Configuración del servidor virtual Modelo: existe un único nodo del clúster. No existen en la capacidad de conmutación por error del clúster. Los servidores virtuales se pueden aplicar a los clientes para responder las solicitudes. En una etapa posterior, cuando los nodos adicionales se aplican para el grupo, los recursos pueden ser agrupadas en los servidores virtuales sin necesidad de reconfigurar los clientes.
- Alta Disponibilidad con Estático Modelo de Equilibrio de carga de configuración: Los nodos tienen particular, los recursos que son responsables de. Para garantizar la disponibilidad durante el failover, cada nodo tiene que ser lo suficientemente capaz de apoyar los recursos de otro nodo. Este modelo lleva a la configuración de una disminución del rendimiento durante la duración de la conmutación por error.
-
Hot Spare nodo con la máxima disponibilidad de configuración de modelo: Un solo nodo principal administra los recursos. El nodo de repuesto no se utilizan al mismo tiempo que el nodo principal. Este nodo sólo administra los recursos, cuando el nodo principal tiene un fracaso. Este modelo asegura una alta disponibilidad y alto rendimiento durante el failover.
- Parcial de configuración del Servicio de Cluster Server Modelo: Este modelo se basa en los principios de la ex modelo. Cuando se produce conmutación por error, el grupo desconoce las solicitudes de estancia no la duración de la conmutación por error. De Cluster desconocen las aplicaciones no son parte de este proceso y el rendimiento de estas aplicaciones es muy reducido en los momentos de failover. Este modelo proporciona la configuración de alta disponibilidad de recursos que están incluidos en el proceso de conmutación por error.
- Modelo híbrido de configuración: Este modelo puede considerarse como una agrupación de la configuración de modelos. En esta configuración, el modelo, cada uno de los nodos del clúster administra sus propios recursos. Debido a que este modelo es una agrupación de los otros modelos, la disponibilidad está garantizada durante el failover de los recursos especificados para el failover.
Windows 2000 Equilibrio de carga de red (NLB) es una agrupación que ofrece la tecnología de alta disponibilidad y escalabilidad. NLB es típicamente utilizado para asignar las solicitudes Web entre un conjunto de aplicaciones de servidor de Internet. NLB reencamina todas las solicitudes que se envían a un servidor de clúster NLB no. Con NLB, las solicitudes de los clientes son de carga equilibrada de acuerdo con la configura los parámetros de equilibrio de carga. Servidores en el clúster NLB, por lo tanto, puede ser configurado para compartir la carga de procesamiento de solicitudes de clientes. El conductor de Wlbs.sys NLB está configurado para cada servidor del clúster, y las funciones entre el adaptador de red y el protocolo TCP / IP. El conductor cliente administra y asigna las solicitudes a un servidor del clúster. Con NLB no existe un único caso de fracaso, ya que únicamente se considera como una aplicación distribuida. Se maximiza el rendimiento porque la emisión de subred se utiliza para distribuir solicitudes de cliente a los servidores del clúster. Estas solicitudes de cliente se filtra en cada grupo de servidor.
Para asegurar un alto rendimiento, NLB utiliza un algoritmo de filtrado distribuido para que coincida con las solicitudes de clientes a los servidores de NLB en el grupo al realizar balanceo de carga de decisiones. Cuando un paquete entrante se recibe, todos los servidores de NLB verificación para determinar qué servidor NLB debe manejar el cliente solicite. El uso de servidores de NLB una cartografía estadística que determina una serie de prioridad para el nuevo paquete, para identificar el servidor NLB que debe manejar la petición. Una vez que el servidor NLB es identificado por el paquete, el resto de los servidores en el clúster NLB descartes en el paquete. Cada servidor en el clúster NLB utiliza los latidos del corazón y transmite mensajes para identificar el estado de la agrupación. El latido del corazón mensaje contiene información sobre el estado de la agrupación, y las configuraciones de clúster y las reglas de puerto.
Algunas consideraciones NLB planificación y los requisitos se enumeran a continuación:
- Las aplicaciones en el cluster tiene que utilizar los puertos TCP o UDP, y los clientes tienen que ser capaces de conectar utilizando TCP / IP.
- Se recomienda tener dos adaptadores de red por el grupo anfitrión.
- Los anfitriones en el grupo debe estar en la misma subred física.
- NLB se puede utilizar con servidores VPN y los servidores de streaming de medios de comunicación.
- Usted debería planificar la capacidad de los servidores de acuerdo a los diferentes tipos de aplicaciones que van a residir en el clúster NLB.
- Añadir servidores a la NLB grupo hasta que el cliente solicite la carga es manejable, y no sobrecargar el grupo. Hasta 32 servidores pueden existir en un clúster NLB.
- RAID basado en hardware o software basados en RAID puede ser utilizada para proporcionar tolerancia a fallos de disco.
- Los servidores deben estar configurados correctamente para ejecutar y apoyar las aplicaciones alojadas en ellos, y todas las aplicaciones de carga debe ser equilibrado. La mayoría de las aplicaciones que puede ser configurado para utilizar TCP / IP con el puerto puede participar en el equilibrio de carga en el clúster NLB. Las aplicaciones que generalmente se apoya en un clúster NLB son:
Entender el papel de Sistema de archivos distribuido (DFS) en Fault Tolerance
Sistema de archivos distribuido (DFS) es un solo sistema de archivos jerárquico que ayuda en la organización de carpetas compartidas en varios equipos en la red. DFS proporciona una única estructura lógica del sistema de archivos, y también puede proporcionar un almacenamiento tolerante a fallos del sistema. DFS proporciona balanceo de carga y tolerancia a fallos que, a su vez las características de alta disponibilidad del sistema de archivos y mejorar el rendimiento. Los administradores también pueden instalar DFS como un servicio de clúster para proporcionar una mayor fiabilidad. Con raíces DFS basada en dominio, Active Directory se utiliza para la topología de la replicación DFS, asegurando así una tolerancia a fallos y la sincronización de la raíz DFS y carpetas compartidas. Configurar la replicación DFS para la raíz y cada uno de las carpetas compartidas proporcionan un mejor rendimiento a los clientes. Con el equilibrio de carga, los clientes pueden seleccionar aleatoriamente un servidor físico para conectar a la utilización de la lista de las referencias proporcionadas por el servidor DFS.
Dfs raíces puede ser independiente de las raíces o de dominio basado en raíces.
- Las características del stand-alone raíces DFS se destacan a continuación:
- Raíces DFS independiente puede existir en cualquier servidor Windows.
- Stand-alone raíces DFS no utilizar Active Directory porque la DFS información se almacena en el Registro local.
-
Stand-alone raíces DFS no ofrecen características de replicación automática para la DFS raíces, y las carpetas compartidas, con lo que la raíz DFS de un único punto de fallo. Aunque los servicios de replicación de archivos no están disponibles con autónomo raíces DFS, puede crear una réplica de la raíz DFS.
- Las características de dominio basado en raíces DFS se destacan a continuación:
- DFS de dominio basado en raíces existen en un servidor miembro o en un controlador de dominio que pertenecen a un dominio de Active Directory.
- Raíces DFS de dominio basado en el uso de servicios de Active Directory para almacenar el árbol de la topología DFS. Una raíz DFS de dominio basado no representa un único punto de fracasar debido a la topología DFS se publica en Active Directory.
- Los objetivos se sincronizan automáticamente por los servicios de Active Directory cuando se realizan cambios en el árbol DFS.
- DFS de dominio basado en raíces se encuentra en una versión 5.0 con formato NTFS partición.
- Con Windows Server 2003, un servidor puede alojar múltiples raíces DFS basada en dominio.
Los siguientes servidores pueden acoger una raíz DFS, o ser un servidor DFS:
- Cualquiera de las ediciones de Windows Server 2003
- Servidor Windows 2000
- Windows NT 4 Server con Service Pack 3 o posterior
El proceso para el despliegue de dominio basado en DFS se describen a continuación brevemente:
- Identificar a los servidores que se van a acoger las raíces DFS. Los servidores tienen que ser los servidores miembro o controladores de dominio del dominio.
- Tienes que crear una carpeta compartida en el servidor DFS que es servir como la raíz DFS. Usted debe mantener dentro de los archivos vinculados acciones, y no en el volumen.
- Crear la raíz DFS
- Especifique cualquier otra raíz objetivos
- Crear enlaces a la DFS las carpetas compartidas. También puedes añadir enlaces a las carpetas compartidas en otros servidores.
- Especifique cualquier vínculo objetivos
Cómo crear un volumen seccionado (RAID 0)
- Abra la consola Administración de discos
- Haga clic derecho en el espacio no asignado en el disco donde desea crear el volumen, y seleccione Nueva Tomo para iniciar el Asistente para volumen nuevo. Haga clic en Siguiente.
- Seleccione Rayas en el Tomo Seleccione Tipo ventana. Haga clic en Siguiente.
- Seleccione los discos en la ventana, seleccione el disco (s) de incluir en el volumen y la cantidad de espacio que se utilizará. Haga clic en Siguiente
- En el Asignar letra de unidad o ruta de la ventana, asignar una letra de unidad o montar el volumen a NTFS una carpeta vacía. Haga clic en Siguiente
- Formato en la ventana del volumen, seleccione un formato (NTFS) para el volumen, o seleccionar el formato No este volumen opción. Haga clic en Siguiente
- El Completar el Asistente para volumen nuevo ventana muestra las opciones que ha seleccionado.
- Haga clic en Finalizar para crear el volumen.
Cómo crear un volumen reflejado (RAID 1)
- Abra la consola Administración de discos
- Haga clic derecho en el volumen que desea espejo, y seleccione Agregar espejo para abrir la ventana Agregar espejo.
- Seleccione el disco que desea utilizar para un espejo.
-
Haga clic en Agregar espejo para crear el espejo.
Cómo recuperar un volumen reflejado fracaso (RAID 1)
- Abra la consola Administración de discos
- Haga clic derecho en el volumen no refleja Espejo y seleccione Eliminar en el menú contextual.
- Cuando el espejo quitar cuadro de diálogo, elija el disco que deben eliminarse, y haga clic en Eliminar Espejo
- Haga clic en Sí para verificar su acción para eliminar el espejo. El resto del volumen se convierte en un volumen simple.
- Ahora puede quitar la unidad no desde el ordenador, y lo reemplaza.
- A raíz de esto, usted debe utilizar la consola Administración de discos para crear el volumen reflejado de nuevo
Cómo crear un volumen RAID 5
- Open the Disk Management console.
- Right-click the unallocated space on the disk where you want to create the RAID 5 volume, and select New Volume to launch the New Volume Wizard. Haga clic en Siguiente.
- Select RAID 5 on the Select Volume Type window. Haga clic en Siguiente.
- On the Select Disks window, select the disk(s) to include in the volume, and the amount of space to be used. Haga clic en Siguiente
- On the Assign Drive Letter or Path window, assign a drive letter or mount the volume to an empty NTFS folder. Haga clic en Siguiente
- On the Format Volume window, select a format (NTFS) for the RAID 5 volume, or select the Do not format this volume option. Haga clic en Siguiente
-
The Completing the New Volume Wizard window displays the options you have selected.
- Click Finish to create the RAID 5 volume
How to recover from a RAID 5 volume failure
- Back up your data prior to performing any necessary actions to repair a RAID 5 volume set.
- Your first step is to restore all drives in the RAID5 volume set to online. The status of the volume set has to be displayed as Failed Redundancy.
- Where the status of the failed volume is Missing or Offline, verify that the drive has power and that there are no connectivity issues.
- Use the Disk Management console to reactivate the disk. Right-click the volume and then choose Reactivate Disk from the menu. The status of the drive should first move to Regenerating and following this, to Healthy.
- Right-click the volume and choose the Regenerate Parity option if the status fails to change to Healthy.
- Where the status of the failed volume is Online (Errors), right-click the volume that failed and choose Reactivate Disk from the menu. The status of the drive should first move to Regenerating and following this, to Healthy. Choose the Regenerate Parity option if the status fails to change to Healthy.
How to configure a DHCP cluster
- Install the cluster hardware
- Proceed to configure Cluster Service
-
Install the DHCP service on the node in the cluster
- Specify the global options when implementing many scopes.
- Configure a new scope. Assign the IP Address range and options (WINS/
-
Verify failover for the DHCP cluster, and check whether the DHCP server can be accessed by clients.
- You can use System Monitor to monitor DHCP Server performance. The DHCP Server audit log can be utilized for troubleshooting purposes.
How to install Internet Information Services (IIS) on a cluster
- On the cluster shared disk, configure a folder for the IIS virtual servers. A folder should be configured for each IIS virtual server.
- Next, utilize Cluster Administrator to configure a resource group for each defined virtual server. For this, the Dependant Disk resource for each resource group is necessary. The Dependant Disk resource for MS DTC (if configured) should be the same as the IIS virtual server disk.
- Ensure that the IIS virtual server resources are on the node that manages the Physical Disk resource of the virtual web.
- Configure the IIS virtual server's IP Address resource in the exact group as the Physical Disk resource at the location of the Web folders. Configure the IP Address resource as being dependent on the IIS virtual server's Physical Disk resource and MS DTC resource (if necessary).
- Specify the IIS virtual server's Network Name in the exact group as the Physical Disk resource at the location of the Web folders.
- Configure the Network Name resource as being dependent on the IP Address resource.
-
To configure the cluster Web site, utilize the Internet Services Manager snap-in. The cluster Web site can be a new Web site or an existing Web site. The Web site should utilize the IP Address and folder on the shared disk. Make certain that the Web site is not specified as All Unassigned, or to the IP address of the IIS virtual server. The Website has to utilize an anonymous username/password combination. The nodes have to be able to utilize these details.
- Next, continue to configure the identical Web site on the other cluster node.
- Configure an IIS server instance with the Web site value mapping to the IIS Web site. Utilize Cluster Administrator for this configuration. For failover, ensure that each node is a possible owner of the IIS server instance, and that an IP address resource dependency is configured. When the Web information is held on the cluster, the IIS server has to be dependent on the Physical Disk resource. A Network Name dependency can be configured. This will ensure failover when the network name is utilized for accessing purposes.
- It is recommended to utilize Cluster Administrator to start and stop the cluster Web sites / IIS resources. Cluster Administrator should also be utilized to remove cluster IIS resources.
- All IIS resources have to be removed from the node before you uninstal Cluster Service.
How to create a domain based Dfs root
- Open the Dfs console
- Right-click the Distributed File System icon, and choose New from the shortcut menu. You can also select the New Root option from the Action menu
- When the New Root Wizard launches, click Next on the Welcome To The New Dfs Root Wizard screen.
- On the Root Type screen, choose the Domain Root option if the server is a member of an Active Directory domain. Haga clic en Siguiente
- Enter the fully qualified DNS name of the server hosting the Dfs root on the Host Domain screen. You can click Browse to search Active Directory for the server. Haga clic en Siguiente
- When the Root Name screen appears, enter a name for the new Dfs root. You can also enter a comment in the Comments field. Haga clic en Siguiente
- The Root Share screen is displayed when the share does not exist on the server. This is where you enter the full path to the folder that should store the Dfs root. Haga clic en Siguiente
- Verify the settings that you have selected
- Haga clic en Finalizar
- The wizard now shares the specified folder, and creates the Dfs root and entries in the registry.
How to publish domain based Dfs roots in Active Directory
- Open the Dfs console
- Choose the Dfs root, and select Properties from the Action tab.
-
When the Properties dialog box of the selected Dfs root appears, click the Publish tab.
- Enable the Publish This Root In Active Directory checkbox
- Enter a description for the Dfs root in the Description box
- You can also enter an e-mail address for the administrator of the Dfs root in the Owners box
- Click the Edit button to specify a list of keywords.
- Haga clic en Aceptar.
How to create Dfs links
- Open the Dfs console
- In the left pane, choose the root that you want to create a link(s) for.
- Select the New Link option from the Action menu.
- The New Link dialog box opens.
- Enter the name that you want your users to see when they browse Dfs in the Link Name box.
- In the Path To Target box, enter the shared folder's UNC or DNS path. You can alternatively click the Browse button.
- Use the Comments box to enter any additional information.
- In the Amount Of Time Clients Cache This Referral In Seconds box, enter the amount of time for clients to cache the referral before they ascertain whether it is still valid.
- Haga clic en Aceptar.
How to create targets for the Dfs root to provide redundancy
When working with domain based Dfs roots, you can configure the Dfs root with targets to provide redundancy. By setting up multiple targets for the Dfs root, you are enhancing fault tolerance for the Dfs tree. Targets can also be configured to automatically replicate with one another. You can ensure that users can continue to access files when a server has a failure by creating additional targets for your Dfs links.
To create targets for the Dfs root
- Open the Dfs console
- Navigate to the domain based Dfs root that you want to add targets for.
- Select the New Root Target option from the Action menu
- This action initiates the New Root Wizard.
- Enter the DNS name of the server that is going to host the new target. You can click Browse to find the server. Haga clic en Siguiente
- Enter the path of the folder that you are going to use for the Dfs root target. You can click Browse to find the folder. Haga clic en Siguiente
-
Verify the settings that you have specified.
- Haga clic en Finalizar
- The new Dfs root target is created.
Bookmark Understanding Fault Tolerance
Latest Blog Posts