You are on page 1of 19

Calculadora de disponibilidad implementada en una hoja de calculo

Esta hoja de calculo intenta ayudar en los calculos de disponibilidad para topologias de servidores distribuidos. Debe usarse e The spreadsheet should be used as a "worksheet" based around the "Overall Chain" calculation on sheet 2. The other sheets perform individual calculations, the results of which can be entered in the "Overall Chain" calculation.

Sheet 3, "Clusters", allows the overall availability of a cluster of servers to be calculated. This allows the cluster to be treated a overall chain.

Sheet 4, "Stacks", allows the availability of a single node to be calculated from the individual availabilities of each element of th hardware, software etc.). The results from these calculations can be used in either cluster or overall chain calculations.

Sheet 5, "Capacity & Availability", provides several utility calculations - e.g. how to calculate availability from mean time betwee capacity relates to availability. The results from these calculations can be used in calculations for Stacks, Clusters and / or the

the cluster to be treated as a single element in the lities of each element of the stack on that node (e. chain calculations.istribuidos. and how redundant cks. Debe usarse en conjunto con el paper sheet 2. . The other sheets should be used repeatedly to . Clusters and / or the Overall Chain.g. ity from mean time between failures.

6502416038% 1 2 3 ISP Centro de datos Red 99. debe ser usada cuando la disponibilidad para cu cluster en la topologia ha sido calculado.Calculos para la cadena global de la topologia Esta hoja debe se usada para calcular las dispobilidad global de la topologia. Capturar la descripcion y disponibilidad de componetes en tantas celdas como requiera y deje el resto en blanco Esta hoja debe ser usada de acuerdo a la guia en ____ del paper Disponibilidad global Cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad 99.9998120000% 99. asi los cluster pueden ser tratados como componentes individuales La hoja contiene 5 renglones de 10 elementos.9990000000% 99.8610000000% 11 12 13 21 22 23 31 32 33 41 42 43 .

9090000000% 99.9720000000% 14 15 16 4 7 8 9 17 18 19 24 25 26 27 28 29 34 35 36 37 38 39 44 45 46 47 48 49 .ser usada cuando la disponibilidad para cualquier omponentes individuales ad de componetes en tantas celdas como se 5 6 Cluster del servidor de Bases de datos Cluster HTTP Aplicaciones (Backend) 99.9090000000% 99.

10 20 30 40 50 .

So. 4. 6. The formula also applies to linear chains. 3. 1095 dias o 3 años para UNIX) 24. Véase la hoja 5.g.908759% 0. select "Tools" . 2. e. Esta hoja debe ser usada de acuerdo a la guia del paper Capturar los datos base aqui: Tamaño del cluster Numero de servidores que pueden fallar y que se considere que el cluster es “disponible” Tiempo medio para fallas en un solo nodo (dias) Tiempo medio para recuperacion de un solo nodo (horas) Disponibilidad Calculada de un solo nodo Disponibilidad calculada de reemplazo de un solo nodo % (Dejar en blanco para aceptar la cifra anterior en rojo) Disponibilidad Normalizada de un solo nodo en uso Resultados Disponibilidad del Cluster Capacidad redundante en operaciiones normales Notes de los calculos: 1. 24 horas o 1 dia para UNIX) 99. Note that if the cluster depends on.. e. overall node availability = (application availability) * (OS availability) * (HW availability). Take a cluster of 10 servers."Unlock Sheet" and enter the password "availability".g. apart from the entry data cells.g.Calculadora de Disponibilidad de Clusters Esta hoja de calculo calcula la disponibilidad global de un cluster de nodos La disponibilidad es definida como el porcentaje de tiempo que la capacidad requerida es disponible – asi se contabiliza tomando la redundacia disponible en el cluster cuando el cluster completo es disponible. 7. 5. e. overall availability = (ISP availability)*(data centre availability)*(HTTP cluster availability)*(application availability)*backend/database availabililty). This formula also applies to individual components on a node. to prevent losing the calucations.g. This spreadsheet is protected. of which servers 1-9 are available and 10 is unavailable. then the overall availability is (data centre availability) * (cluster availability). The probability of this specific configuration is (probability of an individual server being available)^9*(probability of an individual server being unavailable). 5 1 1095 (e."Protection" . physical data recovery. To remove protection.0000 (e. If you really want to know how this works … a. Availability = 1-((mean time to recover)/(mean time to failure + mean time to recover)).99908759 #VALUE! 20% . “Capacidad y Disponibilidad” para calculos adicionales en esta area.g. the overall availability should always be calculable from a nested combination of simple chains and clusters.

except availabilities are usually expressed in percentages rather than values from 0 to 1. Assuming we can afford 3 out of 10 servers to be unavailable. the probability the cluster is unavailable is the sum of the probabilities of 4. Now ask: how many ways are there of 2 servers out of 10 being unavailable? Or x servers out of y being unavailable? g. h. all we need to do is find out what "available" means.6. l. f.3. The total probability of x servers then being unavailable is (answer to g)*(answer to h) … I. i. m. n.e. there's your answer. Honest . Now. d. Then. … or x servers out of y being unavailable. the probability of any one of the combinations happening. Anything else is available. So.7. (probability of an individual server being unavailable) = 1 .5. we have the probabilities of 1.9 or 10 servers being available. c.8. ^ above means "raise to the power of". j.(probability of an individual server being available). e. Where y! = "y factorial" = 1*2*3* … *y. So.there are 9 other ways (i. servers 1 to 9). However: servers 1-9 being available and server 10 being unavailable is not the only way 1 server out of 10 can be unavailable . probability is the same as availability.2. multiplied by the number of combinations.e. in terms of the cluster. k. The probability of a specific x servers out of y being unavailable is (probability of an individual server being available)^(y-x)*(probability of an individual server being unavailable)^x.b.-) . Alternatively. Maths gives us the answer: the number of ways is y!/((y-x)!*y!). go buy a maths book and enjoy.

000000 1. Contribuciones de disponibilidad Normalizada en uso 1.0000% 100. e.000000 1. Servidor de Aplicaciones> Elemento 1 2 3 4 5 servidor Descripcion Tomcat 7 Linux Tiempo medio para falla (dias) 1095 30 Tiempo medio para recuperacion (horas) 24 0.0000% 100. La disponibilidad de cada stack puede se usada como entrada a los calculos de la disponiblidad del cluster o el calculo de la disponibilidad global de la cadena o ambas Se considera que los datos del tiempo medio para falla y el tiempo medio para recuperacion podrian ser usados para describir la disponibilidad.9088% 99.999861 1.8949% Stack 2 <Introduce etiqueta aqui. e. Para contrarrestarla.Calculos de la disponibilidad por Stack Esta hoja provee calculos para determinar la disponibilidad de un nodo basado en su STACK de software y/o hardware Esta hoja debe ser usada de acuerdo a la guia del paper Las Tablas proveen para calcular la disponibilidad de hasta 10 stacks.g.000000 1.0000% 100.0000% 100.1 Contribuciones Disponibilidad Calculada 99. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).0000% 100. refiérase al paper Stack 1 <Introduce etiqueta aqui.g.9861% 100.000000 Disponibilidad Stack 1 99. capturar una cifra de disponibilidad en el renglon “reemplazo” abajo del renglon “disponibilidad calculada” Para componentespara los cuales la disponibilidad no es conocida.999088 0.0000% Stack 3 <Introduce etiqueta aqui.000000 Disponibilidad Stack 2 100.000000 1. e.000000 1.000000 1. Contribuciones de disponibilidad Normalizada en uso 0.g.0000% 100. Servidor de Aplicaciones> .0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).

0000% Stack 6 <Introduce etiqueta aqui.0000% 100.0000% 100.000000 Stack 4 <Introduce etiqueta aqui.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).000000 1.000000 1. Contribuciones de disponibilidad 1.000000 1.g.Elemento 1 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.g.000000 1. e.0000% 100. Servidor de Aplicaciones> Elemento 1 Descripcion 2 3 4 5 .000000 Normalizada en uso Disponibilidad Stack 5 100. e.g.000000 Disponibilidad Stack 4 100.000000 Normalizada en uso Disponibilidad Stack 3 100.000000 1.000000 1.0000% 2 3 4 5 100.000000 1.0000% 100.000000 1.0000% Stack 5 <Introduce etiqueta aqui.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.000000 1. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.000000 1.0000% 1.000000 1.0000% 100. Contribuciones de disponibilidad Normalizada en uso 1.0000% 100. e. Contribuciones de disponibilidad 1.0000% 100.

000000 Disponibilidad Stack 7 100. e. Contribuciones de disponibilidad Normalizada en uso 1. e.000000 1.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).g.000000 1. Contribuciones de disponibilidad Normalizada en uso 1.0000% 100.0000% 1.000000 Disponibilidad Stack 8 100.000000 Disponibilidad Stack 6 100. Contribuciones de disponibilidad Normalizada en uso 1.Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.000000 1. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.000000 1.0000% 100.0000% 100.000000 1.0000% 100.0000% Stack 9 <Introduce etiqueta aqui.0000% Stack 8 <Introduce etiqueta aqui.000000 1.0000% 100.000000 1.0000% 100. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.000000 1. Servidor de Aplicaciones> Elemento 1 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) 2 3 4 5 . e.000000 1.0000% 100.000000 1.0000% 100.g.000000 1.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).0000% 100.0000% 100.000000 Stack 7 <Introduce etiqueta aqui.g.

0000% 100.0000% 100. e.000000 1.0000% 100.0000% 100.0000% 100.g.0000% 1.000000 1.0000% 100. Contribuciones de disponibilidad Normalizada en uso 1.000000 1. Contribuciones de disponibilidad 1.000000 Disponibilidad Stack 9 100.0000% . Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.000000 1.000000 1.Contribuciones Disponibilidad Calculada 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).000000 1.000000 1.0000% 100.000000 Stack 10 <Introduce etiqueta aqui.000000 Normalizada en uso Disponibilidad Stack 10 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default).

000000 1.0000% 100.0000% 100.0000% 100.0000% 100.000000 1.000000 6 7 8 9 10 100.0000% 100.000000 1.000000 .000000 1.000000 1.e software y/o hardware a stack puede se usada al de la cadena o ambas drian ser usados para n “reemplazo” abajo del 6 7 8 9 10 100.0000% 100.0000% 100.0000% 100.000000 1.0000% 1.0000% 1.000000 1.000000 1.

0000% 100.0000% 100.000000 6 7 8 9 10 .000000 6 7 8 9 10 100.000000 1.0000% 100.0000% 100.000000 1.000000 1.000000 1.6 7 8 9 10 100.0000% 100.0000% 100.0000% 100.0000% 1.000000 6 7 8 9 10 100.000000 1.0000% 100.000000 1.0000% 1.0000% 1.0000% 100.0000% 100.000000 1.000000 1.000000 1.0000% 100.000000 1.0000% 100.000000 1.000000 1.

000000 1.000000 1.000000 1.0000% 100.0000% 100.000000 1.0000% 1.000000 6 7 8 9 10 100.0000% 100.000000 1.0000% 100.000000 1.0000% 100.0000% 100.0000% 100.0000% 100.0000% 100.000000 1.000000 1.0000% 100.000000 1.0000% 100.000000 6 7 8 9 10 100.0000% 1.0000% 1.000000 6 7 8 9 10 .000000 1.100.000000 1.0000% 100.000000 1.

0000% 100.0000% 1.000000 1.100.0000% 100.0000% 100.000000 1.0000% 100.0000% 100.000000 1.0000% 100.000000 1.0000% 100.0000% 100.000000 1.000000 1.000000 .000000 1.000000 6 7 8 9 10 100.000000 1.0000% 1.

Cálculos del tiempo promedio de falla Se calcula la disponibilidad basada en el “tiempo promedio de falla” (i.00% 23.Cálculos de Capacidad y Disponibilidad Esta hoja contiene cálculos para capacidad básica y disponibilidad. Los cálculos son usados para proveer datos a cualquiera Esta hoja debe ser usada de acuerdo a la guia en <SECTION> del documento <LINK>.EL tiempo promedio entre el fin de una falla y el empie recuperarse de ella. Que porcentaje de x esta preparado para invertir en redundancia de Se introduce el tamaño del cluster y número de servidores que se permiten fallar en "la hoja del Cluster" para determinar la d Redundancia de capacidad deseada como un porcentaje del número de servidores requeridos para capacidad normal (%) Number of servers required for normal capacity Numero total de servidores requeridos para soportar la disponibilidad Numero de servidores que pueden fallan mientras se mantiene la “disponibilidad” Actual redundant capacity as percentage of number of servers required for normal capacity Capacidad redundante como porcentaje del numero total de servidores requeridos para soportar la dispoibilidad 25 10 13 3 30. Tiempo Promedio para Falla (dias) Tiempo Promedio de recuperacion (horas) Disponibilidad Calculos de Capacidad y Disponibilidad para clusters Variante 1 3650 10 años 24.08% La siguiente tabla ilustra como las cifras anteriores evolucionan a medida que el tamaño de del cluster se incrementa (limitado .972610% Considerando que se quiere una capacidad normal de x.0000 1 dia 99.e.

00% Tamaño del cluster .86% 8 62.00% 7 57.00% 50.00% 6 50.00% 60.33% 10 70.86% La siguiente tabla ilustra como las cifras anteriores evolucionan de acuerdo al incremento del tamaño del cluster (limitado a ci Capacidad disponible cuando Capacidad de operación se permite que un numero de normal que es efectivamente servidores falle redundante 1 n/a n/a 2 n/a n/a 3 n/a n/a 4 25.00% 5 40. ¿Cuál es el porcentaje de capacidad disponi Servidores permitodos para que fallen Tamaño del cluster Capacidad disponible como fracción del total desplegado cuando se permite que un numero de servidores falle Normal operating capacity that is effectively redundant 3 7 57.00% 75.50% 37.14% 42.00% 30.14% 42.Numero de servidores requeridos para capacidad normal 1 2 3 4 5 6 7 8 9 10 Variante 2 Numero total de servidores requeridos para soportar disponibilidad 2 3 4 5 7 8 9 10 12 13 Numero de servidores que pueden fallar mientras se mantiene la disponibilidad 1 1 1 1 2 2 2 2 3 3 Asumiendo que tiene definido el tamaño del cluster y permite x servidores fallen.50% 9 66.67% 33.

dos para proveer datos a cualquiera de las otras hojas. edio entre el fin de una falla y el empiezo de otra falla). y el tiempo promedio para arado para invertir en redundancia de la capacidad para soportar la disponibilidad? hoja del Cluster" para determinar la disponibilidad global de del cluster se incrementa (limitado para cifras apropiadas a tamaño de cluster de 10 o menos): .

00% 25.00% 50.00% 28.00% 30.57% 33.00% 40.57% 22.00% 23.00% 50.33% 25.00% 20.08% es el porcentaje de capacidad disponible cuando x servidores fallan? o del tamaño del cluster (limitado a cifras apropiadas para tamaño de cluster de 10 o menos): .Capacidad redundante Capacidad redundante actual como porcentaje como porcentaje del del numero de servidores numero total de servidores requeridos para capacidad requeridos para soportar la normal disponibilidad 100.33% 25.22% 25.00% 33.00% 28.00% 20.33% 33.00% 33.33% 25.