You are on page 1of 106

Tcnicas para el diseo de

sistemas electrnicos
tolerantes a fallas

(Evaluacin y Clculo de la Confiabilidad)


Fulvio Corno, Maurizio Rebaudengo,
Matteo Sonza Reorda
Politecnico di Torino
Dipartimento di Automatica e Informatica

Introduccin

Para obtener un producto confiable se debe


partir de un diseo confiable a travs de:

Lineas gua durante el diseo


Previsin de la confiabilidad y anlisis de
riesgo.
Mejoramiento de la confiabilidad.

Resumen

Medidas Cuantitativas de Confiabilidad

Tcnicas para la evaluacin de la confiabilidad.


Clculo de la confiabilidad de un sistema.

Resumen

Medidas Cuantitativas de Confiabilidad

Tcnicas para la evaluacin de la confiabilidad.


Clculo de la confiabilidad de un sistema.

Clculo de la Confiabilidad

Se analizarn algunos conceptos


cuantitativos que buscan calcular la
confiabilidad como caracterstica de un
objeto, a travs de la funcin matemtica

de confiabilidad

El objetivo es un tratado matemtico que


pueda definir la confiabilidad a nivel de
sistema, partiendo de la confiabilidad de
cada componente.
5

Confiabilidad

La confiabilidad es un campo relativamente


nuevo cuyo nacimiento se debe
principalmente a la creciente complejidad
de las tecnologas modernas y al rpido
progreso de la microelectrnica.

Un poco de historia

Los problemas de escasa confiabilidad se


hicieron evidentes en los equipos militares
usados por los norteamericanos desde los
aos 60.
Algunos estudios revelaron que:

Los equipos electrnicos eran operativos slo el


50% del tiempo.
2/3 de los equipos del ejrcito estaban en
reparacin.
7

Tasa de Falla y Funcin de


Confiabilidad

Intuitivamente:

Tasa de Falla = nmero esperado de fallas (de

un DISPOSITIVO de o de un SISTEMA) por


unidad de tiempo.
Funcin de Confiabilidad = Probabilidad de que
un nico componente NO est daado en el
tiempo t

Se deben proveer definiciones formales


8

Funcin de Confiabilidad

R(t) = Probabilidad condicional de que el


componente funcione correctamente
durante el intervalo (t0,t), dado que en el
tiempo t0 l funcionaba correctamente.

Derivacin de la Funcin de
Confiabilidad

Se someten a prueba N componentes


idnticos en el tiempo t0
Despus de un tiempo t tendremos N0
componentes funcionantes (operational) y
Nf componentes daados (failed): N = NO +
NF .

NO (t )
NO (t )
R (t ) =
=
N
NO (t )+ N F (t )
10

Interpretacin

R(t) es la probabilidad de que el


componente sobreviva al intervalo (t0, t)
Prolongando el tiempo, el nmero de
componentes funcionantes NO disminuye,
como consecuencia la Funcin de
Confiabilidad disminuye.

NO (t )
R (t ) =
NO (t )+ N F (t )
11

Funcin de No-Confiabilidad (I)

Q(t) es la probabilidad de que un


componente NO sobreviva al intevalo (t0,
t). Se llama tambin Funcin de Densidad

de Malfuncionamiento.

Los eventos
Componente
Componente
mentarios:

12

Funcin de No-Confiabilidad (II)

N F (t )
Q (t ) =
NO (t )+ N F (t )

13

Ritmo de Decaimiento (I)


Calculamos la derivade de R(t) con
respecto al tiempo
N F (t )
R(t ) = 1 Q(t ) = 1
N
dR(t ) 1 dN F (t )
=
dt
N dt
dN F (t )
dR(t )
= ( N )
dt
dt

14

Ritmo de Decaimiento (II)

dNF/dt se puede interpretar como el


nmero de componentes que sufren daos
durante un intervalo de tiempo dt,
comprendido entre t y t+dt; que equivale a
la velocidad de dao en el tiempo t.

dN F (t )
dR(t )
= ( N )
dt
dt
15

Tasa de Dao (I)

Dividiendo ambos miembros de la ecuacin


entre NO(t) se obtiene z(t), conocida como
Funcin de Peligro o Tasa de Dao o Tasa
de Falla

N dR(t )
1 dN F (t )
z (t ) =
=
N O (t ) dt
N O (t ) dt
16

Tasa de Dao (II)

Siendo R=NO/N , la Tasa de Dao se puede


expresar como:

dR(t )
dt
z (t ) =
R(t )

17

Frmula matemtica de la
Confiabilidad

Manipulando e integrando se obtiene la


frmula matemtica de Confiabilidad:
d R (t )
z (t ) d t =
R (t )
t
R ( t ) d R (t )
R d R (t )
0 z (t )dt = R ( 0) R (t ) = 1 R (t )
t

z (t )dt = ln R (t )
0

R (t ) = exp z (t )dt
0

18

Comportamiento de la Tasa de Dao

z(t) no es constante sino que evoluciona


atravezando 3 fases.

mortalidad infantil (o peligro de asentamiento)


vida til
envejecimiento

En la regin de vida til:

z(t) ~ constante = (tasa de falla)

19

Comportamiento de la Tasa de Dao


Funcin Tasa de Falla

z(t)

Curva en forma
de Tina de
bao

Tasa de
Fallas
Constante

Fase de
Mortalidad
Infantil

Periodo de vida til

T1

Fase Senil

T2
Tiempo

20

Tasa de Dao

Representa un tasa de dao constante en


la vida til del producto.
Se expresa como el nmero de daos por
unidad de tiempo
Es conveniente hacer funcionar el sistema
en la zona en la cual z(t)=

21

Tiempo de Misin

Es la cantidad de tiempo que se necesita


para garantizar que el sistema satisfaga un
cierto grado de servicio.
Ejemplos de tiempo de misin:

Misil: pocas horas


PC: 5 aos
Satlite: 10 aos
Central telefnica: 20/25 aos
22

Ciclo de vida de un producto

El comportamiento de la tasa de dao, en


forma de tina de bao aparece
sistemticamente cada vez que se analiza
por completo el ciclo de vida de un gran
nmero de sistemas de diferente tipo:
mecnicos, elctricos, electrnicos, etc.

23

Ciclo de vida de un producto

Se analizan los tres periodos


separadamente.

24

Periodo de Asentamiento

La tasa de dao decrece debido a que los


elementos dbiles se daan.
Despus del tiempo T1 todos los elementos
de constitucin dbil cesan de funcionar.

25

Daos Infantiles (I)

El perodo de asentamiento se caracteriza


por daos debidos a la calidad del proceso
productivo, se atribuyen tpicamente a la
rotura de componentes que presentan
algn defecto intrnseco.
En el caso de los semiconductores:
soldaduras mal hechas, contenedores no
hermticos, grandes defctos tecnolgicos,

26

Daos Infantiles (II)

Estos componentes se daan durante las


primeras horas (das o meses) dado que
son ms dbiles que los dems (mortalidad
infantil) y los daos que producen se
llaman Daos Infantiles (early fault).

27

Prevencin de Daos Infantiles

Los Daos Infanties relacionados con el


periodo de asentamiento:

Pueden ser reconocidos y eliminados


fcilmente usando procedimientos (pruebas
aceleradas, burn-in) que permitan forzar la
manifestacin del defecto intrnseco en el
sistema.

28

Las Pruebas Aceleradas (I)

Buscan acelerar la degradacin del sistema


en un tiempo dado, aumentando las
condiciones de exigencia con respecto a
aquellas de uso normal.
Resultan vlidas y significativas cuando no
introducen modos o mecansmos de dao
diferentes a los que se verificaran en la
condiciones de uso normal.
29

Las Pruebas Aceleradas (II)

Las exigencias que se exaltan para acelerar


la vida de los dispositivos pueden ser de
tipo:

Ambiental
Elctrico
Mecnico

(temperatura, humedad)
(voltaje, corriente)
(vibraciones, golpes).

30

Burn-in

Aproximadamente, la vida operativa


vivida se duplica cada vez que la
temperatura supera el 10% de la
temperatura nominal de trabajo.
El burn-in ms utilizado es:

Para aparatos: funcionamiento a 45C de 12 a


45 horas.
Para componentes: funcionamiento a 125C
por 168 horas.
31

Periodo de Vida til

Despus del asentamiento, la tasa de dao


se estabiliza sobre un valor casi constante
por un periodo de tiempo relativamente
largo (periodo de vida til)
Este es el periodo ms interesante para el
usuario, porque se caracteriza por el valor
ms bajo de tasa de dao.

32

Daos en la Vida til (I)

El periodo de vida til se caracteriza por


daos causados por eventos que,
relacionados tpicamenten con el ambiente,
alcanzan incrementos imprevistos de
exigencia, ms all de la resistencia
mxima establecida por el diseo.

33

Daos en la vida til (II)

Como consecuencia:

Tales daos se pueden verificar durante


intervalos casuales, de manera imprevista, del
todo inesperada (daos casuales)
Ningn asentamiento ni ningn mantenimiento
es capaz de eliminarlos

34

Periodo de Desgaste

La Tasa de Dao crece rpidamente.


Los daos son debidos al envejecimiento
progresivo de los componentes: Daos
Seniles (wearout fault)

35

Daos Seniles

Durante este periodo se hacen evidentes


los mecansmos de dao intrnsecos de
cada tecnologa e independientes de la
construccin especfica de cada
componente.

36

Ejemplo

La utilizacin de un sistema metlico Au-Al


para la realizacin de soldaduras hace
inevitable el hecho de que, despus de
algunos aos (por ejemplo 10), la
soldadura se despegue, debido a la
formacin de compuestos intermetlicos
frgiles.

37

Prevencin de Daos por Desgaste (I)

Si la utilizacin del sistema no es contnua y


ste se puede apagar peridicamente, es
conveniente reemplazar, a intervalos
regulares y de duracin apropiada, los
componentes accesibles que se sabe estn
sometidos al desgaste (mantenimiento
preventivo).

38

Prevencin de Daos por Desgaste (II)

Si los componentes sometidos a desgaste son


inaccesibles entonces deben ser diseados larga
vida, de tal forma que el desgaste suceda
despus del tiempo de misin.
La aplicacin de este segundo mtodo comprende
los sistemas de un solo intento (one shot) que se
utilizan solo una vez, por ejemplo misiles o
satlites.

39

Ley Exponencial de Daos

Aplicando la frmula matemtica de la


confiabilidad durante el periodo de vida
til, con z(t)=:
R(t ) = e t
R(t)
1

1/

t
40

Medidas de Confiabilidad

Ms all del comportamiento estadstico de


R(t), es posible definir algunas medidas
particularmente representativas del nivel de
disponibilidad de un sistema.
Estas medidas son vlidas exclusivamente
cuando z(t)= (Daos Casuales).

41

Tiempo Medio antes de la Falla


(MTTF Mean Time To Failure)

Es el tiempo previsto durante el cual el


sistema funcionar antes de la primera
Falla.

42

Relacin entre MTTF y Confiabilidad

Despreciando algunos pasos:

MTTF = R(t )dt


0

Durante la vida til:

MTTF = e dt = 1
0

43

Relacin entre MTTF y Tiempo


de Misin
t

R(t)

MTTF

0.368

MTTF / 10

0.905

MTTF / 20

0.951

MTTF / 100

0.990

MTTF / 1000

0.999

R(t)
1

1/=MTTF

44

Consecuencias (I)

La confiabilidad de un sistema que posee


una MTTF igual al su tiempo de misin es
igual a 0.368.
Esto implica que: haciendo funcionar 100
dispositivos del mismo tipo, al final del
tiempo de misin funcionarn ~37,
mientras que ~63 se habrn daado antes.

45

Consecuencias (II)

Para obtener, al final del tiempo de misin,


una confiabilidad del 99.9%, se debe
garantizar un MTTF 1000 veces superior al
Tiempo de Misin.

46

Sistemas Reparables (I)

Se define un Sistema Reparable a aquel,


despus de un malfuncionamiento, se
puede restablecer gracias a alguna accin
de mantenimiento o reparacin.

47

Sistemas Reparables (II)

El mantenimiento de un Sistema Reparable


se puede hacer de 2 modos:

Accin Correctiva: realizada como respuesta a


un malfuncionamiento
Accin Preventiva: realizada para prevenir o
retardar un malfuncionamiento.

48

Modelado de un Sistema

Un Sistema Reparable se encuentra en 2


estados posibles:

Funcionante (up)
En reparacin (down).

Ntese que el sistema puede estar en


Reparacin por una Accin Correctiva o por
una Accin Preventiva.
49

Tiempo Medio antes de la Reparacin

(MTTR Mean Time To Repair)

Se define como el tiempo medio necesario


para reparar el sistema.
Es difcil modelarlo matemticamente;
generalmente se recurre a datos
estadsticos medidos en laboratorio.

50

Tiempo Medio Entre Fallas


(MTBF Mean Time Between Failure )

Es el tiempo medio que pasa entre dos


fallas del sistema
Es diferente al MTTF, porque el MTTF hace
referencia a la Primera Falla
Toma en cuenta tambin el tiempo de
reparacin
Si navg es el nmero medio de fallas en un
T
periodo T, se tiene:
MTBF =
navg
51

Relacin entre MTTF, MTBF, MTTR

Se supone que las reparaciones son


siempre posibles y perfectas (good as new)
Luego de cada reparacin, el sistema
funcionar durante el MTTF
Cuando el sistema falle, restar inactivo
durante el MTTR
Como consecuancia: MTBF = MTTF + MTTR
52

Disponibilidad

Proporcin de tiempo durante el cual el


sistema est disponible

MTTF
A=
MTTF +MTTR

53

Ejemplo

Considerando un sistema con:

MTTF = 886 horas


MTTR = 25 horas

A = 886/911 = 0.972

54

Resumen

Medidas Cuantitativas de Confiabilidad

Tcnicas para la evaluacin de la confiabilidad.


Clculo de la confibilidad de un sistema.

55

Calculo de la Confiabilidad de un
Sistema

Problema

Calcular la Confiabilidad de un sistema,


conociendo las tasa de dao de los
componentes que lo constituyen.

56

Modelo de Previsin de
Confiabilidad

Expresin matemtica que permite calcular


un valor esperado dada la tasa de dao de
un componente como funcin de las
caractersticas tecnolgicas, de las
exigencias elctricas, trmicas y
ambientales en las cuales el componente
trabaja.

57

Finalidad de un Modelo de Previsin

Verificar el cumplimiento de los objetivos


del diseo
Establecer los valores contractuales
Confrontar ms soluciones.

58

Modelos de Previsin: los Bancos


de Datos

Las tasas de dao son elencadas en


manuales
La tasa de dao se expresa a travs de un
modelo que contiene todo lo conocido
sobre las leyes de degradacin de los
componentes y la dependencia de factores
importantes.

59

Condiciones Habituales de
Funcionamiento

La estimacin correcta de la confiabilidad


calculada para un sistema, depende de la
exctitud de los valores de tasa de dao
adoptadas para los componentes.

60

Condiciones No Habituales de
funcionamiento

La Tasa de Dao sufre fuertes variaciones


con la variacin de los niveles de exigencia.
La Tasa de Dao de los componentes
electrnicos son fuertemente influenciadas
por los niveles de voltaje, corriente y
temperatura.

61

Valor de la Tasa de Dao

El valor asumido como Tasa de Dao de los


componentes se refierea un conjunto de:

Condiciones de funcionamiento (ej.: valores de


voltaje, corriente y temperatura).
Niveles de exigencia mecnica (ej.: las
vibraciones y los golpes).

62

Manuales

MIL-HDBK-217: Departamento de la
Defensa a partir de 1962
RDF: CNET Francia 1974
HRD: British Telecom UK 1974
RPP: Bell Core USA 1984
AT&T: USA 1990
IRPH93: Italtel, CNET e BT EU - 1993
63

MIL-HDBK-217

En el mbito electrnico, la referencia ms


conocida y usada es el manual MIL-HDBK217, publicado por el Departamento de la
Defensa USA en 1962 y actualizado
peridicamente. De este manual es posible
extraer la tasa de falla de cualquier
componente electrnico bajo cualquier
condicin de uso.
64

MIL-HDBK-217: Objetivo

Definir y mantener mtodos consistentes y


uniformes para estimar la confiabilidad de
los sistemas electrnicos en el mbito
militar.
Proveer modelos para el clculo de tasas de
dao.

65

MIL-HDBK-217

Presenta 2 mtodos:

Part stress analysis: presupone el conocimiento

de la informacin detallada del sistema y por


tanto se utiliza al final del diseo.
Parts count: necesita menos informacin y se
utiliza en la fase preliminar del diseo para
obtener una primera estima.

66

MIL-HDBK-217: Part Stress


Analysis (I)

Se debe disponer de una lista detallada de


las partes utilizadas en el sistema y de los
esfuerzos (stress) a los cuales se somenten
Hiptesis:

Componentes independientes.
Tasa de dao constante.

67

MIL-HDBK-217: Part Stress


Analysis (II)

p = b Q E A
p: Tasa de dao de la componente
b: Tasa de dao base
i : Factores que modifican la tasa de dao
base en funcin de los parmetros que
pueden influenciar la confiabilidad de la
parte.
68

MIL-HDBK-217: Part Stress


Analysis (III)

Principales factores utilizados:

Q: Factor de Calidad: depende del seleccin

(screeining) sufrida por la parte


E: Factor Ambiental: Toma en cuenta los

efectos de las condiciones ambientales (sobre


la tierra, sobre una nave, al vuelo, en el
espacio, sobre un misil, etc.)

69

MIL-HDBK-217: Part Stress


Analysis (IV)

Otros factores utilizados solo en modelos


especficos:

L: Factor de Aprendizaje, tiene en cuenta la madurez

de la tecnologa.
T: Factor de Temperatura.
E: Factor de Aplicacin
R: Factor de Potencia
S: Factor de Esfuerzo Elctrico
C: Factor de Construccin del Contacto
S: Factor de Funcin.

70

MIL-HDBK-217: Ejemplo

GAL (Generic Array Logic) y


Microprocesadores:

p = (c1 T + c2 E) Q L

71

Ejemplo de condiciones de referencia

Para la definicin del factor ambiental (E)


se definen 3 clases de ambiente:

Protegido climatizado
No protegido
Mvil

E = 0
E = 2.5
E = 4

72

MIL-HDBK-217: Parts Count

Informacin necesaria:

Tipo y cantidad de partes:


Nivel de calidad de las partes:

= N i (G Q )i
n

i =1

73

Limitacin de las previsiones de


Confiabilidad a travs de manuales

Limitacin de los bancos de datos que


normalmente contienen poca informacin
acerca de los mecanismos de dao.
Hipotesis de tasa de dao constante.
La tecnologa electrnica est en constante
evolucin cosa que aumenta la dificultad de
evaluar la confiabilidad.
74

Estimacin de la Confiabilidad de un
Sistema

Instrumentos de software disponibles en el


mercado, permiten calcular los parmetros
de confiabilidad partiendo del modelo de
descripcin del sistema.

75

Diagrama de Bloques de Confiabilidad

(RBD Reliability Block Diagram)

Diagrama de eventos
Muestra como el dao de cualquier
componente influenciara el desempeo del
sistema.
Un sistema subdividido en unidades lo
suficientemente pequeas para poder
calcular la confiabilidad.
76

RBD: anlisis del sistema

En el diseo de un sistema cada parte


puede ser:

nica (el dao de tal elemento implica la falla


del sistema); tales elementos son necesarios
para realizar la funcin del sistema
Repetida (el dao de una de estas las partes se
compensa con el funcionamiento de sus
iguales)
77

Esquema de Confiabilidad

A partir del diseo se puede realizar un


sistema de bloques, conocido como
esquema de confiabilidad, en el cual:

Los elementos nicos se conectan en serie


Los elementos repetidos se conectan en
paralelo.

78

Ejemplo
in

c1
c2

El sistema est formado por C1,


C2 e C3 que son esenciales para
el funcionamiento del sistema.
C5 es una repeticin de C4.

c3
c4

c5

out
79

Sistemas Serie (I)

En los sistemas Serie es suficiente con que


un solo elemento se dae para interrumpir
toda la cadena.
R1

R2

R3

80

Sistemas Serie (II)

La probabilidad de sobrevivencia del


sistema es el producto de la probabilidad
de sobrevivencia de cada bloque en serie.
Rs(t) = R1(t) R2(t) R3(t) = e -(1+2+3) t

81

Sistemas Serie (III)

En un sistema Serie la confiabilidad est


dada por el producto de la confiabilidad de
cada bloque y la Tasa de Dao es la suma
de las Tasas de Dao

s = i
Rs = Ri

82

Ejemplo 1

Analizando una central de conmutacin


compuesta por 10.000 componentes y
asumiendo que cada componente tenga
una Tasa de Dao = 10-7 = 0.1
ppm/hora.
La confiabilidad del sistema es:

Rs = e

-(10^4 10^-7) t

=e

- t / 1000

MTTF = 1000 horas


83

Ejemplo 2 (I)

Consideremos un circuito electrnico


compuesto por:

4 transistores de silicio,
10 diodos de silicio
20 resistencias de aglomerado.
10 condensadores cermicos.

84

Ejemplo 2 (II)

Supongamos adems que:

El cableado (circuito impreso) y las soldaduras


sean 100% confiables.
Que los componentes trabajan bajo sus niveles
nominales de voltaje, corriente y temperatura.

85

Ejemplo 2 (III)

Supongamos que las tasas de dao sean


las siguientes para cada componente:

diodos:
transistores:
resistencias:
condesasdores:

d
t
r
c

=
=
=
=

0.000002
0.00001
0.000001
0.000002

86

Ejemplos 2 (IV)

Para evaluar la confiabilidad del circuito se


deben sumar las tasas de dao:

s = 10 d + 4 t + 20 r + 10 c
s = 0.0001
MTTF = 1 / s = 10.000 horas

87

Sistemas Paralelo (I)

Un conjunto de elementos tales que cada


uno es suficiente para asegurar el
funcionamiento del sistema.

R1

R2

88

Sistemas Paralelo (II)

Un sistema paralelo est constituidos por


dos aparatos similares, uno de los cuales es
redundante y entra en funcionamiento
cuando el otro se daa.
Un sistema paralelo se daa cuando ambos
aparatos se daan.

89

Sistemas Paralelo (III)

La probabilidad de dao de un sistema


paralelo se debe a la probabilidad del dao
contemporneo de cada aparato.
Suponiendo que los daos en cada aparato
sean independientes:

Qp(t) = Q1(t) Q2(t) Q3(t)

Qp(t) = [1 - e

-1 t

] [1 - e

-2 t

] [1 - e

-3 t

]
90

Ejemplo

Un aparato constituido por dos bloques


redundantes de 10.000 componentes,
posee una tasa de dao de 10-7 la
probabilidad de dao del sistema es:

Qs = ( 1 - e
Rs = 1 Qs

-t/1000

)(1-e

-t/1000

91

Duplicacin

En un sistema duplicado:

Q (t) = [1 - e - t ]2 = 1 - 2 e - t + e
R(t) = 1 - Q (t) = 2 e - t - e 2 t

2 t

MTTF = R(t )dt


0

MTTF = 1.5 / = 1.5 MTTF0

92

M1

Redundancia 2-de-3

M2

M3

Como hipotesis el comparador de votos (voter) est


libre de daos.
La confiabilidad se determina enumerando los casos
disyuntos de funcionamiento correcto.

Los 3 estn libres de daos (probabilidad R03)


M1 y M2 funcionante, M3 daado (probabilidad R02(1-R0))
M1 y M3 funcionante, M2 daado (probabilidad R02(1-R0))
M2 y M3 funcionante, M1 daado (probabilidad R02(1-R0))

R = R03 + 3R02(1-R0) = 3R02 2R03 = 3e-2t 2e-3t


MTTF = 3/2-2/3=5/6= 5/6 MTTF0

93

Cut Set

Es el conjunto de componentes, cuyo dao


provocara unmalfuncionamiento del
sistema
1

2
4
3

Cut Set: {(1,3), (2,3), (4)}


94

Tie Set

Es el conjunto de componentes, cuyo


funcionamiento asegura el funcionamiento
del sistema.
1

2
4
3

Tie Set: {(1,2,4), (3,4)}


95

Redundancia (I)

Activa: los elementos redundantes son sometidos


a la misma carga que el resto de los elementos
operativos, durante todo el tiempo de misin.
(R= 0)

Caliente: los elementos redundantes son


sometidos a una carga ms baja hasta que uno
de los elementos operativos se daa (R < 0)
Stand-by: los elementos redundantes no se
somenten a ninguna carga hasta que uno de los
elementos operativos se daa (R= 0).
96

Redundancia (II)

En los casos de redundancia caliente y


stand-by se existe de un interruptor
(switch) que permite el cambio
maestro/esclavo (master/slave) en el
momento en el que se presenta el dao en
el maestro (master).

97

Caso de studio

Calcule la confiabilidad del sistema ilustrado


en la figura.
A1
CS

A2
98

Descripcin del sistema

Los dos aparatos A1 y A2 don redundantes.


Un interruptor S (accionado usando un
comando de cambio CS) permite
seleccionar uno de los dos aparatos.

99

Construccin del Esquema de


Confiablidad

Para obtener el esquema de confiabilidad


se deben buscar los eventos que pueden
conducir al dao del sistema. Tales
eventos son:
1. Se daan ambos, A1 y A2
2. Se daa S
3. Se daan ambos, A1 y CS.

100

Esquema de Confiabilidad

Cada uno de los eventos considerados es


suficiente para bloquear el sistema,
entonces se conectan confiabilsticamente
en serie.
Los sub-eventos que componen los eventos
1 y 3 se deben conectar en paralelo porque
deben suceder los dos para que el sistema
se dae.
101

Esquema de Confiabilidad

El esquema de Confiabilidad es el
siguiente:
1
2

1
s

cs

102

Ejercicio

El servidor de una base de datos necesita


315GByte de disco, tal espacio se obtiene usando
9 discos de 35GByte. Por cuestiones de
desempeo, no se conectan ms de 3 discos a un
mismo controlador.
Considere los siguientes sistemas:

Sistema no tolerante a fallas: el sistema se daa


cuando se daa un disco o un controlador o el servidor.
Sistema tolerante a fallas: Con esta arquitectura el
malfuncionamiento de un disco debido al controlador
es compensado por el sistema.

103

Ejercicio

(continuacin)

Disear el esquema confiabilstico


Calcular las funciones de confiabilidad
asumiendo los siguientes valores de MTTF:

Disco, MTTFD = 200.000 horas


Controlador, MTTFC = 500.000 horas
Servidor, MTTFS = 25.000 horas.

104

Solucin (I)

Sistema no tolerante:
s

c1

d1

d2

d3

c2

d4

d5

d6

c3

d7

d8

d9

s = S + 3 C + 9 D =
4*10-5 + 6*10-6 + 4.5*10-5 = 9.1*10-5
MTTF = 1 / s = 1098 horas
105

Solucin (II)

Sistema tolerante:

d4

d1

c1

d2

c2

d5
d6

d3

d10

d7
c2

d8
d9

c4

d11
d12

s = S + 4 C + 4*6/5 D + =
4*10-5 + 8*10-6 + 2.4*10-5 = 7.2*10-5 = 1388 horas
106