Professional Documents
Culture Documents
Prevencija i
tolerancija
otkaza
6/17/2011
injenice
90% oruja zahteva raunare i softver za
upravljanje. Desilo se mnogo otkaza i
pogrenih lansiranja.
72 od 141 meteoroloih balona je uniteno
zbog pogrenog itanja zahteva
"emergency self-destruct" umesto "read
data" od strane francuskog
meteorolokog satelita.
.................
2
6/17/2011
injenice
Na svakih milion linija programskog koda,
unese se 20 000 bagova (bugs).
Normalno, 90% otkrije se u toku testiranja,
jo 200 otkaza otkrije se u toku prve
godine rada,
1800 bagova ostane nedetektovano!
U toku odravanja obino se otkrije 200 i
uvede 200 novih otkaza!
3
6/17/2011
Pojmovi
Pouzdanost (reliability) mera uspeha
sa kojim sistem zadovoljava specifikacije
ponaanja.
Kvar (failure) stanje kada sistem
odstupa od specificiranog ponaanja.
Otkaz (fault) Uzrok nastanka kvara.
4
6/17/2011
Pojmovi
Greka (error) detektovano
neodgovarajue ponaanje sistema koje je
uzrokovao otkaz.
6/17/2011
Tipovi otkaza
prolazni (transient) nastanu, postoje
neko vreme i nestanu (napr. ponaanje
komponenata zbog spoljnjeg polja),
stalni (permanent) nastanu i ostaju do
popravke sistema napr. prekid ice ili
softverska greka),
isprekidani (intermittent) nastaju
svemena na vreme (napr. hardverske
komponente osetljive na grejanje).
6
6/17/2011
Tipovi kvara
pogrena vrednost
pogreno vreme izvravanja:
suvie rano
suvie kasno
beskonano kasno (izostanak odgovora)
6/17/2011
6/17/2011
6/17/2011
Prevencija otkaza:
10
10
6/17/2011
11
11
6/17/2011
12
12
6/17/2011
Uklanjanje otkaza:
Procedure nalaenja i otklanjanja otkaza.
Nikada sistem nije tako iscrpno testiran da
se moe rei da su uklonjeni svi
potencijalni otkazi. Problemi su:
Test se koristi tako da pokae odsustvo, a
ne prisustvo otkaza.
Nekada je nemogue testirati sistem u
realnim uslovima.
Neke greke manifestuju se tek kada
sistem ue u upotrebu.
13
13
6/17/2011
Tolerancija otkaza:
Sistem moe da poseduje vie nivoa tolerancije
otkaza:
puna tolerancija otkaza sistem nastavlja sa
radom u prisustvu greaka, bez znaajnog
gubitka funkcionalnosti ili osobina,
blaga degradacija - sistem nastavlja sa radom
u prisustvu greaka, sa deliminom
degradacijom funkcionalnosti ili osobina u toku
oporavka ili popravke,
bezbedno zaustavljanje sistem zadrava svoj
integritet uz privremeni zastoj u radu.
14
14
6/17/2011
Funkcionalnost u
sluaju nude
omoguava razlikovanje
aviona.
Backup sa susednog punkta;
koristi se u sluaju
katastrofalnog kvara kao to je
zemljotres.
15
15
6/17/2011
16
16
6/17/2011
Hardverska redundansa:
Protektivna redundansa dodavanje
komponenata koje imaju funkciju
otkrivanja greaka i oporavak od greaka.
Statika redundansa redundantne
komponente unutar sistema koriste se za
skrivanje efekata otkaza.
Dinamika redundansa redundantne
komponente funkcioniu samo kada se
detektuje greka.
17
17
6/17/2011
Statika redundansa:
TMR (Triple Modular Redundancy)
18
18
6/17/2011
Trostruka redundansa:
TMR (Triple Modular Redundancy)
19
19
6/17/2011
Dinamika redundansa:
Redundansa primenjena unutar
komponente koja indicira eksplicitno ili
implicitno da je izlaz pogrean.
Obezbeuje detekciju greke, a ne
maskiranje. Oporavak mora da obezbedi
neka druga komponenta.
Primer: checksum, parity bit.
20
20
6/17/2011
21
6/17/2011
Programiranje u N verzija:
22
22
6/17/2011
23
23
6/17/2011
24
6/17/2011
25
6/17/2011
26
6/17/2011
27
6/17/2011
28
28
6/17/2011
29
6/17/2011
30
6/17/2011
Poreenje glasova:
Najbitnije kod programiranja u N verzija je
efikasnost i lakoa sa kojom drajverski
program poredi glasove i odluuje da li
postoji neslaganje.
Neki rezultati su takve prirode da verzije ne
proizvode isti rezultat. Tada se obavlja
netano poreenje uzimajui u obzir
opseg ili srednju vrednost.
31
31
6/17/2011
T2
>Ti
T3
>Ti
ne
da
ne
P1
P3
P2
>Pi
>Ti
da
>Pi
>Pi
ne
V1
V2
V3
32
32
6/17/2011
33
33
6/17/2011
34
34
6/17/2011
Detekcija greke:
Dve klase tehnika detekcije:
detekcija greke u okolini,
detekcija greke u aplikaciji.
35
35
6/17/2011
36
36
6/17/2011
37
6/17/2011
38
38
6/17/2011
Oporavak greke:
Procedure oporavka greke:
napred pokuava se da se iz take
greke nastavi dalje pravei selektivne
korekcije stanja sistema (redundantni
ukazivai, redundantni kodovi),
unazad nastoji da sistem vrati u
bezbedno stanje koje je prethodilo pojavi
greke tj. u taku oporavka.
39
39
6/17/2011
40
40
6/17/2011
41
41
6/17/2011
42
6/17/2011
Ukratko ....
Prevencija otkaza:
izbegavanje otkaza,
uklanjanje otkaza.
Tolerancija otkaza:
hardverska,
softverska.
43
43