Professional Documents
Culture Documents
RAID Kao Tehnologija Skladištenja Podataka
RAID Kao Tehnologija Skladištenja Podataka
Elektrotehniki fakultet
SEMINARSKI RAD
Datum:
26.08.2014. godine
Studenti:
Slavko Kulji
Janko uri
SADRAJ
1.
UVOD ..................................................................................................................... 4
2.
2.1.1.
2.1.2.
2.1.3.
Dupliranje ................................................................................................ 6
2.1.4.
2.2.
2.2.1.
2.2.2.
2.2.3.
2.2.4.
2.3.
2.3.1.
Pouzdanost ............................................................................................. 16
2.3.2.
2.3.3.
Dostupnost ............................................................................................. 18
2.3.4.
2.4.
3.
2.4.1.
2.4.2.
2.4.3.
3.1.1.
3.1.2.
3.1.3.
3.2.
3.2.1.
RAID 0 ................................................................................................... 26
3.2.2.
RAID 1 ................................................................................................... 28
3.2.3.
RAID 2 ................................................................................................... 29
3.2.4.
RAID 3 ................................................................................................... 30
3.2.5.
RAID 4 ................................................................................................... 32
3.2.6.
RAID 5 ................................................................................................... 33
3.2.7.
RAID 6 ................................................................................................... 34
3.2.8.
RAID 7 ................................................................................................... 35
3.3.
3.3.1.
4.
5.
3.3.2.
3.3.3.
RAID 10 ................................................................................................. 39
3.3.4.
3.3.5.
3.3.6.
3.3.7.
3.3.8.
4.2.
4.2.1.
4.2.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
5.2.
5.3.
5.4.
5.5.
6.
ZAKLJUAK ...................................................................................................... 55
7.
LITERATURA: ................................................................................................... 56
1. UVOD
Jo od davne 1956. godine i prvog IBM-ovog tvrdog diska RAMAC kapaciteta
5MB do danas, kapaciteti tvrdih diskova viestruko su se poveali, zalazei ve
pomalo u podruje TByte-a. No, nisu samo diskovi poveavali kapacitet. Potranja
ljudi, za dragocjenim resursom zvanim memorija, odnosno digitalnim skladitem
podataka, nezaustavljivo raste. To poveavanje potranje za prostorom za uvanje
podataka ve 1978. godine rezultiralo je IBM-ovim patentom zvanim RAID.
RAID ili Redundant array of independent (inexpensive) disks je, kao to
samo ime govori, polje redundantnih jeftinih diskova, u dananje vrijeme se koristi
naziv nezavisni diskovi (eng. independent). RAID je svojom pojavom omoguio
poveavanje kapaciteta za uvanje podataka sa vie diskova (jeftinih) spojenih u polje.
Deset godina kasnije, 1988., definiu se RAID nivoi od 1 do 5, koji svojim razliitim
funkcionalnostima i mogunostima pruaju iroki spektar naina spajanja diskova u
polje (polja) i time su dobijene mogunosti, kao to su integritet podataka, tolerancija
na greke i poveanje performanse. U najjednostavnijem obliku RAID prua
mogunost povezivanja vie tvrdih diskova u jedan logiki disk, pa tako operativni
sistem umjesto vie diskova vidi samo jedan. RAID se najece koristi kod serverskih
raunara i RAID se pritom ostvaruje diskovima jednake velicine, a nerijetko i potpuno
jednakim diskovima, to je naravno najbolje rjeenje. Smanjenjem cijena raunara
opreme i vee dostupnosti RAID mogunosti, putem ugradnje kontrolera na matine
ploe, RAID se pojavljuje i kod personalnih raunara, preteno kod raunarskih
sistema koji zahtijevaju vei kapacitet za uvanje podataka, kao to su sistemi za
audio-video obradu.
2. RAID koncepti
2.1.
2.1.3. Dupliranje
Dupliranje je proirenje preslikavanja jer koristi isti princip kao preslikavanje.
Kao i u preslikavanju, i ovdje se svi podaci zapisuju na dva tvrda diska. Meutim,
dupliranje ide jedan korak dalje u pogledu hardvera i to tako da se koristi dvostruki
hardver, tj. svaki pojedinani disk ima svoj RAID kontroler.
Metoda dupliranja je superiorna u odnosu na preslikavanje u smislu dostupnosti
sistema jer osigurava postojanost sistema i u sluaju kvara bilo kojeg RAID
kontrolera. Meutim, ova je metoda oito i skuplja jer zahtjeva ulaganje u dvostruko
vie hardvera. Dupliranje je dakle opcija kod implementacije RAID 1 polja - premda
veina ljudi smatra da je RAID 1 samo preslikavanje.
Budui da se polazi od pretpostavke da e RAID kontroler upravljati svim diskovima
u polju nije ba esta implementacija opcija dupliranja u PC sistemima, i najee se
ova opcija nalazi implementirana unutar samog operativnog sistema.
Izlaz
#1
#2
"OR"
"XOR"
1
1
0
1
Razlog zato nam je logiki XOR tako zanimljiv je njegovo svojstvo da ako se dva
puta izvede u istom redu ponitava. Tako, na primjer, uzmemo dva broja A i B,
provedemo A XOR B i zatim uzmemo rezultat operacije i opet provedemo XOR B
kao rezultat emo dobiti onaj A sa poetka, tj. A XOR B XOR B = A.
Ovo svojstvo iskoriteno je za izraun pariteta kod RAID polja.
Ako imamo 4 podatkovna elementa D1, D2, D3 i D4 moemo izraunati paritetnu
informaciju DP kao D1 XOR D2 XOR D3 XOR D4. Sada moemo, poznavajui bilo
koja 4 elementa od D1, D2, D3, D4 i DP operacijom XOR nad njima dobiti element
koji nam nedostaje.
U slijedeem primjeru to emo demonstrirati koristei 4 okteta podataka.
Dakle imamo sljedee oktete:
D1=10100101,
D2=11110000,
D3=00111100,
D4=10111001.
Zatim izvrimo XOR operaciju nad njima, korak po korak:
D1 XOR D2 XOR D3 XOR D4 = ( (D1 XOR D2) XOR
D3) XOR D4 = ( (10100101 XOR 11110000) XOR
00111100) XOR 10111001 = (01010101 XOR 00111100)
XOR 10111001 = 01101001 XOR 10111001 =11010000
Dobili smo paritetni oktet DP = 11010000.
Sada emo tih pet okteta podatka zapisati na pet diskova. Meutim disk #3 koji sadri
informaciju 00111100 se pokvari.
Koristei preostala 4 okteta i uz pomo XOR operacije jednostavno emo povratiti
izgubljenu informaciju, na slijedei nain:
D1 XOR D2 XOR D4 XOR DP = ( (D1 XOR D2) XOR D4)
XOR DP = ( (10100101 XOR 11110000) XOR 10111001)
XOR 11010000 = (01010101 XOR 10111001)
XOR 11010000 = 11101100 XOR 11010000 =00111100
to odgovara izgubljenoj vrijednosti D3 sa diska #3
U poreenju sa preslikavanjem, paritet (sa zapisom u pojasevima) ima neke pozitivne
i neke negativne karakteristike. Najoitija prednost je ta da paritet ima dobru zatitu
podataka u sluaju kvara jednog od diskova u polju, bez potrebe za potronjom
dodatnih 50% vie diskova kao kod preslikavanja, samo jedan od N+1 diskova sadri
redundantnu informaciju. Zapis u pojasevima sa paritetom takoe omoguuje
iskoritavanje dobrih performansi takvog zapisa.
Najvei nedostatak pariteta manifestuje se u koliini procesorske snage potrebne za
izraun pariteta. To znai da je potreban vrlo kvalitetan i snaan kontroler koji e
vriti izraun pariteta. Koritenje programskog RAID-a time pada u vodu jer bi bila
potrebna vrlo velika procesorska snaga a to bi znaajno usporilo sustav.
Sva RAID polja od RAID 3 do RAID 7 koriste paritet, najpopularniji danas je RAID
5, RAID 2 koristi koncept slian paritetu ali ne potpuno jednak.
10
Jo jedan udarac na performanse pisanja javlja se kod sistema koji koriste dodatni
disk za zapisivanje paritetne informacije kao kod RAID 3 i RAID 4 polja.
Kako kod ovih polja samo jedan disk sadri paritetnu informaciju on se koristi u
svakoj operaciji zapisivanja to stvara usko grlo u ssistemu.
Kao da sve ove prije navedene stvari ne smanjuju dovoljno performanse zapisivanja,
javlja se jo jedan razlog smanjenju performansi. Naime, kontroler mora biti siguran
da kada zapisuje promijenjene informacije i pripadajui promijenjeni paritet to ini
simultano. Ako se taj proces prekine, recimo, u sredini, nakon promjene podataka a
prije promjene pariteta, postoji mogunost da se kompromitira integritet RAID polja.
Za sprjeavanje toga koristi se specijalni proces koji se esto naziva two-phase
commit. Ovaj proces vrlo je slian tehnici koja se koristi kod baza podataka, kad
elimo biti sigurni kod transfera novca i elimo biti sigurni da se novac koji skidamo
s jednog rauna stvarno prebaci na drugi, i obrnuto.
11
Kod itanja malih datoteka koje ne zahtijevaju pristup svim diskovima u polju,
"pametni" kontroler moe pokrenuti dva ili vie pristupa podacima odjednom. Ovo
poboljava kako performanse pozicioniranja tako i performanse transfera iako je
poboljanje performansi transfera relativno maleno.
Poboljanje performansi kod RAID polja koja koriste pojaseve zavise i o veliini
pojasa i irini pojasa.
12
Oito, ne postoji "optimalna" veliina pojasa za sve korisnike. Veliina pojasa zavisi o
zahtijevanim performansama, o vrsti aplikacija, pa ak i o karakteristikama samih
tvrdih diskova. Ba iz tog razloga proizvoai kontrolera ostavljaju ovu opciju
otvorenom, tako da bi svaki korisnik mogao prema svojim potrebama postaviti
veliinu pojasa.
13
bojom) nalazi se na samo jednom disku umjesto na sva 4 kao u prijanjem sluaju.
Takoe, datoteka veliine 100KB (oznaena zelenom bojom) sada se nalazi na dva
diska u odnosu na prijanji sluaj gdje se nalazila na sva 4 diska u polju.
Ovo poveava performanse pozicioniranja. U oba sluaja irina pojasa je naravno
etiri.
Ostaje nam pitanje koju veliinu pojasa emo koristiti. Najbolji odgovor na ovo
pitanje proizlazi iz toga da isprobamo par razliitih veliina i da se sami uvjerimo u to
koja najbolje odgovara naim potrebama. Kao i kod ostalih parametara koji utiu na
performanse ni ovdje ne smijemo precijeniti razlike izmeu performansi kod
koritenja razliitih veliina pojasa. Nekad poveanje performansi moe biti znaajno,
posebno ako uporedimo veliine pojasa suprotnih graninih vrijednosti kao na primjer
4KB i 256KB. No te razlike u performansama ipak nisu toliko velike kad uporedimo
susjedne vrijednosti veliine pojasa.
Ako ipak elimo neke smjernice po tom pitanju moemo, uopteno zakljuiti, da ako
RAID polje koristimo u okruenju transakcijskog tipa (npr. baze podataka) koje
izvodi puno operacija itanja i pisanja podacima male veliine moemo preporuiti
koritenje veih veliina pojasa, naravno do neke odreene granice.
Koritenje aplikacija koje zahtijevaju bre itanje, manjeg broja veih datoteka bolje
e funkcionisati sa manjom veliinom pojasa.
14
15
2.3.
RAID Pouzdanost
2.3.1. Pouzdanost
Pouzdanost odreene komponente sistema oznaava koliko e ta komponenta
nastaviti s radom nakon to je otkriven kvar u sistemu. Pouzdanost komponente
kombinacija je raznih faktora. Od optih kao to su dizajn i proizvodnja odreenog
modela nekog proizvoaa, ali i specifinih faktora kao to su nain na koji je
odreena komponenta proizvedena, dostavljena, ugraena i odravana.
Pouzdanost sistema je funkcija pouzdanosti komponenata od kojih je sistem
sastavljen. to se vie komponenata nalazi ugraeno u sistemu to e i pouzdanost
sistema, kao cjeline, biti loija. Ovo je i razlog zato se sloeniji sistemi ee kvare
od manje sloenih.
Najei izraz koji se koristi za opisivanje pouzdanosti komponenata pa tako i tvrdih
diskova je srednje vrijeme izmeu kvarova (eng. mean time between failures MTBF). Ako su MTBF vrijednosti unutar sistemi oznaene na slijedei nain:
MTBF1, MTBF2, MTBF3 i tako sve do MTBFN, onda pouzdanost sistema moemo
izraunati na slijedei nain:
Sistem . . . MTBF = 1 / ( 1 / MTBFi + 1 / MTBF2 + . . . + 1 / MTBFn ).
Ako su MTBF vrijednosti svih komponenti jednake (MTBF1 = MTBF2 = MTBFN)
onda se formula pojednostavljuje, i izgleda ovako:
Sistem . . . MTBF = komponenta MTBF / N ,
pri emu N oznaava broj diskova u polju. Iz ovih formula je vidljivo da MTBF
sistema koji se sastoji od 4 diska, koji imaju MTBF jednak 500 000 sati iznosi samo
16
17
2.3.3. Dostupnost
Jo jedna stvar povezana sa pouzdanou i tolerancijom na greke je
dostupnost.
Ovaj izraz jednostavno oznaava mogunost nesmetanog pristupa podacima.
U velikom broju firmi koje implementiraju RAID, dostupnost je razlog zato se ulae
u implementaciju RAID sistema. I zatita podataka je bitna, ali ona se moe osigurati
kvalitetnim sistemom za izradu sigurnosnih kopija podataka i tako utedjeti novac
potreban za RAID sustav, a i postoji potreba za sistemom za izradu sigurnosnih kopija
podataka.
Dostupnost se rauna po sljedeoj formuli:
MTTF - Mean time to failure - srednje vrijeme do kvara, MTTR - Mean time to repair srednje vrijeme do popravka.
Dostupnost RAID polja zavisi od nekoliko faktora:
Pouzdanost hardvera: to je vea pouzdanost hardvera koritenog u RAID
polju, manja je vjerojatnost da e uopte doi do hardverskih problema, i ovo je
naravno najbolji nain za odravanja visokog nivoa dostupnosti. Pouzdanost ostalih
komponenti takoe je jednako toliko bitna.
-
Servis: Ako doe do "pada" RAID polja, sistem nije dostupan dokle god se ne
zamijeni neispravna komponenta. Premda se ovo rijetko deava u kvalitetno
konfigurisanom RAID polju ipak se deava i onda dostupnost zavisi upravo o brzini
servisiranja.
-
Ako nam je vana visoka mjera dostupnosti ona se itekako moe ostvariti, naravno na
raun cijene. Postoje firme koje dizajniraju specijalna RAID polja, visoko tolerantna
RAID polja koja odolijevaju skoro svim kvarovima. Postoje i vrhunska rjeenja, koja
zbog prirode koritenja aplikacija koje su zavisne od dostupnosti, nadilaze sva ova
RAID rjeenja i koriste potpuno redundantna rjeenja koja su nerijetko i fiziki
smjetene na razliite lokacije da bi se zatitili i od prirodnih nepogoda.
18
19
2.4.
20
21
3. RAID POLJA
3.1. Karakteristike RAID polja
Mnogo je naina za implementaciju RAID polja, koristei razne kombinacije
tehnologija kao to su preslikavanje podataka, zapis u pojasevima, dupliranje
(koritenje duplih komponenti), i paritet.
Nekoliko standardiziranih metoda definisane su 1988. godine u istraivakoj
publikaciji sveuilita Berkeley, sa ime i zapoinje fenomen zvani RAID.
Iz nekog razloga oni su razliitim RAID poljima dodijelili sufikse nivoi (eng. level),
to ustvari asocira na hijerarhijsku podjelu RAID polja. Takav naziv implicira da je,
recimo, RAID N+1 polje bolje od RAID N polja to nije potpuna istina, jer znamo da
su RAID polja nezavisna jedna od drugih i da se razlikuju.
Originalna publikacija iz 1988. godine definie 5 RAID polja, od RAID 1 do RAID
5. Tom popisu naknadno je dodano jo RAID 0, te RAID 6 polje, a poslije se javlja i
RAID 7 polje koje je u "privatnom vlasnitvu".
Osim ovih jednostrukih RAID polja javljaju se i viestruka RAID polja koja u svojoj
implementaciji koriste dva ili vie RAID polja i time dobijaju nove mogunosti (i
ogranienja). Mnoga razliita rjeenja se koriste u dananje vrijeme to pokazuje
razliite potrebe za RAID poljima. Neka rjeenja su se s vremenom prestala koristiti
jer vie nisu zadovoljavale neke potrebe i umjesto njih su se pojavile nove
implementacije na tritu.
U ovom poglavlju opisana su jednostruka RAID polja i to od RAID 0 do RAID 7, i
navedene su neke razliitosti tehnike prirode.
22
23
jednostavnijih. Sva RAID polja najbolje iskoritavaju diskovni prostor ako su svi
diskovi identini.
24
3.2.
25
Kategorija
Nivo
Opis
Zahtjevano
diskova
Raspoloivost
podataka
Stratifikacija
Neredundantni
Manje od jednog
diska
Preslikavanje
Preslikani
2N,3N,itd
Vea od RAID
2,3,4 ili , a manja
od RAID6
Vei od
jednog diska
za itanje,
slian
jednom disku
za upisivanje
Paralelni pristup
Neredundantni preko
Hammingovog koda
N+m
Bit-isprepletana
parnost
N+1
Blok-isprepletana
parnost
N+1
Mnogo vea od
jednog diska,
uporediva sa
RAID 3,4 ili 5
Mnogo vea od
jednog diska,
uporediva sa
RAID 2,4 ili 5
Mnogo vea od
jednog diska,
uporediva sa
RAID 2,3 ili 5
Najvei od
svih
alternativa u
listi
Najvea od
svih
alternativa u
listi
Slian RAID
0 za itanje,
znatno manji
od jednog
diska za
upisivanje
Blok-isprepletana
raspodjeljena parnost
N+1
Mnogo vea od
jednog diska,
uporediva sa
RAID 2,3 ili 4
Slian RAID
0 za itanje,
manji od
jednog diska
za upisivanje
Blok-isprepletana
dualno raspodjeljena
parnost
N+2
Najvea od svih
alternativa u listi
Slian RAID
0 za itanje,
manji od
RAID 5 za
upisivanje
Nezavisni pristup
Kapacitet
velikog
prenosa U/I
podataka
Vrlo veliki
Brzina
malog
zahtjeva
Vrlo veliki
za itanje i
za
upisivanje
Do
dvostruke
od jednog
diska za
itanje,
slina
jednom
disku za
upisivanje
Priblino
dvostruka
od jednog
diska
Priblino
dvostruka
od jednog
diska
Slina
RAID 0 za
itanje,
znatno nia
od jednog
diska za
upisivanje
Slina
RAID 0 za
itanje,
obino nia
od jednog
diska za
upisivanje
Slina
RAID 0 za
itanje,
znatno nia
od RAID 5
za
upisivanje
3.2.1. RAID 0
RAID 0 (Slika 3.1.) nije pravi lan porodice RAID zato to ne ukljuuje
redundantnost da bi poveao pouzdanost. Meutim, ima nekoliko aplikacija, kao to
su neke na superraunarima, u kojima su prvenstvena briga preformansa i kapacitet, a
nia cijena je znaajnija od poboljane pouzdanosti.
Kod RAID 0, korisniki i sistemski podaci se raspodjeljuju po svim diskovima
u nizu. To je znaajna prednost u odnosu na upotrebu jednog velikog diska: ako dva
razliita U/I zahtjeva ekaju na dva razliita bloka podataka, tada postoje dobri izgledi
da su traeni blokovi na razliitim diskovima. Prema tome, dva zahtjeva mogu da se
izdaju paralelno, to smanjuje U/I vrijeme ekanja.
Ali RAID 0, kao i svi RAID nivoi, ide dalje od jednostavnog raspodjeljivanja
podataka po nizu diskova: podaci se stratifikuju (dijele na trake, eng. strip) po
raspoloivim diskovima. Svi korisniki i sistemski podaci se vide kao da su
uskladiteni na logikom disku. Disk je podjeljen na trake; te trake mogu da budu
26
fiziki blokovi, sektori ili neke druge jedinice. Skup logiki uzastopnih traka, koji
preslikava tano jednu traku na svaki lan niza, zove se traka.
U nizu od n diskova, prvih n logikih traka se fiziki skladite kao prva traka
na svki od n diskova, formirajui prvu traku; drugih n traka se raspodjeljuje kao druge
trake na svaki disk; i tako dalje. Prednost ovakvog rasporeda je to ako se jedan U/I
zahtjev sastoji od vie logikih susjednih traka, onda do n traka za taj zahtjev mogu da
se opslue paralelno. to u velikoj mjeri smjanjuje U/I vrijeme prenosa.
27
3.2.2. RAID 1
RAID 1 (Slika 3.2.) se razlikuje od RAID nivo 2 do 6 po nainu na koji se
postie redundantnost. U drugim RAID emama koristi se neki oblik prorauna
parnosti da bi se uvela redundantnost, dok se kod RAID 1 ona postie jednostavnim
dupliranjem svih podataka. Koristi se stratifikacija podataka, kao i u RAID 0. Ali u
vom sluaju, svaka logika traka je preslikana na dva posebna fizika diska, tako da
svaki disk u nizu ima svoj disk-odraz u ogledalu, koji sadri iste podatke. RAID 1
takoe moe da se implementira i bez dijeljenja podataka na trake mada je to manje
uobiajeno.
Postoji nekoliko pozitivnih aspekata organizacije RAID 1:
1. Zahtjev za itanje moe da se opslui pomou bilo kog od dva diska koji
sadre traene podatke, koji ima minimalno vrijeme pozicioniranja plus
rotaciono kanjenje.
2. Zahtjev za upisivanje trai da obe odgovarajue trake budu aurirane, ali to
moe da se uradi paralelno. Prema tome, performansu upisivanja diktira sporije
od dva upisivanja (odnosno, ono koje obuhvata vee vrijeme pozicioniranja,
plus rotaciono kanjenje). Meutim, nema kazne upisivanja kod RAID 1.
RAID nivoi 2 do 6 obuhvataju upotrebu bitova parnosti. Zato, kada se aurira
jedna traka, softver za upravljanje nizom mora prvo da prorauna i aurira
bitove parnosti, kao i auriranje stvarne trake koja je u pitanju.
3. Oporavak od otkaza je jednostavan. Kada ureaj otkae, podacima odmah
moe da se pristupi na nekom drugom ureaju.
Glavni nedostatak RAID 1 je cijena; on zahtjeva dvostruki prostor na
diskovima za logiki disk koji podrava. Zbog toga se konfiguracija RAID 1
vjerovatno ograniava na ureaje koji sladite sistemski softver i podatke, kao i
druge kritine datoteke. U tim sluajevima, RAID 1 obezbjeuje rezervnu kopiju u
28
relanom vremenu za sve podatke, pa u sluaju otkaza diska, svi kritini podaci su i
dalje odmah raspoloivi.
U okruenju orijentisanom na transakcije, RAID 1 moe da postigne velike
brzine U/I zahtjeva ako se njihov najvei dio odnosi na itanje. U toj situaciji,
performansa RAID 1 moe da se priblii dvostrukoj vrijednosti one koju ima
RAID 0. Meutim, ako je znaajan dio U/I zahtjeva za upisivanje, onda dobici u
odnosu na RAID 0 mogu biti beznaajni. RAID 1 moe takoe da obezbjedi
poboljanu performansu u odnosu na RAID 0 za aplikacije sa intezivnim
prenosom podataka, sa velikim procentom itanja. Do poboljanja dolazi ako
aplikacija moe da podijeli svakih zahtjev za itanje, tako da oba diska lana mogu
da uestvuju u njihovom opsluivanju.
3.2.3. RAID 2
RAID (Slika 3.3.) nivoi 2 i 3 koriste paralelnu tehniku pristupa. U nizu sa
paralelnim pristupom, svi diskovi lanovi uestvuju u izvrenju svakog U/I
zahtjeva. Vretena pojedinanih ureaja su tipino sinhronizovana, tako da je svaka
glava diska u istom poloaju na svakom disku u bilo kom trenutku vremena.
Kao i kod drugih RAID ema, koristi se dijeljenje podataka na trake. U sluaju
RAID 2 i 3, trake su veoma male, esto veliine jednog bajta ili rijei. Kod RAID
2 proraunava se kod za ispravljanje greaka nad odgovarajuim bitovima na
29
3.2.4. RAID 3
RAID 3 (Slika 3.4.) se organizuje na slian nain kao i RAID 2. Razlika je u
tome to RAID 3 zahtjeva samo jedan redundantni disk, bez obzira na to koliko je
veliki niz diskova. Umjesto koda za ispravljanje greaka, proraunava se
jednostavan bit parnosti za skup pojedinanih bitova na istoj poziciji na svim
diskovima sa podacima.
Redudantnost
U sluaju otkaza ureaja, pristupa se ureaju za parnost i podaci se
rekonstruiu sa preostalih ureaja. Jednom kada se ureaj koji je otkazao zamijeni,
podaci koji nedostaju mogu da se obnove na novom ureaju i operacija e se
nastaviti.
30
()
()
()
()
()
()
()
()
()
objema strama
()
31
3.2.5. RAID 4
RAID nivoi 4 (Slika 3.5.)do 6 koriste tehniku nezavisnog pristupa. Unizu sa
nezavisnim pristupom, svaki disk lan radi nezavisno, tako da zasebni U/I zahtjevi
mogu da se zadovoljavaju paralelno. Zbog toga su nizovi sa nezavisnim pristupom
pogodniji za aplikacije koje trae velike brzine U/I zahtjeva, a relativno su manje
pogodni za aplikacije koje trae velike brzine prenosa podataka.
Kao i u drugim RAID emama, koristi se dijeljenje podataka na trake. U
sluaju RAID 4 do 6, trake su relativno velike. Kod RAID 4, rauna se bit po bit
traka parnosti preko odgovarajuih traka na svakom disku za podatke, a bitovi
parnosti se skladite u odgovarajuoj traci na disku za parnost.
RAID 4 obuhvata kaznu upisivanja kada se izvodi U/I zahtjev za upisivanjem
malog obima. Svaki put kada se pojavi upisivanje, softver za upravljanje nizom
mora da aurira ne samo korisnike podatke, nego i odgovarajue bitove parnosti.
Zamislimo niz od pet ureaja u kome X0 do X3 sadre podatke, a X4 je disk za
parnost. Predpostavimo da se izvrava upisivanje koje obuhvata samo traku na
disku X1. U poetku. Za svaki bit i, imamo sljedei odnos:
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
Prethodni skup jednaina izvodi se kao to slijedi. Prvi red pokazuje da e promjena u
X1 takoe uticati na disk parnosti X4. U drugom redu, dodajemo lanove [
()
].
S
obzirom
na
to
da
je
XOR
(ekskluzivno
ILI)
svake
veliine
sa
samom
sobom
()
jednako 0, to ne utie na jednainu. Meutim, to je pogdnost upotrebljena da bi se
napravio trei red, promjenom redosljeda. Najzad, jednaina je upotrbljena da se
zamijene prva etiri lana sa ( ) .
Da bi izraunao novu parnost, softver za upravljanje nizom mora da proita
staru korisniku traku i staru traku parnosti. Onda on moe da aurira te dvije trake sa
novim podacima i novoizraunatom parnou. Tako svako upisivanje u traku obuhvata
dva itanja i dva upisivanja.
U sluaju U/I veeg obima, upisivanja koje obuhvata trake na svim ureajima
diskova, parnost se lako izraunava korienjem samo novih bitova podataka. Na taj
nain disk za parnost moe da se aurira paralelno sa ureajima za podatke i nema
dodatnih itanja ili upisivanja.
U svakom sluaju, svaka operacija upisivanja mora da obuhvati disk za
parnost, koji zato postaje usko grlo.
32
3.2.6. RAID 5
RAID 5 (Slika 3.6.) se organizuje na slian nain kao i RAID 4. Razlika je u
tome to RAID 5 raspodjeljuje trake za parnost po svim diskovima. Tipino, podjela je
po emi sa krunim dodjeljivanjem, to je ilustrovano na slici ispod. Za niz od n
diskova, traka za parnost je na razliitom disku za prvih n traka, a onda se uzorak
ponavlja.
Raspodjelom traka za parnost po svim ureajima, izbjegava se potencijalno
U/I usko grlo koje nalazi u RAID 4.
33
3.2.7. RAID 6
RAID 6 (Slika 3.7. ) je uveden u narednom lanku itraivaa sa Berkeleya
(KATZ89). U emi RAID 6, vre se dva razliita prorauna parnosti i skladite se u
zasebnim blokovima na razliitim diskovima. Zato se niz RAID 6, iji korisniki
podaci zahtjevaju N diskova, sastoji od N+2 diska.
Ta ema ilustrovana je na slici ispod. P i Q su dva razliita algoritma za
provjeru podataka. Jedan od njih je proraun ekskluzivnog ILI koji se koristi u RAID
4 i 5. Ali drugi je nezavisan algoritam za provjeru podataka. To omoguava da se
obnove podaci ak i ako otkau dva diska koji sadre korisnike podatke.
Prednost RAID 6 je u tome to on obezbjeuje veoma visoku raspoloivost
podataka. Trebalo bi da otkau tri diska unutar intervala MTTR (srednjeg vremena za
opravku) da bi se izgubili podaci. S druge strane, RAID 6 unosi znaajnu kaznu
upisivanja zato to svako upisivanje utie na dva bloka parnosti.
34
3.2.8. RAID 7
Koritene tehnike: Asinhroni zapis u pojasevima sa paritetom.
Za razliku od ostalih RAID polja, RAID 7 polje nije otvoreni industrijski standard ve
je zatieno trino ime u vlasnitvu Storage Computer Corporation a koji se koristi
za opisivanje njihovog RAID rjeenja. RAID 7 zasniva se na konceptu koritenom
kod RAID 3 i RAID 4 polja ali sa velikim poboljanjima vezanima upravo uz ta dva
polja. Naime, RAID 7 ukljuuje koritenje velike koliine brze prirune memorije
rasporeene u vie nivoa i koristi specijalni Real-time procesor za asinhrono
upravljanje poljem. Ova sklopovska podrka, a pogotovo privremena memorija,
dozvoljavajui puno istovremenih operacija, znaajno poveava performanse a
istovremeno odrava visoku toleranciju na greke.
RAID 7 nudi poboljane performanse nasuminog itanja i zapisivanja u odnosu na
RAID 3 i RAID 4 polja jer ona u velikoj mjeri zavise o paritetnom disku, a to je kod
RAID 7 polja izbjegnuto upotrebom dodatnog hardvera.
Svo ovo poveanje performansi naravno ima svoju cijenu tako da je RAID 7 polje
vrlo skupa solucija a pri tome je proizvodi i odrava samo jedna kompanija.
Zahtjevi za kontrolerom: Zahtjeva specijalne i skupe hardverske kontrolere. Zahtjevi
za tvrdim diskovima: Zavisi od implementacije.
Kapacitet polja: Zavisi do implementacije.
Efikasnost pohrane podataka: Zavisi od implementacije.
Tolerancija na greke usled kvara: Vrlo dobra.
Dostupnost: Odlina.
Degradacija i obnavljanje podataka: Bolje nego kod veine RAID polja zbog
koritenja hardverskog izraunavanja pariteta i zbog koritenja vie nivoa memorije.
Performanse nasuminog itanja: Vrlo dobre do odline. Dodatna memorija esto
moe sadravati potrebne rezultate tako da nije potrebno pristupati diskovima u
polju to znaajno poboljava performanse.
35
3.3.
36
37
38
3.3.3. RAID 10
Zahtjevi za kontrolerom: Gotovo svi hardverski kontroleri podravaju ili RAID
10 ili RAID 01, ali esto ne oba.
Zahtjevi za tvrdim diskovima: Potreban je paran broj diskova, minimalno 4 diska,
maksimalan broj zavisi od postavki kontrolera. Preporuka je da su identinog tipa i
veliine.
Kapacitet polja: (Kapacitet najmanjeg diska) * (Broj diskova) / 2.
Efikasnost uvanja podataka: Ako su svi diskovi jednakog kapaciteta, 50%.
Tolerancija na greke usljed kvara: Vrlo dobra kod RAID 01 polja, odlina kod
RAID 10 polja.
Dostupnost: Vrlo dobra kod RAID 01 polja, odlina kod RAID 10 polja.
Degradacija i obnavljanje podataka: Relativno mala degradacija kod RAID 10 polja.
Moe biti znatno vea kod RAID 01 polja.
Performanse sluajnog itanja: Vrlo dobre do odline.
Performanse sluajnog zapisivanja: Dobre do vrlo dobrih.
Performanse slednog itanja: Vrlo dobre do odline.
Performanse slednog zapisivanja: Dobre do vrlo dobrih.
Trokovi: Relativno visoki zbog potrebe koritenja velikog broja diskova i zbog niske
39
40
41
RAID 30 i 03 polja. Na slici 3.19 vidimo kako su rasporeene datoteke u RAID 5+0
42
43
44
45
Napomene: Kod kolone "broj diskova" navedeno je prvih par ispravnih brojeva
diskova za odreenu vrstu polja, s tim da prvi broj oznaava minimalan broj diskova, a
najvei je najee odreen od strane kontrolera. RAID 01/10 i RAID 15/51 moraju
imati paran broj diskova, a minimalno 6. RAID 03/30 i RAID 05/50 mogu imati samo
broj diskova jednak umnoku dvaju cijelih brojeva, a minimalno 6.
Kod kolone za kapacitet i efikasnost uvanja podatakae, slovo "S" oznaava kapacitet
najmanjeg diska u polju. Kod RAID 03 i RAID 30 polja oznaka "N0" oznaava irinu
RAID 0 dimenzije polja, dok "N3" oznaava irinu RAID 3 dimenzije polja. Tako bi u
primjeru RAID 30 polja od 12 diskova implementirano kao 3 RAID 3 polja od po 4
diska i zatim podijeljeno po pojasevima, ove vrijednosti iznosile N3=4 i N0=3.
Isto ovo se odnosi i na oznaku N5 u redu gdje se nalazi RAID05/50.
Efikasnost uvanje podataka pretpostavlja da su svi diskovi identini. U sluaju da
nije tako, univerzalna formula je (kapacitet polja) / (zbroj svih veliina diskova).
46
4.1.
Dok RAID nivoi pojedinih polja i koriteni diskovi dobijaju dosta panje, RAID
kontroleri esto ne dobijaju toliko panje to je teta jer izbor i mogunosti
implementacije zavise upravo od odabira RAID kontrolera. Sam kontroler ali i
pripadajui hardver imaju vaan uticaj na kapacitet polja i performanse.
U nastavku slijedi osvrt na razliite opcije dostupne za upravljanje RAID poljem, a
posebnu panju daemo uporeivanju podranog i programskog RAID-a.
4.2.
47
4.3.
Programski RAID
48
4.4.
Poput dananjih raunara, koja imaju svoj BIOS (Basic Input Output System), tj.
program koji radi na niem nivou od operativnog sistema, a slui za pokretanje
komponenti matine ploe, tako vlastiti BIOS posjeduju i hardverski RAID kontroleri.
Tokom vremena, proizvoa kontrolera moe izdati novu verziju BIOS-a, to se
deava uglavnom da bi se korigirali neki manji problemi sa kontrolerom, a ponekad i
da bi se omoguila(e) neka nova mogunost kontrolera. Takoe, razlog moe biti i
dodavanje podrke za ureaje koji nisu postojali u vrijeme izlaska kontrolera, odnosno
pripadajueg BIOS-a.
Nadogradnja se vri tzv. flash procesom.
4.5.
RAID okruenja
Postoje 2 glavna tipa okruenja koja se koriste u RAID poljima. Tradicionalno, sva
RAID polja podrazumijevala su SCSI okruenje, no u zadnje vrijeme, sve je vei broj
RAID polja koja koriste IDE/ATA okruenje.
Odluku o koritenju SCSI ili IDE/ATA okruenja slina je odluci o koritenju
programskog ilihardverskog RAID kontrolera i svodi se na razmatranje odnosa
trokovi/mogunosti.
IDE/ATA okruenje je dosta jeftinije od SCSI-a ali je i na puno naina ogranieno.
Kapacitet polja je manji jer se moe koristiti manji broj diskova, performanse su
loije, podrka za sloenija RAID polja nedostaje i napredne mogunosti su rjee
implementirane.. U praksi, sve ozbiljnije RAID implementacije koriste SCSI
okruenje. Prednost IDE/ATA suelja je ta da pribliava RAID tehnologiju
korisnicima kunih raunara
4.6.
Eksterna brzina prenosa podataka sistema (eng. data rate transfer) je jedna od
performansi kojoj se pridaje previe vanosti, ne u smislu da je nevana, ve zbog
injenice da ne postoji disk koji ima brzinu zapisivanja i itanja podataka veu nego
to bi pripadajui sistem mogao podravati. Diskovi maksimalnu brzinu protoka
podataka imaju samo na trenutke (eng. burst). Nije od neke velike vanosti da li je
49
disk spojen na Ultra ATA/100 interfejs koji ima teoretsku propusnost od 100MB/s
kada disk alje podatke brzinom od 40MB/s.
Meutim, kada koristimo veliki broj diskova u RAID polju stvari se mijenjaju. Kod
IDE/ATA interfejsa se ne mijenjaju puno jer IDE/ATA moe obraivati transfer samo
jednog diska istovremeno.
Kod SCSI RAID-a imamo potpuno drugaiju situaciju. SCSI interfejs sposoban je
prenositi podatke sa vie diskova istovremeno. To znai da ako imamo vei broj
diskova i elimo kod svih iskoristiti maksimalnu brzinu transfera moramo voditi
rauna o maksimalnoj propusnosti interfejsa.
Uzmimo, na primjer, disk sa maksimalnim prenosom podataka (eng. Sustained
Transfer Rate) od 40MB/s. U idealnom sluaju, od interfejsa bismo oekivali barem
toliku propusnost. Ako sada spojimo jedan takav disk na Ultra 160 SCSI interfejs
problema nema, jer je teoretska propusnost interfejsa 160MB/s.
ta se deava ako elimo RAID polje sa 4 diska za editovanje multimedijalnih
sadraja? U ovom sluaju emo ve malo pripaziti na brzinu interfejsa i efikasno emo
je iskoristiti jer e protok velikih datoteka biti istovremen i propusnost interfejsa e
taman zadovoljiti nae potrebe.
ta ako elimo koristiti RAID polje sa 8 diskova? Uzmemo li u obzir ak i prosjenu
brzinu diskova od 32MB/s opet nam je potrebna propusnost od 256MB/s, a mi imamo
samo 160MB/s. Za izbjegavanje ovakvih problema, vrhunski SCSI RAID kontroleri
donose podrku za viestruke kanale (eng. multiple channels), tako da SCSI RAID
kontroleri nemaju samo jedan kanal ve 2 ili vie. Jo jedna stvar je bitna kod
koritenja interfejsa, a to je kapacitet samog interfejsa unutar raunara. PCI bus ima
propusnost 127MB/s (32 bita * 33MHz), dok SCSI RAID sa viestrukim kanalima
koristi 64 bitni, 66MHz PCI sistem sa teoretskom propusnou veom od 500MB
(528MB).
4.7.
4.8.
Broj diskova
Broj tvrdih diskova koritenih u RAID polju ima vaan uticaj na kapacitet polja i
performanse. Broj diskova direktno utie na sljedee aspekte polja:
Kapacitet i efikasnost uvanja podataka: Konani kapacitet RAID polja zavisi
od vrste primijenjenog RAID-a i o broju diskova u polju ( i naravno o
kapacitetu svakog diska). Efikasnost uvanja podataka, tj. postotak ukupnog
kapaciteta koji sadri neke podatke, takoe je funkcija broja diskova.
Performanse: Za RAID polja koja koriste zapis u pojasevima, irina pojasa
jednaka je broju diskova u polju. Dodavanjem diskova poboljavamo
performanse (random - nasuminog zapisivanja i sequential - slijednog
zapisivanja), za sluaj sekvencijalnih performansi teoretska propusnost je
"grubo" proporcionalna broju diskova u polju, dok je kod performansi
nasuminog zapisivanja i itanja situacija sloenija.
50
4.9.
Veliina diskova
51
52
RAID polja predstavlja pad sistema. Tako, na primjer, alarm e se oglasiti ako se desi
kvar jednog diska u RAID 0 polju ili dva diska u RAID 1,3,4,5 polju. Za viestruka
RAID polja alarm e se oglasiti ako se desi kvar nekog pod-polja bez obzira to polje na
viem hijerarhijskom nivou radi ispravno.
Rad u degradiranom stanju: Polje spojeno na kontroler nalazi se u degradiranom stanju
jer se dogodio neki hardverski problem. Ovo upozorenje pojavie se u naem RAID polju
kada odreeni broj diskova prestane sa radom ali nedovoljno da bi se cijelo polje ugasilo.
Polje e i dalje raditi ali sa degradiranim performansama (u degradiranom stanju), i to sve
dok se ne otkloni kvar(ovi) i dok se ne obnove podaci na diskovima. Ovaj alarm je vrlo
vaan jer je teko odmah otkriti da je polje u degradiranom stanju, za razliku od
cjelokupnog pada polja kad je to evidentno.
Zavretak obnove podataka: Ako je pokrenuta automatska obnova podataka u naem
polju, kontroler e nam signalizirati kad je obnova podataka dovrena. Ovaj alarm je
bitan, na primjer, u situacijama kada se kvar diska desio u naoj odsutnosti i podaci se
obnavljaju na rezervni (eng. hot spare) disk. Po zavretku obnavljanja podataka znati
emo da je rezervni disk upotrijebljen i da ga trebamo zamijeniti .
Greka hardvera kontrolera: Kontroler je otkrio neki interni kvar ili problem. Na primjer,
neki kontroleri mjere svoju vlastitu temperaturu i ako ona pree odreenu, dozvoljenu
vrijednost oglaava se alarm.
Uz zvune alarme, alarmi se mogu slati administratoru i preko lokalne mree.
5.5.
54
6. ZAKLJUAK
Svrha i cilj ovog rada bila je da poblie objasnim koncept RAID polja, njegove
karakteristike, performanse, mogucnosti i izvoenja. RAID moemo podijeliti na RAID podran
hardverom i podran programom. Veina "ozbiljnih" RAID implementacija koristi RAID
podran hardverom. RAID podran hardverom se naime koristi kod implementacija serverskih
okruenja zbog
svojih performansi i naprednih mogunosti. Programski RAID koristi programska rjeenja
umjesto hardverskih za obavljanje istog posla kao i hardverski RAID kontroler tako da ima
slabije performanse I mogue je postaviti samo RAID 0, 1 i 5 polja, ali iziskuje i manje trokove.
to se tie samih RAID polja vidjeli smo da imamo jednostruka i viestruka RAID polja.
Jednostruka su RAID 0, 1, 2, 3, 4, 5, 6 i 7, dok su viestruka RAID polja kombinacije
jednostrukih pa tako imamo RAID 01, RAID 10, RAID 03 (ili 53), RAID 30, RAID 05, RAID
50, RAID 15 i RAID 51. Imamo jo i tzv. JBOD koji je u biti samo jedna velika koliina diskova
i ti se diskovi koriste kao jedna logika cjelina. RAID 0 se koristi kod polja koja sadre podatke
koji nisu od kritine vanosti ali koji zahtijevaju visoke performanse, dok se RAID 1 koristi kod
aplikacija koje zahtijevaju visoku toleranciju na greke pri niskim trokovima, i gdje nema
potrebe za velikim kapacitetom uvanja podataka i visokim performansama. RAID 3 pogodan je
za aplikacije koje zahtijevaju velike koliine slednih podataka kao to je audio-video obrada.
RAID 4 se ne koristi puno kao njegovi bliski srodnici, RAID 3 i RAID 5 ali kad se koristi onda
su to okruenja slina RAID 3 i RAID 5 poljima. RAID 5 polje je gotovo idealan izbor za
najvei broj okruenja jer donosi dobre performanse, dobru toleranciju na greke, visok kapacitet
polja i visoku efikasnost uvanja podataka. RAID 6 polje je gotovo idealan izbor za najvei broj
okruenja kao i RAID 5 polje ali u situacijama gdje nam je potrebna vea tolerancija. Meutim
RAID 6 nije u irokoj upotrebi zbog dodatnih trokova koje iziskuje u odnosu na RAID 5 polje.
RAID 7 polje se koristi za specijalne namjene koje zahtijevaju najbolje performanse. Viestruka
RAID polja se najee koriste zbog svojih poboljanih karakteristika, koje su vrlo primjetne.
Ugnijedena RAID polja imaju bolje performanse nego pojedinana RAID polja od kojih su
sastavljena.
Najece koriteno polje, u kombinaciji s ostalima, je RAID 0 polje, koje se najece kombinuje
sa redundantnim poljima kao to su RAID 1, RAID 3 ili RAID 5, koja osiguravaju toleranciju
dok RAID 0 polje osigurava visoke performanse. Potrebno je jo spomenuti da RAID sistemi ne
pruaju potpunu sigurnost i zatitu od gubitka podataka, pa je stoga za to veu sigurnost
poeljno koristiti uz RAID sisteme i sisteme za izradu sigurnosnih kopija podataka.
55
7. LITERATURA
1. Aleksandar Kresovi: Sveuilite u Splitu, Odjel za strune studije, DIPLOMSKI RAD
RAID sustavi.
2. William Boswell : Inside Windows Server 2003, Published by Addison Wesley
Professional, 14.04.2003.
3. Jerry Honeycutt : Introducing Microsoft Windows Server 2003, Published by
Microsoft Press, 29.01.2003.
4. http://www.microsoft.com/windowsserver2003/default.mspx
5. http://www.pcguide.com/ref/hdd/perf/raid/index.htm
6. http://www.acnc.com/index.html
7. http://www.ecs.umass.edu/ece/koren/architecture/Raid/raidhome.html
8. William Stallings: Organizacija i arhitektura racnara (7. izdanje)
9. Kri Boris: Sveuilite u Zagrebu, Sustavi za praenje i voenje procesa
10. http://sr.wikipedia.org/sr-ec/_RAID_
56