Professional Documents
Culture Documents
PRZYKADOWY ROZDZIA
SPIS TRECI
KATALOG KSIEK
KATALOG ONLINE
ZAMW DRUKOWANY KATALOG
TWJ KOSZYK
DODAJ DO KOSZYKA
CENNIK I INFORMACJE
ZAMW INFORMACJE
O NOWOCIACH
ZAMW CENNIK
CZYTELNIA
FRAGMENTY KSIEK ONLINE
Wydawnictwo Helion
ul. Kociuszki 1c
44-100 Gliwice
tel. 032 230 98 63
e-mail: helion@helion.pl
Spis treci
O autorach .................................................................................................15
Wstp .........................................................................................................17
CZ I
Spis treci
Spis treci
Spis treci
Cz II
Spis treci
10
Spis treci
Spis treci
11
12
Spis treci
Skorowidz ................................................................................................451
25
ROZDZIA 1.
wiat przetwarzania
wysoko wydajnego i wysokiej
dostpnoci w Windows
Wstp
W tym rozdziale przedstawimy przegld poj zwizanych z wysok dostpnoci (HA), przetwarzaniem wysoko wydajnym (HPC) oraz z tym, w jaki sposb platforma Windows Server 2003 firmy Microsoft realizuje wymagane mechanizmy.
Rozpoczniemy od zapoznania si z podstawami poziomu obsugi, dostpnoci,
pojciami pracy pomimo usterek, nadmiarowoci, skalowalnoci, wysokiej dostpnoci, jak rwnie technologii zarzdzania dziaaniem systemu. Zapoznamy
si z zapobiegawczym zarzdzaniem systemami komputerowymi na potrzeby
wysokiej dostpnoci, a take z funkcjami reaktywnymi wymagajcymi wczeniejszego zaplanowania, na przykad usuwaniem skutkw awarii. Nastpnie zajmiemy
si wysoko wydajnymi architekturami, sprztem i oprogramowaniem.
26
Poziom usugi
Poziom usugi to najczciej naduywany termin w zarzdzaniu sieciami LAN
i technologiami serwerowymi. To niewaciwe uywanie terminu wynika z istnienia wielu interpretacji. Na przykad, niektrzy menaderowie i analitycy korzystaj
z tego terminu do okrelenia, jak dostpny jest lub powinien by pojedynczy
system komputerowy. Moe by to prawda w wiecie schykowych systemw,
ktre byy w wikszym stopniu monolitami, a nie zbiorem rozproszonych i poczonych ze sob komponentw, lub w wiecie telekomunikacji, do opisania
central i systemw PBX. Analitycy systemw i sieci s czsto proszeni o zapewnienie w systemie odpowiedniego poziomu obsugi, bez faktycznej wiedzy o tym,
co ten poziom obsugi ma zapewnia.
27
SYSTEM
Systemem moe by pojedynczy komputer, wiele serwerw (oraz klaster serwerw),
a nawet wiele lokacji serwerw. System nie jest kompletny bez administratora systemu,
bdcego osob lub komputerem, ktry wymaga rwnie operatora. Do dziaania potrzebuje on zasilania, szaf, stojakw, budynkw, ochrony przed ogniem i tak dalej.
Prby zachowania poziomu usugi i zapewnienia dziaania systemu komputerowego przez 24 godziny, 7 dni w tygodniu czsto prowadz do zego ukierunkowania usug. Lepiej unika poziomw usugi opisujcych dostpno systemw komputerowych; zamiast tego powinno si podawa ilo czasu w okresie
operacyjnym, przez ktry usuga lub aplikacja jest dostpna dla uytkownikw
lub subskrybentw.
Poziom usugi okrela, na ile usuga jest dostpna w okienku serwisowym. Nie
tylko sam system musi spenia wymagania poziomu usugi, ale take usuga, by
moe wykorzystujca wiele systemw i komponentw, w tym zasoby ludzkie,
musi by dostpna.
Gdy ocenimy lub okrelimy poziom usugi dla aplikacji lub usugi, na pocztek
musimy zapyta, jaki jest oczekiwany okres dziaania dla tej usugi. Gwarancja
jakoci wiadczonych usug (SLA), ktra zostanie opisana w jednym z kolejnych
punktw, jest umow, najczciej zatwierdzan przez jej podpisanie przez zainteresowane strony, w ktrej zakada si, e usuga bdzie dostpna przez wikszo
czasu w okresie operacyjnym.
Na pocztek naley zdefiniowa pojcie okresu operacyjnego. Czy usuga jest
wymagana przez 12 godzin dziennie, 18 godzin, czy te przez ca dob? Po
ustaleniu okresu operacyjnego musimy dowiedzie si, przez jaki czas w okresie
operacyjnym firma lub uytkownik usugi moe tolerowa przerwy w pracy
usugi. Jeeli okresem operacyjnym jest 12 godzin i w tym czasie wymagane jest
nieprzerwane dziaanie usugi, to wymaganym poziomem usugi jest 100 procent.
Jeeli uytkownik lub firma moe tolerowa, zamy, 45-minutowy okres przestoju
w oknie operacyjnym, to poziom usugi moe by ustalony na 90 lub 95 procent.
Po okreleniu i uzgodnieniu poziomu usugi, specjalici IT oraz analitycy systemw mog rozpocz budowanie systemu skadajcego si z komponentw
sprztowych i programowych, ktre musz by dostpne przez czas okrelony
w SLA. Parametr ten jest nazywany dostpnoci i jest mu powicony nastpny
punkt. W tabeli 1.1 przedstawione s przykady kategorii wymaganego poziomu
usugi w typowej, obcionej witrynie handlu elektronicznego.
28
Godziny dziaania
Wydajno
Ksika ta nie jest forum dyskusyjnym na temat SLA; dobrym rdem informacji na ten temat jest konsorcjum International Engineering Consortium (IEC),
ktrego witryna jest dostpna pod adresem www.iec.org.
Dostpno
Systemy, jakie opracowujemy w celu spenienia okrelonych potrzeb biznesowych lub operacyjnych, powinny by dostarczane i budowane w taki sposb,
aby speni uzgodniony poziom usugi. Mona si z tym nie zgadza i dowodzi,
e podstawowym wymaganiem jest bezpieczestwo systemu, integralno danych
lub cena. Oczywicie zagadnienia te s wane i s one czci zadania.
Integralno systemu, bezpieczestwo i zarzdzalno s wane, ale nie musz
by one rozwaane przed okreleniem poziomu usugi. W kocu warunki zaoenia systemu wpywaj na jego dostpny potencja. Jeeli mona wama si do
systemu, bdzie on zbudowany z tanich komponentw lub le zaprojektowany,
to bdzie on mniej dostpny i przez to nie bdzie spenia wymaga poziomu
dostpnoci dla dziaajcych w nim aplikacji.
29
DOSTPNO
Dostpno mona zdefiniowa jako ilo czasu w oknie obsugi, przez ktry aplikacja
lub usuga jest dostpna dla uytkownika. Na przykad, macierze RAID to urzdzenia
pamici masowej, ktre s dostpne rwnie w przypadku awarii jednego, dwch, a nawet trzech dyskw. Nie jest to ten sam parametr co niezawodno, cho nie trzeba chyba
tumaczy, e do naszych celw naley wykorzystywa niezawodne komponenty.
Mwic o dostpnoci systemu, na przykad Exchange, mamy na myli procent czasu
(w oknie operacyjnym), przez ktry usuga dziaa i moliwe jest wysyanie i odbieranie
poczty.
Istniej rne poziomy dostpnoci. Moemy powiedzie, e system jest rednio dostpny, gdy skada si z komponentw i technologii, ktre potencjalnie
mog powodowa awarie systemu lub przerwy w dziaaniu, wpywajce na poziom usugi i powodujce amanie SLA.
Niektre mae firmy mog tolerowa dusze okresy przerwy w dziaaniu ni
wiksze firmy lub dostawcy usug, ktrzy musz wypenia swoje zobowizania.
Gdy z serwera wydruku korzysta tylko kilka osb w czasie normalnego dnia pracy
trwajcego od 9 do 17, to jego niedostpno przez godzin lub dwie nie jest
postrzegana jako krytyczne zagroenie dla dziaania firmy. Jeeli jednak w tym
samym oknie obsugi z serwera wydruku korzysta kilkaset osb, to 15-minutowa
przerwa w pracy moe mie katastrofalny wpyw na firm.
W drugim scenariuszu wiadomo, e w celu spenienia poziomu usugi i cigoci
dziaania, system musi by zbudowany z zastosowaniem architektury wysoko dostpnej i komponentw o duej wydajnoci. Wczeniej stwierdzilimy, e w przypadku mniej krytycznych potrzeb pojedynczy komputer moe suy jako serwer wydruku; jednak w drugim przypadku w celu zapewnienia poziomu usugi
wymagany jest zaawansowany klaster serwerw, zapewniajcy natychmiastowe
odtworzenie usugi w przypadku awarii jednego z wzw.
Od dawna dostpno usugi systemw komputerowych i oprogramowania bya
mierzona procentem czasu dziaania. Model dziewitkowy okrela procent dostpnoci, gdzie 99,9999 (sze dziewitek) jest wartoci najwiksz, czsto
wykorzystywan do opisania systemu poczty elektronicznej lub serwera bazy
danych, bez odpowiedniej wiedzy, do czego odwouj si te dziewitki.
Dostpno jest typowo mierzona za pomoc dziewitek. Na przykad, rozwizanie o poziomie dostpnoci trzech dziewitek jest w stanie udostpnia swoje
funkcje przez 99,9 procent czasu, co jest odpowiednikiem rocznego czasu wyczenia wynoszcego 8,76 godzin w przypadku dziaania w trybie 247365
(24 godziny dziennie, siedem dni w tygodniu, 356 dni w roku). W tabeli 1.2
wymienione s standardowe poziomy dostpnoci, ktre prbuje osign wiele
organizacji.
30
99,9999
32 sekundy
99,999
5 minut i 15 sekund
99,99
52 minuty i 36 sekund
99,95
4 godziny i 23 minuty
99,9
8 godzin i 46 minut
99,5
99
95
18,25 dnia
90
36,5 dnia
Sprbujmy nieco bardziej uszczegowi to rwnanie. Zajmujemy si tu rwnaniem dajcym w wyniku prawdopodobiestwo awarii komponentu. MTBF
okrela redni odstp czasu, mierzony w tysicach lub dziesitkach tysicy godzin
pracy (nazywanych rwnie godzinami czasu dziaania lub POH), a do wystpienia awarii komponentu. Dlatego MTBF jest obliczany za pomoc nastpujcego
rwnania:
MTBF = (redni czas cakowity czas przestoju) / liczba awarii
31
Przy tych obliczeniach naley korzysta z tabeli 1.2. W taki sposb mona zmniejsza niepodany lub oczekiwany czas wyczenia. Aby projektowa i tworzy
bardziej niezawodne systemy, naley wic stosowa konfiguracje nadmiarowe
lub odporne na awarie. Inaczej mwic, jeeli twardy dysk osignie milionow
godzin pracy i zawiedzie, ostatni rzecz, jak bdziemy si przejmowa, jest
MTTR. Jeeli bdziemy mieli inny dysk, ktry moe zastpi uszkodzony, to kto
bdzie zajmowa si napraw dysku? Obecnie czas MTTR oznacza czas potrzebny
na zakupienie nowego dysku lub wyjcie go z magazynu. Wicej informacji na
temat nadmiarowych komponentw przedstawimy w nastpnym punkcie.
UWAGA: W wiecie systemw komputerowych MTTR jest czsto rozwijany
jako Mean Time To Restore (redni czas do odtworzenia).
Wysoka dostpno,
czas wyczenia i awarie
System o wysokiej dostpnoci to taki, ktry spenia wymagania wysokiej dostpnoci zapisane w SLA. Moe to oznacza dowoln technologi, konfiguracj,
projekt, technik lub kombinacj tych skadnikw, ktre zapewniaj spenienie
warunkw SLA.
32
33
34
midzy wieloma hostami. Microsoft dostarcza rozwizania do klasteryzacji z wyrwnywaniem obcienia sieci (NLB), wyrwnywaniem obcienia komponentw
(CLB) oraz klastry dziaajce pomimo awarii, jednak jeeli samo oprogramowanie dostarczajce usug nie jest skalowalne ani zalene od zastosowania klastra
NLB, to jego stosowanie wraz z pozostaymi usugami klastrowania dostpnymi
na platformie Windows Server ma niewielki sens.
Wysoka dostpno korzysta rwnie z nadmiarowoci sprztu. Nawet jeeli
system nie obsuguje pracy pomimo awarii, nadal mona osign wysok dostpno przez zastosowanie nadmiarowoci sprztowej. Najbardziej znanym
zastosowaniem nadmiarowoci jest nadmiarowo dyskw; istnieje kilka technologii zapewniajcych mirroring, striping oraz kombinacje obu tych technik,
dziki czemu mona zapobiec wyczeniom spowodowanym awari dysku lub
wyeliminowa je. Nadmiarowo sprztow omawiamy bardziej szczegowo
w rozdziale 2., Wybr sprztu o wysokiej wydajnoci, oraz 3., Pamici masowe
dla systemw wysoko dostpnych.
Jeeli jestemy przy pamiciach masowych, trzeba pamita, e nie ma nic lepszego dla systemw o wysokiej dostpnoci jak technologie konsolidacji pamici
masowych. Zarwno systemy NAS, jak i SAN graj niezwykle wan rol w wiecie
wysokiej dostpnoci. Nie jest to tylko skonsolidowana centrala danych dostpna
przy projektowaniu klastra dziaajcego pomimo awarii. Caa technologia przepustowo, atwo serwisowania, zarzdzania i tak dalej peni wan rol
w spenieniu podstawowego wymagania dostpnoci. Z tego powodu pamiciom
masowym powicilimy cay rozdzia 3., Pamici masowe dla systemw o wysokiej dostpnoci.
Pamici, procesory, wejcie-wyjcie, magistrale i tym podobne elementy rwnie
odgrywaj krytyczn rol, szczeglnie w przypadku zapewnienia skalowania,
wieloprocesowoci, wielowtkowoci i tak dalej. Komponenty te w systemach
o wysokiej dostpnoci wymagaj monitorowania dostpnoci, monitorowania
wydajnoci oraz analiz, dziki czemu mona speni wymaganie wysokiej dostpnoci. Z tego powodu w rozdziale 13. przedstawiamy narzdzia do monitorowania
dziaania, takie jak konsola Performance oraz Microsoft Operations Manager firmy
Microsoft.
Na koniec przedstawimy czynniki pozasystemowe, ktre mog wpyn na dostpno: ludzk zdolno do obsugi i utrzymania systemw, oraz ich waciwe
projektowanie i implementowanie. W rozdziaach 5. i 6. wprowadzamy temat
projektowania i implementacji. Kolejne rozdziay s ukierunkowane na projektowanie a zawarte w nich informacje s przedstawiane w postaci przykadw.
Ksika na temat wysokiej dostpnoci i wydajnoci nie byaby wyczerpujca bez
omwienia zagadnie bezpieczestwa. Aby zapewni zaoony poziom obsugi,
naley stale si upewnia, e system nie jest przedmiotem ataku. Ataki przyjmuj
35
36
Klasteryzacja
Jak si ju niebawem okae, termin klasteryzacja moe odnosi si do wicej
ni jednej techniki zapewnienia dostpnoci. Wanie omwione klastrowanie
zapewniajce skalowanie w poziomie korzysta z usug dostarczanych przez Windows Server 2003 do zapewnienia wyrwnywania obcienia i rozpraszania przetwarzania pomidzy poszczeglne wzy. Z drugiej strony klastrowanie w celu
zapewnienia pracy pomimo awarii to technika zapewniania dostpnoci. Jest to
odmiana nadmiarowoci.
Klaster aktywno-pasyny skada si z pary wzw, w ktrej wze pasywny nie
wykonuje adnej pracy, natomiast wze aktywny realizuje wszystkie zadania.
Jeeli awarii ulegnie wze podstawowy, dziaanie aplikacji jest przekazywane
do wza pasywnego, ktry jest w tym momencie aktywowany. Zauwaalna jest
niewielka przerwa w pracy usugi, jednak aplikacja jest odtwarzana z pomijaln
przerw w dziaaniu i przetwarzanie jest kontynuowane na nowym wle podstawowym. Uszkodzony wze jest nastpnie odtwarzany i albo jest doczany
jako wze pasywny, albo aplikacja jest przenoszona na poprzedni system i odtwarzany jest stan aktywno-pasywny sprzed awarii.
W Windows Server 2003 Enterprise Edition oraz Datacenter Edition mona mie
wicej ni jeden aktywny wze w klastrze. Jest rwnie moliwe uruchomienie
wicej ni dwch aktywnych wzw w klastrze i dodanie jednego pasywnego.
Konfiguracja aktywno-aktywno-pasywna (n+1) jest omwiona dokadniej w rozdziale 5., Przygotowywanie platformy dla sieci o wysokiej wydajnoci.
UWAGA: Nie mona utworzy klastra dziaajcego pomimo awarii z wykorzystaniem Windows Server 2003 Standard Edition.
37
najczciej procesorw lub pamici, w celu penego wykorzystania technik przetwarzania rwnolegego i wielozadaniowego.
Skalowanie pionowe wykorzystuje moliwoci nowoczesnych procesorw, takich
jak wielowtkowo, hyperthreading, blokady, semafory i inne funkcje atomowe.
Systemy skalowane w pionie s zwykle atwiejsze do zarzdzania, poniewa zwykle
trzeba radzi sobie z jednym stanem systemu operacyjnego, jednym repozytorium danych oraz przestrzeni przetwarzania rozproszonego. Jednak niektre
aplikacje z powodzeniem korzystaj z poczenia technik skalowania poziomego
i pionowego.
Systemami tymi s wysoce dostpne systemy przetwarzania transakcji, w ktrych
zoone aplikacje wielowtkowe s skalowane poziomo na kilka klastrw obsugujcych prac pomimo awarii lub wyrwnywanie obcienia. Wicej na ten temat
napiszemy w rozdziaach 5., 9., 11. i 12.
38
pienidze nie s warte osiganych efektw. Nawet pomijajc problemy ze zgodnoci sprztu, prawdopodobnie napotkamy problemy z oprogramowaniem po
przekroczeniu pewnego punktu krytycznego.
Na przykad, zwrmy uwag na opcj /3GB /PAE z pliku boot.ini serwera Windows 2000. Mamy tu problem z prawidowym wykorzystaniem przez OS duych
iloci pamici (4GB i wicej). Niektre systemy oprogramowania, na przykad
serwery baz danych, maj wewntrzne algorytmy obsugi transakcji, blokowania,
wielodostpnoci i problemw z architektur trjwarstwow. Architektura tych
systemw ma ograniczenia efektywnoci. Ograniczenia ta mog uniemoliwi
dalsze skalowanie w pionie. Jest to podobne do krzywej dzwonowej: prdzej
czy pniej, na szczycie krzywej bdziemy potrzebowali bardzo drogich aktualizacji sprztu, aby uzyska niewielk popraw wydajnoci. Skalowanie w poziomie oznacza zastosowanie wikszej iloci sprztu.
Udostpnianie wszystkiego
a nieudostpnianie niczego
Skupmy si teraz na zastosowaniu wikszej iloci sprztu, a nie tylko sprztu wikszego lub lepszego. Skalowanie poziome moe by efektywnym rozwizaniem problemw napotykanych w scenariuszu skalowania pionowego. Projektujemy system
nie tak, aby udostpnia wszystko, ale raczej tak, by nic nie udostpnia.
W istocie, architektura wspdzielenia niczego oznacza, e kady system komputerowy w klastrze dziaa niezalenie. Kady system w klastrze posiada osobne
zasoby (CPU, pami, dyski). Aby rozwiza problemy pojemnoci przez skalowanie poziome, dodajemy wicej sprztu do puli a nie do pojedynczej jednostki.
Skalowanie poziome pozwala rozwiza problem czynnika kosztu zwizany
ze skalowaniem pionowym, poniewa dodanie kilku mniejszych systemw jest
zwykle tasze ni unowoczenianie duego systemu klasy mainframe lub koszt
oraz problemy zwizane z cakowitym przeniesieniem na now platform. W przypadku skalowania poziomego wielko i szybko dziaania pojedynczego systemu nie ogranicza cakowitej wydajnoci. Architektura wspdzielenia niczego
pozwala zlikwidowa problem wskich garde programowych przez dostarczenie
architektury obsugujcej wiele mechanizmw wspbienoci. Poniewa obcienie jest dzielone na wiele serwerw, cakowita pojemno programowa i przepustowo zwiksza si.
Pomimo tego, e skalowanie poziome zapewnia rozwizanie integralnych ogranicze architektury skalowania pionowego, metoda jest zwizana z innymi problemami. Skalowanie poziome wymaga dodatkowych czynnoci administracyjnych, dogbnej wiedzy i oczywicie pienidzy. Puapki mog by potencjalnie
39
tak due, jak uzyskiwany przyrost wydajnoci. Nawet pomimo tego skalowanie
w poziomie moe by doskonaym rozwizaniem dla serwerw baz danych, ktre
osigny granice skalowalnoci sprztu.
Mamy wiele do przemylenia, szczeglnie gdy klient ma tylko jedno wymaganie:
zapewni, aby system by zawsze wczony.
40
konkurencyjnym, nie tylko trzeba by dostpnym przez cay czas, ale przepustowo systemw musi by moliwie dua.
HPC jest krytyczne dla wszystkich firm. Jeeli usuga dziaa powoli i maa grupa
ludzi o minut duej bdzie wysya dane, to po podsumowaniu roku okae si,
e stracilimy tydzie pracy. Ta strata na pewno wpynie na wyniki finansowe firmy.
Serwery baz danych udostpniajce witryny WWW lub wprowadzanie danych
i obliczenia musz dziaa z najwiksz moliw szybkoci. Serwery WWW
musz by w stanie obsuy tysice pocze, a nie tylko kilka. Serwery plikw
i drukarek nie mog zatrzymywa si na przecieniu procesora lub pamici
w przypadku drukowania wanej notatki dla wszystkich pracownikw.
41
42
Ten system operacyjny jest nie tylko taszy, ale rwnie dziaa taki sposb, e
systemy z niego korzystajce wedug wikszoci naukowych definicji mona
traktowa jak superkomputery.
Przetwarzanie i pami
Przetwarzanie wysoko wydajne zaley od kilku komponentw, ale zazwyczaj
na pocztku zwraca si uwag na procesor i pami. Procesory staj si tasze,
bardziej dostpne i wydajniejsze. Jednym z czynnikw, ktry przesta by problemem dla wikszoci budetw, jest rozmiar i ilo procesorw zamontowanych
w serwerze. Wikszo firm obecnie kupuje serwery z obsadzonymi wszystkimi
gniazdami serwerw dostpnymi na pycie gwnej.
Prawo Moorea zakada, e ilo tranzystorw w pojedynczym ukadzie podwaja
si co 18 miesicy. Do niedawna formua ta sprawdzaa si z niezwyk dokadnoci. Obecnie ilo tranzystorw podwaja si szybciej ni przewidzia to Gordon Moore, byy czonek zarzdu firmy Intel (najwikszy producent mikroprocesorw i dugoterminowy partner firmy Microsoft). Jak opiszemy w rozdziale
2., w przyszoci procesory stan si mniej zalene od tradycyjnych ogranicze
metalu nadprzewodzcego.
W roku 1998 komputer z procesorem 386 16 MHz z 1 MB pamici RAM i 40 MB
dyskiem twardym, kosztujcy ponad 20 000 z, by poza zasigiem wikszoci
firm. Obecnie komputer z procesorem 1,5 GHz z ponad 256 MB pamici RAM
i dyskiem twardym 40 GB mona bez problemu kupi za mniej ni 2 000 z.
Rozwj pamici rwnie przebiega w niezwykym tempie, dziki czemu ilo
pamici zamontowanej w systemie przestaje by problemem. Jeeli mamy potrzeby klasy HPC i SLA do spenienia, zamawiajc sprzt dla nowego klastra
SQL Server lub Exchange, najczciej polecamy sprzedawcy, aby doda pamici
do pena.
System operacyjny Windows Server 2003 zapowiada rwnie er systemw
64 bitowych, ktra spowoduje powstanie wielu firm, wielkich i maych, tworzcych nowe aplikacje dla superkomputerw. Autostrada przetwarzania 64-bitowego
jest niezwykle obiecujca. W rozdziale 2. przyjrzymy si, jak pojemno pamici
masowych wpywa na nasze potrzeby programowe.
43
moe te dziaa bez wspdzielonego i nadmiarowego systemu pamici masowej (RAID 1, 5, 10 i tak dalej). Pami masowa i kilka innych krytycznych komponentw jest opisanych w kilku kolejnych rozdziaach.
Pozostae komponenty skadajce si na systemy HPC-HA to zasilacze (PSU),
dyski i kontrolery, przeczniki i poczenia przecznikw, okablowanie sieciowe
(szczeglnie wkna wiatowodowe), karty sieciowe, adaptery magistrali i tak dalej.
Wedug CTC, s oni w pierwszym szeregu bada nad obliczeniami wysoko wydajnymi od wielu lat. Podobnie jak wiele innych tego typu organizacji, CTC
we wikszoci swoich prac wykorzystuje drogie, specjalizowane implementacje
systemu UNIX. W zwizku z ograniczeniami budetowymi, zwikszon zalenoci naukowcw od infrastruktury wysoko wydajnej oraz zwikszajc si dostpnoci komputerw i komponentw sieciowych, w roku 1999 w CTC opracowano unikatow strategi wykorzystania do oblicze wysoko wydajnych
systemw Microsoft Windows.
Od tego momentu CTC z sukcesem tworzy wiatowej klasy centrum superkomputerowe korzystajce z Windows. Najwikszym systemem CTC jest 256-procesorowy klaster Velocity II, ktry jest jednym z 10 najszybszych superkomputerw
na wiecie.
Cho w kolejnych rozdziaach skupiamy si w wikszoci na dostpnoci, element HPC jest zawsze zwizany z kad klas sprztu i oprogramowania, ktra
spenia nasze wymagania poziomu usugi.
44
Podsumowanie
W tym rozdziale przedstawilimy niektre wane pojcia, przygotowujc w ten
sposb grunt pod kolejne rozdziay. Zdefiniowalimy kilka terminw: dostpno, wydajno, niezawodno, nadmiarowo, awaria, naprawa, czas dziaania
i czas wyczenia. Omwilimy rwnie poziom obsugi oraz umowy SLA. Na
koniec rzucilimy nieco wiata na zagadnienia przetwarzania wysoko wydajnego
i superkomputerw.
Oprcz przygotowania gruntu dla kolejnych rozdziaw, rozdzia ten przedstawia
kilka idei. Obecnie Windows Server 2003 nie jest zbyt trudny ani drogi, wic
mona go stosowa przy budowaniu wysoko dostpnych lub wysoko wydajnych
systemw komputerowych. Po umieszczeniu takiego systemu superkomputerowego w lokalizacji zabezpieczonej przed klskami ywioowymi, bdziemy
w stanie sprosta najbardziej wymagajcym umowom SLA. Jeeli w SLA prawidowo zdefiniujemy czas wyczenia i bdziemy pilnowa, aby wyczenia nie
zdarzay si w oknie dziaania, dla ktrego jest podpisana umowa, najprawdopodobniej bdziemy w stanie osign cztery dziewitki bez potrzeby obrabowania banku.