Curs 7 4.2.4.

STUDIU DE CAZ - Solutii D-Link pentru Network Storage for Business Continuity and Disaster Recovery and Home Media
http://www.informationweek.com/whitepaper/download/showPDF.jhtml?id=61500027&site_id=300001 - (Iulie 2008)

Tehnologiile SCSI over IP si Open Storage Networking (OSN) combina cele mai bune facilitati oferite de NAS si SAN într-o solutie coerenta de management al stocarii. Internet SCSI (iSCSI) încapsuleaza pachete SCSI în TCP, apoi le ruteaza folosind IP. => datele stocate la nivel de bloc pot fi transportate în retele IP cu utilizare larga. => solutie hibrida SAN/NAS: întreprinderile si furnizorii de servicii pot administra retelele SAN dintr-o locatie centrala, folosind infrastructura IP -> arhitectura NAS. Comparatie iSCSI versus Fibre Channel (FC) în solutii SAN O solutie SAN ce utilizeaza iSCSI IP (iSCSI IP storage network ) este privita în general ca fiind o solutie cu o implementare si mentenanta mai putine complexe decât în cazul SAN cu FC (Fibre Channel SAN). Costurile cu iSCSI IP storage network sunt mai mici, dar iSCSI nu asigura aceleasi performante ca Fibre Channel SAN. iSCSI prezinta stocarea ca pe un dispozitiv virtual la nivel de bloc, care permite aplicatiilor sa lucreze cu iluzia utilizarii exclusive a spatiului de stocare. Pe de alta parte, FC = tehnologie de transmisie care utilizeaza un format de stocare la nivel de bloc identic cu cel utilizat de driverele de disc atasate , deci transferul de date este de tip „same to same”. Costul total aferent detinerii FC-ului este relativ mare comparat cu cazul detinerii iSCSI. În plus, în cazul întreprinderilor mici, poate fi necesara angajarea de noi specialisti – experti în FC SAN. Alt dezavantaj consta în limitarile relative la lungimea cablurilor. Toate acestea fac adesea prohibitiva utilizarea FC SAN în IMM-uri.

Solutii iSCSI SAN sau NAS? Întreprinderile mari pot opta pentru medii de calcul robuste cu solutii iSCSI SAN , acestea fiind mai potrivite pentru aplicatii care utilizeaza intensiv volume mari de date ce pot fi distribuite între utilizatori aflati la distanta sau între utilizatori numerosi care lucreaza în retea. La IMM-uri sau societati sau institutii ca de ex. birouri de avocati, de doctori, etc., se pot utiliza cu succes si solutii economice NAS. De ex. dispozitivele NAS de la D-Link ofera solutii NAS la 1/10 din pretul solutiilor SAN. NAS sau USB HDD extern? Pentru majoritatea retelelor de tip „businesses and home networks”, este preferabil un NAS unei solutii standard cu HDD extern conectat la USB. Avantajul mare al utilizarii NAS=accesibilitatea datelor. Utilizatorii de solutii Dlink NAS (de ex. D-Link DNS-323) au raportat performante mai bune comparativ cu dispoz. NAS standard. Ex.: D-Link DNS-323 atinge viteze read/write de 15Mbps, pe când alte unitati testate au atins doar viteze write de 3Mbps si viteze read de 5Mbps. Configuratiile NAS RAID furnizeaza: - mirroring îmbunatatit; - performante bune de tip systemwide si fault-tolerance; - solutii incorporate Internet si FTP access; - tool-less drive bays (carcase pentru drivere cu acces facil); - modalitati facile de configurare a permisiunilor utilizatorilor. Solutia este ideala pentru medii de lucru de tip birouri unde se lucreaza cu date secrete aferente angajatilor, sau pentru retele de tip home networks unde de ex. copiii ar putea accesa date confidentiale. Solutile D-Link NAS sunt compatibile cu orice calculator (PC, MAC, sau lucrând sub Linux) din retea, fara a fi necesara instalarea de SW specializat pe acesta.

http://www.google.ro/imgres?imgurl=http://benchmarkreviews.com/images/reviews/network/D-Link %2520DNS-323/DNS-323_diagram.jpg&imgrefurl=http://benchmarkreviews.com/index.php %3Foption%3Dcom_content%26task%3Dview%26id%3D58%26Itemid %3D1&h=600&w=363&sz=35&tbnid=g7BAorEKGExrVM:&tbnh=90&tbnw=54&prev=/search%3Fq %3D%2522D-Link%2BDNS-323%2522%26tbm%3Disch%26tbo%3Du&zoom=1&q=%22DLink+DNS323%22&docid=3FGX6gibGJpauM&hl=ro&sa=X&ei=UruBT4bCL4nj4QTIrvDLBw&ved=0CDYQ9QE wAg&dur=370

2 In exemplu – dispozitivul de stocare in configuratie NAS este accesibil: 1 – prin conexiune directa 2 – prin internet (legatura prin cablu) 3 – wireless 4 – pentru uzul unui media player 5 – pentru imprimanta 4 3 1

5

Fig. 17

În mod traditional, topologiile SAN utilizeaza cablare/switch-uri FC

Topologiile NAS folosesc protocolul TCP/IP peste cablurile de retea

4.2.5. NIVELE DE VIRTUALIZARE 4.2.5.1. Generalitati si scurt istoric Prescurtare: VS= virtualizarea stocarii. VS isi regaseste utilitatea in : sisteme de fisiere, SAN-uri, switch-uri si sisteme virtuale de benzi. Solutii de implementare pentru VS: SW, HW , solutii hibride sau appliance-uri SW. Rolul VS: „ascunde” complexitatea fizica a stocarii în fata administratorilor stocarii si a aplicatiilor de stocare, facând posibila gestionarea întregii stocari ca si cum aceasta ar fi o resursa unica. Se îmbunatatesc dramatic performantele si se micsoreaza costurile globale [1]. Virtualizarea a fost introdusa pentru început în lumea mainframe-urilor: -1960 – virtualizarea memoriei; -1970 – începuturile virtualizarii aferente stocarii, virtualizarea primelor subsisteme disc, cu utilizarea initiala a benzilor ca solutie pentru stocare de masa - sfârsitul anilor ’70 – introducerea primelor discuri de masa; - 1992 – primul disk-array RAID virtual; - 1997 – primele sisteme virtuale de benzi. Cu timpul virtualizarea a patruns si în lumea sistemelor deschise. Momentul de glorie al virtualizarii -> la sfârsitul anilor ’90, ca si rezultat al virtualizarii SANurilor si NAS-urilor într-un efort de a reunifica toate platformele de calcul dezvoltate în anii ’80.

Aspecte ale virtualizarii din sistemele deschise (Open Systems) [1]: - virtualizarea a început la nivelul SO-urilor, unde se aflau majoritatea punctelor de control în cazurile UNIX, Windows si Linux. De ex. SO-ul Sun Solaris furnizeaza arhitecturi container pentru virtualizarea mai multor imagini masina într-un singur server. - disk array-urile virtuale au aparut si în lumea nonmainframe (ex. Sun StorEdge™) ; - bibliotecile de benzi virtuale (virtual tape libraries) au aparut la sfârsitul anilor 90; - apoi au aparut si unitatile de control al volumelor virtuale, routerele si SW-ul pentru optimizarea SAN. Sarcinile aferente managementul virtual îngreuneaza eforturile administratorilor stoc arii. În prezent utilizatorii finali pot opta pentru mai multe solu tii, de aceea vendorii trebuie sa reduca atât complexitatea cât si numarul solutiilor alternative, pentru a fi competitivi [1].

Fig. 18 Solutii pentru virtualizarea stocarii

Stocare

4.2.5.2. Solutii pentru virtualizarea stocarii Fiecare optiune pentru implementarea VS (fig. 18) are avantaje si dezavantaje [1] : (1) Abordarile tipul „host-based” pot fi foarte lente si supuse caderilor. Daca un host (server) cade, celelalte sisteme trebuie sa ii preia integral sarcinile. Apar probleme mari cand solutia de tip hostbased ruleaza pe mai multe servere diferite. (2) Folosirea unei solutii „out-of-band” poate fi tinta unor atacuri hacker la adresa driverelor de dispozitiv (este localizata în afara fluxului de date si comenzi în retea => intrusii pot face brese în tehnicile de securitate). (3) Folosirea unei solutii “in-band” are probleme datorita localizarii sale în calea de date. Pot apare suprasarcini (overhead-ul= provocare tehnica majora) si latenţǎ ca si rezultat al încercarii de a gestiona toate cererile I/O vehiculate între mai multe servere si dispozitive de stocare. (4) Localizarea virtualizarii în controllerele subsistemelor de stocare si în switch-uri ridica probleme deoarece aceste controllere sunt de tip „proprietary” si uzual lucreaza numai cu produsele aceluiasi vendor. Exista si exceptii, controllerele de fabricatie recenta „recunoscând” si alte solutii.

4.2.5.3. Nivele de virtualizare a stocarii Se pot defini urmatoarele nivele de virtualizare a stocarii (fig. 19) [2]: 1) Nivelul server (Host virtualization). Abstractizarea la nivelul serverului se realizeaza prin intermediul gestionarii volumelor logice pe care SO le întretine la nivelul serverului. 2) Nivelul fabric. Abstractizarea la nivelul fabric poate face posibila independenta storage pools-urilor aferente serverelor heterogene. Fabric-ul SAN-ului poate fi divizat (zoned) pentru a permite appliance-urilor de virtualizare sa „vada” subsistemele de stocare si serverelor sa „vada” appliance-urile de virtualizare. Serverele nu pot sa „vada”/opereze direct cu subsistemele de stocare [2] Acest tip de virtualizare s-a rasfrânt si asupra switch-urilor în 2003, liderii pe segment fiind IBM si Sun StorageTek™ [1]. Fig. 19 Nivele de virtualizare a stocarii
Wiki: Computer appliance= componenta HW separata, proiectata special pt. a furniza o anume resursa de calcul. Adesea este rezidenta pe o platforma HW dedicata.

(Network appliance (Webopedia) – calculator personal , de obicei ieftin, uneori numit si thin client, care permite accesul la Internet si la anumite activitati business-related. Aplicatiile utilizate pe network appliance-uri sunt în mod tipic gazduite de un server Web, pe care il acceseaza appliance-ul. Network appliance-urile se folosesc pentru usurarea managementului retelei si reducerea costurilor.) 3) Nivelul subsistemului de stocare. Sistemele de stocare cu discuri pot furniza anumite niveluri de virtualizare: - prin subdivizarea discurilor în drivere virtuale mai mici sau -mai multe disp. de stocare sunt consolidate împreuna pentru a forma un driver virtual mare. Exemplu de virtualizare la nivelul stocarii = subsistemele RAID. VS poate trece la urmatorul nivel facând posibile prezentarea si managementul unor sisteme disparate de stocare [2] . În 2003, piata pentru sisteme de benzi virtuale pentru sisteme deschise a atins pentru prima oara un apogeu, a.î. aria lor de utilizare initiala (care se rezuma doar la mainframe-uri) s-a extins cucerind piete noi si generând o cerere crescuta pe acest segment de piata. În 2005, sistemele de benzi virtuale au reprezentat cea mai populara initiativa de stocare în multe „storage management pools” (pool-uri pentru managementul stocarii) [1] . 4) Nivelul sistemului de fisiere (file virtualization). Virtualizarea la nivelul sistemului de fisiere poate furniza cel mai înalt nivel de stocare virtuala. Poate de asemenea sa furnizeze si cele mai mari beneficii, deoarece datele si nu volumele pot fi partajate, alocate si protejate. Pe partea de aplicatii, „file virtualization” s-a bucurat de cea mai mare popularitate [1]. În sistemele deschise, cresterea impresionanta de date nestructurate si diversificarea sistemelor de fisiere, împreuna cu dezvoltarea arhitecturilor NAS au condus la cresterea importantei acestui nivel de virtualizare. Prin agregarea mai multor fisiere într-unul singur, utilizarea devine mai facila. Posibilitatea utilizarii unei singure interfete pentru un numar mare de fisiere diferite conduce la micsorarea fenomenului cunoscut sub numele de „storage management gap” (slide-ul urmator)[1]

4.2.5.4. Fenomenul „Storage Management Gap” (discrepanta din managementul stocarii) La nivelul anului 2006, la un server mediu non-mainframe se puteau atasa cca 40 terabytes de spatiu disc, pe când volumul mediu de stocare pe care îl poate gestiona administrarul stocarii se ridica doar la cca. 8 terabytes (fig. 20 [3]). Viteza de crestere a volumului de date este superioara celei cu care se dezvolta capacitatea de management a stocarii => discrepanta ia amploare, desi industria ia toate masurile de reducere. Pasii care pot fi parcursi pentru reducerea gap-ului: Fig. 20

Fig. 20 Solutii pentru reducerea „storage management gap”

(Wiki: SLA (service-level agreement = agreement negociat între doua parti , una fiind clientul si cealalta provider-ul de

- consolidare; - maparea topologiei SAN - managementul resurselor de stocare; - backup disc-pe-disc - tool-uri pentru managementul emailurilor - management hierarhic al stocarii; - securitatea stocarii - SW de virtualizare -Protectia continua a datelor - Managementul ciclului de viata al informatiilor (Information Lifecycle Management) - Switche inteligent -Instrumente pentru managementul ciclului de viata al datelor

Realizarea tuturor acestor sarcini în mod individual => marirea gap-ului.

Solutie la cele de mai sus poate fi Virtualizarea:
- consolideaza task-urile mentionate într-o interfata unica si poate elimina gap-ul, - permite si utilizarea arhitecturilor traditionale mainframe si - gestioneaza în mare parte volumul aferent stocarii lor. O solutie cheie este deci dezvoltarea virtualiz arii. Cresterea gradului de utilizare a dispozitivelor (fig. 21 [3]) = alt factor cheie în reducerea gapului. Supravegherea stocarii la sisteme UNIX si analiza capacitatii de utilizare au demonstrat ca în lumea non-mainframe (în special la UNIX si Windows), cca. 60 % din spatiul disc ramâne nealocat si deci nefolosit.
La mainframe-uri, o mare parte din virtualizare provine din implementarea initiala a DFSMS, care reprezinta un „policy engine” foarte eficient, patentat de IBM. O solutie similara este BrightStor CA-Disk. Prin utilizarea unor tool-uri de acest tip, utilizarea discului poate fi marita pâna la 80%.
www-03.ibm.com/systems/storage/software/ sms/index.html:

Fig. 21

IBM DFSMS= Data Facility Storage Management Subsystem= suita SW care gestioneaza datele automat, de la creare s pana la distrugere. Furnizeaza controlul alocarii pentru a imbunatati serviciile aferente disponibilitatii datelor, pe cele aferente operatiunilor de backup/recovery, disaster recovery, gestionarea spatiului, gestionarea benzilor etc.

Deoarece spatiul de stocare oferit de benzi este mare, cantitate de date scris a pe acestea este mult mai mica decât capacitatea lor. Spatiul alocat/utilizat tinde sa fie <50%. Daca însa se utilizeaza „virtual tape” (se pun mai multe volume logice pe un singur tape cartridge) se mareste mult utilizarea tape cartridge-ului. În medie, o rata de compresie de 2:1 mareste capacitatea de stocare a datelor. Utilizatorii de benzi virtuale pot atinge un grad de utilizare a benzii peste 80% la arhitecturi care incorporeaza Disk and Tape Library (DTL), deoarece virtualizarea permite utilizarea capacit atii în exces.

Fig. 21 Gradul de utilizare a spatiului de stocare

În fig. 22 -> Virtual Tape Library (VTL), discurile parând a fi mai multe drivere de banda. VTL-ul integrat include disk array si o biblioteca fizica de benzi. Împreuna, acestea furnizeaza o vedere integrata a VTL-ului, conducând la usurarea sarcinilor de management. La VTL miscarile de date (de tip „policy-based”) unde sunt implicate discuri si arhitectura aferenta se bazeaza pe un management de stocare ierarhic (hierarchical storage management - HSM). Din bufferul de disc, datele se muta (de) pe banda fizica, pe baza unei politici diferite în functie de sensul mutarii: când datele se misca spre banda fizica, volumele logice sunt stivuite (stacked) pentru a se îmbunatati gradul de utilizare. Caracteristicile hibride sunt:
Disk-array-ul fizic incorporat (care apare ca si cum ar fi benzi) are avantajele: - Se formeaza volume virtuale; - Numarul de drivere virtuale de banda poate depasi numarul de drivere fizice de banda => creste numarul de stream-uri de date paralele si eficienta globala; - pe disc se genereaza o imagine a dispozitivului banda (tape device image): - serveste ca un cache pentru mai multe date active; - face posibile recuperarile rapide ale datelor de pe disc. Biblioteca de benzi automatizata, care permite: - backup/recovery; arhive long-term, continut nemodificabil, conformitate; - realizarea în mod transparent a tehnologiilor de tip „re-mastering” asupra benzilor.

Fig. 22 Subsisteme de discuri virtuale

WORM=Write Once Read Many

4.2.5.6. Ghiduri relative la costurile implicate de stocare
FICON (definitie IBM) = protocolul standard pentru z/OS (z/OS = SO pe 64 biti pentru servere mainframe IBM), care va înlocui în timp protocolul ESCON ESCON = Enterprise System Connection (definitii IBM) poate avea mai multe sensuri: 1) Interfata perif. de tip ESA/390, seriala, optica între calculatoare mainframe IBM si dispozitive periferice cum sunt cele pentru stocare si driverele de banda. Asigura comunicatie half-duplex la o viteza de 17MB/sec pe distante de pâna la 43 km. Interfata I/O foloseste protocoalele logice ESA/390 pentru o interfata seriala care configureaza unitati atasate la un fabric. 2) Set de produse si servicii IBM care asigura un mediu conectat în mod dinamic în interiorul unei întreprinderi. MAID = Massive Array of Idle Disks (Wiki) = sistem cu sute sau mii de HDD pentru stocare de tip „nearline data storage”. Proiectat pentru aplicatii Write Once, Read Occasionally (WORO). Este similar unui JBOD f. mare, dar suplimentat cu gestionarea puterii. Comparatie MAID vs RAID. Avantaje MAID: densit. de stocare marita, cost mai mic Dezavantaje: latenta mult mai mare (x10 sec); performante de iesire (throughput= cantit.de date vehiculata/unit.timp) mult mai slabe si redundanta scazuta; cerinte speciale de alimentare/racire. . Majoritatea HD-urilor sunt proiectate pentru rotire aproape continua => fiabilitatea lor sufera daca sunt accelerate pentru a ajunge la viteza de rotatie nominala în mod repetat/ MAID pot suplimenta sau înlocui bibliotecile de date în stiva ierarhica de stocare. Odata cu aparitia SATA, arhitecturile MAID au evoluat spre o noua platforma de stocare pe termen lung, „online storage of persistent data”. Sistemele de stocare pe disc de dimensiuni mari care folosesc MAID permit un grad mare al „compactarii” driverelor (packaging of drives) si sunt proiectate pentru ca la un anumit moment doar 25% din discuri sa fie supuse accelerarii/decelerarii.

Pretul unitar/GB (anul 2006) la diferite subsisteme, care uzual este monitorizat lunar.
(La benzi se foloseste costul : nr. cartridge-uri/ nr. drivere.) Pentru sist. cu disc de masa (solid-state disk syst.), ASP-ul include controllerul, cache-ul si discul back-end. Tipul de disc “Economy” este un segment popular în industrie, folosinduse discuri ieftine SATA , la preturi /GB comparabile cu cele aferente bibliotecilor automatizare de benzi. ASP-ul se constituie într-un indicator mai bun decât lista de preturi negociate în industrie. El este important pentru analiza diferitelor situatii – corelate cu diferite nivele de stocare. Fig. 23. Average Selling Price (ASP) (pret mediu de vânzare) pentru subsist. de stocare În centrele de date mai mari, “mai multe date” se traduce prin “diferente mai mari în costurile cu infrastructura”. Aceasta impune necesitatea unei ierarhii de stocare stratificate (tiered storage hierarchy).

4.2.5.7. Ierarhia de stocare stratificata La ierarhiile de stocare stratificate actuale, existand o paleta variata de dispozitive, apare problema administrarii complexitatii . Se urmareste atingerea unui grad cât mai înalt de virtualizare. (Shelved data = date care nu se mai utilizeaza curent). În vârful ierarhiei se afla elementele arhitecturilor de virtualizare combinate. La nivel de organizatie nu se recomanda mentinerea unei arhitecturi de virtualizare pentru fiecare piesa componenta din modelul lor de stocare. Fig. 24 Ierarhia de stocare stratificata

Industria s-a axat pe un model de stocare în 3 straturi majore (3-tier), în cadrul fiecaruia dintre acestea existând mai multe alte straturi (unele organizatii au 6-7 astfel de substraturi). Primul strat major (tier-1 storage = primary storage) -> folosit pentru procesarea tranzactiilor de mare performanta, de tip mission-critical (critice pentru buna desfasurare a business-ului). Al 2-lea strat major (secondary storage) a fost inspirat de progresele rapide înregistrate de discurile de tip (SATA) si de “mutarea” lor din desktop-uri în centrele de date. Astfel s-a obtinut un strat foarte eficient pentru tehnicile “backup and recovery”. În acest strat se utilizeaza diferite arhitecturi bazate pe discuri SATA. Tot aici se regasesc si VTL-urile integrate, care folosesc discuri SATA. Al 3-lea strat major - “Long-term data retention” reprezinta actualul factor major de dezvoltare pentru industria benzilor traditionale, datorita cresterii nevoii de stocare a datelor odata ce au fost create. Atunci când au fost introduse bibliotecile de benzi (1988), s-a presupus ca majoritatea datelor nu vor avea un timp de viata util mai mare de 2 ani, cu câteva exceptii, ca: date de tip “statute-of-limitations data”, date seismice si date stiintifice a caror recreare la intervale regulate de câtiva ani ar fi prea costisitoare. Trasaturi ca de ex. conformitatea (“compliance”), continut fix (“fixed content”) si arhivarea au avut un anumit impact asupra ciclului de viata al datelor (Data Lifecycle) , asa cum se prezinta în fig. 25

Termeni: OLTP=Online Transaction Process. CDP= Continuous Data Protection (regasit si sub denumirile Continuous backup sau Continuous Vaulting). Ciclul de viata are o tendinta crescatoare, a.î. datele trebuie pastrate pentru un timp nedeterminat. Industria benzilor domina lumea tier-3, discurile detinând majoritatea aplicatiilor tier-urilor 1 si 2.
Fig. 25. Ciclul de viata al datelor

Fig.25 reprezinta si modelul ILM (Information Lifecycle Model) si ilustreaza modul de administrare a datelor de-a lungul ciclului lor de viata într-o gama larga de tehnologii. Acesta include modalitatile foarte facile de realizare a administrarii datelor din cele 3 tier-uri si a mutarii datelor înainte si înapoi.

4.2.5.8. Solutii pentru viitor - topologia de retea pentru stocare Fig. 26, care prezinta clienti care utiliz. o gama larga de SO, ilustreaza o solutie de viitor = topologia Storage Network Topology, care ar putea fi luata în considerare de catre o organiz. pentru planurile sale strategice. La baza diagramei este ilustrata “mutarea” datelor între disk array-uri si arhitectura Nearline într-un mod independent de servere, prin virtualizarea infrastructurii stocarii. O virtualizare a organizatiei ar trebui sa permita datelor sa se deplaseze între tier-uri diferite fara a fi necesara citirea si scrierea lor de pe/pe fiecare server individual. Abordarea furnizeaza mai multa inteligenta în (a) fabric-ul stocarii (în switch-uri) si (b) în dispoz. de stocare, fiind realizabila si in-band si out-of-band. Aceasta strategie impune ca o parte din virtualizare sa se mute în exteriorul serverului, mai aproape de datele propriu-zise atât pentru fisiere cât si pentru blocurile de date. Astfel se poate evita pe viitor necesitatea implementarii unei arhitecturi de virtualizare în fiecare server individual. În fig. 26 se prezinta aceasta arhitectura, în care un host din organizatie (cel marcat cu galben) este implicat în mod direct în capabilitatile de virtualizare în termenii unei solutii Unix si Solaris. Wiki: >>DWDM= Dense Wavelength Division Multiplexing. Un sistem DWDM foloseste un multiplexor la transmitator (reuneste toate semnalele) si respectiv un demultiplexor la receptor (separa semnalele). Cu un tip corespunzator de fibra, se poate ca un dispozitiv sa incorporeze ambele functionalitati, si deci sa se comporte ca un multiplexor de tip „optical add-drop multiplexer”. Synchronous optical networking (SONET) si Synchronous Digital Hierarchy (SDH), reprezinta doua protocoale de multiplexare strâns legate, folosite pentru transferul de streamuri multiple de biti folosind laseri sau LED-uri peste aceeasi fibra optica. NDMP (Network Data Management Protocol) = protocol folosit pentru transportarea datelor între dispozitive NAS. Se elimina necesitatea transportarii datelor prin intermediul serverului de backup, obtinându-se cresterea vitezei si degrevarea de sarcini a serverului de backup.>>> E-SRM = Electronic Storage Resource Management . Containerele la nivelul serverului si zona galbena din partea inferioara a figurii prezinta o virtualizare a întregii ierarhii de stocare cu scopul de a stoca si gestiona datele pe tot parcursul vietii acestora. Acest pas este important deoarece organizatiile trebuie sa tina cont de perioada aferenta memorarii datelor , tinzându-se spre necesitatea gestionarii lor pentru perioade mari de timp.

FSP=File Service Protocol = protocol bazat pe UDP , proiectat pt. a inlocui FTP.

Fig. 26. Topologia Storage Network Topology

4.2.5.9. Alegerea nivelului de virtualizare O strategie posibila (de ex. cea practicata de IBM) este de: -a „ muta” inteligenta aferenta managementului DS în afara serverului, nemaifiind necesara implementarea de SW specializate (gen LVM – Logical Volume Manager) la nivelul serverului. - a reduce necesarul de inteligenta la nivelul subsistemului de stocare => nu vor mai trebui implementate subsisteme de stocare inteligente. Prin implementarea la nivelul fabric-ului, controlul stocarii este mutat în retea, acest lucru facând posibila utilizarea tuturor tipurilor de virtualizare, simultan cu reducerea complexitatii prin furnizarea unei singure vederi a stocarii. Reteaua de stocare se poate folosi pentru a sprijini toate tipurile de servicii aferente multiplelor DS, inclusiv virtualizarea. Prin (*) implementarea la nivelul sistemului de fi siere, detaliile aferente fisierelor sunt practic stocate în reteaua de stocare si nu în serverele individuale. Astfel inteligenta sistemului de fisiere este disponibila tuturor serverelor de aplicatie si se obtin avantaje imediate ca: un singur spatiu de nume si un singur punct de management. Gestionarea fisierelor nu mai trebuie facuta printr-o tehnica server-by-server.

4.2.5.10 Modelele In-band si Out-of-band Modelele In-band si Out-of-band nu se exclud, adesea preferandu-se utilizarea unei combinatii între acestea. Modelul In-band La o retea de stocare virtuala in-band, atât datele cât si comenzile circula pe aceeasi cale, pe care exista nivele de abstractizare, iar tehnica pool se poate aplica sub controlul unui manager de domeniu [2]. În general solutiile in-band sunt percepute ca fiind mai simplu de implementat, în special deoarece nu necesita instalarea unui SW specializat în servere (altul decât SW-ul conventional multi-pathing). Tehnica poate conduce la îmbunatatirea performantelor sistemelor disc existente, le poate mari timpul de viata si poate reduce costurile aferente unor noi capacitati de stocare, deoarece se pot folosi sisteme disc mai ieftine, cu functionalitati reduse, fara a se reduce performantele. Se mai pot obtine si alte avantaje: a) capacitatea de a degreva host-ul de anumite functii; b) furnizarea (catre SAN) de functionalitati aferente managementului stocarii; c) realizarea de optimizari ale performantelor în calea de date; d) suport pentru sistemele host care nu sunt grupate în clustere; e) suport pentru mai multe sisteme host heterogene; f) integrare buna cu SW-ul de management al stocarii; g) clientul nu mai este legat de DS-uri produse de anumiti vendori; h) furnizarea unei scalabilitati excelente, etc. SAN Volume Controller (SVC) (IBM) reprezinta un bun exemplu de solutie in-band .
Fig. 27. Modelele In-band si Out-of-band

Solutia in-band IBM TotalStorage SAN Volume Controller (SVC) a fost proiectat pentru a realiza urmatoarele: (a) Asigurarea unui punct de control centralizat pentru gestionarea unui SAN heterogen, incluzând volumele de stocare produse de vendori diferiti. b) Sprijinirea optimizarilor aferente unor investitii IT existente prin virtualizarea stocarii si centralizarea managementului. c) Cresterea utilizarii capacitatii de stocare, a timpului de lucru fara întreruperi (uptime), a productivitatii administrarii si respectiv a eficientei. d) Furnizarea unui singur set de servicii avansate de copiere si backup pentru DS multiple. Administratorul IT este ajutat de catre SVC sa gestioneze volumele de stocare din SAN-urile pe care le administreaza. SVC ajuta la combinarea capacitatii mai multor controllere de stocare, chiar de proveniente heterogene, într-o singura resursa, cu o singura vedere asupra volumelor. SVC ofera administratorului posibilitatea sa lanseze operatiuni de tip migrare a stocarii între dispozitive diferite, fara ca dispozitivele implicate sa trebuiasca sa treaca în starea offline, si permite administratorului sa realizeze mai bine operatiuni asupra capacitatii de stocare, cum sunt: realocarea, scalarea, upgradarea si backup-ul, fara ca aplicatiile aflate în executie sa fie întrerupte. SVC ofera suport unor servicii de copiere avansate, care privesc toate DS atasate, indiferent de inteligenta incorporata în controllerele suport.

Studiu de caz (publicat sept. 2011) – implementare la Universitatea din Pittsburgh
http://www-01.ibm.com/software/success/cssdb.nsf/CS/KGOY-8M6MPE?OpenDocument&Site=default&cty=en_us

Contextul in care s-a optat pentru solutia IT: volum de date in continua crestere, care genera o anumita presiune asupra infrastructurii de stocare existente. Operatii complexe si mari consumatoare de timp legate de gestionare si “provisioning”. Solutie: Dezvoltarea unei infrastructuri de stocare complet virtualizate, gestionate folosind IBM SAN Volume Controller , pe doua nivele, incluzand: -doua sisteme de tip “IBM® System Storage® DS8800 array” -un sistem de tip IBM Storwize® V7000 Beneficii Se poate adauga rapid, fara riscuri, capacitate noua de stocare, reducandu-se dramatic volumul sarcinilor administrative simultan cu cresterea satisfactiei clientilor. Prin virtualizarea stocarii a fost stimulata flexibilitatea.
http://www-03.ibm.com/systems/storage/disk/storwize_v7000/

IBM Storwize V7000 Unified Storage Consolideaza sarcinile de lucru la nivel de bloc si respectiv fisier intr-un singur sistem de stocare pentru a simplifica managementul si a reduce costurile
http://www.crn.com/news/storage/227700356/ibm-intros-new-arrays-adds-virtualization-tiering-capabilities.htm;jsessionid=xAZaysPhrpCq3UupbW6tg**.ecappj01?pgno=2 (2010)

DS8800 – caracterizat prin: controlere IBM POWER6+, conectivitate la fibra optica de 8-Gbit /sec si la SAS 6-Gbit /sec, demonstrand performante marite cu 40% fata de modelul DS8700. Include “ Easy Tier”, caracteristica prin care se reduc mult costurile cu stocarea.

Modelul out-of-band În cazul out-of-band, fluxul de date si cel de comenzi sunt separate. Acest lucru se realizeaza prin separarea datelor de meta-date, acestea fiind amplasate în locuri diferite. Toate tabelele de mapare si blocare sunt mutate într-un server separat (meta-data controller) care contine metadate despre fisiere. Serverele cer de la meta-data controller autorizare pentru accesul la date, acesta putând acorda autorizari, gestiona blocarea, s.a.m.d. Dupa ce primesc autorizarea, serverele acceseaza datele direct, fara a mai implica vreun dispozitiv de stocare a metadatelor. În multe operatiuni meta-data controller-ul nu intervine. Datorita separarii fluxurilor, operatiunile de I/O beneficiaza de întreaga latime de banda pe care o poate furniza SAN, în timp ce comenzile se pot deplasa printr-o retea separata sau prin rute diferite. Astfel se obtin performante care sunt aproape egale cu cele aferente unui sistem de fisiere local, cu toate beneficiile si functionalitatea suplimentara aferente implementarii out-ofband. Se mai pot obtine si alte avantaje, cum ar fi: - avantajele prezentate la modelul in-band, identificate prin literele: b), e), g) si h); - host-ul este degrevat de procesari; - se ofera suport managementului stocarii de la mai multi vendori; - overhead (volum suplimentar) relativ scazut în calea de date. SAN File System (SFS) reprezinta un bun exemplu de solutie out-of-band .

Solutia out-of-band IBM TotalStorage SAN File System (SFS) = sistem de fisiere mult utilizat care permite centralizarea managementului si îmbunatatirea utilizarii stocarii la nivelul fisierelor. SFS este configurat a.î. asigura un nivel foarte bun de disponibilitate. Se bazeaza pe platformele xSeries cu clustering pentru metadata controller-e, asigurând redundanta si toleranta la defecte. SFS a fost proiectat pentru a furniza capabilitati automate pentru stocare de tip „policy-based” (la care se aplica politici de securitate), pentru provisioning si amplasarea datelor, migrarea de tip nondisruptiv a datelor , simultan cu oferirea unui singur punct pentru managementul fisierelor din SAN. >>Wikipedia: Procesele aferente provisioning-ului: (a) monitorizeaza drepturile de acces si privilegiile în scopul asigurarii securitatii resurselor întreprinderii si a confidentialitatii utilizatorilor; (b) asigura conformitatea (compliance) si minimizeaza vulnerabilitatea sistemelor în fata tentativelor de penetrare si abuz; (c) încearca sa reduca volumul de configurari personalizate prin utilizarea unui boot image control si a altor metode care reduc drastic numarul de configuratii implicate.>> La implementarea SFS s-au gasit solutii pentru majoritatea problemelor cauzate de interoperabilitatea între componente produse de vendori diferiti, componente care sunt conectate la un fabric din SAN, o provocare majora pentru industrie fiind problema gestionarii datelor stocate de dispozitive diverse produse de vendori diferiti . Anumiti utilizatori si vendori folosesc termenul de partajarea datelor într-un sens mai liber, ca si proces de replicare a fisierelor sau bazelor de date care permite ca mai multi utilizatori sau aplicatii sa utilizeze copii separate ale datelor. Aplicatiile implicate pot opera pe platforme host diferite. Dar adevaratul sens al partajarii datelor (true data sharing) este cel aferent utilizarii unei singure copii a unui fisier de catre mai multi utilizatori.

Într-un mediu cu servere omogene, cu control corespunzator al SW-ului de aplicatie, mai multe servere pot accesa o singura copie a datelor stocate pe un subsistem de stocare consolidat. Daca însa serverele atasate reprezinta platforme heterogene (de ex. UNIX cu Windows), partajarea datelor reprezinta un proces complex, datorita diferentelor prezentate din fig. 28. Arhitectura SFS permite ca mediul SAN sa beneficieze de sistemul de stocare deja existent gestionat de mainframe. În mainframe-urile IBM sunt de mult implementate caracteristici ca: alocare bazata pe politici (policy-based allocation), managementul volumelor si managementul fisierelor.

Fig. 28 Diferente HW si diferente aferente sistemelor de operare

Infrastructura aferenta unui astfel de management centralizat, automat este deficitara în lumea sistemelor deschise (Linux, Windows, UNIX). La sistemele conventionale, managementul stocarii depinde de platforma, pe când SFS este independent de platforma. SFS este proiectat special pentru utilizarea în SAN. Prin utilizarea sa se obtin avantajele mentionate la par. 4.2.5.9. (notate cu (*)). În plus, SFS automatizeaza task-urile de rutina si respectiv pe cele susceptibile de a produce erori (ex. amplasarea fisierelor), si gestioneaza problemele legate de spatiu. SFS face posibila partajarea reala a fisierelor, aceea în care citirea/scrierea ACELORASI date se poate realiza de catre SO diferite. 4.2.6 Managementul SAN Managementul SAN-ului are un rol critic, putând fi si un factor de decizie în selectarea unei anumite implementari SAN. Uzual fiecare vendor si fiecare dispozitiv au tehnicile sale particulare de management al HW-ului si SW-ului. De obicei aceste tehnici sunt independente si nu se poate pretinde ca exista o singura solutie de management a SAN, care va furniza un singur punct de control. Actual complexitatea tehnica si paleta bogata de facilitati oferite de vendorii de tehnologii SAN au condus la utilizarea intensa a agentilor, care însa ridica noi probleme utilizarii SAN-urilor.

4.2.6.1. Initiative bazate pe standarde În 1999 SNIA si DMTF (Distributed Management Task Force) au introdus standarde deschise pentru gestionarea DS. Acestea utilizeaza un protocol comun care face posibila interoperabilitatea – CIM (Common Information Model). Versiunea Web a acestuia (WBEM) foloseste XML pentru a defini obiecte CIM si a procesa tranzactii în interiorul sesiunilor. Standardul propune ca un manager de obiecte CIM (CIMOM=CIM Object Manager) sa gestioneze obiecte si interactiuni CIM. CIM defineste obiectele si interactiunile lor. Aplicatiile de management utilizeaza modelul obiect CIM si XML peste HTTP pentru a realiza managementul DS-urilor=> managementul centralizat prin utilizarea de standarde deschise. Folosirea modelului standardizat permite produselor implicate în operatiuni de stocare precum si aplicatiilor de management sa administreze, monitorizeze si controleze mai usor DS. SNIA foloseste SMI (Storage Management Initiative) pentru a crea si promova adoptarea unei interfete de management interoperabile cu multe functionalitati pentru produse aferente SAN de la vendori diferiti. Se intentioneaza ca toate DS sa fie conforme cu aceasta interfata. Astfel, SMI-S (Storage Management Interface Specification) pentru managementul stocarii aferente SAN furnizeaza : - specificatiile de baza pentru managementul dispozitivelor; - suportul pentru serviciile de copiere si respectiv virtualizare. Conform standardului, serviciile CIM sunt înregistrate într-un director pentru a fi disponibile tuturor subsistemelor si aplicatiilor de management. SNIA foloseste protocolul xmlCIM pentru a descrie obiectele de management al stocarii si comportarea lor. Prin CIM este posibil ca aplicatiile de management sa comunice cu dispozitivele

4.2.6.2. Managementul deschis al stocarii folosind CIM Managementul SAN implica: - atribuire LUN; - provisioning; - atribuirea de masti (masking); - configurari; - zoning; - monitorizarea si optimizarea performantelor, a capacitatii si a disponibilitatii. Suportul pentru disponibilitatea non-stop (24/7-> „24 hours a day, 7 days a week") si asigurarea posibilitatii recuperarii dupa dezastre impun ca serviciile de copiere (de) pe dispozitive sa fie disponibile ca un mediu viabil de tip „ failover and disaster recovery” . Uzual fiecare dispozitiv furnizeaza: - o interfata pentru interpretarea comenzilor (Command Line Interface-CLI) ; - o interfata utilizator grafica (GUI) ca suport pentru acest tip de sarcini administrative. Multe disp. furnizeaza si API-uri care permit altor programe sa le acceseze capabilitatile interne.
Majoritatea dispoz. SAN pot fi administrate prin intermediul CLI : - folosind fie o conexiune telnet standard, unde dispozitivelor SAN le sunt asociate adrese IP; - fie printr-o conexiune seriala RS-232. API-urile pot conduce la cazul ideal în care folosindu-se un singur produs de management se pot gestiona si configura toti „actorii” de pe scena SAN. Unii vendori pun la dispozitie API-urile aferente produselor lor si altor vendori, pentru a face posibil managementul comun. Pentru mediile complexe SAN, pot fi disponibile aplicatii de management (abrev. neconsacrata AM), acestea usurând efectuarea acestui tip de sarcini administrative la o multime de dispozitive. Interfata CIM si modelul SMI-S furnizeaza un model standard pentru accesarea dispozitivelor, care permite AM si dispozitivelor care provin de la o mare varietate de vendori sa conlucreze cu produsele celorlalti. Astfel clientul are mai multe raspunsuri posibile pentru întrebarile: (a) Care DS accepta o AM aleasa?; b) care AM se poate folosi pentru un DS ales?

4.2. 6.3. Managerul de obiecte CIMOM Standardul SMI-S specifica doua solutii pentru a implementa un CIM: (a) folosind un proxy; (b) folosind un agent incorporat. În oricare dintre cazuri, obiectele CIM sunt suportate de un CIMOM. Aplicatiile externe comunica cu CIM prin intermediul HTTP pentru a interschimba mesaje XML, care sunt utilizate pentru a configura si gestiona dispozitivul. Într-o configuratie proxy, (fig. 29) CIMOM ruleaza în exteriorul dispozitivului si poate gestiona mai multe dispozitive. Se instaleaza în CIMOM o componenta provider pentru ca CIMOM sa poata sa gestioneze anumite dispoz. Providerii adapteaza CIMOM a.î. acesta sa poata lucra cu dispozitive si subsisteme diferite. Astfel se poate utiliza o singura instalare CIMOM pentru a accesa mai multe tipuri de dispozitive si mai multe dispozitive din fiecare tip într-un subsistem.
CIMOM actioneaza ca si un captator de cereri (catcher of requests) care sunt trimise de catre Aplicatia de Management (AM). Interactiunile dintre captator si expeditor folosesc

Fig. 29 Configuratie proxy cu CIMOM

limbajul si modelele definite de SMI-S. Astfel AM-urile, indiferent de vendor, pot sa interogheze starea si se realiz. actiuni de tip comanda/control folosind interactiuni CIM bazate pe XML.

4.2.6.5. Managementul si monitorizarea fabric-urilor În cazul managementului „in-band” , comunicarea dintre dispozitiv si entitatea de management a retelei se realizeaza de cele mai multe ori direct, folosind SES si transportul prin FC. >>>> IBM defineste SES – SCSI Enclosure Services, ca si propunere ANSI SCSI-3 care defineste un set de comenzi pentru solicitarea unor informatii de baza despre starea dispozitivelor dintr-un DS: temperatura, viteza ventilator, starea sursei, etc. Acest gen de management este simplu de implementat, nu necesita conexiuni LAN si are avantaje inerente, cum ar fi de ex. abilitatea unui switch de a initia o harta topologica a SAN-ului prin intermediul unor interogari SES catre alte componente de tip fabric. Dezavantajele solutiei sunt aferente eventualelor „caderi” aferente transportului prin FC. Dupa o astfel de cadere, informatiile de management nu se mai pot transmite, deci se pierde accesul la dispozitive precum si abilitatea de a detecta, izola si remedia probleme de retea. Problema se minimizeaza prin folosirea de cai redundante între dispozitivele din fabric. Ca dezvoltari ale managementului in-band se pot mentiona propunerile pentru interfete de nivel jos: Ex.1 -> RNID - Return Node Identification (pt. colectare informatii despre disp. individuale si despre conexiuni); Ex. 2 -> RTIN – Return Topology Identification (pt. colectarea informatiilor pentru un server de management care deduce informatii de topologie). Protocolul SNMP (Simple Network Management Protocol) = protocol bazat pe IP care include un set de comenzi pentru setarea parametrilor opera tionali ai dispozitivelor si obtinerea informatiilor despre starea acestora. Platforma de management a SNMP se numeste SNMP manager, iar dispozitivele care sunt administrate astfel au agentul SNMP încarcat. Datele aferente managementului sunt organizate într-o structura ierarhica numita Management Information Base (MIB). MIB-urile sunt definite si modificate de catre diferite asociatii industriale

Managementul out-of-band semnifica faptul ca datele de management al dispozitivelor
sunt recoltate prin intermediul unei conexiuni TCP/IP cum este de ex. o re tea Ethernet. Comenzile si interogarile se pot trimite prin SNMP, Telnet sau http, ultimele dou a solutii fiind mai convenabile pentru retele mici. Managementul out-of-band nu se bazeaza pe reteaua FC! De aceea are marele avantaj ca mesajele si comenzile aferente managementului pot fi trimise chiar dac a un segment sau un fabric nu functioneaza corect. Facilitatile integrate de management sunt implementate mai u sor, în special prin utilizarea SNMP. Dar, spre deosebire de managementul in-band, managementul out-of-band nu poate furniza în mod automat mapari de topologie SAN. Dezvoltarile managementului Out-of-band se refera la implementarea a doua MIB-uri de baza pentru uzul SNMP: - ANSI Fiber Channel Fabric Element MIB , care furnizeaza informatii operationale si pentru configurarea unor dispozitive individuale; - Fiber Channel Management MIB , care furnizeaza tabele de legatura suplimentare si informatii pentru switch zoning care pot fi utilizate pentru a deduce informa tii despre conexiunile fizice si logice dintre dispozitive individuale. Totusi monitorizarea out-of-band ramâne incompleta. Numeroase DS si anumite dispoz. fabric nu îi ofera suport, iar multi administratori nu ataseaza elementele SAN-urilor la reteaua TCP/IP.

Sinteza avantaje in-band vs out-of-band

4.2.6.6. Protocolul Service Location Protocol (SLP) SLP-ul furnizeaza un cadru de lucru flexibil si scalabil care asigura sistemelor host accesul la informatii despre existenta, localizarea si configurarea serviciilor de retea. SPL elimina necesitatea ca un utilizator sa cunoasca numele unei retele gazda care suporta un serviciu. În schimb, utilizatorul specifica tipul de serviciu dorit si un set de atribute pentru descrierea acestuia. Pe baza acestei descrieri, SLP-ul determina ( resolves) adresa de retea a serviciului. SLP-ul furnizeaza un mecanism de configurare dinamica pentru aplicatii în LAN-uri. Aplicatiile sunt modelate ca si clienti care vor sa gaseasca servere atasate la oricare dintre retelele disponibile dintr-o întreprindere. Atunci când sunt disponibili mai multi clienti sau mai multe servicii, protocolul utilizeaza Directory Agents aflati în apropiere care ofera un depozit centralizat pentru servicii de tip advertised services.

4.2.6.7. Tivoli Common Agent Services Tivoli Common Agent Services (abrev. neconsacrata TCAS) a fost proiectat pentru a furniza o modalitate de a desfasura cod-agent peste mai multe masini end-user sau servere de aplicatie dintr-o întreprindere (fig.30). Agentii colecteaza date si executa operatiuni asupra resurselor gestionate, pentru managerul de resurse Fabric Manager. TCAS este format din doua subcomponente: (a) Agent manager si (b) Common agent. (a) Agent manager-ul: - asigura autentificarea si autorizarea (genereaza certificate si chei pentru autentificari); - mentine un registry cu informatii de configurare despre managerii de resurse din mediu si agenti; - furnizeaza si API-uri de interogare pentru uzul altor produse. Managerii de resurse (de ex. Fabric Manager) administreaza agentii dezvoltati de agentul comun. O singura instanta a unui agent manager poate administra mai multi manageri de resurse si agenti. AM folosesc serviciile agent manager-ului pentru a obtine informatii despre sistemele de calcul pe care se executa TCAS si a comunica în mod sigur cu acestea. (b) Agentii comuni se comporta ca niste containere de gazduire a agentilor de productie si a serviciilor comune. Un agent comun asigura: - capabilitati de dezvoltare la distanta; - resurse masina partajate ; - conectivitate sigura. Un singur agent comun poate sa administreze mai multi agenti de productie pe aceeasi masina. El furnizeaza capabilitati de monitorizare si poate fi folosit pentru instalarea si actualizarea agentilor

Fig. 30

[1] http://www.sun.com/storage/virtualization/StgVirtWP.pdf „Storage Virtualization for IT Flexibility”, de Fred G. Moore, 2006 [2] White papers si red papers IBM [3] www.horizon.com