UNIVERSITATEA DIN BACĂU FACULTATEA DE INGINERIE

POPA SORIN EUGEN

EVALUAREA SISTEMELOR DE CALCUL
note de curs şi seminar pentru studenţii Facultăţii de Inginerie

2007

Cuvânt înainte,

Volumul "Evaluarea performanţelor sistemelor de calcul " se adresează studenţilor de la specializarea Tehnologia informaţiei anul IV şi acoperă materia cursului intitulat generic "Evaluarea performaţelor" Cursul este structurat pe două părţi, prima de teorie ce conţine 6 capitole referitoare la noţiunile teoretice privind aspectele generale a evaluării, testării şi comparării performanţelor componentelor de bază ale sistemelor de calcul, şi a doua parte conţine care conţine 6 lucrări de seminar cu scopul de completare a celor predate la curs. Primul capitol, "Noţiuni de bază privind evaluarea performanţelor" face o trecere în vedere a întregului domeniu de evaluare a performanţelor, atât al companiilor (firmelor) cât şi a sistemelor de calcul. Aşa cum se va vedea şi din prelegerea ce urmează, este aproape imposibilă evaluarea unui sistem de calcul ca întreg, o evaluare obiectivă putându-se realiza doar pe componente. În consecinţă, următoarele capitole vor trata problema evaluării computerelor pe baza evaluării principalelor sale componente. Capitolul doi tratează evaluarea plăcilor de bază ale unui computer, şi conţine definiţii şi elementele componente ale plăcii de bază şi o evaluare comparativă a plăcilor soket 939. Al treilea capitol tratează problema evaluării procesoarelor, cu descrierea arhitecturii celor două mari clase de procesoare, Intel şi AMD, şi dual-core. În ultima parte a capitolului, prezentându-se procedura de realizare practică a testelor comparative. Capitolul patru tratează procesul de evaluare şi testare a memoriilor iar capitolul cinci pe cel al plăcilor grafice. Ultimul capitol care încheie acest volum se apleacă asupra testării şi evaluării hard discurilor. A doua parte a volumului conţine şase lucrări de seminare care vin în completarea materialelor prezentate în capitolele anterioare cu detalieri şi exemple practice. În primul seminar se prezintă metodologia de evaluare generală a componentelor unui calculator, cu specificaţii mai detaliate pentru testarea plăcilor de bază. Al doilea seminar tratează , drept exemplu, evaluarea plăcilor de bază dual core.

i

Seminarul numărul patru prezintă modul general de testare şi evaluare a ecranelor TFT-LDC.Al treilea seminar prezintă procedura de realizare a overclockingului plăclor video. adică procedura de îmbunătăţire a performanţelor acestora. şi criteriile de alegere a acestora Ultimele două lucrări prezintă procedura de realizare a overclocking-ului la procesoarele Intel şi AMD64 Autorul ii .

Placa de bază . permiţând producătorilor să vândă bine memorii cu latenţe uriaşe. GT3 etc) care contribuie cu succes la îndesirea peretelui de fum ce acoperă sub nume frumoase performanţe uneori dezamăgitoare.). VIA etc). VL. cu suport felurit pentru memorii (de la bătrânele SDRAM şi RIMM la DDR.. 2. cum se poate măsura performanţa unui sistem fără a aluneca în groapa discuţiilor fără sfârşit legate de platforme şi setări diferite şi benchmark-uri inconsistente? Ei bine. Cumpărătorul este din nou orbit de frecvenţele scrise cu litere uneori uriaşe şi ignoră existenţa acelui termen esenţial numit „latenţe”. rezultând hibrizi cum ar fi plăci video cu performanţe slabe şi cantitate de memorie prea mare faţă de capacităţile „motorului”.Prelegere La prima vedere. cu suport video variat (grafică integrată. 478. La urma urmei. sau faimoasele plăci video cu „memorie” TurboCache. ULi. componentele de bază.a cărei alegere se poate dovedi dificilă chiar şi pentru un specialist. Rămân. NVIDIA. sunet integrat de diferite tipuri şi performanţe. SLI etc). deci. 940. din componente de bază (fără de care sistemul nu poate funcţiona) şi componente opţionale.prezentată în forme şi tipuri diverse (ATX. aceasta e problema cea mai importantă. GT. Limitându-ne doar la cei mai mari „jucători” de pe piaţa actuală (AMD şi Intel). tipul şi numărul de conectori LAN etc). ATI. 3. 775. cu suport divers pentru procesoare diverse (Socket 462. încă mai dificil de înţeles. DDR2 etc). 754. dar haideţi să ne concentrăm asupra sistemului care respectă această regulă. Pe lângă aceasta. pare o problemă absurdă. 4. Un cumpărător obişnuit se uită în special la cantitatea de memorie video. TD. enumerăm doar câteva dintre caracteristicile ce afectează performanţa: frecvenţa de funcţionare. Adevăraţii entuziaşti ai benchmark-urilor ignoră în mod voit problemele ivite. TC. GTO. Menţionăm pe scurt şi alte caracteristici care pot lărgi şi mai mult varietatea plăcilor de bază (IDE. 1. Acestea din urmă pot fi îndepărtate din „demonstraţie” fără a avea un impact asupra concluziei. VE. GT2. În afară de seriile ATI (numerotate de la 9200 la 9800 şi de la X300 la X850) şi GeForce (de la 5100 la 7800) trebuie să acordăm atenţie şi sufixelor (SE. şi anume procesorul.. preţuri colosale şi performanţe nu cu mult mai mari decât cele ale memoriilor cu frecvenţe mai mici dar latenţe strânse. În cele ce urmează vom încerca să explicăm în ce fel un sistem de calcul se transformă dintr-un standard într-un unicat. PCI Express. Placa video . fiindcă altfel ar rămâne fără pasiunea care îi motivează. Avem de-a face cu o gamă aşa de diversificată de produse încât încercarea de a da consistenţă rezultatelor ce măsoară performanţa unui sistem informatic se transformă într-o luptă cu morile de vânt. slot AGP.cu denumiri create în mod special pentru a suna frumos şi cu caracteristici reale ascunse de către producător mai bine decât chipul femeilor din Afghanistan. o chestiune fără sens şi prea vagă pentru a fi discutată. Un calculator poate fi definit în termeni vagi ca fiind alcătuit dintr-o unitate centrală şi periferice. AM2 etc). Bineînţeles că există şi excepţii. motorizată de chipset-uri la fel de diverse (Intel. BTX. se pare. 939. la rândul ei. Am ajuns şi la componenta care părea să aibă o descriere mai simplă însă este. micro-ATX. Memoriile . numărul şi varietatea de motoare grafice existente în prezent simultan pe piaţă fac genomul uman să se înverzească de ciudă. S-ATA II. obicei „prins” repede de către producători şi care este exploatat la maximum. numărul de porturi USB. Unitatea centrală este alcătuită. dimensiunea cacheiii . S-ATA. etc.

ne lovim de o întrebare de 100 de puncte: având în vedere toate aceste diferenţe care fac ca două sisteme să nu poată fi comparate obiectiv. Încă mai mult. mai ales luând în considerare existenţa altei variabile care poate afecta puternic modul în care se comportă un calculator: software-ul? De ce software-ul? Fiindcă un calculator fără un sistem de operare este inutil. Ergo.000 de puncte în PCMark 05. au apărut şi jocuri murdare (driver care detectează prezenţa unui program de benchmark şi îl „minte” pentru a obţine scoruri mai mari). care este cel mai bun program de benchmarking? Răspunsul amar şi evident este: nici unul. Sempron 2500+ Palermo sau Celeron D315…. au apărut contestaţii. răspunsul corect este: cea mai bună măsură a performanţei unui sistem este utilizatorul acestuia. folosind un algoritm uneori obscur şi complicat. iar dacă sunt un mega-super-hiper pretenţios.. Avem Athlon 64 X2 4000+ sau Pentium 4 640+. denumiri teribile şi confuze.ului. cantitatea şi tipul resurselor consumate de către alte produse software instalate etc. „călcâiul lui Ahile”. De fapt. Ca urmare. soluţia a venit tot din partea entuziaştilor: să măsurăm întregul pe bucăţi! Au apărut testele axate pe măsurarea performanţelor procesorului. monitorul. memoriei. În sensul că dacă mie îmi este de ajuns sistemul X. unităţilor optice. aceleaşi teste. Cu atâtea posibilităţi de a combina componente de bază. La această „supă primordială” se adaugă şi alte componente (sursa de alimentare. degeaba râd alţii de mine că nu scot nici 1000 de puncte în 3DMark 05. se ridică încă o întrebare: este un benchmark o soluţie sigură de măsurare a performanţei unui sistem de calcul. La final. Dar cine se poate lupta cu spiritul de competiţie al omului? iv . alte componente interne opţionale) care pot „face diferenţa” afectând pozitiv sau negativ performanţa sistemului. efectuate succesiv pe acelaşi sistem sau pe sisteme absolut identice. a apărut o întreagă industrie bazată pe testarea performanţelor unui sistem faţă de altul. este un sistem cu performanţă condiţionată de o mulţime de factori suplimentari: versiunea şi calitatea driverelor. un mouse. fiindcă este la fel de subiectiv ca şi un soft de testare. reprezentat în acest caz prin expresia „scorul meu e mai mare ca al tău!”. un conglomerat de linii de cod care. Dar înainte de sistemul de operare şi lucrând în strânsă relaţie cu componentele hardware se află BIOS-ul.. apoi au apărut testele care verifică fiecare componentă din punct de vedere al performanţei şi. Toată această „goană după aur” continuă să fie alimentată de spiritul de competiţie tipic uman. satisfacţia unui utilizator nu este egală cu cifra afişată ca rezultat de respectivul program de testare. poate transforma un iepure în broască ţestoasă. Iar un calculator cu un sistem de operare. dau rezultate diferite (şi ne referim aici la diferenţe cuprinse între 1% şi 3%). modul în care sistemul de operare „ştie” să lucreze nativ cu anumite componente. tipul şi numărul de instrucţiuni. tot nemulţumit rămân. rezultatul testelor este nicicum altfel decât neconcludent. pot să am 15. o tastatură. generează un scor final. plăcii video. dimensiunea tranzistorilor. configurat incorect. hard disk-ului. Cu alte cuvinte. Ei bine. Bineînţeles că goana după procente de vânzare i-a făcut pe ambii producători să creeze coduri şi denumiri care „bagă în ceaţă” un utilizator obişnuit.

Traducere: Bench-mark = (inf) mulţime bench-mark (mulţime cu un număr minim de lucrări. deoarece este calea pe care o urmăm întotdeauna".2. Avantajele benchmarking-ului asupra companiilor: • O mai bună înţelegere asupra aşteptărilor clienţilor deoarece benchmark-ul este bazat pe realitatea pieţei estimate într-un mod obiectiv. Benchmark-ul are consecinţe care sunt dincolo de procesul însuşi: el reformează toate nivelurile companiei. adică astfel: "Calea pe care o urmăm este cea mai bună. modifică procesul de producţie. utilizată pentru evaluarea performanţelor). • O planificare economică mai bună a scopurilor şi obiectivelor de atins în companie deoarece ele sunt: centrate pe ce are loc în afara spaţiului controlat şi stăpânit.1.deoarece benchmakingul poate fi aplicat oricărui proces sau funcţii economice. Noţiuni de bază privind evaluarea performanţelor Benchmarking este un proces utilizat în management şi în particular management strategic. • O practică curentă mai bună. dardeseori este tratat ca un proces continuu în care organizaţia caută în mod permanent să-şi îmbunătăţească practicile. Benchmarkingul deschide organizaţiile către noi metode. • O mai competitivitate datorită: înţelegerii solide a competiţiei cu o puternică implicare a noilor idei de vârf în practică şi în testarea noilor tehnologii. în care organizaţia evaluează mai multe aspecte ale propriilor procese în relaţie cu "best practice" (succesul). Procedura de realizare a benchmark-ului • Identificarea zonelor cu probleme .1. idei şi mijloace pentru aşi îmbunătăţi eficacitatea. Acest proces permite organizaţiilor să dezvolte planuri despre cum să adopte aceste poveşti de succes (best preactice). Benchmark-ul organizaţiilor 1. Benchmarking-ul poate fi un eveniment de singular. Avantajele benchmarking-ului Benchmarking-ul este o unealtă de management puternică deoarece învinge "paradigmul orbului". • O mai bună creştere a productivităţii: rezoluţia problemelor reale prin înţelegerea proceselor şi a ceea ce produc ele. 1. Acestea includ: conversaţii informaţionale cu clienţii.1. şi mentalitatea angajaţilor. reformează organizarea ierarhică a companiei. cu scopul de a obţine creşteri în performanţei. producţia însăşi. angajaţii sau 5 . 1. pot fi necesare o serie de tehnici de cercetare.1. de obicei în interiorul sectorului propriu de activitate. El ajută la învingerea rezistenţei naturale împotriva schimbărilor prin demonstrarea altor metode utilizabile în rezolvarea problemelor şi demonstrează că aceste metode funcţionează fiind folosite şi de alţii.1. paradigm care poate fi rezumat la modul de gândire.

cu scopul de a stabili performanţele relative a unui obiect. găsirea celor mai bune companii pentru studiu. Acest timp este luat din timpul dedicat activităţilor curente de producţie. • Costul bazei de date de benchmarking . de exemplu.3.1. de obicei. Supravegherea este realizată. Principalele trei tipuri de costuri sunt: • Costuri cu deplasări – cheltuieli cu transportul. benchmarking-ul înseamnă rularea unui program de calculaor. 1. normal prin rularea a unui număr de testa standard sau de încercare asupra lui. de asemenea. cadouri simbolice. cum ar fi: grupul ţintă. în special în testarea compilatoarelor sau a bazelor de date de management a sistemului. controlul calităţii. şi pierderea timpului cu munca. şi software-uli. chestionare. cantitative. cazarea. Pot fi create scenarii care testează blocarea definitivă a manipulării. analiză inginerească.Evaluarea performanţelor sistemelor de calcul • • • • furnizorii. Testarea poate fi aplicată. finanţarea proiectului şi vânzarea ideilor către organizaţie în scopul obţinerii valorilor demonstrative ale procesului. cercetări de marketing. Costul benchmarking-ului Benchmarking-ul este un proces cu un cost moderat-scump. Vizitarea companiilor de succes pentru a identifica cele mai bune metode (practici) – companiile sunt de obicei de acord cu schimbul mutual de informaţii în interes comun pentru un grup de benchamark şi a împărţi rezultatele în interiorul grupului. asociaţi şi/sau consultanţi neutri. utilităţi de performanţă. Benchmark-ul este util în înţelegerea modului în care managerul bazei de dare răspunde în diferite condiţii. supravegherea companiilor pentru măsurători şi practică – companiile ating anumite procese de afaceri folosind examinări detaliate ale măsurătorilor şi practicilor utilizate pentru a identifica procese alternative şi companii de vârf. Implementarea şi îmbunătăţirea noilor practici acumulate – preluarea celor mai bune practici (metode) şi dezvoltarea planurilor de implementare care includ identificarea oportunităţilor specifice.organizaţiile ca au instituţionalizat benchmarkingul în procedura zilnică creează şi întreţin o bază de date cu best practice şi cu companiile asociate fiecărui succes. Benchmark-urile oferă o metodă de comparare a performanţelor diferitor tipuri de subsisteme în combinaţie cu diferite sisteme. vizitare şi implementare. sau a unui set de programe sau alte operaţii. Benchmarking-ului în computere În domeniul computerelor. diurna. testarea performanţelor procesoarelor la operarea în virgulă mobilă. analiza indicatorilor financiari: Identificarea organizaţiilor care sunt lideri în aceste probleme – Examinarea. pentru a proteja datele confidenţiale. Termenlul benchmark mai este de asemenea folosit de specialişti pentru a defini însăşi programele de testare. tehnici de cercetarea exploratorii. diferite 6 . supraveghere. Benchmarking-ul este de obicei asociat cu evaluarea performanţelor componentelor hardware caracteristice ale calculatoarelor. • Costuri cu timpul – membrii echipei de benchmark vor investi timp în cercetarea problemelor. 1. harta procesului.2.

nerealiste. în tip ce un procesor Intel Pentium 4 operează în general la frecvenţe mai mari decât AMD Athlon XP. prin 1980 unele compilatoare puteau detecta o operaţie specifică matematică folosită în cunoscutul benchmark în virgulă mobilă şi înlocuiau operaţia cu o operaţie matematică echivalentă care este mult mai rapidă. aceste practici sunt numite "benc-marketing". Producătorii de calculatoare au o lungă istorie în încercarea de a-şi seta (proiecta) sistemele pentru a obţine performanţe mai înalte.. Benchmark-ul "aplicaţie" rulează un program din lumea reală pe sistem. în testele de benchmark care nu se regăsesc şi în utilizarea reală. benchmark-ul sintetic ăşi are utilitatea în testarea individuală a unor componente. De exemplu. asta nu înseamnă în mod automat mai multă putere de calcul. Producătorii raportează de obicei doar benchmark-urile (sau aspecte ale acestora) care pun produsul lor într-o lumină bună. Astfel. Benchmark-urile sunt destinate a imita un anumit tip de suprasarcină pe un calculator sau sistem.1. dacă un benchmark ne oferă algoritmul cheie pentru o aplicaţie. până la mijlocul anilor 1990. putem obţine indicii privind îmbunătăţirea performanţelor. De exemplu. un procesor AMD "mai lent" din punct de vedere al frecvenţei de ceas. Este de asemenea cunioscută metoda de a denatura semnificaţia benchmark-urilor.2. când arhitecturile RISC1 şi VLIW2 au evidenţiat importanţa tehnologiei compilării în atingerea performanţelor. dar şi performanţele reale ale aplicaţiilor. Benchmark-urile sunt importante în special în proiectarea micorprocesoarelor. 1. este din ce în ce mai dificilă compararea performanţelor diferitelor sisteme de calcul doar prin analizarea specificaţiilor lor. permiţând compararea rezultatelor obţinute pe sisteme diferite.2. cum ar fi hard discuri sau dispozitive de reţea. Scopul benchmarking-ului Odată cu avansarea arhitecturii calculatoarelor. caracteristica ratei de tranzacţie când sunt conectaţi mai mulţi utilizatori şi chiar efectele utilizării unei versiuni noi a produsului. De exemplu.Cap 1: Noţiuni de bază privind evaluarea performanţelor metode de încărcat date. 1. Cu alte cuvinte. Luate împreună. el va conţine aspecte ale performanţelor sensibile ale acelei aplicaţii. Benchmarking-ul "sintetic" realizează testarea prin programe special create care impun o suprasarcină componentei evaluate. poate realiza la fel de bine un test de benchmark ca un procesor Intel ce funcţionează la o frecvenţă mai mare. Benchmarkurile sunt acum frecvent utilizate de dezvoltatorii de compilatoare pentru a îmbunătăţi nu numai propriul scor. oferind arhitecturii procesorului abilitatea de a măsura şi realiza optimizarea deciziilor din proiectarea micro arhitecturală. doar pentru a pune îântr-o lumină mai bună propriile produse. Dar. În timp ce benchmark-ul aplicaţie ne dă o măsură mult mai bună a performanţelor reale ale sistemelor.2. Provocări Benchmarking-ul nu este uşor şi deseori implică mai multe runde iterative înainte de a obţine concluzii predictibile şi utile. Rulând aceasta într-o buclă mult mai strâmtă pe un simulator ciclic precis. Interpretarea datelor benchmark-ului 1 2 RISC = reduced instruction set computer VLIW = Very Long Instruction Word 7 . au fost dezvoltate teste care pot fi realizate pe diferite sisteme. o asemenea transformare era rareori utilizată în afara benchmark-ului .

Producătorii au tendinţa să publice rezultatele benchmark-ului pentru o utilizare constantă de 80% a serverelor. o Kernel normal: bucle Livermore. 1. în special datorită sensibilităţii topologiei reţelelor. benchmark-urile nu măsoară TCO3. utilizatorii apreciază predictabilitatea – servere care întotdeauna îndeplinesc sau depăşesc SLA5. scalabilitatea (în special abilitatea de a adăuga sau modifica capacităţi în mod nedistructiv). • în general. Kernel o Conţine codul cheie. • Benchmarkul rareori măsoară performanţele din lumea reală a sarcinilor mixate – rularea unor aplicaţii multiple concurenţiale într-un context multidepartamental / multi-aplicaţie. de asemenea. durata de serviciu. testare şi recuperarea în caz de dezastru. • Utilizatorii pot avea percepţii foarte diferite a performaneţei pe care benchmarkul o poate sugera.("fall off a cliff" = cădere în pantă. • benchmark-urile în general nu dau nici o garanţie pentru calitatea serviciilor. 3 4 TCO = Total cost of ownership TCP Benchmark = Transaction Processing Performance Council 5 SLA = Service Level Agreement 8 . dar standardele industriale de evaluare nu tind să măsoare puterea I/O şi design-ul mare şi rapid al memoriilor de care are nevoie serverul. server de aplicaţii.2. o În mod normal abstract de la programul actual . • Producătorii de benchmark-uri tind să ignore necesităţile pentru capacităţile de dezvoltare. Iată câteva din provocările normale ale benchmarking-ului: • producătorii au tendinţa de a potrivi specificaţiile produselor după standardele industriale. Exemple de ne-măsurare a calităţii serviciilor includ: securitatea. În particular. server de fişiere. când vârful de sarcină trece epste acest prag. disponibilitatea. dar benchmark-ul nu ia întotdeauna în calcul acest factor. şi să nu ne informeze despre ce se întâmplă la supraîncărcarea sistemului. Bgenchmark-ul tinde să accentueze un scor (din perspectiva IT). un scop unic: server de baze de date. extraordinar de dificilă. De exemplu.Evaluarea performanţelor sistemelor de calcul este. Producătorilor le place să se raporteze doar la necesităţile restrânse ale capacităţilor de producţie. • Benchmark-urile au probleme în adaptarea la lumea serverelor distribuite.3. o Unelte software CDA o Aplicaţii utilizator (MIS) 2. o situaţie total nereală. Multe alte arhitecturi de server dictează o funcţie fixă. serverul mainframe IBM excelează în sarcini mixate. Tipuri de benchmark 1. integritatea execuţiei. • Multe arhitecturi de servere se degradează dramatic la un nivel ridicat de utilizare (apropiat de 100%) . Real program o Software de procesare text. fiabilitatea. Specificaţiile TCP4 Benchmark se adresează parţial asupra costului de proprietate prin specificarea faptului că trebuie utilizată o metrică preţ/performanţă. server web. bruscă).

arhitectura calculatorului este văzută c o serie de straturi abstracte: • Hardware – este un termen utilizat în general Fig. 4. o 1.3. Arhitectura calculatoarelor În viziune clasică. el administrează resursele sistemului şi comunicarea dintre componentele hardware şi software. Acest test nu este adecvat pentru a măsura pileline-ul (conductele) computerelor. 6 o rezultatele sunt prezentate în MFLOPS Toy Benchmark/ micro-benchmark o Utilizatorii le pot programa şi utiliza pentru a testa componentele de bază ale calculatorului. întârzierea memoriei. Synthetic Benchmark o Procedura pentru programarea unui synthetic Bench mark Se culeg date statistice despre toate tipurile de operaţii de la programele de aplicaţii. dimensiune cache. cum ar fi: număr de înregistrare. o Detectează automat parametrii componentelor hardware ale calculatoarelor. I/O benchmarks Benchmark-uri paralele: sunt utilizate pe maşini cu procesoare multiple sau sisteme ce onstau din mai multe maşini. 5. Se obţine proporţia fiecărei operaţii Se scrie un program bazat pe proporţiile obţinute anterior. 6. o Tipuri de Synthetic Benchmark: Whetstone Dhrystone o Rezultatele sunt reprezentate în KWIPS (kilo whetstone instructions per second). • aplicaţii. operaţii în virgulă mobilă pe secundă 9 . • Firmware – este un software scris (ars) de producători în componentele hardware (cipuri). 6 MFLOPS = FLoating point Operations Per Second. serie de straturi.Cap 1: Noţiuni de bază privind evaluarea performanţelor 3. • sistem de operare – reprezintă un set de programe care administrează resursele hardware şi software ale unui computer. • Assembler – program utilitar folosit pentru traducerea limbajului de asamblare (care este un limbaj low-level pentru programarea calculatoarelor). • Kernel – reprezintă componenta centrală a oricărui sistem de operare al computerului. linpack benchmark (cnţine subrutine algebrice lineare scrise în limbajul FORTRAN).1: O viziune tipică asupra pentru deschierea componentelor fizice ale arhitecturii calculatorului ca o sistemului. 1.

De exemplu. dimensiunea memoriei cache. arhitectura calculatoarelor este un design conceptual şi structurarea funcţionării fundamentale a unui sistem de calcul. . 10 . o facilităţi ca multiprocesarea. modul de adresare al memoriei. performanţa calculatorului este descrisă în termeni de viteză de ceas (MHz sau GHz). Implementarea nu este considerată ca făcând parte din arhitectura calculatorului. şi include setul de instrucţiuni. ci. Scopurile proiectării Cele mai comune ţinţe în arhitectura calculatoarelor este realizarea echilibrului dintre cost şi performanţă (ex: viteză). mai concret. componente de circuit diferite sunt plasate în planul chipului sau pe placă şi sunt trasate conexiunile dintre piese. . • micro-arhitectura. nu are nimic în comun cu ISA. Ea reprezintă copia fidelă şi descrierea funcţională a cerinţelor (în special viteze şi interconexiuni) şi designul implementării pentru diferite părţi ale calculatorului. Acest proces de design. alături de alte consideraţii. cum ar fi: dimensiunea. în general.este de nivel scăzut. 1. mai degrabă. este o caracteristică organizaţională care. Costul – în general costul este menţinut constant. Odată ce ISA şi microarhitectura au fost specificate. concentrându-se pe larg asupra modului în care unitatea centrală de calcul (procesorul) realizează funcţiile sale interne şi accesează adresele din memorie. sau ecuaţii logice sau porţi logice sunt implementate la nivel de tranzistor. o mecanismul de acces direct la memorie al CPU. setul de facilităţi. Implementarea poate fi împărţită în trei părţi. greutatea. cum ar fi: o sistemul de interconectare: magistrale şi comutatoare. cunoscută ca şi organizarea calculatorului. este deseori denumit implementare. dispozitivul trebuie să fie proiectat în hardware. o controllerul de memorie şi ierarhie. Pentru procesoare. • implementarea fizică – în care circuitele sunt desenate. sau ISA. Dar. care include toate celelalte componente hardware din calculator. şi anume: • implementarea logică – în care blocurile definite în microarhitectură sunt implementate ca ecuaţii logice.3.Evaluarea performanţelor sistemelor de calcul În ingineria calculatoarelor. expandabilitatea şi consumul de energie. descrierea sistemului care implică cum părţile constituente ale sistemului sunt interconectate şi cum inter-operează ele pentru a implementa ISA. proiectare. din ingineria proiectării. determinat de cerineţele de sistem sau comerciale. întregul proces de implementare se numeşte CPU design.1. Arhitectura calculatoarelor cuprinde cel puţin trei ari categorii: • arhitectura setului de instrucţiuni. Performanţa În general.este o imagine abstractă a sistemului de calcul care este văzută de limbajul maşină (limbajul de asamblare). • designul sistemului. regiştrii procesor şi adresarea şi formatul datelor. Aceasta se referă la cicluri pe secundă ale ceasului procesorului. fiabilitatea. • implementarea circuitului – în care blocuri de viteză critică.

cum este şi IntelCore 2 pune un accent mai mare pe creşterea eficienţei energetice. dacă viteza maşinii este dată în MHz sau în GHz. Performanţa este afectată de o foarte mare plajă de alegeri făcute în proiectare – de exemplu. dacă autostrada este aglomerată (cache mic) performanţele vor fi reduse. Performanţa unui calculator poate fi măsurată folosind alte metrici. Puterea de trecere reprezintă cantitatea de muncă realizată pe unitate de timp. de asemenea. Performanţele calculatorului mai pot fi. viteza magistralei.timpul scrus de la generarea unei întreruperi de către un dispozitiv şi deservirea acelui disozitiv. iar un altul poate rula jocuri video la modă mult mai uşor. în lumea calculatoarelor capsulate. lipsa aglomeraţiei de pe autostradă este dată de mărimea cache. Drept rezultat.Cap 1: Noţiuni de bază privind evaluarea performanţelor de multe ori această măsură este greşit înţeleasă. Calculatoarele care controlează maşini (calculatoarele de proces) necesită. şi costul va fi alocat proporţional pentru a asigura acest lucru. producătorii sau îndepărtat de măsurarea performanţelor prin măsurarea frecvenţei procesorului. Consumul de energie Consumul de putere este un alt criteriu de design. Astfel. Designul procesoarelor moderne. o latenţă de întrerupere scăzută. măsurarea unei maşini înseamnă mai multe măsurători. ceea ce creşte dramatic viteza de execuţie a unui program. cu atât mai mare este necesarul de cache. latenţa de întrerupere . Latenţa este timpul dintre începutul procesului şi terminarea lui. Cu cât viteza este mai mare. Sunt două tipuri principale de viteză: latenţa şi puterea de trecere (throughput). disponibilitatea memoriei şi tipul şi ordinea instrucţiunilor din programul care rulează. deoarece o maşină cu o frecvenţă de ceas mai mare nu este obligatoriu să atingă performanţe mai înalte. dependente de domeniul de aplicaţie. eficienţa energetică a crescu ca importanţă. De exemplu. Consumul de energie a devenit important în sistemele server şi cele portabile. Drept analogie să luam traficul auto. Nu contează cât de mare este viteza unei maşini. 11 7 . Eficienţa energetică poate fi deseori tratată pentru performanţă sau eficienţă economică. Benchmarking-ul încearcă să ia în considerare toţi aceşti factori în procesul de măsurarea a timpului de execuţie a unei serii de programe de test. Latenţa de întrerupere7 este garantarea timpului maxim de răspuns a sistemului la un eveniment electronic (ex: când HDD termină de mutat datele dintr-un loc în altul). de obicei. Forma exactă a unui sistem de calcul va depinde de constrângerile şi scopurile pentru care va fi optimizat. rata de transfer a datelor va fi constantă pentru toate părţile sistemului. Schema generală a optimizării este de a căuta costurile diferitor părţi componente al calculatorului. Procesoarele moderne pot executa mai multe instrucţiuni pe un ciclu de ceas. Aceste calculatoare operează în timp real şi produc eşec dacă o operaţie nu este terminată întrun anumit interval de timp. Cu toate că benchmark-ul ne dă puterea. adăugarea de cache face latenţa mai proastă (lentă) dar creşte puterea de trecere. Un alt factor care influenţează viteza este mixarea unor unităţi funcţionale. un sistem poate realiza rapid aplicaţii ştiinţifice. Într-un sistem de calcul echilibrat. alături de performanţă. el nu ne poate ajuta în alegerea unui calculator. măsurate prin dimensiunea memoriei cache. De cele mai multe ori. Odată cu creşterea densităţii de energie în circuitele numerice moderne datorată creşterii numărului de tranzistori din chip. eficienţa energetică a fost şi rămâne principala ţintă în proiectare.

fiecare având rolul său. placa de bază. puntea de nord şi cea de sud (evident că nu există nici o legătură cu punctele cardinale. Memoria nu face altceva decât să stocheze temporar informaţii necesare celorlalte echipamente. Evaluarea performanţelor plăcilor de bază 2. controller-ul de memorie este circuitul care „dă viaţă” memoriei. Ea joacă rol de arbitru şi direcţionează fluxurile de date între procesor şi memorie. Placa grafică deţine un chip principal ce efectuează operaţii similare dar optimizate pentru domeniul grafic. Sau altfel spus. însă numărul celor folosite într-o anumită perioadă a evoluţiei PC-urilor este relativ mic. fiind format de obicei din două chip-uri independente (de aici denumirea de chipset = set de chip-uri). Definiţii de bază: chipset-ul Chip-ul reprezintă denumirea pentru un circuit integrat. Mulţi vor considera că singurul ei rol este acela de a lega componentele între ele. Plăcile de bază: funcţionare. construit pe bază de siliciu. ce poate fi ori de execuţie a anumitor operaţii. care coordonează toate activităţile. Putem spune că placa de bază este un controller general. istorie 2. nordul şi sudul fiind alese pentru a sublinia poziţiile opuse pe care le au aceste chip-uri. De exemplu. toate înglobează unul sau mai multe astfel de chip-uri. Nimic nu poate funcţiona „pur şi simplu”. ori de memorare a unor date.1. aşadar ce nevoie mai avem de chip-urile prezente pe ea? În primul rând. Un astfel de echipament poartă numele de controller. memoria. neexistând nimeni care să exploateze posibilităţile oferite de ele. placa de bază nu este pur şi simplu un element de legătură ci componenta principală a unui sistem. placa de sunet. 12 . Fiecare dintre ele are un rol bine determinat. rol care depinde de la chipset la chipset dar există multe elemente comune între diferitele modele. placa grafică. Numărul tipurilor de chipset-uri apărute de-a lungul istoriei este foarte mare. de obicei temporară. este nevoie de o componentă „supremă” care să ştie să folosească resursele celorlalte componente dintr-un PC. aproape simetrice faţă de centrul plăcii). care are un rol bine definit în funcţionarea unui echipament electronic. memorie şi hard disk. Ele poartă numele de northbridge şi southbridge (aceasta în ciuda încercării unor companii de a le schimba aceste nume deja încetăţenite). funcţia procesorului este uşor de înţeles: execuţia propriu-zisă a operaţiilor necesare desfăşurării activităţilor unui computer.1. Procesorul. al cărei rol este mai greu de înţeles. diferitele segmente ale ei oferind funcţia de controller local. (placă de bază pentru procesoare 486) (placă de bază modernă: Epox 4PCA3+) Controller-ul principal al plăcii de bază este denumit chipset. procesor şi tastatură şi altele asemenea.2. Am ajuns la placa de bază.1. atât 2D cât şi 3D. fără el minunatele memorii DDR PC3200 vor fi alimentate cu energie şi nimic mai mult. Spre exemplu.

rezultă faptul că viteza sa a fost diminuată cu un procent total nesemnificativ. cu portul AGP şi/sau PCI Express (dacă cel puţin unul dintre ele există) iar southbridge-ul cu tot ce înseamnă periferic: unităţi de stocare (porturile IDE şi cel de floppy). FireWire. Producătorii de chipset-uri se luptă în această pseudo-competiţie a bus-urilor. pe de altă parte. unele plăci chiar se numesc controllere şi îndeplinesc funcţia de suport pentru unele componente externe pe care placa de bază nu le cunoaşte. şi 13 . care este de regulă egală cu cea a bus-ului PCI (133 MB/s). Mai mult. Plăcile PCI sunt. un fel de controllere. o simplă placă PCI poate îndeplini sarcina. vom vorbi despre modelul clasic de chipset. Această primă parte a capitolului intenţionează. arată bine pe hârtie. preluarea semnalului din linia telefonică (modemul) sau prelucrarea semnalului TV (TV tuner-ul). format din northbridge şi southbridge. fiind considerat un dispozitiv obişnuit. pe de o parte. în primul caz pentru că unele chipset-uri sunt de fapt simple chipuri (nordul se contopeşte cu sudul). componente ce îndeplinesc anumite sarcini standard: northbridge-ul este răspunzător de comunicarea cu procesorul. iar în ultimele cazuri pentru că schimbarea forţată a denumirilor de către producători (un exemplu fiind Intel) este întemeiată şi relevantă. ele fiind răspunzătoare de activităţi conexe. recent depăşindu-se 1 GB/s. fiecare componentă a sistemului trebuie „controlată” de cineva.) Spre exemplu. În realitate. (Vom vedea mai târziu ce este un bus. mai există situaţia în care controller-ul nu este nici integrat în chipset-ul plăcii de bază. reţeaua sau sunetul. la rândul lor. la KT266A ea este (cu ajutorul tehnologiei V-Link) de 266 MB/s iar în cazul lui KT400 la 533 MB/s (V-Link 8x). maxim) dacă există limitarea de 133 MB/s. de el depinzând practic performanţa sa. Pentru început. Sau. cum ar fi emiterea de sunet în boxe (plăcile de sunet). vom parcurge chipset-urile prezente în epoca modernă a calculatoarelor. dacă hard disk-ul doreşte să transfere 150 MB/s într-o situaţie dintr-o mie şi nu-i pot fi satisfăcuţi decât 133 MB/s. comunicarea dintre nordul şi sudul chipset-ului VIA KT133A este realizată la viteza bus-ului PCI. Aceasta înseamnă că fluxul de date nu poate depăşi această limită. insistând pe perioada ultimilor 5-6 ani şi exemplificând acolo unde este cazul cu modele de plăci care au rămas cu adevărat în istorie. Comunicarea dintre cele două componente principale este realizată la o viteză maximă predefinită. cum ar fi cea USB. el este pur şi simplu integrat pe placă. numărul lor fiind de ordinul miilor. să facă lumină printre utilizatorii de calculatoare care nu cunosc principiile funcţionării plăcilor de bază moderne şi nici nu sunt la curent cu ultimele evoluţii de chipset-uri şi. sub forma unui chip. eventual multiplicată de un număr de ori. nici prezent sub forma unei plăci suplimentare. cu memoria. dacă placa de bază nu deţine integrat suportul pentru interfaţa FireWire. Spre exemplu. Cum o istorie a modelelor de plăci de bază este inutilă şi practic imposibil de realizat. Northbridge-ul este componenta principală a chipset-ului. necesarul fiind mai mare decât limita într-un număr infim de situaţii. deci degeaba aveţi un hard disk Serial ATA cu un transfer de 150 MB/s (iarăşi. fiind prezent un singur integrat principal pe placa de bază ce joacă dublu rol. ataşat adesea la bus-ul PCI. aceste limite nu influenţează aproape deloc performanţa unui sistem. să ofere pasionaţilor o scurtă istorie a acestui domeniu. După cum aţi putut observa. slot-urile PCI şi ISA şi interfeţele externe. Un controller de memorie bun poate oferi mai multă viteză. northbridge şi southbridge chiar dacă ele nu sunt 100% corecte.Cap 2: Evaluarea performanţelor plăcilor de bază Voi folosi în continuare denumirile de chipset. Întradevăr.

el variază între 100 şi 200 MHz.1 GB/s. el fiind integrat în procesor. 800 şi 1066 MHz virtuali în loc de 100. precum este cazul procesoarelor din familia AMD64. AGP 8x. Acest limbaj. cum este şi în cazul de faţă: saltul de performanţă de la KT266 la KT266A este mai mare decât în cazul comparaţiei KT266A . în funcţie de tipul acesteia. egală cu dublul frecvenţei PCI. Bus-urile AGP şi PCI Express reprezintă a treia sarcină a northbridge-ului. Athlon 64 (Socket 754 şi 939) şi exemplele pot continua. de unde rezultă performanţe mai bune. Frecvenţa celui AGP este de 66 MHz. în funcţie de procesor. Procesoarele până la Pentium III aveau acest PSB setat la frecvenţe între 66 şi 133 MHz (nu vorbim aici de creşterea artificială. corespunzător x-ului indicator: AGP 2x. spunem că informaţia este transmisă atât pe frontul crescător cât şi pe cel descrescător al semnalului. Limbajul folosit pentru comunicare trebuie să fie comun şi. Pentru procesoarele din familia AMD K7 (Athlon. deşi ambele suportă acelaşi tip de memorie. Uneori. este vorba de tehnologia dual-channel. Există şi altă situaţie. Pentium 4 (Socket 478. adică overclocking). 200 şi 266. ultimul oferind valoarea impresionantă de 2. din cauza optimizărilor interne. practic neafectând cu nimic adevărul „palpabil”. Aici apar diferenţele fundamentale dintre chipset-uri şi de aceea există incompatibilităţi între anumite chipset-uri şi anumite procesoare. variază în funcţie de procesor dar şi de setările plăcii de bază şi se măsoară în MHz. Astfel. Deja se naşte o întrebare firească: care este viteza de comunicare dintre northbridge şi procesor? Această viteză este dată de PSB (Processor Side Bus). aceea în care specificaţiile sunt aceleaşi dar performanţele diferă: KT266A este mai rapid decât KT266. tehnică folosită şi la memoria DDR. A doua sarcină principală a northbridge-ului este comunicarea cu procesorul.Evaluarea performanţelor sistemelor de calcul aceasta ne putem da seama parţial doar privind specificaţiile. 533. găsim câteva platforme distincte: Athlon XP (Socket A). componentă care comunică cu northbridge-ul prin bus-ul AGP sau PCI Express X16. Există mai multe tipuri de controllere de memorie. AGP 4x. Să luăm nişte exemple: VIA KT266A şi KT333. altele oferă tehnici de dublare a vitezei efective (încă o dată faţă de DDR). există şi mai multe standarde în ceea ce priveşte chipset-urile. frecvenţă care este multiplicată cu 2. Orice sistem modern deţine o placă grafică cu capabilităţi 3D. Primul poate lucra cu memorie DDR la frecvenţa de 133 MHz. Pentium 4 foloseşte un mecanism asemănător prin care multiplică de patru ori PSB-ul. rezultând 400.KT333. LGA 775). afirmaţie teoretic greşită. Athlon XP. din cauza faptului că există mai multe generaţii şi mai multe companii care produc procesoare. Sunt valabile aceleaşi considerente de la comunicarea dintre 14 . 133. se numeşte bus. altele sunt dedicate special celor de tip Rambus. Unele pot lucra şi cu memorie SDR şi cu cea DDR. aceste optimizări depăşesc în eficienţă forţa brută a creşterii frecvenţei. însă ea este multiplicată opţional de un număr de ori. Pentru fiecare din ele există o serie de chipset-uri care „cunosc” limbajul procesoarelor în cauză şi astfel pot dota plăci de bază corespunzătoare acestora. Duron). al doilea poate creşte viteza acesteia la 166 MHz. care permite comunicarea „pe aceeaşi lungime de undă” între orice două componente dintrun sistem. În termeni electronici. de unde rezultă o dublare a vitezei (şi nu o dublare a frecvenţei). Departamentele de marketing au profitat imediat de situaţie şi au afirmat că FSB-ul procesoarelor Athlon este de 200-400 MHz. Iar alte chipset-uri nici nu conţin acest controller.

pentru plăcile grafice au fost concepute mai multe tipuri de memorie. când corectitudinea 15 . Frecvenţa sa este de 100 MHz. toate concepute în scopul creşterii performanţelor DRAM-ului standard: FPM DRAM (Fast Page Mode DRAM). RDRAM (Rambus DRAM). WRAM (Windows RAM). cu variantele DDR SDRAM (Double Data Rate SDRAM) şi DDR2 SDRAM. X4) sunt gestionate de northbridge. SDRAM şi respectiv DDR2 SDRAM. deţin un buffer (zonă de memorie suplimentară) care depozitează informaţia înainte ca ea să fie transmisă controller-ului. aşadar necesarul efectiv este în majoritatea cazurilor mult mai mic decât cel oferit de AGP 8x. În cazul lui PCI Express. SGRAM (Synchronous Graphics RAM) şi GDDR3. la câteva fracţiuni de secundă. enumerând tipurile uzuale de DRAM prezente de-a lungul istoriei. precum benzile magnetice). printre care VRAM (Video RAM).1. până în momentul în care ea este rescrisă. memoria de tip SRAM este folosită cel mai adesea ca memorie cache pe când DRAM-ul este uzual în PC-urile moderne. memoria dinamică necesită rescrierea permanentă. EDO DRAM (Extended Data Out DRAM). în prezent impunându-se SDRAM (Synchronous DRAM). micşorarea forţată a transferului la nivelul lui AGP 2x nu scade performanţele cu mai mult de 10-30%. De acest din urmă tip ne vom ocupa în continuare. precum hard disk-urile sau CD-urile). cât şi cele destinate plăcilor obişnuite (X1. Avantajele memoriei SRAM: utilitatea crescută datorită modului de funcţionare şi viteza foarte mare.2. memoria statică păstrează datele pentru o perioadă de timp nelimitată. asemănător unui mediu magnetic. Ar mai fi de menţionat alte două elemente care influenţează viteza. De asemenea. BEDO RAM (Burst EDO DRAM). stabilitatea şi preţul memoriilor: funcţiile ECC şi Registered. 2. ele fiind variante de DRAM (primele două). datele stocate se pierd) şi . ea beneficiind în plus faţă de alte medii de stocare a informaţiilor de o viteză extrem de mare.Cap 2: Evaluarea performanţelor plăcilor de bază cele două componente ale chipset-ului. În realitate. Memoria. permiţând verificarea riguroasă a acesteia. tipuri de memorie Memoria RAM (Random Access Memory) este denumirea generică pentru orice tip de memorie care deţine următoarele caracteristici: • poate fi accesată aleator (nu secvenţial. Drept dovadă. • se prezintă sub formă de chip-uri (aşadar excludem dispozitivele magnetice sau optice. • este volatilă (la întreruperea alimentării cu energie electrică. lucrurile stau altfel: atât bus-ul X16. necesar plăcii grafice (eventual X8 în unele cazuri). În schimb. iar rata de transfer în modul 1x este similară lui AGP 1x şi dublă faţă de PCI. integrate în unele module de memorie. folosirea lor fiind justificată doar în cazuri speciale. Memoriile Registered sunt mai lente decât cele normale sau ECC şi extrem de scumpe. diferenţele constând în „stabilitatea” informaţiilor. de exemplu. Astfel. Există două tipuri principale de RAM: memorie statică (SRAM = Static RAM) şi dinamică (DRAM = Dynamic RAM). Cele ECC (Error Correction Code) deţin o funcţie specială care permite corectarea erorilor ce apar pe parcursul utilizării iar cele Registered (numite şi Buffered). optimizate pentru a fi folosite ca memorie video. dezavantaj: preţul mult peste DRAM. fiind de mii de ori mai rapidă decât un hard disk. altfel informaţiile fiind pierdute. Utilitatea memoriei RAM este foarte mare. fiind prezent în primul rând ca memorie principală a oricărui sistem.

oricine putând monta o memorie. Mai amintim de modulele SO-DIMM. RIMM (Rambus Inline Memory Module) este modelul constructiv al memoriilor RDRAM. configuraţia pinilor şi modul de lucru fiind total diferit. destinate calculatoarelor portabile. Spunem că procesorul rulează asincron faţă de PSB. însă în momentul în care procesoarele au atins frecvenţe de peste 50 MHz. În primă fază. Nu numai imposibilitatea creşterii frecvenţei memoriei a dus la 16 . totuşi. în funcţie de tip: SDRAM sau DDR SDRAM. având la bază un fel de dual-channel intern. Diferenţele de viteză dintre memorii se bazează în mare parte pe diferenţele de frecvenţe. când vine vorba de modulele în sine (plăcuţele care se introduc în slot-urile plăcii de bază).5x. A existat şi un număr limitat de modele de DIMM bazate pe EDO DRAM dar ele nu au avut succes pentru că trecerea de la SIMM la DIMM a coincis cu cea de la EDO la SDRAM. fiind necesară doar puţină atenţie. Pentium şi Pentium Pro. După perioada de început. Diferenţele de viteză dintre ele corespund perfect perioadei de glorie: dacă prima versiune era uzuală pe timpul sistemelor 286 şi 386. destulă forţă) duce întotdeauna la arderea memoriei. tensiune sau temperatură în afara specificaţiilor) ea oferă o stabilitate extrem de apropiată de perfecţiune. Ne-am referit până acum la chip-urile de memorie. s-a pus problema faptului că nu există posibilitatea fabricării (la preţuri acceptabile) de memorii la astfel de frecvenţe. setându-se astfel un raport fix între PSB şi procesor. inclusă în sisteme ca memorie de lucru. adică Dual Inline Memory Module. când chip-urile de memorie se înfigeau pur şi simplu în placa de bază. frecvenţa sa era egală cu cea a procesorului şi a PSB-ului (de ordinul zecilor de MHz). dimensiunea fizică a SIMM-ului pe 30 de pini este de două ori mai mică decât în cazul celeilalte variante. Chip-urile folosite au fost de tip DRAM. mai târziu. el oferă o lăţime de bandă de 64 de biţi. dacă ni se permite comparaţia. Numărul de pini este de 184 (ca şi la DDR SDRAM) dar asemănările se opresc aici. Numărul de pini a fost de 168 sau de 184 de pini. După cum îi spune şi numele. Denumirea de SIMM provine de la Single Inline Memory Module. arhisuficientă pentru un calculator obişnuit. primul model uzual a fost SIMM-ul pe 30 de pini. montarea modulelor SIMM era o operaţie greoaie şi necesita experienţă şi îndemânare. care deţin un număr diferit de pini: 184 pentru SDRAM şi 200 pentru DDR SDRAM.Evaluarea performanţelor sistemelor de calcul informaţiilor prelucrate şi stabilitatea sistemului este vitală. un 486 DX4 la 100 MHz avea un PSB de 33 MHz (memoria rulând şi ea la această frecvenţă) iar un Pentium MMX la 233 MHz avea un PSB de 66 MHz. avem câteva modele constructive. până la apariţia procesoarelor 80486. Odată cu modulele DIMM (şi RIMM. în primul caz cu un multiplicator de 3x iar în al doilea de 3. Urmaşul lui SIMM s-a chemat DIMM. modulul prezentând o lăţime de bandă de 8 biţi pentru prima versiune şi de 32 pentru cea de-a doua. FPM şi. care au acelaşi sistem de prindere) chinul a fost dat uitării. dublă faţă de SIMMurile pe 72 de pini. atât timp cât memoria nu este supusă unor situaţii anormale de funcţionare (frecvenţă. SIMM-ul pe 72 de pini a stat la baza generaţiei 486. urmat de cel pe 72 de pini. Astfel. Montarea inversă a unui DIMM (care necesită. Aşa că s-a recurs la un truc: s-a hotărât ca memoria şi PSB-ul să lucreze la o frecvenţă mai mică decât cea a procesorului. Să luăm cazul memoriei principale. EDO DRAM. În general. de exemplu în cazul serverelor. Practic vorbind.

urmând apoi DDR2-533 (PC2-4300). care a oscilat permanent foarte puternic. Este vorba de o optimizare a standardului DDR2 pentru plăcile grafice. la fel cum era SGRAM pentru SDRAM. S-a început cu DDR2-400 (PC2-3200). Întâmplător. Avantajul constă în posibilitatea creşterii frecvenţei mult dincolo de DDR400. denumirea de FSB are sens doar cu privire la procesoarele Pentium II. numită (cum altfel?) GDDR4. avem GDDR3 SDRAM. Vom vedea că mai târziu că situaţia s-a schimbat. iar pentru a creşte frecvenţa RAM independent de aceste două bus-uri era necesară implementarea acestei funcţii în chipset. Procesoarele cu cache-ul L2 inclus în pastila centrală au bus-urile FSB şi BSB unificate sub denumirea de PSB. o parte din modelele Pentium III (doar cele cu nucleu Katmai) şi unele variante de Athlon. care costă totuşi o avere. ajungându-se rapid la 100 şi apoi la 133 MHz (chiar şi cu păstrarea FSB-ului la 100 MHz). ci dimpotrivă: latenţele mai ridicate scad uşor performanţa. am folosit termenul de PSB (Processor Side Bus) care s-a metamorfozat în cazul lui Pentium II în FSB (Front Side Bus). nefiind ratificate). sunt lucruri total diferite. Următorul pas a fost DDR2 SDRAM. Aşadar. memoria rula sincron cu FSB-ul. fiind anticipat o nouă versiune. un standard asemănător cu DDR. un modul DDR2 nu este mai rapid decât unul DDR la aceeaşi frecvenţă. nu a mai fost atins de SDRAM dar nici exclus total.7 GB/s). controller-ul de memorie se afla în northbridge şi. standardul la care s-a poticnit DDR SDRAM (DDR533 şi următoarele sunt pseudo-standarde.Cap 2: Evaluarea performanţelor plăcilor de bază această situaţie ci şi limitările celorlalte bus-uri. DDR266 şi DDR333 sau PC1600. care dubla lăţimea de bandă a unui SDRAM. desigur. între cache-ul L2 şi nucleu. Bus-ul BSB (Back Side Bus) era cel care făcea legătura mai departe. de 166 MHz. 133 sau 166 MHz. Pentru plăcile grafice. Chiar dacă frecvenţa reală era de 100. Observaţie: Nu trebuie confundată frecvenţa PSB cu cea a memoriei. la acea vreme ISA. Ca o mică paranteză. care nu suportau frecvenţe mult mai mari decât cele standard. existând cazuri în care el a crescut de câteva ori pe parcursul unei singure luni. mult mai lentă. VLB şi PCI. Dar poate cel mai important factor a fost instabilitatea preţului la memorie. 2. corespunzător lăţimii de bandă: 1. PSB-ul fiind viteza de comunicare dintre procesor şi northbridge. Trecerea la SDRAM şi creşterea FSB-ului uzual de la 66 la 100 MHz (odată cu Pentium II Deschutes şi K6-2) a facilitat depăşirea acestei bariere. Deşi numele ar sugera dublarea vitezei. ultima realizare fiind DDR2-800 (PC2-6400). scăderea a fost.6. 266 şi 333 MHz (memoriile fiind marcate ca DDR200. Aceste denumiri au generat şi generează în continuare confuzii. ci mai degrabă neglijat datorită apariţiei memoriei DDR SDRAM. Următorul prag. la latenţe mai ridicate. PC3200) şi chiar mai sus. PC2100 şi PC2700. Ulterior s-a ajuns la 400 MHz (DDR400. FSB-ul fiind bus-ul care lega chipset-ul plăcii de bază de acest cache. frecvenţe mai mari. termenul de FSB a fost introdus special pentru procesoarele al căror cache level 2 era extern procesorului. poate şi datorită faptului că această frecvenţă corespunde dublului frecvenţei bus-ului PCI şi egalului frecvenţei bus-ului AGP (care a apărut mai târziu). dar care permite. amatorii de overclocking dezlănţuindu-şi pasiunea odată cu module DDR533 (PC4200) sau chiar DDR625 (PC5000). 66 MHz a fost un prag greu de trecut pentru memorie.1 şi respectiv 2. toate având la bază platforma Slot 1 (pentru Intel) şi 17 . tot întâmplător. memoria se comporta aproape identic cu una la frecvenţă dublă şi de aceea au fost încetăţenite frecvenţele improprii de 200.

AGP etc Revenind la începuturi. nu are FSB. trebuie să menţionăm în final şi un alt tip de memorie: ROM (Read Only Memory). Ar putea fi asemănat şi cu un driver. ISA era destinat plăcilor de extensie (plăci grafice. EPROM (Erasable Programmable ROM) . elementul care face posibilă comunicarea dintre un program şi o componentă hard. ce consta (fizic vorbind) într-o extensie la vechiul ISA.Evaluarea performanţelor sistemelor de calcul respectiv Slot A (pentru AMD). AGP. Standardul s-a păstrat până aproape de zilele noastre. dar BIOS-ul lucrează la un nivel „mai low-level”. MCA a eşuat din cauza politicii IBM foarte restrictive. la prima vedere. Serial ATA şi altele. s-a impus versiunea pe 16 biţi a lui ISA. Distingem şi aici mai multe varietăţi. Deşi nu intră în categoria de mai sus. Odată cu 80286 şi cu nevoile tot mai mari de viteză. Îl putem numi controller la nivel software. IBM era singurul care putea proiecta şi fabrica plăci de extensie destinate lui MCA. chiar şi azi mai putând fi întâlnite plăci ISA şi plăci de bază care să le suporte. EISA (Extended ISA) şi VLB (VESA Local Bus. voi detalia istoricul interfeţelor destinate dispozitivelor mai mult sau mai puţin periferice. PCI. Interfeţele interne: ISA. Odată cu procesorul 80386DX. Bus-ul ISA (Industry Standard Architecture) a fost inventat de IBM odată primul IBM PC. diferite de ROM-ul standard: PROM (Programmable ROM) .1. precum ISA. orice procesor inserabil într-un socket. cu alte cuvinte. calculator ce folosea magistrala de 8 biţi specifică procesorului 8088. mai apropiat de hardware şi deţine doar câteva funcţii elementare. care s-a manifestat prin incompatibilitatea bus-ului cu vechiul ISA şi prin decizia de a face acest standard proprietar. controllere de hard disk) ce se ataşau PC-ului. funcţionalitatea unei astfel de memorii este asemănătoare memoriei RAM: informaţia poate fi alterată. EISA a fost răspunsul lui Compaq la MCA. cu care era compatibil.care poate fi şi rescrisă. incompatibile între ele. Legat de EPROM şi EEPROM. este puţin forţată denumirea de ROM pentru că. ci PSB. pe care se va baza driverul. BIOS-ul (Basic Input Output System) reprezintă interfaţa dintre hardware şi software. IDE. PCI. care a evitat cele două greşeli ale lui IBM dar nu a reuşit să se impună 18 . similar unui CD-R. această memorie nu poate fi decât citită. similar unui CD-RW şi EEPROM (Electrically Erasable Programmable ROM) memorie care poate fi rescrisă inclusiv prin metode software. şi anume MCA (Micro Channel Architecture). USB. fiind în esenţă un program care traduce comenzile software-ului într-un limbaj propriu al componentei respective şi invers. După cum îi spune şi numele. în sensul că o placă de bază compatibilă 16-bit ISA suporta plăci de extensie 8-bit. s-a pus problema unui nou bus. Acest din urmă tip este folosit îndeosebi în cazul BIOS-urilor diverselor componente (plăci de bază. BIOS care este rescris în caz de necesitate (se spune că „i se face update”). şi anume adresarea pe 32 de biţi. Astfel s-au născut o serie de standarde. apărut la începutul anilor '80 .care poate fi scrisă o singură dată. Însă modul de construcţie îi oferă o viteză redusă şi o face utilizabilă doar ocazional şi în cantităţi mici. plăci grafice). care să folosească din plin posibilităţile acestuia. VLB. nu şi scrisă prin metode obişnuite. Aşadar.3. VESA = Video Electronics Standards Association). 2.

odată cu dublarea lăţimii bus-ului la 2x şi respectiv 4x.5V la 0. De remarcat faptul că. utilizat doar în servere. acesta a devenit un standard utilizat şi în prezent. urmaşul lui PCI s-a numit AGP şi a fost (şi este) destinat doar plăcilor grafice. numite AGP 2. care este comun tuturor northbridge-urilor. tehnici speciale permiţând atingerea unei frecvenţe virtuale de opt ori mai mari decât AGP-ul standard (numit şi AGP 1x). Însă cu plăcile PCI „simplu” nu există probleme. Standardul este total incompatibil cu oricare altul. au fost create noi standarde. dar aceasta poate fi într-o cantitate mai mică decât este necesar. Pentru calculatoarele obişnuite. efectul fiind similar. AGP 4x şi AGP 8x. în epoca jocurilor 3D. oferea avantajul utilizării întregului potenţial al procesoarelor 386 şi 486 dar nu şi al lui Pentium. atât fizic cât şi logic. Deşi a devenit popular în epoca lui 486. impunerea sa datorându-se exclusiv nevoii tot mai mari de creştere a numărului de cadre pe secunde afişate în jocuri. ca în cazul lui PCI-64. Spre exemplu. dar care nu au adus mult-aşteptatul spor de viteză din simplul motiv că ele nu erau necesare. crescând substanţial performanţa în jocuri. 19 . de la 33 la 66 MHz. Tehnologia se află abia la început şi nu este foarte populară. Astfel. în care pot fi introduse unele plăci de extensie practic absente de pe piaţă. Ele modificau diverse aspecte interne (şi relativ puţin importante) ale bus-ului şi scădeau tensiunea de alimentare de la 3. care deţinea un bus extern de 64 de biţi. ele putând coexista cu PCI Express (de fapt.0 şi AGP 3.8V . compatibile cu AGP. În loc să se crească lăţimea de bandă. tehnica este inferioară folosirii de către placa grafică a propriei memorii. majoritatea plăcilor de bază compatibile PCI Express oferă câteva slot-uri X1 sau X4. Deşi în prezent utilitatea sa este legată exclusiv de plăcile grafice.practic plăci de bază noi.5V şi respectiv de la 1. plăcile VLB aveau un conector suplimentar faţă de ISA). realizându-se aşa-zisa texturare AGP. nu înainte de a deschide calea lui PCI-64. de ele este răspunzător southbridge-ul. a fost introdusă posibilitatea ca chip-ul video să poată accesa memoria sistemului ca memorie video. Chipset-urile PCI Express nu sunt. odată cu introducerea de către Intel a bus-ului PCI (Peripheral Component Interconnect) VLB a decăzut ca importanţă datorită problemelor de compatibilitate cu nou-apărutul Pentium şi a altor detalii minore care adunate au determinat impunerea lui PCI pe piaţă.o sursă de incompatibilitate între unele plăci grafice şi de bază. nefiind altceva decât o opţiune pentru entuziaşti. Avantajele lui AGP în faţa lui PCI sunt numeroase şi legate în special de plăcile grafice. ce lucrează în modul PCI Express X16 (de 16 ori mai rapid decât AGP-ul standard). o facilitate multiGPU. AGP (Accelerated Graphics Port) a sosit mai târziu. fiind mult mai rapid faţă de predecesori şi având compatibilitatea cu ISA asigurată (fizic. atât cu controller AGP cât şi cu PCI Express).3 la 1. Ultima realizare în domeniu se numeşte PCI Express. A urmat bus-ul VLB ce a fost conceput pentru plăcile grafice dar a fost folosit şi pentru diverse controllere. Acesta. bazate pe alte chipset-uri decât cele cunoscute. Desigur. Un alt avantaj al noului bus constă în posibilitatea ca plăcile grafice NVIDIA (şi în curând şi ATI) să lucreze în mod SLI (Scalable Link Interface). Extinderea bus-ului AGP a dus la crearea standardelor AGP 2x. este posibilă existenţa a două plăci grafice în sistem care să lucreze în mod cooperativ. motivul fiind încercarea producătorilor de a impune noul standard în defavoarea celui vechi.0. fiind necesare controllere noi pentru a-l gestiona . ca şi celelalte trei tentative de bus-uri pe 32 de biţi (deloc sau doar parţial reuşite). în general. Însă cum necesităţile vremii nu au cerut altceva decât un simplu bus PCI pe 32 de biţi.Cap 2: Evaluarea performanţelor plăcilor de bază datorită preţului mare practicat şi a performanţelor nu tocmai strălucite. a fost crescută frecvenţa.

nu poate fi utilizat decât de componente care nu necesită viteze mari. Iniţial.4. locul său fiind preluat de alte standarde incompatibile cu acesta. datorită vitezei scăzute. hard disk şi unitate optică. unităţile de bandă dar şi altele mai exotice.compatibil pin la pin cu PS/2. de la mouse până la DVD writer. scanner-ele. Un nou standard.Evaluarea performanţelor sistemelor de calcul 2. Reţinem că atât mouse-ul cât şi tastatura (conectată până atunci prin standardul AT . în speţă plăcile de extensie. el devenind uzual abia odată cu introducerea în 1997 a form factor-ului ATX. de la apariţia PC-ului încoace. Interfeţele externe: serial. Porturile serial şi paralel sunt prezente în practic toate sistemele. este posibilitatea de transmitere a datelor la distanţe mult mai mari decât portul paralel. Pe lângă aceasta. Portul serial. modem. scanner etc). însă nici un alt standard nu a reuşit să se impună puternic din cauza costurilor ridicate. fiind utilizate în principal pentru cuplarea unor dispozitive periferice externe (mouse serial. TV tuner. EPP a oferit compresie/decompresie în timp real. paralel. porturile externe permit ataşarea de dispozitive exterioare PC-ului care îndeplinesc diverse funcţii. Acesta a fost introdus de IBM în 1987. utilizarea procesorului fiind minimă. nu putem pune o relaţie comparativă între portul serial şi paralel pentru că ele au fost concepute pentru utilizări diferite. precum webcamurile. Ambele se află în declin. a apărut din dorinţa de a se oferi o interfaţă universală. USB etc Pe lângă interfeţele care permit conectarea componentelor interne. cuprinzând în primul rând imprimantele. cu excepţia celui PS/2 . ceea ce a constituit un ajutor remarcabil pentru dispozitivele ce necesitau rate mari de transfer. pe numele său USB (Universal Serial Bus). Pentru a se evita inconvenientul a fost introdus standardul ECP (Extended Capabilities Port) care lucra în aşa-numitul mod DMA (Direct Memory Access). un eşec total pentru Big Blue. Însă odată cu necesităţile tot mai mari de la sfârşitul anilor '90. Concluzionând. faţă de cel paralel care transferă datele pe opt linii paralele (byte cu byte).1. Diferenţele dintre ele privesc modul de funcţionare: portul serial transmite date pe un singur fir (bit cu bit). imprimantă. deci costurile cablurilor sunt mai reduse. de cele mai multe ori ignorat. Un avantaj al său. portul paralel a început încet-încet să fie dat uitării. Însă Intel s-a folosit de standard. dar de formă mai mare) se leagă în prezent la computer prin acest port. precum mouse-ul sau modem-ul. Nevoia tot mai mare de viteză a adus un nou impediment privind creşterea ratei de transfer: utilizarea prea mare a procesorului sistemului. Perifericele conectate la portul paralel sunt diverse. Putem adăuga şi numărul de fire de transmisie mai mic (3 în cazul portului serial faţă de 19 sau 25 pentru paralel). despre care vom vorbi mai târziu. 20 . odată cu EPP (Enhanced Parallel Port). odată cu seria de PC-uri numită PS/2 (Personal System/2). problema a dispărut iar viteza maximă atinsă a crescut de la 150 KB/s la 2 MB/s. portul paralel era capabil de transmisie unidirecţională (într-un singur sens). aceasta datorită limitării standardului SPP (Standard Parallel Port).utilizat azi pentru tastatură şi mouse. până la interfaţă externă de sunet (similară unei plăci de sunet dar situată în exteriorul PC-ului). capabilă să conecteze la PC orice fel de dispozitiv. imprimantă. de la mouse.

ESDI (Enhanced Small Device Interface. fără a fi necesară o repornire. scopul lui FireWire este diferit: el doreşte să conecteze la computer dispozitive ce au nevoie (şi aveau nevoie încă de la acea dată) de viteze foarte mari. Prin intermediul acestuia. Sony adoptând rapid standardul. ce oferea o rată de 21 . standard introdus de către Apple la mijlocul anilor '80 şi oferit apoi către IEEE (Institute of Electrical and Electronics Engineers) pentru standardizare. telefoane mobile. Soluţia la problemă a fost oferită de USB 2. devenind astăzi ceva doar cu puţin mai exotic decât USB (nefiind prezent pe orice placă de bază. acest institut lansa specificaţiile sale oficiale. care permite schimbul de date wireless („fără fir”) cu alte echipamente ce au incorporată o astfel de tehnologie (imprimante.. Încet-încet. este IrDA (Infrared Data Association). pe parcursul câtorva ani el progresând lent din cauza performanţelor reduse ale dispozitivelor conectate la acest port. de unde şi numele alternativ. precum camerele video digitale. Cum subiectul este destul de complex pentru a fi detaliat aici. dar şi de produse destinate publicului larg. fiind folosit de dispozitive real-time de editare audio/video. În prezent. dar încă exotic pentru utilizatorii obişnuiţi. Tot la capitolul interfeţe wireless mai merită menţionat standardul Bluetooth. În prezent. Totuşi. dar mai rar folosită. numit şi IEEE 1394. webcam-uri. fapt datorat limitării transferului la 12 Mbps. printre ele numărându-se MFM (Modified Frequency Modulation. unui CD-ROM 40x îi era imposibil să se conecteze la portul USB pentru că ar fi avut nevoie de un transfer de 6 MB/s (48 megabiţi pe secundă). telefoanele mobile. PC-urile. Mai multe sub-standarde au respectat specificaţiile ST-506. Spre exemplu. dar cele high-end sigur îl deţin). pe distanţe scurte sau medii. care costă mai puţin şi oferă aproape aceleaşi facilităţi. FireWire a câştigat popularitate. în prima sa versiune (12 Mbps) era doar în proiect. majoritatea plăcilor de bază suportă interfaţa USB 2. Aceasta în perioada în care USB. relativ folosit. unităţi optice de stocare sau hard disk-uri portabile. fiind dezvoltat în anul 1980 de către Seagate. trecem la capitolul următor. imprimantele şi alte dispozitive. Un port cu funcţii mai avansate şi cu o vechime mai mare este FireWire.0. 200 şi 400 Mbps. camere digitale etc) sau chiar cu un alt PC. USB a fost destinat doar dispozitivelor lente (totuşi mult mai rapide decât portul serial. Totuşi. Altă interfaţă întâlnită pe majoritatea plăcilor de bază. utilizarea sa este destul de largă. Primul standard.1. ce creştea densitatea datelor cu 50% şi era compatibil cu MFM). ce prevedea viteze de până la 480 Mbps (60 MB/s.. versiunea originală).Cap 2: Evaluarea performanţelor plăcilor de bază Interfaţa este plug&play şi hot-swappable. oferind trei rate de transfer posibile: 100. care era limitat la câteva sute de Kbps). 2. cei mai mulţi utilizatori preferă soluţiile comune (dacă ele există). deci şi un ipotetic CD-ROM 400x ar face faţă). pot fi conectate folosind undele radio. a doua versiune a standardului. laptop-uri. PDA-urile.5. ceea ce înseamnă că orice dispozitiv va fi recunoscut automat de sistemul de operare şi respectiv va putea fi conectat sau deconectat „din zbor”. RLL (Run Length Limited. Interfeţele pentru dispozitive de stocare Interfeţele de conectare a unităţilor de disc nu au fost întotdeauna atât de rapide precum sunt astăzi. de patru ori mai mult decât limitele bus-ului. USB s-a impus foarte greu. precum scannere. PDAuri. De aceea. În 1995. introdus în IBM PC-ul original s-a numit ST-506.0 şi dispozitivele ce se conectează la aceasta sunt din ce în ce mai multe.

IDE aducea o serie de inovaţii. Schimbările palpabile au fost reprezentate de noile tipuri de cabluri. ATA-6 (UDMA100 sau Ultra DMA 5) şi ATA-7 (UDMA133 sau Ultra DMA 6.Evaluarea performanţelor sistemelor de calcul transfer foarte ridicată pentru acea perioadă) şi. posibilitatea conectării a două hard disk-uri pe acelaşi cablu în combinaţia Master/Slave.3 MB/s. IDE (Integrated Drive Electronics). legat de tehnologia SMART (Self Monitoring Analysis and Report Technology). spre exemplu. Mai departe. precum şi de eliminarea conceptelor de Master şi Slave. nu în ultimul rând. numit şi ATA (Advanced Technology Attachment). EIDE (Enhanced IDE). Este vorba de posibilitatea conectării şi a altor tipuri de unităţi de stocare decât hard disk-urile. astfel. ATA-3. numărul de fire ale cablului de date a crescut de la 40 la 80 pentru a se reduce interferenţele electromagnetice ce ar putea apărea la viteze atât de mari (fiecare al doilea fir era unul de masă. ATA-5 (UDMA66 sau Ultra DMA 4). precum şi capacităţi mai mari decât limita impusă IDE-ul standard . atât pentru alimentare cât şi pentru date (ultimul mult mai comod de folosit. ATA-4 (1998) a introdus modul Ultra DMA/33 (Ultra ATA. 100 şi respectiv 133 MB/s.6 MB/s. cu doar 7 fire). oferind. Transferul era realizat prin intermediul modului PIO (Programmable Input/Output) . numită şi FastATA sau ATA-2. Serial ATA (sau S-ATA) a fost următorul pas. în final. ci privind securitatea. viteza de transfer a crescut substanţial. EIDE şi FastATA (numite astfel de Western Digital şi respectiv Seagate) fiind versiuni ale standardului ATA-2 ce cuprind şi specificaţiile ATAPI (Advanced Technology Attachment Packet Interface). standardul Ultra DMA/100 a oferit şi AAM (Automatic Acoustic Management). O extensie a lui IDE. posibilitatea detectării automate în BIOS a parametrilor hard disk-ului. 4x. introdus în 1997. procesorul fiind degrevat de această sarcină. de obicei mai mult decât puteau oferi hard disk-urile acelei perioade. marketing similar lui AGP 8x vs. Aşadar. denumirile nu sunt perfect sinonime.în acest proces fiind angrenat şi procesorul . UDMA33 oferind un maxim de 33 MB/s. începând cu Ultra DMA/66. un Power Management extins (micşorându-se astfel consumul de putere) şi. nu toate unităţile suportă AAM. ce permitea monitorizarea permanentă a stării de sănătate a hard disk-ului.504 MB. fiind posibilă introducerea/eliminarea hard 22 . totuşi. „sărit” de unii producători) nu au făcut decât să crească rata maxim de transfer la 66. nu a adus îmbunătăţiri legate de viteză. Totodată. ESDI şi mai ales IDE au integrat pe hard disk o mare parte din funcţionalitatea controller-ului acestuia (şi e uşor să ne dăm seama de acest lucru privind partea electronică a oricărui hard disk modern). oferea la mijlocul anilor '90 rate de transfer de până la 16. fiind mai subţire. prin care controllerul IDE comunica direct cu memoria. Spre deosebire de standardele iniţiale. pentru ecranare). fiind practic o versiune foarte sofisticată a lui RLL. precum unităţile optice (doar de tip CD-ROM la acea vreme). Rata maximă de transfer era de 8. Un alt avantaj remarcabil este hot-swapping-ul.sau DMA (Direct Memory Access). În plus. UDMA33 sau Ultra DMA 2). o facilitate care permite reducerea zgomotului emis de hard disk prin reducerea nesemnificativă a performanţelor. De fapt. fiecare hard disk având canalul său dedicat. renunţându-se la îmbunătăţirea modului PIO. de bandă sau de dischete cu capacităţi mari.

daisy-chaining etc) şi nu afectează în mare măsură utilizatorul obişnuit. În finalul acestui capitol. dar cele cu 754 de pini sunt limitate la un controller de memorie single-channel. modulele non-registered (unbuffered) fiind mult mai ieftine. servere şi. Avantajele sunt numeroase (viteză mai mare. începând cu mijlocul anilor '80 . Cablul de date este asemănător celui IDE. practic. el fiind azi integrat pe placa de bază. SCSI (Small Computer System Interface . Standardul ATA a fost redenumit retroactiv în Parallel ATA (sau P-ATA).2. Introducere Platforma Socket 939 nu poate fi decât atrăgătoare. ocupare minimă a procesorului în timpul transferului. Testarea plăcilor de bază Socket 939 2. un standard foarte utilizat în workstation-uri. posibilă printr-un upgrade la un procesor mai rapid fiind imboldul care goleşte magazinele de puţinele plăci cu 939 de pini.Cap 2: Evaluarea performanţelor plăcilor de bază disk-ului fără a opri PC-ul. Procesoarele sunt practic identice. Denumirile provin chiar de la modul în care sunt transmise datele: P-ATA foloseşte mai multe „căi” pentru transmiterea în paralel a informaţiilor (de aici şi numărul mare de fire necesar). dar se aşteaptă adoptarea în viitor a lui Serial ATA III pentru 600 MB/s. pe când S-ATA efectuează o transmisie serială. performanţa actuală dar mai ales cea viitoare. Platforma Socket 939 este una high-end. AMD a lansat primele procesoare AMD64 odată cu platforma Socket 940. în două silabe şi cu accent pe „a”) a devenit. Cu alte cuvinte. precum conectarea imprimantelor sau a scanner-elor. ce se adresează în primul rând utilizatorilor cu pretenţii mari şi în acelaşi timp cu buzunarele ceva mai pline decât ceilalţi.1. a celor S-ATA pentru mai toate modelele de plăci din ultimul an. De notat că unităţile floppy se mai pot conecta prin SCSI sau USB 2. dar se poate găsi şi separat. sub forma unei plăci de extensie ce se ataşează prin intermediul unui slot (PCI. AMD determinând astfel utilizatorii de Socket 940 să schimbe placa de bază pentru a obţine un pin în minus dar compatibilitate cu nou-apărutele modele de Athlon 64 şi Athlon 64 FX. pentru a se putea diferenţia uşor de S-ATA. însă cu numai 34 de fire. SCSI este folosit şi în alte scopuri. Orice controller P-ATA/S-ATA/SCSI poate fi integrat pe placa de bază (este cazul P-ATA. al cărei controller a trecut prin multe faze.pronunţat „scazi”. înlocuită rapid de cea 754. Dual-channel-ul oferit de pinii suplimentari (în comparaţie cu 754) readuce în prim-plan o tehnologie atât de bine 23 . în PCurile high-end. Versiunile curente sunt Serial ATA „original” (150 MB/s) şi Serial ATA II (300 MB/s). trebuie să spunem câteva cuvinte şi despre unitatea de dischete. Totuşi. Socket 939 este urmaşul lui S940.2. începând cu MFM (controller care putea gestiona atât floppy-ul cât şi hard disk-ul). modelele cu un pin mai puţin au scăpat de această limitare. de ce această schimbare? Socket 940 necesită memorii de tip registered din cauza moştenirii arhitecturii lui Opteron. ocazional. o platformă mainstream. orice hard disk normal poate fi acum folosit precum unul portabil. precum şi cazul SCSI pentru plăcile de bază de servere). Separat de ATA/IDE şi variantele sale. eventual VLB sau ISA). cel puţin pentru plăcile fabricate în ultimii 10 ani.

însă începe încet-încet să-şi resimtă bătrâneţea. plăcile cu suport AGP urmând să facă subiectul unor teste viitoare. plus alte mici detalii care fac diferenţa dar nu justifică renunţarea la un bus ce nu constituia limitarea în calea obţinerii de performanţe maxime. ce dublează lăţimea maximă de bandă faţă de prima versiune de Serial ATA (avantaj total neobservabil în practică) şi suport pentru modul SLI (doar în versiunea nForce4 SLI) cu alte cuvinte e posibilă conectarea a două plăci grafice PCI Express pentru performanţe nu chiar duble dar foarte mari. doar K8T890 fiind comparabil cu nForce4. Oricum. unite prin SLI. aşadar dacă cititorul este interesat mai degrabă de un ECS ieftin. evaluând la sânge produsele. o justificare clară. au fost punctate cu o pondere mai mare caracteristicile pe care un pasionat şi le-ar dori la placa sa de bază. În lucrare. 2. este vorba de entuziaşti. dar el nu a fost adoptat la scară largă. dotat numai cu câteva elemente esenţiale şi al cărui preţ nu trece de 50-60 de dolari.2. decât de un preţ mai mic. performanţele obţinute fiind foarte mari (la un preţ foarte mare). cele mai multe produse de pe piaţă şi toate cele testate dotate cu acesta. bus-ul AGP este încă suportat de o serie de plăci. în egală măsură. nForce3 este deja depăşit datorită suportului pentru AGP şi a lipsei unor facilităţi incluse în urmaşul său.maxim un an . cei încântaţi mai degrabă de o dotare în plus sau. ar trebui să parcurgă testul nostru cel mult din curiozitate. Astfel este lăsat în urmă un bus ce a dominat ultimii 7÷8 ani şi care a fost „izgonit” oarecum pe nedrept. în câteva luni .urmând să aibă loc impunerea plăcilor grafice PCI Express. E adevărat. destul de puţin costisitor. cum ar fi un Firewall integrat.2. NVIDIA fiind o companie care în ultima vreme a început să dea tonul pe piaţa plăcilor de bază pentru procesoare AMD. de opţiune ascunsă în BIOS care le permite un overclocking superior. În toate variantele sale („simplu”. În primul rând.Evaluarea performanţelor sistemelor de calcul gândită încât nu merita să moară: lăţimea de bandă a memoriei este dublată folosind un mic artificiu. 24 . acum putem avea din nou două plăci grafice în sistem. „complotul” marilor producători neavând. Ultra. însă numărul lor este în scădere. Calificative precum „excelent” sau „extrem” costă şi vor costa întotdeauna foarte mult. Produsele testate sunt înzestrate cu slot-uri PCI Express. în caz că se vor găsi pe piaţă în cantităţi suficiente. aparent. SLI şi eventual neoficialul 4X) nForce4 oferă o serie de facilităţi deosebite. trebuie să stabilim cine sunt utilizatorii în pielea cărora am încercat să intrăm. Chipset-ul nForce4 de la NVIDIA se pare că domină plăcile PCI Express. Modul de testare Înainte de orice. nForce3 deţine şi el o serie de funcţii inovatoare. Testul a fost împărţit în patru categorii. şi anume: • performanţă. În continuare se vor prezenta o serie de teste realizate cu placi de bază Socket 939. La fel şi K8T880 (Pro). Amintim de Serial ATA II (numai în versiunile Ultra şi SLI). precum un port FireWire sau o frecvenţă mare atinsă prin overclocking.

Testele analitice au avut o pondere mică. au contribuit cu 15% la rezultatul final. De remarcat faptul că testele 3D au contat în total cu 50% din punctaj (excludem de aici SPECviewperf care. FarCry şi Unreal Tournament 2004 (12. 25 . De aceea. fiind punctat manualul. De aceea. maxim 3%. Au fost acordate note atât comodităţii operării pe placa de bază. • testele implicite din 3DMark 2001. Mult. SPECviewperf şi 3DMark 2001. fiind necesare luni sau chiar ani pentru ca primul defect să-şi facă apariţia. a unora ce au alt scop dar care deţin şi un modul de testare a vitezei sau pur şi simplu prin cronometrarea timpului scurs între două momente între care a fost efectuată o anumită operaţie. garanţia. • copierea unor fişiere de pe o partiţie pe alta a unui hard disk Serial ATA (8%). precum şi software-ul livrat. punctajul oferit aici a fost destul de mic şi în totalitate subiectiv. • comprimarea unui film cu codec-ul XviD (8%). de aceea au contat cu 8 şi respectiv 12. Am inclus aici numărul de slot-uri şi porturi. precum şi diverselor indicii privind fiabilitatea produsului. puţin. facilităţile din BIOS (în special cele legate de overclocking).5%). Facilităţile au contat tot cu 40 de procente. luând în seamă temperaturile atinse de diversele componente de pe placă şi alte aspecte subiective. reflectă destul de bine activitatea profesioniştilor în grafică şi a gamerilor. alţii sunt factorii care ar trebui să influenţeze un potenţial cumpărător. se adresează altei categorii de utilizatori). deşi sintetice. diferită faţă de cele mai multe review-uri întâlnite în diverse reviste sau pe web. rămâne să judecaţi dumneavoastră. Performanţa a fost evaluată prin rularea mai multor programe speciale de benchmark. precum şi posibilitatea de contact online cu producătorul. Ergonomia şi construcţia. deci cu 14% la nota finală. precum şi rezultatele testelor realizate în condiţii extreme au contat cu 35% din cele 40 de procente ale facilităţilor. • construcţie & ergonomie. complexitatea interfeţei de sunet. În fine. precum şi un număr mare de produse care să fie supuse testelor.Cap 2: Evaluarea performanţelor plăcilor de bază • facilităţi. • documentaţie & service. deşi rulează în mod 3D. Astfel. în interiorul carcasei (de exemplu poziţia jumper-ilor şi a conectorilor). reunite într-o singură rubrică. Restul testelor au fost practice: • arhivarea unor fişiere cu WinRAR (8%). documentaţia şi service-ul au completat ultimele 5 procente. de 40%. • randarea unei imagini cu PovRay (8%). un rol important jucând experienţa în acest domeniu.5% fiecare) şi un test special creat în Quake3 care foloseşte procesorul mult mai mult decât testul implicit (12. Menţionăm pentru cei (ne)interesaţi de overclocking că opţiunile destinate acestei practici. Este imposibil de evaluat fiabilitatea oricărui produs hardware. Aceasta deoarece am considerat că performanţa unei plăci de bază este extrem de puţin importantă în luarea unei decizii privind achiziţionarea uneia pentru că diferenţele sunt de ordinul a 1-2%. Ponderea performanţei a fost relativ mică.5%. testul de lăţime de bandă a memoriei din SiSoft Sandra şi cel de latenţă a memoriei din ScienceMark au contat cu câte 5%.

tRAS şi Command per Clock au fost setate la minimul posibil. desigur. Stabilitatea a fost măsurată cu al cincilea test din Memtest86+1. tRP.htm 26 . Doom3). CL3 4-4-8 2T etc).4V.65V). urmată de câteva procente din testul 7. 500 MHz core. 2000 MHz. însă ştim cu toţii că diferenţele dintre plăci dotate cu acelaşi chipset. tRFC. în aşa fel încât ele să nu afecteze stabilitatea (LDT 2x sau 3x. Bank Interleave a fost şi el activat. Rareori am rulat stabil în aceste condiţii.4. dacă neglijăm factorul overclocking). Overclocking-ul a fost testat în două moduri. Fiecare placă a fost setată. un kit de memorii Corsair TwinX1024-3200XLPT ce totalizau 1 GB. Nu am rulat Prime952 pentru că procesorul nu avea prea mult motive să manifeste instabilitate. tREF sunt alte câteva setări.65V pe care o permitea BIOS-ul) . Testarea efectivă Sistemul de test a constat într-un procesor Athlon 64 3200+ (nume de cod Winchester . valorile normale fiind 9 şi respectiv 12.org/ http://www. Apoi am setat memoria atât sincron cu HTT-ul cât şi la un raport de 1:2 faţă de acesta.65V (sau cea mai apropiată valoare mai mică de 1.mersenne. alias Fatal1ty.93. de 2 GHz.9V iar dacă placa permitea setarea voltajului chipset-ului. Setările principale de memorie. Windows XP SP2.memtest. un hard disk Western Digital Caviar SE (WD800JB) de 80 GB cu 8 MB cache pe Parallel ATA. şi anume nForce4 Standalone Kit 6. De asemenea. 2. tRCD.2. Sistemul de operare. după un update al BIOS-ului (dacă exista unul mai nou decât cel cu care placa venea).2. 1000 MHz memoria). tRRD.7 SATA cu aceleaşi specificaţii. de obicei CL2 2-2-5 1T. Abit AN8 Fatal1ty (nForce4 Ultra) AN8 Fatal1ty poartă „numele” lui Johnathan Wendel. frecvenţa maximă la care rula stabil: 2550 . Placa are ca scop declarat obţinerea celor mai mari performanţe.39 şi ForceWare 66.3. Unreal Tournament. Producătorul susţine că seria Fatal1ty (deschisă cu modelul AA8XE pentru Pentium 4) 1 2 http://www.6 – 1.5 2-2-0 1T. 1. iar testele rulate pentru a evalua performanţa sunt suficient de stresante pentru acesta pentru a se bloca sau a da erori în caz de probleme. tWR. tRTW. sunt minime (desigur. în ambele situaţii scopul fiind obţinerea unui bus HTT maxim (în paşi de 5 MHz). sau chiar cu chipset-uri diferite. un gamer care la doar 23 de ani a câştigat numeroase turnee de 3D Shootere (Quake3. şi anume CAS Latency. Tensiunea procesorului a fost ajustată la 1. primele două ieşind în evidenţă prin faptul că au valori mari. de minim 7 şi respectiv 9. iar pentru evaluarea performanţei controller-ului Serial ATA am montat un Seagate Barracuda 7200. De asemenea. însă au fost şi cazuri în care am rulat în CL1. Driverele au fost cele mai noi oficiale la data începerii testării.09 microni. iar celelalte setări au fost puse la minim sau aproape de minim. tensiunea memoriei a fost urcată până la maxim 2. la maximul de performanţă pe care îl puteam obţine în condiţii de stabilitate perfectă. am realizat şi această modificare. Am setat multiplicatorul (dacă placa a permis acest lucru) în aşa fel încât frecvenţa finală a procesorului să fie cel puţin egală cu cea implicită.maximul la care putem sta liniştiţi că nu urmează o mică explozie în interiorul acestuia. o placă grafică Gigabyte GV-NX66T128D cu chip GeForce 6600 GT (128 MB. tWTR.Evaluarea performanţelor sistemelor de calcul 2. Nu am folosit programe de tip A64 Tweaker sau ClockGen pentru a efectua alte setări decât cele ale BIOS-ului sau a încerca creşterea HTT-ului direct din Windows. crescând valoarea la maxim.0. 512 KB L2 cache.org/freesoft. tRC.2600 MHz la 1.

făcând referire. ceea ce nu justifică cele două porturi prezente pe bracket. Aşadar.0/FireWire. Să vedem ce surprize ne mai rezervă. Cele două cutii incluse în pachet. întâlnit de exemplu la modelul NF7. iar pentru alimentarea hard diskurilor este disponibil un convertor molex – SATA. doar culoarea roşie trădează materialul din care a fost confecţionat. totalizând (împreună cu porturile din back-panel) şase şi respectiv trei porturi.Cap 2: Evaluarea performanţelor plăcilor de bază este creată special pentru jocuri. Un efect deosebit s-ar fi obţinut dacă şi aceste din urmă cabluri erau de culoare roşu-vişiniu. Dacă până aici nu am găsit nimic ieşit din comun. însă de culoare neagră. spre ele încep să bată două ventilatoare „Dual OTES” tot de 40 mm dar mai adânci decât cele normale. Practic. precum vedem la plăcile Gigabyte high-end. menţinând astfel memoriile la o temperatură la care să suporte un overclocking superior condiţiilor normale. serial şi paralel pe plăcile obişnuite. avem de-a face cu o campanie de marketing aparent reuşită. PCB-ul plăcii. conţin diverse accesorii utile plăcii. pentru că nForce4 este construit dintr-un singur chip) este. precum cele SATA. Iată că încet-încet acele performanţe extreme promise încep să-şi arate colţii. însă el iese în evidenţă prin faptul că este de tip rounded. eficientă. atât datorită performanţelor extreme ce pot fi obţinute cât şi faptului că placa a fost lipsită de anumite componente pe care gamerii nu le folosesc . astfel încât cele 80 de fire se află la vedere. Tranzistorii de tip MOSFET sunt acoperiţi de radiatoare. la absenţa porturilor serial şi paralel. răcirea chip-ului principal (nu a chipset-ului.. radiatorul fiind realizat din cupru. cu care Abit ne-a obişnuit de ceva vreme. Cablurile Serial ATA sunt în număr de patru. ce conţine doi conectori. Însă pe placă avem un singur conector extern de FireWire. iar dacă temperatura acestora depăşeşte o anumită limită. Nu s-a pus atât de mult accent pe cantitate. extrem de atrăgător. prinzându-se cu ajutorul a două cleme. slot-urile PCI şi DIMM şi cele câteva LED-uri. probabil. Cablurile Parallel ATA sunt în număr de unu. după spusele lui Abit.. De asemenea. mai ales dacă ţinem seama de aspectul exterior al produsului. Astfel. Şi cablul floppy este rounded. situaţia se schimbă dramatic odată ce punem ochii pe OTES RAMFlow. nu avem decât un bracket USB 2. un set de două ventilatoare de 40 mm înglobate într-o carcasă de plastic şi destinate răcirii memoriilor. Răcirea extremă este lucrul de care Abit s-a îngrijit cel mai mult. este vorba de cooler-ul clasic Abit. acoperit cu un plastic transparent. Ele se aşează deasupra slot-urilor DIMM. Nu putem trece mai departe fără a enumera succint celelalte elemente de 27 . poziţionate în locul porturilor PS/2.

2V pentru a „hrăni” memorii precum Winbond BH5 nu ar fi stricat deloc. ceea ce nu prea stă bine unui produs Abit.65V). ce rezolvă problema multiplicatorului. Frecvenţele maxime atinse prin overclocking au fost de 310 MHz sincron şi 375 MHz cu raport de 2:1 între HTT şi memorie. el specifică foarte clar la ce se face referirea deşi este impropriu numit astfel). avem la dispoziţie LED-urile binecunoscute.8V. primul lucru care iese în evidenţă este imposibilitatea setării multiplicatorului. Oricum. utilitare capabile cam de aceleaşi lucruri ca şi meniurile de 28 . valori foarte bune. peste medie. BIOS-ul este foarte bun. atât pentru temperatură cât mai ales pentru voltaje. Performanţele nu au dezamăgit. În testul de overclocking. Turaţiile celor maxim şase ventilatoare pot fi reglate în fel şi chip. cea a memoriei până la 2. două porturi IDE aşezate culcat (un „bravo!” la ergonomie). sunt ventilatoare care se alimentează din mufa molex şi care practic nu pot fi folosite pe această placă până nu îi este setată în BIOS opţiunea de a nu stinge sistemul dacă observă că CPU Fan raportează zero turaţii. valoarea cea mai mare întâlnită (pe majoritatea plăcilor el se limitează la 1. Placa detectează automat aceste situaţii. cât şi o valoare destinată turaţiei maxime. Tensiunea procesorului poate fi ajustată până la 1. Setările uzuale sunt la locul lor. ce indică printr-un cod de eroare starea în care sistemul s-a „agăţat”. desigur. placa se oprea fără drept de apel la un HTT de 255 MHz din cauza procesorului care nu reuşea să ruleze stabil la frecvenţe mai mari (reamintesc că este vorba de un Athlon 64 3200+ ce rulează stabil la puţin sub 2600 MHz. fiind prezente şi câmpuri rar întâlnite. varianta iniţială fiind 11). patru Serial ATA 300 coordonate de „southbridge”-ul integrat în chip-ul central. În caz că neglijăm alimentările de ventilatoare deja ocupate (două cu răcirea surselor de putere. Monitorizarea este bună. rulăm cu Abit. Problema poate fi rezolvată cu versiunea beta de BIOS (12 beta 1. ea s-a închis irevocabil din cauza ventilatorului pentru procesor alimentat din alt conector. care ne-a obişnuit cu patru sau chiar cu cinci astfel de conectori. frecvenţa standard fiind de 2 GHz). nu cu DFI.8V. iar de reţeaua Gigabit se ocupă un integrat Vitesse. În acordarea notei sa ţinut seama doar de funcţionarea cu acest BIOS beta deoarece lansarea variantei finale de către Abit este iminentă. în meniul SoftMenu. Dacă mufa de floppy nu s-ar fi aflat într-o poziţie extrem de proastă. şi anume în spatele ultimului slot PCI. nota la ergonomie ar fi fost mare. cu atât mai mult cu cât e vorba de una de vârf. Nu aveam pretenţia la 4V la memorie. una opţională pentru răcirea memoriilor). Soft-ul livrat include. trei PCI. Trecând la analiza BIOS-ului. la imposibilitatea pornirii. existând posibilitatea setării unei valori minime de temperatură la care să intre în funcţiune ventilatorul la o turaţie mică (reglabilă în volţi). fiind normale pentru o placă bazată pe acelaşi chipset (sper că îmi este permisă folosirea în continuare a acestui termen. valori aproape deranjant de comune. deşi nu de excepţie. două X1. găsim doar două fan headere libere. Temperatura cooler-ului de pe chipset nu a fost deloc mică. devenit acum µGuru.75V. O problemă destul de gravă am întâlnit-o chiar de la pornirea plăcii: după câteva secunde. nefiind necesară nici măcar apăsarea clasicei taste Insert pentru ca sistemul să POST-eze. precum voltajul de standby al chipset-ului. Voltajul chipset-ului poate urca până la 1. semn că radiatorul de cupru lucrează la maximul de care este capabil. Setarea greşită a parametrilor sensibili poate duce. una cu chip-ul nForce4. Abit EQ şi OC Guru. pe lângă un program de scriere a BIOS-ului din Windows. În cel mai rău caz. dar un 3.Evaluarea performanţelor sistemelor de calcul pe placă: un slot PCI Express X16. Pe lângă faptul că suntem obligaţi să folosim. Imposibil şi inadmisibil pentru o placă Abit. la prima montare a plăcii (sau după reset-area BIOS-ului) un anume conector. la acest capitol AN8 stă bine.

nu foarte ortodoxă. Şi nu în ultimul rând. putem face presupunerea că viitoarele BIOS-urile de AN8 ar putea recurge la aceeaşi metodă.Cap 2: Evaluarea performanţelor plăcilor de bază monitorizare şi respectiv overclocking din BIOS. Dar dacă „săpăm” puţin. Preţul ei este cu circa 25% mai mic. prezent pe multe plăci mai slab cotate. testele nu au scos-o în evidenţă. ci de versiunea ce permite un transfer de doar 150 MB/s.BIOS beta . Ce lipseşte? Dispozitivul extern 3rd Eye. precum AV8. prin absenţa modulului de răcire a memoriilor şi prin dotarea puţin mai obişnuită la capitolul cabluri (de exemplu. În plus. prin inscripţionarea diferită a sistemului de răcire a surselor de putere. valoare considerată implicită de anumite plăci Abit. Normal şi Turbo.8V pentru memorie .preţ mare 2. Diferenţa este absolut insesizabilă. fără sufixul Fatal1ty. 210 şi 216 MHz pentru HTT. Concluzie Nu este foarte plăcut să afli că placa de bază pe care tocmai ai cheltuit o sumă impresionantă are un BIOS în stadiu beta. nu avem cabluri IDE rounded ci normale). ce nu diferă de sora mai mare decât prin culoarea PCB-ului şi a slot-urilor. deşi marcat ca oficial. descoperim că există şi modelul cu „al treilea ochi”.2. Abit AN8 (nForce4) Probabil aţi remarcat pe parcursul acestei prezentări că uneori m-am referit la placă numind-o AN8 pur şi simplu. ce corespund valorilor de 204. de a creşte performanţa plăcii. Acesta este unul dintre puţinele impedimente care pot hotărî un entuziast să nu cumpere Abit AN8 Fatal1ty. aşadar este foarte discutabil dacă achiziţionarea versiunii Fatal1ty reprezintă o opţiune bună.doar 2. De ce? Pentru că există şi versiunea AN8 „simplu”. De aceea. Concluzie + potenţial mare de overclocking + răcire bună 29 . Întâlnim acelaşi 204. Teste care au demonstrat performanţe identice şi frecvenţe de overclocking atinse „la fel de” identice. prin dotarea cu chipset-ul nForce4 „simplu”.5. ajustându-se în acelaşi timp şi voltajul memoriei şi procesorului. în cazul lui Abit EQ există trei preset-uri: Quiet. + potenţial mare de overclocking + răcire excelentă + LED-uri de diagnosticare + prezentare atrăgătoare . puţin mai scump. ce nu dispune de Serial ATA 300.

Cablurile (două ATA-133 rounded. Deschizând cutia.2. pe nume Oscar Wu. în cutie se mai găsesc un manual nu foarte bogat. fiind considerate adevărate campioane ale overclocking-ului. însă cu informaţii suficiente pentru ca instalarea să decurgă fără probleme. ca şi ultimele modele produse de DFI. împreună cu combinaţia de culori (PCB cafeniu şi slot-uri galbene la fel de UV-sensitive) folosită de placa de bază. unul FDD rounded) sunt toate de culoare galbenă şi sensibile la ultraviolete şi. ar trebui să spună multe despre cui se adresează placa de faţă. KX7-333. poartă semnătura aceluiaşi inginer. care deşi nu e decât un simplu codec ALC850 pe opt canale ce se montează pe un PCB separat. cinci jumperi suplimentari „cu moţ”.toate sunt modele de plăci de bază de la Abit ce într-un moment sau altul au făcut istorie. deoarece controller-ul Sil3114 se află numai pe modelele high-end). observăm un conţinut nu foarte bogat. ele. Aceasta. însa interesant dacă luăm în calcul că modelul prezentat aici este cea mai „săracă” variantă din oferta DFI a acestei game.Evaluarea performanţelor sistemelor de calcul + LED-uri de diagnosticare + prezentare atrăgătoare . Probabil vă veţi întreba „ce au ele în comun cu DFI-ul despre care vrem sa discutăm aici?”. IT7. singura opinie este legată de culorile folosite şi de imaginea stilizată ce lasă impresia unui ambalaj de jucării.8V pentru memorie 2. precum si exoticul modul audio Karajan. trei seturi de jumperi SLI de rezervă şi un back-panel ce asigură compatibilitatea configuraţiei mufelor la orice carcasă. un pliant ce prezintă tehnologia CMOS Reloaded. sunt furnizate un adaptor pentru alimentarea a două hard disk-uri S-ATA. două S-ATA. un cleştişor pentru manevrarea mai uşoară a jumper-ilor. împreună cu lista de specificaţii tehnice şi mai ales cu opţiunile foarte „îndrăzneţe” disponibile în meniul BIOS-ului (pe care le vom detalia mai târziu). o dischetă cu driverele de RAID Silicon Image (inutilă.doar 2. La o primă vedere aruncată asupra ambalajului. De asemenea. 30 .BIOS beta . ei bine. Alături de aceste cabluri. NF7 .6. CD-ul cu drivere şi utilitare. se presupune că oferă o îmbunătăţire calitativă a semnalului faţă de implementarea obişnuită onboard. DFI LANParty UT nF4 Ultra-D (nForce4 Ultra) BE6-II. pot avea un aspect destul de plăcut într-o carcasă cu fereastră.

nu putem trage decât o concluzie: placa e proiectată să găzduiască componente ce consumă foarte multa putere.com/cpuchipsets/showdoc.000 de puncte in 3DMark03. sunt dotaţi cu radiatoare de dimensiuni impresionante. Un alt lucru care merită cu siguranţă atenţia e prezenţa a două slot-uri PCI Express X16. Analizând sistemele de răcire. cooler ce are dimensiuni peste medie şi beneficiază de un ventilator Mag-Lev (teoretic de câteva ori mai fiabil decât cele ball bearing si în acelaşi timp mai silenţios). Back-panel-ul e special. pentru că au depus efortul de a modifica atât de radical PCB-ul de referinţă NVIDIA. diferenţa constând doar în prezenta unei punţi conectate pe chipset (similare celei întâlnite la procesoarele Athlon). şi anume cel cu mufa de FDD. precum şi obişnuiţii conectori PS/2 pentru tastatură şi mouse. plasat foarte aproape de centru. sistemul overclock-at depăşind bariera celor 19.aspx?i=2322 31 . +12V. şi adăugând la aceasta faptul că sunt prezente nu mai puţin de 4 (patru!) mufe de alimentare pentru placa de bază (ATX 2.Cap 2: Evaluarea performanţelor plăcilor de bază Trecând la analizarea aspectului plăcii. două RJ-45 (LAN Gigabit). singurul care aduce o penalizare mai serioasă este unul din cei de alimentare. cu substanţă electroconductoare sau chiar cu pistolul de lipit . cât şi cei pentru RAM şi chipset. două conectoare de tip RCA (intrarea. şase jack-uri audio. observam că atât tranzistorii ce deservesc sursa de alimentare a procesorului. Ultimul lucru legat de layout ce merită menţionat este prezenţa switch-urilor de Power şi Reset precum şi a unui speaker direct 3 http://www. din aluminiu. observăm poziţionarea mai deosebită a slot-urilor de memorie şi a procesorului. una FireWire. un vot în plus pentru inginerii DFI. Mai mult. Se observă eliminarea conectorului pentru portul paralel.0. deşi conectorii de extensie lipsesc. funcţionând perfect cu două plăci grafice Leadtek 6800 în mod SLI. DFI-ul a suportat cu succes modificarea (ce poate fi realizată cu un creion. respectiv ieşirea SP/DIF). molex HDD + mufa FDD). Punând şi cooler-ul de pe chipset sub lupă. pentru că livrează curentul foarte aproape de consumator.anandtech. probabil în efortul de a reduce lungimea traseelor bus-ului HyperTransport. întocmai ca la modelele ce suportă modul SLI. iar alături de ele existenţa unor seturi de jumperi ce se pot seta pe „Normal” sau „SLI”. Overclocking anybody? Majoritatea conectorilor au o amplasare bună. AnandTech3 a sesizat acum ceva timp că chipset-urile nForce4 Ultra şi nForce SLI sunt unul şi acelaşi. existenţa lui acolo este justificata dacă ne gândim la eficienţă maximă.nerecomandat celor care nu au priceperea necesară). în timp ce cel serial precum şi unul suplimentar FireWire şi patru USB pot fi conectate intern pe placa de bază. găzduind nu mai puţin de şase mufe USB. ce promit o funcţionare stabilă a respectivelor module în condiţii extreme. ce permite identificarea chipset-ului ca având sau nu posibilităţi de SLI. eliminând astfel pierderile suplimentare prin traseele de pe PCB-ul plăcii de baza.

şi anume 445 MHz. este o unealtă foarte utilă în cazul overclocking-ului sau al testării componentelor. Per total. Deşi această din urmă setare e utilă doar în cazul în care sunt folosite memorii cu anumite chip-uri Winbond ce răspund dar mai ales rezistă la asemenea valori. micul producător DFI reuşeşte să se prezinte cu o ofertă excepţională. am reuşit să le împingem până la o frecvenţă stabilă de 315 MHz. mai ales datorită faptului că a suportat setări ale memoriei mai agresive decât în cazul celorlalte modele. avem posibilitatea de a rula Memtest86+ imediat după POST (test ce este integrat în chip-ul de BIOS). astfel. Astfel. am observat un comportament excelent.5% mai bine decât următoarea clasată. respectiv 5. Trecând mai departe la măsurarea performanţelor. precum şi un overclocking limitat. „Ambalajul de jucării” conţine. placa având funcţionalitate deplină fără a necesita folosirea unei carcase. singurele categorii care ar putea fi îmbunătăţite fiind legate de documentaţie şi de funcţionalitatea software-ului. descoperim un BIOS extrem de bogat care. placa stabilind referinţa pentru celelalte incluse în test. Overclocking-ul este însă capitolul unde DFI arată cu adevărat tot ce poate. Forţând memoriile Corsair la latenţe crescute.Evaluarea performanţelor sistemelor de calcul pe placa de baza. numită „Genie BIOS” .5V şi. 32 . placa a dovedit că poate rula stabil la o frecvenţă aproape de două ori şi jumătate mai mare faţă de specificaţii.de unde putem afla tensiunile critice şi.8V. aceasta pe lângă greşelile evidente de limbă engleză din program. on-board LAN etc) .şi când zic „toate” nu mă refer doar la memorie şi voltaje. foarte interesant.5 şi respectiv 0. Un lucru de asemenea special este CMOS Reloaded. ce se pot încărca mai târziu prin simpla apăsare a unei taste. Toate setările legate de overclocking sunt strânse într-o singură categorie a BIOS-ului. Mai departe. De asemenea. Cea mai mare diferenţă de performanţă a avut loc în compresia WinRAR. pe care am avut ocazia să le apreciem în timpul testelor. soft-ul NVIDIA nTune precum şi un alt utilitar numit ITE SmartSpeed. VDD (chipset) până la 1. permite reglarea tensiunii Vcore (pentru procesor) până la 2. comparativ cu 9-12-2 la celelalte. ci şi la posibilitatea de a dezactiva anumite device-uri on-board ce ar putea limita overclocking-ul extrem (porturi S-ATA. în timp ce la celelalte modele testate nu am reuşit sa le coborâm în condiţii de stabilitate mai jos de 2. având însă în vedere că target-ul produsului se află mai degrabă în zona power-user. şi ceva jucării de oameni mari. LDT (HyperTransport) până la 1. Cel mai impresionant lucru a fost HTT-ul atins. şi posibilitatea setării tensiunilor Vcore. ce constă în posibilitatea de a stoca patru configuraţii ale BIOS-ului. alături de modul „Safe Boot” selectabil printr-un jumper (pentru a nu fi necesar să resetăm BIOS-ul). pe lângă numărul foarte mare de setări legate de memorie. notăm încă un punct în plus pentru DFI din partea entuziaştilor. posibilităţile de supratactare fiind practic nefuncţionale. Acesta conţine. destul de impresionant având în vedere că ele sunt certificate la o frecvenţă de lucru de 200 MHz (cu latenţe mult mai strânse însă). şi anume 1. aceste lipsuri sunt ca şi inexistente. pe lângă funcţionalitatea lui ITE SmartGuardian. Software-ul inclus pe CD-ul cu drivere constă într-un program de monitorizare (ITE SmartGuardian) ce permite şi controlul turaţiei ventilatoarelor în funcţie de temperaturi. unde placa a punctat cu 1. folosind un divizor 2:1 pentru memorie. cel mai impresionant. Această din urmă funcţie este total nereuşită. tRFC si tRRD au coborât până la 7-9-0. Vdimm (cea a memoriei) până la 4V. tRC. Vdimm si VDD.1V. setările CAS şi TRAS au mers coborâte până la unele valori mai neobişnuite. se pare.

în interiorul pachetului aflându-se două cutii mai mici. fiecare putând suporta o placă grafică performantă. un abţibild Gigabyte. este dotată cu două slot-uri PCI Express X16. Cu alte cuvinte. un ghid de instalare rapidă sub formă de pliant. Lucrurile mai serioase se concretizează prin nu mai puţin de opt cabluri Serial ATA şi patru cabluri convertoare molex – alimentare SATA (cu câte doi conectori pe fiecare cablu) şi numai un cablu Parallel ATA. GA-K8NXP-SLI impresionează în primul rând prin dotare şi. unul servind şi conectării a două dispozitive FireWire. dar mult mai mic decât acesta). DPS este. În cealaltă cutie avem deja obişnuitul DPS (Dual Power System) cu care ne răsfaţă Gigabyte de circa doi ani încoace.2. 1x PCI Express 16x sau 2x PCI Express 8x . chiar şi în competiţie cu modelele high-end de la producători consacraţi. şi cam atât cu „maculatura”. observăm cele două slot-uri PCI Express. pline cu „jucării”. Analizând acum placa.7. asemănător modulelor SO-DIMM. + overclocking extrem atins în practică + BIOS special conceput pentru overclocking + numeroase setări de memorie + poate fi transformată uşor pentru lucrul în mod SLI . ce conţine o sursă de putere suplimentară.. 33 . Titlul de XF Award l-a primit cu greu din cauza absenţei de pe piaţa românească la data efectuării testelor. Modul SLI este reflectat de un mic card. Mai întâi sare în ochi cutia dublă faţă de cea a unei plăci normale. de ce nu. Să nu uităm nici de cele trei bracket-uri USB (şase porturi în total. prin aspectul estetic de excepţie. În prima găsim (enumerate într-o ordine aleatoare) o foaie ce face reclamă la cooler-ul 3D Rocket. fără a le menţiona pe cele patru de pe placă). o placă suplimentară (dotată şi cu sistem de răcire separat) ce se aşează într-un slot special (asemănător ca şi construcţie cu vechiul ISA. scris în câteva limbi. Gigabyte GA-K8NXP-SLI (nForce4 SLI) Placă creată special pentru a oferi maximul de performanţă dintr-un sistem de gaming. RAID 5).Cap 2: Evaluarea performanţelor plăcilor de bază Concluzie Performanţa şi posibilităţile deosebite de overclocking fac din DFI LANParty UT nF4 Ultra-D câştigătorul testului nostru. creat tot de Gigabyte (un model foarte reuşit).evident că dacă cea de-a doua placă lipseşte. precum şi o placă al cărui nume spune totul: 802. după cum spuneam anterior. unul destinat chip-ului Sil3114 (hint: Serial ATA.11 Wireless LAN Card.. vom alege prima variantă. un manual bine scris. Cu alte cuvinte. ce permite selectarea modului de operare: SLI sau Normal. fiecare hard disk Serial ATA ce poate fi utilizat împreună cu această placă de bază nu va avea nevoie de nici un cablu suplimentar faţă de cele livrate.documentaţia şi software-ul lasă de dorit 2.

mai reperăm două slot-uri PCI Express X1. însă opţiunea producătorului nu poate fi privită decât ca un plus.) Overclocking-ul a produs mari dureri de cap. utilizatorul având acum de unde alege. Ce nu prea este e spaţiul dintre slot-urile PCI Express. chip-ul).75V. am scăzut performanţa extrem de puţin. Plasare potrivită a conectorului de alimentare? Este.Evaluarea performanţelor sistemelor de calcul utilă în caz de stres maxim (overclocking. Spaţiu în jurul procesorului? Este. Da. Back-panel-ul este asemănător cu cel clasic. Tensiunile. chip-urile răspunzătoare fiind produse de Marvell şi Vitesse. restul căzând în sarcina unui controller separat. precum şi două PCI „normal”. Prin setarea unor latenţe foarte agresive pentru memorie. Analizând mai departe. slot-ul X1 dintre cele două plăci grafice fiind practic inutilizabil pentru că plasarea unei plăci în acesta ar crea probleme grave răcirii plăcii grafice din vecinătate. operaţie necesară pentru a putea accesa opţiunile ascunse şi destinată utilizatorilor experimentaţi. sub pretenţiile pe care le 34 . placa poate seta din BIOS frecvenţele VPU-ului şi a memoriei plăcii (plăcilor) video în procente. minusurile fiind de înţeles având în vedere numărul de componente care au încăput pe placă. Ergonomia. BIOS-ul plăcii este excelent. cei de pe DPS fiind fierbinţi. două Parallel şi opt Serial-ATA.8V şi respectiv 1. dar sistemul a rulat stabil. Găsim astfel posibilităţi de overclocking practic nelimitate. aţi citit bine. cel puţin după apăsarea tastelor Ctrl+F1. Spaţiu între placa grafică şi DIMM-uri? Este. conectorul serial fiind înlocuit de o intrare şi o ieşire SPDIF. (Reamintesc faptul că testul de performanţă a fost rulat cu o singură placă grafică. iar conectarea la reţea este servită de două interfeţe capabile de 1 Gbps. putând fi întâlnite o serie de timing-uri care lipsesc cu desăvârşire în BIOS-urile plăcilor ieftine. deşi nu cele mai bune. Schimbând valorile la unele mai „de bun simţ” dar în continuare foarte agresive. de la Silicon Image. de patru din acestea din urmă ocupându-se chipset-ul (pardon. am observat că aceasta preia cea mai mare parte din sarcina surselor de putere deoarece tranzistorii de tip MOSFET prezenţi pe placa de bază au rămas reci. Prezenţa celui de-al doilea slot PCI Express X16 a contat doar la capitolul dotare. am obţinut o instabilitate exemplară. plaja de valori fiind între 100% şi 255%. ceea ce nu mai reprezintă nimic deosebit. ultimul permiţând şi RAID 5. Practic. Fiecare controller este capabil de funcţia RAID. Performanţele atinse au fost foarte bune. Aproape nimic de reproşat. de la banala setare a busului HTT (era să spun FSB) până la reglaje fine ale memoriei. Interfeţele de unităţi de stocare sunt în număr de zece. Deşi frecvenţele atinse au fost de 315 MHz asincron şi 265 MHz sincron (destul de modeste. temperaturi mari. Numărul de setări legate direct sau indirect de memorie este de 12. aşezate alternativ cu cele X16. atât pentru memorie cât şi pentru procesor. consum foarte mare din partea procesorului). pot fi ajustate până la maxim 2. Este ciudată alegerea a două chip-uri diferite destinate acestui scop. Deosebit este posibilitatea de overclocking a plăcii grafice.

producătorul taiwanez a fost la înălţime. astfel că am dezactivat opţiunea Auto Recovery (practic. însăşi prezenţa unei surse de putere suplimentare prin prezenţa DPS-ului creşte în mod teoretic fiabilitatea produsului.2. Gigabyte ar putea accede la fotoliul de lider al plăcilor de bază destinate entuziaştilor. iar condensatorii Nichicon ce „învăluie” socket-ul procesorului sunt consideraţi ca având o fiabilitate peste medie. vina nu se poate spune a cui e. peste câteva ore.overclocking-ul efectiv a creat mari probleme 2. am obţinut 315 MHz. Altfel spus. iar chipset-ul din dotare este nForce4-4X. nota 10 la dotare şi doar notă de trecere la overclocking. De asemenea. + dotare excelentă + acceptă două plăci grafice în mod SLI + setări bune de overclocking în BIOS + Dual BIOS .lipsă aproape totală a monitorizărilor în BIOS . la un moment dat la circa două din cinci porniri intrând în funcţiune Dual BIOSul. Dotările extravagante. Oricum. Aşadar. aceasta este fraza clasică pe care orice tester o afirmă în situaţii de acest gen. De exemplu. Concluzie Cu puţină atenţie suplimentară la detalii. am fost lovit de diverse probleme de stabilitate în condiţii uneori hilare. Alarmele erau în mod clar false. Chipset ce nu există în documentele NVIDIA (Gigabyte este singurul producător care îl utilizează) şi care nu reprezintă decât o revizie mai veche a lui nForce4 (A2 faţă de A3) care suportă un bus HyperTransport de maxim 800 MHz (faţă de 1000 MHz pentru variantele clasice).Cap 2: Evaluarea performanţelor plăcilor de bază aveam de la o astfel de placă). Bazată pe un PCB foarte asemănător. Diferenţele de performanţă sunt absolut neglijabile în sistemele obişnuite. Nu se poate pune problema calităţii slabe a componentelor de pe placă. placa a funcţionat haotic în condiţii de stres. eventual versiunea BIOS-ului (F6. deosebirile privesc în primul rând absenţa celui de-al doilea slot SLI (ce este înlocuit de unul PCI normal). temperaturile atinse nefiind foarte mari (mai puţin temperatura DPS-ului care a ajuns la valori deranjante odată cu setarea unei tensiuni mari pentru procesor). fiind detectată coruperea BIOS-ului. putând rezista vreme îndelungată la temperaturi mari. precum şi şansele de reuşită ale unui overclocking extrem. placa fiind printre cele mai bine dotate plăci pe care am avut ocazia să le testez. chiar dacă au şanse mici să fie folosite în practică. Până atunci. am reuşit să aduc placa în situaţia de a nu trece de POST la un HTT mai mare de 213 MHz şi aceasta în condiţiile în care. Cert este că alte exemplare ale acestui model au rulat fără probleme la un HTT mai mare şi este posibil ca acest exemplar să fi avut unele probleme. deţinut în prezent de alte nume sonore pe care vă lăsăm plăcerea să le descoperiţi mai departe în acest capitol. ultimul disponibil la data testării) să creeze probleme. la exact aceleaşi setări.8. am dezactivat funcţionalitatea Dual BIOSului) şi am putut realiza testele. drept urmare impresia subiectivă asupra posibilităţilor de overclocking ale plăcii de faţă . Gigabyte GA-K8NF-9 (nForce4-4X) O variantă pentru buget redus a plăcii descrise anterior este GA-K8NF-9. În rest. drept dovadă placa a fost la fel de rapidă ca şi 35 . oferă o aură de supremaţie.şi luând în calcul experienţele similare pe plăci mai vechi ale aceluiaşi producător .nu este pozitivă.

mai mare = mai bine) Testul sintetic de lăţime de bandă a memoriei din SiSoft Sandra a confirmat ceea ce bănuiam. De asemenea. Chiar dacă nu avem două interfeţe LAN sau opt conectori SATA. problemele întâlnite la K8NXP-SLI neapărând. + setări bune de overclocking în BIOS + overclocking bun atins în practică + preţ foarte atractiv .9. Cine? Noi. placa DPS. Totuşi. iar conectorii de ventilatoare sunt în număr de doi (neluând în seamă cel destinat chipset-ului răcit acum pasiv. rezultatele obţinute cu diferite progrme de testare. fără să fie conectate la placă prea multe dispozitive şi fără a se efectua teste riguroase. Concluzie Una peste alta. unul din cele două BIOS-uri. dotarea plăcii nu este nici pe departe atât de extravagantă ca cea a suratei mai mari. având în vedere setările efectuate în BIOS şi rezultatele obţinute în celelalte teste: placa de la DFI oferă un plus de performanţă datorită latenţelor mai mici ale memoriei. nici nu avem nevoie de aşa ceva. Rezultate comparative În continuare se prezintă. a plăcilor de bază. a rulat aparent stabil la un LDT de 5x (deci 1000 MHz).punctaj testată SiSoft Science Copiere Sandra Mark fişiere DFI 5647 42. fiind un model destul de ieftin şi care dispune de facilităţi remarcabile.8 358 Gigabyte 5636 43. mai mic = mai bine) 36 . Lipsesc patru din cele opt porturi Serial ATA. 320 MHz asincron şi 280 sincron nu impresionează pe nimeni care a pus mâna pe plăci mai bune. În plus.lipsă aproape totală a monitorizărilor în BIOS 2. frecvenţele acesteia nemaiputând fi ajustate în procente. ci doar pe baza a două preset-uri: Fast şi Turbo. e drept. Science Mark (Unitatea de măsură: nanosecunde. în format cu două fire). comparativ. dar sunt nişte valori excelente pentru un produs value.8 355 Abit AN8 5632 42.Evaluarea performanţelor sistemelor de calcul K8NXP-SLI.2. cei care nu suntem dispuşi să plătim dublu pentru astfel de facilităţi. Placa de bază Activitate /program testare . BIOS-ul este identic cu excepţia opţiunii de overclocking a plăcii grafice. GA-K8NF-9 îşi merită banii. Frecvenţele maxime ale bus-ului HTT au fost urcate ceva mai sus decât în cazul plăcii anterioare.3 356 Arhivare WinRAR 255 261 259 PovRay 842 837 841 Codare XviD 478 480 481 SiSoftSandra (Unitatea de măsură: puncte.

am avut în test trei plăci de bază. cel mai probabil. modelul GAK8NXP-SLI fiind un produs mediu pentru categoria sa. Ea s-a comportat excelent. mai ales când două dintre ele sunt variante mai sărace ale modelelor de vârf.10. o dovadă în plus că DFI este un producător care poate accede uşor la trofeele cele mai mari din domeniul overclocking-ului. sau care nu vă vor ajuta prea mult. Acesta din urmă încarcă substanţial preţul. DFI-ul luând un avans de peste două procente faţă de aceasta. iar preţul este foarte tentant. ţinând cont că el este acelaşi la toate cele trei plăci. Cât despre codaşa clasamentului. Codare XviD (Unitatea de măsură: secunde.2. Dacă la dotare este de neegalat (SLI. ne aşteptam la altceva. un test al controller-ului Serial ATA. placa DFI fiind în continuare în frunte. oferind un plus de facilităţi pe care. drept pentru care placa DFI a „stors” doar un 0. Gigabyte a ocupat ultimele două locuri. Dotarea şi overclocking-ul sunt foarte bune. dovedind că nu avem nevoie de o gaură în buget de 200$ pentru a obţine o placă bună. 37 . mai mic = mai bine) La copierea fişierelor. Practic. Copiere fişiere (Unitatea de măsură: secunde. însă la aceiaşi bani se pot găsi produse care nu poartă „ştampila” Abit şi care pot oferi satisfacţii similare. Abit s-a prezentat exemplar prin AN8. ea reprezintă fără discuţie best buy-ul acestui test.6% în faţa lui Abit. Concluzii Este greu de tras linia şi făcut totalul după doar cinci plăci testate. orientarea firmei schimbânduse total în ultima perioadă. diferenţele au fost mici. cât şi fără sufixul Fatal1ty. opt porturi Serial ATA şi alte „minunăţii”). atât cu. DFI LanParty UT nF4 Ultra-D este fără discuţie câştigătorul testului. Arhivare WinRAR (Unitatea de măsură: secunde. să nu uităm. nu le veţi folosi.Cap 2: Evaluarea performanţelor plăcilor de bază Testul de latenţă a memorie din ScienceMark nu ne-a oferit nici un rezultat relevant. versiunea testată nu este cea mai dotată placă a producătorului taiwanez. GA-K8NF-9. mai mic = mai bine) Scoruri foarte apropiate la codarea unui film folosind XviD. PovRay (Unitatea de măsură: secunde. mai mic = mai bine) Comprimarea cu WinRAR a scos la iveală cele mai mari diferenţe: Abit AN8 a fost cea mai lentă placă din test. mai mic = mai bine) Randarea unei imagini în PovRay depinde aproape în totalitate de procesor. 2. Şi. restul facilităţilor nu au excelat.

este cunoscută sub numele de cod Prescott. Northwood este mai rapid decât Prescott la aceeaşi frecvenţă în anumite aplicaţii. Simplificând. Astfel. Pentium 4. Dacă AMD preferă denumiri legate de cai pentru a-şi promova CPU-urile (Morgan. fapt ce se dovedeşte a fi din ce în ce mai fals. Palomino. au fost necesare unele schimbări interne care au dus inevitabil la scăderea vitezei comparativ cu alte procesoare la aceeaşi frecvenţă. Cam atât cu poveştile. un orăşel în Arizona cu o populaţie de câteva zeci de mii de locuitori. Intel preferă nume de localităţi sau regiuni geografice din America (Willamette şi Coppermine sunt râuri. împreună cu creşterea latenţei cache-ului. ele se aseamănă cu precedentul salt de tehnologie.1. pentru aceasta. din anumite puncte de vedere. Evaluarea performanţelor procesoarelor 3. Ezra). 38 . Modificările aduse de Intel arhitecturii vechiului Pentium 4 (cod Willamette sau Northwood) nu sunt atât de marcante ca în cazul trecerii de la Pentium III la Pentium 4 însă putem spune că. cât şi un nume. oferă noi orizonturi privind potenţialul de a atinge frecvenţe uriaşe. Northwood este denumirea atribuită mai multor localităţi). precum cache-ul şi unitatea pentru numere întregi au fost optimizate.1. 20 la Pentium 4 Willamette şi Northwood). Joshua. Prescott fiind atât o pădure. ajungându-se la modelele ulterioare la 4x266=1066 MHz. marele fizician englez Joule având numele complet de James Prescott Joule. de ordinul a 5 GHz. deci vom avea în continuare un procesor ce rulează cu un PSB efectiv începând cu de patru ori mai mare decât frecvenţa de bază. ce poartă aceeaşi denumire comercială ca şi predecesorii săi.1. el ajungând la peste 30 (10 la Pentium III. Thoroughbred sunt rase de cai) iar VIA foloseşte termeni cu rezonanţă religioasă (Nehemiah. el devenind acum SSE3. explicând (cel puţin sumar) toate noţiunile care ar putea produce dificultăţi în urmărirea textului pentru un cititor începător. Nu trebuie să vă îngrijoraţi: Intel a făcut tot posibilul pentru a minimaliza efectele încercării oarecum forţate de creştere a frecvenţei. schimbările aduse de către Prescott se bazează pe încercarea producătorului de a creşte performanţa în primul rând prin creşterea frecvenţei. şi anume 4x200=800 MHz. o serie de unităţi ale procesorului. Arhitectura lui Pentium 4 Prescott 3. dimensiunea cacheului L2 a fost dublată. Nu este nevoie de prea multă imaginaţie pentru a afla motivul acestor schimbări.3. Introducere Ultima realizare de la Intel. Cu alte cuvinte. Arhitectura NetBurst a fost păstrată. iar câteva instrucţiuni suplimentare au extins setul SSE2. să trecem la lucruri serioase. la fel cum Pentium III Coppermine era mai rapid decât Pentium 4 Willamette dacă se comparau două CPU-uri rulând la tacturi similare. Această modificare. numărul de stagii ale conductelor de prelucrare (aşa numitele pipeline-uri) a fost crescut în continuare. frecvenţă cunoscută de la ultimele modele de Northwood. Vom explica în continuare majoritatea schimbărilor aduse de Prescott lui Pentium 4 Northwood. În acelaşi timp. el fiind unul comercial: mai mulţi megahertzi înseamnă pentru cei mai mulţi mai multă performanţă.

09 microni a lui Prescott. Cache-ul este o zonă de memorie intermediară care stochează informaţiile mai des folosite.13 microni pentru Pentium 4 Northwood şi 0. să fie furnizaţi memoriei câte 6. ce tinde să nu mai fie valabilă din cauza atingerii unor distanţe critice: 0.Cap 3: Evaluarea performanţelor procesoarelor Câteva cuvinte despre tehnologia de fabricaţie. de două ori mai mult decât pentru un Athlon XP cu PSB de 400 MHz (2x200). Aceasta este teoria clasică. Exact aceasta este lăţimea de bandă a PSB-ului de 800 MHz. acest flux circulă cu doar 4. ci de 200 MHz multiplicaţi de un număr de patru ori. 533 şi 800 MHz.4 GB/s. în schimb.09 microni (90 nanometri) pentru Prescott. deţine integrate în primul rând controller-ul de memorie şi cel pentru bus-ul AGP sau PCI Express X16. o valoare normală ca lăţime de bandă fiind cea de 6. DDR2 SDRAM sau RDRAM (Rambus).4 GB/s (DDR400 în mod dualchannel).3 GB/s. Controllerul de memorie influenţează puternic performanţa. După cum se ştie. devenind necesare unele schimbări de ordin intern. motivul fiind explicat mai sus. tranzistorii pot lucra mai rapid. în special datorită dimensiunii foarte mici a pastilei.2. Astfel. Northwood beneficiază doar de 400. aceasta 39 . Cu cât acestea sunt mai mici. circulaţia fluxului de date procesor-northbridge-memorie se desfăşoară cu viteza de 6. 3. pe de altă parte apar fenomene nedorite. Numărul de microni întâlnit în specificaţiile oricărui procesor se referă la distanţele dintre tranzistorii procesorului. Şi nu este vorba de 800 MHz reali. Pentru ca această viteză teoretică să afecteze puternic performanţa este nevoie ca datele furnizate de procesor să ajungă în memorie la timp.1. majoritatea modelelor de Prescott nu depăşesc decât prin overclocking cei 800 MHz. o frecvenţă a memoriei mai mare de cea corespunzătoare lui PC2100 (DDR266) dual-channel neaducând creşteri majore de performanţă.4 GB într-o secundă. 800 şi 1066 MHz. crescând foarte mult (de mii de ori) performanţa unui procesor. el având posibilităţi de a lucra cu memoria SDRAM. folosindu-se o tehnică asemănătoare cu dublarea ratei de transfer la PSB-urile procesoarelor Athlon şi la memoriile DDR. ceea ce înseamnă că. Toate chipset-urile uzuale folosesc memoria în mod dual-channel (care în principiu dublează performanţa acesteia dacă sunt folosite două sau mai mult module de memorie într-o anumită combinaţie). Pe de o parte. pentru majoritatea chipset-urilor destinate lui Pentium 4. northbridge-ul. Astfel. Gestionarea memoriei principale şi secundare Să comentăm puţin memoria cu care lucrează ultimele procesoare Intel. cu atât se măreşte potenţialul creşterii frecvenţei de tact. DDR SDRAM. Prescott rulează la un PSB de 533. În varianta de PSB 533. prin intermediul PSB-ului (care este în esenţă viteza de comunicare dintre CPU şi northbridge). ele fiind similare din acest punct de vedere celor mai recente procesoare Northwood. tehnologia Strained Silicon rezolvă parţial neajunsurile datorate arhitecturii pe 0. Totuşi.

Chiar dacă avem de-a face cu o 40 . el fiind folosit mult mai intens decât L2. numită Execution Trace Cache.Evaluarea performanţelor sistemelor de calcul datorită faptului că. cum este Pentium 4. primul nivel fiind mai aproape de nucleul procesorului şi având astfel o eficienţă mai mare. pe lângă informaţiile reziduale. care stochează aceste instrucţiuni într-o formă deja decodată. avem de-a face cu o relaţie inclusivă între cele două nivele. având un hit rate (probabilitatea ca informaţiile cerute să se afle în cache) mai mare decât la predecesori. nemaifiind necesară copierea informaţiei din L1 a datelor considerate inutile pentru moment. acest trace cache este vital pentru un procesor cu un pipeline lung. Totuşi. şi imaginea completă a nivelului 1 de cache. el este încă extrem de mic comparat cu procesoarele AMD. cache-ul total este egal cu L1 + (L2 – L1) = L2. În plus. dimensiunea totală a cache-ului este mai mică decât suma celor două componente ale sale. ea este readusă în L1. consumându-se din nou timp preţios (se creează altă informaţie reziduală ce este copiată în L2. cele două zone sunt de capacitate identică şi totalizează 128 KB. L1 cache-ul lui Prescott a fost puternic optimizat. La majoritatea procesoarelor de azi. Dacă informaţia copiată anterior din L1 în L2 redevine utilă. însă Pentium 4 a adus o nouă organizare a cache-ului. După cum v-aţi dat seama. Relaţia exclusivă este caracteristică procesoarelor din familia K7 (Athlon) pe Socket A şi AMD64. care deţin un cache total (date + instrucţiuni) de 128 KB. De ce nu este prelucrată direct în L2? Pentru că sunt şanse foarte mari ca informaţia să fie necesară de un număr mare de ori. Pentru procesoarele AMD. cache-ul pentru instrucţiuni a rămas acelaşi iar cel de date a fost crescut la 16 KB. capacitatea fiind de 12. în funcţie de relaţia sa cu L1. Pentru acesta din urmă se preferă o viteză mai redusă dar o dimensiune mai mare. O consecinţă directă este faptul că o relaţie inclusivă implică o dimensiune a L2 cache-ului mai mare decât cea a nivelului 1. să le numim reziduale (desemnate conform unui algoritm numit LRU Least Recently Used). fiind mai eficientă copierea ei într-o zonă de memorie mai rapidă decât menţinerea sa într-una lentă. Dimensiunea cache-ului L2 este de 256 KB la primul Pentium 4 (Willamette). existând o secţiune de date de doar 8 KB şi una de instrucţiuni. 512 KB la Northwood şi 1 MB la Prescott. Există cel puţin două nivele de cache: level 1 (L1) şi level 2 (L2). fostă reziduală). L2 fiind de zeci de ori mai încăpător decât L1. urmând ca datele considerate mai importante să fie aduse în spaţiul liber creat în L1. În momentul umplerii cache-ului L1 este solicitat nivelul al doilea. O altă metodă elimină necesitatea transferului între L1 şi L2 datorat celei dintâi situaţii expuse mai sus.000 de micro-operaţii (micro-ops). Cache-ul L2 este de asemenea o zonă de memorie care stochează date temporare. acest lucru având un impact direct asupra performanţei. un cache convenţional chiar şi mult mai mare ar fi putut dezavantaja procesoarele Intel. însă rolul său este diferit. care au o dimensiune a cache-ului L1 comparabilă cu cea a lui L2 dar eficienţa acestuia din urmă este destul de redusă. Aceasta datorită faptului că L2 conţine. el este împărţit într-o secţiune pentru date şi una pentru instrucţiuni. Mai exact. acest tip de cache depăşeşte ca eficienţă unul obişnuit de 8 KB. în privinţa lui L1 se merge pe ideea de viteză mare şi dimensiune mică. Avantajul vitezei a decis compania Intel să implementeze acest tip de cache în toate procesoarele sale începând cu Pentium Pro şi terminând (deocamdată) cu Prescott. Această relaţie dintre cele două nivele de cache o numim exclusivă. datele şi instrucţiunile nu sunt folosite o singură dată ci de un număr foarte mare de ori într-un interval scurt. în care sunt depuse informaţiile mai rar folosite. În cazul lui Prescott. în cele mai multe cazuri. creându-se loc în L1 pentru noua informaţie preţioasă. În plus. În acest caz.

este nevoie de memoria sistemului. Intel a preferat prima variantă. Să vedem şi de ce. pe de altă parte. el le va solicita pe rând. Tehnologie Cache L1 Cache L2 Latenţă cache L1 Latenţă cache L2 Tip cache Willamette Northwood Prescott AMD K7 0.13µ 0.1. dacă procesorul are de adunat 1000 de numere. Cu toate acestea. Situaţia reală este alta: al 537-lea număr se află în cache. alături de celelalte elemente ale şirului şi de multe alte informaţii recent utilizate. Însă câte cicluri de tact trec de la efectuarea cererii până la obţinerea informaţiei? Dacă procesorul rulează la peste 3 GHz iar memoria la câteva sute de MHz. Dar ce se întâmplă când în algoritm apare. după terminarea adunării.09µ 0. iar pentru aceasta sunt necesari timpi „morţi” suplimentari sau costuri de fabricaţie mai mari.13µ 8KB+12Kops 8KB+12Kops 16KB+12Kops 128 KB 256 KB 512 KB 1 MB 256 KB 2 2 4 3 19 inclusiv 19 inclusiv 28 inclusiv 20 exclusiv AMD64 0. solicitarea de a refolosi cel de-al 537-lea număr din şirul de 1000? Procesorul ar trebui să ceară memoriei elementul cu numărul de ordine 537. Spre exemplu. evident. frecvenţele uriaşe pentru care este proiectat Prescott trebuie să fie suportate şi de cache. atât (parţial) pentru L1 cât şi pentru L2. Pentru a se evita această situaţie. avantajul (parţial pentru L1. noul model de Pentium 4 are o latenţă mai mare a cache-ului.13÷0. acesta se va umple rapid şi procesorul va trebui să ceară memoriei ceea ce îşi doreşte. Cu alte cuvinte. Pentru aceasta. Dacă un procesor poate face multe. acest număr este de două cicluri la Pentium 4 Northwood şi de patru cicluri la Prescott.3.Cap 3: Evaluarea performanţelor procesoarelor dimensiune dublă faţă de predecesor. Dacă cache-ul nu este suficient de mare. 41 . total pentru L2) dublării cache-ului este probabil superior dezavantajului scăderii eficienţei sale. durata obţinerii valorii acelui element fiind astfel mult mai mică. Pentru cache-ul L1. Motivul este faptul că ambele nivele de cache rulează la frecvenţa internă a procesorului.18µ 0. primind informaţiile şi oferind imediat rezultatul cerut. este uşor de înţeles că soluţia aceasta pune procesorul în situaţia de a aştepta rezultatul în loc să execute alte operaţii.25÷0. Latenţa Latenţa reprezintă timpul (măsurabil în cicluri de tact) scurs de la solicitarea unei operaţii până la executarea efectivă a acesteia. Probabilitatea ca o instrucţiune sau o variabilă recent folosită să fie din nou necesară într-un interval scurt este foarte mare. Nivelul doi de cache deţine o latenţă de 19 cicluri pentru Northwood şi 28 pentru Prescott. a cărei frecvenţă de apariţie creşte odată cu creşterea frecvenţei procesorului. deoarece importanţa unui cache mare creşte odată cu creşterea diferenţei dintre viteza CPU-ului şi cea a memoriei. ceea ce duce.09µ 128 KB 512KB÷1MB 3 13 exclusiv 3. cu atât procesorul va solicita mai rapid informaţii. la scăderea performanţelor. Aceasta se datorează frecvenţei mari a procesorului. Cu cât frecvenţa procesorului este mai mare. un singur lucru nu poate: să stocheze date (excluzând cache-ul). cu atât diferenţa dintre viteza acestuia şi cea a memoriei creşte şi.

Nu este deloc o exagerare să afirmăm că SSE3 conţine ceea ce Intel a uitat să implementeze în SSE şi SSE2.. astfel că. cu un minim de suport atât hardware cât şi software. ultimele două optimizează modul de operare HyperThreading dar necesită suport din partea sistemului de operare. S-a dovedit faptul că două sarcini diferite. cel puţin din punct de vedere al cache-ului level 2. De aceea. cum ar fi două aplicaţii sau două thread-uri (ramuri) ale aceleiaşi aplicaţii lucrează mai rapid în acest mod. în caz contrar putând fi sesizate chiar şi scăderi de performanţă. ce cuprinde un număr mic de instrucţiuni în comparaţie cu precedentele versiuni. destinate operaţiilor cu numere complexe. SSE3 oferă avantaje minore diverselor sarcini ale aplicaţiilor multimedia.Evaluarea performanţelor sistemelor de calcul trebuie crescută dimensiunea cache-ului. stagiul 1: fetcher – pregăteşte următoarea instrucţiune stagiul 2: decoder – decodifică următoarea instrucţiune stagiul 3: ALU – execută instrucţiunea stagiul 4: retire unit – aduce rezultatul înapoi în memorie 42 . MMX a fost extins cu SSE (Streaming SIMD Extensions). însă sub care dacă tragem linie obţinem ceva remarcabil. fiecare stagiu ocupând exact timpul unui ciclu de tact. apoi cu SSE2 odată cu Pentium 4 iar Prescott a introdus SSE3. aplicaţiile de azi sunt mai sensibile la creşterea latenţei cache-ului decât la creşterea dimensiunii sale.1. Iată un exemplu de pipeline simplu. Aşteptăm cu interes dezvoltarea software-ului care să profite de SSE3. Northwood este mai rapid decât Prescott. Intel punând la dispoziţie versiunea a opta a compilatorului propriu de C++. software-ul comportându-se ca şi cum în sistem ar fi prezent. Asta dacă ar fi vorba doar de avantaje. SSE3 nefiind altceva decât unul din numeroasele avantaje minore ale lui Prescott. Pipeline-ul este împărţit în stagii. Acesta reprezintă suma unor etape pe care instrucţiunile trebuie sa le parcurgă până la obţinerea rezultatului final. Sporul de performanţă adus ar putea atinge 10 procente. Acesta reprezintă. Ce limbi vorbeşte? O altă caracteristică a lui Prescott (dar şi a altor procesoare din familia P4) este HyperThreading-ul. un set de instrucţiuni capabil să simuleze funcţionarea procesorului în mod dual. fiecare având o sarcină bine definită. Pe lângă cele 11 instrucţiuni diverse. De remarcat însă că există versiuni de Prescott fără aceste instrucţiuni. Intel a implementat tehnologia HyperThreading în ultimele procesoare Northwood. În 1997.. Din păcate. un al doilea CPU. Însă sporul maxim de viteză se obţine doar atunci când aplicaţiile sunt optimizate pentru acest mod de lucru. precum şi în majoritatea modelelor de Prescott. care „ştie” de SSE3. motivul fiind faptul că multe zone ale procesorului nu sunt folosite la adevăratul potenţial când execută o singură sarcină. 3. conversiei integer-FPU şi altele. Conductele Poate cel mai important aspect legat de noul Prescott este dat de pipeline (în traducere . fizic. cu scopul de a accelera aplicaţiile multimedia optimizate pentru acestea. în esenţă.conductă).4. cum ar fi compresia video. nefiind decât o completare a acestora. am descris-o pentru a putea fi înţeles paragraful următor. Intel a introdus instrucţiunile MMX (MultiMedia eXtensions). Deşi această tehnologie nu este specifică doar lui Prescott.

fiecare necesitând câte patru stagii. 43 . Desigur.5 GHz era depăşit deseori de un Pentium III la 1 GHz. Şi nu trebuie înţeles faptul că fiecare pipeline este legat de aceeaşi instrucţiune. în cazul ideal. Şi cu cât drumul pe care îl aveţi de parcurs este mai lung. Drept urmare. Este evident că şansele ca acest eveniment să aibă loc cresc odată cu creşterea numărului de stagii. care a crescut numărul de stagii odată cu apariţia primului Pentium 4 (Willamette): 20 faţă de 10 la Pentium III. performanţa este multiplicată de un număr de ori dat de lungimea pipeline-ului. Din păcate. pe fiecare ciclu fiind executate câte patru operaţii. în care procesorul nu se încălzeşte şi de care se poate profita. incomodându-i pe ceilalţi şoferi. Situaţia descrisă duce la apariţia timpilor morţi. trebuie să aşteptaţi pe cineva să vă aducă benzina. de ordinul a 4-5 GHz. elemente concepute să afecteze pozitiv viteza.Cap 3: Evaluarea performanţelor procesoarelor Desigur. atunci se va realiza un procesor cu un număr imens de stagii al pipelineului. veţi aştepta câteva ore în trafic. fiecare instrucţiune trebuie să treacă prin toate etapele pipeline-ului dar nu e necesar ca la un moment dat pipeline-ul să fie plin cu aceeaşi instrucţiune. SSE2 şi altele). frecvenţe irezistibile pentru orice cumpărător neavizat. eventual vă veţi retrage la marginea drumului pentru a evita neplăcerile pricinuite. crescându-i-se frecvenţa. dar pe alte căi. situaţia ideală nu este întâlnită niciodată pentru că instrucţiunile depind unele de altele mai mult decât pare la prima vedere. Spre exemplu. Un procesor care îşi propune să atingă performanţa maximă la o frecvenţă dată va realiza un compromis între avantaje şi dezavantaje. cu atât cresc şansele să rămâneţi fără combustibil. ceea ce ne oferă o viteză identică cu cea observată în execuţia secvenţială. În caz că nu există simultan mai multe instrucţiuni de prelucrat (situaţie practic imposibilă pentru că procesorul are permanent ceva de lucru). toate aceste operaţii puteau fi executate neorganizat. procesor care să „zacă” nefolosit o bună parte din timp. instrucţiuni SSE3. Astfel. tot mai multe instrucţiuni fiind „blocate în trafic”. Cum nu este nici o benzinărie prin zonă şi cum nimeni nu se oferă să vă tracteze. execuţia ei fiind amânată şi lăsând loc altor instrucţiuni care pot fi executate la acel moment. neţinându-se seama de performanţă. ALU-ul calculează poziţia icon-ului în interiorul ferestrei iar retire unit-ul returnează memoriei rezultatul copierii unor fişiere în background. Acelaşi lucru se întâmplă şi cu o instrucţiune dacă ea nu poate fi executată decât după ce primeşte de la alta un rezultat: ea va rămâne blocată în pipeline până când primeşte unda verde sau va fi eliminată din pipeline. semn că dezavantajul datorat pipeline-ului lung nu este compensat de frecvenţa ridicată. ci dimpotrivă. decoder-ul este ocupat cu decodificarea unei instrucţiuni de desenare a unui caracter în acea fereastră. dacă procesorul are de executat 100 de operaţii. Totul pentru a se putea atinge frecvenţe mari. însă pentru un pipeline cu patru stagii avem patru operaţii care sunt realizate simultan în locul uneia singure. Să presupunem că plecaţi de acasă cu maşina personală şi la jumătatea drumului vă daţi seama că nu mai aveţi benzină. Rezultatul a fost evident: cu toate îmbunătăţirile aduse de noua arhitectură (PSB 400 faţă de 133. ceea ce va duce la scăderea drastică a vitezei raportată la frecvenţă. al cărui număr de pipeline-uri a ajuns la 31 de stagii. Exact acest lucru a realizat Intel. etc. doar un singur stagiu al pipeline-ul va fi ocupat. avem şi avantaje: un cache dublu. fiind dotat cu un număr relativ redus de stagii. O situaţie similară o întâlnim şi la Prescott. Dacă scopul este atingerea de frecvenţe mari. un Pentium 4 la 1. fetcher-ul pregăteşte instrucţiunea de desenare a unei ferestre. vor fi necesare doar 100 de cicluri de tact în locul a 400. Totodată. Pipeline-ul a fost gândit tocmai pentru a oferi posibilitatea execuţiei simultane a mai multor instrucţiuni şi.

b = a + 4 3. Să presupunem că avem de efectuat trei adunări. procesorul rulând la o treime din potenţial. Şi anume. toate urmând a fi executate de câte o unitate ALU. rezultatul furnizat va fi incorect. bazându-se pe „experienţele” precedente. fără a evalua condiţia x=y. schimbările au fost minore. Prescott a necesitat modificări şi în această privinţă. nu cantitativă. cu sensul de a stabili ceva la un anumit moment). Aici intervine scheduler-ul. după care se ia o decizie: se merge pe ramura A sau B. Acesta. Un procesor „inteligent” se bazează pe faptul că timpii morţi pot fi folosiţi pentru execuţia următoarei instrucţiuni. nu ar fi activă decât o singură unitate la un moment dat. Intel a îmbunătăţit predicţia. Modificările sunt minore dar importante şi de natură calitativă. Exemplu: if x=y then { ramura A } else { ramura B } Cu ajutorul unităţii de predicţie (branch predictor). dând astfel câte o sarcină fiecărei unităţi ALU. nelegate de cele de mai sus.) Pentru Prescott. O altă unitate a procesorului este scheduler-ul. situaţia doar va genera timpi suplimentari. a = 1 + 2 2. cu atât acurateţea ei este mai mare iar cazurile în care este aleasă ramura greşită sunt mai rare. motivul fiind faptul că un pipeline mai lung avea nevoie stringentă de acest lucru. De data aceasta nu este vorba de ramuri cu instrucţiuni ce vor fi probabil executate ci de unele care vor intra sigur în execuţie. Dar ce ne facem când instrucţiunile depind una de alta. ca şi branch predictor-ul. Ce se întâmplă atunci când instrucţiunea curentă depinde de cea precedentă. pentru a compensa creşterea numărului de stagii al pipeline-ului. 44 . Cum arhitectura curentă nu permite o modificare puternică a acestei unităţi. nu a fost mărit Branch Target Buffer-ul (spaţiul de memorie din procesor destinat depozitării acţiunilor precedente. care programează execuţia altor instrucţiuni. Cu cât algoritmul predicţiei este mai bun. Ceea ce înseamnă că o singură unitate ALU din cele trei va fi folosită. pe baza cărora algoritmul să prevadă acţiunile viitoare) ci algoritmul a fost optimizat. ramura care are şansele cele mai mari să fie adevărată. (Nu trebuie înţeles faptul că. Pentru execuţia unei anumite ramuri trebuie executată instrucţiunea if.Evaluarea performanţelor sistemelor de calcul Un procesor clasic execută fiecare instrucţiune în ordinea firească. aşteptând terminarea fiecăreia până să treacă la execuţia celei următoare. însă fără acest scheduler (to schedule = a programa. c = b – a Este clar că numai după execuţia primei instrucţiuni va putea fi executată cea dea doua şi numai după execuţia primelor două va putea fi executată cea de-a treia. Procesoarele moderne deţin mai multe unităţi independente care îndeplinesc aceeaşi sarcină (spre exemplu. toate modelele de Pentium 4 deţin trei unităţi de calcul cu numere întregi – ALU). fiind necesară obţinerea rezultatului de pe urma execuţiei acesteia? Un caz clasic este acela al unui bloc if-then-else din cadrul oricărui limbaj de programare. este conceput pentru a creşte eficienţa CPU-ului. precum se poate vedea în exemplul următor: 1. procesorul va executa. pentru a-l determina să lucreze la potenţialul maxim de care dispune. la alegerea ramurii greşite.

1. Mai mult. indiferent de alte considerente. Calculul matematic Numărul de unităţi a rămas acelaşi ca la precedentele modele de P4. reprezentat 45 . necesarul de tensiune de funcţionare scade. Intel a încercat să elibereze al treilea ALU (cel lent) de sarcinile pe care oricum le îndeplinea cu greutate.6. este specializată în astfel de operaţii şi poate furniza rezultatele mai rapid. Segmentul ALU (Arithmetic and Logic Unit). Pe de altă parte.4 GHz.Cap 3: Evaluarea performanţelor procesoarelor 3.1. printre care posibilitatea selectării tensiunii în paşi mai mici (0. Dezavantajul: toate plăcile de bază trebuie să suporte acest standard. Astfel.0 (VRM = Voltage Regulator Module).13 microni) a atins 3. cel care se ocupă cu calcule legate de numere întregi. Chiar dacă acesta din urmă este special conceput pentru frecvenţe mari. Un exemplu practic de îmbunătăţire este acela în care sunt aplicate unui număr binar operaţii de multiplicare cu 2 (10 binar). adică posibilitatea ca procesorul să-şi schimbe tensiunea „on the fly”. modul µPGA a dominat modelele acestei companii. deci ar fi greşit să afirmăm că. Ambalarea Deşi nu are legătură cu arhitectura lui Prescott.18 microni) care se oprea fără drept de apel la 2 GHz pe când Northwood (0. datorită consumului excesiv. un CPU construit pe baza unei tehnologii mai „fine” şi rulând la un voltaj mai mic va fi mai rece. frecvenţe mai mari de funcţionare. cu utilitate evidentă în cazul sistemelor mobile. caz tipic de shift în care este suficientă deplasarea cu câte un pas a fiecărui bit. De asemenea. Ca să nu o mai lungim. oferind unităţilor ALU double pumped mai multe sarcini. La 3. pe de o parte temperaturi de rulare mai scăzute şi.025V la predecesori) şi Dynamic VID. pe de altă parte. arhitectura internă influenţează puternic factorii putere disipată şi temperatură de funcţionare.0125V faţă de 0.7. un Northwood disipă 89W faţă de 103W în cazul lui Prescott. operaţiile de tip shift şi rotate erau executate de ALU-ul lent.287V. Două dintre ele lucrează la o viteză dublă faţă de restul unităţilor (sunt double pumped). Tensiunile Se ştie că prin creşterea „fineţii” tehnologiei se pot obţine. menţionăm că Intel a introdus un nou mod de a „împacheta” procesorul. 3. înmulţirile sunt acum realizate de unitatea FPU (Floating Point Unit). de la 1. Prescott este compatibil cu standardul VRM 10. În trecut. care consumă mult. de aceea operaţiile se execută foarte rapid. nu doar din BIOS. denumit LGA775. ceea ce îi conferă câteva avantaje. 3. deci plăcile vechi nu au nici o şansă să lucreze cu Prescott. Odată cu Prescott. socket-ul purtând denumirea de Socket T. Să ne amintim de P4 Willamette (0. plăcile de bază trebuie să suporte acest consum. În fine. este nevoie de măsuri speciale de precauţie: în primul rând. Prescott este un procesor mai fierbinte decât se dorea a fi. iar Prescott coboară până la 1. a rămas divizat în trei segmente care pot prelucra datele şi instrucţiunile independent. în al doilea rând sistemul de răcire trebuie să fie foarte bine pus la punct.5.1. care chiar dacă teoretic este mai lentă decât ALU-ul.5V pentru Northwood.75V pentru Willamette s-a ajuns la 1. conform celor descrise în paragraful anterior.4 GHz. acum ele au fost preluate de celelalte două mai rapide.

contactul realizându-se prin alăturarea directă a procesorului de socket. Cea mai nouă revizie.facilitate care permite ajustarea tensiunii de 46 . C0. Recent. Versiuni de Prescott-uri Există până în prezent câteva revizii ale lui Prescott. cei care doreau să atingă maximul de performanţă prin overclocking erau dezamăgiţi. care asigură o minimă protecţie împotriva celor mai uzuali viruşi. plăcile de bază cu regulatoare de tensiune mai slabe nu făceau faţă curenţilor mari. stresând în acelaşi timp şi sursa sistemului. procesoarele ce purtau acest însemn fiind extrem de fierbinţi şi producând diverse neplăceri. această politică a fost schimbată. De asemenea. o mai mare atenţie trebuia acordată fluxului de aer din carcasă. de a putea rula orice cod din orice zonă de memorie.deoarece au existat şi reviziile A0 şi B0 dar informaţiile despre acestea sunt practic inexistente). era clar: spatele chip-ului cuprindea un număr mare de pini care erau inseraţi într-un socket. locul frecvenţei fiind luat de un număr. Astfel. procesorul fiind acum o sursă enormă de căldură. Intel a remediat problema şi a introdus a doua revizie. consumul de putere putând depăşi 100W. fiind prima companie care a introdus într-un procesor de larg consum această tehnică. Enhanced Halt State . AMD. foloseşte de multă vreme altă unitate de măsură (rating-ul) pentru a caracteriza procesoarele. Prima revizie (uzuală .1. Aspectele mai importante ale lui E0 constau în primul rând în adăugarea de facilităţi suplimentare. Dacă concurentul său. Principiul. Intel a utilizat până acum modul consacrat. folosit la toate procesoarele de la 80386 până în prezent. Mai mult. Intel a schimbat şi modul de a marca produsele sale. putând afecta buna funcţionare a sa şi a componentelor din jurul său dacă nu erau luate măsuri de precauţie. iar AMD a fost mai „sprinten”. Tehnologia a fost până acum implementată de Intel doar în modelele pe 64 de biţi (Itanium).Evaluarea performanţelor sistemelor de calcul de Socket 478. în general. îmbunătăţeşte şi mai mult caracteristicile termice ale procesoarelor însă de data aceasta sporul este minor. Practic. generau „pierderi de putere” (power leakage). Astfel. de exemplu. Tocmai de aceea. diferenţele dintre acestea fiind minore sub aspectul funcţionalităţii şi inexistente când vine vorba de performanţe. Astfel. sistemul de operare (Windows XP SP2. şi anume specificarea frecvenţei de funcţionare. noul P4 neputând face faţă temperaturilor mari. denumite stepping-uri. Noul mod de împachetare LGA (Land Grid Array) elimină aceşti pini (cel puţin partea vizibilă a acestora). viruşii bazându-se. denumită D0.tehnologia antivirus de care vorbeam mai devreme.40 GHz. Intel a specificat în mod expres temperatura maximă ambiantă la care procesoarele sale pot lucra: 38 de grade.8. de exemplu) se foloseşte de această funcţie a procesorului pentru a marca diferite segmente de memorie ca fiind neexecutabile. odată cu trecerea la o tehnologie de fabricaţie tot mai mică. realizându-se astfel contactul. cunoscută şi ca EDB (Execute Disable Bit) sau NX (No eXecute). 3. Pentium 4 550 desemnează un P4 ce rulează la 3. suferea de boli ale copilăriei. tocmai pe această slăbiciune a sistemului. numită (cum altfel?) E0. în schimb socket-ul poate fi deteriorat destul de uşor prin montarea repetată a procesoarelor. îmbunătăţind eficienţa funcţionării tranzistorilor care. îndoirea sau ruperea pinilor nu mai poate avea loc. Odată cu apariţia acestui mod de împachetare. cum ar fi Execute disable sau XD . Modelele cu sufixul J (de exemplu 550J) beneficiază de tehnologia antivirus XD (eXecute Disable). doar codurile marcate în mod explicit ca executabile pot fi rulate.

Fedora Core. Scopul este evident: costuri mai scăzute. Intel a adăugat în procesoarele sale suport pentru EM64T (Extended Memory 64-bit Technology). ceea ce reprezintă a doua limitare. care „punea procesorul pe tuşă” în totalitate ori de câte ori temperatura depăşea limita. cache-ul L2 a fost redus la 128 KB (faţă de 256 KB pentru P4 Willamette şi 512 KB pentru P4 Northwood). ce a devenit din ce în ce mai răspândit. Răspunsul este legat de software-ul conceput pentru AMD64. scăzând-o în momentul în care nu este nevoie de putere de procesare. Pe când EM64T nu este decât o copie a instrucţiunilor dezvoltate de texani. pentru care performanţele contează mai puţin. acest lucru afectând puternic performanţele. Intel a ţinut mult timp secret acest „supliment”. În privinţa versiunii care „se trage” din Pentium 4. Al doilea factor este frecvenţa PSB. fiind o variantă de Pentium II cu performanţe ceva mai mici. Aceasta din urmă reprezintă răspunsul lui Intel la tehnologia AMD64 care deja începuse să „prindă” pe piaţă server-elor. Practic. fiind pentru prima dată când gigantul californian a realizat o clonă a unei tehnologii AMD. motivul principal fiind promovarea de către al său concurent a aceleiaşi tehnologii. în aceeaşi perioadă cu introducerea noii revizii. de câţiva ani. astfel. totuşi 47 . începând cu MMX şi terminând cu SSE3. istoria spunând că tendinţa este inversă. Mandrake etc). motiv pentru care majoritatea chip-urilor E0 deţin EM64T. SuSE. aproape sigur prezent dar dezactivat încă de la prima revizie a lui Prescott. pe când procesoarele Itanium rulează extrem de lent codul pe 32 de biţi deoarece IA64 reprezintă o arhitectură complet nouă. limitarea a fost legată de trei aspecte: în primul rând. trebuie ţinut cont că prima parte a acestui cache afectează cel mai mult viteza de lucru. precum Red Hat. Ne putem pune întrebarea de ce Intel a implementat în procesoarele sale această tehnologie care nu-i aparţine. creşterea de la 256 la 512 KB contează mult mai puţin decât creşterea de la 128 la 256 KB. iar setul de instrucţiuni „made in Santa Clara” se numea.1. Primul Celeron a apărut la începutul anului 1998.9. Gentoo. 3. Deşi arhitectura sa a suferit schimbări majore.funcţie prin care se poate ajusta frecvenţa procesorului în cazul în care temperatura sa depăşeşte pragul maxim admis – aceasta spre deosebire de senzorul termic iniţial. toate procesoarele compatibile EM64T putând rula fără probleme aplicaţii IA32. IA64.Cap 3: Evaluarea performanţelor procesoarelor alimentare a procesorului în mod dinamic. IA64. Chiar dacă diferenţa nu pare colosală. Primele versiuni de P4 (Willamette) rulau cu acest bus la 400 MHz iar a doua versiune. fapt ce conduce la un consum de putere şi căldură degajată mai scăzute şi Thermal Monitor 2 . Alte procesoare din familia P4 Celeron este numele comercial al unui procesor în mare parte identic cu versiunea „de prim rang” dar care suferă de anumite limitări. EM64T este o extensie a setului IA32. deci acoperirea unei categorii din piaţă dornică de un preţ foarte mic. existând versiuni ale sistemelor de operare destinate acestei arhitecturi atât de Windows XP şi 2003 Server cât şi de Linux (în diverse distribuţii. Nu vom insista asupra acestei perioade ci vom menţiona că Celeron a fost omniprezent pe piaţă de atunci şi până în prezent. Însă Celeron a rămas la 400 MHz. l-a crescut la 533 şi apoi la 800 MHz. AMD copiind sau urmând să copieze fiecare set de instrucţiuni Intel. Această arhitectură este compatibilă cu cea AMD64 şi incompatibilă cu cea pe care Intel a promovat-o mult timp prin seria de procesoare Itanium. fiecare model de Celeron a avut la bază nucleul fratelui mai mare. P4 Northwood. ce oferea în plus regiştri şi mod de adresare pe 64 de biţi. Pe lângă toate acestea.

şi anume Duron. • pipeline crescut cu circa 50%.10. fiind recomandat doar utilizatorilor care doresc neapărat un procesor Intel dar dispun de fonduri limitate.09 microni (90 nm) Strained Silicon. Şi aici un avantaj de 2-3%. rezultând o predicţie şi o execuţie a instrucţiunilor mai eficientă. şi anume Athlon 64 FX-51. de unde şi succesul foarte redus al acestui model. performanţele sporite faţă de varianta veche transformă acest Celeron D într-un procesor cât se poate de decent pentru orice aplicaţie. dublu faţă de Celeron-ul vechi. Al treilea factor. În plus. preţul. Celeron D este numele noului Celeron. şi puţin important. Astfel. a fost stabilit la nişte valori exorbitante. acest L3 a contat extrem de puţin în materie de performanţă dar a făcut diferenţa. ea reprezentând la data lansării singurul model de Pentium 4 care rula la această frecvenţă de bus. 48 . Diferenţele faţă de acesta constau. • 13 instrucţiuni noi. adică relativ slabe în comparaţie cu Pentium 4 sau chiar cu versiunea low-end de la AMD. Intel a introdus un model de Pentium 4 cu un al treilea nivel de cache. îl privesc şi pe Celeron D.1. Celeron a căpătat o reputaţie negativă. Arhitectura lui P4EE a fost preluată de la Gallatin. dar cu 33% mai mult decât la Celeron. care pot aduce avantaje minore în anumite aplicaţii. este absenţa funcţiei HyperThreading.Evaluarea performanţelor sistemelor de calcul nu atât de drastică în comparaţie cu cea descrisă anterior. • tehnologiile antivirus XD şi EM64T. Aşadar.18 şi respectiv 0. • cache pe de o parte îmbunătăţit. • optimizarea execuţiei anumitor operaţii. deşi nesemnificativ în realitate. totuşi este vorba de optimizări strict necesare unui pipeline atât de lung. Pentium 4 Extreme Edition şi-a făcut apariţia datorită nevoii lui Intel de a concura (a se înţelege cel puţin a egala. a fost introdusă şi o versiune cu un PSB de 1066 MHz. Aceasta înseamnă că toate aspectele enunţate mai devreme care privesc Pentium 4 Prescott. În plus. implementate doar în ultimele modele. Acesta dispunea de avantaje minore dar observabile în cifre în cadrul diverselor teste realizate de reviste şi site-uri. • branch predictor-ul şi scheduler-ul îmbunătăţite. prin dublarea secţiunii de date a nivelului 1 şi în totalitate a nivelului 2 şi prin creşterea eficienţei sale. Desigur. dimensiunea sa fiind de 256 KB. având la bază nucleul Prescott. ceea ce determină o scădere masivă de performanţe dar şi un potenţial crescut privind frecvenţa de funcţionare. în absenţa a trei sferturi din cache-ul L2. Specificaţiile sale fiind similare (afară de tehnologia folosită – 0. acesta având o dimensiune de 2 MB. 3. performanţele au fost identice la frecvenţă identică. poate decide succesul sau insuccesul unui produs.13 microni). cuprinse în setul SSE3. vom recapitula noutăţile aduse de Prescott: • tehnologie de 0. în principal. PSB-ul a fost limitat la 533 MHz (faţă de majoritatea P4 Prescott-urilor care lucrează la 800 MHz). Celeron a existat atât în versiune cu nucleu Willamette cât şi Northwood. Concluzii Pentru cei care nu au avut răbdare să ne urmărească până aici. cu sprijinul acestora. Drept urmare. în schimb. precum înmulţirile. pe de altă parte suferind de handicapul creşterii latenţei. de preferinţă a depăşi) cel mai rapid procesor de la AMD. un Northwood uşor modificat.

49 . în special familiile 915 şi 925 au oferit facilităţi noi. doar Intel 848P. dotări demne de a fi menţionate. nimic nu mai este ca înainte. Astăzi degeaba „ne scăldam” cu 3. 910GL. Aceasta pentru limitarea în privinţa jocurilor.3. Astfel. DDR2.2. odată cu atingerea barierei de 1GHz.. vorbind din punctul de vedere al chipset-ului. criteriul de stabilire al performanţei fiind doar frecvenţa acestuia.11.. care susţin cu tărie ori că produsele de la Intel sunt mult superioare celor AMD (şi acest "mult" este nelipsit). micşorare de proces de fabricaţie. Intel 925XE suportă suplimentar şi PSB-ul de 1066 MHz de care dispune modelul de Pentium 4 Extreme Edition la 3.0. Putem observa mai sus două generaţii de chipset-uri: 8xx şi 9xx. uneori RAID şi Serial ATA. În plus. Primele. Dar din ce în ce mai puţini cumpără procesoare de dragul tehnologiilor. 875P. a început să fie dată de placa grafică. noi nume de căi. GV) şi 925 (X şi XE) suportă acest PSB (să ne reamintim faptul că majoritatea modelelor de Prescott rulează la un PSB de 800). G şi GV). 865 (în versiunile PE. Fiecare schimbare de arhitectură.4 GHz cu FSB 800 nu poate fi montat pe o placă de bază cu chipset Intel 845PE. Trebuia să se întâmple ceva. la acea vreme. apărute în prima parte a anului 2003. G.Cap 3: Evaluarea performanţelor procesoarelor 3. Anumiţi producători au depăşit specificaţiile chipset-ului. oferind dotări precum AGP 8x şi USB 2. precum PCI Express.46 GHz. creştere în frecvenţă. erau adaptate la procesoarele acelei perioade. 3. cele mai avide de performanţă. Revistele de specialitate abundau de materiale care prezentau pe câteva pagini cum noile (pe vremea aceea) AMD K6 şi Cyrix 6x86 „zdrobeau” (pe ici pe colo doar în punctele esenţiale) performanţa Pentium-urilor. Următoarea generaţie. ori invers. viteza brută a procesorului pierzând mult din importanţă. Arhitectura procesoarelor AMD64 3. Singura condiţie este ca chipset-ul să deţină suport pentru un PSB cel puţin egal cu cel al procesorului. fani Intel sau AMD. procesorul a încetat să mai reprezinte punctul de atracţie. Tocmai pentru această categorie se duce bătălia între cele două companii. un P4 la 2. care nu suportă (cel puţin oficial) această frecvenţă de bus. Dacă acum cinci ani vedeam încărcarea Windows-ului de două ori mai rapidă pe un procesor la 500 MHz decât pe unul la 200MHz.8 GHz dacă rulăm Half Life 2 pe un Radeon 9200 pe 64 de biţi. dual-channel DDR. cel puţin cea vizibilă prin marketing. garantând funcţionarea plăcilor lor la un PSB superior celui suportat de chipset. ele făcând tot posibilul pentru a-şi satisface fanii. trebuie anunţată cu surle şi trâmbiţe de-o parte şi de alta. facilităţi utile anilor 2004 şi mai ales 2005. 915 (P. adăugare de cache. Însă. Anexă: Chipset-uri pentru Pentium 4 Nu putem spune că există anumite chipset-uri specifice lui Prescott pentru că orice chipset uzual lucrează fără probleme cu noul P4 şi totodată toate chipset-urile nouapărute. lansate în preajma apariţiei lui Prescott lucrează fără probleme cu procesoarele mai vechi. Procesorul a rămas important doar pentru cârcotaşi. pe ambalajul oricărui produs.1. Trecut şi prezent Competiţia procesoarelor din urmă cu câţiva ani era mult diferită faţă de cea actuală. Situaţia s-a schimbat în timp.

Soft-urile uzuale pe 32 de biţi au început să răsară abia la începutul anilor ’90. Există totuşi o veste bună: deja o serie de sisteme de operare utilizează la maxim noile procesoare AMD. destinate server-elor. El era dotat cu un set nou de instrucţiuni.Evaluarea performanţelor sistemelor de calcul Şi s-a întâmplat! AMD a amanetat herghelia1 pe o tehnologie nouă. şi Intel a adoptat recent aceste instrucţiuni. au devenit sisteme de operare uzuale. Mai mult. Abia Windows 2000 şi mai ales Windows XP. Windows NT exista de ceva vreme pe piaţă dar el era adresat celor care azi folosesc procesoare Opteron. Pentru a justifica afirmaţia. aşa că nu poate intra în discuţie.1. ne putem da seama că AMD a întors foaia şi vrea să ne răsfeţe cu ceva complet nou. pe 64 de biţi. mai târziu. un adevărat talmeş-balmeş de cod pe 16.3.Athlon).. Dacă primul aspect este legat în viitor. Este discutabil care dintre instrucţiunile pe 64 de biţi şi integrarea controllerului de memorie este mai importantă. ele. În rest. Athlon 64 FX şi. Nu este deplasat să anticipăm un fenomen asemănător cu privire la instrucţiunile pe 64 de biţi. controller-ul de memorie (până acum prezent în northbridge-ul plăcii de bază) scapă sistemul de o gâtuire extrem de deranjantă.ro/content-62-page1. la nu mai puţin de 15 ani de la lansarea primului procesor capabil (teoretic. Revistele şi site-urile de profil au publicat ştirile corespunzătoare şi. nimeni nu a zis nimic. 1 http://www. 3.xf. Să vedem prin ce se diferenţiază de arhitectura K7. Abia la aproape un an distanţă au ieşit la lumină nişte procesoare utilizabile de către oamenii obişnuiţi: Athlon 64. iar prima tentativă de sistem de operare pe 32 de biţi a fost Windows 95. atât. 80386. implementarea instrucţiunilor SSE2 sau creşterea uşoară a numărului de stagii ale pipeline-ului sunt schimbări fireşti pentru care nu s-a făcut prea mare tam-tam. Cel puţin nu în acest moment. precum Windows XP x64 Edition sau o serie de distribuţii de Linux. versiunile iniţiale fiind Sledgehammer (Opteron) şi Clawhammer (Athlon 64). Numele de cod au purtat denumirea generală Hammer. După nume (K8).şi 32-bit.dar sub o cu totul altă formă . denumind setul EM64T. deşi departamentul de marketing a lucrat serios la imaginea noii progenituri. căci acesta este numele său. Nucleul s-a numit K8 (în contrast evident cu precedentele K6 şi K7 . Iniţial. Cei 64 de biţii Să începem cu începutul.în procesoarele Intel Itanium. vom face o călătorie în istorie. spre deosebire de cele AMD64. Aceasta pentru că Opteron. mai exact în 1985. capabil să acceseze până la 4 GB de memorie (faţă de cei 16 MB ai celor pe 16 biţi) şi să ofere performanţe de invidiat dacă era folosit la potenţialul său maxim. Ele sunt prezente de ceva timp . nu şi din punct de vedere al vitezei) să le utilizeze. modificările sunt minore. extinderea setului IA32 la cel denumit acum AMD64 ducând la crearea unui potenţial suplimentar de performanţă şi nimic mai mult. Sempron. când Intel lansa primul procesor pe 32 de biţi. ce sunt programate complet pe 32 de biţi. nu lucrează nativ cu cod IA32. Am spus mai devreme că cei 64 de biţi nu afectează în mod esenţial performanţa.html 50 . era creat pentru un domeniu destul de ciudat al computerelor: server-ele de mare performanţă..

compatibility 32-bit mode şi 64-bit long mode. la fel cum 80386 putea comuta între modul real şi cel protejat. Unii necesită operaţii cu numere pe 64 de biţi.). (Observaţie: tehnic vorbind. la cifra zecilor ne mai rămâne 6. economisindu-se mult timp. Comunicarea dintre memorie şi procesor se realiza prin bus-ul denumit până acum PSB sau (incorect dar încetăţenit) FSB. Memoria. De remarcat următorul fapt: K8 nu va rula mai rapid (dar nici mai lent) decât K7 codul pe 32 de biţi sau. 15-8=7. capabil să execute instrucţiunile precum orice procesor pe 32 de biţi. ca orice entitate din interiorul sistemului de calcul. legacy 32-bit mode. Memoria gestionată direct din procesor O altă noutate adusă de generaţia K8 este faptul că de acum nu chipset-ul va mai fi răspunzător de memorie ci însuşi procesorul. E drept.2.Cap 3: Evaluarea performanţelor procesoarelor Nu trebuie însă să ne bucurăm prea mult pentru că schimbarea nu poate avea loc de la o zi la alta şi va trece mult timp până ce vom vorbi de aceste sisteme de operare la fel cum vorbim azi de cele pe 32 de biţi care sunt prezente în marea majoritatea sistemelor de calcul moderne. trebuie să fie gestionată de un controller care să realizeze comunicarea dintre aceasta şi elementul central. procesorul a preluat sarcina. Trebuie să privim instrucţiunile AMD64 ca pe o extensie la setul IA32.3. Folosind o maşină 32-bit. ce reprezenta una dintre gâtuirile principale de care sufereau procesoarele rapide. compatibility 16-bit mode. este vorba de nişte regiştri suplimentari incluşi în nucleul procesorului. Să luăm un exemplu: algoritmii de criptare. Practic. similar celui aplicat de om pentru orice adunare sau înmulţire. împrumutăm o zece. Dacă el deţine un controller DDR SDRAM. Orice procesor pe 64 de biţi poate realiza „dintr-un foc” operaţia. (vă mai aduceţi aminte de „75-18. De fapt dezavantajul: cel care decide ce tip de memorie poate fi folosită în sistem este procesorul. ele se vor datora altor motive decât prezenţa noului set de instrucţiuni. care pot efectua operaţii cu numere pe 64 de biţi (până la 2 la puterea 64). northbridge-ul integra acest controller însă. Memoria maximă adresabilă a crescut şi ea de la 64 GB la procesoarele IA32 cu PAE (Physical Addressing Extensions) activat la 1 TB. Totuşi. K8 este transformat într-un procesor normal. nu ca pe un înlocuitor. dar cei 64 GB precedenţi se aflau în mod sigur la limită. le punem unul sub altul. traficul dintre procesor şi celelalte componente desfăşurându-se mult mai fluent. nicidecum o necesitate a momentului. pot fi prelucrate simultan de două ori mai multe date. 3. să nu ne bucurăm prea mult de noua reuşită a celor AMD şi să prezentăm şi dezavantajele. dublarea numărului de regiştri şi practic triplarea spaţiului de memorare a acestora (măsurabil în biţi – 3072 faţă de 1280) conduce la posibilitatea menţinerii de date în procesor pentru mai mult timp. Cei 64 de biţi au reprezentat în primul rând un instrument de marketing pentru AMD. 6-1=5. deci rezultatul e 57” ?). Procesorul este capabil să comute între legacy mode şi long mode în funcţie de necesităţi. fiind mai rar necesară schimbul cu memoria principală. dacă performanţele vor diferi. procesorul. e puţin probabil ca acum un server să necesite atât de multă memorie. 5-8 nu se poate. este imposibilă obţinerea directă a unui rezultat. De asemenea. În legacy mode. Până acum. singura metodă de calcul fiind crearea unui algoritm care să realizeze acest lucru. din raţiuni de viteză. însă descrierea lor în detaliu nu face subiectul cursului de faţă. atunci va fi imposibilă „asortarea” lui cu una de tip DDR2 51 . programatorul are la dispoziţie 5 moduri: legacy 16-bit mode. Astfel.

de schimbarea procesorului depinzând schimbarea memoriei şi invers. În sistemele obişnuite. Există un aspect ciudat dar foarte important pentru cei interesaţi de overclocking (dar nu numai) care trebuie explicat în acest context. e suficient să ne gândim că lăţimea de bandă obţinută este de 800 MHz x (32/8) bytes = 3. Astfel. şi pe 64 sau 128 de biţi. ce serveşte. pe o platformă K7 cu un chipset nForce2. de exemplu. De aceea. De exemplu. depăşind de 6 şi respectiv 3 ori arhitecturile celorlalte două CPU-uri. 3. 5:6 sau 2:3 în cazul în care considerăm frecvenţele efective. în funcţie de numărul de canale. PSB-ul efectiv fiind de 400 MHz. Motiv: controller-ul de memorie trebuie să lucreze în strânsă legătură cu PSB-ul. De ce inferioară? Pentru că nu se poate permite memoriei să ruleze la o frecvenţă superioară celei dorite. Deşi el este conceput pe doar 32 de biţi (16 biţi pentru transmisie. 166 şi respectiv 133 MHz teoretici (sau 1:1.3. numit iniţial LDT (Lightning Data Transport).3 GB/s ai lui PEG x16. memoria rulează la o frecvenţă egală cu frecvenţa PSB înmulţită cu un raport fix de numere mici. bus-ul este o componentă a PSB-ului. Ceea ce înseamnă că nu vom putea folosi la întreaga capacitate o placă grafică PCI 52 .Evaluarea performanţelor sistemelor de calcul sau RDRAM. În cazul nostru. În cazul lui P4. Ce ne facem când controller-ul este integrat în procesor? El va primi de la acesta n biţi şi va transmite mai departe m.2 GB/s. Arhitectura K7 beneficiază de bus-ul EV6. HyperTransport Comunicarea dintre procesor şi chipset se realizează prin bus-ul HyperTransport (pe care îl vom numi în continuare HT).5) inferioară acesteia. respectiv a bus-ului PSB. Un HT de 1 GHz (prin cei 4 GB/s) se apropie de cei 4. Raţiuni tehnice împiedică rapoarte gen 2:29. situaţia este mai fericită. 16 pentru recepţie – cazul cel mai frecvent) la o frecvenţă de tipul 800 sau 1000 MHz.4 GHz. s-au ales nişte divizori întregi. K8 se va situa mult deasupra ambilor concurenţi. cum ar fi necesar dacă procesorul ar rula la 2900 MHz iar memoria în DDR400. şi invers – unde n şi m sunt direct proporţionali cu frecvenţa memoriei. memoria va rula. în exemplul nostru. el fiind unul universal. şi anume la frecvenţa memoriei. adică 200. frecvenţa memoriei fiind 1:15. ultimele două având un PSB de 200 MHz reali.3. Bus-ul nu este conceput special pentru această platformă. ce dublează frecvenţa. bus-ul Quad Pumped ridicând această frecvenţă la 800 MHz efectivi. de 400. Astfel. upgrade-ul este mai problematic. de exemplu. în funcţie de tipul controller-ului integrat: singlesau dual-channel.33 MHz în loc de cei 200 solicitaţi. la 1:2. Frecvenţa însă a crescut la valori impresionante. spre exemplu. din motive evidente. Să luăm ca exemplu trei procesoare: unul K8. adică puţin peste valoarea lui AGP 8x dar sub cea oferită de PCI Express X16. dacă avem un PSB de 400 MHz. bus-ul dintre procesor şi controller-ul de memorie rulând la 2400 MHz. unul K7 şi altul Pentium 4 ce rulează la 2. dar cea care afectează cel mai puţin performanţa şi care depinde exclusiv de chipset. şi la comunicarea dintre southbridge-ul şi northbridge-ul chipsetului nForce2 (deci în cadrul platformei K7!). 5:12 sau 2:6 din această frecvenţă. 333 şi 266 MHz). memoria va rula la doar 193. trebuie ştiut că acest lucru nu afectează aproape deloc viteza de lucru. cea mai apropiată valoare de 2:29 (adică 1:14. la fiecare n biţi primiţi de la memorie trebuind să transmită m biţi către procesor. deşi există o „bătălie pe viaţă şi pe moarte” privind „cine scoate cel mai rapid HyperTransport”. ea fiind acum egală cu frecvenţa procesorului. însă raportul trebuie să fie unul de numere mici. Astfel. Lăţimea bus-ului dintre procesor şi controller-ul de memorie a rămas aceeaşi ca la vechile sisteme: 64 sau 128 de biţi. Comunicarea dintre controller şi memorie se desfăşoară la aceeaşi viteză.

ca şi la generaţia anterioară. Fiecare procesor are acum maxim trei legături (Hyper Transport Links): una prin care este legat de chipset (prezent şi la sistemele cu un singur procesor) şi altele două prin care putea „lua legătura” cu alte două procesoare. Gestionarea memoriei de către procesor este realizată în două moduri: adresare reală şi adresare virtuală. înseamnă că nivelul al doilea de cache nu include şi o imagine a celui dintâi (în contrast cu relaţia inclusivă întâlnită la Pentium 4). Cache-ul La AMD64. Sporul adevărat apare în sistemele multiprocesor unde.Cap 3: Evaluarea performanţelor procesoarelor Express. ca la orice procesor modern.4. Desigur. neputând adresa una ce aparţinea altui CPU. Uneori este mai util ca adresarea să se facă relativ la altă locaţie decât la mod absolut. Nu putem nega dezavantajul ce rezultă de pe urma folosirii acestui bus. Tot legat de cache. Relaţia dintre ele este exclusivă.3. 3. ceea ce Fig. cel USB 2.1: În plus. spre deosebire de alte platforme. schema de interconectare între 8 procesoare. Iată.1: Schema de interconectare între 8 procesoare. Reprezintă acest lucru un dezavantaj? Cu siguranţă nu. lăţimea de bandă dintre procesor şi controller-ul de memorie nu este împărţită în mod egal între procesoare. jocurile de azi nefiind limitate aproape deloc de o lăţime de bandă echivalentă cu AGP 4x (circa 1 GB/s). de exemplu controllerul IDE. Bus-ul HT realizează legătura şi cu celelalte componente. unde fiecare procesor avea alocată o zonă specifică de memorie. notăm o creştere a numărului de intrări în TLB (Translation Lookaside Buffer) pentru ambele nivele de cache. de exemplu. interconectarea dintre procesoare este supusă specificaţiilor NUMA (Non-Uniform Memory Access) prin care se asigură posibilitatea oricărui procesor de a accesa orice zonă de memorie. 3. adică precizând distanţa de la altă adresă şi nu pe cea de la punctul zero. eficienţa nivelului doi este mai redusă datorită unui transfer mai frecvent dintre L1 şi L2. dar el este extrem de mic.0 sau chiar cel SCSI. Viteza comunicării dintre cele două nivele a fost dublată. de aici rezultând încă un plus de performanţă faţă de arhitectura K7. spre deosebire de tehnica shared. Astfel. lucru reflectat de un test ce poate fi realizat de către oricine: cele mai multe plăci de bază permit ajustarea frecvenţei HT şi un scurt 3DMark rulat la mai multe frecvenţe ne poate lămuri că diferenţele sunt infime. figura 3. trebuie să explicăm ce este acest TLB. trebuie spus că sistemele obişnuite nu sunt afectate foarte mult de prezenţa acestuia în procesor: latenţele reduse nu au crescut niciodată la valori impresionante performanţele. Revenind la controller-ul de memorie. TLB este o mică zonă de memorie integrată în nucleul procesorului care 53 . această memorie intermediară este stratificată pe două nivele integrate în CPU.

dar pentru cel de-al doilea a fost micşorată. cu atât există şanse mai mici ca ramura curentă de execuţie să fie incorectă. ambii producători schimbând între ei tehnologii (Intel a preluat de la texani setul AMD64).3.3. La K8. cu atât ele vor fi executate mai eficient. Numai ca pentru un pipeline lung să nu afecteze negativ viteza sunt necesare un branch prediction şi un scheduler pe măsură. Acelaşi lucru se poate spune şi despre scheduler.Evaluarea performanţelor sistemelor de calcul face legătura dintre cele două tipuri de adresare (cu ajutorul ei se poate transforma o adresă virtuală într-una reală şi invers). De aceea. precum şi datorită îmbunătăţirii spaţiului din scheduler destinat unităţii ALU. Moştentirea de la Intel În primul rând. o regulă dedusă 54 .. Prelucrarea efectivă este realizată în alte stagii. Observaţie.. AMD a crescut cu 2 numărul de stagii din cauza reproiectării blocului de predicţie (branch predictor).6. Situaţia e foarte interesantă. Setul de instrucţiuni introdus odată cu primul Pentium 4 este. nu este de dorit nici un pipeline foarte scurt pentru că astfel nu mai poate fi executat în paralel un număr prea mare de instrucţiuni. având un branch prediction cu un hit-rate de 100% precum şi un scheduler foarte încăpător va oferi numai avantaje în termeni de performanţă. în sfârşit prezent şi în CPU-urile AMD. Situaţia este oarecum amuzantă. de trei ori. Cât despre latenţa cache-ului. deşi această cifră poate părea unora destul de optimistă. care trimite către fiecare unitate de prelucrare instrucţiunile cuvenite. pipeline-ul este împărţit în două segmente: unul pentru ALU şi unul destinat FPU-ului. Deşi instrucţiunile de acest tip nu sunt licenţiate în nici un fel. Prescott are pipeline şi latenţe crescute faţă de predecesor pentru a-şi putea creşte frecvenţa. De ce creşterea pipeline-ului a fost datorată îmbunătăţirii celor două unităţi? Cu cât „prezicătorul” este mai eficient. pe când K8 are aproape acelaşi pipeline iar latenţa a scăzut. 3. Lungimea mare a pipeline-ului nu trebuie privită ca o sperietoare. Se spune că creşterea de la 256 KB la 1 MB afectează cu 15% performanţa. iar acestea nu pot fi îmbunătăţite la infinit. După cum spuneam şi în subcapitolul anterior. Desigur. aceste ultime stagii au fost crescute cu câte 2. Un pipeline foarte lung. Dimensiunea cache-ului a suferit şi ea modificări. şansele de alegere greşită a ramurii fiind suficient de reduse astfel încât creşterea lungimii sale să fie considerată un avantaj. 3. numărul total devenind 12 faţă de 10 (pentru ALU) şi 17 faţă de 15 (pentru FPU). în funcţie de modelul procesorului. La K8. dedicat lui Prescott. de 6 stagii. AMD a considerat că pipeline-ul poate fi crescut. el cuprinzând fetch (preluarea instrucţiunii) şi decode (decodificarea acesteia). urmând golirea pipeline-ului. AMD ştie mai bine ce face. Cu cât acesta poate reţine mai multe instrucţiuni. ceea ce poate constitui o barieră în goana după gigahertzi. nivelul al doilea a fost crescut la 512 KB sau 1 MB. spaţiul acestuia a crescut substanţial. anticiparea instrucţiunilor devenind acum cu 5÷10% mai precisă. Există un segment comun. Dacă primul nivel a rămas la 128 KB.5. Conductele şi predicţia La procesoarele AMD. care nu a fost afectat de nici o schimbare în cazul lui K8. un pipeline prea lung afectează negativ performanţa dar creşte posibilitatea atingerii de frecvenţe mari. SSE2. aceasta datorită eficienţei mai scăzute a nivelului doi comparativ cu Pentium 4. pentru nivelul unu ea a rămas aceeaşi. De asemenea. la K7 în număr de 4 (pentru ALU) şi respectiv 9 (pentru FPU).

SSE2 optimizat. erau capabile să ruleze în sisteme de un singur. FX-53. deci orice implementare care costă mult e calculată la sânge. două. având în vedere că procesoarele K8 au întârziat nepermis de mult. patru şi respectiv opt procesoare.7. extrem de scumpe şi cu puţin mai lente decât cele normale (unbuffered). aplicaţiile ce se folosesc de el fiind deseori mai lente decât cele ce se bazează pe clasicul FPU.Cap 3: Evaluarea performanţelor procesoarelor experimental spune că niciodată cel care copiază nu va obţine. înainte de lansarea lui K7 avea serioase probleme financiare (ultimele modele de K6 nefiind prea reuşite) iar înainte de K8 mergea în pierdere. Astfel s-a născut Athlon 64 FX. Controller-ul de memorie integrat era de tip dual-channel iar memoriile necesare erau de tip registered. un procesor extrem de scump pentru aproape oricine (costa peste 1000$ la lansare). înainte de fiecare lansare a unei noi generaţii ea având dificultăţi mari financiare: înainte de lansarea lui K6 era în pragul falimentului. Spre exemplu. SSE3 (inclus deja în ultimele stepping-uri de K8) şi. 2xx. de ce nu. folosit cu totul şi cu totul ocazional în programele acelor vremuri. Odată cu apariţia modelelor desktop. Modele de K8. Notarea lui Athlon 64 FX a fost destul de ciudată. deşi aparent identice. deşi utilizatorii nu prea beneficiau de acesta. AMD a portat o versiune a lui Opteron în sisteme „mai cuminţi” dar destinate entuziaştilor. Opteron 246 rula la 2 GHz şi putea funcţiona în sisteme dual-procesor. Un ultim lucru care merită menţionat este protecţia antivirus NX (No Execute) despre care am discutat la capitolul destinat lui Prescott şi care de altfel este prezent în ultimele versiuni ale acestuia. dar nu se întrevede nici un model care să beneficieze de ea. 55 . Însă setul 3DNow!. Într-o situaţie asemănătoare s-a aflat şi Intel la lansarea lui P4 (Willamette. Numele de cod a fost Sledgehammer iar platforma utilizată Socket 940. modelele purtând numele FX-51. Sau. Legat de ultimul aspect. Revenind în prezent. dacă ne adâncim şi mai mult în istorie. oferind încă de la primul procesor K8 apărut (Opteron) această protecţie. AMD a achiziţionat licenţele necesare pentru această tehnică. performanţele concurentului său. AMD este o companie mică (în comparaţie cu alţi giganţi din lumea IT. unii au presupus că AMD pur şi simplu nu a mai avut timp să optimizeze SSE2-ul. În plus. destinate tuturor utilizatorilor. AMD nuşi poate permite prea multe eşecuri. Cele patru versiuni disponibile. necesita şi memorii registered. HyperThreading. Aşa se face că noua generaţie de procesoare de la AMD obţine performanţe teribil de mici prin SSE2. salva onoarea firmei AMD. găsim un K6-2 cu al său FPU de 2-3 ori mai lent decât cel din procesoarele Intel similare. programele inteligente care foloseau instrucţiuni SSE în locul celor FPU obţinând performanţe mult crescute. tehnologii de fabricaţie şi platforme Primele variante de K8 au fost destinate server-elor şi au purtat numele de Opteron. unitatea FPU fiind mai lentă decât cea din Pentium III. printre care se află şi Intel). fiind practic un Opteron din seria 1xx redenumit. ele identificându-se printr-un număr de tip 1xx. Ce am mai văzut la Intel şi aşteptăm implementat şi în procesoarele concurenţei? Thermal throttling. 3.3. 4xx şi 8xx. legat de acele instrucţiuni. AMD s-a aflat în faţa lui Intel de această dată. FX-55 etc. primul model).

dar acesta din urmă avea un cache level 2 dublu. aproape identic ca funcţionalitate cu NewCastle. el s-a dovedit a fi un semi-eşec din punct de vedere al overclocking-ului. dar despre care nu vom vorbi în detaliu aici. modelul 3100+ rulând la 1. AMD s-a folosit de rating-ul cunoscut de la Athlon XP.3.Evaluarea performanţelor sistemelor de calcul Pentru utilizatorii care ţineau seama şi de bugetul alocat. diferenţa faţă de Clawhammer privind dimensiunea cache-ului: doar 512 KB. Dacă al doilea aspect nu aduce beneficii prea mari. diferenţa de performanţă faţă de FX fiind minimă. NewCastle. Acest lucru nu a constituit un dezavantaj. primul ajută substanţial la creşterea performanţei. precum şi setul de instrucţiuni pe 64 de biţi absent. dar mai rece. Aşa s-a născut nucleul Winchester. pe când cea NewCastle (512 KB) de 2. AMD a introdus câteva versiuni de Sempron. Limitare care nu era prezentă 56 . ca şi Athlon 64 2800+. fiind însă considerată din ce în ce „mai low-end”. modelele ce se inserau în acest socket beneficiind de un controller de memorie ce lucra cu memorii unbuffered în dualchannel. Athlon 64 a fost văduvit de o parte din pini. Concluzii AMD a schimbat multe odată cu K8.2 GHz. un controller de memorie optimizat şi un potenţial crescut de atingere a frecvenţelor mari. Totuşi. evident. Athlon 64 „simplu” a oferit satisfacţii similare. limitare care uneori nu putea fi suprimată nici măcar odată cu creşterea foarte mare a frecvenţei de tact. Pentru Socket 754. De exemplu. De reţinut faptul că modelele inferioare lui Sempron 3100+ sunt concepute pentru platforma Socket A. 3. creat numai pentru platforma 939 (care de altfel are şi un viitor asigurat). iar controller-ul de memorie integrat rula pe un singur canal. Noul core. numărul lor fiind redus la 754. În fine. frecvenţa superioară compensând minusul cu pricina. memoria L2 cache rămânând la 1 MB. Rating-ul său a fost stabilit în funcţie de Celeron D. cu 512 şi respectiv 1 MB de cache.8 GHz.13 microni (130 nm). oferă şanse suplimentare creşterii frecvenţei procesorului. Athlon 64 3200+ în versiunea Clawhammer (1 MB cache) avea o frecvenţă de 2 GHz. Platforma Socket 754 a fost păstrată.09 microni: Venice şi San Diego. Astfel.2 GHz. AMD a introdus nouă noi nuclee pe 0. menţionăm că tehnologia de fabricaţie a lui K8 a unor modele a suferit o modificare importantă: introducerea SOI (Silicon-On-Insulator) care. Trecerea la 0. Toate nucleele amintite erau create în tehnologia de 0.8. Northwood sau Prescott? Nu răspundem la întrebări filozofice.. un Athlon 64 3200+ este (teoretic) la fel de rapid ca un Pentium 4 la 3. referinţa fiind procesoarele Intel Pentium 4. Recent. ele neavând nimic în comun (afară de nume) cu cele S754. De remarcat şi controller-ul de memorie uşor îmbunătăţit al noului core. exista atât în versiuni single. Puţine dacă ne referim strict la arhitectura internă dar multe dacă luăm în calcul adaosurile: controller-ul de memorie integrat şi instrucţiunile pe 64 de biţi. pe scurt. implementând instrucţiunile SSE3. diferenţele faţă de Athlon 64 privind cache-ul: 128 sau 256 faţă de 512 KB sau 1 MB (controller-ul de memorie fiind. Pentru denumirea modelelor. single-channel). procesul de fabricaţie nematurizat punându-şi amprenta asupra frecvenţelor atinse..cât şi dual-channel. excluzând astfel din ecuaţie o puternică limitare de care sufereau vechile K7. Socket 940 a fost înlocuit cu Socket 939. fiind necesară pentru atingerea de frecvenţe superioare. Mai exact dezactivat şi imposibil de activat.09 microni (90 nm) a fost iminentă.

• instrucţiuni AMD64. slab folosite pentru moment. Anexă: Chipset-urile destinate procesoarelor din familia AMD64 Dacă la Prescott lucrurile erau mai simple. de exemplu). atât ca lăţime a bus-ului (8 biţi sau 16 biţi) cât şi ca lăţime de bandă (între 600 şi 1000 MHz). • cache crescut iniţial la 1 MB. Există două familii de nForce pentru procesoarele AMD K8.Cap 3: Evaluarea performanţelor procesoarelor la procesoarele Pentium 4. • protecţie antivirus NX. acest lucru depinde de procesor şi 57 . Mai mult. diferenţele dintre ele constând în viteza HyperTransport. a cărui răspândire nu este mare. şi nForce4 .aplicaţii urmând o curbă exponenţială ascendentă.09 microni (90 nm) SOI. • instrucţiuni SSE2 (introduse pentru prima dată în Pentium 4).13 (130 nm) şi apoi de 0.şi destul de puţine . Dacă seria nForce3 150 nu are în dotare decât simpla interfaţă ATA 133. puteam creşte oricât frecvenţa unui Athlon XP. În testele în cauză. implementarea lăsând de dorit la capitolul viteză. similară celei XD de la Intel. în schimb. un Athlon 64 la 2. nForce3 250 oferă atât porturi Parallel ATA cât şi Serial ATA. în unele . unind northbridge-ul (văduvit de controller-ul de memorie) cu southbridge-ul. precum şi în viteza de comunicare dintre northbridge şi southbridge. Viitorul ne va oferi multe surprize. piaţa fiind împărţită în Intel şi „alţii”. VIA ne oferă pentru platforma AGP un K8T800 „simplu” şi unul Pro. Cu alte cuvinte. nForce4 Ultra introduce Serial ATA II. în cazul lui AMD există doi mari jucători: NVIDIA şi VIA. denumirea de chipset devenind astfel improprie (întâlnim expresia single-chip core-logic). În fine. efortul necesar atingerii vitezei unui Pentium 4 sau Athlon 64. şi anume nForce3 . un Athlon XP supus unui overclocking puternic şi rulând la 2. De partea cealaltă. cea mai aşteptată fiind legată de DDR-2 şi de modelele cu două nuclee. însă impactul asupra performanţelor este cvasi-zero. nForce4 SLI oferă posibilitatea conectării în acest mod a două plăci grafice PEG X16 pentru maximizarea performanţei 3D. cel de 1 MB fiind destinat modelelor high-end. Legat de primul aspect. Acestea fiind zise. precum şi K8T890 pentru PCI Express. Menţionăm că între chipset-uri mai există diverse diferenţe la nivelul HyperTransport.cu suport AGP 8x. ce deţine principalul merit al creşterii performanţelor. În sistemele obişnuite aceste elemente influenţează atât de puţin performanţa încât competiţia este doar una de marketing (similară celei dintre AGP 4x şi 8x. revenindu-se ulterior la 512 KB.cu suport PCI Express. să facem un rezumat al facilităţilor oferite de noile procesoare AMD: • tehnologie de 0.6 GHz era cu doar puţin mai rapid decât unul la 2 GHz. NVIDIA foloseşte un singur chip. Pentru prima dată.6 GHz nu are probleme în a afişa rezultate oarecum proporţionale cu cel la 2 GHz. • pipeline uşor crescut odată cu un branch prediction şi o unitate scheduler îmbunătăţite. • controller de memorie integrat. dublând lăţimea de bandă disponibilă pentru unităţile de stocare (nForce4 „simplu” se limitează la un Serial ATA „I”). nefiind atât de limitat de factori externi precum un controller de memorie. probabil din cauza PSB-ului foarte mare (de ordinul a 800 MHz faţă de maxim 400 la K7) care compensa latenţele suplimentare datorate prezenţei externe a controller-ului în cauză.

4 GHz pe o arhitectură de 90 nm.4. câştigător este procesorul celor de la Advanced MicroDevices. însă. Pe scurt. cu siguranţă. superioare. acest model este dotat şi cu funcţia Hyper Threading. oferă practic două unităţi centrale de procesare integrate într-o singură bucată de silicon. Conectarea la sistem se face prin intermediul unui Socket 939. ele au frecvenţe mai scăzute decât modelele cu un singur nucleu. la platformele AMD există posibilitatea de upgrade a existentului Athlon 64 din PC doar printr-un simplu upgrade de BIOS. Este implementat pe o arhitectura de 90 nm. Intel nu s-a lăsat mai prejos şi a lansat procesorul Intel Pentium 840 Extreme Edition. 58 . performanţele urmând să fie. Procesorul consumă maximum 110 W. în baza testelor PC World dintre Intel Pentium 840 Extreme Edition şi AMD Athlon64 X2. Pentru o mai uşoară trecere între generaţiile de procesoare. rezultă ca noul model de la Intel poate executa nu mai puţin de patru procese în paralel. Computerele cu procesoare dual-core au început să apară deja pe piaţă în diferite variante. proiectate pentru a sustine două nuclee distincte. având în vedere că fiecărui procesor fizic dintre cele două de pe capsula îi sunt alocate două procesoare logice prin HT. Intel nu oferă aceeaşi flexibilitate. Astfel. Front Side Bus-ul acestui procesor atinge 800 MHz. procesoarele Athlon 64 X2 pe 64 biţi propulsează deja serverele dual-core Opteron şi staţiile de lucru. Interesant este ca pe lângă tehnologia Dual-Core. Ca şi competitorul direct. pentru trecerea la tehnologia Intel Dual-Core fiind necesară achiziţia unei noi placi de bază. Vom analiza în continuare tehnologiile şi proprietăţile specifice fiecărui producător pentru a ne face o idee de ansamblu asupra modurilor de implementare a procesoarelor dual-core. funcţionând la o frecvenţă de tact de 3.Evaluarea performanţelor sistemelor de calcul doar AMD este cel care poate decide. Testele indică faptul că indiferent de constructorul ales. Intel sau AMD. Magistrala sistemului funcţionează la 2. 3. care surclasează toate procesoarele Intel existente. conectându-se pe socket LGA 775. are câte 1 MB de memorie cache L2 pe fiecare nucleu. are 1 MB de memorie cache L2 pe fiecare nucleu. Procesoare Dual-Core Cipurile dual-core. vom avea parte şi de noul standard implementat în viitoarele Athlon 64. beneficiind şi de tehnologia Cool’n’quiet. ce lucrează la o frecvenţă de tact de 2. care ajustează puterea consumată în funcţie de activitatea desfăşurata de procesor. atunci când se va simţi nevoia.2 GHz. Lansate în iunie anul curent.000 MHz datorită tehnologiei HyperTransport. Pe de alta parte. cipurile Dual Core beneficiază de performanţe ridicate atunci când rulează mai multe aplicaţii simultan. Interesant de aflat este: pentru cat timp? Procesorul AMD Athlon 64 X2 4800+. Cât despre dual-core.

Cap 3: Evaluarea performanţelor procesoarelor

3.4.1. Tehnologia Intel dual-core Intel Un procesor dual-core Intel are două nuclee de execuţie separate pe acelaşi cip care rulează la aceeaşi frecvenţă. Ambele nuclee împart acelaşi package fizic şi aceleaşi interfeţe cu chipset-ul şi memoria. Totuşi, ele pot opera ca nuclee distincte de execuţie. Procesarea dual-core este una dintre metodele de a furniza performanţa în timp ce se balansează cerinţele de putere şi constă în adăugarea mai multor resurse procesorului şi nu în creşterea frecvenţei acestuia (fig. 3.2).

Fig.3.2: Procesor dual-core: se observă paralelismul în execuţia proceselor.

Fig.3.3: Procesor dual-core cu tehnologie Hyper Threading – 4 procese pot rula simultan.

Fig.3.4: Procesor cu tehnologie Hyper Threading – execuţie simultană a două procese. O staţie de lucru bazată pe un procesor dual-core Intel extinde capabilităţile PCului şi asigură un mai mare grad de procesare simultan, un utilizator putând, de exemplu, să randeze şi să editeze o secvenţă video în acelaşi timp. Ca o analogie, imaginaţi-vă o autostradă cu patru benzi: pe ea trec până la de doua ori mai multe maşini fără a obliga fiecare maşină să meargă de doua ori mai repede. Procesorul Intel dual-core este o evoluţie a tehnologiei Hyper Threading. Atât tehnologia HT, cât şi un procesor dual-core permit rularea mai multor aplicaţii concepute pentru a exploata procesele multiple, dar dual-core aduce mai multe resurse şi putere de procesare în cadrul PC-ului. În alte cuvinte, procesarea dual-core face acelasi lucru ca şi Hyper Threading, doar că mai repede, având o putere de calcul mai mare.

Fig.3.4: Procesor cu un singur nucleu – procesele sunt rulate secvenţial.

59

Evaluarea performanţelor sistemelor de calcul

În viitor, Intel va lansa procesoare ce vor îmbina cele două tehnologii, HyperThreading şi Dual-Core, pentru a asigura rularea în paralel a unui număr maxim de patru procese diferite. Acest lucru va duce, pe lângă dublarea teoretic a vitezei, la o explozie a numărului aplicaţiilor concepute să ruleze pe sistemele multi-core. 3.4.2. Tehnologia Dual-Core AMD AMD continuă drumul inovaţiilor introducând tehnologia dual-core (dual socket) pentru piaţa PC. Procesoarele dual-core Opteron pentru staţii de lucru extind arhitectura Direct Connect a AMD, conectând două unităţi centrale de procesare (CPU) într-un singur circuit integrat, îmbunătăţind per total performantele sistemului şi eficienţa acestuia. Procesoarele AMD Operton single-core şi dual-core cu arhitectura Direct Connect şi HyperTransport Technology permit tranziţia uşoară la tehnologia pe 64 biţi fără a sacrifica performanta pe 32 biţi. Un lucru îmbucurător pentru fanii AMD este că tehnologia dual-core este extrem de uşor de implementat prin următoarele considerente principale: • procesorul dual-core conţine două unităţi centrale de procesare într-un singur circuit integrat, fiecare nucleu având propria memorie cache L2 de 1 MB; • se conectează pe socket-urile existente cu 940 de pini pentru procesoarele AMD Opteron; • un update de BIOS este tot ceea ce este necesar pentru a obţine un sistem compatibil de a rula cu procesoare dual-core; • cele două nuclee CPU se descurcă cu aceeaşi memorie şi cu tehnologia HyperTransport disponibile pentru procesoarele single-core. Procesoarele AMD Opteron dual-core prezintă, de asemenea, avantajele arhitecturii unui procesor cu un singur nucleu. Aceste avantaje cuprind următoarele tehnologii: • Direct Connect Arhitecture - ajută la îmbunătăţirea performanţei sistemului şi a eficienţei prin conectarea directă a procesoarelor, controllerului de memorie şi a dispozitivelor de intrare-ieşire ale procesorului. • HyperTransport Technology - asigură interconectare cu lăţime de bandă scalabilă între procesoare, subsitemele periferice şi alt chipset. • AMD PowerNow! Technology cu Optimized Power Management (OPM) asigură necesarul de putere de calcul în funcţie de cerinţe, rezultând un raport performanţă-putere optimal. Să analizăm, însă, cum se vor comporta noile cipuri în PC-urile noastre: Creştere de viteza Sistemul de referinţa pe care s-au efectuat testele a rulat Windows XP Pro. Acesta a venit configurat cu 1 GB de memorie DDR 400, un hard disc de 10.000 rpm şi o placa video nvidia GeForce 6800 Ultra cu 256 MB de memorie DDR3. Maşinăria AMD Athlon64 X2 a reuşit un scor de 116 puncte în WorldBench 5, cu mult mai bun decât cele 95 de puncte obţinute de procesorul dual-core Pentium 840 Extreme Edition. Unitatea AMD a arătat un real plus de putere în porţiunea de multitasking a lui PC WorldBench 5. Timpul de doar 6 minute şi 44 de secunde a fost cu 3 minute şi 42 de secunde mai bun decât media dintre două sisteme Athlon 64 FX 55 şi cu aproape 3 minute mai bun decât Pentium 840 EE dual-core. În WorldBench 5, unitatea dual-core
60

Cap 3: Evaluarea performanţelor procesoarelor

produsă de Intel, a arătat îmbunătăţiri comparativ cu acelaşi sistem, dar echipat cu un procesor Pentium 4 seria D la 3,2 GHz (ambele cu Hyper-Threading activat). Despicând firul în patru, mai aflam un lucru interesant: în testele de anduranţă şi de stabilitate, procesorul 840 al lui Intel rămâne ferm pe poziţie, chiar şi după multe zile de lucru intens, în timp ce Athlon-ul 4800+ începe să aibă probleme. La acest capitol putem acorda o bilă albă lui Pentium 840 EE, care se potriveşte ca o mănuşă serverelor şi staţiilor de lucru folosite cu aplicaţii puternice. Este adevărat că procesorul produs de Intel consumă mai mult curent electric, dar de aici provine şi plusul de stabilitate atât de necesar multor utilizatori. Ce se poate face concret cu procesoarele dual-core? Pentru a plasa procesoarele dual-core într-un context potrivit, trebuie să reconsiderăm modul de lucru cu computerul. Sistemele cu două procesoare logice sunt perfect potrivite pentru a face operaţiuni multiple, simultan, fără ca utilizatorul să observe scăderi de performanţă. Imaginaţi-vă cum ar fi să jucaţi un joc 3D sofisticat în timp ce arhivezi fişiere audio. Chiar dacă decizi să mai introduci o operaţiune dificilă, cum ar fi compresia de volume mari de fişiere, abilitatea de a juca shooter-ul 3D nu va fi redusă. Dacă se introduce a patra comandă consumatoare de resurse de către sistem, atunci se va reduce în mică măsură timpul total de execuţie a proceselor, dar nu se va observa un impact major asupra răspunsurilor directe date de sistem. Intel deja introduce procesoarele dual-core bazate pe sistemul Pentium D, iar PC-urile propulsate de acestea vor fi considerabil mai ieftine decât cele cu Pentium 840 EE. Deşi scumpe, procesoarele dual-core dovedesc performanţe simţitor îmbunătăţite. AMD îşi continuă în salturi drumul către inimile gamer-ilor înnebuniţi de gigaherti, în timp ce Intel preferă sa urce cu paşi mărunţi, siguri şi stabili.

3.5. Test de procesoare
Importanţa unui procesor (CPU) într-un sistem de calcul este printre cele mai mari. Teoretic, vorbim despre componenta centrală a PC-ului, „creierul” său, unitatea care coordonează toate activităţile şi fără de care nimic din ceea ce vedem pe monitor nu s-ar putea realiza. Aşadar, o modificare a nivelului său de performanţă va conduce la schimbarea dramatică a vitezei de lucru, productivităţii şi satisfacţiei. Nu trebuie neglijată, însă, importanţa memoriei (mai ales din punct de vedere cantitativ), a plăcii grafice şi a altor componente de bază. De fapt, în primul rând contează sarcinile pe care le dăm PC-ului, în funcţie de ele putându-se deduce nivelul de performanţă necesar din partea fiecărei componente. De exemplu, un împătimit al jocurilor va avea nevoie în primul rând de o placă grafică performantă (cu un GeForce 6200, de exemplu, nu se va putea atinge un framerate minim decent în ultimele apariţii), apoi de un procesor performant; abia în ultimul rând contează alţi factori, precum o cantitate de memorie mai mare de 1 GB sau un hard disk rapid. În schimb, un profesionist al graficii (2D) nu se va folosi de puterea 3D a plăcii grafice, în schimb va avea nevoie de un procesor cât mai rapid şi de o cantitate de memorie de minim 2 GB pentru a-şi face treaba în condiţii bune.

61

vrândnevrând .o popularitate mare printre utilizatori.Evaluarea performanţelor sistemelor de calcul În continuare se prezintă rezultatele unor teste care se doresc a fi un ghid al momentului cu privire la achiziţionarea unui procesor.perceptibilă în practică. cuprinzând atât jocurile şi partea de multimedia/entertainment cât şi aplicaţiile profesionale. fie în cazul unui upgrade. timp de doi ani.un tip de împachetare diferit de cel clasic: pinii nu se află pe procesor. testele sintetice reflectă în mare măsură comportamentul în utilizarea reală. numită şi Socket T. dar necesară pentru introducerea noilor sale procesoare cu suport DDR2: controller-ul de memorie fiind situat în procesor. pentru o evaluare din două perspective: cea reală . un CPU Socket AM2 introdus într-o placă de bază cu suport DDR nu ar fi funcţionat. Şi. având ca principale caracteristici creşterea de patru ori a lăţimii de bandă a bus-ului PSB (el fiind numit acum Quad Pumped) şi restructurarea cache-ului level 1. Arhitecturile testate sunt în număr de trei: Intel NetBurst. fiind dedicată exclusiv procesoarelor Intel. SuperPI). Platformele alese au fost în număr de trei: LGA775. El se deosebeşte de cel anterior. şi cea teoretică . Intel a introdus o serie de inovaţii în procesoarele acestei serii. dar în acelaşi timp foarte populare printre utilizatori. şi nici reciproc. devenind singura soluţie pentru platforma Intel. Socket 939. toate prezente pe piaţă în acest moment. codare audio/video. Critica principală adusă a fost 62 . Au fost introduse atât teste analitice (jocuri reale. precum şi prin dispunerea diferită a celorlalţi. Mai târziu şi fără legătură directă cu arhitectura. de ce să nu recunoaştem. Socket 939 a fost. procesoarele S939 sunt pe cale de dispariţie din magazine. printr-un pin suplimentar. Aceasta a înlocuit vechiul Socket 478 şi a introdus pentru prima dată acest Land Grid Array (LGA) . dar care a dominat lumea procesoarelor Intel în ultimii şase ani. ci pe placa de bază. CPU-ul conţinând doar contactele necesare pentru a se face legătura cu pinii. Intel Core şi AMD64.atât de populară printre entuziaşti şi cei care doresc să doboare recorduri. Socket AM2 şi Socket 939. fie pentru un sistem nou. Criticat în primul rând pentru faptul că pinii situaţi în socket pot fi îndoiţi sau chiar distruşi relativ uşor. precum tehnologiile HyperThreading şi EM64T (aceasta din urmă fiind „împrumutată” de la AMD64). referinţa pentru platforma AMD64. Socket AM2 desemnează penultimul socket introdus de AMD. Se urmăreşte să se acopere toate domeniile de utilizare a PC-ului. precum şi includerea a două nuclee într-un singur CPU. LGA775 a căpătat . Este evident faptul că AMD a decis acest lucru pentru a crea o incompatibilitate forţată. deşi Socket 939 se pare că în curând va ieşi din scenă. a apărut în urmă cu peste doi ani. Ea a fost introdusă odată cu Pentium 4 şi a succedat-o pe cea P6 (Pentium II/III). LGA775. prin prezentarea unui număr mare de teste. arhivare). cât şi sintetice (3DMark. Deşi îmbunătăţirile aduse de Socket AM2 sunt minore. Intel NetBurst reprezintă o arhitectură aspru criticată.

AMD64. Platforma Intel Core a fost introdusă în acest an de către Intel. S-ar părea că diferenţa de performanţă se datorează în mare parte şi cache-ului de 4 MB de tip inclusiv. Pe baza acestei arhitecturi a ieşit la lumină. marketing-ului agresiv. Ca fapt divers. frecvenţe ridicate faţă de cele standard (650/1600 MHz) în ideea de a nu avea plafon în performanţă grafică . rezerve foarte mari de atingere a frecvenţelor ridicate. Deşi s-a insistat mult pe instrucţiunile. la apariţia lui Socket AM2: odată cu schimbarea tipului de memorie. de curând. să atingă frecvenţe deosebit de ridicate . Pentium M a pătruns şi în domeniul desktop datorită adaptorului Socket 479-478. utilitatea acestui „add-on” este momentan extrem de redusă. Acest lucru a adus şi câteva dezavantaje. cea mai importantă fiind includerea controller-ului de memorie în procesor. practic Intel a preluat scheletul lui Dothan şi i-a adus numeroase îmbunătăţiri pentru a o face competitivă acestei perioade. P6. şi placa de bază. un procesor foarte popular pentru platformele mobile. interesant este faptul că şi vechea arhitectură de la Intel. regiştrii şi întreaga arhitectură pe 64 de biţi.3 GHz). care ar fi fost satisfăcute doar de o configuraţie SLI. Pipeline . cine îşi cumpără procesoare AMD64. Instrucţiunile SSE3. împărţit între cele două nuclee. deşi un simplu update al vechiului AMD K7 (Athlon. nu o face din cauza celor 64 de biţi. Pentium 4 la 1. spre exemplu. care a dat naştere celei mai performante şi mai reci combinaţii posibile pentru un PC. Succesul lui NetBurst a fost datorat numelui Intel. şi primul CPU cu patru nuclee: Core 2 Extreme QX6700 (nume de cod Kentsfield). spre deosebire de cele AMD64.lucru practic imposibil pentru anumite procesoare. a introdus câteva îmbunătăţiri cheie. Descrierea configuraţiilor care au stat la baza testului Placa grafică folosită a fost un NVIDIA GeForce 7900 GTX produs de EVGA. Arhitectura a fost folosită chiar şi în vremurile de apogeu ale lui Pentium 4 în „persoana” lui Pentium M (nume de cod Dothan). el oferind o performanţă per clock superioară chiar şi unui Athlon 64 FX. (Desigur. aflată la baza procesorului Pentium III. precum bus-ul Quad Pumped. trebuie înlocuit şi procesorul. întrecea unele modele de Pentium 4 chiar şi la o frecvenţă mai ridicată (de exemplu. dar şi faptului că procesoarele din această serie puteau. Oricum. un Athlon 64 la 2 GHz depăşea cu mult un Pentium 4 la aceeaşi frecvenţă. ea reprezentând o revenire în prim-plan a arhitecturii P6. tactat la 710/1800 MHz. Performanţa per clock a devenit foarte ridicată. principalul avantaj al procesoarelor AMD. fără de care ele nu ar fi făcut faţă concurenţei.Cap 3: Evaluarea performanţelor procesoarelor datorată consumului extrem de ridicat şi a performanţei mici per clock (performanţa la o frecvenţă dată).apropiindu-se de 4 GHz şi depăşind chiar cu mult această valoare prin overclocking-ul extrem. iar procesoarele rezultate au. în continuare.reprezintă suma unor etape pe care instrucţiunile trebuie să le parcurgă până la obţinerea rezultatului final 63 2 . fapt datorat pipeline-ului2 extrem de lung. EMT64 şi VT sunt considerate de mulţi „bling-bling”-uri accesorii inutile. În ceea ce priveşte arhitectura Core. depăşind-o pe cea a concurenţilor de la AMD. dată fiind lipsa de popularitate a sistemelor de operare şi a aplicaţiilor care să utilizeze cod 64-bit. însă nu se ştie niciodată când este nevoie de ele. unul dintre ele fiind resimţit chiar acum. ceea ce reprezintă. într-adevăr. ci datorită performanţei sporite de mutarea controller-ului de memorie din placa de bază în procesor. Athlon XP). Au mai fost moştenite unele inovaţii aduse de NetBurst (dar fără legătură cu arhitectura în sine). Pentium III la 1 GHz vs.

ce nu excelează prin nimic. Operaţiile (benchmark-urile) în cauză încearcă să reflecte.Evaluarea performanţelor sistemelor de calcul frecvenţele au fost testate minuţios. Ca pas firesc de urmat. chiar şi la stresul enorm exercitat de o platformă de ultimă generaţie overclockată aproape de limită.5. dar ca performanţă surclasează alternativele de la Asus şi Gigabyte. În fine. comportamentul practic al procesorului. pe cât posibil. am scăzut detaliile şi rezoluţiile până am ajuns la un punct unde coborârea sub o anumită limită deja ar fi fost irelevantă (nimeni nu mai foloseşte rezoluţii precum 800 x 600 sau 640 x 480 cu un Core 2 Duo. ea fiind dotată cu două rail-uri independente de 12V de 16A şi respectiv 17A şi dovedind voltaje stabile. Pentru procesoarele AM2 sa folosit o placă Abit AN9 32X (chipset nForce 590 SLI). atât pentru procesor cât şi pentru memorii. iar setările plăcii grafice din drivere au fost cele implicite. astfel încât placa a rulat perfect stabil şi fără artefacte în aceste condiţii. spre exemplu). El a reuşit să răcească pasiv toate procesoarele pe care le-am avut în teste. cu latenţe extrem de mici: până la 800 MHz am rulat cu CL3 2-2-7. Evident. ele au rulat la frecvenţe impresionante. la frecvenţe implicite. Layout-ul este unul simplu. au înlăturat îndoielile pe care leam avut în legătură cu ea. cu setări moderate de overclocking.) S-a renunţat la împerecherea a două plăci grafice pentru acest test deoarece ar fi putut apărea probleme serioase cu driverele în anumite cazuri. Ca plăci de bază. sa dispus de un „bătrân” Abit AN8 (chipset nForce 4). un monstru care ar înspăimânta utilizatorul obişnuit. Sistemul de operare a fost Windows XP Professional SP2. simulând activitatea 64 .1. în cazul platformei Intel. performanţa unui procesor este evaluată utilizând diverse aplicaţii care calculează ori timpul necesar efectuării unei operaţii. Voltajele generoase. în momentul în care s-au rulat testele. Testarea propriu-zisă În general. dar arhisuficiente pentru nevoile noastre. ce oferă premisele unui overclocking ridicat. Răcirea a fost asigurată de un cooler Scythe Ninja Plus. dar cu performanţe de top. fără performanţe deosebite. cu variaţii minime. ori câte operaţii sunt efectuate într-un interval de timp prestabilit. pentru platforma Intel sa ales un DFI Infinity 975X/G (chipset Intel 975X) deoarece. module echipate cu chip-urile Micron D9 „fatbodies”. Memoriile folosite au făcut parte dintr-un kit Corsair CM2X512-8000UL. era practic cea mai performantă placă disponibilă. Sursa a purtat numele Antec Phantom 500W. pentru o evaluare cât mai apropiată de condiţiile utilizării de zi cu zi. pentru Socket 939. Pentru platforma Socket 939 (DDR) am dispus de un kit OCZ PC4400 Gold Limited Edition (chip-uri TCCD). cel puţin pe platforma Intel. 3.

Cap 3: Evaluarea performanţelor procesoarelor utilizatorului. Vorbis. sa codat un scurt film în format original DVD (MPEG-2 la 720 x 480) folosind codec-ul DivX 6. sursă). a aplicaţiei ScienceMark (pentru diverse simulări ştiinţifice). deci. altfel spus coordonatele punctelor ce le definesc.3. în defavoarea scorului final. Tot la capitolul performanţă 3D. indiferent dacă rezoluţia este 640 x 480 sau 1600 x 1200. urmând ca mai apoi placa grafică să le umple cu culoare şi să le aplice diverse efecte. precum şi un fişier audio (Dream Theater . alături de CineBench. iar aceasta plafonează performanţa într-un mod ce face imposibilă deducerea influenţei procesorului asupra rezultatului final. rezultatele din fiecare test. AAC. iar cele care raportează rezultatele unor programe create special pentru a evalua performanţa sunt testele sintetice. de exemplu. MPC. Din 3DMark03 sa selectat pentru testarea procesorului numai GT1 (Wings of Fury). creşterea rezoluţiei (sau creşterea nivelului de anti-aliasing . s-au introdus o serie de jocuri reale. memorie RAM. Lobby de memorie (latenţe şi lăţime de bandă).Octavarium. Explicaţii În cazul jocurilor 3D. Pentru evaluarea vitezei de randare în aplicaţii de grafică profesională. rezultând fişiere în formatele MP3. ci depinde atât de aplicaţia folosită de către utilizator. cât şi de operaţiile realizate în cadrul acelei aplicaţii. Aşadar.E. placă grafică.A. a memoriei sistemului. Benchmark-ul sintetic 3DMark 2001 a fost folosit deoarece este până acum singurul test care solicită semnificativ toate componentele vitale ale unui sistem (CPU. Din 3DMark05 s-au selectat testele de bază. putem spune că testul Car Chase depinde de procesor. GunMetal şi X3. Grosso-modo. fie complete sau demo-uri ale acestora create special pentru testare: F.R. Aşadar. ultimele trei teste au constat în folosirea benchmark-ului din WinRAR. care efectuează atât de inutilul calcul cu milioane de zecimale al numărului pi.are un efect similar) conduce la un stres suplimentar din partea plăcii grafice şi. de pe albumul cu acelaşi nume) cu mai multe encodere lossy şi lossless.org/wiki/Wire_frame_model 65 . 3DMark se bazează pe engine-uri reale de jocuri. testul fiind comparabil ca pondere a procesorului cu primele trei teste din 3DMark2001. Clasificarea este oarecum convenţională. Dragothic de procesor şi placa video. fiind aplicate aceleaşi formule de calcul pentru definirea poligoanelor şi funcţiilor matematice care le creează. Quake 4. întrucât numeroase teste sintetice folosesc aplicaţii ce au la bază motorul unor software-uri clasice. În fine. În cazul lui 3DMark06. nici un benchmark nu este perfect.wikipedia. diferenţierea procesoarelor. precum şi clasicul SuperPI. diferenţele de comportament dintre benchmark şi jocurile propriu-zise fiind nesemnificative. Pentru testarea în aplicaţii multimedia. de asemenea. practic. FarCry.. s-au utilizat numai testele pentru CPU deoarece celelalte sunt foarte intens solicitante pentru placa grafică. iar Nature este intens grafic. PovRay şi Photoshop CS2 (aplicarea filtrului Radial Blur asupra unei imagini). eventual. pentru 3 http://en. Testele care folosesc aplicaţii reale se numesc teste analitice. procesorul calculează în principal wireframe-ul3 obiectelor. care oferă un scor final. Este evident faptul că un obiect va fi calculat într-un mod similar. sa avut la dispoziţie SPECviewperf. dar s-au reţinut. În alcătuirea scenelor. FLAC şi APE. Tocmai de aceea sa preferat compararea framerate-ului în toate testele.

2 x 512 KB cache L2). PSB 250 MHz. PSB 200 MHz. ele devenind mai puţin clare . în funcţie de ce reprezintă pentru fiecare aplicaţie/joc schimbarea acestui nivel.Evaluarea performanţelor sistemelor de calcul evaluarea performanţei pure a unui procesor. 512 KB cache L2). 8 x 200. PSB 200 MHz. un potenţial de overclocking mai ridicat decât cea ulterioară. de ce nu sa folosit rezoluţia minimă permisă (uneori chiar 320 x 240). prezentă în testul nostru. În aceste condiţii. CL2 2-2-5 1T (Athlon 64 X2 4600+) • 2750 MHz. după ClawHammer şi Winchester.2. CL2 2-2-5 1T (Athlon 64 3500+) • 2500 MHz. Dual-core de la AMD. CL2 2-2-5 1T (Athlon 64 3200+) Athlon 64 X2 4600+ „Manchester” (2. memoriilor excelente şi plăcii de bază 66 . Altfel stă treaba când vine vorba de nivelul de detalii ale unei scene. Venice aduce în prim plan un controller de memorie îmbunătăţit (puţin mai lent decât cel inclus în Winchester. nimeni nu îşi chinuieşte ochii într-o rezoluţie mai scăzută de 1024 x 768 dacă îşi cumpără o placă grafică de ultimă generaţie .2. temperaturi mai joase ca predecesorii săi şi potenţial de overclocking mai ridicat. DDR400. DDR500. Performanţele sunt specifice unui CPU dual-core. CL2. nivelul maxim poate însemna folosirea un poligon regulat cu 100 de laturi pentru înfăţişarea unui cerc. ea neconstituind astfel un factor limitativ. 256 KB cache L2).5. Socket 939 Athlon 64 3500+ „Venice” (2. pe când un nivel mai scăzut poate reduce acest număr la 50. de la caz la caz. a oferit.cum este cea folosită în testul nostru. PSB 250 MHz. mai ales în aplicaţiile optimizate pentru multiprocesor.2 GHz.2.1. reducerea nivelului de detalii poate desemna o filtrare mai sumară a texturilor. or. 3. este de dorit folosirea unei rezoluţii cât mai mici. CL2.6 GHz.5 3-3-7 1T 3. împreună cu nivelul minim de detalii.5. Socket AM2 Sempron 2800+ „Manila” (1. nucleul Manchester este de fapt rezultatul alipirii a două nuclee de tip Venice.caz în care procesorul are mai puţin de lucru. E6. Testarea a avut loc la setările: • 2200 MHz. PSB 200 MHz. Dar. realismul scenei devenind altul . Revizia E3. DDR400. dar mai compatibil). să reflecte comportamentul real al unui utilizator.2. scăderea sau creşterea lui reflectându-se într-o solicitare mai intensă a procesorului şi/sau plăcii grafice. pentru ca placa grafică să termine întotdeauna calculele înaintea procesorului. Procesoare testate: 3.4GHz. A treia variantă de Athlon 64 pentru Socket 939. Mezinul familiei AM2 urcă generos în frecvenţă mulţumită cache-ului minuscul (dar suficient pentru aplicaţiile nepretenţioase). 12 x 200. De exemplu. DDR500. DDR400. pentru a fi siguri că placa grafică nu limitează în nici un fel performanţa? Pentru că orice test trebuie să aibă o aplicabilitate practică. Aceasta din urmă a dezamăgit entuziaştii.5 3-3-7 1T • 2000 MHz.caz în care placa grafică este degrevată de o parte dintre sarcini. 11 x 200. teoretic. necesitând voltaje mari pentru a atinge frecvenţe cât de cât ridicate. Testarea a avut loc la setările: • 2400 MHz. la fel de bine.5.

Nucleul Manila este un nucleu Orleans (A64 AM2) cu cache-ul redus la 256 KB. PSB 250 MHz. deşi temperaturile atinse i-ar face pe mulţi să înnebunească. Socket T (LGA775) Intel Celeron D 336 „Prescott” (2. DDR2-800. • 3000 MHz. DDR2-667. Dual-core-ul pentru platforma AM2. DDR2-646. PSB 250 MHz. ci vă invităm doar să studiaţi graficele testelor.3. CL3 2-2-7 Intel Pentium 4 531 „Prescott” (3 GHz. nucleul Windsor nu reprezintă o inovaţie. PSB 200 MHz. DDR2-667. DDR2-667. datorită cache-ului măricel şi mai ales a faptului că avem de-a face cu un procesor cu două nuclee. PSB 200 MHz. nu a dezamăgit. Comportamentul în teste este decent. DDR2-667. • 1866 MHz. DDR2-533. CL3 2-2-7 Intel Core 2 Duo E6700 „Conroe” (2. dovedind prin overclocking performanţe decente pentru zona în care se află şi pentru preţul pe care îl are.5. CL3 3-3-7 1T (Sempron 2800+) • 2880 MHz. CL4 3-3-8 1T (Athlon 64 X2 3800+) 3. CL4 3-3-8 1T • 2000 MHz. DDR2-960. CL3 2-2-7 (Pentium D 945) • 4250 MHz. PSB 205 MHz.2 GHz. Testarea a avut loc la setările: • 2200 MHz. DDR2-800. PSB 200 MHz. 1 MB cache L2). mai ales dacă îşi doresc sisteme silenţioase. Testarea a avut loc la setările: • 1600 MHz. 10 x 266. Englezul spune „save the best for last”. procesorul de faţă este unul decent.8 GHz. 2 x 512 KB cache L2). PSB 266 MHz. deşi am fi preferat ca urcarea în frecvenţă să se facă cu o creştere mai mică a tensiunii. Mezinul familiei Core 2 Duo. Testarea a avut loc la setările: • 2800 MHz. Răţuşca cea urâtă a lui Intel. Celeron. 2 x 1 MB cache L2). 2 x 2 MB cache L2). PSB 360 MHz. PSB 430 MHz.2. 2 x 2 MB cache L2). CL3 2-2-7 Intel Core 2 Duo E6300 „Allendale” (1. Considerat de mulţi o relicvă vie a arhitecturii NetBurst. însă fără a excela. DDR2-834. • 3400 MHz. DDR2-617. CL4 3-3-8 2T Athlon 64 X2 4200+ „Windsor” (2. deoarece ele vorbesc de la sine. CL4 3-3-8 1T (Athlon 64 X2 4200+) • 2750 MHz. PSB 200 MHz.4 GHz. 7 x 266. PSB 255 MHz. 17 x 200. Performanţa sa este una bună. CL3 2-2-7 (Pentium 4 531) • 3825 MHz. Noi nu spunem nimic. CL3 2-2-7 Intel Pentium D 945 „Presler” (3. DDR2-680. 21 x 133. PSB 200 MHz. 6300 dovedeşte o putere de calcul ieşită din comun şi se ia la trântă voiniceşte cu Pentium D 945. Şi are „numai” 2 MB de cache level 2 şi frecvenţă net inferioară acestuia. DDR2-667. 15 x 200. CL3 2-2-7 (Celeron D 336) • 4305 MHz.Cap 3: Evaluarea performanţelor procesoarelor excepţionale. PSB 133 MHz. 256 KB cache L2). ci doar o cuplare a două nuclee Orleans. CL3 2-2-7 (Core 2 Duo E6300) • 3010 MHz. 11 x 200.66 GHz. Performanţele foarte bune caracterizează acest procesor. 67 .86 GHz.

Altfel ar fi stat situaţia într-o configuraţie multi-GPU. creşterea la 2T determină o scădere masivă de performanţă. procesorul putând urca la o frecvenţă şi mai mare. la cinci ani de la apariţie. nu (mai) există setarea Command Per Clock (1T/2T). sa folosit frecvenţa de 2 GHz pentru Windsor pentru a simula comportamentul lui Athlon 64 X2 3800+. DDR2-667. plăcile grafice moderne determină în continuare o limitare a framerate-ului. setarea memoriei a fost DDR2-667 datorită compatibilităţii oficiale restricţionate la această frecvenţă. cel mai lent CPU dual-core de la AMD. un procesor de referinţă pentru platforma Socket 939. aparent. PSB 266 MHz. Diferenţele dintre procesoare au fost marcante în toate testele. 68 .primul test popular ce a folosit funcţia Pixel Shader introdusă odată cu generaţia GeForce 3 şi în cazul căruia. Rezultatele sunt exprimate în număr de fps. pentru platforma Intel. PSB 345 MHz. rulându-se implicit cu valoarea 2T. deşi nu au fost probleme în rularea la DDR2-800. cu excepţia lui Nature . CL3 2-2-7 (Core 2 Duo E6700) 3450 MHz. în cazul lui AMD. DDR2-690.Evaluarea performanţelor sistemelor de calcul • • 2666 MHz. limitarea overclocking-ului la Sempron 2800+ (la 80%!) a fost datorată plăcii de bază. în cazul lui Sempron AM2. însă procesoarele Intel se pare că nu depind în mod vital de latenţa 1T. CL3 2-2-7 • • • • • Observaţii: sa folosit frecvenţa de 2 GHz pentru Venice cu scopul de a simula comportamentul lui Athlon 64 3200+.

69 . Aici nu există „cel mai rapid”. ci „cel mai potrivit”. în cele din urmă fiind o decizie subiectivă.Cap 3: Evaluarea performanţelor procesoarelor Alegerea unui procesor a fost întotdeauna o decizie grea.

Introducere Un test de memorie nu este simplu de realizat.4. iar multe plăci de bază oferă o configurabilitate foarte bună. precum stă treaba la plăci de bază sau plăci grafice. Acum. nu există memorie ideală.1. eventual creşti tensiunea la maxim şi vezi la cât rulează stabil. să lămurească unele aspecte delicate legate de memorii şi abia apoi să ofere un ghid de cumpărare celor interesaţi. un test de memorii perfect riguros ar trebui să dureze circa trei luni de muncă intensivă. Mai problematic este aspectul frecvenţelor. cine posedă un Athlon 64 3200+ care. el nu mai pune problema la modul „vreau să-mi iau o memorie de 512 MB”. Dacă nu. latenţele pot face diferenţa dintre un sistem rapid şi unul care suferă de pe urma unei limitări ce putea fi evitată. va avea nevoie de o memorie pe măsură. acesta nu este unul care să reflecte cu acurateţe comportamentul produselor. Tocmai de aceea testul nu trebuie considerat ceva exhaustiv. micşorezi latenţele. nu s-au luat în considerare decât parţial latenţele secundare. Fără a exagera câtuşi de puţin. testarea nu este atât de riguroasă pe cât s-ar fi putut realiza. Momentan. De ce? Pentru că numărul parametrilor care trebuie luaţi în calcul este cu cel puţin un ordin de mărime mai mare. care să satisfacă „foamea” de lăţime de bandă a procesorului. tRFC.. tREF. E suficient să comparăm BIOS-ul unei plăci high-end cu chipset Intel cu cel al unei plăci nForce4 (în ediţia pentru AMD): trei sau patru setări de memorie versus minim 10. de exemplu. frecvenţa ei va trebui scăzută iar penalizarea de performanţă va fi destul de mare. platforma AMD se foloseşte intensiv memorii DDR. Un test riguros ia în calcul şi parametrii cei mai puţini uzitaţi. Drive Strength. Spre deosebire de alte teste. iar sistemele bazate pe procesoarele companiei texane sunt preferate de foarte mulţi. din cauza timpului enorm care ar fi fost necesar acestui demers. Unii ar spune că e simplu: setezi frecvenţa. tRWT. 70 . Fiecare utilizator îşi va stabili propriile standarde în funcţie de diverşi factori. mentalitatea cumpărătorului a suferit schimbări semnificative în ultima perioadă. şi anume una care să reziste cu succes la 270 MHz. Testarea şi metoda prezentate în curs reprezintă un compromis. şi lista lor ar putea umple o pagină. uneori 20 sau 30. dintre care amintim: • frecvenţă. rulează în 2700 MHz. De asemenea. s-au testat doar 30 de produse (cu toate că s-ar fi putut procura mai multe) şi nu s-au introdus în „concurs” decât kit-uri de 1 GB (câte două module de 512 MB). • latenţe. ne aflăm într-o perioadă de trecere de la standardul DDR la cel DDR2. aspect. dacă nu de cei mai mulţi entuziaşti de la noi. puţini reuşesc. Nu s-au efectuat testele decât sumar pe o a doua placă de bază.. ci în primul rând un ghid care să deschidă gusturile celor pasionaţi. • performanţă brută. supus overclocking-ului. Evaluarea memoriilor 4. Aşadar. Puţini se încumetă. • răspuns la tensiune şi. Fals. de ce nu. ci „vreau să-mi aleg o memorie care merge în latenţe strânse şi în frecvenţă mare”. Chiar dacă sporul de performanţă nu este senzaţional. Totuşi. cu atât mai mult cu cât chipset-urile au căpătat o anumită maturitate.

nu vom putea introduce o memorie DDR2 într-un slot DDR. cât şi pe cel descrescător al semnalului. Dacă platformele Intel au trecut la DDR2. şi care se regăsesc şi la recentul DDR2. HTT. Aspectele abordate în acest material sunt diverse.pe scurt.1. PC2100.autoritatea în domeniu care ratifică diversele standarde de memorie. ce dublează lăţimea de bandă. şi apoi cu 8. unitatea de măsură fiind GB/s (gigabyte pe secundă). Marketing-ul joacă un rol esenţial aici. şi asta la aceeaşi frecvenţă. chiar dacă ambele rulează la 133 MHz. În rest. aşadar. ci ne vom limita la descrierea funcţionării memoriei DDR SDRAM . PC2700 şi PC3200. Veţi afla care sunt. În mod uzual. Cu toate acestea. 4. numărul lor creşte la 16 bytes (128 de biţi) per ciclu. precum şi modul de comportare al celor mai importante module de pe piaţă. aceasta fiind lăţimea consacrată a bus-ului. 133. Aspectul lor este asemănător. cu memoria asincron (230 MHz)? Cine se joacă va prefera prima opţiune. frecvenţa memoriei nu poate depăşi frecvenţa bus-ului procesorului (HTT. DDR. în funcţie de tipul acestora. sunt PC1600.2. de preferinţă identice. diverşi producători au impus anumite pseudo-standarde. Astfel. lăţimi de bandă Standardul DDR SDRAM a adus îmbunătăţiri minore de ordin tehnologic faţă de vechiul SDRAM. Modelele recente de procesoare Athlon 64 (precum cele cu nucleu Venice sau San Diego) pot folosi un divizor maxim de 250:200. Standarde. Atunci ce sens are să depăşim lăţimea de bandă oferită de memoriile ce rulează la 250 MHz (DDR500)? 71 . plăcile de bază dispun de slot-uri specifice în care modulele vor fi inserate. diferenţele „palpabile” dintre o memorie la 600 MHz şi una la 400 MHz fiind minime datorită latenţelor mai crescute la frecvenţe mari. ce înseamnă şi cum trebuie setate latenţele memoriei. Datele sunt transmise atât pe frontul crescător. Standardele DDR aprobate de JEDEC . alături de modul lor de procurare. deseori fiind referite ca DDR200. De ce cifrele 2 şi 8? Pentru că avem de-a face cu memorii DDR. ar putea conta şi aplicaţiile rulate: ce este mai convenabil. iar la fiecare ciclu de tact sunt transmişi câte 8 bytes (64 de biţi). faţă de celelalte două tipuri care dispun de una singură. DDR266. care în mod implicit este de 200 MHz. adică 5:4. cine codează filme va merge pe a doua. între memorie şi HTT. frecvenţe. rezultând o lăţime de bandă de două ori mai mare.Cap 4: Evaluarea memoriilor Mai mult. o memorie DDR400 va transmite (aproximativ) 3. DDR333 şi DDR400 din cauza raportării la SDRAM: o memorie DDR266 (PC2100) este de două ori mai rapidă decât una SDRAM PC133. însă sunt necesare (cel puţin) două module de memorie. Desigur. Nu vom intra prea mult în detalii. oricât de asemănătoare ar fi ele. În cazul controller-elor de memorie dual-channel. avem principii similare standardului SDRAM. cele SDRAM prezentând două crestături. întrucât am mai scris despre memorii în capitolul 2. elementul central de gestiune a acesteia. Fizic vorbind. Lăţimea de bandă oferită de DDR este egală cu frecvenţa sa înmulţită cu 2. 166 şi respectiv 200 MHz. frecvenţele corespunzătoare fiind de 100. care să satisfacă nevoile în creştere ale utilizatorilor. un Athlon 64 „chinuit” la 2600 MHz cu memoria rulând sincron (260 MHz) sau unul la 2750 MHz „chinuit” şi mai mult. însă a dublat performanţa.2 GB/s către controller-ul de memorie.2. cele AMD sunt în continuare fidele standardului DDR şi solicită o lăţime de bandă tot mai mare. modulele DDR prezintă 184 de pini (faţă de 168 pentru SDRAMul clasic şi de 240 pentru DDR2). ex-FSB = viteza de comunicare dintre procesor şi chipset-ul plăcii de bază).

uşor de suportat de către orice procesor. dar arhitectura procesoarelor AMD64 nu permite o frecvenţă a memoriei mai ridicată decât produsul dintre HTT şi 5:4 (1. Ca să fie mai clar. Logica de bază a latenţelor va fi explicată în capitolul următor (test plăci grafice) şi vă invităm să o (re)citiţi.e totuna dacă avem 5 x 200 sau 4 x 250). o frecvenţă mai mică a memorie ar putea completa perfect nevoile de calcul. RAS-ul constă în câteva etape.25). respectiv liniei din matrice. o valoare practic imposibil de atins. precum SysTool sau A64Tweaker. latenţele sunt nişte numere ce reprezintă cicluri de tact dintre diferite stadii de prelucrare a informaţiilor de către memorie. astfel încât produsul final să nu depăşească 5 x 200). Fiecare bank al memoriei (un bank fiind o grupare de mai multe chip-uri . în continuare. adică 5:6. dar cu atât cresc şi şansele ca memoria să nu le suporte. pentru accesarea unei informaţii fiind necesară localizarea unei celule. dacă creştem HTT-ul la 300 MHz nu se măreşte şi frecvenţa finală a procesorului? Cum va rezista un Athlon 64 de la 2 la 3 GHz? Simplu: prin scăderea multiplicatorului (operaţie posibilă la toate procesoarele AMD. prin care informaţia este citită sau scrisă: Active (activează rândul). dacă rulăm asincron (nerecomandat dar posibil) .2. Aici ea poartă numele de overclocking: bus-ul HTT poate fi crescut cu oarecare riscuri la 300 MHz sau chiar mai sus (micşorând în acelaşi timp multiplicatorul acestuia. eventual controller-ul de memorie al procesorului.1. un bus HTT de 300 MHz va putea profita de o frecvenţă a memoriei de până la 375 MHz (DDR750). cu atât performanţele vor fi mai mari. în cazul de mai sus îl vom reduce de la 10x la 7x. Latenţele se pot regla din BIOS-ul plăcii de bază (dacă acesta dispune de o astfel de facilitate) sau prin intermediul diverselor utilitare. astfel încât rularea asincronă la un raport 333:400. altele suportă şi peste 300 MHz cu anumite setări.Evaluarea performanţelor sistemelor de calcul Soluţie se găseşte întotdeauna. în realitate. Read (citeşte informaţia). ar putea fi avantajoasă. rezultând o frecvenţă finală de 2100 MHz. Mai mult. rezultând un frumos DDR600. fiecare fiind dedicat selectării coloanei. În acest scop.deci frecvenţa memoriei va fi egală cu HTT-ul înmulţit cu un număr fracţionar (de exemplu 1:2). acestea reflectă îndeaproape performanţa memoriei. putem atinge HTT-uri de peste 400 MHz! Putem jongla cu divizorul dintre HTT şi memorie astfel încât să obţinem performanţele optime. Dar nu ne opreşte nimeni să setăm divizorul la 1:1. într-o matrice uriaşă. 4. detaliind semnificaţia acestora. limitarea constituind-o acum placa de bază. vom completa acele explicaţii şi ne vom referi la latenţele ce pot fi setate de către utilizator. Practic. Totuşi. Uneori.de multe ori logică) constă. De exemplu. un HTT crescut nu afectează cu nimic performanţa (din moment ce frecvenţa finală a acestuia nu poate depăşi 1000 MHz . Plăcile de bază nu acceptă uşor frecvenţe mari ale HTT-ului: unele se plafonează la 220 MHz. cu un suport minim din partea plăcii de bază). au loc câteva procese fundamentale: CAS (Column Address Strobe) şi RAS (Row Address Strobe). Cu cât acestea sunt mai mici. Write (scrie informaţia). datorită latenţelor mai scăzute. Latenţe Numite şi timing-uri. Precharge (şterge informaţiile şi face pregătirile 72 .

Memoriile ieftine lucrează cu valori de 3 sau chiar 4. apoi un rând şi o coloană. Dacă acestea sunt prea mici. altfel spus. Selectarea unui rând nu trebuie să dureze mai puţin decât specifică valoarea tRCD. Trăgând linie. 2. Valoarea 3 nu este acceptată de unele module. 2. setarea Command Rate (CMD) este. fiecare producător preferând o anumită combinaţie pe care o consideră ideală. tRAS (RAS Active Time sau Active to Precharge Delay) este o latenţă foarte interesantă.5 şi 3. selectarea unei coloane se supune indicaţiilor lui tCL. Ea oglindeşte timpul dintre comanda Active şi cea Precharge. rareori de instabilitate). Deoarece ea include atât tRCDul cât şi tCL-ul. care iese din tiparele obişnuite. o valoare mai mică decât suma acestora două nu va avea nici un efect. tRCD (RAS to CAS Delay) limitează timpul dintre RAS şi CAS sau. Valorile uzuale sunt de 2. deşi nu face parte din ciclul RAS. erori de program şi ecrane albastre în Windows până la imposibilitatea de a intra în POST). suportată de unele plăci de bază. timpul dintre comenzile Active şi Read/Write. 3 şi 4. timpul de accesare + citire/scriere + „pregătire pentru pregătire” nu trebuie să fie mai redus decât indică tRAS-ul. o valoare prea mică poate chiar reduce (nesemnificativ) performanţa. memoria va pierde informaţii şi vor apărea erori (de la blocaje.5. în mod paradoxal. adică refacerea celulelor pentru reluarea ciclului. indiferent de frecvenţă. cele mai rapide memorii suportând valoarea 2 la 200 MHz. Per total. apoi 3 la 300 MHz.Cap 4: Evaluarea memoriilor pentru reluarea ciclului). Importanţa ei este mai redusă decât cea a lui tRCD şi comparabilă cu tCL. astfel încât la începutul demarării citirii sau scrierii să existe informaţia legată de coordonatele celulei accesate. este strâns legat de acesta din motive evidente. Valorile uzuale sunt de 2.5 la 250 sau chiar 300 MHz. Deşi nu este legată strict de memorie. Pentru performanţe optime se recomandă o valoare cu 1 sau 2 mai mare decât suma celor două . dar unele plăci permit setarea acestora pe riscul utilizatorului (risc de performanţe scăzute. ci de controller. De asemenea. Limitarea timpilor necesari desfăşurării acestor operaţii este efectuat prin setarea latenţelor. tCL (CAS Latency).aceasta deoarece. Ea reprezintă timpul minim în care se desfăşoară selectarea coloanei prin intermediul procesului CAS. valoarea de 1. de departe. cele de 1. 4 şi 4. deşi era latenţa de bază în cazul memoriilor SDRAM. cea mai importantă. Între Active şi Read/Write are loc şi selectarea coloanei prin intermediul lui CAS. importanţa acesteia a scăzut mult la DDR SDRAM. tRP (RAS to Precharge Delay) se referă la timpul de desfăşurare al comenzii Precharge. memoriile performante acceptă tRP = 2 la 230 250 MHz. Numere mai mici de 5 nu sunt suportate oficial (tRCD + tCL + 1 nu poate fi mai mic de 5). Numită în diverse moduri (CPC. pe când cele mai rapide oferă un tRCD de 2 la 200 MHz.5 sunt practic inutile şi. limitând practic întregul proces RAS. se citeşte sau scrie informaţia şi se fac pregătirile pentru reluarea ciclului. Ea este cea mai importantă latenţă pentru memoriile DDR deoarece afectează cel mai mult performanţa. impactul asupra performanţei şi stabilităţii este neglijabil. însă la altele ea este strict necesară pentru atingerea de frecvenţe mari. iar pregătirile pentru ciclul următor nu trebuie să fie mai scurte decât ne spune tRP-ul. Valorile uzuale sunt cuprinse între 5 şi 11. nu creează probleme de stabilitate dar nici nu oferă vreun avantaj. 3. de cele mai multe ori imposibil de setat. în schimb. observăm că memoria lucrează într-un mod relativ simplu: se selectează un bank. 2T 73 .5. pe când cele lente lucrează cu 3 şi 4 la 200 MHz. 3 la 250 MHz şi 4 la 300 MHz.

diferite bank-uri ale memoriei nu vor putea fi accesate sau reîmprospătate alternativ. • tREF (Refresh Period) conţine o setare uşor de înţeles dar dificil de setat optim. vom folosi notaţia CL tRCD-tRP-tRAS CMD. deşi cele multe dintre ele pot fi aplicate şi altor chipset-uri sau chiar altor tipuri de memorii (SDRAM sau DDR2 SDRAM). însă unele memorii au nevoie de mai mult. • tRTW (Read to Write Delay) este similară lui tWTR. se va presupune implicit că ea este 1T. ci doar simultan. • tRRD (Row to Row Delay) limitează timpul dintre RAS şi RAS pentru acelaşi bank. valoarea minimă este egală cu suma dintre tRAS şi tRP (de obicei nici nu pot fi setate valori mai mici de 5 + 2). Valoarea optimă este 1. • tWR (Write Recovery Time) reflectă timpul dintre finalizarea unei operaţii de scriere şi operaţia de Precharge. Valoarea minimă este în general de 9. Pe lângă aceste latenţe principale. 3120 pare a fi valoarea optimă.Evaluarea performanţelor sistemelor de calcul Timing. însă cea de 2 este uneori utilă pentru creşterea stabilităţii la frecvenţe mari.5 3-3-7 2T. impactul asupra performanţei se lasă însă aşteptat. mai ales la frecvenţe mari. adică de reîmprospătare a informaţiilor. nu este cunoscut impactul său asupra performanţei. ce oferă un compromis bun între performanţă şi stabilitate. valoarea clasică fiind 2. de exemplu CL2 2-2-5 1T sau CL2. element vital în cazul oricărei memorii DRAM. Pentru a nota timing-urile principale ale unei memorii. La nevoie. • tWCL (Write CAS Latency) indică o setare de CAS specifică operaţiei de scriere. iar valorile foarte mici (sub 2000) o reduc în mod exponenţial. ea poate fi crescută la 4 dar uneori poate fi scăzută chiar la 0. Deşi nu este o latenţă. s-ar putea să fie necesar şi un tRTW de minim 2. • tRFC (Row Refresh Cycle Time) este timpul minim dintre două operaţii de Refresh aplicate aceluiaşi bank. ea semnifică timpul scurs de la selectarea bank-ului memoriei până la începerea trimiterii comenzilor către acesta. însă unele memorii au nevoie de mai mult. Este vorba de timpul la care memoria este reîmprospătată. valorile mari oferă o mai bună performanţă în detrimentul stabilităţii. dar limitează timpul scurs dintre o operaţie de citire şi una de scriere. Dacă setarea CMD este omisă. Orice platformă ar trebui să suporte 1T pentru un maxim de două module de 1 GB. setarea DRAM Bank Interleave are un impact semnificativ asupra performanţei. Dacă o dezactivăm. Importanţa setării este redusă. În mod evident. Valorile posibile sunt 1T şi 2T (notate exact astfel). Dacă tCL este setat altfel decât 2. Command per Clock). aşadar RAS (reflectat de tRAS) + Precharge (reflectat de tRP). • tWTR (Write to Read Delay) se referă la timpul dintre o operaţie de scriere şi una de citire în cadrul aceluiaşi bank. Menţionăm că ele sunt valabile în primul rând pe platforma nForce4. Opţiunea rareori are un rol de luat în seamă. Cum singura setare posibilă pare a fi cea de 1. valorile posibile fiind de 2 sau 3. însă cea de 4 este indicată pentru şanse mai mari de stabilitate. pe scurt. • tRC (Row Cycle Time) are o importanţă semnificativă şi reflectă întregul ciclu de parcurgere al unui rând. Impactul asupra performanţei este neglijabil. Valoarea de 1 oferă cea mai bună performanţă la citire. există câteva ce au o importanţă mai redusă şi pe care le-am descris în continuare. ceea ce înseamnă 74 .

ce cuprinde diverse alte informaţii pe lângă aceste timing-uri. tRC a luat valoarea 7. cel puţin până la intervenţia utilizatorului care le poate ajusta după cum doreşte. am ales câteva combinaţii uzuale ale latenţelor. Memoriile au format un kit dualchannel de 1 GB şi au rulat în DDR400.9 MHz). iar celelalte latenţe au fost reduse la minim. tRFC 9. 1 http://www.11 instalat. tWR 2. pentru mai multă siguranţă. Acestea fiind zise. o placă grafică Gigabyte GV-RX85X256V-B (Radeon X850 XT PE) cu Catalyst 5. ori double-sided). tWTR şi tRWT 1. În final. Ultimele trei teste au constat în reducerea multiplicatorului procesorului la 9. placa de bază citeşte aceste valori şi le setează. precum şi mai puţin cunoscutul program de benchmark RealStorm Bench 20041.Cap 4: Evaluarea memoriilor că nu vom putea folosi mai multe bank-uri în paralel. frecvenţă reală setată: 200. vor obţine performanţe identice în toate testele. e vorba de latenţele la care producătorul garantează funcţionarea memoriilor. Setarea de bază a fost CL2 2-2-5 1T.realstorm. ce rulează la aceleaşi latenţe şi deţin acelaşi număr de bank-uri (sunt ori single-sided. rezultând o frecvenţă de aproximativ 1800 MHz (în timp ce memoria a rămas constantă). modulele fiind double-sided. Testele realizate au vizat comportamentul diferitelor setări. instrumentele de lucru fiind o placă de bază DFI UT LanParty Ultra-D. Astfel. putem enunţa o regulă foarte importantă în cazul memoriilor: toate memoriile de aceeaşi capacitate. Majoritatea acestor latenţe sunt obţinute de către placa de bază pe baza citirii SPD-ului (Serial Presence Detect). o tabelă înglobată în fiecare modul de memorie. Teoretic. performanţa scăzând corespunzător. cum ar fi producătorul memoriei. un procesor Opteron 146 (2 GHz. tRRD 2. însă practic mulţi dintre aceştia setează valori mai relaxate. pentru a releva impactul asupra performanţei generat de creşterea simultană a acestora. S-a folosit atât un demo personalizat pentru Quake 3. cu excepţia celor suportate neoficiale şi considerate neuzuale. precum şi în scăderea frecvenţei memoriei la 166 şi respectiv 133 MHz (procesorul a rămas constant). care a stresat puternic procesorul şi memoria. ce randează scene 3D folosindu-se exclusiv de puterea procesorului.com/ 75 . În momentul pornirii sistemului pentru prima dată.

Evaluarea performanţelor sistemelor de calcul 76 .

Cap 4: Evaluarea memoriilor ] 77 .

2 GHz. 0. respectiv 18 (18-10-2005). Ca platformă de testare. dar care nu merită neglijată. aducând-o la nivelul lui tRCD = 4. în schimb. Performanţele unui astfel de procesor sunt comparabile cu cele ale unui Athlon 64 3500+. Alternativ. tRCD = 4 sau tCL = 3 însă. orice modul modern este capabil să ruleze în mod dual-channel fără probleme. • Creşterea lui tRC generează o scădere minoră de performanţă. Sa făcut această alegere întrucât sa dorit să fim limitaţi cât mai puţin de controller-ul de memorie. legate de preţ). drept urmare încercarea merită făcută. cu siguranţă. dar pot face diferenţa într-un test de performanţă. el dispunând de frecvenţa lui 3200+ dar şi de o cantitate dublă de cache L2. Placa de bază utilizată în primul rând a fost un DFI UT LanParty Ultra-D cu chipset nForce4 Ultra. similară lui tRAS. eventual chipset diferit). în general la turaţie minimă (2200 rpm).09 microni) în format Socket 939. • tCL = 2. trebuie ştiut că versiunile pe Socket 939 au preţuri foarte convenabile şi sunt compatibile cu practic toate plăcile de bază recente. Concluzii Din rezultatele obţinute mai sus putem trage câteva concluzii. sa folosit un procesor Opteron 146 (nume de cod Venus sau San Diego . • tRCD = 3 este cauza unei scăderi semnificative de viteză. • tRP = 3 sau 4 este o setare ce are un impact minor. tRCD şi 1. setarea la 3 o reduce simţitor. • Command Rate = 2T „omoară dintr-un foc” viteza. • Importanţa lui tRFC este complet nesemnificativă.2. 4. • tWR. cel mult. totuşi. iar tRCD = 4 depăşeşte cu puţin ca importanţă tCL = 3. zgomot de Airbus). • Scăderea frecvenţei memoriei la 166 MHz a depăşit ca importanţă setarea Command Rate = 1T. tWTR şi tRWT au avut o importanţă neglijabilă. Chiar dacă numele de Opteron este asociat mai degrabă serverelor. în module de câte 512 MB. este recomandată o valoare egală cu suma dintre tCL. • Doar setarea lui tRRD la 4 a limitat viteza.discutabil. • Micşorarea cu 200 MHz a frecvenţei procesorului a avut un impact mai pronunţat decât orice însumare a setărilor.3.2. ce a edificat unele probleme întâlnite pe DFI (şi care s-au dovedit a fi legate de compatibilitate). ori separat. • tRAS are o importanţă total nesemnificativă. Modul de testare Memoriile DDR testate au venit ori în kit-uri de 1 GB. BIOSurile au fost ultimele oficiale: N4D623-3 (23-06-2005). cu menţiunea că acestea ar putea diferi în cazul folosirii altei platforme (altă placă de bază. care la revizia Winchester era undeva în vecinătatea stadiului de „catastrofal”. sa folosit şi o placă Abit AN8 SLi Fatal1ty. nu şi suma acestora. Cele mai multe memorii suportă valori mici. Deasupra memoriilor am aşezat un ventilator AeroCool X-Flow. cu toate că extrem de puţin. doar pentru determinarea frecvenţei maxime fiind folosit la maxim (3800 rpm. 78 . Diferenţe practic nu există (decât.Evaluarea performanţelor sistemelor de calcul 4. dar neneglijabil.5 afectează relativ puţin performanţa.

Uneori. pe valoarea Auto. precum şi alte câteva timinguri secundare. iar satisfacţia este garantată pentru pasionaţi. unde ne-am limitat la 40%. Şi aceasta indiferent cât de bună este răcirea. S-au selectat patru praguri: 200. Diferenţe aparent minore. Practic. pe care l-a setat la 4 indiferent de dorinţa noastră. De asemenea. Abit-ul a refuzat categoric orice frecvenţă de peste 296 MHz la o pereche de module normale (double-sided). 14. unde am parcurs întreg testul. ele fiind reglate. Placa Abit a avut probleme cu tRWT.Cap 4: Evaluarea memoriilor Avantajul plăcii DFI constă în stabilitatea mare la frecvenţe ridicate. de preferinţă. chiar dacă în primele minute o tensiune crescută pare a oferi mai multă stabilitate. 250. tRWT 3-3-3-4-4. pentru DDR400 am ales la tRC valoarea de 10. pe cât posibil. tRCD. Revenind în detaliu la latenţe. Desigur. dar creşte în acelaşi timp căldura degajată. multiplicatorul HTT a fost astfel ales încât produsul să nu fie mai mare decât valoarea implicită. la care sa măsurat latenţele minime principale: tCL. Chiar dacă practic toate memoriile suportă valoarea 7. cu excepţia celor legate de Drive Strength. probabil că. este vorba de ajustarea amplitudinii semnalului dintre memorie şi controller. tipul chip-urilor ce dotează memoriile contează enorm. 275 şi 300 MHz. dacă am fi recurs la BIOS-uri speciale. cu care am rulat de trei ori testul #5. o dată #8 şi câteva procente din #7 (din motive de timp) apoi o versiune pentru Windows3. Timing-ul tRAS a fost ales în funcţie de tRCD (nu şi de tCL. Ultimul aspect discutat este tensiunea memoriei. tRRD 2-2-2-2-4.com/memtest/download. tWR 2-2-2-2-3. Modelul de la DFI conţine şi alte câteva setări interesante. La ce folos să folosim memoria la 320 MHz când procesorul rulează la numai 1600 MHz? De asemenea. Command Rate 1T. influenţarea acesteia având consecinţe directe asupra stabilităţii. În final. Nu afirmăm că o asemenea testare este suficientă pentru a declara o memorie „perfect stabilă”. cu 7-7-15 2T am fi obţinut frecvenţe mai mari. după o jumătate de oră este necesară scăderea lui pentru a atinge rezultatele optime. am ales una standard şi uzuală. Pentru a evalua stabilitatea am folosit versiunea 1. Nu le vom detalia aici.org/ http://hcidesign. dar a fost cel mai bun compromis pe care l-am putut realiza. cu excepţia frecvenţei maxime. dar la o lăţime de bandă prea mică.memtest. au o influenţă directă asupra valorilor optime. obţinând astfel frecvenţa maximă la care memoriile rulează cu o performanţă decentă. aici cea mai bună soluţie nu stă în recomandări. Durează câteva ore pentru a găsi optimul. Setările efectuate în BIOS au fost alese astfel încât frecvenţa procesorului să nu fie mai mică decât cea implicită. pentru DDR550 şi DDR600 12. iar tREF 3120-3120-3120-3120-2064. s-au urcat latenţele la CL2. ci în invitaţia de a încerca. tWTR 1-1-1-1-2. Frecvenţe de peste 300 MHz au fost obţinute aproape exclusiv pe platforma DFI.5/3 4-4-10 1T. tRFC a parcurs drumul 12-14-15-15-17. pentru simplificare): 5 pentru tRCD = 2. asociate unor latenţe secundare alese astfel încât ele să nu afecteze stabilitatea şi folosind.65 a popularului Memtest86+2. pentru DDR500 11. o opţiune extrem de utilă dacă dorim atingerea frecvenţelor maxime. am fi atins valori mai mari pentru anumite tipuri de memorii. iar pentru frecvenţa maximă. 7 pentru tRCD = 3 şi 8 pentru tRCD = 4. tRP. 2 3 http://www. precum revizii diferite ale plăcilor de bază. de 1000 MHz.html 79 . Un voltaj crescut poate aduce stabilitate sporită în overclocking. exemplarul testat urcând până la 320 MHz folosind BIOS-ul standard.

tipul chip-urilor din dotare determină întreg comportamentul unei memorii. desigur. 4. Cumpărătorul este astfel derutat. Totuşi. Pentru DDR400 CL2 2-2-x sunt suficienţi şi 2. mai ales în versiunea BH5. mai ales că un TCCD la 4V s-ar „evapora” instantaneu. Acesta din urmă a purtat. până la CL2.2V. Avantajul lor stă în faptul că nu sunt afectate aproape deloc de latenţe. Samsung TCCD reprezintă. însă uneori pot urca până la 3V (rareori mai mult) cu un impact mic asupra frecvenţelor maxime. În general. Timing-urile la care lucrează stabil sunt CL2 2-2-x sau 2-3-x pentru DDR400. CL2. situaţie în care nu avem nevoie de răcire suplimentară. ele fiind descrise în continuare. ce poate urca până la 4V! Puţine plăci de bază permit aşa ceva. rezultând frecvenţe maxime mai reduse. recordurile fiind obţinute întotdeauna cu 2 x 256 MB. precum PCB-ul şi eventual radiatoarele ce acoperă memoria. cu care pot genera erori la frecvenţe mari. Chip-uri de memorie Pentru mulţi. Ne vom referi doar la situaţia în care folosim două module de 512 MB. renumită pentru produsele sale de calitate. popularitatea lor a scăzut.8V. acestea având inscripţionat producătorul modulului. afirmaţia este falsă. După cum spuneam. unele UTT-uri creează probleme şi la 3. Foarte frecvent este procesul de remarcare a chip-urilor. Există puţine modele populare de chip-uri. Cele mai multe rezistă la cel puţin 310 MHz şi se pare că nu agreează setarea CL3. o memorie se evidenţiază (pe lângă frecvenţe şi latenţe) prin producător. Altă caracteristică a Winbond-urilor. singurii factori care contează cu adevărat sunt chip-urile (peste 90% din importanţă) şi PCB-ul.php?name=Company&c_lang=english 80 . în general. 4 http://brain-power. care se opresc la 215 . În imaginea alăturată avem câteva exemple de inscripţionări.5 3-3-x.5 3-3-7 pentru DDR500. CL2 sau CL2. este tensiunea mare la care răspund. semnătura cunoscutei companii BrainPower4.5 4-4-x pentru DDR550 şi CL2.5 4-3-x sau 4-4-x pentru DDR600. de obicei. chiar dacă memoriile nu sunt acoperite cu radiatoare. Ele sunt depăşite pe alocuri în materie de latenţe. şi reciproca este adevărată. nu recomandăm valori mai mari de 3V decât în cazul celor care ştiu cu adevărat ce fac. situaţia fiind diferită pentru 256 MB sau 1 GB deoarece o cantitate mai mare de memorie „stresează” mai mult controller-ul.225 MHz). Ele răspund la un voltaj de până la 2. prin care un PCB poate fi identificat ca BrainPower. cu timpul. dar sunt singurele care depăşesc considerabil frecvenţa de 300 MHz (DDR600). probabil.net/menus.4. abia diferenţa dintre produsele cu aceleaşi chip-uri fiind făcută de elemente auxiliare. condiţia este să avem o răcire bună.Evaluarea performanţelor sistemelor de calcul O regulă empirică spune că dacă memoria „răspunde la voltaj” (adică se comportă mai bine la o tensiune mărită) atunci îl putem creşte în continuare. Totuşi. cele mai bune chip-uri DDR. majoritatea oferind cel puţin 240 MHz cu CL2 22-x (spre deosebire de TCCD-uri. Winbond UTT au fost memorii excepţionale în trecut.7V. Dezavantaj: preţ ridicat. şi nu fabricantul real al integratelor.

rulând fără probleme la CL2 2-2-x în DDR400. 4. de asemenea. Pe acestea le-am identificat ca Infineon CE-5. De asemenea. urmată de apariţia erorilor.5 4-4-x. TCCC-urile ating 250 .250 MHz.290 MHz cu CL3 4-3-x şi CL2. Printre ele se numără Hynix D43 şi D5. atingând 210 . Deşi nu suntem siguri că Samsung TCC4 au stat la baza unui kit din test. respectiv CL2. cele testate (ce nu fac parte din vreun kit. iar la 200 MHz nu suportă decât CL2. Micron 5B C nu se bucură de aceleaşi avantaje: ating în jur de 240 . Surprinzător 81 . între CL2. PQI. ele răspund la voltaj.225 MHz la latenţe CL3 3-3-x. dar au avut o afinitate specială pentru CL3. pe modulele provenite de la Crucial. comportamentul este asemănător cu informaţiile găsite pe Internet. dacă TCC5 sunt versiuni puţin slabe de TCCD. atingând aproximativ 240 245 MHz şi refuzând categoric CL3.5 2-2-x. ceva mai reduse decât la TCCD). Afară de acestea. Bănuiala noastră se îndreaptă către Infineon B5. atingând frecvenţe apropiate de Micron 5B G: 270 .250 MHz cu CL3 3-3-x. avem şi avantajul unor latenţe decente.260 MHz cu CL3 4-4-x.1. rulând cu CL2 3-3-x în DDR400. Samsung TCC5 şi TCCC oferă performanţe total diferite. ProMos 5B se comportă foarte bine. iar în DDR400 nu depăşesc CL2. practic. fiind vândute separat) sunt dotate cu Samsung TCCD. Sycron etc. Aceste chip-uri sunt întâlnite. Aceste chip-uri se găsesc pe memorii ieftine. Micron 5B G oferă performanţe de invidiat. A-Data Vitesta DDR500 Deşi majoritatea modulelor ce poartă acest nume deţin chip-uri Hynix. Ele răspund la tensiuni de circa 3V. există diverse chip-uri ale căror comportament nu l-am putut testa. chiar şi puţin peste 3V. De asemenea. până în zona lui DDR600. Princeton. în caz contrar riscând supraîncălzirea.8V decât ocazional.280 MHz cu latenţe destul de relaxate.5 3-3-x.85V. pe Abit simţindu-se în largul lor.Cap 4: Evaluarea memoriilor Preţul relativ redus este încă un atu al acestor chip-uri. ele nu au nevoie de setarea 4 pentru tRCD şi tRP. Ele se pot lăuda cu un comportament foarte slab. Kingmax. ele au avut probleme de compatibilitate cu placa de bază de la DFI.5 3-3-x pentru frecvenţe de 200 . o divizie a companiei Micron Technology. Ele au avut chip-urile marcate în diverse moduri: G. două alte module au avut un comportament similar. dar rareori ating 250 MHz. la preţuri convenabile. dar în DDR400 au un comportament bun: CL2. ambele cu un comportament satisfăcător: 260 . în general. dar nici exagerat.290 MHz cu timing-uri CL3 4-4-x.5 2-2-x şi CL3 3-2-x în DDR500 şi în CL3 3-3-x mai sus. Numeroase memorii testate au manifestat un comportament similar. ce suportă de obicei CL2 3-3-x sau 3-2-x.4. Samsung UCCC pot fi întâlnite doar pe module de 1 GB şi rulează la 260 .Skill. iar în DDR400 au rulat la CL2 3-2-x. Preţul nu este tocmai redus. dar au nevoie de răcire activă chiar şi la 2. Pe lângă frecvenţele ridicate atinse (totuşi.5 3-3-x. însă se simte afinitatea lor pentru CL3. Diverse tipuri de chip-uri Infineon pot fi întâlnite îndeosebi pe memoriile DDR400 ieftine. Nu obişnuiesc să răspundă la un voltaj de peste 2.

Evaluarea performanţelor sistemelor de calcul

este preţul foarte redus pentru performanţele oferite, performanţe similare celorlalte memorii ce au în dotare aceleaşi chip-uri. Modulele sunt acoperite cu radiatoare roşii de aluminiu, iar PCB-ul este de asemenea roşu, fiind produs de BrainPower. Ele sunt certificate CL3 4-4-8 la 250 MHz şi CL2.5 4-4-7 la 200 MHz, cel puţin dacă privim SPD-ul. Se pare că latenţa CL3 este o reminiscenţă de la implementările cu Hynix, din moment ce chip-urile TCCD nu numai că rareori sunt avantajate de aceasta, dar de obicei obţin şi performanţe mai slabe în compania ei. Ce-i drept, nu la 250 MHz, unde nu există probleme. Testele au arătat un comportament meritoriu. Am remarcat CL2 2-2-5 în DDR400 (peste jumătate dintre TCCD-uri reuşesc această setare), CL2 3-3-7 în DDR500 (CL2 este chiar dificil de obţinut), iar în frecvenţă au urcat până la 312 MHz, o valoare mai degrabă mediocră printre memoriile TCCD. Concluzie Performanţele foarte bune, în prima jumătate a modulelor dotate cu chip-uri TCCD, alături de preţul extraordinar de mic constituie avantaje indiscutabile ale acestui produs. Totuşi, dacă nu aveţi posibilitatea să verificaţi chip-urile din dotare (lucru posibil doar prin testarea efectivă), s-ar putea ca memoriile de faţă să nu vă mulţumească decât parţial. + performanţe excelente + preţ foarte convenabil + radiatoare din aluminiu - nu toate exemplarele se vor comporta la fel de bine - latenţe prea relaxate înscrise în SPD 4.4.2. Corsair TWINX1024-3200C2PT rev 4.2 Revizia 4.2 a modelului 3200C2PT de la Corsair vine cu chip-uri TCCD, aşezate pe un PCB BrainPower. Iarăşi avem de-a face cu o memorie foarte ieftină, care îşi face toţi banii, cu toate că este certificată doar DDR400 CL2 (SPD-ul indică doar CL3 3-3-8). Comportamentul nu a fost impresionant pentru un kit cu TCCD-uri, ci impresionant în sine, dacă ne raportăm la preţ. Nu au fost probleme în DDR400 pentru CL2 2-2-5, dar DDR550 şi DDR600 au fost obţinute cu ceva efort, şi doar la latenţe CL2.5 44-8 şi respectiv CL3 4-4-8 din cauza tensiunii de alimentare mici pe care memoriile au suportat-o. Practic, pentru CL2.5 în DDR600 avem nevoie de un minim de voltaj crescut, însă C2PT-urile s-au plafonat la 2.7V, orice încercare de a creşte tensiunea peste această valoare soldându-se cu numeroase erori. Setarea CL3, chiar dacă nu este pe placul chip-urilor din dotare, dacă totuşi poate fi „prinsă”, se mulţumeşte cu o tensiune mai mică. Deşi nu putem garanta acest lucru, problema ar putea fi datorată plăcii de bază, care face „mofturi” cu anumite memorii la voltaje mari. Frecvenţa maximă a fost de 314 MHz - nici bună, nici rea, dar foarte ridicată dacă ne uităm la zona de preţ din care face parte kit-ul. Concluzie Per total, un produs foarte bun şi ieftin, cu mici probleme pentru un entuziast extrem, dar suficient de bună pentru a fi luată în calcul de către toate celelalte categorii
82

Cap 4: Evaluarea memoriilor

de utilizatori. Din păcate, această versiune se află spre sfârşitul vieţii, reviziile 5.x, ce sunt mai uşor de găsit, fiind considerabil mai slabe. + performanţe foarte bune + preţ redus + radiatoare din aluminiu - probleme la tensiune peste 2.7V - nu rulează cu latenţe strânse la frecvenţe mari - latenţe prea relaxate înscrise în SPD 4.4.3. Corsair TWINX1024-3200C2PT rev 5.2 Noua revizie de 3200C2PT se poate lăuda cu un comportament total diferit faţă de cea anterioară. Chip-urile din dotare sunt ProMos, probabil din seria 5B. Din păcate, DFI LanParty a întâmpinat dificultăţi în combinaţie cu acestea, maximul atins fiind de doar 238 MHz, departe de potenţialul kit-ului. Cu Abit AN8 nu au fost probleme - 286 MHz cu CL3 4-3-8, adică mai mult decât satisfăcător. În schimb, setarea CL2 nu a fost acceptată de Abit în DDR400, cu toate că pe DFI am atins CL2 3-3-7. Latenţele la 250 MHz au fost CL2.5 3-3-7, iar la 275 MHz CL3 4-3-8, adică la mică distanţă de comportamentul TCCD-urilor; totuşi, nici nu s-a pus problema de DDR600. SPD-ul este... amuzant pentru o memorie al cărei nume indică foarte clar CL2: CL3 3-3-8 pentru DDR400, CL2.5 3-3-7 pentru DDR333 şi CL2 2-2-6 pentru DDR266. O particularitate a chip-urilor ProMos este legată de setarea tWTR (Write to Read Delay), care nu este acceptată la valoarea 1 decât la frecvenţe reduse (în jur de 200 MHz), deşi toate celelalte memorii nu au avut probleme de acest gen. Setarea afectează foarte puţin performanţa, deci nu este cazul să ne îngrijorăm. Cât despre tensiune, nu am obţinut nimic în plus la peste 2.75V. La 2.8V au apărut erori, semn că chip-urile ProMos nu sunt tocmai indicate supravoltării. Concluzie Preţul este corect, iar frecvenţele atinse potrivite pentru o memorie „de mijloc”. Sperăm din partea producătorilor de plăci de bază - şi în special din partea lui DFI - o rezolvare cât mai rapidă a problemelor de compatibilitate, ce pot şifona în mod incorect imaginea acestui produs. + frecvenţă maximă ridicată + radiatoare din aluminiu - probleme serioase de compatibilitate cu DFI LanParty - probleme minore de compatibilitate cu Abit AN8 4.4.4. Corsair TWINX1024-3200XLPT rev 1.2 Vârful de gamă al celor de la Corsair, seria 3200XLPT, a strălucit din toate punctele de vedere. Bazată pe clasicele chip-uri TCCD, modulele şi-au întrecut concurenţii în majoritatea testelor, atingând CL2 3-3-7 în DDR500, CL2.5 3-3-7 în DDR550 şi CL2.5 4-3-7 în DDR600. Acest comportament „flawless” a fost completat de frecvenţa maximă de 320 MHz (posibil mai mare, dacă placa de bază ar fi permis, am fi aflat), alături de un răspuns la voltaj de până la 3V! De asemenea, frecvenţa de 226 MHz atinsă cu timing-urile CL2 2-2-5 a fost mai ridicată decât concurentul direct, G.Skill Extreme Performance FF, motiv pentru care putem declara acest kit ca fiind cel mai bun produs bazat pe chip-uri TCCD. E drept,
83

Evaluarea performanţelor sistemelor de calcul

orice memorie cu Winbond UTT va rula în CL2 2-2-5 la frecvenţe mai mari, dar de la nişte TCCD-uri nu se poate cere mai mult decât oferă 3200XLPT. SPD-ul este înscris corect, iar preţul mare, dar corespunzător calităţii produsului. Concluzii Cine este în căutarea celor mai bune memorii cu chip-uri TCCD (practic, a celor mai potente memorii în materie de frecvenţă), s-ar putea să fi găsit alegerea ideală. + performanţe maxime pentru TCCD + răspuns în voltaj până la 3V + radiatoare din aluminiu - preţ ridicat, deşi perfect justificat 4.4.5. Corsair TWINX1024-3200C2PRO rev 4.1 Interesante ca aspect, excelente din punct de vedere al performanţei, kit-ul 3200C2PRO se deosebeşte de celelalte prin prezenţa LED-urilor ce indică activitatea. Practic, atunci când memoriile sunt folosite intens, aceste lumini „umplu” memoria, creând un efect vizual deosebit. De asemenea, design-ul modulelor este ieşit din comun, ele fiind ceva mai înalte decât memoriile obişnuite, şi aici ar putea mici probleme la montarea pe anumite plăci de bază, în cazul în care cooler-ele se bazează pe o înălţime standard a modulelor de memorie. Pe lângă aceste considerente, performanţele au fost foarte bune, kit-ul având la bază aceleaşi chip-uri TCCD. SPD-ul indică un „obositor” CL3 3-3-8, însă nu au fost probleme pentru rularea cu CL2 2-2-5 în DDR400. În rest, nu au am observat diferenţe faţă de alte memorii de acelaşi tip, poate cu excepţia frecvenţei de 318 MHz, foarte apropiată de maximul posibil. Mici probleme de sensibilitate la tensiune au apărut, dar ele nu au fost nici pe departe atât de grave ca în alte cazuri. Concluzie Kit-ul 3200C2PRO primeşte nota 10 la capitolul design, în rest rezultatele fiind excelente pentru orice utilizator. Dacă studiem şi preţul, observăm că el nu este foarte ridicat. + performanţe foarte ridicate + LED-uri de activitate, design atrăgător + radiatoare din aluminiu - latenţe prea relaxate înscrise în SPD 4.4.6. Corsair TWINX1024-4400C25PT rev 1.1 Încă un Corsair cu TCCD, nimic spectaculos - s-ar zice. Deşi aşa este, în mare parte, observăm faptul că aceste module sunt certificate pentru a rula în DDR550 CL2.5 4-4-8. Aşadar, cei neinteresaţi de aspecte precum chip-uri din dotare sau revizii, vor putea achiziţiona fără grijă 4400C25PT pentru a le tacta garantat la 275 MHz. Latenţele specificate sunt mai relaxate decât cele atinse de noi, la frecvenţa nominală obţinând CL2.5 3-3-7. Probleme cu voltajul mare au existat, dar ele s-au manifestat doar la frecvenţe ridicate. Maximul atins a fost de 316 MHz, o valoare bună.
84

standardul care domină în prezent piaţa Intel.Skill Extreme Performance F1-4800DSU2-1GBFF. fiind indicată doar frecvenţa de 200 MHz pentru latenţele CL2. motiv pentru care am premiat modelul de la G. Odată cu apariţia Socket AM2. precum şi G.1 şi Crucial Ballistix Tracer PC4000 posedă LEDuri pentru indicarea activităţii.5 4-4-8.2 şi G. şi care ar putea depinde de la exemplar la exemplar). noi am atins CL2 2-2-5. Două dintre ele . + performanţe foarte ridicate + radiatoare din aluminiu . Concluzie Deşi sunt module de mare performanţă. În gama ieftină am avut numeroase produse ce purtau diverse brand-uri. apropiindu-se de maximul pe care l-am putut obţine în materie de frecvenţă. impunerea totală a lui DDR2 urmând să survină după mai mulţi ani.5 4-4-8. ceea ce este normal . compatibilitatea chipurilor ProMos cu platforma DFI a lăsat de dorit. Concluzii Am parcurs împreună treizeci de perechi de memorii ce poartă marca unora dintre cele mai cunoscute companii ale domeniului.funcţiile suplimentare nu sunt implementate decât pe modelele high-end. iar Corsair Xpert TWINXP1024-3200XL rev 1. Aşadar. În schimb. 85 .mici probleme la creşterea tensiunii . motiv pentru care dintre cele două produse recomandăm categoric kit-ul 3200XLPT. s-au remarcat modulele cu chip-uri Samsung TCCD şi îndeosebi Corsair TWINX1024-3200XLPT rev 1. toate trei s-au comportat bine.2 deţine suplimentar un senzor pentru monitorizarea temperaturii şi alte câteva funcţii interesante. dar e puţin probabil să existe cândva module XLPT care să nu suporte 250 MHz cu CL2. Totuşi.5.Cap 4: Evaluarea memoriilor SPD-ul nu a concordat cu rezultatele obţinute.Skill Normal Series F1-3200PHU2-1GBNT cu Infineon.Skill.este mai ridicat decât cel al altor produse similare. mai slab dar mai compatibil. Din păcate. locul lor urmând să fie luat de DDR2 . puţin mai ridicat decât cel al kit-ului 3200XLPT. preţul . ce-i drept. care au obţinut performanţe maxime. Ce putem reproşa acestui kit este preţul.valori relaxate înscrise în SPD 4. până atunci mai e vreme lungă. Trei produse au oferit funcţii suplimentare de afişare. În plus.deşi nu exagerat .Corsair TWINX1024-3200C2PRO rev 4. nu încercaţi să realizaţi un upgrade forţat doar de dragul de a folosi o tehnologie de viitor! Vă asigurăm că platforma DDR merită încă toată atenţia. Dintre ele s-au remarcat Corsair VS1GBKIT400 cu chip-uri ProMos. memoriile DDR vor fi date uitării. ceea ce ni s-a părut nejustificat. însă nu putem şti ce se ascunde în spatele radiatoarelor: Samsung TCCD sau Hynix. Dintre toate. XLPT-urile oferă alte câteva avantaje (minore. posibil mai bune. ce oferă performanţe apropiate la un preţ extrem de mic. Remarcabilă a fost şi prestaţia modulelor A-Data Vitesta DDR500.

cu detaliile la (sau spre) maxim.13 microni. Şi tipul ei diferă: GDDR în prima situaţie. însă 6600 GT deţine 500 MHz. în jocurile obişnuite. de obicei. existând astfel posibilitatea atingerii de frecvenţe mai mari. afirmaţia este falsă: preţul plătit pe această componentă nu trebuie să fie cât cel al unui întreg sistem pentru a se obţine performanţa dorită. ochiul uman se poate adapta foarte uşor la o calitate cu puţin mai scăzută. fie ea mai mare sau mai mică şi. Evaluarea plăcilor grafice 5. În plus. se găsesc plăci cu răcire cu apă la preţuri de ordinul a 1000 de euro. Să vedem ce înseamnă GeForce 6600 GT. Campionii shooter-elor se folosesc de rezoluţii mici (uneori 640x480) şi de un nivel minim de detalii.1. insesizabilă. Versiunea GeForce 6600 „simplu” nu oferă decât 300 MHz pentru core. Tactul memoriei este de 550 MHz la 6600 şi de 1000 MHz (sau 900 la versiunea pe AGP) în cazul lui 6600 GT. Dacă banii nu reprezintă deloc o problemă. celălalt de vertex) şi lărgimea bus-ului memoriei. Din punct de vedere al performanţei. de trei factori: frecvenţele (două . mai mult decât orice model de 6800. am studiat piaţa românească şi am ajuns la concluzia că plăcile grafice care satisfac cel mai mult nevoile unui jucător normal (nu ocazional sau profesionist. Desigur. Seria GeForce 6 de la NVIDIA se compune din trei familii: GeForce 6800. 86 1 .una pentru chip şi una pentru memorie). Bus-ul memoriei este de 128 de biţi. dar fără nivele exagerate de anizotropie1 şi anti-aliasing. cu potenţial mare de overclocking şi. el este de 64 sau chiar 32 de biţi (dar. în timp ce. Cauza stă în procesul de fabricaţie: 0. valoarea fiind apropiată de cea a suratelor pe 256 de biţi (GeForce 6800). Nimic mai mult. 6600 şi 6200. vor opta pentru rezoluţii între 1024x768 şi 1280x1024. trecerea este. la jumătate faţă de 6800. 12 sau 16 la seria 6800. GeForce 6600 GT deţine opt pipelineuri de pixel (faţă de 8. Astfel. pe de altă parte. cu circa 50% mai rapide decât o placă ce costă de cinci ori mai puţin.unul de pixel. dar nici „maniac” al imaginilor de cristal) sunt cele bazate pe chip-ul GeForce 6600 GT.5. Cum plăcile de bază cu suport pentru bus-ul PCI Express sunt din ce în ce mai populare. Cel mai interesant aspect este legat de frecvenţe. Iar acei 50% se traduc prin posibilitatea de a (nu) juca în rezoluţii mai mari şi/sau cu nivelul de detalii foarte ridicate. 5 sau 6 la 6800 şi tot atâtea cât are 6200). motivul fiind obţinerea numărului maxim de fps. Ei pur şi simplu joacă. Introducere Se spune că pentru a juca ultimele apariţii în domeniu e nevoie de o placă grafică de ultimă oră. GDDR3 în cea de-a doua (practic. performanţa sa fiind similară cu cea a unui Proprietate a unei substanţe de a prezenta caracteristici fizice variate în funcţie de direcţia de măsurare şi de observare (definiţie DEX). 6200 înzestrat cu tehnologia TurboCache care poate folosi memoria sistemului ca memorie video). diferenţele depind. dar 4 la 6200) şi trei de vertex (4. GDDR3 este un DDR2 optimizat pentru operaţii grafice. achiziţionarea unei plăci grafice pe AGP nu este recomandată decât celor care ştiu că vor rămâne la actuala platformă cel puţin un an de acum înainte. în principal. iar adevăraţii gameri nu se uită la detaliile graficii. la unele modele de GeForce 6200. În general. numărul de pipeline-uri (tot două . în consecinţă. majoritatea utilizatorilor au jocurile ca pasiune.11 faţă de 0.

şi două RAMDAC-uri integrate . Unii producători nu realizează sau nu vor să realizeze faptul că 256 MB de memorie la un 6600 GT este „frecţie la picior de lemn”.1.0 (Pixel şi Vertex Shader 3. Şi acesta din urmă este cel care acordă garanţia. dintre care un procent de 20÷25% este datorat exclusiv pipeline-urilor suplimentare. cu 175 MHz mai puţin la core şi cu 300 MHz mai puţin la memorie.0 (Full-Scene Anti-Aliasing şi Anisotropic Filtering cu performanţe superioare celor întâlnite la IntelliSample 2. obţinem justificarea pentru care GeForce 6800 costă cu circa 50% mai mult decât un 6600 GT: performanţe cu 20÷50% mai mari. Sporul de viteză este foarte redus. în funcţie de rezoluţie şi setări. printre care se numără ceea ce NVIDIA numeşte CineFX 3. şi un dezavantaj.0. 87 . Toate plăcile din test au dispus de două ieşiri. rare fiind cazurile în care performanţa creşte cu mai mult de 5% şi foarte multe cele în care ea nu creşte deloc. Privind facilităţile. era livrat şi un adaptor pentru ca placa să poată fi folosită în combinaţie cu monitoarele clasice. dar şi preţul a crescut în consecinţă. obţinem o lăţime de bandă echivalentă cu cea a unei frecvenţe de 1400 MHz pe 128 de biţi (256-bit @ 700 MHz <=> 128-bit @ 1400 MHz). două ieşiri digitale. Aceasta nu înseamnă că ele sunt „bătute în cuie”. Un ultim aspect discutat aici este legat de dimensiunea memoriei. Cei 128 MB suplimentari nu ar fi o problemă dacă preţul nu ar fi urcat de acest aspect. 5. enumerăm şi alte funcţii prezente: accelerare hardware MPEG-2 (DVD. Aşadar. NVIDIA nu garantează funcţionarea în acei parametri. Desigur. cu alte cuvinte. dintre care cel puţin una de tip DVI (destinată anumitor modele de monitoare LCD). în cazurile în care ieşirea normală (D-Sub) era absentă.Cap 5: Evaluarea plăcilor grafice GDDR tactat la aceeaşi frecvenţă . diverşi producători vânzând plăci cu frecvenţele mărite.2. ce înzestra seria GeForce FX). Frecvenţe NVIDIA specifică pentru chip-ul GeForce 6600 GT frecvenţe de 500 MHz pentru nucleu şi de 1 GHz pentru memorie. Deşi relativ neinteresante. Să luăm ca exemplu GeForce 6800 „simplu”. De asemenea. dintre care una de tip digital (DVI). Frecvenţe şi latenţe 5. avem şi un avantaj.ce rulează la 400 MHz şi oferă posibilitatea prezenţei a două ieşiri video. HDTV) şi Windows Media 9. Altfel spus. faţă de 2. nu şi din punct de vedere al plăcii.0. observăm câteva avantaje de partea lui 6600 GT în comparaţie cu seria 6800. pentru 5% de performanţă în 1% din cazuri se pot plăti în plus câteva zeci de dolari.0 la generaţia a cincea a lui GeForce) şi IntelliSample 3. Dar dacă adăugăm încă patru pipeline-uri de pixel. intrările Video-In şi Composite-In au fost prezente la anumite produse. rezoluţia maximă este de 2048x1536 la 85 Hz. în timp ce chip-ul rulează la 325 MHz. prin intermediul unui chip extern (produs de Philips). Se cheamă overclocking din punct de vedere al chip-ului. Dacă ţinem cont de faptul că lărgimea bus-ului memoriei este dublă la 6800.2. ele fiind declarate VIVO. Trăgând linie.însă GDDR-ul nu are nici o şansă de a atinge 1 GHz). Aşadar. fabricantul însă da. Plăcile ce îl încorporează beneficiază de memorie tactată la 700 MHz. familia GeForce 6 oferă aceleaşi funcţii de bază. cel mai lent din serie (excluzând „neserioasa” variantă LE). Unele plăci au oferit.

Dacă etapa X nu este îndeplinită în timpul predefinit (măsurabil în cicluri de tact). Uneori. Pentru început. Frecvenţele pot fi ajustate în continuare de către utilizator prin intermediul aplicaţiilor specializate sau chiar din drivere. După experimente repetate sa ajuns la concluzia că testul din jocul FarCry este extrem de solicitant pentru GPU. în semnificaţia căreia joacă un rol nul sau negativ. nici celelalte teste nu o vor face. 5. 88 3 2 . Mai exact. Dacă ATITool nu generează artefacte. Frecvenţa maximă a memoriei video obţinută cu ATITool a fost întotdeauna cea corectă. La fel funcţionează şi memoria. s-a efectuat o filtrare preliminară cu ajutorul lui ATITool. ce are privirea aţintită asupra monitorului pe toată durata testului. Dacă omul din Ploieşti ajunge în Braşov la ora 8:01. (Cib. problema se va manifesta prin apariţia artefactelor.Evaluarea performanţelor sistemelor de calcul Deseori. ele reprezintă modele selecţionate. indiferent dacă etapa anterioară a fost sau nu completată. operaţiune descrisă în seminar.2. În cazul memoriei sistemului. atunci scrisoarea va fi pierdută şi întreg lanţul se va distruge.php?page=rivatuner http://www. Temperatura ambiantă din timpul testelor a fost de aproximativ 25-28 de grade Celsius. după ce placa a fost încălzită în prealabil) şi nici jocurile/benchmark-urile rulate nu au generat artefacte4 vizibile. Pe lângă frecvenţe. iar indicaţiile spun că omul din Braşov trebuie să plece mai departe la 8 fix. Prin aceasta înţelegem artefacte care pot fi detectate de o persoană experimentată. o diferenţă importantă faţă de ştafeta clasică: indiferent când soseşte omul cu scrisoarea. cel mai probabil. un singur bit omis va compromite. întocmai ca o ştafetă. sau sunt şanse foarte mici să o facă. creşterea frecvenţelor este însoţită de creşterea preţului şi de ataşarea unui sufix denumirii produsului. 2. Cum ciclurile de tact http://www. apa din depărtare (unde Pixel Shader-ul „lucrează din plin”) prezintă unele dreptunghiuri în plus. Există anumiţi timpi de aşteptare între diversele operaţii pe care memoria va trebui să-i respecte. fiind prima aplicaţie care generează anomalii vizuale.com/index.com/downloads/Tweaking/ATITool 4 artefacte = Imagine falsă apărută în preparatele histologice produsă artificial sau datorită unor defecte de fixare ori de colorare. Vă putem asigura că testele de overclocking au fost realizate în condiţiile precizate mai sus. Există. cel care preia ştafeta va trebui să plece la ora indicată.2. stabilitatea sistemului. Informaţia nu este citită/scrisă pur şi simplu. chiar şi atunci când toate celelalte teste rulează fără probleme. În cazul memoriei plăcii grafice.techpowerup. iar Leadtek Extreme Edition. Gainward şi-a denumit versiunea overclock-ată GLH (Goes Like Hell). informaţia pe care etapa Y trebuie să o preia va fi distrusă. Invers.Cluj-Napoca . Să vedem ce înseamnă acestea.Ploieşti . apărând ecrane albastre sau resetări. Sa preferat utilitarul RivaTuner2 şi am considerat ca frecvenţe maxime valorile la care nici ATITool3 (pe durata unui minut şi jumătate. dar ştafeta este predată.Oradea se află câte o persoană care va porni către oraşul următor la ore prestabilite pentru a-i înmâna celeilalte o scrisoare. dacă omul din Ploieşti ajunge la Braşov la ora 7:59. însă. testarea nefiind exhaustivă dar nici superficială. ca şi cum un om ar citi o carte sau ar scrie un text pe o foaie de hârtie. minutul diferenţă este un „timp mort”.) Semnal parazit supus unei informaţii. un factor care influenţează în mai mică măsură viteza este reprezentat de latenţe. alteori doar plăci comune cu tactul crescut. Să presupunem că pe tot traseul Bucureşti . Latenţe Memoria DRAM are nişte principii de funcţionare bine definite.Braşov .guru3d. Astfel.

Cap 5: Evaluarea plăcilor grafice sunt mai lungi la frecvenţe mai mici (frecvenţa însăşi reprezintă numărul de cicluri de tact ce au loc într-o secundă. Pentru toate plăcile testate (şi dotate cu memorii GDDR Samsung de 1. În cazul ideal. programele de acest tip sunt realizate empiric de către amatori. nTimings poate seta latenţele în timp real şi astfel putem evalua stabilitatea imediat. mai exact lipsa artefactelor. folosind funcţia de detecţie a artefactelor din ATITool. 202 poate fi transformat sigur în 000 (deşi latenţele sunt complet nedocumentate şi nu par să afecteze viteza în vreun fel). Reglarea latenţelor unei plăci grafice nu este o operaţie atât de facilă ca în cazul setării memoriei sistemului. fiecare conţinând opt numere. 0F poate fi adus fără probleme la 00.6 sau 2 ns). şi deci de o imagine clară. precum editorul de BIOS NiBiTor şi utilitarul de setare a latenţelor nTimings. Dacă aţi obţinut o configuraţie a latenţelor. 3 şi respectiv 6 (cu menţiunea că acel 7 transformat în 6 afectează mult performanţa. este bine să rulăm câteva jocuri sau teste 3D (precum 3DMark). împreună cu utilitarul 89 . În lipsa unei documentaţii oficiale în acest sens. deci 1 GHz înseamnă un miliard de cicluri pe secundă). latenţele implicite au fost 060F1B15 . Va trebui să creaţi o dischetă de boot. indiferent de viteza lor internă.09010509 . Dacă utilitarul RivaTuner este instalat în directorul C:Program Files&$92. nu aveţi de ce să vă temeţi). 4 şi 7 ar putea fi aduse la 4.20250407. fără probleme. Aici nu există un BIOS Setup. Din grupul al doilea. este foarte probabil ca latenţele să fie altele şi placa să se comporte diferit la scăderea lor. iar 5. iar prima apariţie a lui 9 poate fi scăzută (cu mari riscuri de artefacte) la 8. Rezultatul final? Performanţa va creşte cu câteva procente preţioase. în care se intră cu tasta Del şi se setează tot ce se poate seta. la fel cum frecvenţele pot fi crescute (prin overclocking) la maximul posibil. ar putea fi reduse la 13 cu 10. După ce am stabilit aceste latenţe. Totuşi. Astfel. Din ultima categorie. Încercaţi să editaţi cifrele direct pentru că programul este foarte primitiv şi deţine un bug la acţionarea butoanelor. 1B şi 15. Practic. Pentru a nu intra în detalii. Operaţia este lipsită de riscuri (durează 10-15 secunde şi. numărul 1 poate fi redus la 0. încercaţi mai întâi să reduceţi latenţa 6 din primul grup la 5 sau chiar 4 (contează mult la performanţă). Avem trei rubrici. latenţele pot fi reduse la minimul acceptabil. iar ultimele două. prin acţionarea butonului Show GPU registers vom vizualiza latenţele curente. toate memoriile vor avea aceeaşi performanţă. eventual chiar mai puţin (toate cele trei setări afectează extrem de puţin performanţa). Latenţele ideale le puteţi descoperi singuri. prin setarea aceloraşi latenţe. dar setarea sa este dificilă). afară de cazul în care curentul se întrerupe în acel moment. pentru a verifica suplimentar stabilitatea memoriei.RivaTuner (şi nu altundeva!). Însă prin intervenţia utilizatorului. producătorii lasă o marjă de eroare. este foarte probabil să ne putem face treaba cu ele. introducând aceşti timpi suplimentari tocmai pentru că plăcile diferă de la exemplar la exemplar şi este posibil ca o memorie să fie mai „sprintenă” decât alta din cauze de natură electrică. este necesară rescrierea BIOS-ului plăcii grafice pentru ca setările să devină permanente. Pentru alte plăci decât cele cu memorii de acest tip. având numeroase necunoscute. Optimizarea latenţelor memoriei înseamnă reducerea la minim a acelor „timpi morţi”. exact în momentul în care operaţia X este completată. este evident faptul că latenţe mai mari înseamnă şanse mai mari de preluare corectă a ştafetei. Aici avem doar mijloace rudimentare. operaţia Y îşi începe activitatea.

1. Apoi inseraţi în sistem ambele plăci (cea PCI Express şi cea PCI) şi boot-aţi de pe discheta cu utilitarul de scriere a BIOS-ului. ele devin permanente şi independente de software. ForceWare 71. În tab-ul Timings.. Dacă veţi considera că după overclocking placa este prea fierbinte.84. utilitarul fiind creat prin metode empirice. umblaţi doar la frecvenţe. una dintre plăcile testate a avut înscrise frecvenţele de 65536 şi 255 MHz.rom) înapoi pe dischetă şi boot-aţi de pe ea. consideraţi această secţiune a cursului pur informativă. salvaţi fişierul (să zicem bios_nou. programul nvflash va detecta faptul că în sistem se află şi o placă PCI Express (cu BIOS defect) şi îi va rescrie corect BIOS-ul. Boot-aţi apoi în Windows şi deschideţi fişierul cu NiBiTor. la frecvenţe mai mari se pot seta latenţe mai puţin mici.ro/downloads/nvflas..rom. Reglaţi-le după cum doriţi.rom. una pentru modul 2D şi alta pentru cel 3D. nu veţi avea probleme. Nu încercaţi să modificaţi aceste valori pentru că riscaţi să „defectaţi” BIOS-ul. XF nu poate fi făcut răspunzător pentru defectarea sau pierderea garanţiei unei componentei hardware cauzată de urmarea sfaturilor incluse în acest curs. Ele pot fi setate şi din drivere sau din RivaTuner (cu aplicare directă la pornirea sistemului de operare). valorile care interesează sunt ultimele. software folosit: Windows XP SP2. Tot cu NiBiTor se poate regla frecvenţele de funcţionare. în cazul nostru fiind găsite la categoria Timingset 7. pentru că reducerea latenţelor nu afectează în nici un fel temperatura plăcii. Rescrierea unui BIOS scris greşit se face simplu dacă aveţi o placă grafică PCI la îndemână: setaţi în BIOS-ul plăcii de bază ca pornirea să se facă utilizând placa PCI (opţiunea va fi Init Display First sau ceva asemănător).xf. o placă de bază Abit AN8 (nForce4). Dacă aţi lucrat corect şi „curat”. Dacă nu aveţi cunoştinţele necesare efectuării acestor modificări sensibile. Sistemul de test a fost constituit dintr-un procesor Athlon 64 3200+ Winchester. însă dacă le scrieţi în BIOS. urmând a executa de pe dischetă comanda nvflash --save bios. memoriile Corsair TwinX1024-4400C25PT fiind setate în CL2 2-2-5 1T. 5 http://www. Nu uitaţi. Cauza este aceeaşi lipsă de documentaţie. Astfel.el este vital pentru revenirea la situaţia iniţială în caz de nevoie. Copiaţi fişierul pe hard disk sau chiar pe un CD (o dischetă se poate defecta foarte uşor) .Evaluarea performanţelor sistemelor de calcul nvflash5 (NVIDIA Firmware Update Utility). Cum orice placă din generaţia GeForce FX sau GeForce 6 deţine două frecvenţe de funcţionare. veţi căuta latenţele originale (060F. Înainte de a vinde sau a returna placa la magazin (în cazul defectării). Acum puteţi urma metoda clasică. Observaţie: anumite plăci deţin BIOS-uri incompatibile cu NiBiTor .rom. cât şi după ce s-a crescut frecvenţele la maxim şi respectiv s-a scăzut latenţele la minim.rar 90 . deci alegeţi opţiunea corectă. creându-se astfel un fişier care va conţine BIOS-ul original al plăcii. urmând să rescrieţi BIOS-ul dând comanda nvflash bios_nou. este bine să-i rescrieţi BIOS-ul cu cel original. încercaţi comanda nvflash -4 -5 -6 bios_nou. Dacă programul refuză scrierea.cel puţin cu versiunea 2. Cu toate acestea. Toate plăcile au fost testate atât în condiţii normale (frecvenţe şi latenţe implicite).). aşadar mai întâi stabiliţi frecvenţa maximă de overclocking şi abia apoi treceţi la capitolul latenţe.

În general sunt utilizate ca suport de stocare extern principal pentru calculatoare personale. astăzi. Platanele sunt astfel aranjate încât pista 0 de la platanul 1 91 .2: Secţiune transversală prin suprafaţa magnetică în lucru. Fig. Dacă la începuturi capacitatea unui hard disc nu depăşea 20 MO. În acest caz datele binare sunt codate folosind modulaţia în frecvenţă. Introducere Hard discul sau discul dur este un dispozitiv non-volatil pentru stocarea datelor. 5.2. dar şi pentru anumite aparate electronice (DVD Playere. • capete magnetice de o parte şi de alta a platanelor legate printr-un braţ metalic. fiecare pistă fiind divizată în sectoare. • un sistem electro-mecanic de blocare a capetelor pe pista de stop (landing-zone). • un motor electric pas-cu-pas. un hard disc obişnuit poate depăşi 500 GO.1.6.1: Hard Disc Seagate Barracuda ATA Fig. MP3 playere). • un număr de platane (de obicei 2 sau 3). 5. împărţite în piste. 6. Evaluarea hard discurilor 6. cilindrii şi sectoare. Structură şi funcţionare Un hard disc este format din: • o placă de control logic. Stocarea se face pe o suprafaţă magnetică dispusă sub forma unor platane. Fiecare platan (disc) are doua feţe şi este divizat într-un număr de piste.

în concluzie sunt extrem de lente. braţul care susţine capetele va muta capetele spre acea pistă. Pentru că separatorul de date şi controlerul lucrează în paralel. Deci. Pentru a muta un braţ ca acesta trebuie un timp semnificativ comparativ cu timpul de transfer.Evaluarea performanţelor sistemelor de calcul să fie exact deasupra pistei 0 de la platanul 2. întregul braţ cu capete trebuie mutat de doua ori. Procesorul nu participă la acest transfer. Controlerele DMA operează la 4 MHz. Totuşi. controlerul hard-discului deconectează procesorul de la bus şi transferă datele în memorie singur.Cu aceasta metodă. Segmentul localizat deasupra memoriei video RAM este folosit în general cu acest scop. Pentru a folosi DMA. atunci este optim să fie scrise pe aceeaşi pistă.2. Este mai rapidă decât metoda precedentă. Aceasta înseamnă că fiecare octet este transferat prin intermediul procesorului. Hard discurile ESDI stochează informaţii despre formatul fizic şi adresele sectoarelor defecte şi poate transmite aceste informaţii 92 . Pentru a accesa o pistă oarecare pe unul din platane. trebuie prevenit ca datele sa fie împrăştiate pe mai multe piste. un dispozitiv poate transfera datele direct în memorie. braţul nu mai trebuie să execute mişcări. un program trebuie să îi precizeze controlerului DMA mărimea în bytes a pachetului de date ce urmează a fi transferat dintr-o locaţie într-alta. Datele sunt transferate cu ajutorul instrucţiunii de transfer (mov în cazul arhitecturii x86). controlerul DMA într-un PC este inflexibil şi lent. Deoarece această metodă necesită doar un singur mecanism de poziţionare.2. Pentru a minimiza acest lucru. 6. pentru aceasta trebuiesc mutate toate capetele pentru a accesa o singură pistă. 20 megabiţi la cele recente. O metodă de a optimiza timpul de acces este ca un grup de date care sunt accesate secvenţial să fie scrise pe o singură pistă. Aici. Prin această metodă. Se folosesc comenzile IN şi OUT ale limbajului de asamblare. • DMA .2. şi a fost unul din primele controlere de hard discuri pe calculatoare x86. Se mai foloseşte termenul de cilindru pentru a descrie multiplele platane suprapuse. Acest tip de controler a fost folosit în modelele IBM PS/2. Interfeţe şi controlere ESDI Controlerul ESDI a fost dezvoltat după controlerul ST506. • Busmaster DMA .1. rata de transfer este aproximativ 10 megabiţi/secundă la modelele iniţiale. respectiv 15.hard disc.Folosind DMA (Direct Memeory Access). Dacă datele nu încap pe aceeasi pistă. simplifică design-ul şi coboară preţul. Selectarea capetelor este mult mai rapidă decât mişcarea fizică a braţului care susţine capetele pentru a schimba pistele. porturile controlerului au grijă atât de comenzile drive-ului cât şi de transferul de date între controler şi memorie. Sunt folosite patru metode: • Programmed I/O . viteza datelor va fi limitată la cea a bus-ului PC şi la performanţa procesorului.Folosind această metodă. Transferul datelor la memorie Modalitatea în care datele sunt transferate în memorie determină viteza efectivă a combinaţiei controler . 6. Totuşi. apoi pista 50 pe platanul 3 si apoi iar pe pista 1 de pe primul platan. dar care sunt localizate pe diferite platane. pentru a citi date de pe pista 1 de pe platanul 1. dar pe un platan diferit. Doar capul de citire şi scriere cel mai apropiat trebuie să fie selectat pentru a efectua operaţia de citire. Un cilindru se referă la toate pistele care au acelaşi număr de pistă.Procesorul poate procesa datele provenite dintr-un controler de disc mult mai repede dacă sunt stocate într-o regiune fixă de memorie. • Memory Mapped I/O .

pentru playere MP3 (precum Apple iPod). măsurată în ţoli (inch). pentru identificare şi corectare de erori.Cap 6: Evaluarea hard discurilor controlerului. care pe lângă mărimea redusă. Alte discuri permit până la 1. Dimensiunea fizică. unele distribuţii de Linux. 93 .3. astăzi capacităţile hard discurilor pot depăşi 500 GO. pe când multe sisteme de operare (Windows. cel mai folosit în calculatoarele personale de astăzi foloseşte un singur cablu de 40 pini care combină funcţiile unui cablu de date şi al unuia de control care conectează discul IDE direct la magistrala (busul) de sistem.MTBF). Din cauza consumului redus de energie. SATA Controlerele SATA plaseaza fiecare disc pe propriul canal (cu un set propriu de porturi intrare/ieşire). Controlerul IDE permite legarea pe acelaşi cablu a două hard discuri sau a unui hard disc şi al unei unităţi optice în sistem master/slave. Astăzi hard discurile au fie 3. SCSI Controlerele SCSI (Small Computer System Interface) sunt folosite în special în sistemele care au nevoie de performanţă şi stabilitate ridicată (servere. 6.8". este una din soluţiile folosite pentru calculatoarele portabile.5" (pentru laptopuri . De obicei discurile acestea sunt ansambluri formate dintr-un disc IDE sau SCSI. Nu mai este utilizat decât pe scară redusă. Dacă primul hard disc avea 5 MO. USB/Firewire(IEEE 1394) Există şi discuri portabile care folosesc interfaţa USB sau Firewire pentru a transmite datele. sunt mai rezistente la şocuri.000 rpm şi un MTBF de 1 milion de ore sub un ciclu de utilizare de opt ore. Caracteristici • • • • • • • Capacitatea (măsurată în gigaocteţi) . Astfel se elimină problemele cauzate de arhitectura PATA. MacOS folosesc măsurătoarea în multiplii binari). Controlerele IDE au abilitatea de a emula orice format de disc. staţii de lucru performante). Durabilitate (exprimată în timp mediu între erori . utilizând mai puţin curent electric dar mai scumpe şi mai încete).0 au viteze de 10.4 milioane de ore sub un ciclu de 24 de ore.5" (pentru PC-uri). Număr de operaţii de intrare ieşire permise Consum de curent Nivel de zgomot Timpi de transfer şi timpi de acces. Discurile SATA 1. Această arhitectură a dus la incompatibilităţi între unităţi în anii '90. Există şi discuri de 1.mai mici. ATA/PATA (IDE/EIDE) Controlerul IDE (Integrated Drive Electronics). care însă au fost rezolvate. un controler pentru acestea şi un controler USB/Firewire.în general fabricanţii folosesc ca unitate de măsură multiplii din SI ai octetului (putere de 10). fie 2.

2. Totuşi. reducerea mişcării mecanice întrun drive poate fi realizată prin existenţa unei cozi de comenzi şi prin reordonarea acestora pentru a oferi datele cerute într-o manieră eficientă. Totuşi. Optimizarea timpilor de căutare Ordinea optimă de executare a comenzilor primite de hard disc pentru a reduce latenţele de căutare este ordinea care minimizează mişcarea mecanică. nu numai că este posibilă reordonarea comenzilor dintr-un anumit punct de start. Cât timp drive-ul execută o comandă. 94 . ci să citească din orice poziţie aflată în interiorul zonei de date corespunzătoare. de viteza de rotaţie a hard discului. simpla reordonare a comenzilor bazată pe locaţia de destinaţie a capului de citire/scriere deasupra platanului nu este cea mai eficientă soluţie. Ascensoarele au evoluat până la stadiul de a "înţelege" că reordonarea locaţiilor va avea ca efect un mod de funcţionare mai economic şi mai rapid. bineînţeles. Odată cu apariţia modului de transfer Serial ATA. acesta s-a poziţionat pe pista corespunzătoare. Acest lucru se traduce prin faptul că la orice moment de timp pot fi adăugate la coada de aşteptare a comenzilor (queue) cerinţe de execuţie adiţionale. O analogie destul de sugestivă ar fi un ascensor.Evaluarea performanţelor sistemelor de calcul 6. Acestea pot fi încorporate într-un thread în desfăşurare sau pot fi amânate pentru următoarea serie de execuţie a comenzilor. Primul este reordonarea comenzilor într-un mod astfel încât latenţa de rotaţie să fie minimizată. 6. În cel mai rău caz posibil. La fel ca în cazul liftului. Aceasta presupune ca braţul să nu acceseze neapărat blocul logic de început al datelor cerute. după ce. în prealabil. Dacă toate opririle ar fi executate în ordinea în care s-au apăsat butoanele. o nouă comandă poate intra în această coadă de aşteptare. Al doilea mod de optimizare implică folosirea unei funcţii denumite "out-oforder data delivery". HDD-urile vor folosi algoritmi complecşi pentru a determina cea mai bună comandă pe care să o execute în continuare. atunci va fi următoarea comandă care va fi executată. Optimizarea latenţelor de rotaţie Timpul de rotaţie reprezintă durata necesară pentru ca blocul logic de început al datelor cerute să se rotească până când ajunge sub capul de citire scriere.3. prin alte două moduri de abordare. creşterea acestei viteze implică un cost adiţional substanţial. Traducând aceste lucruri în tehnologie HDD. Oricât pare de incredibil. majoritatea hard discurilor existente pe piaţa de desktop-uri în ziua de astăzi funcţionează în acest mod ineficient. care nu se va opri brusc atunci când o persoană apasă butonul unui etaj pe lângă care tocmai a trecut. Acest timp depinde. iar dacă ea va putea fi procesată cel mai eficient din punct de vedere mecanic. Această optimizare este similară cu cea din cazul timpilor de căutare. Timpii de rotaţie pot fi minimizaţi. Astfel. dar schema este dinamică.3. drive-ul începe să citească datele cerute imediat cum s-a poziţionat pe pista corespunzătoare şi adaugă datele lipsă (cele aflate între blocul logic de început şi cel de la care s-a început efectiv citirea) la sfârşitul aceleiaşi rotaţii. liftul ar funcţiona într-o manieră foarte ineficientă şi ar pierde foarte mult timp pentru a circula între diferitele locaţii.1. de asemenea. O viteza de rotaţie a platanelor mai mare este o modalitate în care se pot reduce latenţele de rotaţie. platanul ar trebui să parcurgă o rotaţie completă până când aplicaţia ar putea accesa datele cerute.

trebuie să fie suportat şi activat de controllerul SATA şi de hard disc. Pentru ca NCQ să fie activat. Pe piaţa hard discurilor ne putem aştepta în viitorul apropiat la o "afluenţă" a dispozitivelor înzestrate cu aceasta tehnologie. cererile de întrerupere individuale pot fi "combinate".această funcţie permite ca starea oricărei comenzi să fie comunicată sistemului. în cel mai rău caz. spre exemplu. cât şi pe cel de rotaţie. Ea a fost dezvoltată de Intel şi Seagate odată cu apariţia modului de transfer SATA pentru dispozitivele de stocare. Beneficiile principale ale NCQ: Race-Free Status Return Mechanism . transferul va fi complet în maxim o rotaţie a platanului. Însă. Seagate nu este singurul care a început implementarea acestei tehnologii. • Interrupt Aggregation şi • First Party DMA. Nu este nevoie de o compatibilitate specială cu sistemul gazdă pentru ca această comunicare să aibă loc. În acest caz. În plus. la care se adaugă durată de timp necesară pentru a citi blocurile logice de date cerute.3. această tehnologie necesită activarea opţiunii Advanced Host Controller Interface (AHCI) din BIOS şi instalarea aplicaţiei Intel Application Accelerator. acesta reordonându-le pentru a reduce atât timpul de căutare. ceilalţi producători nefiind mai prejos. 6.Cap 6: Evaluarea hard discurilor Folosind tehnologia "out-of-order data delivery".în general. Dacă hard discul efectuează mai multe comenzi într-un interval scurt de timp (lucru des întâlnit în majoritatea computerelor). • 95 . Metoda de activare variază în funcţie de controller. Ideea de bază este că Native Command Queuing "se simte" atunci când mai multe comenzi sunt lansate către drive. controllerul sistemului gazdă procesează doar o cerere de întrerupere pentru mai multe comenzi. cel mai rău "scenariu" implică un timp de o rotaţie. de către Seagate. unul dintre producătorii importanţi din domeniu. Fără implementarea acestei funcţii. Acest lucru este subliniat şi de recentul anunţ de achiziţie a companiei Maxtor. bineînţeles. • Interrupt Aggregation . Pe unele plăci de bază cu chipset Intel. Tehnologia NCQ permite ca numărul mediu de cereri de întrerupere per comandă să fie mai mic decât 1. Tehnologia NCQ Native Command Queuing (NCQ) este o tehnologie realizată pentru a creşte performanţele hard discurilor SATA. Cu cât sunt mai multe astfel de cereri de întrerupere. Nu vom intra în detalii despre modul în care hard discurile "echipate" cu tehnologia NCQ realizează această mult dorită reordonare a comenzilor pentru a mari performanţele. există trei noi capabilităţi care sunt încorporate protocolului Serial ATA pentru a îmbunătăţi performanta NCQ: • Race-Free Status Return Mechanism. drive-ul lansează cereri de întrerupere (interrupt requests) de fiecare data când termină de efectuat o comandă.3. cu atât mai mare este sarcina de procesare a sistemului gazda. NCQ asigură performanţe mai bune şi eficienţă prin intermediul unei reordonări eficiente a comenzilor. Bineînţeles.

reducând şi mai mult nivelul acustic şi îmbunătăţind vitezele de transfer ale datelor. poate fi totodată achiziţionat cu software-ul de management Wave Systems Embassy Trust Suite de la Wave Systems.. Alte specificaţii: include 8 Mb memorie cache. “Ultima tehnologie dezvoltată de Samsung în cadrul SpinPoint S166 Series adaugă un surplus de atractivitate unei audienţe mai largi. Seagate Momentus 5400 FDE.5 dB atunci când citesc/scriu date. 120 GB şi 160 GB. ASI Computer Technologies a anunţat ca va distribui primul laptop care va conţine noul hard disc Seagate. Se comportă ca un hard disc obişnuit.3.” a declarat TJ Lee.5. Criptare nativă pentru hard discuri Seagate Technologies a anunţat disponibilitatea primului hard disc destinat laptop-urilor ce beneficiază de capabilităţi de criptare native.puţin mai silenţioase Noile hard discuri Samsung SpinPoint S166 7200 rpm sunt “ultra silenţioase şi de mare viteza. destinate protejării datelor în cazul în care dispozitivele sunt furate sau pierdute.4. precum şi în electronicele destinate consumatorilor. 6. cu algoritmi de criptare AES pe 128 de biţi. ce permite administratorilor IT să controleze criptarea datelor şi parolele la nivel enterprise.2. în funcţie de capacitate: 80 GB.Evaluarea performanţelor sistemelor de calcul • First Party DMA . “Acesta este un drive standard ATA ce este criptat în permanenţă. precum DVR sau orice alt echipament ce are nevoie de stocare şi va fi utilizat într-un mediu silenţios. Deşi există o mulţime de tehnologii de criptare bazate pe software. mult mai ieftină decât software-ul de criptare şi fără să consume din ciclurile procesorului.3.. Hard discuri.” a declarat Lark Allen. Acesta este mijlocul prin care drive-ul poate în mod efectiv să reordoneze comenzile. emiţând 24 dB îin stare idle şi 27. din moment ce poate selecta buffer-ul de transmisie la propria iniţiativă.” Primele două modele prezintă capacitate de 60 Gb şi 160 Gb.Native Command Queuing are un mecanism care îi permite drive-ului să îşi configureze modul de operare DMA (Direct Memory Access) pentru a transfera datele fără o intervenţie software din partea sistemului gazdă. drive-ul Seagate Momentus este primul care include o soluţie de criptare firmware. Aceste coordonate le fac “ideale pentru a fi încorporate în calculatoarele office. vice preşedinte executive în cadrul companiei Wave Systems. Compania a declarat ca a ales propriul notebook 96 . vice preşedinte în cadrul diviziei Samsung Electronics. 6. seful departamentului de marketing în cadrul Seagate. o mai bună rezistenţă la şocuri şi un nou controller ce oferă viteze mai bune de transfer şi un consum redus de curent electric. Hard discul are 5400 RPM şi poate fi achiziţionat în 3 versiuni diferite. Facilitatea de criptare va spori preţul acestui cu aproximativ 25% faţă de costul unui hard disc standard.” pretinde compania.0 Gbps Sata cât şi PATA. beneficiind atât de interfaţa 3. nu ţi-ai da seama de vreo diferenţă. a declarat Melissa Johnson. îmbunătăţirea capului de citire a datelor.

noul dispozitiv respectă directiva europeană RoHS din iulie 2006. Toshiba va începe producţia de masă pentru acest hard disc din ianuarie 2007. cea mai mare din aceasta clasă de hard discuri.8 inci cu o capacitate de stocare de 100 de GB. asigurând astfel un mediu de lucru mult mai prietenos. MK1011GAH utilizează tehnologie PMR (perpendicular magnetic recording) şi un cod de erori îmbunătăţit pentru a asigura cea mai mare densitate virtuală dintre toate hard discurile de pe piaţă: 240. 97 .3. Hard discuri liliputane Toshiba a anunţat că a fabricat un hard disc de 1. deoarece acesta este livrat deja cu opţiuni speciale de securitate precum un cititor de amprente. 6.Cap 6: Evaluarea hard discurilor Centrino de 15 inci pentru a găzdui hard discul. Toshiba a îmbunătăţit consumul de curent la 0.8 MB pe milimetru pătrat. Totodată. De asemenea. Lansarea acestei bijuterii vine să suporte dezvoltarea viitoarelor generaţii de calculatoare mobile. Noul dispozitiv.003W/GB. oferindu-le utilizatorilor funcţionalităţi îmbunătăţite. Împachetarea capacităţilor uriaşe în hard discuri din ce în ce mai mici este o cerinţă obligatorie pentru a ţine pasul cu tehnologiile avansate din piaţa PC-urilor şi pentru a întâmpina cu succes cererile pentru medii digitale ce suportă capacităţi de stocare din ce în ce mai mari.6.

1. Procesul de testare al unei plăci de bază este cel mai complex şi există produse care pot sări peste anumite secţiuni din metodologie. servere pentru reţele de mare performanţă. un anumit produs adresându-se numai unuia dintre aceste segmente. 98 . dar acesta reprezintă părerea echipei de testare. • Professional computer hardware .Seminar Evaluarea performanţelor sistemelor de calcul Seminar 1 1 Metodologia de evaluare pentru plăci de bază 1.2 Introducere Metodologia de testare este destul de complicată. Acest segment de piaţă nu va fi descris în acest seminar. dar există şi anumiţi paşi obligatorii într-o sesiune de testare obiectivă. aşa că acesta este subiectul principal al acestui seminar. Cele patru segmente sunt: • segmentul inferior de piaţă. Majoritatea utilizatorilor cumpără computere în acest segment de piaţă. Perifericele şi componentele hardware pentru computere care costa mai puţin de 600$. ci numai performanţa. dar acest lucru nu contează atâta timp cât păstrăm metodologia de testare. Mult mai importantă este metodologia. S-a împărţit piaţa în patru categorii. Vom discuta despre specificaţii mai târziu. Am hotărât să utilizam sisteme de testare diferite pentru fiecare segment de piaţă. Majoritatea firmelor mici utilizează servere şi echipament de reţea din acest segment de piaţă. dar trebuie luaţi în considerare toţi ceilalţi factori. Cel mai bun exemplu: Majoritatea serverelor rack mountable. Paşii care fac parte din metodologia de testare se aplică în cazul fiecărui segment de piaţă fără diferenţă. Cel mai bun exemplu: plăcile de baza dual procesor care au preţul destul de ridicat şi oferă o performanţă la fel. standarde de firmă. Hardware şi periferice pentru computere care costa mai mult de 1500$. De obicei cel mai important aspect pe această piaţă este preţul. Există şi un al şaselea pas. Am reuşit să definim 5 paşi în cadrul metodologiei de testare. dar noi am ales un model pe patru nivele (ca cel TCP/IP) deoarece este mai uşor de testat în aceste condiţii.1 Obiective: Cunoaşterea metodologiei pentru testarea şi evaluarea plăcilor de bază ale computerelor. Din cadrul acestei categorii fac parte un număr limitat de produse. Există produse la care se aplică numai anumiţi paşi datorită unor motive logice. amintiţi-vă doar că ceea ce este astăzi nou s-ar putea ca luna viitoare să fie depăşit. Sistemele de testare vor fi depăşite în câteva luni. astfel încât se va încerca descrierea pe scurt a procesului de evaluare. acestea nu sunt foarte importante. etc.preţul nu contează. Perifericele şi componentele hardware pentru computere care costă între 600$ şi 1500$. De obicei majoritatea companiilor media şi de cercetare împart piaţa în doar trei segmente. După cum probabil ştiţi există câteva segmente de piaţă. • segmentul superior de piaţă. • segmentul de piaţă mediu. Chiar dacă acestea nu sunt foarte scumpe se adresează utilizatorilor profesionişti.

Multe produse hardware sunt bine prezentate. identificarea pieţei. oferta concurenţilor. . Acest pas este foarte important deoarece în majoritatea cazurilor layout-ul influenţează paşii următori. O atenţie deosebită trebuie acordată părţii electronice / mecanice. Obligatoriu • Layout-ul produsului. dar nu descriu bine setările din BIOS. momentul în care produsul a fost / va fi prezentat pe piaţă. • Documentaţia. De asemenea în această secţiune vom discuta despre drivere. procesoare. . Vom analiza documentaţia din punctul de vedere al unui amator şi din perspectiva unui inginer. Obligatoriu • Situaţia pe piaţă. Cercetăm problemele care ar putea apărea în timpul instalării. SCSI şi plăci de reţea.Producătorul. de sunet. . placi video. firmware. Este posibil să nu fie toate disponibile pentru toate produsele. data lansării pe piaţă. De exemplu vom testa o placă de bază cu câteva dispozitive USB. . Orice acţiune atipică la instalarea produsului va fi raportată.3 Cei cinci paşi în evaluarea obiectivă În cele ce urmează va vom prezenta cei cinci pali din metodologia de evaluare. Bineînţeles că majoritatea 99 .Seminar Evaluarea performanţelor sistemelor de calcul Seminar 1 1.segmentul ţintă. • Identificarea produsului . versiunea. Caracteristicile produsului • Caracteristicile promovate de marketing / Caracteristicile reale. De exemplu un Winmodem nu ar trebui să meargă sub Linux cu toate că pe net există drivere scrise de terţi care asigură funcţionarea. .Privim produsul cu atenţie şi descriem design-ul / layout-ul. De exemplu manualele multor plăci de bază descriu instalarea în detaliu. Obligatoriu • Prezentarea produsului.Instalam produsul în aceleaşi condiţii ca un utilizator final. Obligatoiru • Compatibilitatea produsului cu platformele software. Obligatoriu • Calitatea componentelor. modelul. lotul. Obligatoriu • Compatibilitatea produsului cu alte dispozitive hardware.Unul din paşii principali. Din punctul nostru de vedere aceasta va fi secţiunea cea mai dificilă şi care va lua cel mai mult timp. Instalarea produsului / compatibilitatea • Instalarea normală a unui produs. Obligatoriu 3. 2. Verificăm caracteristicile promise ale produsului. module de memorie. Dacă există produse similare pe piaţă care suportă o gamă mai largă de platforme atunci vom nota acest lucru. Identificarea produsului. dar calitatea componentelor este mediocră. Este imposibil să testezi compatibilitatea cu toate dispozitivele hardware din lume. Fiecare pas este alcătuit din mai multe părţi şi majoritatea acestor paşi se aplica tuturor produselor (marcat cu obligatoriu). . 1. Unele produse nu sunt compatibile cu anumite platforme.Acest pas include verificarea ambalajului şi comentarii despre campania de publicitate realizată de către compania producătoare. Majoritatea laboratoarelor care testează şi aprobă hardware utilizează numai "cele mai populare dispozitive". Noi testăm produsul numai cu sistemele de operare (de exemplu) suportate de produs.

Garanţia este de asemenea importantă deoarece există produse la care o perioadă de garanţie mai îndelungată este bine-venită. dar care nu există la versiunea testată. update-uri la software sunt vitale în menţinerea sistemului la zi şi fara bug-uri. • 100 ore de teste burn-in. Cazurile în care produsele nu mai funcţionează după câteva săptămâni nu sunt foarte frecvente. Verificam funcţionalitatea caracteristicilor promise şi a celor reale. De exemplu Abit SoftMenu nu mai este o caracteristica unică. website şi suportul online. 100 . Majoritatea plăcilor de bază oferă funcţii de overclock-are. Testând o mulţime de plăci de bază cu această funcţie veţi constată că nu veţi înţelege nici măcar un singur cuvânt din ce spunea vocea suava care anunţă o problema. Obligatoriu Caracteristicile unice ale produsului. Obligatoriu Utilitatea caracteristicilor oferite. În decursul timpului am văzut o mulţime de funcţii inutile la unele produse hardware ale unor producători cunoscuţi. Testele cu benchmark-uri ca Ziff Davis Content Creation Winstone 2001. De exemplu funcţia numita "Voice Diagnostic" care este disponibilă la multe plăci de bază şi care în acest moment este o funcţie absolut stupidă. ci o caracteristică promovată de departamentul de marketing. Obligatoriu • Cât de demn de încredere este un produs în condiţii extreme (teste care depăşesc specificaţiile).Seminar Evaluarea performanţelor sistemelor de calcul Seminar 1 • • • • caracteristicilor sunt deja cunoscute utilizatorilor. Performanţa • Performanţa testată cu benchmark-urile care folosesc aplicaţii. Discutam despre ce ne-ar place să vedem la versiunile viitoare ale produsului. update-uri. Obligatoriu 4. dar acestea nu sunt nici recomandate. Există producători care oferă clienţilor caracteristici unice pe piaţă. Plăcile de bază care îşi dovedesc stabilitatea în condiţii de overclock-are sunt şi mai stabile în condiţii normale. Discutam despre îmbunătăţiri. Unul dintre cele mai respectate teste din aceasta categorie este SiSoft Sandra. În general MTBF-ul majorităţii produselor este mai mult decât suficient. Încrederea într-un produs • Cât de demn de încredere este un produs în condiţii normale de exploatare. Suportul nu este totul. Este greu să prezici aceste schimbări. Determinăm intervalul de timp în care poţi utiliza produsul fără să apară schimbări arhitecturale. Obligatoriu Capacitatea produsului de a se adapta la schimbări / Durata de viaţă. Comparam cu caracteristicile oferite de către concurenţă. Orice produs sau orice componentă electronică se poate strica în primele ore de funcţionare. garanţia. Obligatoriu • Performanţa testată cu ajutorul benchmark-urilor sintetice. Amintiţi-vă numai că plăcile de bază Slot nu mai pot fi utilizate în acest moment. În cazul unei plăci de bază aceasta poartă numele de stabilitate. poate există caracteristici a căror prezenţă ar fi de dorit. • Suportul oferit de compania producătoare: drivere. din momentul ce există şi alţi producători care oferă caracteristici comparabile. Este foarte important cât de rapid poate o companie să ofere suport pentru clienţii săi. Bapco SysMark 2001. dar putem afla care sunt planurile producătorilor. Obligatoriu 5. nici suportate de către producători.

De obicei se măsoară timpul de care are nevoie un produs pentru a finaliza o serie de comenzi. Dacă un produs obţine mai puţin de trei puncte într-o secţiune nu va obţine sub nici o forma mai mult de 18 puncte. 1.Are probleme serioase în această secţiune. cu câteva excepţii: 1. între 18 . dar există soluţii mai bune pe piaţă. 101 . • Sfaturi care privesc achiziţionarea. este suma punctajelor obţinute în cadrul fiecărei secţiuni.Un produs mediu. • Între trei şi patru puncte . Nota finală se bazează pe paşii anteriori. Comparaţia cu alte produse. 2.Seminar Evaluarea performanţelor sistemelor de calcul • Seminar 1 • Performanţa în aplicaţii. Părerea evaluatorului • Opţiunile existente pe piaţă.4 Consideraţii finale / Nota finală Trebuie să ne reamintim mereu ca nu suntem în căutarea produsului perfect. • • • • Interpretarea notei finale: mai puţin de 15 puncte . Un produs poate "pica" în cadrul unei secţiuni (ex: încrederea în produs). cumpăraţi-l şi nu veţi regreta. aceasta înseamnă că produsul are probleme serioase. una dintre cele mai bune alegeri de pe piaţă Există de asemenea o notă finală care. Aceste teste se bazează pe aplicaţii des folosite. Obligatoriu 6. Se compară produsul cu alte produse de pe piaţă şi se determină poziţia acestuia pe piaţă. • între două şi trei puncte . • Peste patru puncte .Calitate deosebită. iar noi verificăm cât de aproape de perfecţiune este un produs.Un produs mediu care s-a comportat după cum era de aşteptat. chiar dacă obţine 5 în toate celelalte secţiuni! Puţin posibil.18 puncte . dar există produse aproape perfecte. Punctăm comportamentul produsului în fiecare secţiune cu unul până la cinci puncte.O alegere bună. Produsul perfect nu există. Trebuie luat în considerare şi preţul. Discutam şi comparăm respectiva placă de bază cu alte plăci de bază de pe piaţă. Putem aduna/scădea două puncte din suma totală în funcţie de impresia noastră generală. merită investiţia mai mult de 22 puncte .unul dintre cele mai bune de pe piaţă. Este extrem de importantă şi trebuie să discutam despre acest subiect în detaliu. Dacă are punctaje bune în celelalte secţiuni. îl puteţi cumpăra.un produs mizerabil. în principiu. Nici să nu vă treacă prin cap să-l cumpăraţi! între 15 .Am avut câteva probleme cu acest produs. • Nota finală.22 puncte . poate fi o soluţie. Acest produs este jalnic şi nu este recomandat. Când un anumit produs a trecut de o secţiune primeşte un punctaj. Să vedem care sunt aceste punctaje: • mai puţin de două puncte . Ce părere au specialiştii de IT despre achiziţionarea unei astfel de plăci.

7800GTX. credem că opţiunea multi GPU rămîne o alternativa foarte scumpă. respectiv ATI .1 Obiective: Seminarul îşi propune evaluarea şi compararea mai multor plăci de bază ce suportă procesoare Intel Pentium din familia D. 945G şi mai noul 955X. Odată cu lansarea seriei Pentium D au fost necesare şi câteva modificări în ceea ce priveşte chipset-ul care are în grija procesorul dual core.1800. Unul dintre dezavantajele acestor platforme.2 102 . care vor fi prezentate în continuare. sarcinile sunt împărţite între cele două nuclee ale procesorului. Consideraţii tehnice Realizarea unui upgrate care să presupună ca platformă noile procesoare dual core de la Intel presupune cunoaşterea câtorva detalii.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 2 2 Evaluarea plăcilor de bază dual core 2. Marele avantaj al acestei tehnologii este acela că în situaţiile în care sunt rulate pe sistemul de operare mai multe aplicaţii odată. plăci audio cu opt canale sau dual LAN pe bandă Gigabit şi interfaţa PCI Express. Suntem deja mai mult decât familiarizaţi cu procesoarele dual core pe care marii producători de astfel de componente le-au lansat şi pe piaţa autohtona. Performanţa de care aceste procesoare dau dovadă este de necontestat. posibilitatea de a avea multi procesor pe acelaşi cip integrat este o soluţie la care mulţi dintre noi se gândeau să apeleze. Însă. În 2. Facilităţile pe care acestea le oferă se extind până la interfeţe S-ATA mai performante. mai mult decât atât. în privinţa jocurilor nu aveţi nevoie de o astfel de platformă. este faptul că acestea nu suportă conectarea în mod SLI a două plăci nVIDIA (cazul chipset-urilor Intel). La momentul actual sunt doar trei chipset-uri la care se poate opta în cazul platformelor cu CPU Intel Pentium D: 945P. Cu toate acestea. în privinţa gamerilor. dacă luăm în calcul faptul că procesoarele dual core sunt destinate rulării mai multor aplicaţii în acelaşi timp. apariţia noilor chipset-uri de la nVIDIA .

2. Setările cu care am pornit benchmark-ul au fost cele default. De aceea.50: S-a considerat că arhivarea de fişiere reprezintă un lucru destul de important la ora actuală. numărul de subteste fiind maxim. codare video sau interoperabilitate placa de baza .procesor. aceste platforme sunt destinate. 8 MB cache ATA100 Sursa de putere: Zalman 400 W PC Mark 2005: Noul software dezvoltat de cei de la Futuremark destinat evaluării întregului sistem a ajutat foarte mult în aprecierea performantelor per ansamblu a platformei de test. Lame mp3 encoder a fost utilizat în mod default pentru un fişier de test cu o dimensiune de 100 MB. grafic workstation sau server. Lame mp3 Encoder: Nu foarte popular în ceea ce priveşte codarea în format mp3. 3D Mark 2005: Performanţele video ale platformei au fost testată cu popularul 3D Mark 2005. cât şi pentru aşa. 4x Anisotropic filter şi fără Full Scene Anti-Alasing.numiţii power users. Platforma de test: CPU: Intel Pentium 4 D 3 GHz Memorie: 2x1024MB DDR II SDRAM Kingmax 533 MHz Placa Video: Gigabyte Radeon X800 XL PCIe 256MB GDDR3 Hard disc: Western Digital JB 200 GB.3 Procedura de testare S-a plecat de la ideea că dincolo de jocuri. Apropierea de conceptul digital home este realizată de integrarea unor plăci de sunet cu opt canale. fie pe reţea sau inscripţionare pe CD/DVD. luând în considerare faptul că noi toţi suntem în căutare de un transfer cât mai rapid al fişierelor: fie pe mail. Arhiva sa constituit dintr-un folder iniţial cu dimensiunea de 100 MB şi un număr de 3. 103 . aplicaţiilor office. acestea pot fi doar DDR II la frecvenţe de până la 800 MHz (valabil pentru chipset-urile 955X). în primul rând.600 de fişiere.1. Pe lângă acestea. cei în căutare de un computer foarte performant. s-a ales în testele efectuate mai mult programe care reflectă performanţele computerului în aplicaţii cum ar fi: arhivare de fişiere. posibilitatea de a alege noile suporturi Serial ATA II reprezintă un avantaj fantastic atât pentru soluţiile server. La acestea se adaugă suportul RAID de la matrice în configuraţie 0 până la 5 cu un transfer mediu de aproximativ 3 Gb/s.1 sau 5. WinRAR 3. test ce a rulat pentru setările default: rezoluţie 1024x768@ 32bit.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 2 privinţa memoriilor compatibile. din cauza în primul rând absenţei unei interfeţe prietenoase. alternativă ce va permite să conectaţi un sistem de boxe 7.

0. mai ales dacă luăm în calcul că sunt cu un pas în urma plăcilor care beneficiază de mai noile chipset-uri 955X. Gigabyte GA-9I955X Royal Principalul rival al câştigătorului. Programul ne oferă scoruri pentru Testul de numere Integer (întregi) şi Floating point (calcule în virgulă mobilă). Absenţa conectorilor FireWire nu reprezintă un dezavantaj major dacă luăm în calcul performanţele actuale ale porturilor USB ver2. Scorurile mari înregistrate în teste au convins atât în privinţa performanţei per ansamblu .5.0. Scorul cel mai ridicat în testul 3D Mark05 duce imediat cu gândul la faptul că placa de bază se adresează în primul rând împătimiţilor jocurilor şi apoi celorlalte categorii de cumpărători. Caracteristic chipset-ului 955X de la Intel. Sub capota aceluiaşi chipset 955X de la Intel.şi când ne referim la asta ne referim în primul rând la PC Mark 05.0. Fişierul de test a fost un fragment de DVD (. placă audio cu opt canale şi Gigabit LAN. ajutat de suportul DDR II şi FSB-ul la 1066 MHz. În privinţa dotărilor suplimentare lucrurile stau la fel ca la celelalte plăci de bază cu chipset-uri 955X: suport RAID 0.3. s-a dovedit a fi o platformă completă . 104 2. în acelaşi timp. şi de inovaţii în direcţii precum storage (SATA II) sau audio (compatibilitate cu sisteme audio 7. Cu toate acestea. ASUS P5WD2 Premium Câştigătorul testului din cadrul seminarului nostru. La fel ca şi celelalte concurente. Plăci de bază testate ABIT AW8-MAX Echipată cu ultimul chipset destinat procesoarelor dual core.1).4 . cât ţi la capitolul manipulare a fişierelor.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 2 SISoft Sandra 2005: Test de referinţă în materie de performanţă a componentelor. cât şi în privinţa dotărilor sale. care dă dovadă de o fiabilitate bună şi. au reuşit să ofere rezultate mai mult decât satisfăcătoare în testele rulate. GA-8I955X Royal este o platformă care se doreşte a fi un suport pentru performanţe extreme. Bus-ul memoriei de 888 MHz. Auto Gordian Knot (Xvid 1. specificaţiile tehnice nu sunt cu mult inferioare: acelaşi FSB 1066 MHz ca la concurente. P5WD2 Premium. FSB-ul de care beneficiază acest produs atinge limita de 1066 MHz.vob) cu dimensiunea iniţială de 200 MB.1. MSI Neo 945P şi Platinum 954P Gemenele MSI din acest test s-au comportat exemplar în aplicaţiile rulate. suport pentru memorii DDR II şi compatibilitate S-ATA II. Fişierul de ieşire a fost setat la dimensiunea de 100MB. frecvenţa maximă pentru memoriile compatibile pe această platformă fiind de 800 MHz.3 encoder): Testul de codare video a fost făcut cu Auto Gordian Knot pentru codec video Xvid 1. facilităţile adiţionale cum ar fi a doua placă de reţea sau controlerul audio cu opt canale sunt lucruri cu care ne-am obişnuit deja.atât din punct de vedere al performanţei. AW8-MAX este o placă ce se clasează ca performanţe peste linia mediană a topului realizat. SiSoft Sandra a rulat doar pentru testul CPU Multimedia Benchmark. Audio AC3.

ABIT AL8 Cunoscuţi mai ales datorită capacităţilor fantastice de overclocking. cu siguranţă modelul 955X7AA de la Foxconn ar fi urcat vertiginos pe prima poziţie. scorurile obţinute fiind ceva mai ridicate decât la modelul SLI venit de la ASUS. Timpul destul de scurt înregistrat pentru codarea unui fişier video la standard Xvid/AC3 arată faptul că interconectarea între componentele de bază este foarte bine coordonată. Chiar dacă posibilitatea de extindere la cea de-a doua placă grafică pe care aceste platforme o oferă este una profitabilă din punct de vedere al performanţei. Gigabyte GA-8N-Sli Cea de-a doua placă ce suportă modul Scalable Link Interface (SLI) s-a comportat ceva mai bine la capitolul benchmark-uri sintetice. Cel mai mare scor în PC Mark 2005 şi. de asemenea. Foxconn 955X7AA Dacă punctarea la acest test ar fi fost dată doar de rezultatele în benchmark-uri. credem totuşi că sunt puţini cumpărători de pe piaţa noastră care ar opta pentru o astfel de soluţie. suport DDR II 667. Cu toate că bus-ul maxim pentru placă este de doar 667 MHz. Opţional. dar putem spune că după rezultatele pe care aceasta le-a înregistrat în teste. soluţie aleasă de producător pentru a atrage şi o parte dintre clienţii în căutare de sisteme digital home. Chipset-ul care echipează platforma este unul nForce 4 Sli. RAID 0. şi anume în cel al gamerilor.în speţă chipset-ul nu reprezintă totul. cel mai scăzut timp la arhivarea datelor vă pot face să vă orientaţi pentru o astfel de placă de bază dacă sunteţi o persoană care nu se gândeşte în primul rând la jocuri. placa audio şi placa video. cât şi memoria. ASUS P5LD2 Deluxe Echipată cu un chipset 945P.1. P5LD2 Deluxe se vrea a fi (probabil) o placă middle-range. Platforma nu beneficiază decât de o singură placă de reţea gigabit şi doar un slot adiţional PCX. însă scorurile pe care aceasta le-a înregistrat pe parcursul testării au demonstrat că produsul se vrea a fi în primul rând unul care să impresioneze prin performanţă. Remarcabile rămân performanţele plăcii de bază în ciuda suprasolicitării sale cu mai mult de o placa video. la acest produs puteţi achiziţiona în interiorul pachetului şi o placă WiFi-TV. testul implicând atât procesorul. acesta înregistrând scoruri 105 . Rezultatele în benchmark-urile sintetice categorisesc în mod clar segmentul în care acest produs se integrează.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 2 MSI 955X Platinum Candidatul MSI la categoria chipset 955X versiunea Platinum beneficiază de caracteristici întâlnite la aproximativ toate celelalte concurente. cei de la ABIT nu au reuşit să impresioneze cu modelul AL8. P5ND2 Sli este o placă de bază ce se axează pe performanţa sistemului în aplicaţii multimedia.5 sau ieşire audio pe opt canale. performanţele de care a dat dovadă platforma ne fac să credem că la urmă materia primă . categoria în care se integrează ţine să se apropie de cea de vârf. capabil să ofere un FSB de 1066 MHz. ASUS P5ND2 Sli Destinată în primul rând împătimiţilor jocurilor.

Seminar Evaluarea performanţelor sistemelor de calcul

Seminar 2

îngrijorător de scăzute la mai toate testele pe care le-a rulat. Dotată cu un chipset 945P, potenţialii cumpărători se pot bucura de suportul DDR II, FSB 1066 MHz, placă audio cu opt canale şi interfeţe S-ATA. ASRock 775Dual-880Pro Nu ştiu câţi dintre voi cunoaşteţi atât de bine brand-ul ASRock, însă dincolo de performanţele precare pe care această placă a reuşit să le ofere, posibilitatea de a monta la alegere un procesor AMD sau unul Intel pe această platformă, este de admirat. (Procesorul AMD se motează cu ajutorul unei placi special concepute ce se conectează lângă slotul PCIe x16.) Am rămas plăcut impresionat să observ că în anumite teste 775Dual-880Pro a reuşit să bată competitori cu un nume mai puternic. Concluzii Chiar dacă "era" procesoarelor dual core abia a început, producătorii de plăci de bază nu au întârziat să-şi facă simţită prezenţa în toate segmentele de cumpărători. Produsele prezentate în acest seminar au dat dovadă de performanţe ridicate, diferenţele dintre acestea nefiind extraordinar de mari. 2.5

106

Seminar Evaluarea performanţelor sistemelor de calcul

Seminar 3

3 Realizarea overclock-ingului la plăcile grafice
Generalităţi despre overclocking-ul la plăcile grafice Ca şi în cazul procesoarelor, plăcile grafice pot fi supuse operaţiunii de overclocking, adică creşterea frecvenţelor pentru obţinerea de performanţe superioare celor implicite. Ce gamer nu-şi doreşte performanţe mai mari decât cele oferite de sistemul său dacă realizează că nu poate juca jocul preferat la framerate-ul dorit, la rezoluţia sau setările de calitate preferate? Din păcate, şi aici apar riscuri legate de temperaturi ridicate, deci este necesară o răcire corespunzătoare, nu neapărat suplimentară. O răcire inadecvată poate duce la arderea GPU-ului, caz extrem de rar fiindcă mai toate plăcile recente beneficiază de răcire activă şi/sau există un minim de airflow în carcasă. Fără a mai vorbi de protecţie la supraîncălzire. O frecvenţă prea mare duce de cele mai multe ori la blocaje sau un comportament necorespunzător prin apariţia de artefacte, astfel că un utilizator neiniţiat, care „s-a jucat cu nişte setări”, poate contribui la umplerea departamentelor de service ale firmelor de calculatoare pentru probleme inexistente, singurul lucru care trebuie făcut fiind reducerea frecvenţelor. Atât chip-ul cât şi memoria plăcii pot fi supratactate deoarece fiecare dintre ele beneficiază de o anumită frecvenţă de funcţionare (ca şi în cazul procesoarelor sau a modulelor de memorie) care influenţează în mod direct - dar nu exclusiv - performanţa. Overclocking-ul este util în momentul în care deţineţi o placă „uşor overclock-abilă”. De multe ori, producătorii reduc artificial frecvenţa celor două componente pentru a nu afecta vânzările modelelor mai scumpe, sau pur şi simplu pentru că chipul respectiv nu a rezistat la frecvenţele fratelui său mai mare dar poate rezista unei frecvenţe superioare celei la care este marcat. Să luăm ca exemplu chip-ul GeForce3 Ti200, cel mai lent chip din seria GeForce3. Frecvenţa GPU-ului este de 175 MHz faţă de 240 pentru modelul superior bazat pe aceeaşi arhitectură şi produs în aceeaşi perioadă, GeForce3 Ti500. Practica a demonstrat că în majoritatea cazurilor ambele chipuri suportă o frecvenţă maximă de circa 250-260 MHz din simplul fapt că procedeul de fabricaţie este identic; însă sunt cunoscute situaţii în care un Ti200 nu a suportat nici măcar frecvenţa lui Ti500, adică 240 MHz, fapt ce explică marcarea sa ca Ti200. Dar poate că el rulează perfect la 235 MHz, şi din start putem spune că „s-au pierdut” 60 MHz, ce se traduc poate prin 30-40% în performanţa reală. Frecvenţa maximă a chip-ului depinde în mare măsură de sistemul de răcire. Acesta este compus de obicei dintr-un radiator şi un ventilator, ultimul putând lipsi. Contactul dintre radiator şi chip este realizat în cazul ideal prin pasta termoconductoare, însă mulţi producători ignoră avantajul acesteia şi folosesc un adeziv oarecare, slab conductor termic. În cazul memoriei, problema stă cu totul altfel: fiecare producător îşi dotează placa în funcţie de model sau chiar de stocul de memorii disponibil la acel moment (acest ultim caz întâlnindu-se îndeosebi la producători „de categoria a doua”). Astfel, dacă un Radeon 9550 beneficiază din start de memorii ce rulează la 400 MHz, frecvenţa maximă ce poate fi atinsă poate varia de la model la model sau de la exemplar la exemplar, diferenţele putând fi foarte mari.
107

3.1

Seminar Evaluarea performanţelor sistemelor de calcul

Seminar 3

Şi comportamentul la overclocking diferă faţă de GPU. Dacă în cazul acestuia din urmă, o frecvenţă prea mare duce de obicei la blocaje, o memorie va trece de regulă mai întâi prin stadiul de a prezenta artefacte vizuale, vizibile atât în 2D cât mai ales în 3D, care culminează, într-adevăr, cu blocaje. Însă putem considera că un singur bit scris incorect în memoria plăcii, ce generează astfel un pixel de o culoare incorectă, reprezintă o malfuncţionalitate. Utilitarul Artifact Tester1 este destinat detectării acestor artefacte, însă are dezavantajul de a rula în mod 2D, deci nu utilizează nici funcţiile 3D ale chip-ului grafic, nici întreaga memorie video. În schimb, ATITool2 oferă informaţii mult mai precise legate de prezenţa artefactelor, testul inclus fiind unul foarte riguros şi relevant. Un set de radiatoare lipite pe memorii poate duce la scăderea temperaturii şi, cel puţin teoretic, la un potenţial de overclocking mai ridicat. Pe lângă acest factor, dacă aveţi în minte overclocking-ul la achiziţionarea unei plăci, ar fi bine să vă interesaţi asupra timpului de acces al memoriei folosite, informaţie ce ar trebui să apară în ofertă sau în specificaţiile produsului. Chiar şi fără această informaţie, în cazul în care memoriile nu sunt acoperite, de obicei aveţi posibilitatea să descifraţi timpul de acces. În imaginea de alături este reprezentat un astfel chip de memorie, iar din caracterele înscrise pe el se poate citi la urmă valoarea de 3.6 ns, ce corespunde unei frecvenţe de aproximativ 275 MHz (550 MHz DDR). Formula de calcul este simplă: 1000/timp de acces=frecvenţă, eventual înmulţită 2 pentru că a afla valoarea efectivă, nu reală. Aşadar, un GeForce FX5500 sau un Radeon 9500 ar corespunde cel mai bine frecvenţei, însă dacă această memorie este prezentă pe un Radeon 9550 (cu frecvenţa implicită de 400 MHz), rezultă un produs cu un potenţial de overclocking ridicat. Există şi situaţia contrarie, când o placă este dotată cu memorii mai slabe decât ar trebui, fiind întâlnite de exemplu plăci GeForce4 MX440 cu memorii de 6 (333 MHz) sau chiar 7 ns (286 MHz) în locul celor de 5 ns (400 MHz), rezultând frecvenţe inferioare specificaţiilor. Inutil de menţionat că plăcile respective nu respectă specificaţiile NVIDIA şi performanţa lor este mult redusă. Nu trebuie uitat un aspect important: latenţele memoriilor. Ca şi în cazul modulelor obişnuite de memorie, nu doar frecvenţa contează ci şi timing-urile. Avem o serie întreagă de posibilităţi, ce includ atât setările clasice (CAS Latency, TRP, TRCD, TRAS) cât şi altele mai puţin obişnuite. Utilitarele ATITool (pentru ATI), RaBiT3 (pentru ATI) şi NiBiTor4 (pentru NVIDIA) permit ajustarea acestora în mod real-time, ultimele două chiar şi permanent, prin rescrierea BIOS-ului plăcii. Pot exista cazuri în care o frecvenţe redusă combinată cu nişte latenţe mai mari oferă mai multă performanţă decât situaţia contrarie. Cine are timp şi răbdare, poate testa combinaţia optimă pentru placa sa. Trebuie ţinut cont că rescrierea BIOS-ului plăcii poate anula garanţia acesteia, pe lângă riscurile de rigoare (de multe ori, nici scrierea unui BIOS editat „ca la carte” nu garantează funcţionarea ulterioară a plăcii cu acel BIOS). O situaţie mai rar întâlnită dar mult mai spectaculoasă o reprezintă setarea de către producătorul plăcii a unor frecvenţe peste cele recomandate de producătorul chipului. De exemplu, în loc de 250 MHz core şi 400 MHz memoria, Abit a setat frecvenţele lui Radeon R9550 XTurbo-Guru la 300/500 MHz, oferind astfel un
1 2

http://www.xf.ro/downloads/ArtifactTester2.zip http://www.techpowerup.com/atitool/ 3 http://downloads.guru3d.com/download.php?det=872 4 http://www.mvktech.net/component/option,com_remository/Itemid,26/func,selectfolder/cat,92/ 108

Clemele de prindere trebuie să exercite o presiune mare (dar nu exagerată) asupra chip-ului. cele mai multe plăci din aceeaşi familie eşuând. De exemplu. În plus. o pastilă ciobită înseamnă de foarte multe ori o placă grafică defectă. Trebuie. „Setez din programul de overclocking frecvenţele maxime la care totul merge ok şi cu asta basta. dacă doriţi să aflaţi dacă producătorul v-a răsfăţat cu o substanţă de contact de calitate.” Lucrurile nu stau chiar aşa. ea riscând să se ciobească. problema este mai complicată. Dacă avem un sistem de răcire precar. avută foarte multă grijă.. deci puteţi să le lăsaţi liniştit în pace. există şanse chiar să ardeţi placa! În cazul memoriilor. • contactul dintre radiator/radiatoare şi chip/chip-uri. trebuie aplicată o substanţă termoadezivă. dacă ele slăbesc peste măsură datorită manipulării neglijente. de obicei. 109 3.2 .Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 overclocking din start. Dar şi un produs standard poate atinge aceste frecvenţe. nici prea multă dar nici prea puţină. Ele nu au. dacă aţi desfăcut sistemul de răcire şi nu sunteţi mulţumit de el. dar în acest caz va trebui să renunţaţi cel puţin parţial la overclocking. În schimb. având grijă ca ea să acopere întreaga pastilă sau întregul chip în caz că nu avem de-a face cu o pastilă. plăcile Albatron GeForce4 Ti4200 din seria „Turbo” sunt construite pe baza design-ului plăcilor Ti4400 şi Ti4600. aşadar. mai ales dacă suntem în cazul pastilei. trebuie să desfaceţi sistemul de răcire al chip-ului. un exemplu fiind produsele Thermaltake. De asemenea. cât şi înzestrarea plăcii (uneori) cu o răcire mai bună şi/sau cu memorii mai rapide. oferind cel puţin în teorie un potenţial de overclocking mai ridicat. astfel că se poate pune întrebarea: “Ce rost are să dau mai mulţi bani pe o placă overclock-ată din fabrică dacă pot face acelaşi lucru şi singur?”. curăţaţi cu grijă urmele vechiului adeziv şi aplicaţi cu grijă pasta de bună calitate (de exemplu Arctic Silver 5). GPU-urile moderne deţin o pastilă similară procesoarelor Athlon XP. Elementele esenţiale pentru o răcire bună sunt. importanţa răcirii memoriilor este mai redusă. un sistem de prindere bazat pe şuruburi şi în lipsa acestuia au nevoie de un adeziv puternic pentru a rămâne lipite pentru o bună perioadă de timp. În exemplul nostru. unii fabricanţi reproiectează arhitectura plăcii folosind un design propriu sau unul împrumutat de la alte modele. dacă ele sunt dotate cu radiatoare. placa atinge frecvenţe de peste 450 MHz pentru chip şi de peste 700 MHz în cazul memoriei.. după o perioadă de uzură. • eficienţa ventilatorului. Ce îmi trebuie pentru overclocking? „Simplu!” ar spune unii. Totuşi. Puteţi merge mai departe şi să schimbaţi întreg sistemul de răcire cu unul pasiv. Ventilatorul poate fi sau poate deveni. Mai mult. zgomotos şi ineficient. care joacă atât rol de pastă termoconductoare cât şi de adeziv. Acesta din urmă trebuie să fie realizat cu ajutorul unei paste termoconductoare. riscând astfel să pierdeţi garanţia. Răspunsul constă atât în garantarea de către producător a frecvenţelor respective. Aşadar. • prezenţa radiatoarelor pe memorii şi . dacă doriţi ataşarea unor radiatoare. nu avem nici o şansă în overclocking. în ordine: • eficienţa radiatorului. trebuie doar să găsiţi unul care să se potrivească din punct de vedere al dimensiunilor. Înlocuirea lui nu este deosebit de dificilă. pe 8 straturi faţă de 6.

singura limitare fiind cea hardware. 10 MHz sau chiar mai mult.shtm 7 http://www. de exemplu. De asemenea. RivaTuner7. alteori nu.de două ori mai mare. Alte utilitare bune sunt PowerStrip6 (ce are avantajul recunoaşterii unui număr foarte mare de plăci).php?det=911 http://www. deci avem două frecvenţe. Soluţii există din plin. precum cel livrat de RivaTuner sau cel inclus în ATITool.php 110 .techpowerup. De remarcat că memoriile plăcilor din ziua de azi sunt de obicei DDR. Cea mai normală dar mai sigură este folosirea unor drivere modificate (precum sunt cele Omega sau cele soft-modded8. fiind variantele cele mai lente din serie şi producătorul canadian s-a temut că acest lucru ar putea afecta vânzările suratelor mai rapide (de obicei marcate cu sufixul Pro).com/download. unele plăci ATI sunt protejate la overclocking. Pentru plăcile NVIDIA. ATITool permite setarea timing-urilor memoriei. De asemenea.3 După ce ne-am hotărât asupra soft-ului. cu câte 5. Însă tendinţa este de a se elimina aceste limitări. Mai exact. RadLinker nu manifestă deloc problema. cea reală şi cea efectivă . plăcile cu chip-uri precum Radeon 9000. 9200. ele deţinând (după deblocarea opţiunii în cauză. 3.cele mai noi versiuni de Catalyst 5 6 http://downloads. Uneori. fiind vorba până la urmă de o protecţie .php?page=rivatuner 8 http://www.guru3d. Cea mai „hardcore” este rescrierea BIOS-ului cu unul modificat special în acest sens. de exemplu prin intermediul lui NVTweak5) o funcţie de overclocking automat. una presupunând modificarea driverelor (ceea ce presupune recunoaşterea de către utilitar a driverului . 9600 sau 9700 nu permit realizarea overclocking-ului.net/util/ps.după cum bine spunea cineva .Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 Procedura de realizare a overclocking-ului Este necesar cel puţin un utilitar care ori să activeze opţiunile existente în drivere cu privire la acest aspect (dar ascunse din motive lesne de imaginat).com/index. driverele blocând această practică. după bunul plac. 9550. ele pot fi păcălite pentru a afişa mai mult. de departe imposibil de atins în practică. referirea se face de obicei prin cea efectivă. urmează să creştem cele două frecvenţe progresiv. Impedimente posibile: În primul rând. Unele soft-uri de overclocking nu permit decât o plajă de frecvenţe bine determinată. 9500. dar ea este de obicei de ordinul miilor de MHz. RivaTuner permite două metode. la plăcile Radeon invers.„anti-prost”. Motivele sunt evidente: chip-urile enumerate au un potenţial de overclocking foarte ridicat.guru3d. iar pentru plăcile ATI s-au impus RadLinker şi ATITool. O funcţie deosebită a acestuia din urmă este posibilitatea testării apariţiei artefactelor în mod 3D.entechtaiwan. La plăcile cu chip-uri NVIDIA. pe lângă prezenţa funcţiei de overclocking automat. ori să realizeze el însuşi overclocking-ul. ultimele drivere ForceWare ne vin în ajutor.com/softmod/downloads. care nu diferă de cele originale decât prin absenţa protecţiei sus-amintite). sunt disponibile patch-uri anti-protecţie.

Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 s-ar putea să nu fie recunoscute). 111 . ATITool deţine şi el o funcţie în acest sens. iar cealaltă modificând o locaţie de memorie în care este stocată informaţia despre protecţie. aşa cum se poate vedea în imagine.

rezultând exact 3 MB. O rezoluţie de 1024x768 de pixeli cu adâncimea de culoare de 32 de biţi ocupă 3 MB de memorie video. Memoria grafică este scrisă atunci când este nevoie. dar practica a demonstrat că o operaţie de scriere de informaţii noi într-o memorie care nu funcţionează corect produce mult mai multe erori decât o operaţie de reîmprospătare a informaţiilor deja existente. am setat 350 MHz. Practic. ea rulând în mod implicit la 200 MHz şi oferind un potenţial de overclocking de 250 MHz. memoria video nu reţine instrucţiuni ci informaţii grafice (de exemplu culorile pixelilor). adică 32/8=4 bytes.. Artefactele sunt elemente parazite de imagine. adică 786432 de pixeli. Aşadar. acum 112 . Acum. urmând o avalanşă de rezultate false care culminează rapid cu blocări. o imagine coruptă e coruptă din nou şi din nou. înmulţim această valoare cu numărul de bytes necesari pentru memorarea unui pixel. artefactele fiind astfel mult mai puţine. În caz contrar. aceasta pentru că fiecare pixel al imaginii pe care o aveţi acum în faţă trebuie stocat în memoria plăcii grafice. apelând la aceeaşi logică intuitivă. Pe cât posibil fără acţiuni ireversibile. Cum avem 1024x768. care să ne golească buzunarele sau să ne pună în valoare talentul de convingere a vânzătorului că „nu eu sunt de vină!!!”. Cealaltă fereastră nu a fost clintită din loc. De aceea.e normal. În imagine de mai jos avem o placă grafică a cărei memorie tocmai a fost supusă unui overclocking dur. drept pentru care am fost întâmpinaţi de efectele care să văd.4 Când şi cum apar artefactele? În domeniul overclocking-ului. ea păstrează informaţiile scrise anterior în aceasta. de aceea pe lângă a gândi trebuie să existe şi a experimenta. Anumite chip-uri care o alcătuiesc pot fi mai sensibile sau numai anumiţi tranzistori dintr-un chip pot ceda.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 3. putem să ne dăm seama că nu toată memoria unei plăci este la fel de rezistentă la overclocking. Concluzia care trebuie trasă este că o primă verificare a rezultatului unui overclocking este mişcarea puternică a unei ferestre. ca orice memorie de tip DRAM. similare celor petrecute în cazul procesorului sau a memoriei sistemului. totul trebuie în primul rând gândit. E drept că memoria. E drept. este clar că cei 3 MB pe care îi privim în mod obişnuit nu pot garanta funcţionarea corectă a memoriei la o anumită frecvenţă. cu atât artefactele creşteau .. este vorba de „rateuri” ale unor operaţii. este cazul să creştem rezoluţia. Cea mai mare valoare ce poată fi atinsă cu monitoarele obişnuite este de 2048x1536. oricât de mult am agita ferestrele. trebuie reîmprospătată periodic. Cu cât mişcam mai mult fereastra. Fereastra utilitarului ATITool am mişcat-o puternic. Dacă în cazul memoriei de sistem un bit greşit transformă (de cele mai multe ori) o instrucţiune în alta. Ei bine. care o deteriorează progresiv odată cu creşterea frecvenţei sau (în mai mică măsură) a temperaturii. nu totul este logic (cel puţin conform standardelor noastre ale logicii). memoria plăcii necesitând o rescriere repetată.

Vom seta atât o rezoluţie mare cât şi o setare cât mai înaltă de FSAA. să fie ocupată. sau cea mai mare parte din ea. mai ales că respectivele utilitare folosesc o zonă mică de memorie pe care o testează. dacă avem răbdare. mergând până la a rula 3DMark 2000 sau Quake3 în 1600x1200 cu FSAA maxim sau. Pentru a afla cât mai exact frecvenţa maximă de funcţionare. cu ochii zgâiţi în 113 .Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 având ocupaţi 12 MB. dacă se poate. De asemenea. nivelul de detalii al texturilor reglabil din joc are un rol esenţial în ocuparea unei cantităţi mai mari de memorie video. dar nu strică o încercare înainte de a trece la pasul următor. vom folosi teste/jocuri mai vechi. Dacă placa este suficient de lentă pentru a nu putea randa jocuri sau teste noi. Nu ne rămâne decât să petrecem ceva timp în jocuri sau. Total insuficienţi. 2048x1536. Atât Artifact Tester cât mai ales ATITool pot detecta erorile ce apar datorită overclocking-ului. Însă nici un soft nu poate înlocui testele de ore sau zile petrecute în compania jocurilor preferate. trebuie să facem în aşa fel încât toată memoria.

sub care pot apărea (în caz că stabilitatea se menţine) scăderi de performanţă în lucrul 2D! Să exemplificăm. este destul de probabil să nu găsim niciodată. apar şi blocaje. e posibil să avem în acest caz false probleme datorate inerţiei termice. setate la 310 MHz. va trebui să lăsăm placa la frecvenţe mici pentru a se răci. dacă după 10 minute de teste nu am găsit nimic. 250 MHz maxim). eventual până la următoarea închidere/deschidere a sistemului. dacă alegem o frecvenţă mare la care avem probleme. eventual vom face o pauză de cafea şi ne vom uita la telenovela preferată în timp ce calculatorul stă închis. după care o coborâm. De cele mai multe ori. Lucru valabil şi pentru overclocking-ul GPU-ului. la plăcile mai fierbinţi. Odată cu creşterea rezoluţiei şi cu setarea FSAA. blocaje sau alte probleme. Nu trebuie reacţionat nici în sens invers: o frecvenţă prea redusă (setată temporar pentru răcire sau pentru că pur şi simplu nu avem nevoie de 3D şi ne dorim o placă rece) poate genera artefacte. De asemenea. artefactele au crescut în intensitate. sunt cazuri în care un overclocking prea dur la memorie duce la persistenţa artefactelor până la următorul restart. Încă un aspect important: deseori. În cazuri extreme.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 3DMark şi să căutăm artefacte. În general. Iată nişte artefacte uşoare (câţiva pixeli de pe cer coloraţi eronat) obţinute cu aceeaşi memorie ca în testul anterior (200 MHz implicit. o valoare minimă sigură este cea de 150 MHz (300 MHz DDR). Aşadar. rezultând această imagine 114 .

următorul cadru fiind afişat corect sau cu alte erori de imagine. am obţinut un talmeş-balmeş total. Mergând până la capăt (prin setarea frecvenţei de 350 MHz). memoria video refiind umplută cu informaţie şi alţi biţi fiind înregistraţi greşit. De subliniat că aceste imagini sunt nişte instantanee. 115 . rezultând aberaţia în cauză.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 în care doar partea de sus a fost randată corect. Probabil nişte biţi „cheie” (în funcţie de care se decidea randarea completă a scenei) au fost distruşi.

spune că în 99% din situaţii artefactele apar de la memorie. Şi în cazul plăcilor NVIDIA. nişte artefacte generate de GPU. GPU-ul generând în primul rând blocaje. totuşi. aşadar cum ne dăm seama cine e de vină? O primă regulă. Iată. Din alte unghiuri.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 Nu trebuie omis faptul că anumite drivere cauzează în unele jocuri fenomene asemănătoare cu artefactele. Graţie lui VPU Recover. de cele mai multe ori fiind vorba de texturi ce par să lipsească din locul în care ar trebui să se afle sau de iluminări incorecte. dând o şansă recuperării sesiunii curente de Windows. Uneori problemele ţin de joc şi nu de driverul plăcii grafice. 116 . După cum am mai spus. neexistând nici un blocaj complet. de multe ori apăsarea Ctrl+Alt+Del „dezgheaţă” core-ul plăcii. Motivul este incompatibilitatea dintre ultimele drivere şi un joc apărut cu mulţi ani în urmă. plăcile ATI beneficiază de posibilitatea ca în momentul apariţiei unei erori să fie repuse frecvenţele implicite. alteori chiar şi driverele plăcii de bază joacă un rol. ce foloseşte experimental modul OpenGL. Aceasta în teorie. ea este văzută corect. la fel de empirică precum toate din acest capitol. atât GPU-ul cât şi memoria pot genera artefacte. Iată cum arată textura podelei din Unreal Tournament pe unele plăci ATI cu ultimele drivere Catalyst dacă jocul este setat să ruleze prin OpenGL. fără acele pete.

poate testul de scanare a artefactelor oferit de ATITool.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 3 Observăm cei doi „munţi” triunghiulari care nu au ce căuta în scenă. dar care funcţionează doar pe anumite plăci). 117 . fiind primul test de stabilitate care trebuie luat în seamă (pe lângă. fiind trataţi ca nişte obiecte reale ale scenei. el solicită la maxim chip-ul grafic. Deşi bazat doar pe DirectX 7. nu strică lăsat o noapte întreagă un test precum 3DMark în modul loop. Chip-ul grafic i-a „inventat” din cauza unei erori cauzate de frecvenţele prea ridicate. După toate setările efectuate. se poate spune că overclocking-ul a reuşit. Spre deosebire de artefactele de memorie. Dacă dimineaţă găsiţi demo-ul rulând fără probleme. Un test foarte stresant pentru GPU este Wings of Fury din 3DMark03. ei nu au fost nişte instantanee ci au rămas în scenă până când au ieşit din cadru.

Cathode Ray Tube). Pe de altă parte. Nimic mai adevărat. chiar dacă ştim sau nu să interpretăm ceea ce ne "spun" (afişajele electro-mecanice de la autobuze care indică linia. În 2006 se aştepta lansarea pe piaţă a display-urilor SED. Iniţial.1 Generalităţi În plină eră a dezvoltării tehnologiei informaţiei. LCD. care vor revoluţiona în viitorul deloc îndepărtat viaţa oamenilor. 118 . Este dovedit faptul că informaţia se reţine cel mai bine atunci când o receptăm vizual. DLP.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 4 Evaluarea display-urilor 4. Ecranele de tip "flat panel" cuprind o varietate largă de tipuri constructive şi tehnologice. începând cu luna noiembrie 2005. Vom aborda în acest seminar noile tehnologii şi tendinţe ce se manifestă în privinţa display-urilor. acestea au fost proiectate pentru utilizarea în cadrul laptopurilor. Clasificându-le după tipul de refresh pe care îl necesită. LCOS şi OLED. daca nu chiar un computer şi o legătura la Internet. persoana care doreşte să "ţină pasul" cu vremurile trebuie să se "echipeze" cu cel puţin un televizor. dar caracteristicile şi avantajele lor le-au propulsat în faţa ecranelor clasice cu tub catodic (CRT . Ecranele FED şi NED sunt doar în faza de prototip. avem: Display-uri cu refresh continuu: • LCD (Liquid Crystal Display) • Plasma • DLP (Digital Light Processing) • LCOS (Liquid Crystal On Silicon) • OLED (Organic Light-Emitting Diode) • ED (Surface-conduction Electron-emitter Display) • FED (Field Emission Display) • NED (Nano-Emissive Display) • • • Display-uri bistabile (hârtie electronică): e-ink Gyricon Magink Dintre toate tipurile de display-uri "flat-panel" enumerate sunt disponibile comercial doar ecranele cu plasmă. Nu ne vom referi la toate dispozitivele de afişare a informaţiilor existente peste tot în jurul nostru. Este destul de greu să oferim o definiţie riguroasă pentru display-urile de tip "flat panel".). în domeniul tehnologiei informaţiei. display-urile încorporate în aparatura medicală etc.. Ne vom limita la categoria ecranelor de tip "flat panel". Vom trece în continuare în revistă câteva detalii despre fiecare dintre aceste tehnologii. se spune că o imagine face cât o mie de cuvinte. dar nu cred că există vreo persoană care să nu fi văzut măcar o dată în viaţă un astfel de ecran.

Dacă se aplică un curent electric prin această plasmă. Totuşi. progresul tehnologic aduce cu sine şi reducerea preţurilor. fapt ce determină excitarea atomilor de gaz din plasmă. cu atât pixelul va fi mai luminos. Trebuie spus ca un display cu plasmă consumă la fel de mult curent electric ca şi unul cu tub catodic. Deocamdată. se eliberează fotoni de energie în spaţiu. o lentilă de proiecţie şi ecranul propriu-zis. în principal. dar aşa cum se întâmplă în industria IT. gazul este alcătuit în principal din particule neîncărcate cu vreo sarcină. însă. ecranele OLED se întâlnesc în cazul unor MP3-playere (ex.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 PLASMA Un display cu plasmă este un ecran flat-panel în care lumina este creată de particule fosforescente care sunt excitate de o descărcare de plasmă între două suprafeţe plate de sticlă. preţul este destul de restrictiv. Dlp Digital Light Processing este o tehnologie dezvoltată de compania Texas Instruments. pentru un 119 . un gaz alcătuit din ioni şi electroni care "plutesc" liber. ele sunt aliniate la orizontală şi determină apariţia pixelilor negri pe ecran. acesta fiind în continuare singurul producător al acestor ecrane. Elementul de bază al unui afişaj OLED este luminoforul organic. ce reprezintă aceasta "plasmă"? Elementul central dintr-o lumină fluorescentă este plasma. Fiecare pixel de lumină de pe ecran este roşu. Oled Un display OLED funcţionează pe baza principiului electroluminiscenţei. Oglinzile se pot poziţiona în două feluri: atunci când sunt "oprite". Procesorul sistemului sincronizează roata de culoare cu oglinzile. astfel că este foarte posibil ca display-urile cu plasmă să înlocuiască vechile ecrane cu tuburi catodice. verde sau albastru la orice moment de timp. verzi şi albastre (RGB) care se învârteşte. care este de fapt o roată transparentă cu segmente roşii. Tehnologia se bazează pe capabilitatea ochiului uman de a amesteca culorile pixelilor pentru a forma culoarea corespunzătoare imaginii. Lumina care trece prin fiecare secţiune îşi schimbă culoarea în mod corespunzător. În această învălmăşeală. Cu cât o oglindă este mai mult pe poziţia de "pornit". Însă. Fiecare oglindă reprezintă un pixel din imaginea reconstituită. oglinzile încep să se mişte înainte şi înapoi de câteva mii de ori pe secundă. când cineva porneşte sistemul. În condiţii normale.: Samsung). dintr-o sursă de lumina albă. Philips) şi a unor modele de telefoane mobile (ex. Un display DLP se compune. particulele se ciocnesc în mod constant unele de altele. cunoscut şi sub numele de Digital Micromirror Device (DMD). care determină aproape toţi parametrii pixelului de pe ecran. Culoarea este adăugată prin intermediul unei "roti de culoare" (color wheel). Descărcarea gazoasă conţine un amestec total inofensiv de neon şi xenon. particulele încărcate negativ sunt atrase de partea încărcată pozitiv a plasmei şi invers. Display-urile de acest tip au fost lansate pe piaţă pentru prima data în 1997 de compania Pioneer şi au ajuns să fie preferate în momentul de faţă în cadrul televiziunii de înaltă definiţie (HDTV). luând naştere lumina fluorescentă. raportat la aceeaşi suprafaţă a ecranului. Nu vom intra în amănunte constructive. Imaginea este creată de mici oglinzi microscopice dispuse într-o matrice pe un cip din material semiconductor. Acesta este mecanismul de creare a nuanţelor de gri.: Apple iPod. De exemplu. un cip DMD. Astfel. Ele reflectă lumina printr-o lentilă de proiecţie direct pe ecran. Pe piaţa din România.

Pe plan local. problema efectului de curcubeu din cazul DLP a fost rezolvată la display-urile LCOS. Apoi. aceste raze vin în contact cu cele trei microdispozitive LCOS. Aceasta presupune că display-urile SED vor combina aspectul şi dimensiunile ecranelor LCD cu ratele mari de contrast. verde şi albastru. Astfel. intensitatea acestuia variază de la om la om. Este asemănătoare cu tehnologia reflectivă folosita în cazul DLP şi foloseşte cristale lichide în locul oglinzilor individuale. ignorând segmentul albastru. O bilă neagră pentru aceasta tehnologie este efectul de curcubeu. Foarte similare cu CRT-urile. G (verde) şi B (albastru).Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 galben. SED Surface-conduction Electron-emitter Display este o tehnologie de afişare "flat panel" care foloseşte emiţători de electroni de conducţie superficială pentru fiecare pixel. un display DLP este capabil sa "creeze" 16 milioane de culori. producătorul reprezentat în România cel mai bine fiind Canon. precum şi dimensiunile destul de mari în comparaţie cu ecranele LCD sau cele cu plasmă.lipsa capabilităţii de producere a culorii negre. Totuşi. ele utilizează o reţea de 120 . pentru eliminarea lui folosindu-se roţi de culoare care se rotesc cu viteze mai mari şi cu mai multe segmente colorate. FED-urile au însă doar câţiva milimetri grosime. Toshiba şi Canon au anunţat un acord de colaborare având ca scop producţia în scop comercial a display-urilor SED până la sfârşitul anului 2005. Trebuie spus că exista şi display-uri DLP care folosesc trei surse de lumină. deasupra. LCOS Liquid Crystal on Silicon este o tehnologie "micro-display" aplicată în general în cazul televizoarelor cu proiecţie. care măreşte imaginea şi o afişează pe ecran. acelaşi principiu de bază prezent şi în cazul ecranelor cu tuburi catodice. Funcţionare: pe scurt. lumina albă emisă de sursă este trecută printr-o lentilă de condensare care o focalizează şi o direcţionează spre un separator. dintre care unul reflectiv şi. Lumina reflectată de acestea este trecută printr-o prismă care combină cele trei culori. aceasta direcţionând şi raza printr-o lentilă de proiecţie. refresh-ul şi calitatea superioară a imaginii întâlnite la CRT-uri. ceea ce duce automat la un contrast scăzut. Mişcarea oglinzilor este înlocuită în acest caz cu starea de polarizare a cristalelor lichide. iar în locul folosirii unui singur tun de electroni. Se elimină astfel roata de culori şi efectul de curcubeu şi se creste calitatea imaginii. Desigur. Aceştia emit electroni care excită un strat de fosfor de pe panoul de afişaj. FED Field Emission Display este un tip de display "flat panel" care foloseşte straturi de fosfor ca medii de emisie. acest tip de display a început să pătrundă timid. care transformă raza de lumină albă în trei raze corespunzătoare celor trei culori principale: roşu. colorate fiecare în cate una dintre culorile de baza: R (rosu). Inventatorul acestei tehnologii este indianul Harjinder Kamboja. Un microdispozitiv LCOS este alcătuit din mai multe straturi. Acestea îşi schimbă orientarea la aplicarea unui curent electric. un strat de cristale lichide. permiţând reflectarea luminii sau blocând-o. dar se pare că primele ecrane SED vor fi disponibile totuşi din 2006. care apare tocmai datorită mecanismului vizual de amestecare a culorilor. Câteva dintre dezavantajele acestor sisteme includ: . DMD va reflecta lumina de la segmentele roşii şi cele verzi ale roţii de culoare.

• forma plată a ecranului ce elimină distorsiunile (deşi există şi ecrane CRT plate). Cine s-ar fi gândit acum mulţi ani că vom putea folosi hârtia ca un ecran? Ei bine. Aplicaţiile în care se va dovedi cu siguranţă utilă includ cărţile electronice. Hârtia electronică este. capabile să stocheze versiuni digitale ale multor opere. care sunt cele mai eficiente emiţătoare de electroni cunoscute vreodată). Sony a anunţat de curând disponibilitatea pe piaţa a modelului Sony Reader. mai uşoare şi mai flexibile decât straturile cristaline dintr-un LED sau LCD. Punctul cheie este abilitatea celor de la Motorola de a "produce" nanotuburi de carbon direct pe substratul de sticlă al ecranului. Spre deosebire de ecranele "flat panel" care folosesc o sursă de lumină pentru a ilumina pixelii. Avantajele ecranelor flat-panel fata de cele cu tub catodic: • dimensiuni mai mici. de asemenea. are o luminozitate puternică şi se încadrează cu uniformitatea şi puritatea culorilor în standardele unui produs comercial. hârtie electronică sau e-paper) este o tehnologie de afişare proiectată să "imite" cerneala obişnuita pe hârtie. dezvoltând-o pentru scopurile proprii. un succesor al lui LIBRIe. Cerneala electronică (cunoscută şi sub denumirea de e-ink. hârtia electronică reflectă lumina ca o hârtie obişnuita şi este capabilă să stocheze text şi imagini un timp indefinit fără să consume electricitate sau să folosească putere de procesare. Avantajele şi dezavantajele display-urilor OLED AVANTAJE: straturile organice şi de plastic ale unui OLED sunt mai subţiri. NED Nano-Emissive Display are la bază tot principiul tubului catodic. În trecut. Şi datorită faptului că reflectă lumina. ea poate fi citită din orice unghi. Acestea sunt necesare doar pentru a schimba sau a şterge imaginea. Posterele electronice şi materialele publicitare în magazine şi pe drumuri au fost deja demonstrate. Prototipul poate reda toate culorile spectrului. dar calitatea afişajului era dezamăgitoare. display-urile OLED sunt mai luminoase decât cele LCD datorită faptului că suportul de sticlă necesar acestora din urmă absoarbe o oarecare cantitate de lumină. mai uşoară. mai durabilă şi mult mai flexibilă decât alte tehnologii de afişare. în momentul de faţă. 121 • • • . disponibilă pe piaţă. aceste nanotuburi erau lipite sau imprimate pe o suprafaţă. Prototipul testat public de Motorola în 2005 este un tub catodic subţire şi plat cu mii de tunuri de electroni la fiecare pixel. • consum redus de energie. cu o singură carte afişată pe pagini la un moment dat. prima încercare datează încă din anii '70 şi a fost realizată de specialiştii de la centrul de cercetare Xerox din Palo Alto. denumite şi nanotuburi de carbon. Hârtia electronică Fără îndoială.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 vârfuri metalice fine. substratul unui dispozitiv OLED poate fi flexibil. • luminozitate mai bună. care foloseşte tehnologie de hârtie electronică dezvoltată de Philips. În anii '90 şi alte companii au îmbrăţişat aceasta tehnologie. aceasta este cea mai spectaculoasă tehnologie care a apărut în ultimii ani şi care este.

S-a ajuns astfel la soluţia aplicării unui tranzistor fiecărui pixel.000 de ore. pentru că necesită milioane de conexiuni . fapt ce duce la o durată de viaţă mai mare decât în cazul CRT sau a Plasmelor.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 • • • • • • nu este necesară o iluminare din spate a ecranului. ceea ce este mult prea puţin pentru cerinţele actuale. adâncime a culorii bună. astfel încât nu sunt activaşi complet li tind sp fie mai puţin luminoşi. verde şi albastru) a fiecărui pixel Pentru a rezolva această problemă. Fiecare pixel este un mic condensator cu un strat transparent de oxid în faţă. pentru că le afectează funcţionalitatea. Dacă pe toţi pixelii de pe un rând este aplicată o tensiune pozitivă şi dacă pe toţi pixelii de pe o coloană este aplicată o tensiune negativă. de aproximativ 170 de grade. DEZAVANTAJE: efectul de curcubeu. atunci pixelul de la intersecţia liniei cu coloana are cea mai mare tensiune aplicată şi este activat.se poate aplica o tensiune peste un segment fără a interfera cu celelalte segmente ale ecranului. chiar şi în mărimi mari.câte două pentru fiecare culoare primară (roşu. apa constituie un pericol pentru ecranele OLED. dar toată structura este realizată pe sticlă. fapt ce reduce numărul de conexiuni până la ordinul miilor. Însă şi aici există o problemă . unghiuri de vizualizare foarte bune. Avantajele şi dezavantajele ecranelor DLP AVANTAJE: imagini clare. 122 . zgomotul ventilatorului de răcire. elementele OLED generând ele însele lumina. lipsite de jitter (interferenţe). grosime mai mică decât a ecranelor CRT. Layout-ul circuitului este foarte similar aceluia folosit în cazul memoriei DRAM. procesul de fabricaţie este încă destul de costisitor. grosime mai mare decât în cazul LCD sau a ecranelor cu plasmă.2 Testarea Diplay-urilor TFT LCD Ecranele cu cristale lichide normale. sursa de lumină poate fi schimbată. DEZAVANTAJE: durata de viata a elementelor albastre OLED este în acest moment de numai 1. Această soluţie nu este practică pentru un display de dimensiuni mari (cu mulţi pixeli). pixelii sunt adresaţi pe linii şi coloane.toţi pixelii de pe aceeaşi coloana şi de pe aceeaşi linie sunt 'excitaţi" cu o fracţiune din tensiunea aplicată. precum cele întâlnite în cazul calculatoarelor de buzunar. conţin elemente de imagine separate . fabricarea ecranelor OLED este mai uşoară. care permite controlul individual. • • • • • • • 4. un strat transparent în spate şi un strat izolator de cristale lichide între acestea.

Toate tipurile de monitoare TFT moderne sunt "lăudate" cu parametri foarte buni. display-urile LCD sunt de obicei specializate pe câte una dintre aplicaţiile enumerate.2. De exemplu.1 Procedura de testare a monitoarelor LCD Testul de monitoare LCD se desfăşoară după o metodologie în care se urmăreşte testarea efectivă a aspectelor cele mai importante funcţionale ale unui astfel de dispozitiv.acestea sunt cauzate de sensibilitatea monitorului la radiaţiile electromagnetice din exterior. • existenţa unor defecte de convergenţă a ecranului atunci când se aplică diverse mire de verificare. 4. • claritatea imaginii . dacă pe cineva nu-l interesează capitolul ergonomie. aplicaţii office şi procesare de imagini.2. numărul producătorilor de astfel de ecrane nu este prea mare. • interferenţele care apar şi intensitatea lor .Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 Datorită costului imens al fabricilor TFT. s-au punctat trei lucruri: • testul propriu propriu-zis de calitate a imaginii (60%). orice persoană care şi-a stabilit priorităţile cu privire la un monitor LCD (aspectele care contează mai mult) se poate ghida după acestea. • ergonomia (10%). • persistenta pixelilor . • existenţa efectului de zooming . Calitatea imaginii a fost apreciată folosind programele Nokia Monitor Test 2. Astfel. 123 . Numeroasele convenţii şi simplificări introduse în procesul de evaluare au un rol crucial de multe ori. Aspectele punctate au fost: • existenţa şi intensitatea efectului de Moire (apariţia unor interferenţe supărătoare în cazul dungilor foarte subţiri sau a caroiajelor foarte fine) la aplicarea din program a unor modele cu dungi subţiri verticale şi orizontale.0 şi Monitor Test 2. aprecierea din această lucrare fiind una globală. În timp ce monitoarele CRT de înaltă calitate pot fi utilizate pentru jocuri.semnifică mişcarea spre margine a unui cadru alb pe fond negru la aplicarea unui fond alb în interiorul cadrului. concluzia testelor este clară .un monitor TFT ar trebui să ofere o imagine foarte clară în aproape orice condiţii. Din adunarea acestor note (cu ponderile corespunzătoare) obţinându-se scorul final.se poate aprecia aproximativ timpul de reacţie al monitorului la mişcarea unor pătrate albe pe fond negru cu diferite viteze. Per ansamblu.nu există un monitor LCD "all-purpose" (care poate fi folosit cu succes în orice împrejurare). însă metodele de măsurare permit producătorilor să-şi prezinte produsul în cea mai bună lumină. poate să verifice scorurile de la primele doua categorii şi să decidă modelul pe care eventual doreşte să-l achiziţioneze. • caracteristicile tehnice (30%) şi. dar şi un trailer al unui film cunoscut. pentru a putea vedea comportarea monitoarelor în cazul secvenţelor video foarte dinamice şi claritatea acestora. După cum vom observa.

cu cât contrastul este mai mare. cu atât imaginea va fi mai clară luminozitatea fiecărui model de monitor . • conectivitate cât mai variată. cu atât este mai asemănător. • luminozitate mare . Dacă filmele sunt preferatele casei şi doriţi să le vizionaţi în cel mai bun mod posibil. • timp de răspuns acceptabil . camere video etc. pentru a creşte gradul de confort al utilizatorului. 124 . Doriţi să vă uitaţi mai mult la filme? Sau vreţi să încercaţi ultimele jocuri lansate? Lucraţi mai mult la birou în aplicaţii office? În funcţie de răspunsurile la aceste întrebări veţi putea alege monitorul LCD potrivit pentru nevoile dv. de asemenea.cu cât se apropie de valoarea de 180 de grade. ERGONOMIA În fine. • dimensiuni şi greutate. • eventual modul de tuner TV încorporat . s-au luat în calcul doar standardele TCO. Ar trebui să se poată ajusta înălţimea şi să se rotească suportul. el determinând în mare măsura comportarea monitorului în diverse aplicaţii. certificarea internaţională .2 Cum să alegem un monitor Dacă v-aţi hotărât să achiziţionaţi un monitor.2. rata de contrast a monitorului .în ziua de astăzi. acesta este un capitol din ce în ce mai important pentru unii utilizatori.cel puţin 19 inci (aproximativ 48 cm).pentru a vă fixa monitorul în poziţia cea mai bună pentru dv.cel mult 12 ms.exprimă ce standarde de protecţie împotriva radiaţiilor respectă fiecare monitor. ar trebui să vă gândiţi înainte cu ce tip de aplicaţii îl veţi folosi. • posibilitatea rotirii suportului.cel puţin 600:1.. care este definit ca fiind timpul de aprindere şi de stingere al unui pixel de la negru la alb şi înapoi la negru.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 • • • • • • Caracteristicile tehnice punctate au fost: timpul de răspuns al monitorului. • ergonomie bună . un simplu conector VGA analog (D-Sub) nu este de ajuns pentru a profita din plin de capabilităţile de procesare a plăcii video şi de calitatea imaginii ce poate fi afişată de monitor. unghiul de vizualizare . • rata de contrast mare . Acest timp este foarte important.cel puţin 330 cd/m2. trebuie să vă orientaţi după monitoare LCD cu: • diagonala mare . conectivitatea . calitatea imaginii.pentru a putea viziona şi filmele transmise de posturile de televiziune. pentru a putea conecta eventual şi camere foto digitale.exprimă nivelul de lumină emis de monitor şi influenţează. 4. Iată în continuare un mic "îndrumar".exprimă în ce măsură un obiect poate fi distins faţă de un alt obiect din fundal. Notarea aspectelor care ţin de ergonomie s-a făcut după: • posibilitatea ajustării ecranului în înălţime. • posibilitatea pivotării ecranului (rotire la 90 de grade sau chiar mai mult). din acest punct de vedere. cu monitoarele clasice CRT.

Bineînţeles. pentru cei care lucrează mai mult cu aplicaţii office şi navighează pe Internet. În fine. este de la sine înţeles că toate aceste caracteristici trebuie să fie însoţite de o calitate cât mai bună a imaginii. Dacă nu.TCO 03. • ergonomie bună .pivotarea la 90 de grade este foarte utilă mai ales în cazul editoarelor de texte.TCO 03. telefoane mobile. 125 . recomandăm monitoarele TFT cu: • certificare internaţională cât mai bună . • rata de contrast mare . orientativ.cel mult 8 ms.cel puţin 600:1. dacă acest lucru este posibil. • certificare internaţională cât mai bună . • porturi USB încorporate (eventual). • luminozitate mare . video.cel puţin 330 cd/m2. următoarele caracteristici: • timp de răspuns mic . pentru un acces mai comod şi mai rapid la diversele echipamente ce se pot conecta prin intermediul acestor porturi (camere foto. stick-uri de memorie etc. măcar o privire individuală asupra modelului la care v-aţi hotărât. aşa ca atunci când îl cumpăraţi este bine să aruncaţi o privire comparativă asupra monitoarelor expuse în stand.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 4 Pasionaţii de jocuri PC ar trebui să se uite în primul rând la monitoarele care au..

ATENŢIE : Autorul acestui seminar nu se face responsabil pentru orice pagubă. Noţiunea de overclock apare de fapt încă din procesul de producţie al procesoarelor. trebuie să înţelegem cum este generată frecvenţa procesorului. şi personal chiar cred acest lucru. nu în procesor. little help?". se lasă un spaţiu de siguranţă pentru ca acestea să funcţioneze corect şi în condiţii extreme.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 5 5 Metodologia de realizare a overclocking-ului la procesoarele Intel Introducere Overclockingul reprezintă procedeul prin care o componentă hardware este forţată să funcţioneze peste parametrii daţi de producător. pierdere de date sau orice alte inconveniente produse sistemului dvs. Vă mulţumesc pentru înţelegere. Pentru a face un overclock bun la Intel. folosind tehnicile prezentate aici. asamblate şi testate. Un asemenea procesor trebuie sa ruleze fără probleme minim 10 ani. de exemplu creşterea frecvenţei de tact procesorului fără ca acest lucru să ducă la instabilitatea sistemului. În ultima vreme. Ca o paranteză se poate spune că odată cu dezvoltarea tehnicii în domeniul semiconductorilor. mulţi utilizatori doresc să-şi overclockeze procesorul dar nu au suficiente cunoştinţe în acest domeniu şi din acest motiv apar foarte des topic-uri de genul "Overclock. În momentul în care acestea sunt testate se stabileşte frecvenţa de lucru a fiecărui procesor astfel încât acesta să ruleze corect chiar şi în condiţii în care nu se asigură o răcire corespunzătoare ori tensiunea de alimentare nu este stabilă. În aceste condiţii concluzia este clară. Aceasta este o magistrală care conectează procesorul de memorii prin intermediul northbridge-ului (în care se află controllerul de memorie). motivele sunt multe dar se pare că cel mai important dintre ele ar fi diferenţa de preţ care trebuie să se justifice prin calităţile procesorului în special prin frecvenţa la care rulează acesta. deci pentru cei obişnuiţi cu vechea magistrala FSB am o veste bună: Intel a păstrat-o. prima treapta în fabricarea unui procesor este wafer-ul (un disc subţire din siliciu) pe care se aplică structurile care determina configuraţia viitoarelor procesoare. din acest motiv producătorii marchează frecventa la care chipul a funcţionat bine în condiţiile date mai sus. overclock-ul este o practică tot mai des întâlnită. unii zic că deja a devenit un sport naţional. 5. După cum vă imaginaţi pe un wafer se află procesoare care în ciudata faptului că au aceeaşi structură pot rula la frecvenţe diferite fără să duca la instabilitatea sistemului. astfel că pe un asemenea wafer se delimitează mai multe chipuri a căror frecvenţă nu se cunoaşte până în momentul în care sunt separate. apoi 133 la Northwood 126 5. chipurile nu sunt marcate cu frecvenţa maximă la care pot funcţiona fără probleme.1 . Datorită acestui fapt. Frecventa FSB-ului este de 100Mhz la primele pentium4. Ea este obţinută prin înmulţirea frecvenţei FSB-ului cu multiplicatorul procesorului.2 FSB la Intel Spre deosebire de Athlon64. producătorii de procesoare blochează posibilităţile utilizatorilor de a obţine frecvenţe mai mari decât cele înscrise pe procesoare. Intel a păstrat controllerul de memorie în cipset.

Frecvenţa FSB-ului se incrementează în paşi mici (din 5 în 5 Mhz e bine) şi de fiecare dată când aţi urcat câte o treaptă. care este quad-pumped adică trimite date de 4 ori într-un ciclu de ceas şi de aici frecvenţa efectivă este de 4 ori mai mare: 400 pentru fsb real de 100. Diferenţa majoră dintre Intel şi AMD64 este că la AMD64 frecvenţa procesorului se împărţea cu un anumit divizor pentru a obţine frecventa memoriilor. Frecventa memoriilor. de ex: Prime95. salvaţi setarea. Frecvenţa asta mică este frecvenţa reală a FSB-ului. ci frecventa FSB este cea care determină frecvenţa memoriilor şi divizorii (de fapt sunt nişte raporturi) se aplica la FSB. 800 pentru fsb real de 200 şi aşa mai departe.3 127 . deci 400Mhz frecvenţa efectivă. În funcţie de ce memorii dispuneţi şi de cât de mult suportă ele frecvenţa peste stock. Nu se lucrează cu 1066 ci cu frecvenţa reală adică 1066/4~266Mhz. dacă aveţi procesor Core 2 Duo dezactivaţi toate opţiunile de la CPU. şi PCI-Express. fiind double-pumped vor rula ~533Mhz. altfel veţi fi puternic limitat în overclock de ele. Overclock-ul la Intel se face de cele mai multe ori prin ridicarea frecvenţei FSB-ului. SuperPI. în momentul ridicării frecvenţei FSB-ului va creşte şi frecvenţa memoriilor. cum ar fi cea a memoriilor (tratata mai jos). de 200 la Prescott şi la Core 2 Duo 4300 şi de 266 la Core 2 Duo. paşii care trebuie urmaţi fiind uşori. S&M. cea PCI. în general. Valorile stock sunt urmatoarele: 33Mhz pt PCI. spre deosebire de AMD64. 5. AGP. Desigur placa de baza nu permite să setaţi chiar orice valoare la divizori deci din acest punct de vedere avem un dezavantaj. deoarece multiplicatorul este aproape întotdeauna blocat din fabrică. În primul rând. dar spre deosebire de AMD. dar la Intel frecvenţa procesorului nu are nimic de-a face direct cu frecvenţa memoriilor. 66Mhz pt AGP. Acum poate o să vă întrebaţi un lucru: Cum are Core 2 duo numai 266 că eu ştiu că are 1066. StressPrime2004. astfel că 200*15=3000. De ex să luăm un procesor cu FSB de 1066Mhz. De ex: un Prescott la 3000Mhz are fsb real de 200Mhz şi multiplicatorul de 15. memoriile mai rapide nu aduc un spor foarte mare de performanţă. şi testaţi stabilitatea sistemului cu programe speciale de benchmark. mai puţin Execute Disable Bit. dacă dispunem de nişte memorii foarte rapide se va mari lăţimea de bandă între memorii şi northbridge dar acest lucru nu ajută prea mult deoarece între procesor şi northbridge tot mică rămâne. Orthos. Practic tehnica de overclock la Intel este destul de simplă. Din frecvenţa FSB-ului derivă şi celelalte frecvenţe ale sistemului. şi la fel şi Prescott are 800Mhz?. Dacă se foloseţte un raport de FSB:RAM=1:1 atunci ramii. permite rularea memoriilor mai rapid decât FSB-ul prin setarea unui raport supraunitar. frecvenţele acestea trebuie blocate la valorile lor stock. coşmarul divizorilor şi al latentelor Aşa cum am menţionat mai sus. Dacă setam un raport de 4:3 atunci folosind puţina matematică RAM=FSB*3/4 care ne dă RAM~200Mhz. faceţi un calcul şi setaţi divizorii potriviţi pentru ca memoriile să ruleze la frecvenţe stabile. 100Mhz pt PCI-Express şi tot 100Mhz şi pt porturile SATA. dar acest lucru nu aduce mai nimic în plus la performanţă. Dacă placa de bază permite. La generarea frecvenţei procesorului se înmulţeşte frecvenţa reală a FSB-ului nu cea efectivă. De fapt la Intel. deoarece.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 5 (următoarea generaţie de p4) şi la unele Prescott-uri (în special Celeroan).

iar dacă nu le suportă atunci se compromite stabilitatea şi sistemul fie dă Blue Screen. acolo fiecare atlet trebuie să alerge o distanţă şi apoi să predea ştafeta. Una este prin supravoltare şi este tratată pe larg mai jos. Dacă setam unele mai mici atunci s-ar putea să le suporte dacă sunt memorii bune. deci mai importante. Memoriile cele mai de calitate de tip DDR pot funcţiona chiar şi la 2-2-2-5 şi command rate de 1. În momentul în care ridicăm frecvenţa memoriilor peste cea stock şi ele devin instabile sunt 2 metode de a le mări stabilitatea. Dacă setam unele mai mari. ceilalţi aşteaptă după el. Aceasta se referă la numărul minim de cicluri de ceas care trebuie să treacă de la o comandă activă până la una precharge. nu-i nici o problemă.5-3-3-6 sau 2.5 3 3 6 2 DDR normale 2. Pentru aceasta. Mai este şi Command Rate-ul. La memoriile DDR latenţele obişnuite întâlnite la cele mai multe module de memorii sunt 2. Ele nu reprezintă unităţi de timp (nanosecunde sau ceva de genul) ci cicluri de ceas. ele au nişte laţente stock. Cred că este clar. Fiecare atlet aleargă distanţa într-un timp anume. Memoriile DDR2 au latenţe mai mari de genul 5-5-5-12.5 3 3 8 3 DDR best 2 2 2 5 4 DDR2 5 5 5 12 5 DDR2 4 4 4 10 Command Rate 2 2 1 Să vedem acuma ce legătură au latenţele cu overclock-ul. iar ştafeta ajunge la destinaţie. Gândiţivă la cursa cu ştafetă. Active-to-precharge. acesta pleacă fără ştafetă şi tot procesul se duce de râpă.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 5 Ca să înţelegeţi cum să umblaţi cu latentele trebuie întâi să înţelegeţi ce sunt ele de fapt. • RAS precharge (tRP): este timpul din momentul trimiterii unei comenzi precharge pentru a închide un rând şi până în momentul în care următoarea comandă activă poate fi executată. fie nu bootează deloc. Cifrele sunt în ordinea aceasta: CAS. iar cealaltă 128 . RAS-to-CAS. haideţi să facem o analogie cu un concurs de atletism. Memoria este structurată ca o matrice. RAS precharge. Astfel se întâmplă şi la memorii. Latenţele sunt: • CAS (cL): această latenţă se referă la timpul necesar din momentul cererii unei operaţii de citire şi până în momentul în care sunt trimise datele . • RAS-to-CAS (tRCD): această latenţă se referă la timpul care trece din momentul în care un rând este activat şi până când este executată prima operaţie de citire sau scriere . Acesta este timpul din momentul în care un chip este selectat şi până în momentul în care se poate executa prima comanda activă. Sunt patru latenţe mai cunoscute. • Active-to-precharge delay (tRAS): Această latenţă se întinde peste câţiva paşi în activitatea memoriei.5-3-3-8 şi command rate de 2. (cL) (tRCD) (tRP) (tRAS) 1 DDR normale 2. CAS RAS-to-CAS Tip memorie precharge precharge delay crt. Setări uzuale ale latenţelor memoriilor RAS Active-toNr. 4-4-4-10 etc. că cu cât sunt latentele mai mici cu atât performanţa memoriei este mai mare. În schimb dacă unui atlet i se impune să alerge distanţa mai repede decât poate atunci el nu ajunge la succesorul său. Dacă unul aleargă într-un timp mai lung decât de obicei. scade performanţa dar stabilitatea rămâne.

Acest fenomen este amplificat şi de temperaturi ridicate (De-aia nu-i bine să se încingă prea tare procesorul). făcute pentru overclock (ele de altfel "overclockează" şi portofelul. Ideal este să avem frecvenţa cât de mare la memorii şi latente cât de mici. şi să urmăriţi tot timpul să folosiţi voltajul minim necesar pentru stabilitate. throtlingul ia măsuri mai drastice şi îi scade multiplicatorul scăzând-ui astfel frecvenţa de lucru şi astfel scăzând şi mai mult temperatura până când aceasta coboară sub limită. FSB de 533Mhz (133 real) şi multiplicator de 20x. iar la core 2 duo să nu 129 5. Pentru cei care nu ştiu Throttling-ul este tehnologia de protecţie a procesoarelor Intel împotriva supraîncălzirii.66Ghz. La început ea începe să introducă cicluri IDLE printre ciclurile de ceas ale procesorului. Iniţial vom urca în paşi mici cu FSB-ul până la 160Mhz (640 efectivi) obţinând o frecventa de 3200Mhz. Dacă aveţi un Northwood atunci fiţi foarte atent la SNDS.30V urcă până la 3800Mhz. iară dacă suntem duri şi ăi băgăm în el 1. dacă aveţi de gând să supravoltaţi. De ex dacă îi daţi 1. de fapt două procesoare identice nu se overclockează la fel. Povestea cu voltajele este similară ca şi la AMD. În primul rând când se supravoltează o componentă. Dacă îi dăm pana la 1. în plus prin supravoltare dar acesta este doar un procesor. altele se comporta diferit la supravoltare. şi este prezent la toate procesoarele dar la Northwood se pare că este mai accentuat.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 5 este prin modificarea latenţelor. deoarece îi determină o viteză de golire mult peste cea stock laughing care suportă frecvenţe mari cu latenţe mici. şi acest lucru va duce la o uzură prea mare a procesorului. nu lăsaţi voltajele pe auto deoarece placa de bază creşte prea mult voltajul la procesor în funcţie de FSB-ul setat. Dacă ciclurile idle nu scad temperatura suficient.4 . Ele trebuiesc mărite pentru a stabiliza memoriile la frecvenţe mărite. Cred că este evident că odată intrat în Throttling procesorul va avea penalizări de performanţă.24V conform cpu-z).4V trece de 4Ghz dar cu un coolerul box nu prea stă mult la frecvenţa asta şi imediat intră în Throttling şi pierde stabilitatea pentru că temperatura ajunge la 80 de grade în full load. Voltajele În primul rând. Practic procesorul va deveni din ce în ce mai instabil.75V. aici intervin memoriile de calitate. Supravoltarea uzează mai puternic procesorul decât simpla supratactare astfel că trebuie folosită cu grijă. până când într-o zi brusc nu va mai funcţiona.3V atunci lăsaţi-l la 1. Să luăm de ex procesorul Intel Pentium D805 care are frecvenţa stock de 2.3V.4V. acest lucru urmărind să-i scadă temperatura. La procesorul dat ca exemplu. este recomandat să nu se depăşească cu 10% voltajul stock. Singura diferenţă este că dacă overclock-aţi un Pentium Prescott. observam că câştigăm destul de mulţi mhz. Explicaţia acestui "sindrom" este în fenomenul fizic de migraţie a electronilor care degradează în timp traseele electronice din nucleul procesorului. Până aici este stabil la voltaj stock (1. El constă în moartea foarte prematură a procesorului spre deosebire de alte procesoare supravoltate. La Pentium 4 şi la Pentium D să nu depăşească 50° în idle şi 60° în full. unele s-ar putea să nu urce mai mult de vreo 200mhz oricât voltaj i s-ar da. el se vă încălzi foarte tare la ridicarea voltajelor şi îi va creşte mult consumul de curent. SNDS înseamnă de fapt "Sudden Northwood Death Sindrome" şi apare atunci când voltajul este ridicat peste 1. dar el este stabil şi la 1. Tot timpul când supravoltati FITI CU OCHII PE TEMPERATURI.

Acest lucru se întâmplă pe capăt de strap. Acest NBCC afectează direct performanţa şi stabilitatea memoriilor. Este un strap la 1066Mhz.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 5 treacă de 55° cel mult în full şi să stea în jur de 40÷42° în idle. NBCC-ul declanşator pentru fiecare strap diferă de la placă de bază la placă de bază. iar nici un procesor Intel în afară de cele extreme edition nu permit urcarea multiplicatorului) de la 9 la 7 şi îi dăm FSB de 500Mhz. Puteţi testa diverse valori ale NBCC-ului folosind SuperPI sau orice alt program de măsurat lăţime de bandă pentru a vedea când se schimba latenţele. Strap-ul la northbridge Asemenea unui procesor. Multe plăci de bază oferă opţiunea de a mari şi voltajul pe cipset. şi câtul îl înmulţiţi cu valoarea FSB-ului (valoarea reală. avem latenţa mai mare specifica strap-ului şi deci 130 5. Puteţi descoperi NBCC-ul împărţind multiplicatorul curent al procesorului cu multiplicatorul lui stock. Aceste latenţe cresc în momentul când NBCC-ul atinge valori specifice. Dacă aţi făcut overclock şi sistemul nu este stabil. Dacă ele depăşesc aceste limite va trebui fie să vă cumpăraţi un cooler mai performant. Coborând multiplicatorul sistemului. Să vedem şi ce-i cu latenţele lui. northbridge-ul are frecvenţa internă proprie şi latenţele proprii care influenţează performanţa sistemului (lucru valabil de la i865 încoace). schimbă valorile la care anumite strap-uri se setează. Seria de latenţe care este setată la o valoare specifică a NBCC-ului se numeşte strap. la Intel frecvenţa memoriilor se obţine din FSB şi nu din frecvenţa procesorului. Am vorbit despre frecventa NB-ului. NBCC-ul va creşte şi NorthBridge-ul se va overclocka şi deci va deveni mai instabil. deoarece cum am spus mai sus. Revenim puţin asupra măsurilor de recăpătare a stabilităţii. Ne vom referi la frecvenţa lui prin NBCC (North Bridge Core Clock). a memoriei şi a NB-ului. mărind astfel stabilitatea dar scăzând performanţa. Se mai pot pune ventilatoare şi pe capacul lateral sau în partea de sus a carcasei-"blow-hole"). fie să îmbunătăţiţi ventilaţia în carcasa dacă aceasta lasă de dorit (ideal este un ventilator jos în faţă care bagă aer şi unu sus în spate care scoate. La memorii se aplică cam acelaşi principiu.5 . dar din anumite motive ştiţi că memoriile şi procesorul ar putea mai mult (de ex dacă le testaţi cu o altă placă de baza şi cu aia merg mai mult) limitarea vine din placa de bază. unul la 1333Mhz şi aşa mai departe. Obţinem următorul lucru aplicând formula: (9/7) * 500=642Mhz ăsta-i NBCC-ul. Să luam un exemplu: luam un Conroe E6600 şi îi coboram multiplicatorul (nu toate plăcile de baza permit acest lucru. Acestea erau: supravoltarea procesorului. şi din nou se aplică cam acelaşi principiu ca şi la procesor. dar aici dacă îl coboram. Observăm un lucru interesant. nu cea quadpumped). De ex dacă suntem în strap-ul de 800Mhz. Supravoltarea NB-ului se face când acesta provoacă instabilitatea. ar trebui să-i mărim stabilitatea. dar şi acolo unele s-ar putea să urce mult dacă le mărim voltajul şi altele s-ar putea să nu urce aproape de loc mai mult chiar dacă le îndopăm cu voltaj. Acest NBCC variază în funcţie de FSB-ul sistemului şi de multiplicator. mai exact din cipset. Producătorii de placi de bază totuşi.

Asta se întâmplă deoarece 949 este o valoare mare pentru latenţa strapului de 800Mhz. Fie mărim FSB-ul până ajungem să declanşăm următorul strap (strap-ul de 1066) şi astfel se va mări latenţa şi NB-ul se va stabiliza. 667=3:5. 800=1:2 • pentru strapul de 1066 avem aceleaşi valori de 400. 667=4:5. iar NBCC-ul fiind mare. Intrarea în strap-ul de 1066 nu înseamnă că suntem cu FSB-ul la 1066Mhz. valoarea declanşatoare este mai mică). Acest lucru se face prin modificarea forţată a strap-ului în care ne aflăm. Să luam un exemplu concret că e mai uşor aşa (valorile sunt luate la întâmplare. 533=3:4. sau dacă procesorul nu duce FSB-ul mărit atunci vom supravolta NB-ul pentru a-l stabiliza. 800=5:6 La unele plăci putem găsi opţiunea pentru de ex 889 la memorie.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 5 stabilitate. va rezulta instabilitate. Pornim de la 800Mhz FSB deci ne aflam în strap-ul de 800Mhz. Mai trebuie ştiut că fiecare strap vine cu raporturile lui pentru frecvenţa memoriei. 533=1:1. 667=1:1. De-aia ziceam mai sus ca diferă NBCC-urile la care se schimbă strap-ul în funcţie de placa de bază. Sunt 2 moduri de a rezolva această problemă. Adică: • pentru strapul 800 avem următoarele frecvenţe pentru memorie cu raporturile corespondente fiecăreia: 400=1:1. deci nu ştiu la ce placă de bază sunt valabile(poate la nici una)). însă latenţa strap-ului de 1066 este bună pentru valoarea de 950 şi deci NB-ul este mai stabil. 533=5:4. ci mai jos. Să zicem că în momentul când trecem de 950 de Mhz NB-ul trece în strap-ul de 1066 (cum ziceam mai sus. 533. va urca şi NBCC-ul dar latenţa va rămâne la fel. Când urcăm FSB-ul. 131 . devenind la un moment dat prea mică. Asta înseamnă că valoarea de 949Mhz este încă în strap-ul de 800Mhz deci este mai instabilă decât 950Mhz care este deja în strapul de 1066Mhz. 800=4:6 • strapul 1333 are aceleaşi frecvenţe la ram dar alte rapoarte: 400=5:3. Ziceam mai sus că mărind FSB-ul de la 800 în sus la un moment dat ieşim din strap-ul de 800 şi intram în strap-ul de 1066Mhz. 667 şi 800 dar rapoartele sunt altele: 400=4:3.

Pentru început este recomandată creşterea HTT-ului în paşi de 5 MHz pentru a putea testa cât mai corect şi sigur dacă este sau nu stabil. 3D Mark 2001. Memtest de Windows. Ideea este că frecvenţa memoriei trebuie scăzută de la 400 MHz la 333 MHz sau chiar 266 MHz (în cazul sk. procesor. la altele divizorul (CPU/9.). pentru informaţii despre procesor şi memorie.roclockers.html http://www.). este nevoie de: un procesor overclockabil. Prim95 / Orthos SP 2004. un test rapid de performanţă. SuperPI. CPU/14. 1 2 http://www.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 6 6 Metodologia de realizare a overclocking-ului la procesoarele AMD 6.roclockers. 2) Tot în BIOS există opţiunea HT Multiplier. de pe Auto/SPD pe Manual şi se schimbă frecvenţa. memorii şi chipset. a fi sigur că stabilitatea nu este afectată de aici). o placă de bază bună. pentru testarea stabilităţii procesorului şi memoriei.html 3 http://www.32.2 Procedura de realizare a overclocking-ului 1) În primul rând din BIOS. • • • • • • • • • 6. Cum se face asta depinde de BIOS: la unele arată frecvenţa. trebuie puse pe Manual pentru a permite modificarea voltajului şi a HTT-ului.00. Everest2 /Speedfan3 /SmartGuardian. monitorizare şi testarea stabilităţii: CPU-z1. pentru testarea memoriei. se schimbă setările pentru RAM. 754/939) şi de la 667 MHz la 533 sau chiar 400 MHz pt. Soft-uri care ar trebui folosite pentru. care să permită modificarea unui număr mare de setări în BIOS (FSB. cu destui amperi şi care să nu aibă fluctuaţii de curent.roclockers. 3) Urmează setările pt. platforma sk. dar rezultatele sunt puternic influenţate de tweak-uri. un test care evaluează cele mai importante componente ale calculatorului: procesorul.1 Introducere Pentru început. • răcire bună pe procesor şi preferabil un airflow decent în carcasă.html 132 . pentru monitorizarea temperaturii core-ului plăcii video. etc.net/monitorizare/cpu-z-1. Trebuie modificată pe Manual şi scăzută valoarea multiplicatorului de la 5x la 4x sau chiar 3x. pentru monitorizarea temperaturilor. Din înmulţirea HT Multiplier cu HTT se obţine frecvenţa HT. pentru a nu exista o limitare din partea memoriei. • o sursă bună.40. RivaTuner/ATi Tool. voltaje pentru procesor.net/monitorizare/everest-ultimate-edition-4. HT multiplier. placa video şi memoria. AM2. din nou.net/monitorizare/speedfan-4. care. latenţe/frecvenţe RAM. care nu trebuie să depăşească 1000 MHz (pt. etc.

Nu afectează cu nimic performanţa dacă frecvenţa HT este mai mică de 1000 MHz. În acest caz BIOS-ul va reveni la setările de fabrică. În cazul ăsta probabil a crescut prea mult frecvenţa. Temperatura memoriilor se măsoară "degetometric". este recomandată şi creşterea voltajului de la chipset-ul plăcii de bază. (sk. Recomandat: două rulări ale testului 32M. Nu ştiu dacă la toate plăcile de bază este valabilă această procedură. la fel şi pe un DFI NF4 . dar se resetează sau apare un BSOD (ecran albastru) iarăşi nu e bine şi trebuie modificate valorile prin BIOS. • • • • 5) Testele: Prime95: se lasă cel puţin o oră să ruleze testul "Blend". eventual cu un ventilator de 8 cm poziţionat deasupra. Soluţia este resetarea BIOS-ulului cu jumper-ul de clear CMOS de pe placa de bază. • calculatorul porneşte. • dacă porneşte sistemul de operare. inclusiv pe cele ale plăcii video în caz că se rulează un test 3D. Recomandat: câteva ore de loop-uri continue. SuperPI: măcar 16M. Recomandat: peste 1000%. Pentru fiecare dintre teste se vor monitoriza temperaturile. 3D Mark 2001: un singur loop e OK. etc. 533 MHz. care nu trebuie să depăşească 1000MHz. Asta pe aer. se reporneşte sistemul şi se rulează un test din cele de mai sus. 667 MHz. folosirea zilnică ar fi + 0. Limitele pt. Memtest de Windows: cel puţin 100% cu maximul de capacitate. • Când se ajunge la limite ar mai fi următoarele variante: creşterea voltajului furnizat procesorului. Dacă sunt calde/călduţe e OK. cel puţin pe o placă ABIT A8N32X. o altă limitare ar putea fi memoria. dar se poate intra în BIOS pentru a efectua modificări. 754/939) sau în funcţie de frecvenţa nominală a memoriei.15V cu răcirea stock şi poate ajunge până la 0. Toate setările din BIOS vor reveni la default. dar nu intră în sistemul de operare. adică nici nu bootează. Dacă ard/frig încercaţi să le asiguraţi o răcire. aşa că poate fi folosit direct multiplicatorul 3x. acelaşi lucru este valabil şi pentru HT. AM2). Sau se poate ţine apăsată tasta "1" în timp ce se apasă butonul de reset al PCului. • • • 133 .3V în funcţie de răcire.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 6 4) Se salvează setările. Pentru ca să fim siguri că limitarea nu apare de aici trebuie ca frecvenţa memoriei să fie la 400 MHz sau mai jos (sk. tot din BIOS. Ce s-ar putea întâmpla dacă ceva nu e bine sau când s-a ajuns prea departe: • sistemul nu POSTează. pentru că răcirea pe apă e mai versatilă şi prefer să nu mă pronunţ. Recomandat: peste 4 ore. Aici iarăşi înseamnă că s-a mers prea departe. de preferat 3D Mark 2001 şi/sau un joc pretenţios.

Ea este întotdeauna 200Mhz. Modelele mai vechi de Athlon64 au htt-ul la 800Mhz deci cu multiplicator de 4x. Nu este nici o problema dacă merge şi sub 1000Mhz că nu are un impact vizibil asupra performanţei. Multiplicatorul HTT este de regula 5x adică 5*200=1000Mhz (sau 2000Mhz sau 4GB/s). De obicei plăcile de bază pentru overclock folosesc un clock-generator separat pentru aceste frecvenţe şi au opţiunea de a le bloca la valoarea lor standard. Vom încerca să prezentăm cât mai generalizat: • blocaţi toate componentele la frecvenţa standard în afară de procesor bineînţeles dacă vă permite placa de bază • puneţi frecvenţa de baza pe Manual de pe Auto dacă este cazul • incrementaţi frecvenţa de bază în paşi mici (din 5 în 5 Mhz e ok) verificând stabilitatea sistemului de fiecare dată (puteţi folosi programe specializate pentru acest lucru cum ar fi: Prime95. Ele folosesc o frecvenţă de bază care este de multe ori greşit numita ca FSB.Seminar Evaluarea performanţelor sistemelor de calcul Seminar 6 FSB la Athlon64 Poate că mulţi dintre voi ştiţi că un overclock se face ridicând fsb-ul. O altă frecvenţă care derivă din HTT este şi frecvenţa PCI-express sau AGP după caz. Deci pentru a overclocka un Athlon64 trebuie ridicată frecventa HT (se poate face overclock şi din multiplicator dar acesta este de cele mai multe ori blocat). 6. Frecvenţa efectivă a HyperTransport-ului este frecvenţa de baza multiplicată cu multiplicatorul HTT. Aceasta este de fapt frecvenţa HyperTransport sau i se mai spune HT sau HTT. S&M) • setaţi multiplicatorul HTT la 4x odată ce aţi trecut de 220Mhz • setaţi multiplicatorul HTT la 3x odată ce aţi trecut de 250Mhz Frecvenţa efectivă HTT trebuie să stea sub 1000 sau sub 800. În cazul de faţă setând un multplicator de 4x va rezulta 1000Mhz deci perfect. SuperPI. Orice overclock depinde de placa de bază şi de opţiunile pe care aceasta le oferă. Este un memory bus care conectează memoriile de procesor şi un HyperTransport Bus care conectează procesorul de cipset prin intermediul căreia se trimit comenzi la diverse componente ale sistemului. De asemenea porturile SATA necesita frecvenţa tot de 100Mhz. La Athlon64 este puţin diferit pentru că odată cu integrarea controlerului de memorie în procesor nu mai avem FSB ci avem 2 magistrale. şi celelalte frecvenţe de pe placa de bază derivă tot din frecvenţa HTT.3 134 . şi cea PCI. Frecvenţa PCI-express trebuie să fie 100Mhz cea AGP 66Mhz şi cea PCI 33Mhz. Înmulţind această frecvenţă cu multiplicatorul procesorului se obţine frecvenţa de lucru. Pentru a putea face un overclock bun la Athlon64 trebuie să înţelegem cum este generată frecvenţa la aceste procesoare. Orthos. Ele are frecventa HT de 200Mhz şi multiplicatorul de 13. Astfel că trebuie coborât multiplicatorul HTT-ului ca să coboare şi frecvenţa sub limită. În momentul în care urcaţi frecventa de bază trebuie să aveţi grijă că aceasta multiplicată cu multiplicatorul HTT să nu depăşească maximul permis. Stress Prime2004. depinde de procesor şi de placa de bază. De exemplu un Athlon64 X2 5000+ merge la 2600Mhz. Dar. De ex dacă urcaţi la 250mhz de la 200Mhz şi multiplicatorul HTT rămâne 5x va rezulta o frecvenţă efectivă a HyperTransportului de 1250 deci peste maxim.

00.92/ 16.net/monitorizare/cpu-z-1.ro/content-62-page1. http://www.xf. http://www. http://www.roclockers.techpowerup.org/freesoft.net/component/option.realstorm. http://en.html 11.com/download.roclockers.php?page=rivatuner 12. http://www.com_remository/Itemid.net/menus. http://www.wikipedia.org/ 2.mersenne.net/util/ps.php?name=Company&c_lang=english 10.php?det=872 15.com/index.net/monitorizare/speedfan-4.com/ 7. http://www.sele ctfolder/cat.com/downloads/Tweaking/ATITool 13.html 135 .ro/article135.guru3d.guru3d.com/cpuchipsets/showdoc.com/memtest/download.32.26/func. http://www.xf.html 9. http://hcidesign. http://www.memtest.mvktech.40. http://www.net/monitorizare/everest-ultimate-edition-4. http://www. http://www. http://www.shtm 17.anandtech. http://downloads.roclockers.Bibliografie 1.html 5.org/wiki/Wire_frame_model 6. http://www.org/ 8. http://brain-power.html 19. http://www.entechtaiwan.techpowerup.htm 3.com/atitool/ 14.memtest.html 18. http://www.aspx?i=2322 4.

.................................... Conductele ............ Costul benchmarking-ului...............8 1....................................................................... ARHITECTURA CALCULATOARELOR ..............................................29 2.........39 3......................................................................................................................2.........................3...................................3.........................8...................30 2...... Calculul matematic .......................................1........9...................................................................2..........................38 3................2...2........1.........................................................................................................................12 2.................................... Cei 64 de biţii................................................................................. Memoria gestionată direct din procesor........2................... Rezultate comparative.......... Modul de testare ............1................2.....................................................................5......................................7 1..................................2..1............................................................1..........................................1.....................................1.......... Gestionarea memoriei principale şi secundare .........................................................................2........ USB etc..3................................................ VLB..................... Testarea efectivă ......3................3............................................................................................4....3.2...................... Gigabyte GA-K8NF-9 (nForce4-4X) ...1............................1......................... Introducere...................6 1.......9..................................................... TRECUT ŞI PREZENT...2........ BENCHMARKING-ULUI ÎN COMPUTERE .....3...................1.23 2...............20 2...............................5 1............................................. Interfeţele pentru dispozitive de stocare ..9 1....................4......................................................33 2.......41 3....1.................1................................................42 3...................................... PLĂCILE DE BAZĂ: FUNCŢIONARE. EVALUAREA PERFORMANŢELOR PROCESOARELOR ............................5..................48 3............. EVALUAREA PERFORMANŢELOR PLĂCILOR DE BAZĂ .......... BENCHMARK-UL ORGANIZAŢIILOR.............................................1.....................................................................2......47 3...1...............................................................................................49 3....................... Abit AN8 Fatal1ty (nForce4 Ultra). AGP etc ............1.............1................50 3.......... NOŢIUNI DE BAZĂ PRIVIND EVALUAREA PERFORMANŢELOR......................................... Tensiunile...............................7..................................12 2................ ISTORIE................................................ Introducere..2....................49 3....................... Memoria.. Scopurile proiectării ........1........51 136 ............... Avantajele benchmarking-ului .......................7 1.........2...2...................1......... Concluzii ...................................... ARHITECTURA PROCESOARELOR AMD64 ....3...5 1....7.... Scopul benchmarking-ului .......................................24 2.......2...15 2............. paralel...4.....2................38 3..............................................46 3..............26 2...........................................................................5............................ Ambalarea...........................................................10................. Procedura de realizare a benchmark-ului ........................................ Anexă: Chipset-uri pentru Pentium 4 .... Tipuri de benchmark ..........................................................26 2..45 3.............................3.....................................................................................................................................................................23 2................1....................................... Provocări .....................................................2.......12 2.........................10 2..45 3..................36 2.........................................................1.....11..............1...................................................................... Concluzii .............18 2.................6.... ARHITECTURA LUI PENTIUM 4 PRESCOTT ......... Abit AN8 (nForce4)..........3.....................................................2.............................................1................49 3. PCI.....38 3............................... tipuri de memorie ...1.....................10.................2........................ Gigabyte GA-K8NXP-SLI (nForce4 SLI)....................................................6............................ Interfeţele externe: serial...... Latenţa ...................... Definiţii de bază: chipset-ul...........45 3..............................21 2.........................................................37 3................................................35 2.........................................6 1.......Cuprins CUVÂNT ÎNAINTE Partea a I-a : Curs 1......................1................ Versiuni de Prescott-uri ...........2.................................................................2..................1...............................1.............1..............................1.................................................. Alte procesoare din familia P4 ....................5 1............2...................................1.............................. Interfeţele interne: ISA....5 1................ TESTAREA PLĂCILOR DE BAZĂ SOCKET 939................................................ DFI LANParty UT nF4 Ultra-D (nForce4 Ultra)..8....................................

........................2...................................86 5....2.............. CHIP-URI DE MEMORIE ...................3..................91 6...93 6........ Interfeţe şi controlere..................5.91 6....................................................................................3...................2..2............3...............................3................................ HTT.........82 4......................................................................................1............................................87 5......5........96 6..................................1........... Socket 939........................... tehnologii de fabricaţie şi platforme......64 3.....................4.............................2.........78 4..............................4................................4.84 4....................................................... STANDARDE....3...........................................1................ INTRODUCERE ...............................3............................................5...........55 3............................................................................................ Tehnologia Intel dual-core Intel .......................86 5..66 3.1...................................96 6........5.........2.............................1................5..........................................................................................3...... Optimizarea latenţelor de rotaţie............... Hard discuri liliputane.........71 4.......................... Modele de K8.92 6................ Hard discuri...................................70 4................... Corsair TWINX1024-3200C2PRO rev 4....................... Cache-ul..................... TEST DE PROCESOARE ............................... Corsair TWINX1024-3200C2PT rev 4.. CONCLUZII .........4....................83 4................85 EVALUAREA PLĂCILOR GRAFICE ...... HyperTransport.................6.......... Optimizarea timpilor de căutare................ Testarea propriu-zisă ...............................................................................................................95 6.......5............1.......................................................................................................2.........................................................1................... FRECVENŢE ŞI LATENŢE .............2.......52 3...................66 3................................ STRUCTURĂ ŞI FUNCŢIONARE...............92 6............. Concluzii .................. 6..................... Corsair TWINX1024-4400C25PT rev 1................... Moştentirea de la Intel .........54 3... Tehnologia NCQ . Corsair TWINX1024-3200XLPT rev 1.... Conductele şi predicţia ...............................83 4.. Latenţe ....................................3........56 3........... Procesoare testate: .............. MODUL DE TESTARE ......................2..............1............................................................................94 6.............................58 3.....................................................7....................................53 3...................................................5... FRECVENŢE..........................................84 4........1.........................2..................................4.4..............................................3..........61 3............................... Transferul datelor la memorie ............................... EVALUAREA MEMORIILOR ......................................................................................................3...............................................1..............................3..............4.6..................80 4................................2.................................Cuprins 3..................59 3...................................................3............ Socket T (LGA775) ................... EVALUAREA HARD DISCURILOR ...................................1....2..............5.................. Corsair TWINX1024-3200C2PT rev 5.... A-Data Vitesta DDR500.................3...................87 5................................................................................. Socket AM2 ..............................................................................................2...70 4...................................2..............................................................5.................................2......4.......................................... LĂŢIMI DE BANDĂ ....2.........8...........................................................88 5...... CARACTERISTICI ....3...... Frecvenţe ....................................3..................2.....4.....................................4..............................................5.................................................................................................1...............................................2................. INTRODUCERE .....................66 3......2................................................ Criptare nativă pentru hard discuri....................................................................72 4................ Concluzii ......3.............2..........................................................................94 6..........................91 6.......4.81 4............................................................3.............................puţin mai silenţioase................................................................................................................................2............................................................. PROCESOARE DUAL-CORE ..............67 4..............................97 137 ...................3.......................................................................60 3.............. Tehnologia Dual-Core AMD .............................. INTRODUCERE ............2..........54 3......4.......1.....4....................2.................................................. Latenţe ..........................................................................................................................6........78 4..................................................................................................................................................

..........107 3...........................................................................................................3 1.......................................................1 5..................................102 2................................................................................................................................1 Procedura de testare a monitoarelor LCD........................................................127 VOLTAJELE ....................................................................................98 1.........................................Evaluarea performanţelor sistemelor de calcul Partea a II-a : Seminarii 1 METODOLOGIA DE EVALUARE PENTRU PLĂCI DE BAZĂ .107 CE ÎMI TREBUIE PENTRU OVERCLOCKING? ....103 PLĂCI DE BAZĂ TESTATE .........................................................................................................1 6............................98 CEI CINCI PAŞI ÎN EVALUAREA OBIECTIVĂ .101 EVALUAREA PLĂCILOR DE BAZĂ DUAL CORE ...............................................................................................118 4...............2 1....................................................106 3 REALIZAREA OVERCLOCK-INGULUI LA PLĂCILE GRAFICE....................................................................................................................................................................................................................................................................................................................................................................126 5.......2 Cum să alegem un monitor .98 INTRODUCERE ......................................................5 INTRODUCERE .............................................3 5..3 7 8 INTRODUCERE ..........................2 5....................................................................1 2.......129 STRAP-UL LA NORTHBRIDGE .3 3........................................................................................132 FSB LA ATHLON64 ..................2 2............................................112 4 EVALUAREA DISPLAY-URILOR................................................................................................................3 2..................104 CONCLUZII .1 1..99 CONSIDERAŢII FINALE / NOTA FINALĂ ....2...................1 GENERALITĂŢI .... COŞMARUL DIVIZORILOR ŞI AL LATENTELOR...................4 2 OBIECTIVE: .....................................................4 2................................................................................................................................................................................2.................................................................1 3.............109 PROCEDURA DE REALIZARE A OVERCLOCKING-ULUI ..................2 6......................................................130 6 METODOLOGIA DE REALIZARE A OVERCLOCKING-ULUI LA PROCESOARELE AMDEROARE! MARCAJ ÎN DOCUMENT NEDEFINIT.............102 CONSIDERAŢII TEHNICE..2 TESTAREA DIPLAY-URILOR TFT LCD ............126 FSB LA INTEL .................110 CÂND ŞI CUM APAR ARTEFACTELE? .................................122 4........................................102 PROCEDURA DE TESTARE ..........................132 PROCEDURA DE REALIZARE A OVERCLOCKING-ULUI ................................................................4 GENERALITĂŢI DESPRE OVERCLOCKING-UL LA PLĂCILE GRAFICE ............................126 FRECVENTA MEMORIILOR.134 BIBLIOGRAFIE.....................................................................................................118 4................................................135 CUPRINS....... 6.....136 138 ...................................................................124 5 METODOLOGIA DE REALIZARE A OVERCLOCKING-ULUI LA PROCESOARELE INTEL ...................................................................................................................................................................................2 3.......................................................................4 5...........................................................................................................................................................................123 4....................................................................................5 OBIECTIVE: ..............

Sign up to vote on this title
UsefulNot useful