PROCESORI

2 Procesor (u stvari kratak oblik za reč mikroprocesor, koji se često zove i CPU ili centralna procesorska jedinica) predstavlja središni sastavni deo PC računara. Ova vitalna komponenta je na neki način odgovorna za sve što radi PC računar. Procesor pored ostalog odredjuje, u najmanju ruku delimično, koji operativni sistemi će se upotrebiti, koji softverski paket može da radi na PC računaru, koliko mu je električne energije potrebno i koliko će sistem biti stabilan. Procesor takodje uglavnom odredjuje i koliko će ceo sistem da košta: što je procesor noviji i moćniji, mašina će biti skuplja. Kada je madjar po rodjenju John von Neumann prvi predložio pamćenje niza instrukcija - to će reći programa - u istoj memoriji gde se nalaze i podaci, to je stvarno bila inovativna ideja. On je to napisao 1945. godine u svom "Prvom nacrtu izveštaja o EDVAC-u". U tom izveštaju, računar je bio organizovan u četiri glavne celine: centralna aritmetička jedinica, centralna upravljačka jedinica, memorija i ulazno/izlazni uredjaji. Danas, posle više od pola veka, gotovo svi procesori imaju "von Neumann-ovu" arhitekturu.

Principi
Principi kojima podležu svi računari su isti. U osnovi, oni svi uzimaju signale u obliku nula (0) i jedinica (1) (koji se zato zovu binarni signali), manipulišu njima saglasno nekom skupu instrukcija i proizvode izlaze, opet u obliku nula i jedinica. Napon na liniji u trenutku kada se signal pošalje odredjuje da li je taj signal 0 ili 1. U sistemu koji radi na 3,3V, napon od 3,3V znači da je to 1, dok napon od 0V znači da je 0. Procesor radi pomoću reagovanja na ulaz od više 0 i 1 na odredjene načine i vraćanja izlaza zasnovanog na odluci. Sama odluka se dešava u elektronskim sklopovima koji se zovu logička kola (od kojih svako zahteva najmanje jedan tranzistor), čiji su ulazi i izlazi različito uredjeni pomoću različitih operacija. Činjenica da današnji procesori sadrže milione tranzistora ukazuje na to koliko je složen takav logički sistem. Logička kola u procesoru rade zajedno na stvaranju odluka koristeći Bulovu logiku, koja se zasniva na algebarskom sistemu koji je osnovao George Boole. Glavni Boole-ovi operatori su I, ILI, NE i NI (ne-I); moguće su i njihove mnogobrojne kombinacije. Izlaz I kola je 1 samo ako su oba njegova ulaza 1. ILI kolo na izlazu daje 1 ako je bar jedan od njegovih ulaza 1. NE kolo ima samo jedan ulaz i daje njegovu suprotnu vrednost na izlazu, odnosno 1 ako je na ulazu bila 0 i obrnuto. NI kola su veoma popularna, jer koriste samo dva tranzistora umesto tri kao u I kolu, a ipak imaju isto toliko funkcionalnosti. Pored toga, procesor koristi kola u kombinaciji da bi izvršavao aritmetičke funkcije; on ih takodje koristi da pobudi smeštanje podataka u memoriji. Logička kola rade putem hardvera koji se naziva prekidač - posebno digitalni prekidač. U vreme računara veličine oveće prostorije, to su stvarno bili fizički prekidači, ali danas se više ništa ne kreće izuzev same struje. Najuobičajeniji tip prekidača u današnjim računarima je tranzistor poznat kao MOSFET (metal-oksid poluprovodnički tranzistor sa efektom polja). Ova vrsta tranzistora izvodi jednostavnu, ali suštinski bitnu funkciju: kada mu se dovede napon, on reaguje uključujući ili isključujući kolo. Većina PC procesora danas radi na 3,3V, ali raniji procesori (do pojave, pa i uključujući neke od Pentijuma) radili su na 5V. Sa uobičajenim tipom MOSFET tranzistora, ulazni signal na maksimalnoj vrednosti naponskog opsega, ili blizu nje - uključuje kolo, dok ga pnaj koji je blizu 0 isključuje. Milioni MOSFET tranzistora rade zajedno, prema instrukcijama programa, da bi upravljali tokom elektriciteta kroz logička kola i proizveli zahtevani rezultat. Svako logičko kolo sadrži

3 jedan ili više tranzistora i svaki tranzistor mora da kontroliše struju tako da se kolo uključuje, isključuje ili ostaje u trenutnom stanju.

I logičko kolo

IlI logičko kolo

Slika 1: Jednostavna logička I i ILI kola Ako brzo pogledamo na jednostavna I i ILI logička kola na slici 1, videćemo kako ona rade. Svako od ovih logičkih kola ima dva ulaza koji proizvode jedan izlazni signal. Logičko I znači da oba ulaza moraju da budu 1 da bi izlaz bio 1; logičko ILI znači da bilo koji ulaz može da bude 1 da bi izlaz bio 1. U I kolu, oba ulazna signala moraju da budu na visokom nivou napona (odnosno logičkom 1) da bi kolo propustilo struju kroz sebe. Tok elektriciteta kroz svako kolo se kontroliše pomoću tranzistora u tom kolu. Medjutim, ovi tranzistori nisu pojedinačne i diskretne jedinice. Umesto toga, njihov veliki broj se proizvodi od jednog komada silicijuma (ili nekog drugog poluprovodničkog materijala) i medjusobno povezuje pomoću metalnih provodnika ili nekog drugog spoljašnjeg materijala. Ovakve jedinice se zovu integrisana kola (IC) i njihov razvoj je, u osnovi, učinio ostvarivom složenost mikroprocesora. Integracija kola se nije zaustavila na prvim rezultatima. Baš kao što su prva integrisana kola povezala više tranzistora, tako su se kasnije povezivala i višestruka integrisana kola, u procesu koji je poznat kao visok stepen integracije (Large Scale Integration - LSI); na kraju su i ovakvu skupovi integrisanih kola bili povezivani, u procesu koji se zove veoma visok stepen integracije (Very Large Scale Integration - VLSI). Savremeni mikroprocesori sadrže na desetine miliona mikroskopski malih tranzistora. Upotrebljeni u kombinaciji sa otpornicima, kondenzatorima i diodama, oni čine logička kola. Logička kola grade integrisana kola, a integrisana kola - elektronske sisteme. Prvi slavan rezultat firme Intel bio je integracija visokog nivoa svih logičkih kola u jedinstven složeni procesorski čip - Intel 4004 - koji se pojavio krajem 1971. godine. To je bio 4-bitni mikroprocesor, namenjen za upotrebu u kalkulatoru. On je obradjivao podatke od 4 bita, ali su mu instrukcije bile dužine od 8 bita. Memorije za program i podatke bile su razdvojene. Intel 4004 je imao 46 instrukcija, koristio je svega 2300 tranzistora u 16-pinskom pakovanju sa dvojnim priključnim sklopom (Dual in Line Package - DIP) i imao je brzinu generatora takta od 740 kHz (osam ciklusa generatora takta po ciklusu centralne procesorske jedinice od 10,8 mikrosekundi). Dve familije mikroprocesora su nekoliko godina vladale industrijom PC računara - Pentijumi firme Intel i PowerPC firme Motorola. Ove centralne procesorske jedinice bile su takodje prvi primeri dve konkurentne procesorske arhitekture u poslednje dve decenije - od kojih se prva klasifikuje kao CISC, a druga kao RISC čip.

4 CISC Računar sa složenim skupom instrukcija (complex instruction set computer - CISC) je tradicionalna računarska arhitektura, u kojoj centralna procesorska jedinica koristi mikrokôd da bi izvršavala veoma širok skup instrukcija. Te instrukcije mogu da budu promenljive dužine i da koriste sve načine adresiranja, što zahteva složenu elektroniku za njihovo dekodovanje. Proizvodjači računara su jedno vreme težili da izgrade sve složenije centralne procesorske jedinice koje su imale sve veće skupove instrukcija. 1974. godine, John Cocke iz IBM-ovog istraživačkog sektora odlučio je da pokuša sa pristupom koji bi dramatično smanjio broj instrukcija koje čip izvršava. Do sredine 80-ih godina to je dovelo do toga da je jedan broj proizvodjača računara obrnuo trend gradeći centralne procesorske jedinice koje su mogle da izvršavaju samo veoma ograničen skup instrukcija. RISC Centralne procesorske jedinice računara sa smanjenim skupom instrukcija (reduced instruction set computer - RISC) imaju konstantnu dužinu instrukcija, isključile su indirektni način adresiranja i zadržale su samo one isntrukcije koje mogu da se preklapaju i izvršavaju u jednom mašinskom ciklusu ili manje od toga. Prednost RISC centralnih procesorskih jedinica je u tome što one mogu veoma brzo da izvršavaju instrukcije, jer su te instrukcije tako jednostavne. Druga, možda mnogo važnija prednost je u tome što RISC čipovi zahtevaju manje tranzistora, što ih čini jevtinijim za projektovanje i proizvodnju. Još uvek postoji značajna rasprava izmedju eksperata o krajnjoj vrednosti RISC arhitektura. Njihove pristalice ističu da su RISC mašine i jevtinije i brže, pa su zbog toga mašine budućnosti. Skeptici primećuju da učinivši hardver jednostavnijim, RISC arhitekture više opterećuju softver - RISC prevodioci moraju da generišu softverske rutine za izvršavanja složenih instrukcija koje se u CISC računarima izvode u hardveru. Oni ističu da to ne vredi uloženog truda, jer su konvencionalni procesori i tako postali brzi i jevtini. Argumenti u izvesnoj meri postaju sporni, jer CISC i RISC su implementacije sve sličnije. Mnogi od današnjih RISC čipova podržavaju isto toliko instrukcija kao i dojučerašnji CISC čipovi i, obrnuto, današnji CISC čipovi koriste mnoge od tehnika koje su ranije bile pridružene RISC čipovima. Čak i šampion medju CISC proizvodjačima, Intel, upotrebio je RISC tehnike u svom čipu 486, a pogotovu u svojoj familiji procesora Pentijum.

Istorijska perspektiva
Procesor 4004 bio je preteča svih današnjih ponuda firme Intel i, do dana današnjeg, svi procesori PC računara bili su zasnovani na originalnim projektima ove firme. Prvi čip koji je upotrebljen u IBM PC računaru bio je Intel 8088. U vreme kada je odabran, to nije bila najbolja raspoloživa centralna procesorska jedinica, u stvari Intel-ov sopstveni procesor 8086 bio je moćniji i pojavio se ranije. Procesor 8088 je odabran iz ekonomskih razloga: njegova 8-bitna magistrala podataka je zahtevala jevtinije matične ploče od 16-bitnog 8086. Takodje, u vreme kada je projektovan originalni PC računar, većina raspoloživih čipova za sprege bila je namenjena za upotrebu u 8-bitnim konstrukcijama. Ovi rani procesori ne bi imali ni blizu dovoljnu snagu da izvršavaju današnje programe.

5 Sledeća tabela prikazuje generacije procesora od prve generacije 8088/86 firme Intel u kasnim 70-tim godinama do sedme generacije AMD Athlon koja je uvedena u leto 1999. godine: Širina magistrale Tip/ Generacija Godina podataka/ adresa 8088/Prva 1979 8/20 bit 8086/Druga 1978 16/20 bit 80286/Druga 1982 16/24 bit 80386DX/Treća 1985 32/32 bit 80386SX/Treća 1988 16/32 bit 80486DX/Četvrta 1989 32/32 bit 80486SX/Četvrta 1989 32/32 bit 80486DX2/Četvrta 1992 32/32 bit 80486DX4/Četvrta 1994 32/32 bit Pentium/Peta 1993 64/32 bit MMX/Peta 1997 64/32 bit Pentium Pro/Šesta 1995 64/36 bit Pentium II/Šesta 1997 64/36 bit Pentium II/Šesta 1998 64/36 bit Pentium III/Šesta 1999 64/36 bit AMD Athlon/Sedma 1999 64/36 bit Skrivena memorija 1. nivoa (KB) Nema Nema Nema Nema 8 8 8 8 8 8 16 8 16 16 16 64 Brzina memorijske magistrale (MHz) 4.77-8 4.77-8 6-20 16-33 16-33 25-50 25-50 25-40 25-40 60-66 66 66 66 66/100 100 100-200 Brzina unutrašnjeg generatora takta (MHz) 4.77-8 4.77-8 6-20 16-33 16-33 25-50 25-50 50-80 75-120 60-200 166-233 150-200 233-300 300-450 450-600 500-600

Čipovi treće generacije, zasnovani na Intel-ovim 80386SX i DX procesorima, bili su prvi 32bitni procesori koji su se pojavili u PC računarima. Glavna razlika medju njima bila je u tome što je 386SX bio 32-bitni procesor samo u svojoj unutrašnjosti, dok su njegove sprege sa spoljašnjim svetom bile preko 16-bitne magistrale podataka. To je značilo da su se podaci kretali izmedju SX procesora i ostatka sistema upola manjom brzinom nego kod procesora 386DX. Četvrta generacija procesora je bila takodje 32-bitna. Ipak, oni su svi nudili izvestan broj poboljšanja. Prvo, čitava konstrukcija je bila pažljivo uradjena za Intel-ovu familiju 486, čineći ove procesore inherentno više od dva puta bržim. Drugo, oni su svi imali 8 Kbajta skrivene (keš) memorije na samom čipu, baš uz procesorsku logiku. Ovi skriveni prenosi podataka iz glavne memorije su značili da je procesor u proseku morao da čeka na podatak sa matične ploče samo 4% od ukupnog vremena, jer je obično bio u stanju da dobije traženu informaciju iz keš memorije. Model 486DX razlikovao se od 486SX samo po tome što je imao i matematički koprocesor na ploči. To je bio zaseban procesor, projektovan da preuzme proračune sa pokretnim zarezom. On je imao malo uticaja na svakodnevne primene, ali je menjao performansu tabelarnih proračuna, programa za projektovanje pomoću računara itd. Važna inovacija bilo je udvajanje generatora takta uvedeno sa procesorom 486DX2. To je značilo da su kola unutar čipa radila dva puta brže od spoljašnje elektronike. Podaci su bili prenošeni izmedju procesora, unutrašnje skrivene memorije i matematičkog koprocesora dvostrukom brzinom, što je značajno poboljšavalo performansu. Procesor 486DX4 je dalje usavršio ovu tehniku, utrostručavajući brzinu generatora takta da interno radi na 75 ili 100 MHz i udvostručavajući veličinu primarne skrivene memorije na 16 Kbajta.

6 Pentijum je definišući procesor pete generacije koji obezbedjuje veoma povećanu performansu u odnosu na čipove 486 koji su mu prethodili, zahvaljujući većem broju promena u arhitekturi koje uključuju i udvostručavanje širine magistrale podataka na 64 bita. Procesor P55C MMX je napravio dalja značajna poboljšanja udvostručavanjem primarne skrivene memorije na ploči na 32 Kbajta i proširenjem skupa instrukcija u cilju optimizovanja izvršavanja multimedijskih funkcija. Procesor Pentijum Pro, uveden 1995. godine kao naslednik Pentijuma, bio je prvi u šestoj generaciji procesora i uveo je više jedinstvenih osobina arhitekture koje nikada ranije nisu bile vidjene u procesorima PC računara. To je bila prva centralna procesorska jedinica iz glavnog proizvodnog toka koja je radikalno promenila način izvršavanja instrukcija, prevodeći ih u mikroinstrukcije slične onima kod RISC procesora i izvršavajući ih u vrlo naprednom jezgru. Takodje je uvedena skrivena memorija koja je imala dramatično viši nivo performanse u poredjenju sa svim ranijim procesorima. Umesto da se koristi keš memorija sa matične ploče koja radi brzinom memorijske magistrale, upotrebljena je integrisana skrivena memorija drugog nivoa sa njenom sopstvenom magistralom, koja radi punom brzinom procesora, tipično tri puta brže od skrivene memorije na Pentijumu. Intel-u je trebala gotovo jedna i po godina da proizvede novi čip posle Pentijuma Pro. Kada se konačno pojavio, ispostavilo se da je Pentijum II bio samo sledeći evolutivni korak. Ovo je pokrenulo nagadjanje da je prilikom izrade Pentijuma II jedan od glavnih Intel-ovih ciljeva bio da pobegne od skupe integrisane skrivene memorije drugog nivoa koju je bilo teško proizvoditi na Pentijumu Pro. U pogledu arhitekture, Pentijum II se ne razlikuje mnogo od Pentijuma Pro, ima slično emulaciono jezgro x86 i većinu istih ostalih osobina. Pentijum II je unapredio arhitekturu Pentijuma Pro udvostručavanjem veličine skrivene memorije prvog nivoa na 32 Kbajta, upotrebom specijalnih keš memorija da se poveća efikasnost obrade 16-bitnog kôda (Pentijum Pro je bio optimizovan za 32-bitnu obradu i nije tako dobro radio sa 16-bitnog kôdom) i povećavanjem veličine bafera za pisanje. Medjutim, ono o čemu se najviše govorilo u vezi sa Pentijumom II bilo je njegovo pakovanje. Integrisana sekundarna skrivena memorija Pentijuma Pro, koja je radila punom procesorskom brzinom, bila je na Pentijumu II zamenjena specijalnom malom pločom koja je sadržavala procesor i 512 Kbajta sekundarne skrivene memorije i koja je radila na polovini brzine procesora. Ovaj sklop koji je nazvan jednoivični kertridž (single-edge cartridge - SEC), bio je projektovan tako da odgovara slotu od 242 pina (Podnožje 8) koji se nalazio na novim matičnim pločama za Pentijum II.

Osnovna struktura
Glavni funkcionalni sastavni delovi procesora su (Slika 2): • Jezgro: Srce moderne izvršne jedinice. Pentijum ima dva paralelna sklopa za protočnu obradu koji mu omogućavaju da čita, interpretira, izvršava i šalje dve instrukcije istovremeno. Jedinica za predvidjanje grananja: Ovaj sklop pokušava da pogodi koja sekvenca će biti izvršena svaki put kada program sadrži uslovni skok, tako da jedinica za prethodno donošenje i dekodovanje može unapred da pripremi instrukcije. Jedinica za obradu u pokretnom zarezu: Treća izvršna jedinica u Pentijumu u kojoj se vrše necelobrojna izračunavanja.

7 • Primarna skrivena memorija: Pentijum ima dve skrivene memorije na čipu, svaka od po 8 Kbajta, od kojih je jedna za kôd a druga za podatke i koje su daleko brže od veće spoljašnje sekundarne skrivene memorije. Sprega za magistralu: Ovaj sklop donosi centralnoj procesorskoj jedinici pomešane podatke i kôd, odvaja ih kada treba da se koriste i ponovo ih kombinuje i vraća natrag.

Slika 2: Glavni funkcionalni sastavni delovi procedsora Svi elementi procesora drže korak pomoću generatora takta koji diktira brzinu rada. Prvi mikroprocesor je imao generator takta na 100 KHz, dok Pentijum Pro koristi generator takta od 200 MHz, što će reći da ovaj sat "otkucava" 200 miliona puta u sekundu. Kada sat "otkucava" dešavaju se razne stvari. Programski brojač (Program Counter - PC) je jedna od lokacija u unutrašnjoj memoriji koja sadrži adresu sledeće instrukcije koja treba da se izvrši. Kada dodje vreme da se ona izvrši, upravljačka jedinica (Control Unit - CU) prenosi instrukciju iz memorije u njen registar za instrukciju (Instruction Register - IR). U isto vreme, sadržaj programskog brojača se uvećava, tako da pokazuje na sledeću instrukciju u sekvenci; procesor sada izvršava instrukciju koja se nalazi u registru za instrukciju. Neke instrukcije izvršava sama upravljačka jedinica, tako da ako neka od njih kaže "skoči na lokaciju 2749", 2749 se upisuje u programski brojač da bi procesor kao sledeću izvršio tu instrukciju. Mnoge instrukcije uključuju i aritmetičku i logičku jedinicu (Arithmetic and Logic Unit ALU). Ona radi sa registrima opšte namene - privremenim područjima u koja se mogu učitavati podaci iz, ili upisati podaci u RAM memoriju. Tipična instrukcija aritmetičke i logičke jedinice bi mogla da doda sadržaj memorijske lokacije registru opšte namene. Aritmetička i logička jedinica takodje menja bitove u registru stanja (Status Register - SR) kad god se

8 izvršava neka instrukcija; ovaj drži informaciju o rezultatu prethodne instrukcije. Tipično, bitovi registra stanja pokazuju da je rezultat bio 0, prekoračenje, prenos itd. Upravljačka jedinica koristi informacije u registru stanja da izvrši uslovne instrukcije kao što je na primer "skoči na adresu 7410 ako je prethodna instrukcija rezultovala prekoračenjem". Ovo bi bilo uglavnom sve u vezi sa osnovnim osobinama procesora i operacijama koje se izvršavaju upotrebom sekvenci jednostavnih instrukcija kao što su one koje smo upravo opisali.

Napredovanja u arhitekturi
Prema Moore-ovom zakonu (koji je 1965. godine formulisao Gordon Moore, jedan od osnivača firme Intel), centralne procesorske jedinice udvostručavaju svoje kapacitete i sposobnosti na svakih 18 do 24 meseca. Poslednjih godina Intel je uspevao da se uporno drži ovog zakona i ostane na čelu svih konkurenata, uvodeći više moćnih čipova za PC računare od bilo kog drugog preduzeća. 1978. godine, procesor Intel 8086 je radio na učestanosti generatora takta od 4,77 MHz i imao manje od milion tranzistora. Do kraja 1995. godine njihov Pentijum Pro je imao zapanjujućih 21 milion tranzistora na čipu i radio je na učestanosti od 200 MHz. Fizički zakoni ograničavaju projektante u beskrajnom povećavanju brzine generatora takta i, mada te brzine rastu svake godine, samo to ne bi dalo povećanja performanse na koja smo se navikli. To je razlog zašto inženjeri stalno traže načine da procesor preuzme na sebe sve više rada sa svakim otkucajem generatora takta. Jedan od pristupa je da se prošire magistrala podataka i registri. Čak i 4-bitni procesor može da sabere dva 32-bitna broja, ali je za to potrebno mnogo instrukcija, dok 32-bitni procesor može da obavi taj zadatak u jednoj jedinoj instrukciji. Većina današnjih procesora ima 32-bitnu arhitekturu, ali već stižu i 64-bitne varijante. U prvim danima, procesori su mogli da rade samo sa celim brojevima. Bilo je moguće napisati program da se radi sa razlomcima pomoću jednostavnih instrukcija, ali bi to bilo sporo. Gotovo svi današnji procesori imaju instrukcije za direktan rad sa brojevima u pokretnom zarezu. Kada se kaže "da se neke stvari dešavaju sa svakim otkucajem generatora takta", potcenjuje se koliko je stvarno vremena potrebno da bi se izvršila neka instrukcija. Tradicionalno, potrebno je pet taktova - jedan da se učita instrukcija, jedan da se dekodira, jedan da se uzme podatak, jedan da se instrukcija izvrši i jedan da se upiše rezultat. U ovom slučaju, vidi se da je procesor koji radi na 100 MHz sposoban da izvrši 20 miliona instrukcija u sekundi. Većina procesora danas primenjuje protočnu obradu (pipelining) koja podseća na fabričku proizvodnu liniju. Jedan stepen u protočnoj obradi posvećen je svakom koraku potrebnom da se izvrši instrukcija i svaki stepen prepušta instrukciju sledećem stepenu kada završi sa njom. To znači da u bilo kom trenutku vremena, jedna instrukcija je učitana, druga je dekodovana, za treću je uzet podatak, četvrta se stvarno izvršava i rezultat se upisuje za petu. Sa savremenom tehnologijom, na taj način se postiže da se izvršava jedna instrukcija po jednom taktu generatora. Pored toga, mnogi procesori sada imaju superskalarnu arhitekturu. To znači da je elektronika za svaki stepen protočne obrade udvostručena, tako da više instrukcija može da prolazi paralelno. Na primer, Pentijum Pro može da izvršava do pet instrukcija po ciklusu njegovog generatora takta.

9

Proizvodni proces
Ono što razlikuje mikroprocesor od njegovih prethodnika konstruisanih od elektronskih cevi, pojedinačnih tranzistora ili malih integrisanih kola, je to što je nam je on, po prvi put, doneo potpun procesor na jednom čipu od silicijuma. Silicijum je osnovni materijal od koga se prave čipovi. On je "poluprovodnik" koji, kada se u njega unesu primese u odgovarajućem obliku, postane tranzistor, osnovni blok za izgradnju digitalnih kola. Proces obuhvata "graviranje" tranzistora, otpornika, linija za medjusobno povezivanje i ostalog na površini silicijuma. Prvo se razvije šipka od silicijuma. To mora da bude savršena kristalna struktura, bez grešaka, što je činilac koji ograničava njenu veličinu. U prvim danima, šipke su bile ograničene na prečnik od 2 inča, dok su danas uobičajeni prečnici i od 8 inča. U sledećoj fazi, šipka se seče na tanke kružne pločice. One se zatim poliraju sve dok ne dobiju besprekornu površinu sličnu ogledalu. Na ovim pločicama se prave čipovi. Tipično se napravi na desetine mikroprocesora od jedne pločice. Integrisana kola se grade u slojevima. Slojevi su napravljeni od različitih materijala. Na primer, silicijum-dioksid je izolator, a polisilicijum se koristi za provodne linije. Kada se izloži čisti silicijum, on može da se bombarduje jonima da bi se proizveli tranzistori - što se naziva unošenje primese, ili dopovanje. Da bi se napravile tražene osobine, dodaju se slojevi koji pokrivaju celu površinu pločice, a onda se suvišni delovi uklanjaju graviranjem Da bi se to izvelo, novi sloj se pokriva sa fotootpornim materijalom, na koji se projektuje slika zahtevanog oblika koji daje traženu karakteristiku. Posle ekspozicije, razvijanjem se otklanjaju oni delovi foto-otpornog materijala koji su bili izloženi svetlu, ostavljajući masku kroz koju može da se obavi graviranje. Posle toga se preostali foto-otporni materijal uklanja pomoću rastvarača. Ovaj proces se nastavlja, po jedan sloj istovremeno, sve dok se ne izgradi celo kolo. Ne treba posebno naglašavati da sa karakteristikama koje su napravljene uz merenja veličina manjih od milionitog dela metra, najmanja čestica prašine može da napravi pravi haos u strukturi. Čestice prašine mogu da budu bilo koje veličine izmedju 1 i 100 mikrona, odnosno 3 do 300 puta veće od strukture koja se pravi. Mikroprocesori se zato prave u "čistim sobama" - okruženju izuzetne čistoće u kome radnici nose "svemirska" zaštitna odela. U prvim danima, proizvodnja poluprovodnika svodila se na pogotke i promašaje, sa koeficijentom uspešnosti od manje od 50% po pločici. Danas se dobijaju viši prinosi, ali niko ne očekuje celih 100%. Čim se svi slojevi dodaju na pločicu, svi čipovi se ispituju i označava svaki koji ima grešku. Zatim se pojedini čipovi razdvajaju i od tog trenutka se nazivaju integrisanim kolima. Ona neispravna se odbacuju, dok se dobra pakuju u matrice pinova (Pin Grid Array - PGA) - keramičke pravougaonike sa redovima pinova na dnu, za koje većina ljudi zamišlja da su mikroprocesori. Procesor 4004 je koristio 10-mikronski proces: najmanja dimenzija je bila dužine 10 milionitih delova metra. Po današnjim standardima, to je OGROMNO. Na primer, Pentijum Pro bi pod takvim ograničenjem bio veličine oko 5,5 x 7,5 inča, a bio bi i spor; brzi tranzistori mora-

10 ju da budu mali. Do 1998. godine većina procesora koristila je 0,25-mikronski proces - dok je 0,1 mikron postao srednjoročni cilj mnogih proizvodjača.

Softverska kompatibilnost
U prvim danima računarstva, mnogi ljudi su pisali svoj sopstveni softver, tako da je tačan skup instrukcija koje bi procesor mogao da izvršava bio od malog značaja. Danas, medjutim, ljudi očekuju da mogu da koriste gotov softver, tako da je skup instrukcija najvažniji. Mada sa tehničke tačke gledišta arhitektura procesora Intel 80x86 nije ništa posebno, ona je odavno postala industrijski standard. Ako treće lice pravi procesor koji ima različite instrukcije, on neće moći da izvršava standardni industrijski softver, što će rezultovati praktično nikakvom prodajom. Zato su, u vreme procesora 386 i 486, firme kao što je AMD klonirale Intel-ove procesore, što je značilo da su one bile uvek za oko jednu generaciju u zaostatku. Procesori Cyrix 6x86 i AMD K5 su bili suparnici Intel-ovom Pentijumu, ali oni nisu bili kopije "pod indigo-papirom". K5 je imao svoj sopstveni skup instrukcija i prevodio je instrukcije 80x86 u svoje pre nego što ih je uzimao u obradu, tako da firma AMD nije morada da čeka na Pentijum da bi projektovala svoj K5. Mnogo toga oni su projektovali paralelno sa Intel-om - samo je sklop za prevodjenje bio zadržavan. Kada se K5 pojavio, on je nadmašio Pentijum u performansi u slučajevima kada su brzine generatora takta bile podjednake. Drugi način na koji su procesori sa različitim arhitekturama imali izvestan stepen uniformnosti u odnosu na spoljašnji svet, bio je preko standardnih magistrala. Od svoje pojave u 1994. godini, magistrala PCI bila je jedan od najvažnijih standarda u ovom pogledu. Magistrala PCI definiše skup signala koji omogućavaju procesoru da komunicira sa ostalim delovima PC računara. Ona obuhvata magistrale za adrese i podatke i još jedan broj upravljačkih signala. Procesori imaju svoje sopstvene magistrale, tako da se koristi skup čipova za prevodjenje sa tih "privatnih" na "javnu" PCI magistralu.

Pentijum
Reč Pentijum ne znači ništa, ali sadrži slog pent, grčki koren za broj pet. Na početku, Intel je nazvao ovaj procesor 80586, da bi nastavio seriju prethodnika ovog čipa 80x86. Ali, kompaniji se nije dopala ideja da AMD, Cyrix i drugi proizvodjači klonova takodje koriste ime 80x86, pa je zato Intel odlučio da novom proizvodu da zaštićeno ime - odatle Pentijum. Uvodjenje Pentijuma u 1993. godini napravilo je revoluciju na tržištu PC računara, stavljanjem više moći u PC kućište nego što je NASA imala u svojim klimatizovanim računarskim salama ranih 1960-ih godina. Pentijumova CISC arhitektura predstavljala je skok napred u odnosu na procesore 486. Verzije sa 120 MHz i više, imale su preko 3,3 miliona tranzistora, proizvedenih u 0,35-mikronskom procesu. U svojoj unutrašnjosti, procesor je imao 32-bitnu magistralu, ali spoljna magistrala podataka imala je širinu od 64 bita. Spoljna magistrala je zahtevala drukčiju matičnu ploču i da bi to podržao, Intel je takodje uveo poseban skup čipova za povezivanje Pentijuma sa 64-bitnom spoljašnom skrivenom memorijom i PCI magistralom. Većina Pentijuma (75 MHz i više) radila je na 3,3V sa 5V za ulazno/izlaznu zaštitu. Pentijum je imao dvostruku superskalarnu konstrukciju za protočnu obradu, koja mu je dozvoljavala da izvršava više instrukcija po ciklusu generatora takta. Još uvek postoji pet faza (donošenje, de-

11 kodiranje instrukcije, generisanje adrese, izvršavanje i vraćanje rezultata) u izvršenju celobrojnih instrukcija, kao kod procesora 486, ali Pentijum ima dve paralelne celobrojne protočne obrade, koje mu omogućavaju da čita, interpretira, izvršava i šalje dve operacije istovremeno. Ovi sklopovi mogu da rade samo celobrojne proračune - posebna jedinica za pokretni zarez "opslužuje" realne brojeve.

Slika 3: Arhitektura procesora Pentijum Pentijum takodje koristi dva dvosmerna asocijativna bafera od po 8 Kbajta (koji su poznati i kao primarne, odnosno skrivene memorije prvog nivoa), jedan za instrukcije a drugi za podatke. Ove skrivene memorije doprinose povećanoj performansi, jer one deluju kao privremeni memorijski prostor za instrukcije i podatke dobijene iz sporije glavne memorije. Bafer za pogadjanje grananja (Branch Target Buffer - BTB) obezbedjuje dinamičko predvidjanje grananja. BTB sklop poboljšava izvršavanje instrukcija "pamćenjem" gde je bilo poslednje grananje i primenom istog grananja kada se ta instrukcija koristi sledeći put. Kada sklop BTB napravi tačno predvidjanje, performansa se poboljšava. Jedinica za rad u pokretnom zarezu obezbedjuje aritmetičku mašinu koja "opslužuje" realne brojeve. Sledeća tabela prikazuje različite verzije procesora Pentijum, od njegovog uvodjenja u 1993. godini, do predstavljanja procesora Pentijum MMX: Godina 1993 1994 1995 1996 Kodirano ime Broj tranzistora P5 P54 P54 P54 3,100,000 3,200,000 3,300,000 3,300,000 Proizvodni proces (μm) 0.80 0.50 0.35 0.35 Brzina (MHz) 60/66 75/90/100/120 120/133 150/166/200

12

Pentium Pro
Intel-ov Pentijum Pro, koji je bio uveden krajem 1995. godine sa jezgrom centralne procesorske jedinice koje se sastojalo od 5,5 miliona tranzistora i 15,5 miliona tranzistora u skrivenoj memoriji drugog nivoa, bio je prvo namenjen tržištu servera i vrhunskih radnih stanica. To je superskalarni procesor koji ima procesorske osobine višeg reda, optimizovan za rad na 32 bita. Pentijum Pro je isto tako bio i prvi Intel-ov procesor koji nije koristio cenjeno podnožje tipa Socket 7, zahtevajući veći 242-pinski interfejs podnožja tipa Socket 8 i novu konstrukciju matične ploče. Pentijum Pro se razlikuje od Pentijuma po tome što ima skrivenu memoriju drugog nivoa na čipu kapaciteta izmedju 256 Kbajta i 1 Mbajta koja radi na učestanosti unutrašnjeg generatora takta. Smeštanje sekundarne skrivene memorije na čip, a ne na matičnu ploču, omogućava signalima da prolaze preko 64-bitnog spojnog puta za podatke, a ne preko 32-bitnog puta Pentijumovih sistemskih magistrala. Fizička bliskost takodje doprinosi poboljšanju performanse. Kombinacija je toliko moćna da Intel izjavljuje kako je 256 Kbajta skrivene memorije na čipu ekvivalentno ili čak nadmašuje 2 Mbajta skrivene memorije na matičnoj ploči. Čak veći faktor poboljšanja performanse procesora Pentijum Pro dobijen je zahvaljujući kombinaciji tehnologija koja je poznata kao "dinamičko izvršenje". Ovo obuhvata predvidjanje grananja, analizu toka podataka i spekulativno izvršenje. Ova kombinacija omogućava procesoru da koristi one cikluse generatora takta koji bi inače bili neiskorišćeni, pomoću predvidjanja toka programa da bi se instrukcije unapred izvršavale. Pentijum Pro je takodje bio prvi procesor u familiji x86 koji je primenio superprotočnu obradu, koja ima 14 koraka podeljenih u tri sekcije. Prva sekcija se stara o dekodiranju i izdavanju instrukcija i sastoji se od osam koraka. Jezgro za vanrednu obradu koje izvršava instrukcije ima tri koraka a zadnja sekcija ima takodje tri koraka.

13 Slika 4: Arhitektura procesora Pentijum Pro Druga, kritičnija razlika Pentijuma Pro u odnosu na prethodnike je njegova obrada instrukcija. On uzima instrukcije x86 računara sa složenim skupom instrukcija (CISC) i pretvara ih u interni skup mikrooperacija računara sa smanjenim skupom instrukcija (RISC). Ovo pretvaranje se radi da bi se izbegla neka ograničenja koja su urodjena skupu instrukcija x86, kao što je nepravilno kodiranje instrukcija i aritmetičke operacije tipa registar-ka-memoriji. Mikrooperacije se onda daju na obradu mašini za vanredno izvršavanje koja odredjuje da li su instrukcije spremne za izvršavanje; ako nisu, one se mešaju, da bi se sprečilo blokiranje protočne obrade. Postoje nedostaci primene RISC pristupa. Prvi je u tome što je za pretvaranje instrukcija potrebno vreme, čak i ako se ono računa u nano ili mikrosekundama. Rezultat je uticaj Pentijuma Pro na performansu kada obradjuje instrukcije. Drugi nedostatak je da konstrukcija sa vanrednom obradom može trpeti negativan uticaj od 16-bitnog kôda, što za rezultat može da ima blokiranje računara. Njihov uzrok je u delimičnom ažuriranju sadržaja registara koja se pojavljuju pre čitanja punog sadržaja registara, što može imati za posledicu gubitke u performansi i do sedam ciklusa generatora takta. Sledeća tabela prikazuje različite varijante procesora Pentijum Pro, počevši od njegovog uvodjenja 1995. godine: Godina 1995 1995 1997 Kodirano ime P6 P6 P6 Broj Keš memorija Proizvodni Brzina (MHz) tranzistora drugog nivoa proces (μm) 5,500,000 256/512KB 0.50 150 5,500,000 256/512KB 0.35 160/180/200 5,500,000 1MB 0.35 200

MMX
Intel-ov P55C MMX procesor sa proširenjima za multimedijalne primene bio je uveden početkom 1997. godine. On je predstavljao najznačajniju promenu osnovne arhitekture PC procesora u toku deset godina i obezbedio je tri glavna poboljšanja. To su: • • • skrivena memorija prvog nivoa na ploči standardnog Pentijuma bila je udvostručena na 32Kbajta; 57 dodatih novih instrukcija koje su bile posebno projektovane da efikasnije obradjuju video, audio i grafičke podatke; razvijen novi proces, nazvan Jedna instrukcija - višestruki podaci (Single Instruction Multiple Data - SIMD), koji je omogućio da jedna instrukcija izvede istu funkciju nad više podataka istovremeno.

Veća primarna skrivena memorija znači da će procesor imati više informacija pri ruci, što smanjuje potrebu za izvlačenjem podataka iz skrivene memorije drugog nivoa, odnosno dobrobobit za celokupan softver. Nove instrukcije, u kombinaciji sa SIMD i osam povećanih registara procesora P55 (od po 64 bita), daju intenzivnu upotrebu paralelizma, gde osam bajtova podataka može da se obradjuje u jednom ciklusu, umesto jednog bajta po ciklusu. Ovo je posebna prednost u multimediji i grafičkim primenama kao što su audio i video kodovanje/dekodovanje, srazmerna promena veličine slike i interpolacija. Umesto pomeranja osam piksela grafičkih podataka u procesor po jedan istovremeno, da bi se odvojeno obradjivali,

14 osam piksela se mogu pomerati kao jedna 64-bitna pakovana vrednost i obradjivati odjednom, pomoću jedne jedine instrukcije. Intel je izjavio da su ova poboljšanja dala 10-20% povećanja brzine za upotrebu ne-MMX softvera i oko 60% poboljšanja za primene omogućene za MMX. Sledeća tabela prikazuje različite varijante procesora Pentijum MMX od njegovog uvodjenja 1997. godine do predstavljanja procesora Pentijum II: Godina 1997 1998 Kodirano ime P55 P55 Broj tranzistora 4,500,000 4,500,000 Proizvodni proces (μm) 0.28 0.25 Brzina (MHz) 166/200/233 266

Pentijum II
Uveden sredinom 1997. godine, Pentijum II je doneo veći broj važnih promena u oblasti procesora PC računara: • • Prvo, sam čip i sistemska skrivena memorija drugog nivoa su povezani pomoću posebne namenske magistrale koja je mogla da radi istovremeno sa magistralom koja povezuje procesor sa sistemom. Drugo, procesor, sekundarna skrivena memorija i rashladni element su svi montirani na malu ploču koja se uključuje u slot na matičnoj ploči, na način koji više potseća na dodatne kartice nego na tradicionalni raspored procesor/podnožje. Intel je ovo nazvao jednoivični kertridž (single-edge cartridge - SEC). Treća promena je stvarno više sinteza, jer Pentijum II ujedinjuje osobinu udvojenih nezavisnih magistrala (Dual Independent Bus - DIB) Pentijuma Pro sa MMX poboljšanjima, praveći tako novu vrstu Pentijum Pro/MMX hibrida. Prema tome, dok izgleda vrlo različito u odnosu na prethodne Intel-ove procesore, u svojoj unutrašnjosti Pentijum II je mešavina novih tehnologija i poboljšanja onih starijih.

Za razliku od Pentijuma Pro koji radi na 3,3V, Pentijum II radi na 2,8V, dozvoljavajući tako Intel-u da koristi više učestanosti bez preteranog povećavanja zahteva za napajanjem. Dok Pentijum Pro na 200 MHz sa skrivenom memorijom od 512 Kbajta troši oko 37,9 W snage, Pentijumu II na 266 MHz sa skrivenom memorijom od 512 Kbajta potrebno je 37,0 W. Kao Pentijum Pro, Pentijum II takodje koristi tehnologiju dinamičkog izvršavanja. Kada se softverske instrukcije učitavaju u procesor i dekodiraju, one se unose u područje za izvršavanje. Tehnologija za dinamičko izvršavanje usvaja tri glavna pristupa optimizovanju načina na koji procesor radi sa tim kôdom. Višestruko predvidjanje grananja ispituje tok programa kroz više grana i predvidja gde će se sledeća instrukcija pronaći u memoriji. Dok procesor učitava, on takodje proverava instrukcije dalje u protočnoj obradi, što kao rezultat ubrzava obavljanje procesa rada. Analiza toka podataka optimizuje redosled u kome će instrukcije biti izvršavane, ispitivanjem dekodovanih instrukcija i odredjivanjem da li su one spremne za izvršavanje, ili zavise od nekih drugih instrukcija. Spedkulativno izvršenje povećava brzinu rada sa instrukcijama gledanjem trenutne instrukcije unapred i obradom onih sledećih instrukcija koje će verovatno biti potrebne. Ti rezultati se onda pamte kao spekulativni

15 rezultati, sve dok procesor ne sazna koji će od njih biti potrebni, a koji ne. Na toj tački se instrukcije vraćaju u svoj normalni poredak i dodaju osnovnom toku. Postoje dve osnovne prednosti tehnologije dinamičkog izvršavanja: instrukcije se brže i efikasnije obradjuju nego što je to uobičajeno i, za razliku od centralnih procesorskih jedinica koje koriste RISC arhitekturu, programi ne moraju ponovo da se prevode da bi se izvuklo najbolje od procesora. Centralna procesorska jedinica sve to radi u letu.

Slika 5: Pentijum II, dvoprocesorska konstrukcija Pentijum II primenjuje glavnu magistralu sa GTL logikom koja podržava direktno povezivanje dva procesora. U vreme kada se pojavio, to je obezbedilo ekonomičnu, minimalnu dvoprocesorsku konstrukciju koja je dozvoljavala simetričnu višeprocesorsku obradu. Ograničenje na dva procesora nije postavio Pentijum II sam po sebi, nego skup čipova (chipset) matičnih ploča. Prvobitno ograničavanje skupa čipova na dvoprocesorske konfiguracije, dozvolilo je firmi Intel i prodavcima radnih stanica da ponude dvoprocesorske sisteme na brži i ekonomičniji način od bilo čega drugog što je tada bilo moguće. Ovo ograničenje je uklonjeno sredinom 1998. godine, uvodjenjem skupa čipova 450NX koji je podržavao rad 1 do 4 procesora. Skup čipova 440FX koji se sastojao od PMC i DBX čipova, nije nudio preplitanje memorije, ali je podržavao EDO DRAM, dozvoljavajući poboljšanu performansu memorije smanjivanjem kašnjenja generatora takta. Kada je Intel projektovao Pentijum II, on se takodje latio i slabe performanse na 16 bita njegovog prethodnika. Pentijum Pro je sjajan kada radi sa punim 32-bitnim softverom kao što je Windows NT, ali je iza čak i standardnog Pentijuma kada izvršava 16-bitni kôd. To je bilo gore od performanse Pentijuma pod operativnim sistemom Windows 95, čiji su veliki delovi još uvek 16-bitni. Intel je rešio ovaj problem upotrebom Pentijumove skrivene memorije za opis segmenata u Pentijumu II. Kao i Pentijum Pro, Pentijum II je izuzetno brz za aritmetiku u pokretnom zarezu. Uz Ubrzani grafički port (Accelerated Graphics Port - AGP) ovo će učiniti Pentijum II moćnim rešenjem za trodimenzionalnu grafiku visoke performanse.

16

SEC Tehnologija kertridža sa jednoivičnim kontaktom (SEC) primenjena u Pentijumu II dozvoljava da jezgro i skrivena memorija drugog nivoa budu potpuno zatvoreni u kaseti od plastike i metala. Ovi sastavni podsklopovi su površinski montirani direktno na supstratu unutar kertridža da bi se omogućio rad na visokim učestanostima. Kertridž dozvoljava upotrebu široko rasprostanjenih industrijskih statički RAM memorija za namensku skrivenu memoriju drugog nivoa, omogućavajući tako obradu sa visokom performansom, po cenama uobičajenim za glavne proizvodne tokove. Postoji šest pojedinačno pakovanih uredjaja na supstratu SEC kertridža: procesor, četiri statičke RAM skrivene memorije po industrijskom standardu i jedna RAM memorija sa kontrolnim kôdom. PGA pakovanje primenjeno u Pentijumu Pro je zahtevalo 387 pinova, dok SEC kertridž koristi samo 242. Ovo smanjivanje broja pinova za trećinu je posledica toga što SEC kertridž sadrži diskretne sastavne delove, kao što su završni otpornici i kondenzatori. Ovi delovi obezbedjuju razdvajanje signala, što znači da se traži manje pinova za napajanje. Slot koji se koristi u SEC kertridžu se zove Slot 1 i može da se posmatra kao nešto što je preuzelo funkciju prethodne procesorske montaže Podnožje 7. DIB Arhitektura udvojenih nezavisnih magistrala (DIB) - prvi put primenjena u procesoru Pentijum Pro - stvorena je da se poveća propusni opseg procesora. Pentijum II ima dve (udvojene) nezavisne magistrale, što mu omogućava da pristupi podacima preko bilo koje od svojih magistrala istovremeno i paralelno, a ne na pojedinačan sekvencijalni način, kao što je to slučaj u sistemu sa jednom magistralom. Procesor učitava i piše podatke na i iz skrivene memorije drugog nivoa koristeći specijalizovanu brzu magistralu. Ona se zove pozadinska magistrala (backside bus) i odvojena je od sistemske magistrale, koja spaja centralnu procesorsku jedinicu i glavnu memoriju (ona se sada zove čeona magistrala - frontside bus). Arhitektura DIB dozvoljava procesoru da koristi obe magistrale istovremeno, a isto tako donosi i druge prednosti. Dok magistrala izmedju centralne procesorske jedinice i skrivene memorije drugog nivoa radi sporije nego na konvencionalnom procesoru Pentijum Pro (na polovini brzine procesorskog generatora takta), ona je veoma skalabilna. Kako procesor ubrzava, to radi i skrivena memorija, nezavisno od čeone magistrale. Pored toga, brzine čeone magistrale mogu da se povećavaju bez uticaja na magistralu skrivene memorije drugog nivoa. Veruje se, takodje, da je proizvodnja memorije na istom silicijumu kao i centralne procesorske jedinice, loše uticalo na prinose Pentijuma Pro sa 512 Kbajta, što je imalo za posledicu visoke cene. Čeona magistrala sa protočnom obradom takodje omogućava višestruke istovremene transakcije (umesto pojedinačnih sekvencijalnih transakcija), ubrzavajući tok informacija unutar sistema i povećavajući ukupnu performansu. Sve zajedno, poboljšanja arhitekture udvojenih nezavisnih magistrala obezbedile su povećanje propusnog opsega do tri puta u odnosu na arhitekturu procesora sa jednom magistralom - kao i podršku razvoju sistemske magistrale na 100 MHz.

17

Deschutes
Varijanta Pentijuma II na 333 MHz pod nazivom "Deschutes", prema reci koja teče kroz američku državu Oregon, objavljena je početkom 1998. godine, sa učestanostima generatora takta od 400 MHz i višim planiranim za kasniji period u toj godini. Ime Deschutes se u stvari odnosi na dve različite linije centralnih procesorskih jedinica. Verzija sa Slotom 1 nije ništa drugo nego nešto razvijeniji Pentijum II. Arhitektura i fizička konstrukcija su identični, sem što je deo Deschutes-a Slot 1 napravljen upotrebom 0,25-mikronske tehnologije uvedene u jesen 1997. godine sa centralnom procesorskom jedinicom prenosivog računara Tillamook, a ne 0,35-mikronskog proizvodnog procesa koji je korišćen za delove koji rade na učestanostima 233 MHz do 300 MHz. Upotreba 0,25-mikronskog procesa znači da su tranzistori na čipu medjusobno bliži, da centralna procesorska jedinica troši manje snage i zbog toga generiše manje rasipne toplote na datoj učestanosti generatora takta, dozvoljavajući jezgru da bude taktovano na višim učestanostima. Sve drugo u vezi sa procesorom Slot 1 Deschutes je identično na običnom Pentijumu II. Montiran na supstratu i zatvoren u kertridžu sa jednoivičnim kontaktom (SEC), on uključuje skup instrukcija MMX i sprege sa svojom sekundarnom skrivenom memorijom od 512 Kbajta koje rade na polovini brzine generatora takta jezgra. On ima isti ivični konektor i radi na istim matičnim pločama, sa istim skupovima čipova. Kao takav, on još uvek radi sa skupovima čipova 440FX ili 440LX na brzini spoljašnje magistrale od 66 MHz. Početkom 1998. godine došlo je do mnogo većeg skoka u performansi sa novom varijantom procesora Deschutes, kada je dolazak novog skupa čipova 440BX dozvolio propusni opseg sistemske magistrale od 100 MHz, smanjujući uska grla podataka, sa podržavajućim generatorima takta učestanosti od 350 MHz i više. Do početka 1999. godine najbrži stoni Pentijum II je imao procesor koji je radio na 450 MHz. Drugi procesor na koji se odnosi ime Deschutes je deo Slot 2, uveden sredinom 1998. godine kao procesor Pentium II Xeon. Intel je ubacio Deschutes Slot 1 i Slot 2 kao komplementarne proizvodne linije, gde je Slot 1 projektovan za masovnu proizvodnju, a Slot 2 za vrhunske servere i slične primene, gde su troškovi manjeg značaja od performanse. Sledeća tabela prikazuje različite varijante procesora Pentijum II, od njegovog uvodjenja 1997. godine, do pojave procesora Pentium Xeon: Godina 1997 1998 Kodirano ime Broj tranzistora Proizvodni proces (μm) Brzina (MHz) Klamath 7,500,000 0.28 233/266/300 Deschutes 4,500,000 0.25 333/350/400

Celeron
U pokušaju da se bolje obrati sektoru PC računara niske cene, do tada carstvu proizvodjača klonova, firmi AMD i Cyrix, koje su nastavile da razvijaju nasledjenu arhitekturu oko Podnožja 7, Intel je u aprilu 1998. godine uveo svoj niz procesora Celeron.

18 Zasnovani na istoj arhitekturi P6 kao i Pentijum II i koristeći isti 0,25-mikronski proizvodni proces, sistemi Celeron nude celokupno pakovanje najnovijih tehnologija, uključujući podršku AGP grafici, pogone diskova ATA-33, sinhronu dinamičku memoriju sa direktnim pristupom (SDRAM) i ACPI. Celeron će raditi sa svakim skupom čipova za Intel Pentijum II koji podržava sistemsku magistralu od 66 MHz, uključujući 440LX, 440BX i novi 440EX, koji je posebno projektovan za tržište "osnovnih PC računara". Za razliku od Pentijuma II sa njegovim pakovanjem u kertridžu sa jednoivičnim kontaktom (SEC), Celeron nema plastičnu zaštitnu oblogu oko procesorske kartice, što Intel zove Jednoivično procesorsko pakovanje (Single Edge Processor Package - SEPP). On je još uvek kompatibilan sa Slotom 1, dozvoljavajući da se koriste postojeće matične ploče, ali mehanizam za zadržavanje kartice centralne procesorske jedinice treba da se prilagodi da bi mogao da radi sa SEPP faktorom forme. Prvi Celeroni na 266MHz i 300MHz, bez skrivene memorije drugog nivoa, nisu baš naišli na neki oduševljen odziv tržišta, jer su nudili malu ili nikakvu prednost u odnosu na sisteme sa Podnožjem 7 zasnovane na klonovima, a ipak ne uspevajući da daju značajnije preimućstvo u performansi. U avgustu 1998. godine, Intel je pojačao svoj niz Celeron sa procesorom prvobitno nazvanim Mendocino. Shodno tome, počevši od tipa 300A, svi celeroni su došli opremljeni sa 128 Kbajta skrivene memorije drugog nivoa na čipu koje su radile punom brzinom centralne procesorske jedinice, uz spoljašnju komunikaciju preko magistrale od 66 MHz. Ovo je učinilo novije Celerone daleko sposobnijim od njihovih tromih prethodnika. Ono što donekle zbunjuje je činjenica da su svi procesori Celeron, od 300A do 466 MHz, bili raspoloživi u dve verzije - u faktorima forme SEPP ili plastična matrica pinova (plastic pin grid array - PPGA). Prvi od njih je verzija za glavni tok proizvodnje, kompatibilan sa postojećom Intel-ovom arhitekturom oko Slota 1, dok je drugi Podnožje Pin 370 koje nije ni Podnožje 7 ni Slot 1. Upotreba podnožja, pre nego slota, daje projektantima matičnih ploča više fleksibilnosti, jer podnožje zauzima manje mesta i istovremeno ima bolje karakteristike disipacije toplote. Posledica je da ono obezbedjuje proizvodjačima originalne opreme više mogućnosti za konstrukcije sistema manje cene. Verzija od 500 MHz bila je raspoloživa samo u PPGA pakovanju. U proleće 2000. godine situacija sa pakovanjem je postala još složenija sa najavom prvih procesora Celeron proizvedenih upotrebom 0,18-mikronske tehnologije, koji su bili pravljeni u još jednom faktoru forme - Intel-ovom jevtinom pakovanju FC-PGA. To je najavilo kraj i PPGA i Slot 1 stila pakovanja, uz kasnije čipove Pentijum III koji su takodje podržavali faktor forme FC-PGA. Matične ploče projektovane za 370-pinsko podnožje neće podržavati procesor Pentijum III u faktoru forme FC-PGA. Procesori Pentijum III u FC-PGA imaju dva pina za RESET i zahtevaju specifikacije VRM 8.4. Postojeće matične ploče se nazivaju nasledjenima, a novije matične ploče koje podržavaju drugi pin za RESET i VRM 8.4 su poznate kao fleksibilne matične ploče. Sledeća tabela prikazuje različite verzije procesora Pentijum II Celeron, od njegove pojave 1998. godine: Godina 1998 1998 1999 2000 Kodirano ime Covington Mendocino Mendocino Mendocino Broj tranzistora 7,500,000 19,000,000 19,000,000 19,000,000 Proizvodni proces (μm) 0.25 0.25 0.25 0.18 Brzina (MHz) 266/300 300A/333 366 to 500 566 to 700

19

Pentium II Xeon
U junu 1998. godine Intel je predstavio svoj procesor Pentijum II Xeon, za brzinu od 400 MHz. Tehnički, Xeon predstavlja kombinaciju tehnologija Pentijuma Pro i Pentijuma II i konstruisan je da ponudi izuzetnu performansu u kritičnim primenama za radne stanice i servere. Koristeći novu spregu Slot 2, Xeon je skoro dva puta veći od Pentijuma II, prvenstveno zbog povećane skrivene memorije drugog nivoa. Sistem skrivene memorije je sličan onome u Pentijumu Pro, što je jedan od glavnih činilaca koji su uticali na cenu. Drugi je statička memorija sa direktnim pristupom, sa kôdom za ispravljanje grešaka (ECC SRAM) koja će postati standard za sve procesore Xeon. Kada je uveden, čip je bio raspoloživ sa skrivenim memorijama drugog nivoa, kapaciteta od 512 Kbajta ili 1 Mbajta. Prva varijanta je bila namenjena tržištu radnih stanica, a druga za implementacije servera. Verzija od 2 Mbajta se pojavila kasnije u 1999. godini. Kao kod centralnih procesorskih jedinica Pentijum II za 350 MHz i 400 MHz, čeona magistrala radi na 100 MHz da bi se poboljšao propusni opseg sistema. Najdramatičnije poboljšanje u odnosu na standardni Pentijum II je u tome što skrivena memorija drugog nivoa radi na istoj brzini kao i jezgro centralne procesorske jedinice, što je suprotno od konstrukcija Slot 1 koje ograničavaju skrivenu memoriju drugog nivoa na polovinu učestanosti jezgra, dozvoljavajući tako Intel-u da koristi jevtinije gotove statičke RAM memorije za skrivenu memoriju drugog nivoa, a ne da proizvodi svoje sopstvene. Daleko skuplja sopstvena skrivena memorija drugog nivoa koja radi punom brzinom će postati glavni razlog za razliku u ceni izmedju delova za Slot 1 i Slot 2. Još jedno ograničenje koje će prevazići Slot 2 je granica udvojene simetrične višeprocesorske obrade. Nemogućnost da funkcionišu sistemi Pentijum II sa više od dve centralne procesorske jedinice bila je glavni razlog preživljavanja Pentijuma Pro u sektoru vrhunskih servera, gde mogu biti zahtevane višeprocesorske konfiguracije. Sistemi zasnovani na procesoru Pentijum II Xeon mogu biti konfigurisani tako da imaju četiri do osam procesora, pa i više od toga. Mada je Intel odlučio da nameni Xeon tržištima kako radnih stanica tako i servera, on je razvio različite skupove čipova matičnih ploča za svaku od ovih primena. Skup čipova 440GX je izgradjen oko jezgra arhitekture skupa čipova 440BC i namenjen je za radne stanice. Sa druge strane, skup čipova 440NX je konstruisan posebno za tržište servera. Do početka 1999. godine prihvatanje procesora Xeon bilo je nešto sporije. To je bilo uglavnom zato što procesori Xeon nisu bili raspoloživi sa dovoljno visokim učestanostima generatora takta u odnosu na brže Pentijume II koje bi opravdale njihovu visoku cenu. Medjutim, inovativni proizvod firme SuperMicro izgledao je spreman da poboljša Xeon-ove nade - naročito ako bi ga usvojili drugi proizvodjači matičnih ploča. Koristeći činjenicu da centralne procesorske jedinice i Pentijuma II i Xeon-a dele istu mikroarhitekturu P6 i zato rade na vrlo sličan način, SuperMicro je projektovao adapter jednostavnog izgleda koji dozvoljava da se standardni Pentijum II/350, ili brži, uključi u njihovu novu matičnu ploču S2DGU. Ova dovitljiva konstrukcija je omogućila - po prvi put - nadgradnju izmedju dve različite arhitekture x86 bez potrebe promene matične ploče. Sledeća tabela prikazuje različite varijante procesora Pentijum II Xeon od njegovog uvodjenja 1998. godine:

20 Godina 1998 1999 Broj tranzistora 7,500,000 (PII) 9,500,000 (PIII) Keš memorija drugog nivoa 512KB/1MB 2MB Proizvodni proces (μm) 0.25 0.25 Brzina (MHz) 400/450 450

Pentium III
Intel-ov naslednik Pentijuma II, prvobitno nazvan Katmai, došao je na tržište u proleće 1999. godine. Sa uvodjenjem procesora MMX, došao je i proces nazvan Jedna instrukcija - višestruki podaci (SIMD). To je omogućilo da jedna instrukcija izvede istu funkciju na više podataka istovremeno, povećavajući brzinu kojom su skupovi podataka koji su zahtevali iste operacije mogli biti obradjivani. Novi procesor je uveo 70 dodatnih SIMD proširenja - ali nije napravio nikakva poboljšanja u arhitekturi. Od tih novih SIMD proširenja, 50 je bilo namenjeno poboljšanju performanse za rad u pokretnom zarezu. Da bi se pomoglo manipulisanje podacima, postoji osam novih 128-bitnih registara. U kombinaciji, ova poboljšanja su dovela do toga da je do četiri rezultata u pokretnom zarezu moglo biti vraćeno u svakom ciklusu procesora. Postoji takodje 12 novih instrukcija za medije koje se dopunjavaju sa postojećih 57 celobrojnih MMX instrukcija obezbedjivanjem dodatne podrške obradi multimedijskih podataka. Poslednjih 8 instrukcija se kod Intel-a označavaju kao nove instrukcije za skrivenu memoriju. One poboljšavaju efikasnost skrivene memorije prvog nivoa centralne procesorske jedinice i dozvoljavaju naprednijim projektantima softvera da pojačaju performanse svojih primena ili računarskih igara. Izuzev toga, Pentijum III nije napravio nikakva poboljšanja arhitekture. On i dalje odgovara matičnim pločama Slot 1, iako sa pojednostavljenim pakovanjem - novim kertridžom SECC2 koje dozvoljava da rashladni element bude montiran direktno na procesorsku karticu i koristi manje plastike u oblozi. Centralna procesorska jedinica i dalje ima 32 Kbajta skrivene memorije prvog nivoa i biće u početku isporučivana u modelima od 450 MHz i 500 MHz, sa brzinom čeone magistrale od 100 MHz i 512 Kbajta skrivene memorije drugog nivoa na polovini procesorske brzine, kao kod Pentijuma II. To znači da, sem ako korisnik radi sa aplikacijama trodimenzionalne grafike ili računarskim igrama koje su bile posebno napisane da bi iskoristile prednosti novih SIMD proširenja, ili ako koristi verziju 6.1 Microsoft-ovog DirectX API on verovatno neće videti značajniju dobit u performansi u odnosu na slično taktovani Pentijum II. Vrlo blizak Pentijumu III, došao je Pentijum III Xeon, prvobitno nazvan Tanner. To je u osnovi Pentijum Xeon sa novim SIMD proširenjima skupa instrukcija. Namenjen tržištima servera i radnih stanica, Pentijum III Xeon je u početku isporučivan sa procesorom na 500 MHz, sa skrivenim memorijama drugog nivoa od 512 Kbajta, 1 Mbajta ili 2 Mbajta. U oktobru 1999. godine, uvedeni su procesori Pentijum III nazvani Coppermine, izgradjeni u Intel-ovoj 0,18-mikronskoj proizvodnoj tehnologiji. Njihova struktura ima dimenzije koje su manje od 1/500 dela debljine ljudske vlasi - manje od bakterija, ili talasne dužine svetlosti koju čovek može da vidi. Koristi koje su došle uz to obuhvataju manje dimenzije integrisanih kola, niže radne napone, omogućavanje kompaktnijih i po snazi efikasnijih konstrukcija sistema i učestanosti generatora takta od 1 GHz i više. Delovi za stone računare su raspoloživi u dva oblika, sa brzinama čeonih magistrala od 100 MHz ili 133 MHz i brzinama procesora u opsegu od 500 MHz do 700 MHz i 733 MHz respektivno. Uredjaji se razlikuju po procesori-

21 ma uradjenim u 0,18-mikronskom i 0,25-mikronskom proizvodnom procesu na istoj učestanosti, što je označeno pomoću sufiksa "E" i verzijama sa čeonom magistralom na 133 MHz, pomoću sufiksa "B". Mada je veličina skrivene memorije drugog nivoa novih Pentijuma III bila prepolovljena na 256 Kbajta, ona je bila smeštena na čipu da bi radila istom brzinom kao i procesor, a ne polovinom te brzine kao ranije - pa je rad na punoj brzini više nego nadoknadio nedostajućih 256 Kbajta. Intel označava tako poboljšanu skrivenu memoriju kao "keš sa naprednijim prenosom" (Advanced Transfer Cache - ATC). U stvarnim terminima, ATC znači da je skrivena memorija povezana sa centralnom procesorskom jedinicom preko magistrale širine 256 bitova - četiri puta šire od 64-bitne magistrale Pentijuma III zasnovanog na procesoru Katmai. Ukupna performansa sistema je dalje poboljšana pomoću Intel-ove tehnologije Naprednog sistemskog baferovanja, koja povećava broj "bafera" izmedju procesora i njegove sistemske magistrale, što ima za posledicu povećanje toka informacija. Najava Pentijuma III na 850 MHz i 866 MHz u proleće 2000. godine potvrdila je Intel-ovu nameru da racionalizuje faktore forme centralne procesorske jedinice po pločama - na koju je ukazano ranije putem oglašavanja prvih 0,18-mikronskih Celerona u novom FC-PGA pakovanju - sa ovim verzijama raspoloživim i u SECC2 i u FC-PGA pakovanju. Ograničena raspoloživost matičnih ploča kompatibilnih sa FC-PGA pakovanjem u prvoj polovini 2000. godine stvorila je tržište za "adapter slot-na-podnožje" (slot-to-socket adapter - SSA). Ovo je ipak rezultovalo nečim kao minsko polje za potrošače, sa nekim kombinacijama SSA/matične ploče, koje su prouzrokovale da centralne procesorske jedinice rade van specifikacije - ukidajući na taj način Intel-ovu garanciju i potencijalno oštećujući procesor i/ili matičnu ploču. Sledeća tabela prikazuje različite varijante dosadašnjih procesora Pentijum III: Godina Kodirano ime 1999 1999 1999 2000 Katmai Tanner Coppermine Coppermine Broj Keš memorija Proizvodni Brzina (MHz) tranzistora drugog nivoa proces (μm) 9,500,000 512KB 0.25 450/500/550 9,500,000 512KB/1MB/2MB 0.25 500/550 28,100,000 256KB (na čipu) 0.18 500 do 800MHz 28,100,000 256KB (na čipu) 0.18 850MHz do 1.13GHz

Ubrzo posle njegove pojave 31. jula 2000. godine, Intel se suočio sa nevoljom potrebe da se opozovu svi isporučeni procesori na 1,13 GHz, jer se otkrilo da je čip prouzrokovao prekide rada sistema prilikom izvršavanja pojedinih aplikacija. Mnogi su povezali taj problem sa narastajućom konkurencijom od strane rivala u proizvodnji čipova AMD - koji je uspeo da pobedi firmu Intel na granici od 1 GHz nekoliko nedelja ranije - verujući da je Intel mogao biti primoran da predstavi brže čipove pre nego što je prvobitno bilo planirano.

Itanium
U junu 1994. godine Hewlett-Packard je najavio njihov združeni istraživačko-razvojni projekat namenjen da se dobiju napredne tehnologije za radnu stanicu za kraj milenijuma, server i računarske proizvode za preduzeća, a u oktobru 1997. godine oni su otkrili prve detalje njihove 64-bitne računarske arhitekture. U to vreme, prvi član Intel-ove nove porodice 64-bitnih procesora - nazvan Merced, po reci u Kaliforniji - bio je pripremljen za proizvodnju u 1999. godini, upotrebom 0,18-mikronske tehnologije. U situaciji kada je razvojni program Merced

22 posrnuo i bio procenjen na još uvek godinu dana daleko od završetka, Intel je objavio izbor imena Itanium na svom razvojnom forumu u oktobru 1999. godine. Glavna korist od 64-bitne računarske arhitekture je količina memorije koja može da se adresira. Sredinom 1980-ih godina, 4 Gbajta adresibilne memorije 32-bitnih platformi je bilo više nego dovoljno. Medjutim, do kraja milenijuma, velike baze podataka su prevazišle tu granicu. Vreme potrebno da se pristupi memorijskim uredjajima i podaci smeste u virtuelnu memoriju ima značajan uticaj na performansu. 64-bitne platforme mogu adresiraju enormnih 16 Tbajta memorije. U stvarnim terminima to znači da opslužuju baze podataka dovoljno velike da, dok 32-bitna platforma može da opsluži bazu podataka dovoljno veliku da zapamti ime svakog stanovnika SAD od 1977. godine, ona 64-bitna je dovoljno moćna da zapamti ime svake osobe koja je ikada živela od postanka sveta! Medjutim, bez obzira na uticaj koji će imati povećano adresiranje memorije, njegova tehnologija Eksplicitnog računanja pomoću paralelnih instrukcija (Explicitly Parallel Instruction Computing - EPIC) - temelj nove 64-bitne arhitekture skupa instrukcija (Instruction Set Architecture - ISA) - je ono što predstavlja Itanijum-ov najveći tehnološki napredak. EPIC, koji sadrži inovativnu kombinaciju spekulacije, predvidjanja i eksplicitnog paralelizma, predstavlja napredak u najsavremenijim dostignućima u procesorskim tehnologijama, posebno se obraćajući ograničenjima performanse koja se nalaze u RISC i CISC tehnologijama. Dok obe od ovih arhitektura već koriste razne interne tehnike da bi pokušale da obradjuju više od jedne instrukcije odjednom gde je to moguće, stepen paralelizma u kôdu je odredjen jedino u vreme izvršenja od strane delova procesora koji nastoje da analiziraju i promene redosled instrukcija u hodu. Ovaj pristup troši vreme i prostor na čipu koji bi mogli biti upotrebljeni za izvršenje, a ne za organizaciju instrukcija. EPIC vrši proboj kroz sekvencijalnu prirodu uobičajenih arhitektura procesora, dozvoljavajući softveru da komunicira eksplicitno sa procesorom kada operacije treba da se izvode paralelno. Rezultat je da procesor može jednostavno da zgrabi što je moguće veću gomilu instrukcija i izvršava ih istovremeno, sa minimalnom predobradom. Povećana performansa je ostvarena pomoću smanjivanja broja grana i promašaja u pogadjanju grananja i pomoću smanjivanja efekata kašnjenja izmedju memorije i procesora. IA-64 arhitektura skupa instrukcija - objavljena u maju 1999. godine - primenjuje tehnologiju EPIC da pruži velike resurse sa urodjenom skalabilnošću, što nije bilo moguće sa arhitekturama prethodnih procesora. Na primer, sistemi mogu da se projektuju da se uključuju u nove izvršne jedinice kad god se zahteva nadgradnja, slično kao što se uključuje više memorijskih modula u postojeće sisteme. Prema firmi Intel, IA-64 ISA predstavlja najznačajniji napredak u mikroprocesorskoj arhitekturi od uvodjenja njihovog čipa 386 u 1985. godini. Procesori IA-64 će imati masivne računarske resurse koji uključuju 128 celobrojnih registara, 128 registara za pokretni zarez i 64 predikatna registra, uz još jedan broj registara posebne namene. Instrukcije će biti pakovane u grupama za paralelno izvršavanje pomoću različitih funkcionalnih jedinica. Skup instrukcija je optimizovan za potrebe kriptografije, video kodovanja i drugih funkcija koje će biti više potrebne u sledećoj generaciji servera i radnih stanica. U procesorima IA-64 je odražana i unapredjena podrška Intelovoj tehnologiji MMX i proširenjima za SIMD. Mada IA-64 nije 64-bitna verzija Intel-ove 32-bitne arhitekture x86, niti je adaptacija HP-ove 64-bitne PA-RISC arhitekture, on obezbedjuje zaštitu investicija za današnje aplikacije i softversku infrastrukturu, održavanjem kompatibilnosti sa prvom od pomenutih u procesorskom

23 hardveru i sa drugom kroz softversko prevodjenje. Medjutim, jedna od implikacija ISA je granica do koje se od prevodilaca očekuje da optimizuju tok instrukcija - i posledica toga je da stariji softver neće raditi optimalnom brzinom ukoliko se ne rekompiluje. Rad IA-64 sa 32-bitnim softverom je izazvao kritiku od strane AMD čiji sopstveni predlog za obezbedjenje podrške za 64-bitni kôd i adresiranje memorije, nazvan "Sledgehammer", ne kažnjava stariji softver na takav način. Dijagrami na slikama 6 i 7 ilustruju veliko opterećenje koje se postavlja procesoru u vezi sa optimizacijom za dve inovativne osobine IA-46: • • Predikaciju, koja zamenjuje predvidjanje grananja dozvoljavanjem da procesor izvrši sve moguće staze grananja paralelno i Spekulativno učitavanje, koje dozvoljava procesorima IA-64 da uzmu podatke pre nego što su oni potrebni programu, čak izvan grane koja nije izvršena.

Slika 6: Predikacija Predikacija je u središtu eliminisanja grananja i paralelnog rasporedjivanja instrukcija IA-64. Normalno, prevodilac pretvara izvorni kôd instrukcije grananja (kao što je IF-THEN-ELSE) u naizmenične blokove mašinskog kôda uredjene u sekvencijalnom toku. Zavisno od ishoda grananja, centralna procesorska jedinica će izvršiti jedan od ovih osnovnih blokova preskačući one druge. Savremene centralne procesorske jedinice pokušavaju da predvide ishod i spe-

24 kulativno izvrše ciljni blok, plaćajući visoku cenu u izgubljenim ciklusima ako ga pogrešno predvide. Osnovni blokovi su mali, često dve ili tri instrukcije, a grananja se pojavljuju na približno svakih šest instrukcija. Sekvencijalna priroda ovog kôda čini teškim njegovo paralelno izvršavanje. Kada prevodilac za IA-64 pronadje instrukciju grananja u izvornom kôdu, on analizira granu da vidi da li je ona kandidat za predikaciju, označavajući sve instrukcije koje predstavljaju svaku stazu u grananju pomoću jedinstvenog identifikatora koji se zove predikat za odgovarajuće slučajeve. Posle označavanja instrukcija predikatima, prevodilac utvrdjuje koje instrukcije centralna procesorska jedinica može da izvršava paralelno - na primer, uparivanjem instrukcija iz različitih ishoda grananja, jer one predstavljaju nezavisne staze kroz program. Prevodilac zatim sakuplja instrukcije mašinskog kôda u 128-bitne grupe, svaka od po tri instrukcije. Polje za zaglavlje grupe ne samo da identifikuje koje instrukcije u grupi mogu nezavisno da se izvršavaju, nego takodje i koje su instrukcije u sledećim grupama nezavisne. Tako, ako prevodilac pronadje 16 instrukcija koje nemaju medjusobnih zavisnosti, on može da ih spakuje u šest različitih grupa (po tri u svaku od prvih pet grupa i jednu u čestu) i označi ih u zaglavljima. U vreme izvršenja, centralna procesorska jedinica skanira zaglavlja, izvlači instrukcije koje nemaju medjusobne zavisnosti i šalje ih paralelno u funkcionalne jedinice. U nekom trenutku, svakako, centralna procesorska jedinica će eventualno procenjivati operaciju poredjenja koja odgovara instrukciji IF-THEN. Do tog trenutka, centralna procesorska jedinica je verovatno izvršila neke instrukcije obe moguće staze - ali još nije zapamtila rezultat. Baš tada centralna procesorska jedinica to radi, pamteći rezultat iz ispravne staze i odbacujući rezultat iz pogrešne staze.

Slika 7: Spekulativno učitavanje Spekulativno učitavanje pokušava da razdvoji učitavanje podatka od upotrebe tog podatka i, radeći tako, izbegne situacije u kojima procesor čeka da podatak pristigne, da li bio u stanju

25 da radi na njemu. Kao i predvidjanje, to je kombinacija optimizacija u vremenu prevodjenja i u vremenu izvršenja. Prvo, prevodilac analizira programski kôd, u potrazi za operacijama koje zahtevaju podatke iz memorije. Kad god je to moguće, prevodilac ubacuje spekulativno učitavanje instrukcije u nekoj prethodnoj tački u toku instrukcija, znatno pre nego što je operaciji koja je u pitanju stvarno potreban podatak. U isto vreme, prevodilac preuredjuje okolne instrukcije tako da centralna procesorska jedinica može da ih šalje paralelno. U vreme izvršavanja, centralna procesorska jedinica nailazi prvo na instrukciju spekulativnog učitavanja i pokušava da dovuče podatak iz memorije. Ovde se procesor IA-64 razlikuje od konvencionalnog procesora. Nekad učitavanje može da bude pogrešno - ono može da pripada bloku kôda izvan grane koja još nije izvršena. Tradicionalna centralna procesorska jedinica bi automatski pokrenula izuzetak - i ako program ne bi mogao da izadje sa njim na kraj, on bi verovatno pukao. Procesor IA-64, medjutim, ne bi odmah prijavio izuzetak ako je učitavanje neispravno. Umesto toga, centralna procesorska jedinica odlaže izuzetak dok ne naidje na spekulativnu ispitivanu instrukciju koja odgovara spekulativnom učitavanju. Tek tada centralna procesorska jedinica prijavljuje izuzetak. Do tada je, medjutim, centralna procesorska jedinica razrešila koja je grana dovela do izuzetka. Ako se ispostavi da je staza kojoj učitavanje pripada neispravna, tada je i učitavanje neispravno, pa centralna procesorska jedinica ide unapred i prijavljuje izuzetak. Ali, ako je učitavanje ispravno, to je isto kao da se izuzetak nije ni dogodio. Važna prekretnica dostignuta je u avgustu 1999. godine, kada je prototip 0,18-mikronske centralne procesorske jedinice Merced, koji je radio na 800 MHz, bio prikazan kako izvršava ranu verziju Microsoft-ovog 64-bitnog operativnog sistema Windows. Proizvodni Itanijumi će koristiti arhitekturu sa skrivenom memorijom u tri nivoa, od kojih su dva nivoa na čipu, a skrivena memorija trećeg nivoa van čipa, ali povezana pomoću magistrale koja radi punom brzinom. Prvi proizvodni modeli - koji se očekuju u drugoj polovini 2000. godine - dolaze u dve verzije, sa 2 Mbajta ili 3 Mbajta skrivene memorije trećeg nivoa. Početne frekvencije generatora takta biće 800 MHz - uz moguće podizanje znatno iznad 1 GHz.

Pentium 4
Početkom 2000. godine, Intel je razotktio detalje svog prvog novog jezgra IA-32 od Pentijuma Pro, predstavljenog 1995. godine. Prvobitno je nazvan Willamette - po reci koja reče kroz američku državu Oregon, ali nekoliko meseci kasnije objavljeno je da će nova generacija mikroprocesora biti prodavana pod nazivom Pentijum 4 i da će biti namenjena pre tržištu stonih računara nego servera. Predstavljajući najveći korak napred Intel-ove 32-bitne arhitekture od Pentijuma Pro u 1995. godini, povećana performansa Pentijuma 4 je velikim delom posledica promena arhitekture koje dozvoljavaju uredjaju da radi sa većim brzinama generatora takta i logičkih promena koje omogućavaju da se više instrukcija izvršava po jednom njegovom ciklusu. Glavna od ovih promena je unutrašnja protočna obrada Pentijuma 4, nazvana Hyper Pipeline - koja se sastoji od 20 stepena, prema onih 10 iz mikroarhitekture P6. Tipična protočna obrada ima fiksiranu količinu rada koji treba da se obavi da bi se dekodovala i izvršila instrukcija. Ovaj rad se izvodi pomoću pojedinačnih logičkih operacija koje se nazivaju "logičkim kolima". Svako logičko kolo sastoji se od više tranzistora.

26 Povećavanjem broja stepena u protočnoj obradi, zahteva se manje logičkih kola u svakom stepenu. Smanjivanje broja logičkih kola u svakom stepenu dozvoljava da se poveća brzina generatora takta, zato što svako od logičkih kola traži izvesno vreme (unosi kašnjenje) da bi obezbedilo rezultat. Sve ovo dozvoljava da više instrukcija bude "u letu" ili u različitim stepenima dekodovanja i izvršenja u protočnoj obradi. Mada su ove koristi donekle pomerene u stranu zbog rada ostalih logičkih kola koja su potrebna da bi se upravljalo dodatnim stepenima, ukupno dejstvo povećanja broja stepena protočne obrade je smanjenje broja logičkih kola po stepenu, što dozvoljava višu učestanost rada jezgra i povećava skalabilnost. U apsolutnim terminima, maksimalna učestanost koju može da dostigne protočna obrada u ekvivalentu silicijumskog proizvodnog procesa, može da se proceni kao: 1/(vreme protočne obrade u ns/broj stepena)*1000 (da bi se pretvorilo u MHz) Na primer, maksimalna učestanost koju može da dostigne protočna obrada od 10 ns u 5 stepeni je: 1/(10/5) * 1000 = 500MHz Sa druge strane, protočna obrada od 12 ns u 15 stepeni, može da dostigne: 1/(12/15) * 1000 = 1250 MHz, odnosno 1,25GHz. Dodatna povećanja učestanosti mogu da se postignu promenom silicijumskog procesa i/ili upotrebom manjih tranzistora, da bi se smanjilo kašnjenje koje prouzrokuje svako logičko kolo. Druge nove osobine koje je uvela nova mikroarhitektura Pentijuma 4, nazvana NetBurst, obuhvataju: • inovativnu implemenraciju skrivene memorije prvog nivoa koja sadrži - pored 8 Kbajta podataka - keš za praćenje izvršenja, koji pamti do 12K dekodovanih instrukcija x86 (mikrooperacija), otklanjajući tako kašnjenje pridruženo sa dekoderom instrukcija u glavnim petljama izvršenja; brzu mašinu za izvršenje koja gura procesorske aritmetičko-logičke jedinice na dvostruku učestanost jezgra, što rezultuje većom propusnom moći izvršenja i njegovim smanjenim kašnjenjem - čip u stvari koristi tri odvojena generatora takta: na učestanosti jezgra, aritmetičko-logičkih jedinica i magistrale; veoma duboku, izvršnu mašinu za vanredno spekulativno izvršenje - koje se zove Mašina za napredno dinamičko izvršenje - za izbegavanje zastoja koji mogu se pojave dok instrukcije čekaju da se razreše medjusobne zavisnosti, a pomoću obezbedjivanja velikog skupa instrukcija iz koga izvršne jedinice mogu da biraju; Skrivenu memorija drugog nivoa sa naprednim prenosom od 256 Kbajta koja obezbedjuje spregu od 256 bita (32 bajta) za prenos podataka u svaki blok jezgra, dajući tako mnogo veću propusnu moć kanala podataka - 44,8 Gbajta u sekundi (32 bajta x 1 prenos podataka po ciklusu x 1,4 GHz) za procesor Pentijum 4 na 1,4 GHz; SIMD proširenja 2 (SSE2) - najnovija iteracija Intel-ove tehnologije Jedna instrukcija - više podataka (SIMD) - koja ima 76 novih SIMD instrukcija i poboljšanja za 68 celobrojnih SIMD instrukcija, što dozvoljava čipu da zgrabi 128 bitova podataka istovremeno i za rad

27 u pokretnom zarezu i za celobrojni rad i tako ubrza operacije kodovanja i dekodovanja koje zahtevaju intenzivan rad centralne procesorske jedinice, kao što su procedure za video, govor, trodimenzionalno prokazi, multimediju i slično; • Prvu industrijsku sistemsku magistralu na 400 MHz, koja obezbedjuje trostruko povećanje propusne moći, poredjeno sa trenutnom Intel-ovom sistemskom magistralom na 133 MHz.

Zasnovan na već zastarelom Intel-ovom 0,18-mikronskom proizvodnom procesu, čip sadrži 42 miliona tranzistora. Originalni projekat bi zaista rezultovao znatno većim čipom, koji bi bio suviše veliki da bi se mogao ekonomično proizvoditi u 0,18-mikronskom procesu. Zato su neke osobine originalne konstrukcije Willamette bile napuštene, kao što su veća skrivena memorija prvog nivoa od 16 Kbajta, dve potpuno funkcionalne jedinice za rad u pokretnom zarezu i spoljašna skrivena memorija trećeg nivoa od 1 Mbajta. To otkriva da je ono što je zaista potrebno - izgradnja Pentijuma 4 u 0,13-mikronskoj tehnologiji - nešto što je Intel planirao za 2001. godinu. Prve isporuke Pentijuma 4 - na brzinama od 1,4 GHz i 1,5 GHz - pojavile su se u novembru 2000. godine. Novi čipovi su u početku pokazali najveća poboljšanja performanse u trodimenzionalnim primenama - kao što su računarske igre - i u grafički intenzivnim aplikacijama kao što je video kodovanje. U svakodnevnim kancelarijskim primenama - kao što su obrada teksta, tabelarni proračuni, pretraživanje WEB-a i elektronska pošta - bilo je objavljeno mnogo manje dobitaka u performansi. Verzija Pentijuma 4 na 1,7 GHz i masovna proizvodnja se najavljuju za prvu polovinu, a verzija od 2 GHz se planira sredinom 2001. godine.

Bakarno medjupovezivanje
Svaki čip ima osnovni sloj tranzistora, sa slojevima provodnika iznad njega za povezivanje tranzistora medjusobno i, u krajnjem, sa ostatkom računara. Tranzistori na prvom nivou čipa su složena konstrukcija od silicijuma, metala i primesa, smeštenih precizno, tako da stvaraju milione sićušnih prekidača za uključivanje-isključivanje koji čine mozak mikroprocesora. Proboji u tehnologiji čipova su najčešće bili unapredjenja u pravljenju tranzistora. Kako su naučnici pravili sve manje, sve brže tranzistore i pakovali ih sve bliže jedne drugima, medjusobna povezivanja su počela da predstavljaju probleme. Aluminijum je dugo bio izabrani provodnik, ali on će ubrzo dostići fizičke granice postojeće tehnologije. Sve je teže provlačiti elektroniku kroz sve manje provodnike - aluminijum jednostavno nije dovoljno brz za te nove, manje dimenzije. Naučnici su godinama uvidjali pojavu problema i tražili način da zamene aluminijum jednim od tri metala koji bolje provode elektricitet: bakrom, srebrom ili zlatom. Medjutim, posle mnogo godina pokušavanja, još niko nije uspeo da napravi bakarni čip za tržište. Sve ovo se promenilo u septembru 1998. godine, kada je IBM upotrebio svoju revolucionarnu novu tehnologiju bakarnog medjupovezivanja (Slika 8) da bi proizveo čip koji koristi bakarne, a ne tradicionalne aluminijumske provodnike, da poveže tranzistore. Ova naizgled mala promena verovatno će imati značajne posledice na buduće konstrukcije procesora. Bakarna medjupovezivanja obećavaju mogućnost da se smanje dimenzije čipa i potrošnja električne energije, dozvoljavajući veće brzine centralne procesorske jedinice u istoj osnovnoj konstrukciji.

28

IBM je istorijski bio čuven zbog vodjstva u proizvodnoj tehnologiji, ali često nije uspeo to da iskoristi u komercijalnom smislu. Ovog puta IBM je brzo implementirao tehnologiju, po prvi put oglašavajući 0,18-mikronski proces CMOS 7SF "Damascus", krajem 1997. godine. Sledeći razvoj je bio preduzet od strane saveza četiri firme uključujući i proizvodjača fabričke opreme Novellus Systems i, u 1999. godini, IBM će ponuditi 7SF proces trećim licima kao deo svojih silicijumskih livničkih usluga. Jedan od problema koji su kočili prethodne pokušaje da se iskoristi bakar za električne veze bila je njegova težnja da vrši difuziju u supstrat od silicijum dioksida koji se koristi u čipovima - čineći ih beskorisnim. Tajna nove IBM-ove tehnologije je tanak zaštitni sloj, obično napravljen od otpornog titanijuma ili tungsten nitrida. On se nanosi posle Slika 8 fotolitografskog graviranja na kanale u supstratu. Mikroskopski početni sloj bakra se postavlja preko njega, da bi omogućio da se veže sledeći bakarni sloj, postavljen preko celog čipa pomoću elektrolize. Hemijsko poliranje uklanja suvišni bakar. Mada su ga IBM i Motorola planirali za 1999. godinu, Intel je nagovestio da neće preći na tehnologiju bakarnog medjupovezivanja do svojih prvih 0,13-mikronskih centralnih procesorskih jedinica, koje se trenutno ne očekuju pre 2002. godine.

Putna mapa
Sledeća tabela predstavlja putnu mapu za razvoj budućih procesora firme Intel: 2001 IA-64 McKinley 0.13-mikronski proces, 2Mbajta keš memorije na čipu Madison 0.13-mikronski proces, bakarno medjusobno povezivanje Deerfield IA-64 za srednje servere/radne stanice Evo objašnjenja kodnih imena i detalja pridruženih razvoja: • McKinley: Naslednik procesora Merced, planiran da bude raspoloživ krajem 2001. godine, očekuje se da će biti čip za 1 GHz, zasnovan na 0,13-mikronskoj tehnologiji i da će koristiti bakarno medjupovezivanje. McKinley će, kako se priča, udvostručiti performansu procesora Merced, pomoću poboljšanja u mikroarhitekturi i upotrebe "veoma velikih" skrivenih memorija na čipu. On će takodje koristiti jaču procesorsku magistralu da bi dobio trostruko povećanje propusnog opsega. Madison: Naslednik procesora McKinley, 0,13-mikronski procesor koji koristi bakarno medjupovezivanje i obezbedjuje velike skrivene memorije trećeg nivoa. 1/1.6GHz > 1GHz > 1GHz 2002 2003

29

Deerfield: Procesor IA-64 namenjen srednjim serverima i radnim stanicama.

Ne-INTEL PROCESORI

Cyrix 6x86
Razotkriven u oktobru 1995. godine, 6x86 je bio prvi Pentijum-kompatibilni procesor koji je stigao do tržišta kao rezultat saradnje sa IBM-ovim sektorom za mikroelektroniku. Prihvatanje 6x86 je u početku bilo sporo, zato što je Cyrix tražio visoku cenu, pogrešno misleći da, obzirom da je performansa uporediva sa Pentijumovom, takva treba da bude i cena. Kada je jednom Cyrix popravio svoja gledišta i prihvatio položaj kao jevtine, visokoperformantne alternative Intel-ovoj seriji Pentijuma, čip je ostvario značajan uticaj na budžetskom delu tržišta. Kako je procesor 6x86 bio u stanju da ima ekvivalentni nivo performanse Pentijumovog čipa uz manje brzine generatora takta, Cyrix je saradjivao sa većim brojem drugih firmi da se razvije alternativa tradicionalnom sistemu vrednovanja brzina genetarora takta. Rezultujuće procesorsko vrednovanje performanse, ili P-vrednovanje (P-rating) je standardizovana mera performanse zasnovana na aplikacijama i Cyrix-ovi procesori su tradicionalno radili na manjim brzinama generatora takta nego njihova P-vrednovanja, bez upadljivog degradiranja performanse. Na primer P133 radi na brzini generatora takta od 110 MHz, dok P155 i P166 rade na 120 MHz i 133 MHz respektivno. Viša performansa procesora 6x86 bila je posledica poboljšanja u arhitekturi čipa, koja su dozvolila 6x86 da pristupi svojoj unutrašnjoj skrivenoj memoriji i registrima u jednom ciklusu generatora takta (dok Pentijumu tipično trebaju dva ili više ciklusa za takav pristup). Pored toga, primarna skrivena memorija 6x86 je bila jedinstvena, a ne od dve sekcije od po 8 Kbajta, za instrukcije i za podatke. Ovaj jedinstveni model je bio u stanju da pamti instrukcije i podatke u bilo kom odnosu, dozvoljavajući tako poboljšano uspešno dobijanje podataka iz skrivene memorije blizu 90%. Procesor 6x86 zaista ima dosta sličnosti sa Pentijumom Pro. To je superskalarni procesor šeste generacije, sa superprotočnom obradom, sposoban da stane u Pentijumovo podnožje P54C (Podnožje 7). On sadrži 3,5 miliona tranzistora, u početku proizvedenih u0,5-mikronskom petoslojnom procesu. On ima jezgro koje radi na 3,3V sa zaštitom ulaza/izlaza na 5 V. Osobine 6x86, slične onima kod Pentijuma su: superskalarna arhitektura, 80-bitna jedinica za rad u aritmetici pokretnog zareza, 16 Kbajta primarne skrivene memorije i Režim sistemskog upravljanja (System Management Mode - SMM). Medjutim, postoji i izvestan broj razlika. Procesor 6x86 ima superprotočnu obradu, sa sedam umesto sa pet stepeni (prethodno donošenje, dva za dekodovanje, dva za generisanje adrese, za izvršavanje i za upis nazad), da bi se informacije kretale brže i da bi se izbegli zastoji u izvršenju. Isto tako, postoji i preimenovanje registara, koje obezbedjuje privremeno smeštanje podataka radi njihove trenutne raspoloživosti bez čekanja da centralna procesorska jedinica pristupi skrivenoj memoriji na čipu ili sistemskoj memoriji.

30

Slika 1: Arhitektura procesora 6x86 Ostale nove osobine uključuju otklanjanje zavisnosti podataka, predvidjanje više grananja, spekulativno okončanje izvršenja "van redosleda". Prisustvo ovih komponenata arhitekture sprečava zastoje u protočnoj obradi pomoću stalnog obezbedjenja rezultata instrukcija: predvidjanja zahteva, izvršenja instrukcija sa visokim stepenom tačnosti i dozvoljavanja bržim instrukcijama da izadju iz redosleda protočne obrade bez ometanja toka programa. Sve to podiže performansu procesora 6x86 iznad one od slično taktovanog Pentijuma. Ono što je ključno za procesor 6x86 je njegova obrada kôda. On radi sa kôdom na "urodjen način"; on u potpunosti optimizuje CISC skup instrukcija x86. To se primenjuje i na 16-bitni i na 32-bitni kôd. Pentijum to radi, takodje, ali za razliku Pentijum Pro zahteva pretvaranje CISC instrukcija u RISC (ili mikro) operacije pre nego što one udju u protočnu obradu. Prema tome, izvršna mašina 6x86, za razliku od Pentijuma Pro, ne gubi na performansi kada radi sa 16-bitnim ili 32-bitnim primenama, jer se ne traži pretvaranje kôda. Sa druge strane, Pentijum Pro je je poznat po tome što je projektovan kao čisto 32-bitni procesor, pa 16-bitne instrukcije mogu izazvati značajne zastoje dok su u protočnoj obradi. Sve ove dodatne osobine arhitekture čine performansu procesora Cyrix 6x86 boljom, uz manju brzinu generatora takta. Poredjen sa Pentijumom na osnovu jednakih brzina generatora takta, 6x86 je efikasniji čip. Medjutim, prvi procesori 6x86 su imali izvesne probleme, posebno sa pregrejavanjem, slabom performansom u pokretnom zarezu i nesaglasnošću sa operativnim sistemom Windows NT. To je loše uticalo na uspeh procesora i izazov 6x86 Pentijumu je kratko trajao, a stvarno se završio sa uvodjenjem Intel-ovih Pentijum MMX procesora, početkom 1997. godine.

Cyrix MediaGX
Uvodjenje procesora MediaGX u februaru 1997. godine definisalo je prvu novu PC arhitektu-

31 ru u dekadi, i začelo je novu kategoriju na tržištu - jevtine "osnovne PC računare". Rast ovog tržišta je bio eksplozivan, procesorska tehnologija i inovacija na nivou sistema firme Cyrix bile su kritične komponente. Što se više obrade bilo na samoj centralnoj procesorskoj jedinici PC računara, to je efikasnija bila i performansa sistema u celini. U tradicionalnim projektima računara, centralna procesorska jedinica obradjuje podatke na učestanosti čipa, dok magistrala koja pomera te podatke izmedju komponenata računara radi na samo polovini te brzine, ili čak i manjoj. To znači da prenos podataka ka i od centralne procesorske jedinice uzima više vremena - i mogućnost za "zastoje" podataka raste. Cyrix je eliminsao ovo usko grlo pomoću tehnologije MediaGX. Arhitektura MediaGX integriše grafičke i audio funkcije, PCI spregu i kontroler memorije u procesorskoj jedinici, eliminišući tako moguće sistemske konflikte i probleme konfiguracija krajnjih korisnika. Ona se sastoji od dva čipa - procesora MediaGX i pratećeg čipa MediaGX Cx5510. Procesor koristi sopstveno podnožje koje zahteva posebno konstruisanu matičnu ploču. MediaGX je procesor kompatibilan sa x86, koji direktno spreže PCI magistralu i EDO DRAM memoriju preko namenske 64-bitne magistrale podataka. Cyrix tvrdi da kompresiona tehnika koja se koristi na magistrali podataka odstranjuje potrebu za skrivenom memorijom drugog nivoa. Na centralnoj procesorskoj jedinici postoji skrivena memorija prvog nivoa od 16 Kbajta - istog kapaciteta kao i na standardnom čipu Pentijum.

Slika 2: Arhitektura MediaGX firme Cyrix Grafika se opslužuje pomoću namenske protočne obrade na samoj centralnoj procesorskoj jedinici, na kojoj se takodje nalazi i kontroler displeja. Nema video memorije, jer je bafer kadra smešten u glavnoj memoriji, bez degradacije performanse pridružene tradicionalnoj arhitekturi ujedinjene memorije (Unified Memory Architecture - UMA); umesto toga, koristi se sopstvena tehnologija za kompresiju displeja (Display Compression Technology - DCT) firme Cyrix. Operacije VGA nad podacima se rade u hardveru, ali VGA registrima i kontrolama se upravlja pomoću Cyrix-ovog softvera za virtuelnu sistemsku arhitekturu (Virtual System Architecture - VSA). Prateći čip MediaGX sadrži audiokontroler i takodje koristi softver VSA da podražava funkcionalnost standardnih industrijskih audio čipova. On takodje obezbedjuje most ka magistrali ISA i IDE i ulazno/izlaznim priključcima. On povezuje procesor MediaGX preko PCI magis-

32 trale na ISA magistralu i spreže IDE i ulazno/izlazne priključke, a pored toga izvršava i tradicionalne funkcije skupova čipova. Posle njene akvizicije od strane National Semiconductor-a u novembru 1997. godine, nova firma je ponovo potvrdila svoju nameru da se takmiči sa Intel-om i da se usredsredi na spuštanje cene PC računara, nastavljajući da razvija svoju MediaGX tehnologiju "PC računara na čipu". Do leta 1998. godine procesori MediaGX, zasnovani na 0,25-mikronskom proizvodnom procesu, dostigli su brzinu od 233 MHz i 266 MHz, sa još većim brzinama očekivanim krajem godine.

Cyrix 6x86MX
Cyrix-ov odgovor na Intel-ovu tehnologiju MMX bio je procesor 6x86MX, lansiran sredinom 1997. godine, malo pre nego što je firmu kupio National Semiconductor. Firma se držala formata Podnožja 7 za svoj novi čip, što je bila odluka koja je zadržala niskim troškove za graditelje sistema i krajnje korisnike, produžavajući život postojećim skupovima čipova i matičnim pločama. Arhitektura novog čipa ostaje u suštini ista kao kod njegovog prethodnika, sa dodatkom MMX instrukcija, malo poboljšanja jedinice za rad u pokretnom zarezu, većom primarnom ujedinjenom skrivenom memorijom kapaciteta 64 Kbasjta i poboljšanom jedinicom za upravljanje memorijom. Njena konstrukcija sa udvojenom protočnom obradom je slična onoj kod Pentijuma, ali je jednostavnija i fleksibilnija od Pentijumovog pristupa zasnovanog na RISC skupu instrukcija. Procesor 6x86MX je bio dobro prihvaćen na tržištu, sa 6x86MX/PR233 (koji je radio na brzini generatora takta od 187 MHz) koji se dokazao kao brži od Pentijuma II i K6 na 233 MHz. MX je isto tako bio prvi vodeći procesor koji je mogao da radi na spoljnoj magistrali od 75 MHz, što obezbedjuje očigledne prednosti u pogledu propusnog opsega i podiže opštu performansu sistema. Sa druge strane, slično prethodnim Cyrix-ovim procesorima, performansa 6x86MX u radu sa pokretnim zarezom je bila značajno slabija od one kod konkurencije, što je loše delovalo na performansu za trodimenzionalnu grafiku.

Cyrix MII
M II je dalji razvoj procesora 6x86MX koji radi na višim učestanostima. Do leta 1998. godine, 0,25-mikronski procesori MII-300 i MII-333 su proizvodjeni u novoj fabrici National Semiconductor u Mejnu; firma je tvrdila da već poseduje mogućnosti daljeg smanjivanja svog 0,25-mikronskog procesa da bi proizvodila 0,22-mikronske geometrijske oblike, na svom putu ka postavljenom cilju - postizanju 0,18-mikronskog procesa u 1999. godini.

AMD K6
Mnogo godina firma Advanced Micro Devices (AMD), kao i Cyrix, proizvodila je centralne procesorske jedinice 286, 386 i 486, koje su bile direktno izvedene iz Intel-ovih konstrukcija. Procesor K5 bio je njihov prvi nezavisno napravljeni x86 procesor, i jedan od onih u koje je AMD polagao velike nade. Dogodilo se, medjutim, da je on postigao samo ograničen uspeh, što je više rezultat promašene prilike nego bilo kog posebnog problema u vezi sa procesorom.

33 Medjutim, kupovina takmaca iz Kalifornije u proleće 1996. godine izgleda da je omogućila AMD-u da se bolje pripremi za svoj sledeći napad na Intel-a. Procesor K6 je počeo svoj život kao Nx686 i bio je preimenovan posle kupovine firme NextGen. Serija K6 procesora kompatibilnih sa MMX je uvedena sredinom 1997. godine, nekoliko nedelja pre Cyrix-ovog 6x86MX, i odmah je naišla na odobravanje. Proizveden u 0,35-mikronskom pet-metal-slojnom procesu, K6 je gotovo 20% manji od Pentijuma Pro, a ipak sadrži 3,3 miliona tranzistora više (8,8 prema 5,5 miliona). Većina tih dodatnih tranzistora je u skrivenoj memoriji prvog nivoa na čipu, kapaciteta 64 Kbajta, koja se sastoji od 32 Kbajta keša za instrukcije i 32 Kbajta keša sa udvojenim pristupom za vraćanje rezultata. To je četiri puta više nego kod Pentijuma Pro i dva puta više nego kod Pentijuma MMX i Pentijuma II. Procesor K6 podržava Intel-ovu tehnologiju MMX, uključujući 57 novih instrukcija projektovanih da pojačaju i ubrzaju softver za multimediju. Kao i Pentijum Pro, K6 u velikoj meri duguje konstrukcijama klasičnih računara sa ograničenim skupom instrukcija (RISC). Upotrebom AMD-ove superskalarne mikroarhitekture RISC86, čip dekoduje svaku instrukciju x86 u niz jednostavnijih operacija koje mogu da se obradjuju na tipičnim RISC principima - kao što je izvršavanje izvan redosleda, preimenovanje registara, predvidjanje grananja, prosledjivanje podataka unapred i spekulativno izvršavanje. Procesor K6 je bio uveden u verzijama od 166 MHz, 200 MHz i 233 MHz. Njegov nivo performanse je vrlo sličan odgovarajuće taktovanom Pentijumu Pro sa maksimalnom skrivenom memorijom drugog nivoa od 512 Kbajta. Zajedničko mu je sa Ciryx-ovim čipom MX, mada u nešto manjoj meri, da mu je performansa prilikom rada u pokretnom zarezu relativno slabija u odnosu na Intel-ove procesore Pentijum Pro i Pentijum II. Medjutim, prodor ovog procesora na tržište krajem 1997. i početkom 1998. godine, bio je ometen problemima koje je AMD imao u prelasku njegovog novog 0,25-mikronskog proizvodnog procesa iz razvojnih laboratorija u proizvodni pogon. Kao što je prouzrokovalo nedostatak delova za 200 MHz i 233 MHz, ovo je takodje imalo uticaja na kašnjenje čipa na 266 MHz i odustajanje od čipa za 300 MHz.

Super7
Kada je Intel sredinom 1998. godine prestao da pravi svoj procesor MMX, on je ustvari u potpunosti prepustio polje Podnožja 7 svojim konkurentima, prvenstveno AMD-u i Cyrix-u. I dok su njihove najnovije ideje zahtevale saradnju sa proizvodjačima matičnih ploča i skupova čipova da bi dostigle svoje pune mogućnosti, obe firme su imale ambiciozne planove da produže život "nasledjenom" faktoru forme. Odluka AMD da usaglasi vlasničku Intel-ovu arhitekturu Slot 1 sa pločama Podnožja 7 je dobro ilustrovana njihovim 0,25-mikronskim procesorom K6-2, uvedenim krajem maja 1998. godine, koji je obeležio značajan razvoj arhitekture. AMD to zove inicijativom platforme "Super 7", i njihov cilj je da održe platformu u životu u 1999. i 2000. godini. Razvijena od strane AMD i ključnih industrijskih partnera, platforma Super 7 daje novu snagu Podnožju 7 dodajući podršku za sprege magistrala na 100 MHz i 95

34 MHz i za specifikaciju ubrzanog grafičkog porta (AGP), kao i isporučivanjem drugih najnovijih karakteristika, uključujući SDRAM na 100 MHz, USB, Ultra DMA i ACPI. Najnovija pojačanja familije procesora AMD-K6 uključuju podršku za pozadinsku skrivenu memoriju drugog nivoa koja radi punom brzinom i opcionu čeonu skrivenu memoriju trećeg nivoa.

AMD K6-2
Procesor AMD K6-2 koji sadrži 9,3 miliona tranzistora, proizveden je pomoću AMD-ove tehnologije 0,25-mikronskog pet-metal-slojnog procesa, upotrebom lokalnih medjusobnih veza i plitke izolacije kanala, u AMD-ovoj fabrici poluprovodničkih pločica Fab 25 u Ostinu, u Teksasu. Procesor AMD K6-2 je pakovan u 321-pinskoj keramičkoj matrici pinova (ceramic pin grid array - CPGA), kompatibilnoj sa platformom Super 7 na 100 MHz.

Slika 3: Arhitektura procesora AMD K6-2 Procesor K6-2 obuhvata inovativnu i efikasnu mikroarhitekturu RISC86, veliku skrivenu memoriju prvog nivoa kapaciteta 64 Kbajta (keš sa dvostrukim pristupom od 32 Kbajta za podatke i keš od 32 Kbajta za instrukcije sa dodatnih 20 Kbajta keša za prethodno dekodovanje) i poboljšanu jedinicu za rad u pokretnom zarezu. Brzina rada MMX jedinice je takodje poboljšana, imajući u vidu kritike upućene procesoru K6. U vreme njegovog uvodjenja sredinom 1998. godine, ulazni nivo verzije centralne procesorske jedinice bio je procenjen na 300 MHz, dok je do početka 1999. godine najbrži raspoloživi procesor radio na 450 MHz.

35 Sposobnosti rada procesora K6-2 sa trodimenzionalnom grafikom predstavljaju drugi glavni proboj. One su ostvarene u tehnologiji 3Dnow! firme AMD, koja obuhvata novi skup od 21 instrukcije namenjenih da pojačaju standardne instrukcije MMX, već uključene u arhitekturu K6, dramatično ubrzavajući vrstu operacija zahtevanih u trodimenzionalnim primenama.

3DNow!
Sa uvodjenjem procesora K6-2, u maju 1998. godine, AMD je pretekao napredak Intel-a, čija slična tehnologija Katmai nije bila spremna za objavljivanje dok ne prodje još jedna godina, odnosno do prve polovine 1999. godine. Do kraja marta 1999. godine baza instaliranih PC računara pojačanih tehnologijom 3Dnow! bila je procenjena da je dostigla 14 miliona sistema širom sveta. Poboljšanjem mogućnosti procesora da izvršava proračune u pokretnom zarezu, tehnologija 3Dnow! zatvara rastući procep u performansi izmedju procesora i grafičkog akceleratora - i eliminiše usko grlo na početku grafičke protočne obrade. To krči put za dramatično poboljšane performanse u oblastima trodimenzionalne grafike i multimedija. Grafička protočna obrada se može posmatrati kao da se sastoji od četiri stepena (Slika 4):

Slika 4: Grafička protočna obrada • • Fizika: centralna procesorska jedinica izvodi intenzivne fizičke proračune u pokretnom zarezu, da bi stvorila simulacije realnog sveta i objekata u njemu. Geometrija: Zatim, centralna procesorska jedinica transformiše matematičke predstave objekata u trodimenzionalne predstave, koristeći intenzivnu trodimenzionalnu geometriju u pokretnom zarezu. Postavljanje: Centralna procesorska jedinica pokreće proces stvaranja perspektive koja se traži za trodimenzionalni pogled, a grafički akcelerator ga završava. Prikaz: Najzad, grafički akcelerator primenjuje realistične teksture na računarski stvorene objekte, koristeći za svaki element slike proračune boje, senke i položaja.

• •

36 Svaka instrukcija 3Dnow! radi sa dva operanda u pokretnom zarezu, a mikroarhitektura K6-2 dozvoljava da se izvršavaju dve instrukcije 3Dnow! po ciklusu generatora takta, što daje ukupno četiri operacije u pokretnom zarezu po ciklusu. Jedinice procesora K6-2 za multimediju kombinuju postojeće instrukcije MMX, koje ubrzavaju celobrojno-intenzivne operacije, sa novim 3Dnow! instrukcijama, i oba tipa mogu da se izvršavaju istovremeno. Naravno, sa grafičkim karticama koje ubrzavaju 3D u harveru, veliki deo trodimenzionalnog prikaza je već bio uradjen van centralne procesorske jedinice. Medjutim, kod mnogo 3D hardverskih rešenja, još uvek ostaje dosta intenzivnog rada u pokretnom zarezu u "prednjim" stepenima trodimenzionalne grafičke protočne obrade - uglavnom u vezi sa generisanjem scene i geometrijom, ali takodje i sa postavljanjem trougla. Intel-ova arhitektura P6, kako je upotrebljena u Pentijumu II i Celeronu, uvek je bila posebno jaka u ovoj oblasti, ostavljajući AMD, Cyrix i IBM iza sebe. Nova instrukcija 3Dnow! ispravlja ravnotežu sa operacijama u pokretnom zarezu tipa jedna-instrukcija-više-podataka (Single Instruction Multiple Data -SIMD) da bi pojačala postavljanje trodimenzionalne geometrije i MPEG dekodovanje. Širok spektar tipova primena se kandiduje da koristi 3Dnow! tehnologiju, koja je takodje licencirana i za upotrebu u uskoro dolazećim procesorima firmi Cyrix i IDT/Centaur. Kako za računarske igre, tako i za WEB lokacije sa jezikom za modelovanje virtuelne stvarnosti (Virtual Reality Modelling Language - VRLM), projektovanje pomoću računara (CAD), prepoznavanje govora i softversko dekodovanje digitalnog video diska. Performansa je dalje pojačana upotrebom Microsoft-ovog DirectX 6.0, uvedenog u leto 1998. godine, koji uključuje rutine za prepoznavanje i najveći dobitak iz novog skupa instrukcija. Buduće verzije OpenGL API će takodje biti optimizovane za 3Dnow!

AMD K6-III
U februaru 1999. godine AMD je najavio da je započeo sa obimnim isporukama procesora AMD K6-III na 400 MHz i da je ponudio uzorke verzije na 450 MHz proizvodjačima originalne opreme. Ključna osobina novog procesora bila je njegova inovativna konstrukcija "skrivene memorije u tri nivoa". Tradicionalno, PC procesori su se pouzdavali u dva nivoa skrivene memorije: • • Skrivena memorija prvog nivoa (L1), koja se obično nalazi unutar silikonskog čipa, i Skrivena memorija drugog nivoa (L2), koja može da bude spolja na matičnoj ploči ili u modulu slota, ili unutra u obliku pozadinske skrivene memorije drugog nivoa "na čipu".

Praktično pravilo u projektovanju podsistema skrivene memorije je da što je ona veća i brža, to je bolja performansa (jezgro centralne procesorske jedinice može brže da pristupi instrukcijama i podacima). Prepoznavajući koristi od velike i brze konstrukcije skrivene memorije koje mogu imati današnje zahtevne primene PC računara, AMD-ova "skrivena memorija u tri nivoa" uvodi veći broj inovacija arhitekture u projektovanju skrivenih memorija, koje su uvedene da bi se poboljšala performansa PC računara zasnovanih na platformi Super 7: • Interna skrivena memorija drugog nivoa sa odloženim ažuriranjem operativne memorije od 256 Kbajta, koja radi punom brzinom procesora AMD-K6-III i komplementira skrivenu memoriju prvog nivoa od 64 Kbajta koja je standard u svim procesorima iz familije AMD-K6;

37 • • • Višepristupna konstrukcija unutrašnje skrivene memorije, koja omogućava istovremena 64-bitna čitanja i upisivanja u skrivene memorije i prvog i drugog nivoa; Četvorostruka asocijativna konstrukcija skrivene memorije drugog nivoa koja omogućava optimalno upravljanje podacima i efikasnost; Čeona magistrala na 100 MHz ka spoljašnjoj skrivenoj memoriji na matičnoj ploči Super 7, skalabilnoj od 512 Kbajta do 2048 Kbajta.

Višepristupna konstrukcija unutrašnje skrivene memorije procesora AMD-K6-III omogućava da i skrivena memorija prvog nivoa od 64 Kbajta i skrivena memorija drugog nivoa od 256 Kbajta izvode istovremene 64-bitne operacije čitanja i upisivanja u jednom ciklusu generatora takta. Ova osobina posedovanja više portova dozvoljava da se podaci obradjuju brže i efikasnije nego kod uobičajenih konstrukcija. Pored ove višepristupne konstrukcije skrivene memorije, jezgro procesora AMD-K6-III može da pristupi skrivenim memorijama i prvog i drugog nivoa istovremeno, što još povećava opštu propusnu moć centralne procesorske jedinice. AMD tvrdi da sa potpuno konfigurisanom skrivenom memorijom trećeg nivoa, K6-III ima 435% veću skrivenu memoriju od Pentijuma III i, zahvaljujući tome, značajnu prednost u performansi.

AMD Athlon
Uvodjenje procesora Athlon, u leto 1999. godine, predstavljalo je najuspešniji potez za firmu AMD. To im je dozvolilo ne samo da se hvale time što su proizveli prvi procesor sedme generacije - ima dovoljno radikalnih razlika u arhitekturi jezgra Athlon-a i onih od Pentijuma II/III i K6-III da bi se zaslužio naziv procesora sledeće generacije - nego je takodje značilo i da su oni istovremeno preoteli tehnološko vodjstvo od moćnog Intel-a. Reč Athlon je izvedena iz starogrčkog jezika, gde to može da znači "trofej" ili "od igara", a Athlon je procesor koji AMD vidi kao mogućnost da postane zaista takmičarski prisutan i u korporativnom sektoru, dok je već tradicionalno imao jaku performansu na tržištima potrošača i trodimenzionalnih računarskih igara. Sa veličinom procesorskog čipa od 102 mm2 i približno 22 miliona tranzistora, najvažniji elementi procesora Athlon su: • Višestruki dekoderi: Tri potpuna dekodera x86 instrukcija, koji ih prevode u makro-operacije fiksne dužine, radi veće propustljivosti instrukcija i povećane snage obrade. Umesto izvršavanja x86 instrukcija, koje imaju dužine u rasponu od 1 do 15 bajta, procesor Athlon izvršava makro-operacije fiksne dužine, istovremeno zadržavajući efikasnost kodovanja instrukcija iz x86 programa. Jedinica za upravljanje instrukcijama: Kada se makro-operacije jednom dekoduju, do tri makro-operacije po ciklusu se upućuju u jedinicu za upravljanje instrukcijama (instruction control unit - ICU). ICU je 72-ulazni bafer za preuredjivanje makro-operacija (ROB) koji upravlja izvršenjem i povlačenjem svih makro-operacija, vrši preimenovanje registara za operande i kontroliše bilo koji uslov izuzetka i operacije povlačenja instrukcija. ICU šalje makro-operacije ka višestrukim planerima za izvršnu jedinicu procesora.

38 • Izvršna protočna obrada: Procesor Athlon sadrži 18-ulazni planer za celobrojno/adresno generisanje makro-operacije i 36-ulazni planer za jedinicu pokretnog zareza/multimediju. Ovi planeri izdaju makro-operacije za devet nezavisnih izvršnih protočnih obrada - tri za celobrojne proračune, tri za proračune adresa i tri za izvršenje MMX, 3DNow! i x87 instrukcija.

Slika 5: Arhitektura procesora Athlon • Superskalarna jedinica za rad u pokretnom zarezu (FPU): Prethodne centralne procesorske jedinice firme AMD su, u poredjenju sa onima iz firme Intel, imale slabe performanse za rad u pokretnom zarezu. Na tu raniju slabost se više nego adekvatno obratila pažnja u procesoru Athlon, koji ima trostruku superskalarnu mašinu, zasnovanu na tri izvršne jedinice sa protočnom obradom van redosleda (FMUL, FADD, i FSTORE). Termin "superskalarna" se odnosi na sposobnost centralne procesorske jedinice da izvršava više od jedne instrukcije po ciklusu generatora takta, i dok su takvi procesori već postojali izvesno vreme do sada, Athlon predstavlja prvi primer upotrebe takve tehnologije na podsistem za rad u pokretnom zarezu. Karakteristika superskalarne performanse je donekle ispod protočne obradi - procesa guranja podataka i instrukcija u virtuelni tok da bi razni segmenti tog toka mogli da obradjuju operacije istovremeno. Sve u svemu, Athlon može da isporuči do četiri 32-bitna rezultata jednostruke tačnosti u pokretnom zarezu po ciklusu generatora takta, što kao rezultat daje performansu od 2,4 Gflopa na 600 MHz. Predvidjanje grananja: Procesor AMD Athlon nudi promišljenu logiku za dinamičko predvidjanje grananja, radi minimiziranja ili eliminisanja kašnjenja koja su posledica instrukcija grananja (skokova, poziva, povratka), čestih u softveru x86. Sistemska magistrala: Sistemska magistrala procesora Athlon je prva takva magistrala na 200 MHz za platforme x86. Zasnovana na protokolu magistrale Alpha EV6 firme Digi-

39 tal, čeona magistrala (frontside bus - FSB) je potencijalno skalabilna do 400 MHz i više od toga i, za razliku od simetrične multiprocesne obrade sa deljenom magistralom kod Pentijuma III, koristi arhitekturu tačka-na-tačku da bi obezbedila veći propusni opseg za jednoprocesorske i višeprocesorske platforme x86. • Arhitektura skrivene memorije: Arhitektura skrivene memorije porocesora Athlon je značajan skok napred u odnosu na konvencionalne centralne procesorske jedinice šeste generacije. Ukupna skrivena memorija prvog nivoa je 128 Kbajta - četiri puta više od one kod Pentijuma III - a brzi 64-bitni kontroler pozadinske skrivene memorije podržava kapacitete izmedju 512 Kbajta i ogromnih 8 Mbajta. Poboljšan 3DNow!: Kao odgovor na SIMD proširenja u intel-ovom Pentijumu III, nadgradjena je implementacija 3Dnow! u procesoru Athlon, dodavanjem 24 nove instrukcije na početnu 21 instrukciju 3Dnow! - 19 da poboljšaju MMX celobrojne matematičke proračune i kretanje podataka za Internet primene i 5 DSP proširenja za softverski modem, softverski ADSL, Dolby Digital i MP3 primene.

Athlon koristi AMD-ovu kosntrukciju modula Slot A, koja je mehanički kompatibilna sa matičnim pločama Slot 1, ali upotrebljava različitu električnu spregu - što znači da centralna procesorska jedinica Athlon neće raditi sa matičnim pločama Slot 1. Slot A je projektovan da se električki poveže na sistemsku magistralu na 200 MHz zasnovanu na protokolu magistrale Alpha EV6, dajući tako značajnu prednost u performansi u odnosu na infrastrukturu Slot 1. Isto kao što je obezbedila svoj sopstveni optimizovani skup čipova - AMD-750 - firma radi i sa vodećim trećim proizvodjačima skupova čipova da im pomogne u isporučivanju njihovih vlastitih rešenja optimizovanih za procesor Athlon. Procesor Athlon je u početku bio raspoloživ u stepenima brzine od 650, 600, 550 i 500 MHz, proizveden upotrebom AMD-ove 0,25-mikronske tehnologije. Do kraja 1999. godine, AMD je dalje povećao brzine, a njegov model na 750 MHz je bio prvi procesor napravljen upotrebom AMD-ove aluminijumske 0,18-mikronske šest-metal-slojne proizvodne tehnologije. Pitanje za diskusiju je da li je to bila najbrža centralna procesorska jedinica x86 proteklog milenijuma, jer je Intel odmah odgovorio objavljivanjem Pentijuma III na 800 MHz. Medjutim, AMD je ponovo preuzeo vodjstvo u brzini početkom 2000. godine, sa objavljivanjem verzija na 800 MHz i 850 MHz, a uspeo je da potuče Intel-a na željenoj granici od 1 GHz, za nekoliko dana koju nedelju kasnije. AMD Athlon procesori koji imaju tehnologiju medjupovezivanja bakrom su predvidjeni da budu raspoloživi sredinom 2000. godine.

Skup čipova AMD-750
Skup čipova AMD-750 se satsoji od dva fizička uredjaja: AMD-751 sistemskog kontrolera i AMD-756 kontrolera periferijske magistrale. Klučne osobine AMD751 sistemskog kontrolera su:

Slika 6: Skup čipova AMD-750

40 • • • • • • Podrška za spregu na AMD Athlon sistemsku magistralu, prvu sistemsku magistralu na 200 MHz za platforme x86; Logička arhitektura sistema optimizovana za AMD Athlon procesor sedme generacije; Sprega za magistralu PCI 2.2, sa podrškom za 6 PCI mastera; Podrška za kapacitete do 768 Mbajta PC-100 SDRAM DIMM memorije; Saglasan sa AGP 2.0 specifikacijama za režime 1x i 2x AGP; Optimizovan da isporuči veću sistemsku performansu procesora AMD Athlon.

Klučne osobina AMD-756 kontrolera periferijske magistrale su: • • • • • Poboljšani režim mastera IDE kontrolera sa podrškom za Ultra DMA-33/66; Podrška za Plug-and-Play, ACPI 1.0 i APM 1.2 standarde upravljanja energijom; Most PCI na ISA koji podleže PC97 i integrisan kontroler ISA magistrale; Integrisan USB kontroler saglasan sa OHCI, sa čvorištem i četiri porta; Podrška za nasledjene kontrolere miša/tastature.

Thunderbird
Sredinom 2000. godine, AMD je predstavio pojačanu verziju procesora Athlon, pod nazivom "Thunderbird". Originalna skrivena memorija drugog nivoa od 512 Kbajta, zamenjena je ovde sa 256 Kbajta skrivene memorije na samom čipu koja radi punom brzinom procesora. Pored toga što je pojačalo performansu, premeštanje skrivene memorije na čip dozvolilo je takodje AMD-u da prati Intel-ovo vodjstvo u kretanju sa procesora zasnovanih na slotu ka faktoru forme podnožja - u slučaju AMD, 462-pinskog formata, koje je nazvano Podnožje A. Podržavajući memoriju PC133, pojačani procesor Athlon je na početku bio raspoloživ u šest brzina, od 750 MHz do 1 GHz, kako u slotu A (doduše dostupan samo proizvodjačima originalne opreme), tako i u novom pakovanju za Podnožje A. Verzije na 1,1 GHz i 1,2 GHz čipa bile su uvedene kasnije tokom 2000. godine i bile su raspoložive samo u faktoru forme Podnožje A.

Duron
Posle premeštanja AMD-ovog K6-III procesora zasnovanog na Podnožju 7 u područje za isključivu upotrebu u mobilnim PC računarima, u drugoj polovini 1999. godine, Intelov niz procesora Celeron je uživao dominantan položaj na segmentu tržišta nižih cena. Sredinom 2000. godine, AMD je pokušao da preokrene takav trend objavljivanjem svog modela Duron nove familije procesora namenjene štedljivijem poslovanju i kućnim korisnicima. Duron je zasnovan na svom moćnijem sabratu, procesoru Athlon, a dobio je ime izvedeno iz latinskog jezika - od "durare" i "on" što znači "trajati" i "jedinka". On ima 128 Kbajta/64

41 Kbajta skrivenih memorija prvog/drugog nivoa - obe na samom čipu, čeonu magistralu na 200 MHz i poboljšanu 3Dnow! tehnologiju. Skrivena memorija drugog nivoa od 64 Kbajta se poredi sa 256 Kbajta kod procesora Athlon i 128 Kbajta kod rivala Celeron. AMD veruje da mu je to dovoljno da obezbedi prihvatljivu performansu na svom ciljnom tržištu, dok pokazuje prednosti u ceni u odnosu na svog Intel-ovog rivala. Proizvedene pomoću AMD-ove 18-mikronske tehnologije, prve centralne procesorske jedinice Duron bile su raspoložive na brzinama od 600 MHz, 650 MHz i 700 MHz. Potvrdjujući napuštanje faktora forme zasnovanog na slotu, Duron je sada raspoloživ samo u AMD-ovom novom pakovanju 462-pinskog Podnožja A.

LDT
"Munjeviti transport podataka" firme AMD (Lightning Data Transport - LDT) je interna medjusobna veza čip-na-čip koja obezbedjuje mnogo veći propusni opseg za ulaz/izlaz i funkcije koprocesora i višeprocesne obrade. LDT podržava jednosmerne veze tipa tačka-na-tačku u svakom pravcu, a sposoban je da dostigne propusni opseg do 6,4 Gbajta u sekundi. Propusna moć je, u stvari, promenljiva i dogovorena je prilikom inicijalizacije. LDT obezbedjuje povećanje propusnog opsega od više od 20 puta, poredjeno sa sadašnjim medjusobnim vezama sistema koji su sposobni da rade brzinama do 266 Mbajta u sekundi.

Slika 7: LDT veza čipova firme AMD

Vrsta topologije kojoj LDT olakšava rad prikazana je na slici 7. Dozvoljena je upotreba čipova "Severni most" - svaki sa više centralnih procesorskih jedinica Athlon priključenih preko standardne magistrale EV6 - da medjusobno komuniciraju svaki sa svakim preko zajedničke magistrale visoke performanse. Čipovi "Severni most" mogu da se povežu preko "Južnog mosta" ili drugih sprežnih kontrolera koristeći istu magistralu LDT. LDT može da se posmatra kao da komplementira spolja vidljive standardne magistrale kao PCI ili Serijski ulaz/izlaz, obezbedjujući vrlo brzu vezu obema. Njegova povećana performansa ulaza/izlaza i propusni opseg će poboljšati ukupnu performansu sistema servera, radnih stanica i ličnih računara zasnovanih na procesoru Athlon. Očekuje se da će dvosmerni čip koji sadrži LDT stići na tržište u drugoj polovini 2000. godine.

Hammer

42 Možda ohrabren tehnološkim vodjstvom u oblasti PC procesora, koje je dostigao uvodjenjem svog procesora sedme generacije Athlon, AMD je objavio sopstvenu viziju puta ka podršci 64-bitnom kôdu i adresiranju memorije u oktobru 1999. godine - i on je bio različit od Intelove arhitekture IA-64. Dok je IA-64 potpuno nova arhitektura, AMD je izabrao da proširi postojeću arhitekturu x86 da bi uključio 64-bitno računanje, usvajajući pristup koji će obezbediti da korisnici lako nastave da upotrebljavaju svoje postojeće 32-bitne primene, a da 64-bitne primene koriste prema potrebi. U osnovi, AMD-ova konstrukcija x86-64 - prvobitno poznata pod imenom "Sledgehammer" a zatim nazvana "Hammer" kada je objavljena potpuna specifikacija arhitekture sredinom 2000. godine - proširuje x86 da bi uključila 64-bitni režim koji ima i 64-bitni adresni prostor i 64-bitne podatke - tako da budući 64-bitni procesori mogu da detektuju koji režim je potreban i da shodno tome vrše računanja. Skup instrukcija će biti proširen, ili uvedene operacije kao što je prethodno donošenje instrukcija i podataka, a jedine veće promene arhitekture očekuju se u jedinici za rad u pokretnom zarezu x87. AMD tvrdi da njegov konzervativniji prelaz na 64-bitno računarstvo ima niz prednosti u odnosu na Intel-ov put razvoja, od okjih su najvažnije: • • • • • potpuno prirodna podrška i za 64-bitne i za 32-bitne primene; manja potrošnja napajanja i zbog toga više učestanosti; mogućnost proizvodnje višestrukih procesora x86-64 na jednom čipu: nema oslanjanja na složenu tehnologiju novih prevodilaca; manja cena.

U jesen 2000. godine, AMD je uveo svoj simulator "SimNow!" - primenu posebno projektovanu da pruži prodavcima BIOS-a, konstruktorima alata, proizvodjačima operativnih sistema i dobavljačima primena mogućnost da procene njihov softver zasnovan na tehnologiji x86-64, pre uvodjenja procesora Hammer.