You are on page 1of 42

William Stallings

Computer Organization
and Architecture
7th Edition
2
Evolucioni dhe performasat e
kompjutereve

ENIAC
Electronic Numerical Integrator And
Computer
Eckert and Mauchly
University of Pennsylvania
Fillimi 1943
Fundi 1946
Perdorimi deri 1955

ENIAC

Decimal (jo binar)


20 akumulator me nga 10 shifra
Programimi manual permes nderpreresve
18,000 gypa katodik
30 ton
15,000 square feet
140 kW
5,000 operacione te mbledhjes ne sekond

von Neumann/Turing
Koncepti i kompjuterit me program te
brendshem (Stored Program concept).
Programi dhe te dhenat ruhen ne
memorien kryesore.
Njesia aritmetiko logjike (ALU) operon me
te dhena binare.
Njesia kontrolluese interpreton
instruksionet e vendosura ne memorie
dhe i ekzekuton
Pajisjet hyrese dhe dalese udhehiqen nga
njesia kontrolluese

von Neumann/Turing
Princeton Institute for Advanced Studies
IAS

Completed 1952

Struktura e makines se von Neumann-it

IAS
1000 fjale 40 biteshe
Numrat binare
2 x 20 bit instructions

Regjistrat (memoria ne CPU)


Memory Buffer Register (bufer regjistri i memories)
Memory Address Register (regjistri asdresor i memories)
Instruction Register (regjistri i instruksioneve)
Instruction Buffer Register (bufer regjistri i
instruksioneve)
Program Counter (numruesi programor)
Accumulator (akumulatori)
Multiplier Quotient

Struktura e IAS

Kompjuteret komercial
1947 - Eckert-Mauchly Computer
Corporation
UNIVAC I (Universal Automatic Computer)
Kalkulimet per US Bureau of Census 1950
Prone e Sperry-Rand Corporation
Fundi i 1950-ve - UNIVAC II
Me i shpejte
Me shume memorie

IBM
Pajosjet per procesim te kartelave me
vrima1953 - IBM 701
Kompjuteri i pare i IBM-it me progtram te
brendshem
Per kalkulime shkencore

1955 IBM 702


Biznis aplikacionet

Pararendes i IBM 700/7000 series

Tranzistoret

Zevendsuan gypat katodik


Me te vegjel
Me te lire
Lirojne me pak nxehtesi
Pajisje solid state
Prodhohen nga silikoni
1947 Bell Labs
William Shockley etj.

Kompjuteret e bazuar ne tranzistore

Gjenerata e dyte
NCR & RCA machines
IBM 7000
DEC 1957
PDP-1

Mikroelektronika
Komponentet e kompjuterit: portet,
qelizat memorike, nderlidhjet
Prodhohen nga materiali gjysempercues

Gjeneratat e kompjutereve
Gypat katodik - 1946-1957
Tranzistoret - 1958-1964
Small scale integration SSI 1965+
Deri 100 pajisje ne cip

Medium scale integration MSI - deri 1971


100-3,000 pajisje ne cip

Large scale integration LSI - 1971-1977


3,000 - 100,000 pajisje ne cip

Very large scale integration VLSI- 1978


-1991
100,000 - 100,000,000 pajisje ne cip

Ultra large scale integration ULSI 1991 Over 100,000,000 pajisje ne cip

Ligji i Moore-it

Dendesia e rritur e komponenteve ne cip


Gordon Moore bashkethemelues i Intelit
Numri i tranzistoreve ne cip dyfishohet cdo vit
Prej 1970s zhvillimi ngadalsohet pak
Numri itranzistoreve ne cip dyfishohet cdo 18 muaj

Cmimi i cipit i pandryshuar


Paketimi me i shpeshte nenkupton rruge me te
shkurta eelektrike, qe rezulton me performansa
me me mira
Madhesia me e vogel jep me shume fleksibilitet
Nevoja me te vogla per energji dhe ftrohje
Me pak nderlidhje mes cipave zvoglojne
problemet e mundshme

Rritja e numrit te tranzistoreve ne CPU

IBM 360 series


1964
Zevendsoi IBM 7000 series
Familja e pare e kompjutereve
Bashkesia e ngjashme ose identike e
instruksioneve
Sistemi operative identik ose i ngjashem
Shpejtesia e rritur
Numri me i madh i porteve hyrese/dalese
(p.sh terminaleve)
Memoria me e madhe
Cmimi me i larte

DEC PDP-8

1964
Minikompjuteri i pare
Nuk i nevojitet klimatizimi
Mund te vendoset mbi tavoline
$16,000
$100k+ per IBM 360

Aplokacionet e integruara dhe OEM


Struktura e busave

DEC - PDP-8 Bus Structure

Memoria gjysempercuese

1970
Fairchild
Madhesia si e berthames magnetike
Permban 256 bita
Non-destructive read
Me e shpejte se berthamat magnetike
Kapaciteti dyfishohet cdo vit

Intel
1971 - 4004
Mikroprocesori i pare
Te gjitha komponentete CPU ne nje cip
4 bit

1972 - 8008
8 bit

Te dizajnuar per aplikacione specifike


1974 - 8080
Mikroprocesori i pare i Intelit per perdorim te
pergjithshem

Rritja e shpejtesise

Pipelining
Cache ne pllake
L1 & L2 cache ne pllake
Parashikimi i degezimit
Analiza e rrjedhes se te dhenave
Ekzekutimi spekulativ

Performansat
Rritja e shpejtesise se procesorit
Rritja e kapacitetit te memories
Shpejtesia e procesorit me e madhe se e
memories

Login and Memory Performance Gap

Zgjidhja
Rritja e numrit te bitave qe merren ne nje
hap
Ndrimi i interfejsit te DRAMit
Cache

Zvoglimi i shpeshtesise se qasjes


memories
Cache me kompleks dhe cache ne cip

Rritja e shpejtesise se nderlidhjeve


Busta e shpejte
Kierarkia e busave

Pajisjet H/D
Periferite me kerkesa te medha per H/D
Kerkesa per transfer te madh te te
dhenave ne njesi kohore
Problemi i bartjes se te dhenave
Zgjidhjet:
Keshimi
Baferimi
Busa interkonektiv me shpejtesi t elarte
Struktura me komplekse e busave
Konfigurimet multiprocesorike

Typical I/O Device Data Rates

Balancimi

Procesoret
Memoria kryesore
Pajisjet H/D
Strukturat nderlidhese

Permiresimet ne organizimin dhe


arkitekturen e cipit
Rritja e shpejtesise se procesorit
Per shkak te zvoglimit te madhesise se porteve
logjike
Me shume porte, te paketuara me shpesh, me
frekuence me te larte
Koha e e shkurtuar e perhapjes se sinjaleve elektrike

Rritja e madhesise dhe shpejtesise se


cacheit
Hapesira e dedikuar ne cipin e procesorit
Koha e qasjes cache-it bjen drastikisht

Ndrimi i organizimit dhe arkitektures se


procesorit
Rritja e shpejtesise se ekzekutimit
Paralelizmi

Probleme me shpejtesine e kllokut dhe


dhe dendesine
Fuqia
Dendesia e fuqise rritet me dendesine e qarqeve logjike dge
shpejtesine e kllokut
Disipacioni i nxehtesise

Vonesa RC
Shpejtesia me te cilen levizin elektronet kufizohet me
rezistencen e percuesve dhe kapacitetet
Rritje e RC rrit vonesat
Percuesit me te holle rrisin rezistencen
Percuesit e vendosur me afer njeri tjetrit rrisin kapacitetin

Ngecja (latency) e memories


Shpejtesia e memories ngec pas shpejtesise se procesorit

Zgjidhja:
Me shume rendesi zgjidhjeve organizative dhe arkitektonike

Intel Microprocessor Performance

Rritja e kapacitetit te cache-it


Ne rastin tipik dy deri tri nivele te cache-it
mes procesorit dhe memories kryesore
Rritja e dendesise se cipave
Me shume cache memorie ne nje cip
Qasja me e shpejte

Pentiumi ia dedikon cacheit 10% te


siperfaqes se cipit.
Pentium 4 ia dedikon cacheit perafersiht
50% te siperfaqes

Logjika komplekse e ekzekutimit


Ekzekutimi paralel i instruksioneve
Pipeline (tubacioni, gypsjellesi) funsionon
si linja montuese
Instruksionet ne stade te ndryshme te
ekzekutimit ne kohe te njejte pergjate te
njejtit pipeline

Procesoret superskalar me me shume


pipeline ne kuader te nje procesori
Instruksionet qe nuk varen nga njeri tjetri
mund te ekzekutohen paralelisht.

Mundesite modeste per permiresim


Organizimi intern i procesoreve kompleks
Paralelizmi
Gjasa te vogla per permiresime sinjifikante

Benefitet nga cache i jane afruar limitit


Rritja e kllokut shkakton probleme te
dispacionit
Jane arritur sisa kufizime fundamentale
fizike

Qasja e re Me shume berthama


Me shume procesore ne nje cip.
Cache i madhe i perbashket

Brenda procesorit rritja e performansave


proporciale me rrenjen katrore te rritjes se
kompleksitetit
Nese softwarei mund te shfrytezoje me shume
procesore, dyfishimi i numrit te procesoreve gati
dyfishon performansat.
Pra, perdoren dy procesore me te thjeshte ne nje
cip ne vend te nje procesori kompleks
Me dy procesore ka kuptim cachei me i madh
Shpenzimi i qarqeve memorike eshte me i vogel se i
qarqeve procesorike

Shembull: IBM POWER4, Pentium Core 2 Duo

POWER4 Chip Organization

Evolucioni i Pentiumit (1)


8080
Procesori i pare me perdorim te gjithanshem
Rruget 8 biteshe te te dhenave
Perdoret ne kompjuterin e pare personal Altair

8086
Shumke me i fuqishem
16 bitsh
Cache i instruksioneve, paramarrja e e disa
instruksioneve
8088 (busi i jashtem 8 bitsh) perdoret ne IBM PC

80286
16 Mbyte memorje te adresueshme

80386
32 bitsh
Perkrahja per multitasking

Evolucioni i Pentiumit (2)


80486
Pipelining i cacheit dhe instruksioneve
Koprocesori matematikor i integruar

Pentium
Superskalar
Instruksione te shumefishta ekzekutohen
paralelisht

Pentium Pro
Organizimi i theksuar superskalar
Riemrimi i regjistrave
Parashikimi i degezimit
Analiza e rrjedhes se te dhenave
Ekzekutimi spekulativ

Evolucioni i Pentiumit (3)


Pentium II
MMX teknologjia
Procesimi i grafikes, videos dhe zerit

Pentium III
Instruksione shtese me pike te levizshme per grafiken
3D

Pentium 4
Permiresime shtese per operacione me pike te
levizshme dhe multimedia

Itanium
64 bit

Itanium 2
Permiresime hardwareike per rritjen e shpejtesise

PowerPC
1975, 801 minicomputer project (IBM) RISC
Berkeley RISC I processor
1986, IBM commercial RISC workstation product, RT PC.
Not commercial success
Many rivals with comparable or better performance

1990, IBM RISC System/6000


RISC-like superscalar machine
POWER architecture

IBM alliance with Motorola (68000 microprocessors), and


Apple, (used 68000 in Macintosh)
Result is PowerPC architecture
Derived from the POWER architecture
Superscalar RISC
Apple Macintosh
Embedded chip applications

PowerPC Family (1)


601:
Quickly to market. 32-bit machine

603:
Low-end desktop and portable
32-bit
Comparable performance with 601
Lower cost and more efficient implementation

604:
Desktop and low-end servers
32-bit machine
Much more advanced superscalar design
Greater performance

620:
High-end servers
64-bit architecture

PowerPC Family (2)


740/750:
Also known as G3
Two levels of cache on chip

G4:
Increases parallelism and internal speed

G5:
Improvements in parallelism and internal
speed
64-bit organization

You might also like