You are on page 1of 3

Arquitectura i Enginyeria dels Computadors

Grau en Enginyeria Inform` atica

Control de la Unitat Tem` atica 1


Setembre de 2013 Primer torn
P ROBLEMA 1 Disposeu dun microprocessador Mips-TwoCores encastrat en un telescopi. Per a processar les imatges obtingudes disposeu del programa PhotoStacker que t e una part parallelitzable que podeu distribuir entre els nuclis disponibles mentre la resta s necess` e ariament sequencial i nom es pot executar-se en un nucli. Aprotant que Mips i heu vist que amb TwoCores t e dos nuclis, heu provat a mesurar-ne el temps dexecucio e s de 12 segons i amb dos nuclis de 7.5 segons. nom es un nucli el temps dexecucio 1. Calculeu el percentatge de temps que dedica Mips-TwoCores a la part sequencial de PhotoStacker quan hi treballa nom es un nucli. 2. Calculeu el percentatge de temps que dedica Mips-TwoCores a la part sequencial de PhotoStacker quan hi treballen els dos nuclis. 3. Us plantegeu canviar el processador Mips-TwoCores per Mips-FourCores, que t e ` costa el doble. Fent servir quatre nuclis que funcionen un 50% m es r` apidament pero s convenient el canvi? Justiqueu-ne la resposta. lan` alisi de cost i prestacions, e : S OLUCI O 1. Per a calcular el percentatge de temps dedicat a la part seq uencial amb un nucli, hi podem plantejar el sistema dequacions seg uent: tseq + tseq + tpar = 12 1 tpar = 7.5 2 Temps amb un nucli Temps amb un nucli

on tseq i tpar s on el temps absolut dexecuci o de les parts seq uencial i paralella de PhotoStack. El sistema es resol amb tseq = 3 i tpar = 9 segons. El percentatge 3 = 25 %. demanat es F = 12 Altre cam , amb la Llei dAmdahl, parteix de S = 12 = 7.5 1 1F + F 2

per a obtenir el mateix resultat. 2. Quant al percentatge de temps dedicat a la part seq uencial amb dos nuclis: Hem calculat el temps absolut de la part seq uencial tseq = 3 segons i el temps total 3 = 40 %. Tamb e podem aprotar que amb dos nuclis, tenim que F = 7.5 F (amb dos nuclis) = F (amb un nucli) S = 0.25 12 = 0.4 7.5

3. El nou processador ofereix dues millores: el guany en velocitat en cadascun dels nuclis (el 50% m es r` apid suposa una acceleraci o SN = 1.5) i el doble de parallelisme (SP = 8/4 = 2). La part seq uencial de Photostaker nom es es benecia de SN tseq = 3 segons = 2 segons 1.5

La part parallela combinar` a tant SN com SP . tpar = 4.5 segons = 1.5 segons 1.5 2

El temps absolut amb el nou processador es de 3.5 segons. Lacceleraci o obtinguda amb el canvi ser` a 7.5 segons = 2.14 S = 3.5 segons que supera lincrement en el cost del processador. Per tant, conv e el canvi de processador. P ROBLEMA 2 Esteu dissenyant un processador molt paregut al MIPS i heu de denir la Us plantegeu dues alternatives: part del joc dinstruccions de bifurcacio. A) Sis instruccions de salt (beq, bne, bge, blt, bgt i ble), totes elles de la forma bcond rs,rt,eti, que corresponen a les sis comparacions possibles entre registres (=, =, , ` <, > i ). Obviament, qualsevol dels dos registres de les instruccions pot ser $zero, aix que les mateixes instruccions aproten per a comparar el valor dun registre amb zero. s a dir, dues instruccions B) Les sis instruccions de salt de qu` e disposa el MIPS R2000, e que comparen dos registres (beq i bne) i les quatre comparacions dun registre amb zero (bgez, bltz, bgtz i blez). Per a fer les comparacions bge, blt, bgt i ble) entre amb una resta (sub) o una dos registres qualsevol, caldr` a combinar una bifurcacio (slt) comparacio de condicions de salt per a un i altre joc: Vegeu uns exemples de traduccio
condici o de salt $t0 = $t1 $t0 > $t1 $t0 > 0 opci oA beq $t0,$t1,eti bgt $t0,$t1,eti bgt $t0,$zero,eti Opci oB beq $t0,$t1,eti sub $at,$t0,$t1 bgtz $at,eti bgtz $t0,eti

A tenen 16 % dinstruccions de Heu vist que els programes compilats per a lopcio i que els programes compilats B tenen en total un 4% dinstruccions m bifurcacio es que A. els compilats per a lopcio de lopcio A sha afegit una instruc1. A quin percentatge dinstruccions de bifurcacio de c` B? cio alcul en lopcio processadors, heu vist que el processador 2. En fer proves amb prototipus dambdos A t amb lopcio e CPI de 1.2 i el seu rellotge pot funcionar a 2 GHz, mentre que el B t processador amb lopcio e CPI de 1.3 i el seu rellotge pot funcionar a 2.5 GHz. e s millor, A o B? Justiqueu-ne la resposta. Quina opcio 2

: S OLUCI O 1. En un programa compilat per a lopci o A, hi ha dos tipus dinstrucci o de salt: (1) aquelles a les qu` e cal afegir una instrucci o de comparaci o en canviar al joc dinstrucci o B i (2) la resta. Sabem que entre cada cent instruccions en el codi de lopci o A hi ha 16 de bifurcaci o. Si totes les bifurcacions foren del tipus (1), el codi B tindria 16 instruccions m es; es a dir, que IB = 1.16 IB ; en canvi, si totes foren del tipus (2), no canviaria el nombre dinstruccions i resultaria IB = IA . a dir, que a les 16 instruccions de En aquest cas hi ha un 4 % m es dinstruccions. Es bifurcaci o cal afegir 4 de c` alcul. Per tant, la proporci o de bifurcacions del joc A a les qu` e caldr` a afegir una instrucci o de c` alcul en el joc B ser` a Proporci o= 4% = 25% 16%

2. Entre els dos dissenys varien els tres factors en qu` e es descompon el temps dexecuci o Tex = I CPI t . Coneguem el valor absolut del CPI (CPIA = 1.2 i CPIB = 1.3) i del 1 1 = 0.5 ns i tB = = 0.4 ns). El factor I dambd os temps de cicle (tA = 2 GHz 2.5 GHz dissenys ve relacionat perqu` e IB = 1.04 IA . El resultat de la comparaci o es de Tex (A) IA 1.2 0.5 ns = Tex (B ) 1.04 IA 1.3 0.4 ns Per tant, el disseny B es 11 % m es r` apid que el disseny B. 1.11

You might also like