You are on page 1of 4

Arquitectura i Enginyeria dels Computadors

Grau en Enginyeria Inform` atica

Control de la Unitat Tem` atica 1


Setembre de 2013 Segon torn
P ROBLEMA 1 Disposeu dun microprocessador Mips-TwoCores encastrat en un telescopi. Per a processar les imatges obtingudes disposeu del programa PhotoStacker que t e una part parallelitzable que podeu distribuir entre els nuclis disponibles mentre la resta s necess` e ariament sequencial i nom es pot executar-se en un nucli. Aprotant que Mips i heu vist que amb TwoCores t e dos nuclis, heu provat a mesurar-ne el temps dexecucio e s de 12 segons i amb dos nuclis de 8 segons. nom es un nucli el temps dexecucio 1. Calculeu el percentatge de temps que dedica Mips-TwoCores a la part sequencial de PhotoStacker quan hi treballa nom es un nucli. 2. Calculeu el percentatge de temps que dedica Mips-TwoCores a la part sequencial de PhotoStacker quan hi treballen els dos nuclis. 3. Us plantegeu canviar el processador Mips-TwoCores per Mips-FourCores, que t e ` costa el triple. Fent serquatre nuclis que funcionen un 100% m es r` apidament pero s convenient el canvi? Justiqueu-ne la resposta. vir lan` alisi de cost i prestacions, e : S OLUCI O 1. Percentatge de temps dedicat a la part seq uencial amb un nucli: Podem plantejar el sistema dequacions seg uent: tseq + tseq + tpar = 12 1 tpar = 8 2

on tseq i tpar s on el temps absolut dexecuci o de les parts seq uencial i paralella de PhotoStack. El sistema es resol amb tseq = 4 i tpar = 8 segons. El percentatge 4 demanat es Fseq = = 33.3 %. 12 Amb la Llei dAmdahl, si partim de S = 12 = 8 1 1 Fpar Fpar + 2 ; Fseq = 1 Fpar

obtenim el mateix resultat. 2. Quant al percentatge de temps dedicat a la part seq uencial amb dos nuclis: El temps absolut de la part seq uencial, tseq = 4 segons, respecte del total amb dos 4 nuclis, es Fseq = = 50 %. 8 Tamb e podem aprotar que Fseq (amb dos nuclis) = Fseq (amb un nucli) S = 0.33 1 12 = 0.5 8

3. El nou processador ofereix dues millores: el guany en velocitat en cadascun dels nuclis (el 100% m es r` apid suposa una acceleraci o SN = 2) i el doble de parallelisme (SP = 8/4 = 2). La part seq uencial de Photostaker nom es es benecia de SN tseq = 4 segons = 2 segons 2

La part parallela combinar` a tant SN com SP . tpar = 4 segons = 1 segon 22

El temps absolut amb el nou processador es de 3 segons. Lacceleraci o obtinguda amb el canvi ser` a 8 segons S = = 2.67 3 segons que queda per baix de lincrement en el cost del processador. Per tant, el canvi no es convenient.

P ROBLEMA 2 Esteu dissenyant un processador molt paregut al MIPS i heu de denir la Us plantegeu dues alternatives: part del joc dinstruccions de bifurcacio. A) Sis instruccions de salt (beq, bne, bge, blt, bgt i ble), totes elles de la forma bcond rs,rt,eti, que corresponen a les sis comparacions possibles entre registres (=, =, , ` <, > i ). Obviament, qualsevol dels dos registres de les instruccions pot ser $zero, aix que les mateixes instruccions aproten per a comparar el valor dun registre amb zero. s a dir, dues instruccions B) Les sis instruccions de salt de qu` e disposa el MIPS R2000, e que comparen dos registres (beq i bne) i les quatre comparacions dun registre amb zero (bgez, bltz, bgtz i blez). Per a fer les comparacions bge, blt, bgt i ble) entre amb una resta (sub) o una dos registres qualsevol, caldr` a combinar una bifurcacio (slt) comparacio de condicions de salt per a un i altre joc: Vegeu uns exemples de traduccio
condici o de salt $t0 = $t1 $t0 > $t1 $t0 > 0 opci oA beq $t0,$t1,eti bgt $t0,$t1,eti bgt $t0,$zero,eti Opci oB beq $t0,$t1,eti sub $at,$t0,$t1 bgtz $at,eti bgtz $t0,eti

A tenen 20 % dinstruccions de Heu vist que els programes compilats per a lopcio i que els programes compilats B tenen en total un 4% dinstruccions m bifurcacio es que A. els compilats per a lopcio de lopcio A sha afegit una instruc1. A quin percentatge dinstruccions de bifurcacio de c` B? cio alcul en lopcio processadors, heu vist que el processador 2. En fer proves amb prototipus dambdos A t amb lopcio e CPI de 1.3 i el seu rellotge pot funcionar a 2.5 GHz, mentre que B t el processador amb lopcio e CPI de 1.2 i el seu rellotge nom es pot funcionar a 2 e s millor, A o B? Justiqueu-ne la resposta. GHz. Quina opcio : S OLUCI O 1. En un programa compilat per a lopci o A, hi ha dos tipus dinstrucci o de salt: (1) aquelles a les qu` e cal afegir una instrucci o de comparaci o en canviar al joc dinstrucci o B i (2) la resta. Sabem que entre cada cent instruccions en el codi de lopci o A hi ha 16 de bifurcaci o. Si totes les bifurcacions foren del tipus (1), el codi B tindria 16 instruccions m es; es a dir, que IB = 1.16 IB ; en canvi, si totes foren del tipus (2), no canviaria el nombre dinstruccions i resultaria IB = IA . a dir, que a les 16 instruccions de En aquest cas hi ha un 4 % m es dinstruccions. Es bifurcaci o cal afegir 4 de c` alcul. Per tant, la proporci o de bifurcacions del joc A a les qu` e caldr` a afegir una instrucci o de c` alcul en el joc B ser` a Proporci o= 4% = 20% 20%

2. Entre els dos dissenys varien els tres factors en qu` e es descompon el temps dexecuci o Tex = I CPI t . Coneguem el valor absolut del CPI (CPIA = 1.2 i CPIB = 1.3) i del 3

1 1 = 0.5 ns i tB = = 0.4 ns). El factor I dambd os temps de cicle (tA = 2 GHz 2.5 GHz dissenys ve relacionat perqu` e IB = 1.04 IA . El resultat de la comparaci o es de Tex (A) IA 1.3 0.4 ns = Tex (B ) 1.04 IA 1.2 0.5 ns 0.833 = 1 1.2

Per tant, el disseny A es 20 % m es r` apid que el disseny B.

You might also like