Professional Documents
Culture Documents
Primeraaparicindeltrmino,en1964(Amdahl):
Esdecir,ACengloba:
Noconsideralaformaenqueseimplementany ejecutanlasinstrucciones.
BellyNewell,en1970,introdujeronuna descripcinmultiniveljerrquica:
Leccin1:ConceptodeAC
Descripcindeniveles paraunaarquitecturavonNeumann
NiveldeTransmisinderegistros(RT): realizaunestudiodelcomportamientodelasunidadesdelnivel deabstraccindecircuitoscombinacionalesysecuencialesala horadetransmitirymodificarlainformacin. Incluyeelniveldemicroprogramacin,solapndosedeeste modoloselementoshardwareconelsoftware. NiveldeSistemaComputador: especificaloscomponentes,suinterconexinylaoperacindel sistemacompleto. Incluyelaprogramacinenensambladoryaqueeslaqueopera directamentesobreelsistema. NiveldeSistemaOperativo:englobalainterfazentreel hardware(nivelesanteriores)yelsoftware(aplicaciones).
Ventajasdeunadescripcinenniveles:
Cadaniveltienesucorrespondiente:
Arquitecturaconcreta(Implementacin):
Describelosmdulosquecomponenelnivel,ylaformaen queestninterconectados.
Arquitecturaabstracta(Funcin):
Especificalaoperacin(funcin)querealizacada componenteindividualdelnivel,comopartedelaestructura.
Ej.Procesador:
LosobjetivosdelaACson:
Tarda3ciclos
Tarda2ciclos
Tema1:Introduccin
Contenidos
1Generacin19461955 Tecnologa:
Vlvulaelectrnicadevaco.
Modelos:
ENIAC(1946):18.000vlvulas,30toneladas,1400m2,100 Kw,5.000sumasporsegundo. EDSAC(1949):primerordenadorconprogramaalmacenado. UNIVAC:primercomputadorcomercial.
Personasdestacadas:
JonhVonNeumannestableceunmodelodelaestructurade uncomputador.
2Generacin:19551965 Tecnologa:
Transistor(BardeenBrattain,1947).Ventajas:menor espacio,menorconsumo,msbaratoymayorfiabilidad.Esto hacedisminuirelprecioytamaodeloscomputadores. Primercomputadorcontransistoren1954
Modelos:
PDP1deDIGITAL
Mododefuncionamiento:
Lenguajesdealtonivel:FORTRAN,COBOL,ALGOL,PL/1. Seescribeelprogramaenpapel,seperforaentarjetas,se llevaaloperador,serecogeellistadodeimpresora. Sistemadeprocesamientoporlotes(conS.O.)
3Generacin:19651980
Tecnologa:
CircuitosintegradosSSI(hasta100)yMSI(1003000) IBMsistema360yPDP8(DIGITAL)
Modelos:
Mododefuncionamiento:
LenguajesdealtonivelBASICyPASCAL S.Oconmultiprogramacin:
4Generacin:19801990 Tecnologa:
SeintegralaUCPenunslochip:elmicroprocesador. CircuitosintegradosLSI(300030000)yVLSI(msde30000)
Modelos:
IBMPC(1981),IBMPCXT(1982),IBMPCAT(1984),IBM PS/2(1987),VAX(DIGITAL,1980),CRAYXMP(1983)
Mododefuncionamiento:
Softwarefcildeusar. SistemasoperativosMSDOS,UNIX.. Sistemasoperativosderedysistemasoperativos distribuidos.
5Generacin:1990... Tecnologa:
Circuitosconmsdeunmillndecomponentes. Nuevasarquitecturas:clustersdecomputadores. Tecnologaptica.
Modelos:
Mododefuncionamiento:
Ej:AplicacionesMultimedia
Fuente:http://www.interfacebus.com
Arquitecturaspropuestas:VLIW,DSPs
Ritmodemejoradelatecnologa:
Losavancesenlatecnologa(actual)estn limitados:
Estoimplicaquelamejoradeprestacionestiene quevenirdadapor:
Paralelismo Localidad
Localidad
Localidad Debidoalaspropiedadesdelocalidadespacial ytemporal,sepuedehacerusodememorias mspequeasperomsrpidasentreel procesadorylamemoriaprincipal. Localidadespacial:lasiguienteinstruccin sueleestarcerca Localidadtemporal:lasiguienteinstruccin suelehaberseejecutadohacepoco Losnivelesmsrpidossonlosmsprximos enlajerarqua
Paralelismo(sistemasmonoprocesador)
Paralelismo(sistemasmonoprocesador)(II)
Multiplicidaddeunidades funcionales
Paralelismo(sistemasmonoprocesador)(III)
Segmentacinencauzada
Paralelismo(sistemasmonoprocesador)(IV)
SolapamientodelasoperacionesdeE/SyCPU
Paralelismoensistemasmonoprocesador(V)
Equilibradodelanchodebandaenlossubsistemas
Tiposdeparalelismo:
Nivelesdeparalelismo:
Arq. S.O..
Clasificacindearquitecturasparalelas
TaxonomadeFlynn
Sebasaenelnmerodeunidadesdecontrolyde procesadoresdisponiblesenelcomputador Introdujolasnocionesde: Flujodeinstruccionessimple(SI):Laarquitecturatiene unanicaunidaddecontrolqueproduceunnicoflujo deinstrucciones Flujodeinstruccionesmltiple(MI):Laarquitecturatiene mltipleunidadesdecontrol,cadaunaproduciendoun flujodistintodeinstrucciones Flujodedatossimple(SD):Slohayunprocesadorque ejecutaunnicoflujodedatos Flujodedatosmltiple(MD):Hayvariosprocesadores, cadaunodeellosejecutandounflujodedatosdistinto.
Clasificacindearquitecturasparalelas
SIMD
MIMD
Clasificacindearquitecturasparalelas
SISD
DescripcinEstructural
DescripcinFuncional
Clasificacindearquitecturasparalelas
SIMD
Descripcin Estructural
Descripcin Funcional
Aprovechanelparalelismodedatos ProcesadoresMatriciales ForallEP(i=1to4) C[i]=A[i]+B[i] F[i]=D[i]E[i]; i[I]=K[I]*H[i]; end Procesadores Vectoriales: ADDVC,A,B SUBVF,D,E MULVI,K,H
SistemasSIMD
EnlosSIMD,unanicaunidaddecontrolproporcionauna nicasecuenciadeinstruccionesqueseejecutan sncronamenteoperandosobredistintosflujosdedatos. LosSIMDrequierenmenosmemoriapuestoqueejecutan elmismocdigo.Sonmsapropiadosparalosproblemas quepresentenunmayorparalelismodedatos. Alejecutartodoslosprocesadoreselmismocdigode formasncrona,habrprocesadorestrabajandoyotros desocupados,dependiendodelosdatosqueestn procesando. Eldiseodelosprogramasesmssencillo.
Clasificacindearquitecturasparalelas
MISD
Clasificacindearquitecturasparalelas
MIMD
Descripcin Funcional
DescripcinEstructural CorrespondealosMultiprocesadoreyMulticomputadores,aprovechanparalelismo funcional Proc1 Fori=1to4do c[i]=a[i]+b[i]; end Proc2 Fori=1to4do F[i]=D[i]E[i]; end Proc3 Fori=1to4do G[i]=K[i]+H[i]; end
Aplicacionesdelprocesamientoparalelo
Modelizacinpredictivaysimulaciones
Diseoyautomatizacindeproyectosdeingeniera
Exploracinderecursosenergticos
Investigacinmdica
TiempodeEjecucin
TiempodeEjecucin(II)
Tiempodeejecucin(III)
Tiempodeejecucin(VI)
Otraformadeexpresarloesteniendoencuentasi unainstruccinpuedecodificarvariasoperaciones:
TCPU=(Noper/Op_instr)xCPIxTciclos
donde:
Nopereselnmerodeoperacionesdelprograma Op_instreselnmerodeoperacionesquepuedenser codificadasporinstruccin Noper/Op_instr=NI
Elementosqueinfluyeneneltiempodecomputacin Tecnologa:
Estructurayorganizacin:
Repertoriodeinstrucciones:
Compilador:
Ejemplo:Consideremos2alternativasparaunainstruccindesalto condicional: CPUA.Unainstruccindecomparacininicializauncdigode condicinyesseguidaporunsaltoqueexaminaelcdigode condicin CPUB:Seincluyeunacomparacinenelsalto EnambasCPU,lainstruccindesaltocondicionalemplea2ciclos derelojylasdemsinstrucciones1.EnlaCPUA,el20%detodas lasinstruccionesejecutadassonsaltoscondicionales;comocada saltonecesitaunacomparacin,otro20%delasinstruccionesson comparaciones.DebidoaquelaCPUAnoincluyelacomparacin enelsalto,sucicloderelojesun25%msrpidoqueeldelaCPU B. QuCPUesmsrpida? YsiconseguimosqueladuracindelosciclosderelojdeB sereduzcaenun10%?
MIPS(millonesdeinstruccionesporsegundo) MIPS=Frecuenciadereloj/(CPI106)Dacifrasmsmanejables Fcildeentender Problemas: Dependendelrepertoriodeinstrucciones Varanentreprogramasenelmismocomputador Puedenvariarinversamentealrendimiento Posiblesolucin: UtilizarMIPSrelativosaunamquinadereferencia MIPSrelativos=(Tr/Tt)xMIPSr(Tr=Tiempoenlamquinade referencia,Tr=Tiempoenlamquinaquesetestea,MIPSr=MIPSenla mquinadereferencia)
MFLOPSesunamedidasimilaralasMIPS,perohacereferenciasloa lasoperacionesencomaflotante.
MFLOPS=(Noperacionesdepuntoflotantedeunprograma)/(Tejecucinx106)
TiposdeBenchmarks:
Aplicacionesreales(CompiladoresdeC,Word,Photoshop...).Pueden presentaproblemasdeportabilidadrelacionadosconladependenciadel compiladorodelS.O.Avecesseutilizanaplicacionesmodificadas (scriptedapplications)parasimularinteraccionesmultiusuariocomplejas (servidores),oquitaroperacionesdeI/Oparamedirbienel comportamientodelaCPU.... Kernels(BuclesdeLivermoore,Linpacks).Pequeostrozosdeprogramas realesseleccionadosparaevaluarcaractersticasespecficasdeuna mquinaoexplicarlascausasdelasdiferenciasentremquinasdistintas. Simples(Toys)(CribadeEratstenes,Puzzle,Quicksort).Programas pequeos(10100lneas),fcilesdeescribir,yderesultadoconocido. Sintticos(Dhrystone,Whetstone).Programasquereproducenlos porcentajesdeinstruccionesyusoderecursosdecargasdetrabajo reales.
BechmarkSuites:conjuntosdeBenchmarksquemidenlas prestacionesdeloscomputadoresatravsdeunconjuntode aplicacionesdistintas.Laslimitacionesdeunbenchmarkse suplenconlapresenciadeotros. Secambianperidicamenteparaevitaroptimizaciones realizadasconelnicoobjetivodemejorarlosresultadosdel conjuntodebenchmark. Computadoresdesobremesa:StandardPerformance EvaluationCorporation(SPEC) Servidores:SPECyTransactionProcessingCouncil(TPC) Embebidos:EDNEmbeddedMicroprocessorBenchmark Consortium(EEMBC)
Linpack
EsunconjuntodesubrutinasFortranderesolucinyanlisisde ecuacioneslineales,sistemasdemnimoscuadradosylas transformacionesSVDyQR,dondelasmatricesasociadaspueden sergenerales,abandas,simtricasindefinidasydefinidaspositivas, ycuadradastridiagonales. Sediseparaserutilizadoenelmbitodelossupercomputadores delos70ycomienzodelos80,actualmenteexisteLAPACKque incorporarutinasdiseadasparaserejecutadaseficientementeen procesadoresvectorialesymemoriacompartida. LalistaTOP500,queincluyelos500computadoresmsrpidos utilizaLinpackcomobenchmark
LeydeAmdahl
GananciadeVelocidad=Sp=Vp/V1=T1/Tp
Lamejoradevelocidad,S,quesepuedeobtenercuandosemejoraun recursodeunamquinaenunfactorpestlimitadapor:
S p=
p 1+f p1
1 S p= 1 f +f / p
feseslafraccindeltiempodeejecucinduranteelquenosepuede aplicaresamejoraenlamquina
Ejemplo:
CostedeunComputador