Arquitectura de Computadores Tema 1 Introducción.

Conceptos fundamentales
Departamento de Arquitectura de Computadores y Automática

Unversidad Complutense de Madrid (Spain)
José Ignacio Hidalgo hidalgo@dacya.ucm.es

José Ignacio Hidalgo. DACYA. UCM, AC, 2009-2010 2009-

1

Índice
1. 2. 3. 4. 5. 6. 7. Introducción. La asignatura Perspectiva Histórica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

2

1. Introducción. La asignatura.
Ofimática (MS-Office, Contaplus, D-Base) Comunicaciones (Netscape, Explorer, Mail) Diseño (A t CAD ) M lti di Juegos, etc. Di ñ (AutoCAD, ...), Multimedia, J t FOR, WHILE, REPEAT, PROCEDURE, ... PASCAL, FORTRAN, C, COBOL, BASIC, ... MODULA, C++ JAVA MODULA C++, JAVA, ... Gestión de memoria Gestión de procesos Gestión de ficheros
Registros R0

Aplicación

Lenguaje de alto nivel Sistema Operativo / Compilador Arquitectura del repertorio de instrucciones Organización Hardware del sistema Circuito Digital

Compilación Enlazado Ubicación
Loop move load add sub b beq #$10, R0 R1(dir1), R2 R2, R0 #1 R1 #1, Loop

• • •
R7

Registro Estado Contador Programa

CPU

Mem. Mem Bus E/S

Físico

3

Niveles de descripción de un computador
¿Dónde se estudia?
Aplicación

Casa, auto-aprendizaje en ratos libres, Academias de informática/ofimática Fundamentos de Programación Programación, EDI Sistemas Operativos (NO compiladores)

Lenguaje de alto nivel Sistema Operativo / Compilador Arquitectura del repertorio de instrucciones Organización Hardware del sistema Circuito Digital Físico

ESTRUCTURA DE COMPUTADORES,
Arquitectura de Computadores Circuitos Digitales Tecnología F Computadores Digitales, Tecnología, F. Instrumentación, Diseño y Test de Circuitos Integrados

4

Arquitectura de computadores
• Los atributos de un computador tal y como los ve un programador en lenguaje ensamblador. ensamblador • La estructura conceptual y el modelo funcional (modelo de programación). Amdahl, Blaaw, Brooks 1964 • El concepto ha cambiado en el tiempo.
– Hasta la mitad de los 80. El énfasis era el diseño de juego de instrucciones orientado a los LAN. – Desde entonces el énfasis es el diseño de CPU, Jerarquía de memoria, sistema de I/O. Aspectos clave coste-rendimiento-tecnología-potencia

• Tres aspectos
– Arquitectura del juego de instrucciones – O Organización ( diferentes organizaciones P6, N tb t AMD) i ió dif t i i P6 Netbrust, – Implementación ( PentiumIII, Celeron, Pentium4, Pentium Xeon )

5

x86 1977-80) Arquitecturas Load/Store ( (CDC 6600. . .HP-PA. .Sparc.IBM RS6000. Cray 1 1963-76) .1987) 6 . IBM 700 series 1953) Separación del modelo de programación de la implementación Orientadas l O i t d a los LAN (B5000 1963) Concepto d Familia C t de F ili (IBM 360 1964) Arquitecturas con Reg de propósito general Arquitecturas CISC (Vax. y ) RISC (Mips. Intel 432.Evolución de los juegos de instrucciones Acumulador (EDSAC 1950) Acumulador + Registros índices (Manchester Mark I.

Metodología de Diseño Complejidad de la Implementación Evaluar Sistemas E l Si t existentes Benchmarks Tendencias Implementar Nuevo Sistema Simular Nuevos Diseños Carga de Trabajo 7 .

Superescalar. Predicción. Ancho de banda. Ejecución fuera de orden. WORM. Especulación.Memoria Central Jerarquía de Memoria L2 Cache L1 Cache VLSI Arquitectura del Procesador DSP . Cintas RAID Organización de memoria Protocolos de Bus Coherencia.La asignatura Entrada/salida y almacenamiento Discos. Latencia Segmentación y ILP Segmentación. Predicción Especulación 8 DRAM. Riesgos.

Routing. S Red de interconexión Switch Procesador Memoria Multiprocesadores Redes de Interconexión 9 . Paralelismo de Datos Red Topología. Routing Ancho de Banda.La asignatura Que estudia la asignatura P M P M °°° P M P M Memoria Compartida. Latencia. M i C id Paso de Mensajes.

7. 3. Coste y Potencia Ley de Moore. 4. Introducción. Tendencias Benchmarks Ley de Ahmdal Consumo 10 . 5.Índice 1. La asignatura Perspectiva Histórica Rendimiento. 6. 2.

400 m2. Tecnológ Válvula de vacío Transistores Circuitos integrados Microprocesador Sistema basados en micro Potencia de cálculo 0. Superficie: 1. Consumo: 140 KW Potencia cálculo: 5000 sumas/seg Difícil de programar.2 MIPS 1 MIPS 10 MIPS > 100 MIPS 1ª Generación (1946-1957) (1946• ENIAC (1946) – – – – Primer computador de propósito especial p p p p Peso: 30 toneladas. Mediante conmutadores y cables UNIVAC I y II (Eckert & Mauchly) IBM Serie 700 Programación en lenguaje máquina • Primeros computadores comerciales (Años 50) – – – 11 .2. Perspectiva histórica Generaciones de computadores Generación Primera Segunda Tercera Cuarta Quinta Fechas 1946-1957 1958-1964 1965-1971 1972-1988 1988Características Tecnológ.04 MIPS 0.

Máquina de Pascal 12 .

Máquina de Leibnitz 13 .

Charles Babbage 14 .

Ramón Verea 15 .

Leonardo Torres Quevedo 16 .

Colossus Primera computadora totalmente electrónica 17 .

Primeras válvulas de vacío • IBM RAMAC 18 .

más fiables mayores prestaciones • Principales computadores comerciales – DEC PDP 1 PDP-1 – IBM Serie 7000 – UNIVAC 1100 • Otras innovaciones – – – – Programación en lenguajes de alto nivel (Fortran.1964) • El transistor t i t – Inventado por los laboratorios Bell en 1947 – Más pequeños.. baratos y menor consumo que las válvulas de vacío p q . q – Computadores de menor coste y tamaño. Cobol. .Perspectiva histórica 2ª Generación (1958 .) Canales de E/S Memoria virtual Interrupciones para la E/S 19 ..

Transistor • IBM 7030 20 .

APL. VMS de DEC) Si t ti b t d IBM d 21 • Principales computadores comerciales – – – – • Otras innovaciones – – – – – – . condensadores.Perspectiva histórica 3ª Generación (1965 .. el tamaño y el coste del computador Aumenta aún más la fiabilidad y las prestaciones DEC PDP 8 PDP-8 IBM Series 360 y 370 UNIVAC 1108 CDC series 6600.1971) • El circuito integrado (CI) – – – Integración de múltiples componentes (transistores. Pascal) Sistemas operativos robustos (MVS de IBM. resistencias. . ) en un mismo CI de silicio Reduce enormemente el tiempo de fabricación. 7800 y Cyber Microprogramación Interrupciones con prioridades Memoria cache Controladores DMA Nuevos lenguajes de programación (Basic.

IBM 360 22 .

Motorola 68020. Motorola 68000. VLSI): se duplica cada año La escala LSI permite integrar todos los componentes de un procesador en un mismo chip • Nace el MICROPROCESADOR Primer microprocesador: intel 4004 (procesador de 4 bits. 8080. Fujitsu • • Aparece el computador personal (IBM/PC) – – – – Principales procesadores de esta generación • • Surge el procesador con conjunto reducido de instrucciones (RISC) – – – – Supercomputadores vectoriales y paralelos • Aparecen las redes de computadores p p 23 . NEC. Hitachi. 68010 De 32 bits (años 85): intel 80386. año 1986) Basados en tecnología ECL Muy caros de fabricar y mantener Cray.1988) • El microprocesador i d – – – Aumento constante en escala de integración (LSI. 68030 MIPS R2000 (32 bits. Motorola 6502. 6800 De 16 bits (año 78): intel 8086. 1971) i4004 Microsoft desarrolla el primer sistema operativo para PC: MS-DOS De 8 bits: intel 8008. 80286.Perspectiva histórica 4ª Generación (1972 .

Intel 4004 Procesador P ocesado de 4 bits 2300 Transistores 8 micras 24 .

Intel 8008 • Intel 8008 – – – – Procesador d 8 bits P d de bit 3500 Transistores 16 K bytes de memoria O.5 MHz 25 .

4ª Generación • MITS Altair 8800 • Apple II (MC6502) 26 .

CRAY 1 27 .

HP PA8000) 28 . R5000. – DEC (Alpha 21064. Pentium 4.. 21364) – Silicon Graphics (MIPS R4000.Perspectiva histórica 5ª Generación (1988 .) • Sistemas basados en microprocesador – – – – Continúa crecimiento en la escala de integración: – Más de 15 millones de transistores por chip Se abaratan los precios de los microprocesadores y aumentan sus prestaciones Aparece el procesador superescalar. II. capaz de lanzar varias instrucciones por ciclo de reloj La increíble relación coste-prestaciones del microprocesador hace de éste el elemento básico de: – Computadores personales – PC (i486. R10000. 21264. IBM SP2) – Multiprocesadores de memoria compartida (SG Origin 2000.. Pentium. Pentium III. PowerPC4) – Estaciones de trabajo (Work-Stations) – Sun (SuperSparc UltraSparc I UltraSparc II UltraSparc III) (SuperSparc. Sun SparcServer. R12000) – IBM (RS/6000) – Supercomputadores paralelos basados en microprocesadores – Multicomputadores de de memoria distribuida (Cray T3E. I. Pentium II. Pentium M) (i486 P ti P ti II P ti III P ti 4 P ti – Machintosh (Motorola 68030. 40.. R8000. 21164.

2. La asignatura Perspectiva Histórica Rendimiento. 7. 4. Coste y Potencia Ley de Moore. 6. 3. 5.Índice 1. Tendencias Benchmarks Ley de Ahmdal Consumo 29 . Introducción.

Perspectiva histórica Evolución del rendimiento de los computadores Incremento del rendimiento: X 1.54 anual Medida de rendimiento utilizada: número de veces más rápido qué el VAX-11/780 30 .

Consumo de Potencia 31 .

6. La asignatura Perspectiva Histórica Rendimiento. 5. 3. Tendencias Benchmarks Ley de Ahmdal Consumo 32 . 2. 7. 4.Índice 1. Introducción. Coste y Potencia Ley de Moore.

Ley de Moore Según Intel 33 .

6 1.25 1.8-2.000 .700 .6 1.15 1.500 1.Predicciones 1997 Tamaño característico (micras) Voltaje de alimentación (V) Transistores por chip (M) Bits DRAM por chip (M) Tamaño del dado (mm2) Dimensión máxima del chip (mm) Frecuencia de reloj local (MHz) Frecuencia de reloj global (MHz) Máxima pot p p por chip (W) 0.1 0. 430 20.18 1.9-1.3 750 750 70 1999 0.100 1.070 .5-1.4 1.7 2.13 1.5 40 1. 340 18.9 6.4 10.200 90 2001 0.6-0.000 175 34 .5-0.000 3.9 520 68. 620 24.07 0.000 160 2009 0.700 .5 11 167 300 17.400 110 2003 0.500 2.5 76 4.500 170 2012 0.05 0.400 275. 385 19.8 21 1.8 3.290 .000 2.2-1. 520 22.2 200 17.250 1.600 130 2006 0.200 .2-1. 750 27.

Rendimiento Evolución del rendimiento de los computadores (cont.) • • • Incremento del rendimiento: X 1.) – R d de alta velocidad Redes d lt l id d 35 – – – – . etc.25 anual La diferencia entre el incremento en la frecuencia del reloj y el incremento real del rendimiento se debe a la introducción de mejoras en el diseño y la organización del propio computador – Mejoras en el procesador – Procesadores superescalares (lanzan varias instrucciones por ciclo) – Ej Ejecución f ió fuera d orden y técnicas de ejecución especulativa (eliminan muchas de las de d é i d j ió l i ( li i h d l dependencias impuestas por el programa) Mejoras en la memoria – Uso de jerarquía de memoria (memoria cache memoria principal memoria virtual) cache. procesadores de E/S Mejoras en los dispositivos de entrada/salida – Dispositivos de almacenamiento de alta velocidad (discos.54 anual Incremento en la frecuencia del reloj: X 1. Mejoras en los elementos de interconexión – Uso de jerarquía de buses (buses del sistema. principal. buses de expansión. CD-ROM. buses externos) Mejoras en la gestión de la entrada/salida – Acceso directo a memoria (DMA).

PREDICCIONES DE LA SIA 36 .

– Problema: limitaciones de la tecnología actual. – velocidad (reduciendo tiempo de respuesta a los cambios) – potencia potencia. • Las predicciones han ayudado al diseño de nuevos chips. actual 37 .PREDICCIONES DE LA SIA • Los estudios se basan en: – transistores (área).

Procesadores de Propósito General • Claves en el diseño: – Rendimiento y velocidad • Speed-up • Eficiencia – Potencia y temperatura • Potencia Estática • Hot Spots – Memoria Cache • Tamaño y niveles – Número de threads – Número de Cores • Actuales < 8 • Futuro 100´s 38 .

EMBEDDED PROCESSORS Y PROCESADORES Soc • Claves en el diseño – Procesadores especializados – Dominan el mercado – Adaptación de sistemas y aplicaciones 39 .

Área y Potencia 40 .Rendimiento.

más fallos de caché en un determinado tiempo. 41 . p j – Frequency wall: • el número de puertas lógicas en una etapa no se puede reducir más allá de un límite – Power wall: • más frecuencia implica más densidad de potencia y. más calor. La MP no puede trabajar a tales velocidades.Consideraciones sobre el rendimiento • Limitaciones al rendimiento: – Memory wall: • más velocidad de CPU. por tanto.

CONSIDERACIONES SOBRE EL COSTE (ÁREA) ( ) 42 .

DIFERENCIA ENTRE DENSIDAD Y PRODUCTIVIDAD g p gap 43 .

FUTURAS DIRECCIONES DE LA TECNOLOGÍA • Objetivo: – Diseños con alto rendimiento y – Bajo consumo de potencia • Arquitecturas de alto rendimiento: – Núcleos múltiples – Más hilos (threads) de ejecución por núcleo – Cachés multinivel más grandes • ELPA – Arquitecturas con consumo mínimo de potencia – Con el objetivo de mejorar la vida media de las baterías 44 .

2. 3. 4. Coste y Potencia Ley de Moore. 7. 5. La asignatura Perspectiva Histórica Rendimiento. Tendencias Benchmarks Ley de Ahmdal Consumo 45 . 6.Índice 1. Introducción.

paralelismo (TCPU * Clock Rate) / Numero de Instrucciones Ciclos / Numero de Instrucciones Σ CPI i * F i – Fj es la frecuencia de aparición de la instrucción J – t : t e po de de c c o tiempo ciclo • implementación. Load 2c(20%).5.4.Rendimiento • Rendimiento del procesador • T CPU= N * CPI * t – – N : Nº de Instrucciones • Compiladores y LM CPI : Ciclos medios por instrucción • • • • LM. St 0.2.4 – TOTAL CPI = 1. Ld 0. Store 2c(10%). implementación. tecnología • Ejemplo: – ALU 1 ciclo( 50%). saltos 2c(20%) 50%) 2c(20%) 2c(10%) – CPI = ALU 0.5 • Invertir recursos donde se gasta el tiempo 46 . salto 0.

Benchmarks • La única forma fiable es ejecutando distintos programas reales – Programas “de juguete”: de juguete : • 10~100 líneas de código con resultado conocido. – Criba de Erastótenes. EEMBC 47 . – Whetstone. servers). SPECapc( aplicaciones 3D) Winbench. TPC-C Graficos: SPECviewperf(OpenGL). Dhrystone – Programas reales típicos con cargas de trabajo fijas • Actualmente la medida más aceptada – SPEC2000 12 programas enteros y 14 en punto flotante – Otros • • • • HPC:LINPACK. SPEChpc96. Puzzle. Nas Parallel Benchmark Servidores: SPECweb SPECSFS( File servers) TPC C SPECweb. Quicksort – Programas de prueba (benchmarks) sintéticos: • simulan la frecuencia de operaciones y operandos de un abanico de programas reales.

Rendimiento 48 .

3. Tendencias Benchmarks Ley de Ahmdal Consumo 49 . 7. Introducción. 4. 5. 2. 6. La asignatura Perspectiva Histórica Rendimiento. Coste y Potencia Ley de Moore.Índice 1.

• Medidas de Mejora Aceleración o Speed-up y Eficiencia – Speedup(E) = TEj sin M / TEj con M – Eficiencia = Tiempo con N Procesadores /Tiempo con 1 procesador *N N 50 . el tiempo de ejecución del resto permanece sin modificación. Por tanto es muy importante el porcentaje de la tarea que es acelerada.Un principio simple • Un principio básico: – Hacer rápidas las funciones frecuentes – Gastar recursos donde se gasta el tiempo • Ley de Amdahl: – El porcentaje de mejora en el rendimiento de un procesador viene limitado l d l d d d l d por el porcentaje del impacto global del elemento que se quiere modificar • Permite caracterizar este principio • Permite la evaluación del speedup que se obtendrá con una cierta mejora • Si la mejora solo acelera la ejecución de un fracción F de la tarea.

1/2) = 0. – El 10% de las instrucciones en mi programa son PF TEjnuevo = TEjantiguo x (0.9 + 0.053 Speedup de un 5% 51 .Fraccionmejora) + Fractionmejora Speedupmejora 1 • Un ejemplo: – Se mejora la implementación de la operaciones PF – reduciendo su tiempo a la mitad.95 x TEjantiguo 1 Speeduptotall = 0.Fraccionmejora) + Fraccionmejora Speedupmejora Speeduptotal = TEjantiguo TEjnuevo = ( (1 .9 5 = 1.Un principio simple • La Ley Amdahl TEjnuevo = TEjantiguo x (1 .

5. 4. 6. 3. Coste y Potencia Ley de Moore. Tendencias Benchmarks Ley de Ahmdal Consumo 52 .Índice 1. La asignatura Perspectiva Histórica Rendimiento. 2. Introducción. 7.

– Coste. Empaquetamientos CI • Consumo eléctrico • Duración baterías 53 .Por qué preocupación sobre disipación de potencia? • Parámetros térmicos – Potencia disipada por el transistor es especialmente crítico con la temperatura – Instalación de un radiador o aleta refrigeradora • no sobrepasar valores máximos que destruyan el dispositivo – Potencia disminuye a medida que aumenta la temperatura.

45nm y 32nm). 45 32 ) – permitirán múltiples cores manteniendo el tamaño de “die” y el consumo dentro de los límites actuales. proporcionando mejoras de rendimiento 54 .Disipación de potencia • Fuentes de consumo de potencia: – U id d de procesamiento Unidades d i t – Memorias – Interconexiones y Comunicaciones SINGLE CORE DUAL CORE MULTI CORE Wafer of Pentium® 4 processors Wafer of Intel® Xeon™ processors Wafer of Itanium® processors • Futuras tecnologías de fabricación de Intel – (65 (65nm.

– En chip. Potencia cortocircuito – “switching” power switching – “leakage” power – Potencia dinámica predomina. Potencia estática vs. potencia disipación proporcional área • Potencia cortocircuito: – Debida a breve corriente de cortocircuito durante las transiciones. pero la potencia estática incremento importante • Potencia estática: – En chip proporcional al nº de transistores • P Potencia dinámica: i di á i – debido a la carga de capacidades durante las transiciones 0 1 y 1 0.Consumo potencia: Fundamentos • Potencia dinámica vs. 55 .

Potencia dinámica CMOS Pdyn ≈ CV²Af y Edisipada (E) ≈ C*VCC² Icharge Isc Pdisipada ≈ C*VCC²*f Isc • P t Potencia corto circuito i t i it – Camino corriente directa entre – VCC y GND cuando d ambos transistores – NMOS y PMOS estén conduciendo. conduciendo Idischarge • CMOS – ITRS (International technology roadmap for semiconductor) mejora todas características tecnológicas aumenta capacidad entrada d d d asociada a las puertas • Desventaja: – • Aumento en el tiempo respuesta al cargar las salidas 56 .

– La corriente inversa de saturación de los diodos crece exponencialmente con el incremento de la temperatura y disminuye el voltaje umbral. – – – – Ps ≈ ∑ Ifugas.Potencia estática • Potencia estática: Corrientes “l k C i t “leakage” ” Presente siempre (aún inactivo) Debida a la formación de diodos parasitarios en CMOS Ps es el producto del voltaje de la fuente de alimentación por la corriente estática del circuito.Vcc Vcc 57 . – DSM (Deep Sub-Micron).(Mucha importancia diseños altas prestaciones).

MIPS/W ó SPEC/W. Julio/SPEC ó SPEC2/W)(Aumentar el rendimiento o reducir energía) – Producto Energía-retardo2 (ED2P). 58 . – Producto Retardo-Potencia (DP) (Julios) (DP=Tpropagación*Pdisipación) – Producto Energía-retardo (EDP).Métricas • Energía (julios/instrucción). • Objetivo: buscar una métrica de consumo en base a un rendimiento dado. CV2 – reduciendo el voltaje alimentación o capacidad (transistores de menor d i d l lt j li t ió id d (t i t d tamaño)(aumento retardo) – Reducción de la frecuencia – Formas no adecuadas de medir porque influyen en el rendimiento. (MIPS3/W ó SPEC3/W)(utilizando tecnología mas pequeña) • Tener en cuenta las corrientes de leakage y el HW adicional a la hora de evaluar mejoras. (MIPS2/W.

itrs. Council – http://www.net • Standard Performance Evaluation Corporation Corporation.tpc.Bibliografía • Capítulo 1 de [HePa06] • S i Semiconductor Industry A d t I d t Association.org • Historia de la Informática y sus p pioneros – Carlos A. – http://www.spec. – http://www.org • Transaction Processing Council. Coello Coello 59 .org • The Embedded Microprocessor Benchmark Consortium.eembc. i ti – http://public.

Sign up to vote on this title
UsefulNot useful