Resumen Desde la dcada de 1970, los sistemas de bases de datos han sido "compute- cntrica". Cuando un clculo necesita los datos, solicita los datos, y los datos se sacaron a travs del sistema. Creemos que esto es problemtico por dos razones. En primer lugar, las solicitudes de datos incurren naturalmente alta latencia ya que los datos se extraen a travs de la jerarqua de memoria, y el segundo, que hace que sea difcil o imposible para varias consultas u operaciones que estn interesados en los mismos datos para amortizar los costos de ancho de banda y latencia asociados con su de acceso a datos. En este trabajo se describe un pura-push basados, la investigacin del sistema de base de datos prototipo llamado DataPath. DataPath es "centrada en los datos". En DataPath, las consultas no solicitan datos. En lugar de ello, los datos son automtica-mente empujado sobre los procesadores, donde son procesados por cualquier clculo interesado. Se demuestra experimentalmente en un punto de referencia multi-terabyte que este principio de diseo bsico hace que para un sistema de base de datos muy ligero y rpido.
Introduccin: Para ver un ejemplo de cmo el sistema DataPath utiliza el movimiento de datos para impulsar la computacin, considere la siguiente consulta: Q1: SELECT SUM (l_quantity) DESDE DONDE LineItem l_shipdate> '1 -1-06 ' Imagine que Q1 se emite para el sistema. El sistema DataPath co-mienza por iniciar un recorrido de la tabla de LineItem. El sistema tiene un solo recorrido de tabla para cada tabla; cada exploracin opera constantemente y en forma dependiente de las consultas en el sistema, streaming de datos desde el disco en forma circular [11]. El sistema crea una forma de punto de seleccin unido a la exploracin a travs de un camino. Dependiendo del tipo de punto de referencia (waypoints tipos incluyen la seleccin, agregar, unir, etc), un punto de ruta tiene un conjunto diverso de apoyo a la maquinaria aso-ciados con l, pero al final, cada punto de ruta organizada en torno a un solo "bucle de procesamiento ".
Contenido principal: Un datapath es un conjunto de unidades funcionales, tales como unidades lgicas aritmticas o multiplicadores, que llevan a cabo operaciones de tratamiento de datos. Es una parte central de muchas unidades centrales de procesamiento (CPU) junto con la unidad de control, que regula en gran medida la interaccin entre el camino de datos y los datos en s, generalmente almacenados en los registros o la memoria principal.
Recientemente, ha habido una creciente investigacin en el rea de reconfigurables datapaths-datapaths que pueden ser re-utilizados en tiempo de ejecucin utilizando la tela-como programar estos diseos puede permitir un procesamiento ms eficiente, as como un ahorro de energa considerable. Organizacin de bus nico de datapath: La primera y principal medio de interconexin importante para todos los registros en el interior del procesador es el bus del sistema. Este autobs es el bus del procesador y no debe ser confundido con el bus externo que conecta diferentes chips de memoria y dispositivos de E / S al procesador. Este bus externo est conectado al bus de sistema interno a travs del MAR y los registros MDR. Las lneas de datos del bus externo estn conectados a la MDR y las lneas de direccin de la bus externo estn conectados a la marzo La MDR es un registro bidireccional que implica que puede recibir y enviar datos desde y hacia cualquiera de los dos buses internos o externos. El MAR es un registro unidireccional. Se recibe su entrada desde el bus interno y da su salida al bus externo.
Conclusin: La Ruta de Datos es responsable de la manipulacin de los datos Para que las rutas de datos funcionen correctamente, se necesitan las seales de control adecuadas, es decir, seales que se deben producir en el momento preciso y que deben controlar todos los componentes de la ruta de datos, multiplexores, ALUs, registros, bufers triestado, etc. el funcionamiento de la ruta de datos, est determinado por las seales de control y el momento en que se producen dichas seales
REFERENCIAS [1] D. Abadi, D. Carney, U. etintemel, M. Cherniack, C. Transmitir, S. Lee, M. Stonebraker, N. Tatbul y S. Zdonik. Aurora: un nuevo modelo y la arquitectura para la gestin de flujo de datos. VLDB J., 12 (2) :120-139, 2003. [2] A. Ailamaki, D. DeWitt, M. Hill, y M. Skounakis. Tejiendo relaciones de rendimiento de la cach. En VLDB, pginas 169-180, 2001. [3] R. Avnur y J. Hellerstein. Eddies: procesamiento de consultas continuamente adaptativo. En SIGMOD, pginas 261-272, 2000. [4] G. Candea, N. Polyzotis, y R. Vingralek. A escalable, predecible operador de combinacin para los almacenes de datos altamente concurrentes. PVLDB, 2 (1) :277-288, 2009. [5] J. Chen, D. DeWitt, F. Tian y Wang Y.. Niagaracq: Un