You are on page 1of 13

TT-CIS-XA-003

UNIVERSIDAD
NACIONAL
DE LOJA

Area
de la Energa las Industrias y los Recursos Naturales No Renovables

Carrera de Ingeniera en Sistemas

Arquitectura cl
uster de alto
rendimiento utilizando herramientas
de software libre

ANTEPROYECTO DE TRABAJO DE

TITULACION

Autores:
Chuquihuanca-Vicente, Leonardo-Rafael
Malla-Bustamante, Edyson-Javier

Asesor:
Chamba-Eras, Luis-Antonio

Loja-Ecuador
2014

Indice
A. Tema

B. Problem
atica
1 . Situacion Problematica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 . Problema de Investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . .

4
4
6

C. Justificaci
on

D. Objetivos
1 . Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 . Objetivos Especficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8
8
8

E. Alcance

F. Metodologa

G. Cronograma

10

H. Presupuesto y Financiamiento

11

I. Bibliografa

11

J. Anexos
13
1 . Licencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Indice de tablas
1.
2.

Cronograma estimado de actividades para el Trabajo de Titulacion . . . . 10


Presupuesto estimado para el Trabajo de Titulacion . . . . . . . . . . . . . 11

A.

Tema

Arquitectura cl
uster de alto rendimiento utilizando herramientas de software libre

B.
1.

Problem
atica
Situaci
on Problem
atica

La constante reduccion en el costo del hardware ha promovido la masificacion de la


arquitectura cl
uster, la que posee una caracterstica especial, que pueden ser construidas
con hardware convencional lo cual reduce en gran medida los costos ocasionados al comprar piezas exclusivas [1], [2].
En el clima actual de presupuestos reducidos y fondos limitados para investigaciones academicas y cientficas, las inversiones en computacion deben resultar rentables en
cuanto a escalabilidad y rendimiento. Despues de todo, el exito de cualquier programa de
investigacion se mide por su capacidad para acceder a la informacion de manera oportuna
[2].
Actualmente, la supercomputacion nos permite simular la mayora de los sistemas
fsicos con un margen de error inapreciable, obteniendo modelos fsicos y calculos muy
fiables en todos los campos: automocion, fsica, aeronautica, qumica, informatica, etc.
conocidos como sistemas de alto rendimiento [3], [4], [5].
Los sistemas de alto rendimiento hacen referencia a una rama de la computacion
aplicada que se centra fundamentalmente en la solucion de problemas que hacen un uso
intensivo del calculo, compuestos por grandes sistemas, especializados y de elevado coste,
que se pueden encontrar principalmente en centros de investigacion [6].
La informatica para investigaciones, denominada computacion de alto rendimiento usa
potentes herramientas y procesos de computacion para generar datos en investigaciones
academicas avanzadas. Con un cl
uster de computacion de alto rendimiento, los centros
de investigacion puede obtener la velocidad y potencia de una costosa supercomputadora
a una fraccion del costo y con menos riesgo de sufrir tiempos de inactividad prolongados
[7].
Algunas de las aplicaciones de los cl
uster de alto rendimiento son: simulaciones, modelizacion, optimizacion discreta, analisis molecular, b
usquedas en arboles, aprendizaje en
redes neuronales, tratamiento de imagenes, reconocimiento de patrones, procesamiento de
consultas en Base de Datos, procesamiento de grandes vol
umenes de informacion como
BigData y minera de datos, entre otras. [8] [9].
Para un centro de investigacion de tama
no medio una ventaja obvia de usar cl
usters
de PCs frente a otros super-ordenadores paralelos convencionales es el precio. Estos orde4

nadores se producen a muy baja escala y necesitan ademas de un desarrollo de hardware


muy especializado [10].
Algunos de los centros de investigacion, que utilizan la arquitectura cl
uster como apoyo
a la investigacion:
Centro de Astrobiologa. (Espa
na)
Universidad de Navarra. (Espa
na)
Universidad de Barcelona. (Espa
na)
Universidad de Valladolid. (Espa
na)
Universidad Rey Juan Carlos. (Espa
na)
Universidad Politecnica de Valencia. (Espa
na)
Universidad Freie de Berln. (Alemania)
Universidad Tecnica de Munich. (Alemania)
Instituto Nacional de Ciencias Toulouse. (Francia)
La Carrera de Ingeniera en Sistemas (CIS)de la Universidad Nacional de Loja cuenta
un laboratorio, conformado por 15 computadores personales con las siguientes caractersticas: procesador core i7 de 4 n
ucleos con de 3.4 Ghz de velocidad , 4 Gb de memoria
RAM; teniendo en cuenta estas caractersticas se puede concluir que el laboratorio de la
CIS cuenta con equipos limitados en lo que se refiere a tecnologa, comparada con la de
un supercomputador, destinado para investigaciones academicas y cientficas.
De acuerdo al analisis realizado los problemas que se han identificado son:
Tratamiento y analisis de grandes cantidades de datos(Big Data).
Procesamiento de consultas en base de datos.
Software de simulacion.
Reconocimiento de imagenes.
Reconocimiento de patrones (datamining).
Descifrado de codigos (criptografa)
Limitaciones en el analisis del resultado de algoritmos.
Limitaciones en los resultados de experimentos que implican gran cantidad de recursos hardware.

2.

Problema de Investigaci
on

La implementaci
on de una arquitectura cl
uster de alto rendimiento, servir
a como alternativa para la ejecuci
on de procesos que requieren de gran
capacidad computacional, para lograr mejores resultados en investigaciones
acad
emicas.?

C.

Justificaci
on

En la actualidad, muchos proyectos de investigacion de Universidades exigen soluciones informaticas para investigacion de alto rendimiento. La capacidad de una solucion
informatica para realizar miles de millones de operaciones por segundo permite lograr
avances importantes en la investigacion academica. Desafortunadamente, la computacion
de alto rendimiento siempre requirio supercomputadoras costosas y propietarias que pueden ser difciles y caras de instalar, mantener y usar [14], por tal razon resulta necesaria
la implementacion de mecanismos de procesamiento avanzado de datos, que ayuden al
mejor desempe
no las actividades dentro de la carrera, elevando as tambien el nivel de
aprendizaje e investigacion en los estudiantes.
Actualmente, la mayora de los Cl
uster estan formados por componentes de hardware
comunes, herramientas de software libre y tecnologa estandar. Cabe destacar que equipos
para estos fines, con estas capacidades disponibles en el mercado, dise
nadas e implementadas por las grandes casas de hardware, tienen un costo exorbitante y que solo pueden
ser costeados por entes gubernamentales o por empresas con un gran capital, en respuesta
a ello una combinacion de hardware y software permite un importante ahorro a nivel
economico, ya que al ser un hardware y software de uso com
un no debe suponer un coste
muy importante, y las herramientas de software libre permiten su uso sin coste de licencia
[12], [15].
El objetivo del presente Trabajo de Titulacion es servir como apoyo a la investigacion
academica en la CIS de la UNL, con la implementacion de un cl
uster de alto rendimiento
la cual permitira dar una solucion potente y economica para mejorar los entornos de investigacion, as como tambien mejorar la capacidad de obtener resultados mas exactos y
en el menor tiempo posible al procesar grandes cantidades de datos.
Es por eso, que con la realizacion del presente Trabajo de Titulacion se pueden obtener resultados que cumplan con las expectativas propuestas, a un costo notablemente por
debajo del sugerido por las grandes empresas de hardware, y con equipos convencionales
de computo, pudiendose utilizar de manera opcional equipos actualmente en uso, reutilizando tecnologa.
Por lo tanto la implementacion y puesta en marcha del presente Trabajo de Titulacion
se justifica; academica, tecnologica y economicamente, permitiendole a la Universidad
Nacional de Loja y de manera directa a la Carrera de Ingeniera en Sistemas ser mas
competitiva en el ambito educativo, pudiendo obtener ventajas significativas entre precio
6

y rendimiento, y soluciones de administracion muy flexibles ideales para las necesidades


de los entornos educativos en investigaciones actuales [14].

D.
1.

Objetivos
Objetivo General

Implementar una arquitectura cl


uster de alto rendimiento en un entorno de software
libre.

2.

Objetivos Especficos
Analizar las plataformas cl
uster para determinar cual es la mas optima de acuerdo
a los equipos y requerimientos existentes.
Implementar una plataforma cl
uster para integrar varias computadoras independientes.
Evaluar la funcionalidad del cl
uster a traves de procesos con grandes cantidades de
procesamiento computacional.

E.

Alcance

La finalidad del El presente Trabajo de Titulacion(TT) es implementar una arquitectura cl


uster de alto rendimiento, que sirva como apoyo a la investigacion cientfica y
academica de la CIS de la UNL.
El tiempo estimado para el desarrollo 400 horas, para lo cual se ha determinado las
fases y actividades estimadas que permitiran el cumplimiento de los objetivos planteados.
El escenario en el cual se llevaran a cabo la evaluacion del presente proyecto, sera el
laboratorio de la Carrera de Ingeniera en Sistemas de la Universidad Nacional de Loja,
haciendo uso de los recursos hardware existentes.
Sin embargo el presente proyecto servira como punto de partida para futuras implementaciones o mejoras en el mismo, y emprender acciones como apoyo a los estudiantes
en su formacion academica y docentes investigadores.
Fase 1:
Analizar las plataformas de cl
uster para determinar cual se adapta mejor de acuerdo a
los equipos y requerimientos existentes.
Revision bibliografica y casos de exito del funcionamiento de los cl
uster en
Centros de Investigacion y en la Educacion Superior.
Analizar los recursos de los equipos informaticos con los que cuenta actualmente
la institucion.
Seleccionar la plataforma de software libre que mas se adapten a los requerimientos de los equipos informaticos existentes.
8

Fase 2:
Implementar una plataforma cl
uster para integrar varias computadoras independientes.
Dise
no logico de la arquitectura cl
uster en el laboratorio de la CIS.
Instalacion y configuracion del sistema operativo del cl
uster.
Instalacion y configuracion de los servicios del cl
uster.
Fase 3:
Evaluar la funcionalidad del cl
uster a traves de procesos con grandes cantidades de
procesamiento computacional.
Preparar el escenario para realizar las pruebas de funcionalidad.
Evaluar los resultados en base al escenario planteado mediante procesos que
impliquen grandes cantidades de recursos computacionales.
Elaborar un artculo cientfico acorde a las normas IEEE.

F.

Metodologa

Para el desarrollo del Trabajo de Titulacion (TT) se utilizara distintos metodos de


investigacion y tecnicas de recoleccion de informacion bibliografica, para poder cumplir
con los objetivos planteados.
Observaci
on Activa.- Este metodo nos permitira involucrarnos directamente con
el objeto a investigar para poder tener informacion mas detallada de los problemas
existentes y las posibles alternativas de solucion que se pueden dar.
Estudio de casos.- Este metodo nos permitira realizar una exploracion e investigacion en profundidad de problemas especficos, basados en experiencias ya vividas
y contadas y casos de exito que funcionen y den un aval de que los resultados pueden
llegar a ser satisfactorios.
Experimentaci
on.- Tecnica mediante la cual se podra realizar las diferentes pruebas que garantice el correcto funcionamiento de nuestra solucion, en base a un
escenario donde se ponga a prueba cada una de la aplicaciones y servicios que se
puedan implementar.
T
ecnica de recolecci
on bibliogr
afica.- Esta tecnica nos permitira extraer la
informacion necesaria para poder sustentar la base teorica del trabajo de titulacion, mediante consultas a: fuentes bibliograficas confiables, casos de exito, artculos
cientficos , revistas indexadas; entre otras.

G.

Cronograma
Actividades

Fase 1
Revision bibliografica y casos de exito del funcionamiento
de los cl
uster en las Instituciones de Educacion superior.
Analizar los recursos de los equipos informaticos
con los que cuenta actualmente la institucion
Analizar y seleccionar la plataforma de software libre
que mas se adapten a los requerimientos de los
equipos informaticos existentes
Fase 2
Dise
no logico de la arquitectura cl
uster en el
laboratorio de la CIS.
Instalacion y configuracion del sistema operativo del cl
uster
Instalacion y configuracion de los servicios del cl
uster
Fase 3
Preparar el escenario para realizar las pruebas
de funcionalidad.
Evaluar los resultados en base al escenario planteado
mediante la aplicacion de algoritmos.
Elaborar un artculo cientfico acorde a las normas IEEE
Documentacion del Trabajo de Titulacion
TOTAL (horas)

Abril Mayo
(hora) (hora)

Junio
(hora)

20
20
30

40
30
40
40
30
20
60 h

30
100h

30
100h

Tabla 1: Cronograma estimado de actividades para el Trabajo de Titulacion

10

Julio
(hora)

30
40
140h
400h

H.

Presupuesto y Financiamiento

1. Presupuesto
Recurso
Equipos
Recursos humanos
Capacitacion
Movilizacion
Materiales
Servicios varios
Total ($):

Subtotal ($)
800.00
4000.00
800.00
400.00
200.00
200.00
6400.00

Tabla 2: Presupuesto estimado para el Trabajo de Titulacion


2. Financiamiento
El financiamiento total del presente Trabajo de Titulacion sera asumido en su totalidad por los responsables del mismo.

I.

Bibliografa

Referencias
[1] Caceres G. Estrategia de implementacion de un cl
uster de alta disponibilidad de n
nodos sobre linux usando software libre, Universidad san Francisco de Quito, Quito,
Agosto 2012.
[2] Santos L. Pe
naloza S. Cruz E. Cluster implementation of a prototype for the resolution of a particular problem , Universidad de Pamplona, Espa
na, 2010.
[3] Ari J. Morales J. Marck F. Schmiedeler G. Implementacion de un servidor cl
uster
de alta disponibilidad bajo herramientas de codigo abierto en la UJAP, Tesis, Universidad Jose Antonio Paez, Venezuela, 2014.
[4] Luna I. Haide D. Implementacion de un cluster de alta disponibilidad de bases de
datos para la GEDGAPA. 2012.
[5] Verona I. Instalacion y configuracion de un cluster de alto rendimiento. 2010.
[6] Perez O. et al. Aplicaciones del computo de altas prestaciones. En XI Workshop
de Investigadores en Ciencias de la Computacion. 2009.
[7] Moreno R. Computacion de altas prestaciones aplicada al calculo de variaciones en
genomica. 2013
11

[8] Montes de Oca E. et al. Comparacion del uso de GPU y cluster de multicore en problemas con alta demanda computacional. En XVIII Congreso Argentino de Ciencias
de la Computacion. 2012
[9] Tinneti F. et al. Procesamiento paralelo de aplicaciones numericas de alto rendimiento. En XII Workshop de Investigadores en Ciencias de la Computacion. 2010.
[10] Institute for Biocomputation and Physics of Complex Systems, Cluster and Grid
Computing, Universidad Zaragoza 2014. [en linea]. Disponible en: [http://oldwww.
bifi.es/research/comp_supercomp/cluster_grid.php
[11] Rocha J. et al. Dise
no e implementacion de un cl
uster de computo de alto rendimiento, Universidad de Guanajuato, Mexico, Acta Universitaria, vol. 21, n
um. 3,
diciembre, 2011, pp. 24-33.
[12] Ari J. Morales J. Marck F. Schmiedeler G, Implementacion de un servidor cl
uster
de alta disponibilidad, Tesis Universidad Jose Antonio Paez, Venezuela 2011.
[13] Dawson W. Quetglas G. El proyecto fin de carrera en Ingeniera Informatica: Una
gua para el estudiante, Madrid - Espa
na, Pearson Educacion, 2002.
[14] DELL, Educacion Superior, El valor de la computacion de alto rendimiento, [en linea]. Disponible en: [http://www.dell.com/learn/mx/es/mxbiz1/
hied-the-value-of-high-performance-computing]
[15] Kendall K. Kendall J. Analisis y dise
no de sistemas. Pearson educacion, 2005.

12

J.

Anexos

1.

Licencia

Anteproyecto de Trabajo de Titulacion. by Leonardo Chuquihuanca, Edyson Malla, is licensed


Under a Creative Commons Attribution- NonCommercial-ShareAlike 3.0 Unported License.

13