UNIVERSIDAD REGIONAL AUTÓNOMA DE LOS

ANDES “UNIANDES”

CARRERA DE SISTEMAS
DESARROLLO CLIENTE/SERVIDOR

TEMA DEL DOCUMENTO:
Términos de Consulta
ESTUDIANTE: JONATHAN SALGUERO
DOCENTE: BERNABE ORTEGA.
2015
Puyo-Pastaza

¿Qué es Big Data?
Todos formamos parte de ese gran
crecimiento de datos. Debido al gran
avance que existe día con día en las
tecnologías
de
información,
las
organizaciones se han tenido que
enfrentar a nuevos desafíos que les
permitan analizar, descubrir y entender
más allá de lo que sus herramientas
tradicionales
reportan
sobre
su
información, al mismo tiempo que
durante los últimos años el gran
crecimiento de las aplicaciones disponibles en internet (geo-referencia
miento, redes sociales, etc.) han sido parte importante en las decisiones de
negocio de las empresas. El presente artículo tiene como propósito
introducir al lector en el concepto de Big Data y describir algunas
características de los componentes principales que constituyen una solución
de este tipo.
Definición de Cloud Computing
El nuevo concepto de negocio en Internet también conocido como
"computación en la nube" Debitoor es una sistema intuitivo y rápido que
trabaja con la tecnología cloud computing. El cloud computing consiste en
la posibilidad de ofrecer servicios a través de Internet.
La computación en nube es una tecnología nueva que busca tener todos
nuestros archivos e información en Internet y sin depender de poseer la
capacidad suficiente para almacenar información.

Ventajas del cloud computing  Bajo coste: Productos gratuitos o pagos mensuales fijos por utilización. ni en licencias  Seguridad: Los datos siempre están seguros . conocidos como ebusiness (negocios por Internet).Lee la política de seguridad de Debitoor  No hay necesidades almacenamiento  Mayor rapidez en el trabajo al estar basado en web  Información a tiempo real  Fuerte inversión en innovación  Acceso a toda la información  Acceso cuando quiera y donde quiera. como en una nube. sin costes adicionales. Consiste en una aplicación de software ofrecida totalmente por Internet. Debitoor es un programa 100% online de facturación y contabilidad simple. procesos. Procedimiento Toda la información. sólo con una conexión a Internet de poseer una gran capacidad de  SAAS (Software as a Servicie) El software como servicio es una de las modalidades más importantes de la computación en nube. así todo el mundo puede acceder a la información completa. se localizan dentro de la red de internet. con todas las funcionalidades y para todos los clientes que lo soliciten. etc.  Envía facturas y presupuestos  Crea plantillas profesionales para facturas en menos de 1 minuto  Gestiona tu lista de clientes y productos . sin poseer una gran infraestructura. ofreciendo servicios a través de Internet. datos. dado que no hay que invertir en gran infraestructura.El cloud computing explica las nuevas posibilidades de forma de negocio actual.

La utilización de la nube permite a las empresas dejar de utilizar servidores internos y aprovecharse de software que se ejecuta fuera de sus ordenadores con lo que pueden invertir menos en equipos informáticos y reducen su consumo energético. El Green Computing representa las estrategias y el desarrollo de sistemas informáticos que buscan la utilización eficiente de los recursos para minimizar el impacto ambiental de los procesos informáticos. Sin embargo la huella del altísimo nivel de consumo energético del siglo XX obliga también a que la tecnología mejore todos los aspectos que involucran los procesos de producción. El Cloud Computing se encuentra dentro de las tecnologías que contribuyen a la consecución de dichas estrategias. Uno de los caminos es el Green Computing. Exporta tus facturas a PDF y Excel  Almacena automáticamente todos tus documentos  Gestiona tus gastos sin límite Más de 300. los avances tecnológicos provocarán que se renueven muchos de los aspectos de nuestro día a día. En Computing . Es la idea tradicional de la externalización pero aplicada a los procesos informáticos. Evidentemente para que esta ecuación tenga sentido llevar el almacenamiento y los procesos a la nube las empresas que ofrecen estos servicios tienen que aprovechar su magnitud para optimizar el espacio y la memoria de ejecución. Una de las claves para comprender las razones por las que el Cloud Computing aumenta la productividad y reduce el impacto energético es la frase ‘menos es más’.000 pymes y autónomos gestionan ya su negocio con Debitoor Green Computing Los escenarios que se plantean en los próximos años serán completamente diferentes a los que hemos conocido hasta ahora.

 Consultas complejas optimizadas.  Seguridad de acceso y auditoría. Se compone de un lenguaje de definición de datos. A continuación te presentamos una guía que te explicará el concepto y características de las bases de datos.  Respaldo y recuperación. el usuario y las aplicaciones que la utilizan.  Acceso concurrente por parte de múltiples usuarios.  Redundancia mínima. Sistema de Gestión de Base de Datos (SGBD) Los Sistemas de Gestión de Base de Datos (en inglés DataBase Management System) son un tipo de software muy específico.¿Qué son las bases de datos? Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar fácilmente. Características Entre las principales características de los sistemas de base de datos podemos mencionar:  Independencia lógica y física de los datos. dedicado a servir de interfaz entre la base de datos.  Acceso a través de lenguajes de programación estándar. los cuales son recolectados y explotados por los sistemas de información de una empresa o negocio en particular. de un lenguaje de manipulación de datos y de un lenguaje de consulta.  Integridad de los datos. . Definición de base de datos Se define una base de datos como una serie de datos organizados y relacionados entre sí.

Mantenimiento de estándares: Gracias a la integración es más fácil respetar los estándares necesarios. pueden ser estándares de documentación. la integración de datos en los sistemas de bases de datos hace que éstos sean más vulnerables que en los sistemas de ficheros. Estos estándares pueden establecerse sobre el formato de los datos para facilitar su intercambio. Si un dato está almacenado una sola vez. Mejora en la accesibilidad a los datos: Muchos SGBD proporcionan lenguajes de consultas o generadores de informes que permiten al usuario hacer cualquier tipo de consulta sobre los . Normalmente. Sin embargo. en una base de datos no se puede eliminar la redundancia completamente. Si un dato está duplicado y el sistema conoce esta redundancia. la integridad se expresa mediante restricciones o reglas que no se pueden violar. ya que en ocasiones es necesaria para modelar las relaciones entre los datos. Consistencia de datos: Eliminando o controlando las redundancias de datos se reduce en gran medida el riesgo de que haya inconsistencias. la base de datos pertenece a la empresa y puede ser compartida por todos los usuarios que estén autorizados. Mejora en la seguridad: La seguridad de la base de datos es la protección de la base de datos frente a usuarios no autorizados. Mejora en la integridad de datos: La integridad de la base de datos se refiere a la validez y la consistencia de los datos almacenados. Esto hace que se desperdicie espacio de almacenamiento. En los sistemas de bases de datos todos estos ficheros están integrados. Sin unas buenas medidas de seguridad. y es el SGBD quien se debe encargar de mantenerlas. Pero en los sistemas de bases de datos. procedimientos de actualización y también reglas de acceso. y está disponible para todos los usuarios inmediatamente. Compartir datos: En los sistemas de ficheros.Ventajas de las bases de datos Control sobre la redundancia de datos: Los sistemas de ficheros almacenan varias copias de los mismos datos en ficheros distintos. los ficheros pertenecen a las personas o a los departamentos que los utilizan. tanto los establecidos a nivel de la empresa como los nacionales e internacionales. como a sus relaciones. por lo que no se almacenan varias copias de los mismos datos. además de provocar la falta de consistencia de datos. el propio sistema puede encargarse de garantizar que todas las copias se mantienen consistentes. Estas restricciones se pueden aplicar tanto a los datos. cualquier actualización se debe realizar sólo una vez.

datos. o un cambio en el modo en que se almacena en disco. si hay varios usuarios que pueden acceder simultáneamente a un mismo fichero. El hecho de disponer de estas funciones permite al programador centrarse mejor en la función específica requerida por los usuarios. sin tener que preocuparse de los detalles de implementación de bajo nivel. sin que sea necesario que un programador escriba una aplicación que realice tal tarea. requiere cambios importantes en los programas cuyos datos se ven afectados. . Mejora en los servicios de copias de seguridad: Muchos sistemas de ficheros dejan que sea el usuario quien proporcione las medidas necesarias para proteger los datos ante fallos en el sistema o en las aplicaciones. Es preciso comprender muy bien esta funcionalidad para poder realizar un buen uso de ellos. La mayoría de los SGBD gestionan el acceso concurrente a la base de datos y garantizan que no ocurran problemas de este tipo. Mejora en la productividad: El SGBD proporciona muchas de las funciones estándar que el programador necesita escribir en un sistema de ficheros. Los usuarios tienen que hacer copias de seguridad cada día. Desventajas de las bases de datos Complejidad: Los SGBD son conjuntos de programas que pueden llegar a ser complejos con una gran funcionalidad. Mejora en el mantenimiento: En los sistemas de ficheros. Esto hace que los programas sean dependientes de los datos. las descripciones de los datos se encuentran inmersas en los programas de aplicación que los manejan. En este caso. y si se produce algún fallo. los SGBD separan las descripciones de los datos de las aplicaciones. gracias a la cual se simplifica el mantenimiento de las aplicaciones que acceden a la base de datos. Sin embargo. Sin embargo. Aumento de la concurrencia: En algunos sistemas de ficheros. los SGBD actuales funcionan de modo que se minimiza la cantidad de trabajo perdido cuando se produce un fallo. A nivel básico. de modo que un cambio en su estructura. todo el trabajo realizado sobre los datos desde que se hizo la última copia de seguridad se pierde y se tiene que volver a realizar. el SGBD proporciona todas las rutinas de manejo de ficheros típicas de los programas de aplicación. utilizar estas copias para restaurarlos. es posible que el acceso interfiera entre ellos de modo que se pierda información o se pierda la integridad. Esto es lo que se conoce como independencia de datos.

Además. Su utilidad resulta: Servir de identificador ya que resultan exclusivos de un registro. Vulnerable a los fallos: El hecho de que todo esté centralizado en el SGBD hace que el sistema sea más vulnerable ante los fallos que puedan producirse.  Alfanuméricos: contienen cifras y letras.  Fechas: almacenan fechas facilitando posteriormente su explotación. es posible que sea necesario adquirir una máquina más grande o una máquina que se dedique solamente al SGBD. Administra muy bien grandes cantidades de datos. Tipos de Campos Cada Sistema de Base de Datos posee tipos de campos que pueden ser similares o diferentes. Presentan una longitud limitada (255 caracteres).  PostgreSql y Oracle: Son sistemas de base de datos poderosos. y suelen ser utilizadas en intranets y sistemas de gran calibre. pueden hacer que sea necesario adquirir más espacio de almacenamiento. Tipos de Base de Datos Entre los diferentes tipos de base de datos. . el cual crea un archivo . Presentan el inconveniente de no poder ser indexados. para alcanzar las prestaciones deseadas. podemos encontrar los siguientes:  MySql: es una base de datos con licencia GPL basada en un servidor. Esta base de datos. como la propia base de datos.  Booleanos: poseen dos estados: Verdadero “Si” y Falso “No”. debe ser creada bajo el programa access. Todo esto hará que la implantación de un sistema de bases de datos sea más cara.Coste del equipamiento adicional: Tanto el SGBD. Es por ello que deben tenerse copias de seguridad (Backup).mdb con la estructura ya explicada. Entre los más comunes podemos nombrar:  Numérico: entre los diferentes tipos de campos numéricos podemos encontrar enteros “sin decimales” y reales “decimales”.  Access: Es una base de datos desarrollada por Microsoft.  Memos: son campos alfanuméricos de longitud ilimitada. No es recomendable usar para grandes volúmenes de datos. Almacenar fechas de esta forma posibilita ordenar los registros por fechas o calcular los días entre una fecha y otra. Se caracteriza por su rapidez.  Autoincrementadles: son campos numéricos enteros que incrementan en una unidad su valor para cada registro incorporado.

Cada base de datos contiene una o más tablas. Estructura de una Base de Datos Una base de datos.  Relaciones de uno a muchos: cada instancia de la entidad A se relaciona con varias instancias de la entidad B. Estos modelos expresan entidades relevantes para un sistema de información. Microsoft SQL Server: es una base de datos más potente que access desarrollada por Microsoft. que cumplen la función de contener los campos. . Se utiliza para manejar grandes volúmenes de informaciones. En el siguiente ejemplo mostramos una tabla “comentarios” que contiene 4 campos. Modelo entidad-relación Los diagramas o modelos entidad-relación (denominado por su siglas.  Relaciones de muchos a muchos: cualquier instancia de la entidad A se relaciona con cualquier instancia de la entidad B. a fin de ordenar la información de manera lógica. posee un orden que debe ser cumplido para acceder a la información de manera coherente. ERD “Diagram Entity relationship”) son una herramienta para el modelado de datos de un sistema de información. sus inter-relaciones y propiedades. Cardinalidad de las Relaciones El diseño de relaciones entre las tablas de una base de datos puede ser la siguiente:  Relaciones de uno a uno: una instancia de la entidad A se relaciona con una y solamente una de la entidad B.

que abarca una amplia gama de tecnologías y arquitecturas. también llamadas No Solo SQL. A continuación veremos un ejemplo de ellos:  Mostrar: para mostrar los registros Select. 'como esta'. busca resolver los problemas de escalabilidad y rendimiento de big data que las bases de datos relacionales no fueron diseñadas para abordar. Delete From comentarios Where id='1'. Además. fecha) Values ('saludos'. tendremos que especificar cuáles son los nuevos valores de los campos que deseamos actualizar. NoSQL es especialmente útil cuando una empresa necesita acceder y analizar grandes cantidades de datos no estructurados o datos que se almacenan de forma remota en varios servidores virtuales en la nube. actualizar y borrar datos. Select * From comentarios. '22-10-2007')  Borrar: Para borrar un registro se utiliza la instrucción Delete. Este lenguaje nos permite realizar consultas a nuestras bases de datos para mostrar. Las bases de datos NoSQL.Los datos quedarían organizados como mostramos en siguiente ejemplo: Por consiguiente una base de datos posee el siguiente orden jerárquico:  Tablas  Campos  Registros  Lenguaje SQL El lenguaje SQL es el más universal en los sistemas de base de datos. Es por ello necesario establecer una selección que se llevara a cabo mediante la cláusula Where.Update comentarios Set titulo='Mi Primer Comentario' Where id='1'. son un enfoque hacia la gestión de datos y el diseño de base de datos que es útil para grandes conjuntos de datos distribuidos. se utiliza la instrucción  Insertar: los registros pueden ser introducidos a partir de sentencias que emplean la instrucción Insert. NoSQL. Como para el caso de Delete. . Insert Into comentarios (titulo. En este caso debemos especificar cual o cuales son los registros que queremos borrar. texto. necesitamos especificar por medio de Where cuáles son los registros en los que queremos hacer efectivas nuestras modificaciones. insertar.  Actualizar: para actualizar los registros se utiliza la instrucción Update.

una base de datos NoSQL podría organizar los datos en objetos. MongoDB usa JSON). sin necesidad en muchos casos de realizar ninguna otra operación más que indicar al sistema cuáles son los nodos disponibles. Muchos sistemas NoSQL permiten utilizar consultas del tipo Map-Reduce. además de un nivel de ejecución más concreto para poderse llevar a cabo. otros simplemente evitan funcionalidades relacionales seleccionadas como esquemas de tablas fijas y operaciones conjuntas. eventualmente.Contrariamente a las ideas falsas causadas por su nombre. Las bases de datos NoSQL parten de la base en la que las “tablas” no existen como tal.  Estructura distribuida: Generalmente se distribuyen los datos mediante mecanismos de tablas de hash distribuidas. generalmente como clave-valor. en lugar de utilizar tablas. Esto se conoce también como BASE (Basically Available Soft-state Eventual Consistency. NoSQL no prohíbe el lenguaje estructurado de consultas (SQL). Por ejemplo. sino que la información se almacena de forma distinta. como por ejemplo BigTable (GQL). De entre todas las implementaciones de bases de datos NoSQL. hay muchas que no utilizan el lenguaje de consultas SQL (por ejemplo. las cuales pueden ejecutarse en todos los nodos a la vez (cada uno operando sobre una porción de los datos) y reunir luego los resultados antes de devolverlos.  Tolerancia a fallos y Redundancia. Si bien es cierto que algunos sistemas NoSQL son totalmente no-relacionales. pero hay algunas que siguen usándolo. por lo . Esta flexibilidad hace que la consistencia se dé. puedo cambiar la estructura de mi información dinámicamente sin tener que re-diseñar todo de nuevo. cuando no se hayan modificado los datos durante un periodo de tiempo. cada sentencia compleja requiere. así es que puedo tener ‘Personas’ con mas atributos que otras. donde la confirmación de un cambio implica una comunicación del mismo a todos los nodos que lo repliquen. pueden cambiar sin perder la agrupación de la información. Características  Consistencia Eventual: No se implementan mecanismos rígidos de consistencia como los presentes en las bases de datos relacionales. que lo ha transformado manteniendo su estructura básica. o coherencia eventual flexible básicamente disponible). pares clave/valor o tuplas. es que deben de transcribir cada sentencia para poder ser ejecutada y.  No generan cuellos de botella: el problema de fondo de los sistemas SQL.  Escalabilidad horizontal: Consite en la posibilidad de aumentar el rendimiento del sistema simplemente añadiendo más nodos. como una tabla en la que las columnas son dinámicas.

como un HashMap donde cada elemento esta identificado por una llave única. además de que pueden escalar fácilmente particionando los valores de acuerdo a su clave. aunque siguen sin permitir joins. facilitando el polimorfismo de datos bajo una misma colección de información. lo que permite la recuperación de la información de manera muy rápida. De hecho varias de las implementaciones de este tipo de bases de datos permiten consultas muy avanzadas sobre los datos. Muchas de ellas están basadas en la publicación de Google acerca de su BigTable y de Amazon. Son muy eficientes para lecturas y escrituras. Riak. Hacerlo así aumenta la claridad (al tener todos los datos relacionados en un mismo bloque de información) y el rendimiento (no hay que hacer un JOIN para obtener los datos relacionados. SimpleDB de Amazon. único y conflictivo en base a rendimiento. De esta forma el tipo de contenido no es importante para la base de datos. dependiendo de cómo almacenan la información:  Key-Value: clave-valor es la forma mas típica. También se pueden almacenar estructuras de datos complejas en un sólo documento. Es similar a las bases de datos Key-value. pudiendo así almacenar sólo los atributos que interesen en cada uno de ellos. los de 1001 a 2000 a otro. solo la clave y el valor que tiene asociado. Normalmente el valor se alamcenar como un objeto BLOB. etc.  Solo lo estrictamente necesario: son sistemas simples que no tienen un sistema de consulta complejo ni con capacidad declarativa para en una sola línea realizar una cantidad interna de operaciones desorbitada. . Cassandra. como por ejemplo almacenar la información sobre una publicación de un blog (título. Si el servidor entiende los datos. por ejemplo aquellos cuya clave está entre 1 y 1000 van a un server.  Estructura dinámica: La primera característica significa que los datos no tienen una definición de atributos fija. pues éstos se encuentran directamente en el mismo documento). cuerpo de texto. es decir: Cada registro puede contener una información con diferente forma cada vez.  Basada en Documentos: estas almacenan la información como un documento (generalmente con una estructura simple como JSON o XML) y con una clave única. Voldemort y MemcacheDB entre otras.que constituye un punto de entrada común. puede hacer operaciones con ellos. pero con la diferencia que el valor es un fichero que puede ser entendido. Podemos encontrar a MongoDB y CouchDB entre las mas importantes de este tipo. Tipos En general hay 5 tipos de bases de datos NoSQL. etc) junto a los comentarios y etiquetas vertidos sobre el mismo. Hadoop. Dentro de estas bases de datos podemos encontrar a BigTable de Google. todo en un único registro. e incluso establecer relaciones entre ellos. autor.

Los Sistemas de Bases de Datos Distribuidas Representan más naturalmente la estructura geográficamente descentralizada de una organización. hoy en día se utilizan ya muchísimo no sólo como almacenamiento primario. en especial por el altísimo rendimiento que ofrecen. y concretamente en las que tiene en el momento de escalar. con dos nuevos problemas que caracterizan el proceso de distribución de datos. El diseño de las Bases de Datos Distribuidas posee las fases del diseño centralizado y cuenta. sino también como sistema de persistencia para guardar cachés. ya que si se requiere consultar un número reducido de columnas. No en vano. pero sí que en determinados entornos donde hemos de escalar rápidamente. además. Cassandra. Estas bases de datos no significa que el modelo relacional desaparezca. este tipo de bases de datos sólo son aprovechables si la información en cuestión se puede representar fácilmente como una red. Esto implica que tendremos que realizar un estudio de nuestro sistema. Además. qué cantidad . es una solución muy buena. donde es necesario disponer de servidores muy potentes y de balanceo de carga. aplicación y datos y ver cuales de todas las posibilidades que se nos proporcionan es la mejor para nuestra aplicación. De hecho. Orientadas a Grafos: Hay otras bases de datos que almacenan la información como grafos donde las relaciones entre los nodos son lo mas importante. Con este cambio ganamos mucha velocidad en lecturas. en vez de a los nodos. Obviamente. al estar almacenadas de esta forma. Por ello este tipo de soluciones es usado en aplicaciones con un índice bajo de escrituras pero muchas lecturas. e incluyen la determinación de: cómo dividir la base de datos en componentes para localizarlos en diferentes sitios. las relaciones también pueden tener atributos y puedes hacer consultas directas a relaciones.Encontramos a neo4j entre otras. es mucho más eficiente navegar entre relaciones que en un modelo relacional. aumentan la disponibilidad de los datos.  Orientadas a Columnas: guardan los valores en columnas en lugar de filas. Son muy útiles para representar información de redes sociales. Incluso podemos utilizar una base de datos relacional para almacenar los usuarios registrados y una base de datos NoSQL para almacenar la información de un blog. es muy rápido hacerlo pero no es eficiente para realizar escrituras. además. y otros datos para los que lo primordial es la velocidad. Por ejemplo. por el abaratamiento de los costos en el equipamiento y la infraestructura de comunicaciones de las redes de computadoras. Conclusión Definitivamente. analíticas de uso. reducen el tráfico de comunicación y es justificable. con el término NoSQL nos referimos a una multitud de bases de datos que intentan solventar las limitaciones que el modelo relacional se encuentra en entornos de almacenamiento masivo de datos.

1991]. La integridad se refiere a la consistencia. validez y exactitud de la información. La combinación de las anteriores resulta en una fragmentación híbrida. La fragmentación es el proceso de dividir una relación en pequeñas porciones llamadas fragmentos [Meghini.de datos debe ser replicados y cómo deben los fragmentos replicados ser localizados.  La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una autonomía e independencia entre los nodos. las cuales aseguran que la BD no tenga .  Control local de los datos con que se interactúa. Las razones principales para la fragmentación son el incremento del nivel de concurrencia y el desempeño del sistema. 1991]. 2. para nuestros propósitos es suficiente expresar que un sistema distribuido es una colección de computadoras independientes interconectadas entre sí que aparecen ante los usuarios del sistema como una única computadora [Özsu.  El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo.  Mayor tolerancia a los fallos Desventajas:  Es más complicado el control y la manipulación de los datos  Es compleja el aseguramiento de la integridad de la información en presencia de fallas no predecibles tanto de componentes de hardware como de software. Existen varias definiciones sobre qué es un sistema distribuido pero hay divergencias entre ellas.  El control de concurrencia y los mecanismos de recuperación son mucho más complejos que en un sistema centralizado dado que los datos pueden estar replicados. Existen dos alternativas para fragmentar datos: fragmentación horizontal (FH) y fragmentación vertical (FV). Ventajas y Desventajas de los sistemas distribuidos Ventajas:  El acceso a los datos es más rápido debido a que los datos se localizan más cercanos al lugar donde se utilizan. La distribución de la BD requiere determinar la fragmentación y la localización.  Nuevos nodos se pueden agregar fácil y rápidamente. Es importante seguir tres reglas.

S. Una primera definición de una IDE puede aludir a un Sistema de Información Geográfico (SIG) abierto implementado sobre la Red. la infraestructura suministra el entorno ideal para abordar los problemas de la conexión de los datos con sus aplicaciones sobre la base del trabajo con un mínimo conjunto de estándares y políticas. regionales. INFRAESTRUCTURA DE DATOS ESPACIALES (IDE) El término Infraestructura de Datos Espaciales fue acuñado por primera vez en 1993 por el U. trabajando conjuntamente. políticas y disposiciones institucionales que.cambios semánticos durante la fragmentación: completitud. Nacional Research Council para referirse a un marco de tecnologías. nacionales y transnacionales. reconstrucción y desjuntara. es necesario incluir acuerdos entre organizaciones con el objeto de posibilitar su coordinación y administración a escalas locales. una IDE aloja datos y atributos geográficos. un medio para su búsqueda. facilitan la creación. y algunos métodos para posibilitar el acceso a los datos. una IDE debe ser mucho más que un simple conjunto de datos o base de datos. Aunque el núcleo del concepto de una IDE no lo recoge. el intercambio y el uso de los datos geoespaciales y recursos de información relacionados a través de una comunidad de intercambio de información. Más allá de esto hay todo un conjunto de servicios y software para soportar la explotación de los datos. Para poder hacer una IDE operacional. La implantación de una IDE tiene como objeto revertir una situación previa en la que se encuentra la información geográfica: datos espaciales . Los estándares esenciales aplicables a la información Geográfica son: la familia de normas ISO 190100 y las especificaciones del Open Geoespatial Consortium (OGC). visualización y evaluación (catálogos y servidores de mapas). suficientemente documentados (metadatos). Sin embrago.

Un sistema RAID externo se encarga de la gestión del RAID con el controlador localizado en el subsistema externo de los discos. tanto a nivel institucional y empresarial como de los propios ciudadanos. Raid es una forma de obtener discos duros más grandes. RAID Hardware Las soluciones hardware gestionan el subsistema RAID independientemente del host. En estos casos. presentándole a este un solo disco.  Animar a la cooperación entre los agentes. pero gestionan todas las comunicaciones reales entre los discos de manera autónoma. favoreciendo un clima de confianza para el intercambio de datos RAID (Redundant Array of Inexpensive Disks): Consiste en una serie de sistemas para organizar varios discos como si de uno solo se tratara pero haciendo que trabajen en paralelo para aumentar la velocidad de acceso o la seguridad frente a fallos del hardware o ambas cosas. lo que permitirá extender el conocimiento y el uso de la información geográfica y la optimización de la toma de decisiones. existencia de información espacial duplicada. desconocimiento por parte de los propietarios de la totalidad de los datos almacenados. más seguros y más baratos aprovechando la potencia de la CPU para tareas que necesitarían circuitos especializados y caros. Existen también controladores RAID en forma de tarjetas que se comportan como un controlador SCSI con el sistema operativo. Por los motivos anteriores los objetivos de una IDE son claros y ambiciosos:  Facilitar el acceso y la integración de la información espacial. pero después podrá configurarlo como un controlador RAID sin que el sistema operativo note la diferencia.  Posibilitar la reutilización de la Información Geográfica generada en un proyecto para otras finalidades diferentes. RAID Software . más rápidos. así como el contacto con las entidades propietarias de los mismos. datos de distintos organismos y países que no son comparables ni interoperables. lo que permitirá la reducción de costos y evitar la duplicación de esfuerzos. con la consiguiente dificultad de localización de los mismos.dispersos por la red. dado el alto coste de su producción. Todo el subsistema está conectado a un host a través de un controlador SCSI normal y se le presenta al host como un solo disco. basta con conectar los discos a un controlador RAID como lo haría con un controlador SCSI.  Promover los metadatos estandarizados como método para documentar la información espacial. Un ejemplo de RAID hardware podría ser el conectado al controlador SCSI que presenta al sistema un único disco SCSI.

El driver MD del kernel de Linux es un ejemplo de que la solución RAID es completamente independiente del hardware.El RAID Software implementa los diferentes niveles de RAID en el código del kernel que tienen que ver con la gestión del disco (block device). El disco redundante es una réplica exacta del disco de datos. Cuando se describen datos en una unidad. Tipos de RAID: Lineal Diferentes discos se enlazan uno detrás de otro para que el sistema vea un solo disco más grande. RAID 1: Mirrored Disk Array (MDA) Conjunto de discos en espejo: La configuración de nivel 1 de Raid o disco en espejo incluye dos unidades de disco: 1° unidad de datos y una unidad de réplica. con lo que el sistema puede seguir funcionando. el RAID software funciona con discos IDE menos costosos así como con discos SCSI. Como no hay redundancia el riesgo de fallos aumenta. Si falla uno perdemos todo el sistema de ficheros. Ventajas  Mayor rendimiento en las lecturas de datos de las lecturas convencionales. pero el rendimiento es muy bueno. Inconvenientes . RAID 0 La información se graba y se lee en paralelo entre varios discos. por lo que se conoce también como disco espejo. por lo que constituye la mejor opción para aplicaciones que contienen un gran número de operaciones de escritura. Con las rápidas CPU de hoy en día. Ofrece además la solución menos costosa. también se escriben en la otra.  Podemos recuperar todos los datos en caso de error en unos de los discos ya que si un disco suspende la operación el otro continua disponible. las prestaciones de un RAID software pueden competir con las de un RAID hardware. Con el nivel de Raid se obtiene la misma velocidad de lectura/ escritura que una configuración normalizada de disco. Las prestaciones de un RAID basado en el software dependen de las prestaciones y de la carga del CPU. Los datos pueden leerse de cualquiera de las 2 unidades de forma que si se avería la unidad de datos es posible acceder a la unidad de réplica.

Raid 2 : Hamming code for Error Corrección Es el primer nivel de Raid que usa código de correcciones de error utilizando la " generación Hamming" de código de error. El problema de este tipo de arreglos es el que implica d costo uplicar el disco. • Podemos recuperar los datos gracias a los discos de código de error. Algunos de estos discos son empleados para códigos de error. Ambientes en donde implementarlos Raid1 está diseñado para sistemas en donde la disponibilidad de información es esencial y su reemplazo resultaría difícil y costoso (más costoso que reponer el disco en si). Típico en escrituras aleatorias pequeñas a fallas. El acceso es simultáneo a todas las unidades tanto en operaciones de escritura como lectura. cada byte se graba con un bit de paridad en cada uno de los discos y un bit de paridad en el noveno. Inconvenientes • Solución cara ya que requeriremos muchos discos para guardar los códigos de error. Con único de paridad solo se puede detectar un único error. Bastante caro ya que necesitamos el doble de espacio que el necesario. incluso aunque los datos se separen en los diferentes discos Raid 3 . La división es a nivel de bits. los cuales se emplean para referencias de los datos en caso de que falle uno de los discos. • Tiempo de escritura de datos bastante lentos. Este nivel tiene un costo bastante elevado ya que necesitamos muchos discos para mantener los códigos de error. Este nivel cuenta con varios discos para bloques de redundancia y corrección de errores.  Moderada lentitud en la escritura de datos ya que la hemos de escribir en dos localizaciones. Estos discos aunque proporcionen un buen rendimiento no son muy empleados ya que los niveles 1 –3 – 5 proporcionan una mayor relación costo/ rendimiento Ventajas • Se emplea para mejorar la demanda y también la velocidad de transferencia. Sistemas de nueve discos. pero si está interesado en la recuperación de más errores son necesarios más discos adicionales. Gracias a como están distribuidos los datos en los discos se consigue mejorar la velocidad de transferencia principalmente en la lectura ya que podemos emplear todos los discos en paralelo.

Para estos es el nivel Raid más eficiente ya que nunca es necesario leer modificar. escribir el bloque de paridad. • Gracias al disco de paridad podemos recuperar datos. Por consiguiente el nivel 3 de Raid no es una opción adecuada para operaciones transaccionales. RAID 4 Independiente Disk Array (IDA) Sistemas de discos independientes con disco de control de errores.El nivel 4 de Raid es preferible al nivel 2 de Raid para pequeños bloques de datos . En el nivel 3 de Raid los discos participan en cada transacción. video. Es menos apropiado para el tipo de acceso de base de datos en los cuales se necesitan transferir pequeñas unidades de datos de manera aleatoria. Los datos se dividen fragmentos que se transfieren a los discos que funcionan en paralelo. porque en este nivel . Este control de información codificada o paridad proviene de los datos almacenados en los discos y permite la reconstrucción de información en caso de fallas. en la que la mayor parte del tiempo se emplea en buscar pequeños registros esparcidos aleatoriamente en los discos. lo que permiten enviar más datos de una sola vez. Conocido también como Striping con paridad delicada.Sistemas de disco en paralelo con disco de paridad para corrección de errores. las peticiones de operaciones de entrada /salida simultaneas pueden sobrecargar y ralentizar el sistema. Utiliza también un disco de protección de información separado para almacenar información de control codificada con lo que se logra una forma mas eficaz de proporcionar redundancia de datos. No obstante en aquellos entornos en los que muchos usuarios desean leer y escribir múltiple registros aleatorios. Resultan más adecuados para sistemas en los que transfieren grandes cantidades de datos secuencialmente. Esta última característica convierte a este nivel en idóneo para que estas aplicaciones que requieran la transferencia de grandes ficheros contiguos hacia y desde el ordenador central. Ventajas •Alto rendimiento para aplicaciones de velocidad de transferencia alta. ejemplo audio. Se requieren como mínimo 3 discos y se utiliza la capacidad de un disco para la información de control. los datos son distribuidos por sectores y no por bits . atendiendo cada petición de Entrada /Salida de una en una. Inconvenientes •Si perdemos el disco de paridad perdemos toda la información redundante que teníamos • Tipo de escritura de datos bastante lento. En el nivel 4 de raid los bloques de datos pueden ser distribuidos a través de un grupo de discos para reducir el tiempo de transferencia y explotar toda la capacidad de transferencia de datos de la matriz del disco . y aumentar en forma sustancial la velocidad general de transferencia de datos.

Cada disco graba un bloque de datos distinto.. Si falla un disco. ideal para sistemas de emisión critica. dos canales. pero el disco que graba el código de corrección se va alternando.Otra ventaja del nivel 4 de RAID frente a los niveles 2 y 3 es que al mismo tiempo puede estar activa más de una operación de lectura escritura sobre el conjunto de discos .. donde se requiera mayor confiabilidad de la información ya que pueden fallar dos discos inclusive (uno por cada canal) y los datos todavía se . seguro. y un disco adicional graba un código de corrección de errores. dos discos para cada canal y se utilizan el 50 % de la capacidad para información de control Ventajas • Este nivel ofrece un 100 % de redundancia de la información y un soporte para grandes volúmenes de datos. cada disco se duplica como raid 1. RAID-6. Este tipo incluye un sistema operativo incrustado de tiempo real como controlador. La operación de escritura se realiza en forma secuencial y la lectura en paralelo. Raid 10 La información se distribuyen en bloques como el Raid 0 y adicionalmente. y sólo pierde la capacidad de un disco. Rápido. El nivel 4 de RAID tiene división a nivel de bloques y el acceso al arreglo de discos es paralelo. pero incluye un segundo esquema de paridad distribuido por los distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y las caídas de disco. creando un segundo nivel de arreglo se conoce como "Striping de arreglos duplicados” . • Meno rendimiento en las lecturas de datos RAID 5 igual que el anterior. Ventajas: •Buen rendimiento en las escrituras de datos: Tiene integridad de datos Inconvenientes • Si perdemos el disco de parida. Posee un delicado a paridad y corrección de errores.. haciendo las operaciones de caché a través de un bus de alta velocidad y otras características de un ordenador sencillo. Hay pocos ejemplos comerciales en la actualidad. pero éste está muy saturado. Este tipo es similar al RAID-5. pero no simultaneo. su información se puede recomponer. RAID-7. Ambientes donde implementarlo. Un vendedor ofrece este sistema. donde el precio no es un factor importante. perdemos toda la información redundante que Teníamos. Se requieren.pero necesita al menos 3 discos. solo perdemos la capacidad de un disco.

Servidores en rack. Los servidores blade son especialmente adecuados para las estrategias de consolidación de centros de datos y de modernización. La categoría de servidor modular incluye ambos servidores blade y servidores multinodo. El diseño de servidores modulares se centra en la densidad de los componentes de hardware y la riqueza del software de gestión de infraestructura incluida. Mediante la implementación de este tipo de servidores. fábrica creada en gran parte se ha estancado desde 2011. los ingresos anuales de los servidores blade sigue siendo más del doble que para los servidores multinodo. Servidores modulares suelen abordar las cargas de trabajo y las cargas de trabajo más pequeños que pueden escalar a cabo para lograr un mayor rendimiento. gestores de centros de datos pueden mejorar la administración de servidores. La demanda de servidores blade. y muchas de las estrategias del sistema integrado se basan en servidores blade. Tradicionalmente. línea . Sin embargo. Web-escala emergente TI cargas de trabajo. muchos productos en esta categoría son similares y pueden caer en la categoría más general de servidores modulares. torre y el marco no se consideran servidores modulares. También pueden aumentar CPU arquitectura flexibilidad y soportar los requerimientos de muchos.Es apropiado también en escritura aleatorias Blade HP Servidores Modulares Información general Servidores modulares son una clase de servidores con capacidades de cómputo modulares alojados en una. hechos a la medida de alto rendimiento de computación (HPC). previamente clasificados como servidores multinodo. como las capacidades de primera calidad que diferencian estas opciones se hicieron comunes. como parte de la oferta de servidor modular. servidores multinodo. Hoy en día. marcadas diferencias entre estos productos disminuyeron. Los mercados blade y servidores multinodo vez separados se superponen cada vez más en términos de uso y la aceptación. chasis común. Una amplia gama de ofertas de servidores modulares están ahora disponibles. Este chasis también puede contener componentes de almacenamiento y de red.mantienen en pequeñas . creando un efecto de canalización de las cuchillas y la conducción de convergencia mercado. el producto debe tener un chasis o recinto que permite la adición o sustitución fácil y rápida de servidores. la eficiencia operativa y la densidad del servidor. Aún así. a menudo de propiedad. los servidores blade. Estos . Consulte "Definiciones de mercado y Metodología: Servidores" para obtener más información. ya las nuevas demandas de carga de trabajo a favor de los factores de forma modulares alternativas. Para Gartner para considerar un producto de servidor como "modular". como tampoco lo son do-it-yourself servidores creados a partir de la placa base y componentes adquisiciones. sistemas de supercomputadoras y diseños de TI de proveedores de servicios han sido en gran parte las ofertas diferenciadas.

como el tipo de CPU y memoria. Si un usuario no puede acceder al sistema se dice que está no disponible.servidores varían en las opciones de configuración. Por ejemplo. la redundancia hace referencia al almacenamiento de los mismos datos varias veces en diferentes lugares. pero el dato duplicado en otro lugar no es actualizado. someter nuevos trabajos. lo que permite que las aplicaciones utilicen varios procesadores cuando se necesite mayor capacidad de procesamiento para aumentar las capacidades de un sistema. si el hardware actual no ofrece un rendimiento adecuado para los usuarios. El término tiempo de inactividad (downtime) es usado para definir cuándo el sistema no está disponible. Alta disponibilidad Alta disponibilidad (High availability) es un protocolo de diseño del sistema y su implementación asociada que asegura un cierto grado absoluto de continuidad operacional durante un período de medición dado. Windows Server 2003 es compatible con una o varias CPU que cumplan el estándar de multiprocesamiento simétrico (SMP). cuando se actualiza el dato en un lugar. memoria. Disponibilidad se refiere a la habilidad de la comunidad de usuarios para acceder al sistema. que se emplea para mejorar el rendimiento en las consultas a las bases de datos Escalado vertical El escalado vertical implica aumentar los recursos del sistema (como procesadores. El escalado vertical es idóneo cuando se desea mejorar el tiempo de respuesta de los clientes. deban hacerse en todos los lugares a la vez. discos y adaptadores de red) al hardware existente o reemplazar hardware existente por otro con mayores recursos de sistema. como en una configuración de Equilibrio de carga de red (NLB) de un servidor de aplicaciones para usuario de Exchange. actualizar o alterar trabajos existentes o recoger los resultados de trabajos previos. Redundancia de Datos En bases de datos o en ficheros. Mediante SMP. esto hace que cuando se graben o actualicen los datos. puede considerar la posibilidad de agregar memoria RAM o unidades centrales de procesamiento (CPU) a los servidores del clúster NLB para satisfacer esa demanda. La redundancia de datos puede provocar problemas como: * Incremento del trabajo: como un mismo dato está almacenado en dos o más lugares. Escalado horizontal . * Desperdicio de espacio de almacenamiento: ya que los mismos datos están almacenados en varios lugares distintos. por ejemplo. no debería haber redundancia de datos (exceptuando la redundancia de datos controlada. Este problema es más evidente en grandes bases de datos. Esto puede suceder. ocupando así más bytes del medio de almacenamiento. Si una base de datos está bien diseñada. almacenamiento y tecnologías de conmutación. el sistema operativo puede ejecutar subprocesos en cualquier procesador disponible. * Inconsistencia de datos: esto sucede cuando los datos redundantes no son iguales entre sí.

Para obtener información detallada sobre la selección de hardware y el ajuste de Exchange 2003 para rendimiento y escalabilidad. Nathan Senthil. Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data.org/wiki/Simple_Linux_Utility_for_Res ource_Management . Deroos Dirk. Kobielus James.usb.engadget.wikipedia. IBM InfoSphere Streams: Assembling Continuous Insight in the Information Revolution. El escalado horizontal también es adecuado cuando se desea mejorar el tiempo de respuesta de los clientes con los servidores. http://ldc. Para obtener información acerca de la escalabilidad en lo que respecta a las soluciones de clúster de servidor. Deutsch Tom.wordpress. esto significa agregar nodos al clúster. Zikopolous Paul.com/2010/09/cloud-basedcomputing-to-begin-dominating-it/ 12.apache.datacenterdynamics. http://www. En una situación NLB de aplicaciones para usuario.htm 10. Foster Kevin. http://www.El escalado horizontal implica agregar servidores para atender a la demanda. 2011 6. consulte “Consideraciones de rendimiento y escalabilidad” en Consideraciones de diseño de la organización en clústeres. http://es. significa agregar equipos al conjunto de servidores de protocolo de aplicaciones para usuario de Exchange 2003.com/blog/big-data-analytics-helpsresearchers-drill-deeper-multiple-sclerosis 3.quantumofgeek. consulte la Exchange Server 2003 Performance and Scalability Guide.org/wiki/Zonbu#Beneficios_ambientales 9.es/focus/archive/2012/0 8/un-data-center-listo-en-30-d%C3%ADas 13.netezza. Ballard Chuck. http://es.org/wiki/Computaci %C3%B3n_en_nube 11. http://es. McGraw-Hill. Rajan Deepak. Clegg Dai. Bibliografía: 1.com/ 7. 2012 5.org/ 4. Big Data: The Data Velocity Discussion.wikipedia. Artículo Web http://thinking.netezza. En un clúster de servidor de servicios de fondo.com/tag/fit-pc/ 8. Lapis George. Artículo Webhttp://thinking. IBM RedBooks. Big Data Analytics Helps Researchers Drill Deeper into Multiple Sclerosis. http://reciclajeinformatico.com/blog/big-data-data-velocitydiscussion 2. http://es.ve/~emilio/Portafolio/Redes/Car. Aprenda más acerca de Apache Hadoop en http://hadoop.wikipedia.

14.siliconweek. http://www.es/noticias/google-duplicara-la- capacidad-de-su-centro-de-datos-en-finlandia-25907 .