You are on page 1of 22

RAID

De Wikipedia, la enciclopedia libre
Saltar a navegación, búsqueda En informática, el acrónimo RAID (del inglés Redundant Array of Independent Disks, «conjunto redundante de discos independientes», originalmente era conocido como Redundant Array of Inexpensive Disks, «conjunto redundante de discos baratos») hace referencia a un sistema de almacenamiento que usa múltiples discos duros o SSD entre los que distribuye o replica los datos. Dependiendo de su configuración (a la que suele llamarse «nivel»), los beneficios de un RAID respecto a un único disco son uno o varios de los siguientes: mayor integridad, mayor tolerancia a fallos, mayor throughput (rendimiento) y mayor capacidad. En sus implementaciones originales, su ventaja clave era la habilidad de combinar varios dispositivos de bajo coste y tecnología más antigua en un conjunto que ofrecía mayor capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y coste más alto. En el nivel más simple, un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAID suelen usarse en servidores y normalmente (aunque no es necesario) se implementan con unidades de disco de la misma capacidad. Debido al decremento en el precio de los discos duros y la mayor disponibilidad de las opciones RAID incluidas en los chipsets de las placas base, los RAID se encuentran también como opción en los ordenadores personales más avanzados. Esto es especialmente frecuente en los computadores dedicados a tareas intensivas de almacenamiento, como edición de audio y vídeo. La especificación RAID original sugería cierto número de «niveles RAID» o combinaciones diferentes de discos. Cada una tenía ventajas y desventajas teóricas. Con el paso de los años, han aparecido diferentes implementaciones del concepto RAID. La mayoría difieren sustancialmente de los niveles RAID idealizados originalmente, pero se ha conservado la costumbre de llamarlas con números. Esto puede resultar confuso, dado que una implementación RAID 5, por ejemplo, puede diferir sustancialmente de otra. Los niveles RAID 3 y RAID 4 son confundidos con frecuencia e incluso usados indistintamente. La misma definición de RAID ha estado en disputa durante años. El uso de término «redundante» hace que muchos objeten sobre que el RAID 0 sea realmente un RAID. De igual forma, el cambio de «barato» a «independiente» confunde a muchos sobre el pretendido propósito del RAID. Incluso hay algunas implementaciones del concepto RAID que usan un solo disco. Pero en general, diremos que cualquier sistema que emplee los conceptos RAID básicos de combinar espacio físico en disco para los fines de mejorar la fiabilidad, capacidad o rendimiento es un sistema RAID.

Contenido
[ocultar]

y y y

y

y

y

y y y y

1 RAID 2 Implementaciones 3 Niveles RAID estándar o 3.1 RAID 0 (Data Striping) o 3.2 JBOD o 3.3 RAID 1 (Data Mirroring) o 3.4 RAID 2 o 3.5 RAID 3 o 3.6 RAID 4 o 3.7 RAID 5 o 3.8 RAID 6 o 3.9 RAID 5E y RAID 6E 4 Niveles RAID anidados o 4.1 RAID 0+1 o 4.2 RAID 1+0 o 4.3 RAID 30 o 4.4 RAID 100 o 4.5 RAID 50 5 Niveles RAID propietarios o 5.1 Paridad doble o 5.2 RAID 1.5 o 5.3 RAID 7 o 5.4 RAID S o RAID de paridad o 5.5 Matrix RAID o 5.6 Linux MD RAID 10 o 5.7 IBM ServeRAID 1E o 5.8 RAID Z 6 Posibilidades de RAID o 6.1 Lo que RAID puede hacer o 6.2 Lo que RAID no puede hacer 7 Véase también 8 Notas 9 Productores de Raid Hardware 10 Enlaces externos

[editar] RAID
A Norman Ken Ouchi de IBM le fue concedida en 1978 la Patente USPTO nº 4,092,732, titulada «Sistema para recuperar datos almacenados en una unidad de memoria averiada» (System for recovering data stored in failed memory unit), cuyas demandas describen los que más tarde sería denominado escritura totalmente dividida (full striping). Esta patente de 1978 también menciona la copia espejo (mirroring o duplexing), que más tarde sería denominada RAID 1, y la protección con cálculo de paridad dedicado, que más tarde sería denominada RAID 4, que eran ya arte previo en aquella época.

Con la implementación por software. Esta opción suele ofrecer un mejor rendimiento y hace que el soporte por parte del sistema operativo sea más sencillo (de hecho. El término «RAID» se usó por vez primera en este ensayo. [editar] Implementaciones La distribución de datos en varios discos puede ser gestionada por hardware dedicado o por software. Katz en el ensayo «Un Caso para Conjuntos de Discos Redundantes Económicos (RAID)» ²A Case for Redundant Arrays of Inexpensive Disks (RAID)². Gibson y Randy H. que a su vez se conecta al sistema principal mediante una o varias conexiones SCSI. con la consiguiente pérdida de rendimiento. a expensas de dejar menos tiempo de proceso al resto de tareas del sistema. Este grupo estudió la posibilidad de usar dos o más discos que aparecieran como un único dispositivo para el sistema. que dio origen a toda la industria de los conjuntos de discos. Además. SATA. permitiendo que los discos que fallen puedan reemplazarse sin necesidad de detener el sistema. 109-116). Fibre Channel o iSCSI. Una importante característica de los sistemas RAID por hardware es que pueden incorporar un caché de escritura no volátil (con alimentación de respaldo por batería) . los realiza la CPU). conectándose al resto del sistema como un NAS. publicado en la Conferencia SIGMOD de 1988 (págs. existen sistemas RAID híbridos basados en software y hardware específico. la controladora y los discos suelen montarse en una caja externa específica. A veces el sistema RAID es totalmente autónomo. Estos sistemas efectúan en realidad todos los cálculos por software (es decir. En 1988. SAS o Fibre Channel). Patterson. Los RAID híbridos se han hecho muy populares con la introducción de controladoras RAID hardware baratas. que gestione la administración de los discos y efectúe los cálculos de paridad (necesarios para algunos niveles RAID). el sistema operativo gestiona los discos del conjunto a través de una controladora de disco normal (IDE/ATA. el hardware es una controladora de disco normal sin características RAID. los niveles RAID 1 a 5 fueron definidos formalmente por David A.La tecnología RAID fue definida por primera vez en 1987 por un grupo de informáticos de la Universidad de California. Berkeley. Garth A. En los RAID mayores. Será necesario usar un controlador de dispositivo específico para que el sistema operativo reconozca la controladora como un único dispositivo RAID. Una implementación de RAID basada en hardware requiere al menos una controladora RAID específica. pero el sistema incorpora una aplicación de bajo nivel que permite a los usuarios construir RAID controlados por la BIOS. puede ser totalmente transparente para éste). y típicamente están restringidos a una única controladora de disco. Las implementaciones basadas en hardware suelen soportar sustitución en caliente (hot swapping). ya sea como una tarjeta de expansión independiente o integrada en la placa base. Considerada tradicionalmente una solución más lenta. con el rendimiento de las CPUs modernas puede llegar a ser más rápida que algunas implementaciones hardware. En realidad. SCSI.

Todas las implementaciones pueden soportar el uso de uno o másdiscos de reserva (hot ). por ejemplo. construir de particiones en lugar de discos completos y agrupar en un mismo R discos R conectados en varias controladoras) y los basados en hardware añaden un punto de fallo más al sistema (la controladora R ). Esto reduce el tiempo del período automáticamente) tras el fallo de un disco del R de reparaci n al acortar el tiempo de reconstrucci n del R . Por el contrario. El RAID 0 se usa normalmente para £ ¢¡   significa:R:redundant A: array I: independent D: disks. el El R [edi Los niveles RAID más comúnmente usados son: y y y [editar] RAID 0 (Data Stri ing) Diagrama de una configuraci n RAID 0. distribuye los datos equitativamente entre dos o más discos sin informaci n de paridad que proporcione redundancia.que permite aumentar el rendimient del conjunto de di cos sin compro meter la integridad de los datos en caso de fallo del sistema. Esta característica no est obviamente disponible en los sistemas R por soft are. Es importante señalar que el RAID 0 no era uno de los niveles RAID originales y que no es redundante. Un RAID 0 (tambi n llamado conjunto dividido o volumen dividido) según SC. que suelen presentar por tanto el problema de reconstruir el conjunto de discos cuando el sistema es reinici do a tras un fallo para asegurar la integridad de los datos. los sistemas basados en soft are son mucho más flexibles (permitiendo. Niveles RAID estándar RAID 0: Conjunto dividido RAID : Conjunto en espejo RAID 5: Conjunto dividido con paridad distribuida . unidades preinstaladas que pueden usarse inmediatamente (y casi siempre s .

si todos los sectores accedidos están en el mismo disco. lo que daría tiempos de búsqueda sólo ligeramente superiores al de un único disco. por lo que el RAID 0 es una forma de usar más discos (en Windows 2000 Professional y posteriores es posible montar particiones en directorios. Un RAID 0 puede ser creado con discos de diferentes tamaños. en Microsoft Windows el número de unidades lógicas (letras) está limitado a 24. Esto podría llevar a tiempos de búsqueda cercanos al escenario menos bueno para un único disco. salvo si los discos giran sincronizadamente. Con un RAID 0. pero el espacio de almacenamiento añadido al conjunto estará limitado por el tamaño del disco más pequeño (por ejemplo. aunque también puede utilizarse como forma de crear un pequeño número de grandes discos virtuales a partir de un gran número de pequeños discos físicos. si bien la fiabilidad del conjunto será igual a la fiabilidad media de cada disco entre el número de discos del conjunto. eliminando así la necesidad de asignar una letra a cada unidad). También es posible crear un RAID 0 con más de dos discos. Esto se debe a que el sistema de ficheros se distribuye entre todos los discos sin redundancia.incrementar el rendimiento. ya que cada disco aporta 100GB). Una buena implementación de un RAID 0 dividirá las operaciones de lectura y escritura en bloques de igual tamaño. entonces el tiempo de búsqueda será el de dicho disco. El RAID 0 es útil para configuraciones tales como servidores NFS de solo lectura en las que montar muchos discos es un proceso costoso en tiempo y la redundancia es irrelevante. de forma parecida a Unix. limitada sólo por la velocidad de la controladora RAID. si bien el coste es una preocupación para la mayoría de los usuarios. es decir. El RAID 0 es también una opción popular para sistemas destinados a juegos en los que se desea un buen rendimiento y la integridad no es muy importante. La velocidad de transferencia del conjunto será la suma de la de todos los discos. la fiabilidad total ²medida como MTTF o MTBF² es (aproximadamente) inversamente proporcional al número de discos del conjunto. si un disco de 300 GB se divide con uno de 100 GB. entonces el tiempo de búsqueda aparente estará entre el más rápido y el más lento de los discos del conjunto. [editar] JBOD . el tamaño del conjunto resultante será sólo de 200 GB. Si los sectores a acceder están distribuidos equitativamente entre los discos. por lo que aumentan los riesgos de falla ocasionando pérdida de datos. pues todos los discos necesitan acceder a su parte de los datos antes de que la operación pueda completarse. Lo normal es montar Raid 1 (K_98_begijar). Otro uso es cuando el número de discos está limitado por el sistema operativo: por ejemplo. por lo que distribuirá la información equitativamente entre los dos discos.

Al consistir en un conjunto de discos independientes (sin redundancia). JB D no supone ninguna mejora de rendimiento. llamado s nning de discos dinámicos). [editar] RAID 1 (Data Mirroring) ¤ ¤§ ¦¥ . JB D es parecido al ampliamente usado gestor de volúmenes lógicos LVM. En este sentido. la concatenación es como el proceso contrario alparticionado: mientras éste toma un disco físico y crea dos o más unidades lógicas. sí es un método popular de combinar múltiples discos duros físicos en un solo disco virtual. La diferencia entre JB D y LVM/LSM es que la traducción de la dirección lógica del dispositivo concatenado a la dirección física del disco es reali ada por el hardware RAID en el primer caso y por el núcleo en el segundo. JB D es útil para sistemas que no soportan LVM/LSM (como Microsoft Windows. Windows XP Pro y Windows 000 soportan JB D vía software. Sin embargo. (Tambi n conocido como RAID Lineal) Aunque la concatenación de discos (tambi n llamada JB D.Diagrama de una configuraci n JB D. JB D usa dos o más discos físicos para crear una unidad lógica. de forma que se comportan como un único disco. conservándose los de los restantes discos. Una ventaja de JB D sobre RAID 0 es que. los discos son meramente concatenados entre sí. JB D es usado a veces para combinar varias unidades pequeñas (obsoletas) en una unidad mayor con un tamaño útil. si bien Windows 003 Server. y LSM en los sistemas Unix. mientras en JB D sólo se pierden los datos del disco afectado. de Just Bunch Of Dri s. en RAID 0 suele producirse la pérdida de todos los datos del conjunto. µSólo un Montón de Discos¶) no es uno de los niveles RAID numerados. Como su nombre indica. en caso de fallo de un disco. puede ser visto como un primo lejano del RAID 0.

con el único límite de la velocidad soportada por la controladora RAID. Para maximi ar los beneficios sobre el rendimiento del RAID se recomienda el uso de controladoras de disco independientes. Por ejemplo. Como en el RAID 0. Algunas implementaciones RAID antiguas también leen de ambos discos simultáneamente y comparan los datos para detectar errores. dado que los datos deben ser escritos en todos los discos del RAID . Un conjunto RAID sólo puede ser tan grande como el más pequeñ de sus discos. lo que incrementa exponencialmente la fiabilidad respecto a un solo disco. Esto requiere que la aplicación de gestión del conjunto soporte la recuperación de los datos del disco en el momento de ¨ . el rendimiento no mejora. ya que los sectores a buscar pueden dividirse entre los discos. muchas tarjetas RAID IDE antiguas leen sólo de un disco de la pareja. Un RAID clásico consiste en dos discos en espejo. el rendimiento de lectura se incrementa aproximadamente como múltiplo lineal del número del copias. Un RAID 1 crea una copia exacta (o espejo) de un conjunto de datos en dos o más discos. dado que todos los datos están en dos o más discos. el tiempo medio de lectura se reduce. el conjunto se comporta como un único disco. Por tanto. en algunos entornos 4/ . por lo que su rendimiento es igual al de un único disco. bajando el tiempo de búsqueda y subiendo la tasa de transferencia. es posible «dividir el espejo»: marcar un disco como inactivo. es decir. una para cada disco (práctica que algunos denominan s litting o duplexing). El RAID tiene muchas ventajas de administración. Al escribir. Sin embargo. un RAID puede estar leyendo simultáneamente dos datos diferentes en dos discos diferentes. Esto resulta útil cuando el rendimiento en lectura es más importante que la o capacidad. La detección y corrección de errores en los discos duros modernos hacen esta práctica poco útil. es decir. con hardware habitualmente independiente. por lo que su rendimiento se duplica. Adicionalmente. la probabilidad de fallo del conjunto es igual al producto de las probabilidades de fallo de cada unode los discos (pues para que el conjunto falle es necesario que lo hagantodos sus discos).Diagrama de una configuración RAID . hacer unacopia de seguridad de dicho disco y luego «reconstruir» el espejo.

Un RAID 3 usa división a nivel de bytes con un disco de paridad dedicado. un disco. residiendo la misma dirección dentro de cada uno de ellos. Éste es el único nivel RAID original que actualmente no se usa. Teóricamente. una petición del bloque «A» formado por los bytes A a A6 requeriría que los tres discos de datos buscaran el comienzo (A ) y devolvieran su contenido. Alternativamente. cualquier operación de lectura o escritura exige activar todos los discos del conjunto. un conjunto de discos puede ser almacenado de forma parecida a como se hace con las tradicionales cintas. [editar] RAID 3 Diagrama de una configuración RAID 3. El RAID 3 se usa rara vez en la práctica. en la que se reserva algún espacio para los cambios. Una petición simultánea del bloque «B» tendría que esperar a que la anterior . En el ejemplo del gráfico. cada columna.la división. Uno de sus efectos secundarios es que normalmente no puede atender varias peticiones simultáneas. presentando una vista estática en un punto temporal dado del sistema de ficheros. [editar] RAID 2 RAID Un RAID 2 divide los datos a nivel de bits en lugar de a nivel de bloques y usa un código de Hamming para la corrección de errores. Así. Los discos son sincroni ados por la controladora para funcionar al unísono. Cada número representa un byte de datos. Este procedimiento es menos crítico que la presencia de una característi a c de snapshot en algunos sistemas de ficheros. un RAID necesitaría 39 discos en un sistema informático moderno: 3 se usarían para almacenar los bits individuales que forman cada palabra y 7 se usarían para la corrección de errores. debido a que por definición cualquier simple bloque de datos se dividirá por todos los miembros del conjunto. Permite tasas de trasferencias extremadamente altas.

. un disco. un conjunto RAID 4 puede servir varias peticiones de lectura simultáneamente. una petición del bloque «A » sería servida por el disco 0. Un RAID 5 usa división de datos a nivel de bloques distribuyendo la información de paridad entre todos los discos miembros del conjunto. Esto permite que cada miembro del conjunto funcione independientemente cuando se solicita un único bloque. [editar] RAID 4 Diagrama de una configuración RAID 4. cada columna. pero al estar toda la información de paridad en un solo disco. En principio también sería posible servir varias peticiones de escritura simultáneamente. [editar] RAID 5 Diagrama de una configuración RAID 5. éste se convertiría en el cuello de botella del conjunto. Necesita un mínimo de 3 discos físicos. una petición de lectura del bloque «A1» sería servida por el disco 0. el RAID 5 se implementa con soporte hardware para el cálculo de la paridad. Cada número representa un bloque de datos. pero una petición de «B2» podría atenderse concurrentemente. El RAID 5 ha logrado popularidad gracias a su bajo coste de redundancia. Una petición simultánea del bloque «B1» tendría que esperar. En el gráfico de ejemplo anterior.concluyese. Un RAID 4 usa división a nivel de bloques con un disco de paridad dedicado. En el gráfico de ejemplo anterior. El RAID 4 es parecido al RAID 3 excepto porque divide a nivel de bloques en lugar de a nivel de bytes. Generalmente. Si la controladora de disco lo permite. Una petición de lectura simultánea del bloque «B1» tendría que esperar.

Las lecturas y escrituras continúan normalmente en el conjunto de discos. aunque con alguna degradación de rendimiento. pero en la práctica es común limitar el número de unidades. un mayor tiempo de reconstrucción y una mayor probabilidad de hallar un sector irrecuperable durante una reconstrucción. Los inconvenientes de usar grupos de redundancia mayores son una mayor probabilidad de fallo simultáneo de dos discos. permitiendo así mayor número de discos por grupo. debido a que. los bloques de paridad se leen cuando la lectura de un sector de datos provoca un error de CRC. Una serie de bloques (un bloque de cada uno de los discos del conjunto) recibe el nombre colectivo de división (stripe). de ahí el término «bloques de paridad distribuidos». si falla un disco del conjunto. el MTBF (tiempo medio entre fallos) puede ser más bajo que el de un único disco. en el Modo Interno de Recuperación de Datos. cuando el CRC y la paridad están en el disco que falló. El fallo de un segundo disco provoca la pérdida completa de los datos. reemplazar y recrear dicho disco es mayor que la probabilidad de fallo de un único disco. si uno de los discos de datos falla. el sector en la misma posición relativa dentro de cada uno de los bloques de datos restantes en la división y dentro del bloque de paridad en la división se utilizan para reconstruir el sector erróneo. El error CRC se oculta así al resto del sistema. pero sólo con el fin de que el sistema operativo pueda notificar al administrador que una unidad necesita ser reemplazada: las aplicaciones en ejecución siguen funcionando ajenas al fallo. A medida que el número de discos en un conjunto RAID 5 crece. los cálculos no tienen que realizarse. es escrita en esa misma división. El sistema sabe que un disco ha fallado. el bloque de paridad (o una parte del mismo) es recalculada y vuelta a escribir. Cada vez que un bloque de datos se escribe en un RAID 5. mientras que en el RAID 4. ya que esto sería una sobrecarga innecesaria y disminuiría el rendimiento. es el RAID 6. Si otro bloque. el RAID 5 puede ser ligeramente más rápido. se genera un bloque de paridad dentro de la misma división (stripe). Esto sucede cuando la probabilidad de que falle un segundo disco en los N-1 discos restantes de un conjunto en el que ha fallado un disco en el tiempo necesario para detectar. El disco utilizado por el bloque de paridad está escalonado de una división a la siguiente. En este caso. De la misma forma. El número máximo de discos en un grupo de redundancia RAID 5 es teóricamente ilimitado. El RAID 5 requiere al menos tres unidades de disco para ser implementado. los bloques de paridad de los restantes discos son combinados matemáticamente con los bloques de datos de los restantes discos para reconstruir los datos del disco que ha fallado «al vuelo». Sin embargo.pero una petición de lectura de «B2» podría atenderse concurrentemente ya que seria servida por el disco 1. los cálculos tienen que ser realizados en cada acceso. Lo anterior se denomina a veces Modo Interino de Recuperación de Datos (Interim Data Recovery Mode). Las escrituras en un RAID 5 son costosas en términos de operaciones de disco y tráfico entre los discos y la controladora. La diferencia entre el RAID 4 y el RAID 5 es que. Una alternativa que proporciona una protección de paridad dual. Los bloques de paridad no se leen en las operaciones de lectura de datos. . o alguna porción de un bloque. Un bloque se compone a menudo de muchos sectores consecutivos de disco.

Esta potencial vulnerabilidad se conoce a veces como «agujero de escritura». típicamente un polinomio en (m = 8 significa que estamos operando sobre bytes). pero en el nivel RAID 6 se usan dos únicos códigos. por lo que divide los datos a nivel de bloques y distribuye los dos bloques de paridad entre todos los miembros del conjunto. códigos Reed-Solomon. Son comunes el uso de caché no volátiles y otras técnicas para reducir la probabilidad de ocurrencia de esta vulnerabilidad. cada columna. El RAID 6 puede ser considerado un caso especial de código Reed-Solomon. lo que se usa es un campo binario de Galois ( ). p y q. se puede ver que es posible ampliar este enfoque para generar redundancia si plemente m produciendo otro código. Tras comprender el RAID 6 como caso especial de un código Reed -Solomon.Algunos vendedores RAID evitan montar discos de los mismos lotes en un grupo de redundancia para minimizar la probabilidad de fallos simultáneos al principio y el final de su vida útil. © © . El RAID 6 no era uno de los niveles RAID originales. lo que exige realizar secuencias de lectura. modificación y escritura tanto para el bloque de datos como para el de paridad. la paridad de una división (stripe) puede quedar en un estado inconsistente con los datos. y recuperarse de un fallo de ese mismo número de discos en cualquier puntos del conjunto. la suma se calcula con un simple XOR. Cada número representa un bloque de datos. [editar] RAID 6 Diagrama de una configuración RAID 6. un disco. siendo un caso degenerado. En las representaciones cíclicas de los campos binarios de Galois. Implementaciones más complejas incluyen a menudo cachés de escritura no volátiles para reducir este problema de rendimiento. Un RAID 6 amplía el nivel RAID 5 añadiendo otro bloque de paridad. Si esto no se detecta y repara antes de que un disco o bloque falle. 1 El RAID 6. 2 Dado que se está operando sobre bits. pueden perderse datos debido a que se usará una paridad incorrecta para reconstruir el bloque perdido en dicha división. Esto se debe a que la paridad debe ser actualizada para cada escritura. En el caso de un fallo del sistema cuando hay escrituras activas. Al añadir códigos adicionales es posible alcanzar cualquier número de discos redundantes. exige sólo sumas en el campo de Galois. Las implementaciones RAID 5 presentan un rendimiento malo cuando se someten a cargas de trabajo que incluyen muchas escrituras más pequeñas que el tamaño de una división (stripe).

No suponen mejora alguna del rendimiento. Un RAID 6 no penaliza el rendimiento de las operaciones de lectura. La capacidad de datos de un conjunto RAID 6 es n-2. pero sí el de las de escritura debido al proceso que exigen los cálculos adicionales de paridad. [editar] Niveles RAID anidados Muchas controladoras permiten anidar niveles RAID. en el RAID 6 la paridad se distribuye en divisiones ( stripes). En caso de que sólo tengamos un conjunto puede ser más adecuado que usar un RAID 5 con un disco de reserva (hot spare). es decir. pero sí se minimiza el tiempo de reconstrucción (en el caso de los discos hot spare) y las labores de administración cuando se producen fallos. Un disco de reserva no es realmente parte del conjunto hasta que un disco falla y el conjunto se reconstruye sobre el de reserva. [editar] RAID 5E y RAID 6E RAID 5E Se suele llamar RAID 5E y RAID 6E a las variantes de RAID 5 y RAID 6 que incluyen discos de reserva. El RAID 6 es ineficiente cuando se usa un pequeño número de discos pero a medida que el conjunto crece y se dispone de más discos la pérdida en capacidad de almacenamiento se hace menos importante. con los bloques de paridad en un lugar diferente en cada división.Al igual que en el RAID 5. El RAID 6 proporciona protección contra fallos dobles de discos y contra fallos cuando se está reconstruyendo un disco. que un RAID pueda usarse como elemento básico de otro en lugar de discos físicos. creciendo al mismo tiempo la probabilidad de que dos discos fallen simultáneamente. los discos de reserva están disponibles para cualquiera de las unidades miembro. Estos discos pueden estar conectados y preparados (hot spare) o en espera (standby spare). Esta penalización puede minimizarse agrupando las escrituras en el menor número posible de divisiones (stripes). Resulta instructivo . siendo n el número total de discos del conjunto. En los RAID 5E y RAID 6E. lo que puede lograrse mediante el uso de un sistema de ficheros WAFL.

cuando el conjunto de más alto nivel es un RAID 0 (como en el RAID 10 y en el RAID 50). porque así será necesario reconstruir menos discos cuando uno falle. Los RAID anidados se indican normalmente uniendo en un solo número los correspondientes a los niveles RAID usados. primero se crean dos conjuntos RAID 0 (dividiendo los datos en discos) y luego. la mayoría de los vendedores eligen omitir el «+». Con estas configuraciones es preferible tener el RAID 0 como nivel más alto y los conjuntos redundantes debajo. los datos perdidos pueden ser co piados del otro conjunto de nivel 0 . Sin embargo. el RAID 10 es preferible al RAID 0+1 aunque las ventajas administrativas de «dividir el espejo» del RAID 1 se perderían. Como puede verse en el diagrama.pensar en estos conjuntos como capas dispuestas unas sobre otras. La ventaja de un RAID 0+1 es que cuando un disco duro falla. Por ejemplo.) Los niveles RAID anidados más comúnmente usados son: y y y y RAID 0+1: Un espejo de divisiones RAID 1+0: Una división de espejos RAID 30: Una división de niveles RAID con paridad dedicada RAID 100: Una división de una división de espejos [editar] RAID 0+1 Diagrama de una configuración RAID 0+1. La diferencia entre un RAID 0+1 y un RAID 1+0 es la localización de cada nivel RAID dentro del conjunto final: un RAID 0+1 es un espejo de divisiones. a pesar de que RAID 5+0 sea más informativo. que no debe confundirse con RAID 1) es un RAID usado para replicar y compartir datos entre varios discos. sobre los anteriores. se crea un conjunto RAID 1 (realizando un espejo de los anteriores). (Así. añadiendo a veces un «+» entre ellos. con los discos físicos en la inferior. En el caso del RAID 0+1 se usa más esta forma que RAID 01 para evitar la confusión con el RAID 1. se suele combinar un nivel RAID que proporcione redundancia con un RAID 0 que aumenta el rendimiento. Al anidar niveles RAID. el RAID 10 (o RAID 1+0) consiste conceptualmente en múltiples conjuntos de nivel 1 almacenados en discos físicos con un nivel 0 encima. agrupando los anteriores niveles 1. Un RAID 0+1 (también llamado RAID 01.

a veces llamado RAID 10. el restante pasa a ser un punto único de fallo para todo el conjunto. Sin embargo. se necesita que todos los discos del conjunto participen en la reconstrucción de los datos. no pudiendo tolerar dos fallos simultáneos de discos salvo que sean en la misma división. Son los más habituales por las empresas. Es decir. es obligatorio añadir otro al de la otra división para equilibrar el tamaño del conjunto. si un disco que ha fallado no se reemplaza. las tecnologías de corrección de errores de bit no han sido capaces de mantener el ritmo de rápido incremento de las capacidades de los discos. muchos entornos empresariales críticos están empezando a evaluar configuraciones RAID más tolerantes a fallos que añaden un mecani mo de paridad s subyacente. Con la cada vez mayor capacidad de las unidades de discos (liderada por las unidades serial ATA). Entre los más prometedores están los enfoques híbridos como el RAID 0+1+5 (espejo sobre paridad única) o RAID 0+1+6 (espejo sobre paridad dual). la otra división se convierte en un punto de fallo único. Un RAID 1+0. el RAID 0+1 no es tan robusto como un RAID 1+0. cuando un disco falla. provocando un mayor riesgo de hallar errores físicos irrecuperables. el riesgo de fallo de los discos es cada vez mayor. Como en el caso del RAID 0+1. es parecido a un RAID 0+1 con la excepción de que los niveles RAID que lo forman se invierte: el RAID 10 es una división de espejos. añadir un disco duro adicional en una división. Si ese disco falla entonces. cuando se sustituye el disco que falló.para reconstruir el conjunto global. [editar] RAID 1+0 Diagrama de una configuración RAID 10. si los discos que han fallado no se reemplazan. Dados estos cada vez mayores riesgos del RAID 0+1 (y su vulnerabilidad ante los fallos dobles simultáneos). . se perderán todos los datos del conjunto completo. Además. En cada división RAID 1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Además. entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultaría en pérdida de datos. Además. Sin embargo.

si a lguno de ellos falla se perderán todos los datos del conjunto. En otras palabras. El RAID 10 es a menudo la mejor elección para bases de datos de altas prestaciones. El tamaño de cada bloque se decide en el momento de construir el RAID. Entre los más prometedores está los enfoques n híbridos como el RAID 0+1+5 (espejo sobre paridad única) o RAID 0+1+6 (espejo sobre paridad dual). que a su vez lo divide en trozos aún menores. donde se almacena la información de paridad.. debido a que la ausencia de cálculos de paridad proporciona mayor velocidad de escritura. El RAID 30 trocea los datos en bloque más pequeños y los divide en cada conjunto RAID 3.Debido a estos mayores riesgos del RAID 1+0.. El tiempo de recuperación necesario (detectar y responder al fallo del disco y reconstruir el conjunto sobre el disco nuevo) representa un periodo de vulnerabilidad para el RAID. El RAID 30 permite que falle un disco de cada conjunto RAID 3. La mejor forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. muchos entornos empresariales críticos están empezando a evaluar configuraciones RAID más tolerantes a fallos que añaden un mecanismo de paridad subyacente. El RAID 30 proporciona tasas de transferencia elevadas combinadas con una alta fiabilidad a cambio de un coste de implementación muy alto.Etc. Hasta que estos discos que fallaron sean reemplazados. El RAID 30 o división con conjunto de paridad dedicado es una combinación de un RAID 3 y un RAID 0. [editar] RAID 100 . [editar] RAID 30 Diagrama de una configuración RAID 30. calcula la paridad aplicando un XOR a cada uno y los escriben en todos los discos del conjunto salvo en uno. los otros discos de cada conjunto que sufrió el fallo son puntos únicos de fallo para el conjunto RAID 30 completo.

El tiempo necesario para recuperar (detectar y responder . a veces llamado también RAID 5+0. El RAID 100 es un ejemplo de «RAID cuadriculado». todos los datos del conjunto global se pierden. el disco restante de un RAID 1 se convierte así en un punto único d fallo para e el conjunto degradado. Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos.RAID 100.. Sin embargo. si el disco que falla no se reemplaza. donde el conjunto software subyacente limita la cantidad de discos físicos permitidos en cada conjunto estándar. [editar] RAID 50 RAID 50. Un RAID 100. Algunos vendedores llaman a este nivel más alto un MetaLun o Soft Stripe. Un RAID 50. combina la división a nivel de bloques de un RAID 0 con la paridad distribuida de un RAID 5. Todos los discos menos unos podrían fallar en cada RAID 1 sin perder datos. los discos restantes de dicho conjunto se convierten en un punto único de fallo para todo el conjunto. siendo pues un conjunto RAID 0 dividido de elementos RAID 5. el RAID 100 es a menudo la mejor elección para bases de datos muy grandes. A menudo el nivel superior de división se hace por software. Sin embargo. es una división de conjuntos RAID 10. a veces llamado también RAID 10+0. un RAID en el que conjuntos divididos son a su vez divididos conjuntamente de nuevo. Si uno falla. Implementar niveles RAID anidados permite eliminar virtualmente el límite de unidades físicas en un único volumen lógico. Por estas razones. Los principales beneficios de un RAID 100 (y de los RAID cuadriculados en general) sobre un único nivel RAID son mejor rendimiento para lecturas aleatorias y la mitigación de los puntos calientes de riesgo en el conjunto.

a veces implementada y conocida como paridad diagonal. y proporciona mejor tolerancia a fallos que un nivel RAID único. pero sólo puede tolerar un máximo de tres fallos potenciales de disco. es bastante fácil calcular la paridad contra múltiples grupos de bloques. el segundo conjunto no es otro conjunto de puntos calculado sobre un síndrome polinomial diferente para los mismos grupos de bloques de datos. [editar] Paridad doble Diagrama una configuración RAID de doble paridad. El RAID 50 mejora el rendimiento del RAID 5. especialmente en escritura. A medida que el número de unidades del conjunto RAID 50 crece y la capacidad de los discos aumenta. La configuración de los conjuntos RAID repercute sobre la tolerancia a fallos general. es común construir conjuntos RAID 5 de seis discos con un disco de reserva en línea (hot spare) que permite empezar de inmediato la reconstrucción en caso de fallo del conjunto. en lugar de sólo sobre los  . [editar] Niveles RAID propietarios Aunque todas las implementaciones de RAID difieren en algún grado de la especificación idealizada. Debido a que la fiabilidad del sistema depende del rápido reemplazo de los discos averiados para que el conjunto pueda reconstruirse. hay dos conjuntos de información de chequeo de paridad. Una adición frecuente a los niveles RAID existentes es la paridad doble. Esto no soluciona el problema de que el conjunto sufre un estrés máximo durante la reconstrucción dado que es necesario leer cada bit. Sin embargo. Este nivel se recomienda para aplicaciones que necesitan gran tolerancia a fallos. 3] Como en el RAID 6. pero a diferencia de aquél. el tiempo de recuperación lo hace también. sobre el gráfico tanto el RAID 5 como el RAID 6 calcularían la paridad sobre todos los bloques de la letra A para generar uno o dos bloques de paridad. capacidad y rendimiento de búsqueda aleatoria. algunas compañías han desarrollado implementaciones RAID completamente propietarias que difieren sustancialmente de todas las demás. Una configuración de tres conjuntos RAID 5 de siete discos cada uno tiene la mayor capacidad y eficiencia de almacenamiento.al fallo de disco y reconstruir el conjunto sobre el nuevo disco) representa un pe riodo de vulnerabilidad del conjunto RAID. justo cuando es más vulnerable. Por ejemplo. sino que se calcula la paridad extra a partir de un grupo diferente de bloques de datos. Una configuración de siete conjuntos RAID 5 de tres discos cada uno puede tolerar hasta siete fallos de disco pero tiene menor capacidad y eficiencia de almacenamiento.

De nuevo sobre el ejemplo. El bloque Q2 se calcularía como A2 xor B3 'xor P3. los datos se recuperan de ambos discos simultáneamente y la mayoría del trabajo se hace en hardware en lugar de en el controlador software.4 megas [editar] Matrix RAID . [editar] RAID 1. Cada volumen reside en un único disco físico. es posible reconstruir dos discos de datos que fallen mediante recuperación iterativa. Cuando se lee. Debido a que los bloques de paridad doble se distribuyen correctamente. Por ejemplo. EMC ofrece también actualmente un RAID 5 estándar para el Symmetrix DMX. luego A2 xor A3 xor P1 = A1.bloques de la letra A: puede calcularse la paridad sobre los bloques de la letra A y un grupo permutado de bloques. mientras el bloque Q3 se calcularía como A3 xor P2 xor C1 y el Q1 sería A1 xor B2 xor C3. EMC llamaba originalmente a esta característica RAID S y luego la rebautizó RAID de paridad (Parity RAID) para su plataforma Symmetrix DMX. y finalmente A1 xor C3 xor Q1 = B2. y se combinan arbitrariamente varios volúmenes para el cálculo de paridad.5 RAID 1. [editar] RAID S o RAID de paridad RAID S es un sistema RAID de paridad distribuida propietario de EMC Corporation usado en sus sistemas de almacenamiento Symmetrix. parece ser una implementación correcta de un RAID 1. No es recomendable que el sistema de paridad doble funcione en modo degradado debido a su bajo rendimiento.5 es un nivel RAID propietario de HighPoint a veces incorrectamente denominado RAID 15.se complementa de un tripocio de 3. que añade cachés a un RAID 3 o RAID 4 para mejorar el rendimiento. los bloques Q son los de la paridad doble. Por la poca información disponible. [editar] RAID 7 RAID 7 es una marca registrada de Storage Computer Corporation. B2 podría recuperarse sin usar ninguno de los bloque x1 ni x2 mediante el cálculo de B3 xor P3 xor Q2 = A2.

[editar] Linux MD RAID 10 RAID 10 . por ejemplo. 200 en raid 10 y 200 en raid 5. la mayoría de los otros productos RAID BIOS de gama baja sólo permiten que un disco participen en un único conjunto. El Matrix RAID utiliza dos o más discos físicos. No es un nuevo nivel RAID. asignando partes de idéntico tamaño de cada uno de ellos diferentes niveles de RAID.Diagrama una configuración Matriz RAID. Este producto está dirigido a los usuarios domésticos. etcétera. Actualmente. Así. Matri RAID (µmatriz RAID¶) es una característica que apareció por vez primera en la BIOS RAID Intel ICH6R. se pueden usar 200 en raid 0. proporcionando una zona segura (la sección RAID 1) para documentos y otros ficheros que se desean almacenar redundantemente y una zona más rápida (la sección RAID 0) pa el sistema operativo. sobre 4 discos de un total de 600GB. ra aplicaciones.

5 y 6) además de otros usos no RAID como almacenamiento multirruta y LVM2. µdisco múltiple¶) puede ser usada para construir un conjunto RAID 1+0 clásico. 4. [editar] Posibilidades de RAID . lo que resulta posible gracias a que el sistema de ficheros conoce la estructura de almacenamiento subyacente ypuede gestionar el espacio adicional cuando lo necesita. En particular. pero también permite un único nivel RAID 10 con algunas extensiones interesantes. [editar] IBM ServeRAID 1E Diagrama una configuración RAID 1E. 1. de multiple disk. Evidentemente esto equivale a la configuración RAID 10 estándar. Esta configuración es tolerante a fallos de unidades no adyacentes. Linux también permite crear otras configuraciones RAID usando la controladoramd (niveles 0. Esto se hace repitiendo cada bloque k veces al escribirlo en un conjunto RAID 0 subyacente de n unidades. soporta un espejado de k bloques en n unidades cuando k no es divisible por n. como se ilustra en el gráfico. [editar] RAID Z El sistema de ficheros ZFS de Sun Microsystems implementa un esquema de redundancia integrado parecido al RAID 5 que se denomina RAID Z. Esta configuración evita el «agujero de escritura» del RAID 5 1] y la necesidad de la secuencia leer-modificar-escribir para operaciones de escrituras pequeñas efe ctuando sólo escrituras de divisiones (stripes) completas. La serie de adaptadores IBM ServeRAID soportan un espejado doble de un número arbitrario de discos. Otros sistemas de almacenamiento como el StorEdge T3 de Sun soportan también este modo.La controladora RAID software del kernel de Linux (llamada md. espejando los bloques pequeños en lugar de protegerlos con el cálculo de paridad.

si se usa un RAID 1 o un RAID basado en división con un tamaño de bloque lo suficientemente grande se logran mejoras de rendimiento para patrones de acceso que implique múltiples lecturas simultáneas (por ejemplo. También es útil para las operaciones de copia de respaldo de disco a disco. RAID puede mejorar el rendimiento de ciertas aplicaciones. ya que el tiempo de no disponibilidad suele tener graves repercusiones. que éstos se corrompan. Si estas herramientas no los soportan. La división de discos de un RAID 0 mejora el rendimiento de transferencia lineal pero no lo demás. Además. lo que supone un punto único de fallo al ser vulnerable a una amplia variedad de riesgos aparte del fallo físico de disco. un RAID permite que los datos se recuperen en un disco de reemplazo a partir de los restantes discos del conjunto. lo que permite que varios discos atiendan simultáneamente las operaciones de lectura lineales. lo que hace que la mayoría de las aplicaciones de escritorio y juegos no muestren mejora alguna. que requerirían varios DVD o cintas para las copias de seguridad. RAID no mejora el rendimiento de todas las aplicaciones. que sufran la modificación o borrado accidental por parte del usuario ni que un fallo físico en otro componente del sistema afecten a los datos. RAID no impedirá que un virus destruya los datos. 5 y 6 usan variantes de división (striping) de datos. los datos serán inaccesibles para ellas. La mayoría de aplicaciones de escritorio y videojuegos hacen énfasis en la estrategia de buffering y los tiempos de búsqueda de los discos. al ser la mayoría de los ficheros a los que se accede muy pequeños. por lo que RAID no evita la pérdida de datos por estas causas. salvo excepciones. mientras al mismo tiempo permanece disponible para los usuarios en un modo degradado. Para estos . Una mayor tasa de transferencia sostenida supone poco beneficio para los usuarios de estas aplicaciones. Los niveles RAID 0. Para usuarios domésticos. se benefician de esta mejora. aumentando la tasa de transferencia sostenida. éste es accesible normalmente mediante un controlador ATA o SCSI incluido en la mayoría de los sistemas operativos. bases de datos multiusuario). [editar] Lo que RAID no puede hacer y y y RAID no protege los datos. Esto es muy valorado por las empresas. En lugar de exigir que se realice una restauración costosa en tiempo desde una cinta.[editar] Lo que RAID puede hacer y y RAID puede mejorar el uptime. Las herramientas de recuperación que trabajan con discos simples en controladoras genéricas necesitarán controladores especiales para acceder a los datos de los conjuntos RAID. como el 50) permiten que un disco falle mecánicamente y que aun así los datos del conjunto sigan siendo accesibles para los usuarios. Los niveles RAID 1. DVD o algún otro medio de respaldo lento. Cuando se trabaja con un solo disco. 5 y 6 (sus variantes. Un conjunto RAID tiene un sistema de ficheros. puede permitir el ahorro del tiempo de restauración de volúmenes grandes. 0+1 o 10. Sin embargo. las controladoras RAID necesitan controladores software específicos. Esto resulta especialmente cierto en las configuraciones típicas de escritorio. como la edición de vídeo e imágenes. Las aplicaciones de escritorio que trabajan con ficheros grandes. RAID no simplifica la recuperación de un desastre.

que a su vez añaden otras diferentes (especialmente relacionadas con el rendimiento). Con un RAID no es tan sencillo: la BIOS RAID debe ser capaz de leer los metadatos de los miembros del conjunto para reconocerlo adecuadamente y hacerlo disponible al sistema operativo. lo mejor es comprar un disco más grande. rápido y caro en lugar de dos discos más lentos y pequeños en una configuración RAID 0. es relativamente fácil trasladar el disco a un sistema nuevo: basta con conectarlo. RAID no facilita el traslado a un sistema nuevo. Esta limitación puede obviarse con el uso de RAID por software. por lo que suele ser necesario mover también la controladora.y usos. Esto resulta imposible en aquellos sistemas donde está integrada en la placa base. . Dado que los distintos fabricantes de controladoras RAID usan diferentes formatos de metadatos (incluso controladoras de un mismo fabricante son incompatibles si corresponden a series diferentes) es virtualmente imposible mover un conjunto RAID a una controladora diferente. si cuenta con la misma interfaz. Cuando se usa un solo disco.