You are on page 1of 4

RAID Redundant Array of Independent Disks. Em portugus "Matriz Redundante de Discos Independentes.

O RAID envolve a combinao de duas ou mais unidades de discos juntas para melhorar o desempenho e a tolerncia a falhas de um HD. A combinao de duas ou mais unidades juntas tambm oferece um melhor e maior tamanho de volume de dados e a acelerao de carregamento de arquivos. O RAID distribui os dados entre vrios discos e considera esta matriz como um nico disco. O RAID foi proposto em 1988 por David A. Patterson, Garth A. Gibson e Randy H. Katz na publicao Um caso para conjuntos de Discos Redundantes Econmicos (RAID). (SIGMOD 1988: pp. 109-16) Implementao via software A implementao via software, o sistema operacional gerencia o RAID atravs da controladora de discos, sem a necessidade de um controlador de RAIDs, tornando-a mais Barata. Nesse tipo de implementao, todo o processamento necessrio para o gerenciamento do RAID feito pela CPU. Toda movimentao de dados (leitura e escrita) feita por uma camada de software que faz a abstrao entre a operao lgica (RAID) e os discos fsicos, e controlada pelo sistema operacional. A configurao do RAID via software feita pelo sistema operacional, que precisa ter implementado no prprio ncleo a utilizao de RAIDs via software. possvel criar RAIDs via software no Mac OS X, Linux, FreeBSD e no Windows (verso server). Alternativamente, podem ser criados com algum software especialmente dedicado a manuteno de discos rgidos do fabricante da placa me (quando h suporte para RAID).

Nveis de RAID As diferentes maneiras de combinar os discos em um s, chamados de nveis de RAID, podem fornecer tanto grande eficincia de armazenamento como simples espelhamento, ou podem alterar o desempenho de latncia (tempo de acesso). Podem tambm fornecer desempenho da taxa de transferncia de dados para leitura e para escrita, enquanto continuam mantendo a redundncia. Novamente, isto ideal para prevenir falhas. Os diferentes nveis de RAID apresentam diferentes desempenho, redundncia, capacidade de armazenamento, confiabilidade e caractersticas de custo. A maioria, mas nem todos os nveis de RAID, oferece redundncia falha de disco. Dos que oferecem redundncia, RAID-1 e RAID-5 so os mais populares. RAID-1 oferece melhor desempenho, enquanto que RAID-5 fornece um uso mais eficiente do espao disponvel para o armazenamento dos dados. De qualquer modo, o ajuste de desempenho um assunto totalmente diferente. Ele depende de uma grande variedade de fatores, como o tipo da aplicao, os tamanhos dos discos, blocos e arquivos. Existe uma variedade de tipos diferentes e implementaes de RAID, cada uma com suas vantagens e desvantagens. Por exemplo, para colocarmos uma cpia dos mesmos dados em dois discos (operao chamada de espelhamento de disco ou RAID nvel 1), podemos

acrescentar desempenho de leitura, lendo alternadamente cada disco do espelho. Em mdia, cada disco menos usado, por estar sendo usado em apenas metade da leitura (para dois discos), ou um tero (para 3 discos), etc. Alm disso, um espelho pode melhorar a confiabilidade: se um disco falhar, o(s) outro(s) disco(s) tm uma cpia dos dados. RAID 0 Striping sem tolerncia falha

Este nvel tem o nome de striping. Os dados do computador so divididos entre dois ou mais discos rgidos, o que oferece uma alta performance de transferncia de dados, porm no oferece segurana de dados, pois caso haja alguma pane em um disco rgido, todo o contedo gravado neles ir ser perdido. O RAID 0 pode ser usado para se ter uma alta performance, porm no indicado para sistemas que necessitam de segurana de dados. possvel usar de dois a quatro discos rgidos em RAID 0, onde os mesmos sero acessados como se fosse um nico disco, aumentando radicalmente o desempenho do acesso aos HDs. Os dados gravados so divididos em partes e so gravados por todos os discos. Na hora de ler, os discos so acessados ao mesmo tempo. Na prtica, temos um aumento de desempenho de cerca de 98% usando dois discos, 180% usando 3 discos e algo prximo a 250% usando 4 discos. As capacidades dos discos so somadas. Usando 4 discos de 10 GB, por exemplo, voc passar a ter um grande disco de 40 GB. Este modo o melhor do ponto de vista do desempenho, mas ruim do ponto de vista da segurana e da confiabilidade, pois como os dados so divididos entre os discos, caso apenas um disco falhe, voc perder os dados gravados em todos os discos. importante citar que neste nvel voc deve usar discos rgidos idnticos. at possvel usar discos de diferentes capacidades, mas o desempenho ficar limitado ao desempenho do disco mais lento.

RAID 1 (mirror e duplexing) O RAID 1 tambm conhecido como espelhamento, ou seja, os dados do computador so divididos e gravados em dois ou mais discos ao mesmo tempo, oferecendo, portanto, uma redundncia dos dados com segurana contra falha em disco. Esse nvel de RAID tende a ter uma demora maior na gravao de dados nos discos, pelo fato da replicao ocorrer entre os dois discos instalados, mais sua leitura ser mais rpida, pois o sistema ter duas pontes de procura para achar os arquivos requeridos. Neste nvel so utilizados dois discos, sendo que o segundo ter uma cpia idntica do primeiro, ou seja, um CLONE. Na prtica, ser como se existisse apenas um nico disco rgido instalado, pois o segundo seria usado para espelhamento dos dados gravados no primeiro - mas caso o disco principal falhe por qualquer motivo, voc ter uma cpia de segurana armazenada no segundo disco. Este o modo ideal se voc deseja aumentar a confiabilidade e a segurana do sistema.

RAID-2 e RAID-3 O RAID 2 e 3 raramente so usados, e em algum momento ficaram obsoletos pelas novas tecnologias de disco. RAID-2 similar ao RAID-4, mas armazena informao ECC (error correcting code), que a informao de controle de erros, no lugar da paridade. Este fato possibilitou uma pequena proteo adicional, visto que todas as unidades de disco mais novas incorporaram ECC internamente.

RAID-2 pode oferecer maior consistncia dos dados se houver queda de energia durante a escrita. Baterias de segurana e um desligamento correto, porm, podem oferecer os mesmos benefcios. RAID-3 similar ao RAID-4, exceto pelo fato de que ele usa o menor tamanho possvel para a stripe. Como resultado, qualquer pedido de leitura invocar todos os discos, tornando as requisies de sobreposio de I/0 difceis ou impossveis. A fim de evitar o atraso em razo da latncia rotacional, o RAID-3 exige que todos os eixos das unidades de disco estejam sincronizados. A maioria das unidades de disco mais recentes no possuem a habilidade de sincronizao do eixo, ou se so capazes disto, faltam os conectores necessrios, cabos e documentao do fabricante. Nem RAID-2 e nem RAID-3 so suportados pelos drivers de RAID por software no Linux. RAID-4 Este um tipo de arranjo segmentado, mas incorpora um mtodo de proteo de dados mais prtico. Ele usa informaes sobre paridade para a recuperao de dados e as armazena em disco dedicado. Os discos restantes, usados para dados, so configurados para usarem grandes (tamanho medido em blocos) segmentos de dados, suficientemente grandes para acomodar um registro inteiro. Isto permite leituras independentes da informao armazenada, fazendo de RAID-4 um arranjo perfeitamente ajustado para ambientes transacionais que requerem muitas leituras pequenas e simultneas. Arranjos RAID-4 e outros arranjos que utilizam paridade fazem uso de um processo de recuperao de dados mais envolvente que arranjos espelhados, como RAID-1. A funo ou exclusivo (XOR) dos dados e informaes sobre paridade dos discos restantes computada para reconstruir os dados do disco que falhou. Pelo fato de que todos os dados sobre paridade so escritos em um nico disco, esse disco funciona como um gargalo durante as operaes de escrita, reduzindo o desempenho durante estas operaes write bottleneck.

Sempre que os dados so escritos no arranjo, informaes sobre paridade normalmente so lidas do disco de paridade e uma nova informao sobre paridade deve sempre ser escrita para o disco de paridade antes da prxima requisio de escrita ser realizada. Por causa dessas duas operaes de E/S, o disco de paridade o fator limitante do desempenho total do arranjo. Pelo fato do disco de paridade requerer somente um disco

adicional para proteo de dados, arranjos RAID-4 so mais baratos que arranjos RAID1. RAID-5 Este tipo de RAID largamente usado funciona similarmente ao RAID 4, mas supera alguns dos problemas mais comuns sofridos por esse tipo. As informaes sobre paridade para os dados do arranjo so distribudas ao longo de todos os discos do arranjo, em vez de serem armazenadas em um disco dedicado. Essa idia de paridade distribuda reduz o gargalo de escrita (write bottleneck), que era o nico disco de um RAID-4, porque agora as escritas concorrentes nem sempre requerem acesso s informaes sobre paridade em um disco dedicado. Contudo, o desempenho de escrita geral ainda sofre por causa do processamento adicional causado pela leitura, reclculo e atualizao da informao sobre paridade.

Para aumentar o desempenho de leitura de um arranjo RAID-5, o tamanho de cada segmento em que os dados so divididos pode ser otimizado para a aplicao que estiver usando o arranjo. O desempenho geral de um arranjo RAID-5 equivalente ao de um RAID-4, exceto no caso de leituras seqenciais, que reduzem a eficincia dos algoritmos de leitura por causa da distribuio das informaes sobre paridade. Como em outros arranjos baseados em paridade, a recuperao de dados em um arranjo RAID-5 feita calculando a funo XOR das informaes dos discos restantes do arranjo. Pelo fato de a informao sobre paridade ser distribuda ao longo de todos os discos, a perda de qualquer disco reduz a disponibilidade de ambos os dados e da informao sobre paridade, at a recuperao do disco que