RAID, arranjos de discos para trabalho em conjunto
Em um mundo impulsionado por sistemas computacionais e análise de dados, a segurança e o desempenho dos servidores e dispositivos de armazenamento é vital para todas as atividades.
Contudo, a ausência de redundância nesses sistemas apresenta riscos substanciais, que podem ter consequências significativas para o desempenho, a segurança e a continuidade dos negócios.
Como acidentes acontecem, a melhor forma de proteger aplicações e arquivos contra imprevistos e utilizar recursos tecnológicos que entregam mais proteção aos dados armazenados.
Nesse contexto, os arranjos RAID são ótimas ferramentas para aumentar o desempenho e proteger as aplicações e dados armazenados em servidores, storages e computadores.
O que é RAID?
RAID (Redundant Array of Independent Disks) é a tecnologia que agrupa dois ou mais hard drives e/ou SSDs para trabalho conjunto. Traduzido como “arranjo redundante de discos independentes”, esse tipo de sistema é usado em unidades de armazenamento que equipam servidores, storages e computadores.
Montar arranjos de discos tem como principais objetivos aprimorar a segurança de um dispositivo de armazenamento bem como aumentar o desempenho no acesso aos dados armazenados em sistemas computacionais.
Enquanto algumas matrizes de armazenamento utilizam recursos como o striping ou paridade para entregar mais velocidade de I/O e proteção aos dados, uma matriz JBOD associa todos os discos para que trabalhem como se fossem um único volume.
Vários tipos de arranjos RAID
Existem vários tipos de arranjos de discos, onde cada matriz oferece diferentes possibilidades para otimizar o desempenho, a confiabilidade e a capacidade de armazenamento de servidores, computadores e storages.
Cada tipo de aplicação ou serviço executado em um ambiente computacional exige a montagem de um arranjo de disco apropriado, de acordo com os requisitos mínimos de hardware e software disponíveis.
Variáveis importantes como tempo de resposta do sistema, custo de implementação e o tipo de cada aplicação são apenas alguns dos pontos a serem analisados antes da escolha do “melhor RAID” para cada tipo de aplicação.
Alguns níveis de arranjo, ao gravar dados, fazem a distribuição dos dados entre os módulos de armazenamento que compõe o sistema, enquanto outros simplesmente duplicam as informações gravadas em duas áreas físicas distintas do equipamento.
Os arranjos de disco mais modernos fragmentam a gravação das informações e adicionam bits de paridade aos dados gravados, permitindo que, caso um dos hard disks ou módulos SSD do sistema falhe, os dados possam ser reconstruídos.
Implementação via hardware ou software
Implementação via software
Os arranjos de disco podem ser criados e gerenciados em servidores, computadores e sistemas de armazenamento através de softwares específicos ou usando um hardware próprio (controladora) para esse fim.
Nas implementações via software, quem monta e gerencia a matriz de armazenamento é o sistema operacional, utilizando a CPU do sistema para a fazer distribuição, gravação, leitura e acesso aos dados.
As implementações via software são mais baratas, pois não exigem uma controladora específica para esse fim, porém torna o sistema mais lento e menos seguro.
Implementação via hardware
Qualquer implementação de disk array via hardware exige uma controladora de discos própria. Essas controladoras possuem vantagens sobre matrizes baseadas em software.
Elas liberam o uso da CPU do servidor ou storage e possuem geralmente cache, tornando o sistema mais rápido e seguro contra a perda de dados.
Qualquer que seja a escolha, para que um arranjo de disco funcione bem, sempre é desejável utilizar discos rígidos de mesma capacidade, fabricante, tecnologia e velocidade.
Tipos de arranjos de discos mais utilizados
Por serem idealizados para atender aplicações distintas, cada tipo de matriz de armazenamento possui prós e contras a serem considerados.
Abaixo faremos uma breve explicação sobre os arranjos de discos mais comuns e suas respectivas características, mencionando as vantagens e desvantagens de cada implementação.
RAID 0
Esse arranjo de discos utiliza dois ou mais discos rígidos com finalidade da maximização do desempenho ao armazenar e acessar informações.
A técnica também é conhecida como "Stripping Array" ou fracionamento e é considerada o disk array mais rápido, porém o menos seguro.
A lógica desse tipo de arranjo consiste em distribuir os dados a serem armazenados no sistema de armazenamento, gravando a informação particionada em diversos hard disks de forma simultânea.
Dessa forma, a gravação (ou leitura) dos arquivos utiliza todos os discos do arranjo, sem necessidade de nenhum cálculo para geração de paridade.
Apesar do alto desempenho conseguido com o trabalho de poucos HDs, esse nível de arranjo perde em questões de segurança, não proporcionando nenhuma tolerância à falhas.
Caso apenas um dos HDs apresente problemas, todos os dados do sistema estarão comprometidos.
Mais sobre o RAID 0
RAID 1
Também conhecido como disk mirror, replicação ou espelhamento, o arranjo RAID 1 é ideal para pequenas empresas e residências, sendo implementado com apenas dois hard disks.
Escrevendo as informações de forma simultânea nas duas unidades de disco, esse sistema faz uma cópia dos aplicativos e dados em tempo real, sem a intervenção do usuário.
O inconveniente desse tipo de implementação é a redução de capacidade bruta, pois como as informações serão escritas integralmente duas vezes, somente a metade da capacidade total será disponibilizada pelo sistema.
Outro ponto negativo é que ao montar um arranjo com discos de capacidades diferentes, o sistema utilizará a capacidade do menor para dimensionar o tamanho máximo da matriz.
O principal atributo desse mecanismo é a segurança gerada para os dados armazenados, pois mesmo que um dos HDs falhe, as informações estarão seguras e online no outro disco, possibilitando assim que o disco defeituoso seja substituído ou o backup dos arquivos realizado sem que nada seja perdido.
Além disso, storages de última geração como os NAS Qnap possuem mecanismos de segurança adicional, como o envio de email ao usuário caso haja falha de disco.
Isso garante maior velocidade na assistência técnica e gera maior confiabilidade ao sistema, protegendo as informações armazenadas.
Mais sobre o RAID 1
RAID 2, 3 e 4
Esses três níveis de arranjos de disco deixaram de ser usados como matrizes de disco em sistemas computacionais devido sua baixa eficiência e dificuldades de implantação.
O RAID 2 é uma matriz de armazenamento que caiu em desuso e é semelhante ao RAID 0, porém com adição de algoritmos de controle e correção de erros.
Suas vantagens incluíam a proteção de dados e o aumento da velocidade de processamento, mas o sistema foi considerado obsoleto por não fazer o espelhamento ou possuir paridade de dados.
Assim como no RAID 0, esse tipo de arranjo fazia a distribuição de dados entre as unidades de armazenamento do sistema para privilegiar o desempenho, porém também abria mão de qualquer tipo de redundância para a proteção de dados.
Já o RAID 3 é um arranjo onde os dados são divididos em pequenos blocos que recebem bits adicionais (bits de paridade) em um novo disco, que é responsável por identificar e corrigir erros. Esse sistema registra toda a paridade em um único disco, e mostrou-se menos eficiente que os arranjos mais novos.
Outro nível de arranjo que também utilizava recursos de paridade para a reconstrução de dados era o RAID 4.
Semelhante a outros arranjos, os dados também são divididos entre os hard disks e podem ser reconstruídos por meio dos bits de paridade em um disco adicional. No entanto, esse sistema também foi aposentado devido sua complexidade para a recuperação de dados.
RAID 5
O modelo RAID 5 é conhecido como "Strip Set com paridade" e é a evolução dos mecanismos já apresentados.
O método é muito utilizado em servidores ou storages com pelo menos três discos rígidos instalados e cria uma camada de redundância, sacrificando parte da capacidade de armazenamento do sistema para proporcionar maior segurança das informações.
Nesse tipo de arranjo, bits de paridade são criados e acrescentados aos dados, escritos de forma alternada em todos os dispositivos de armazenamento disponíveis.
Caso um dos HDs falhe enquanto o sistema estiver funcionando, nenhum arquivo será perdido. A paridade é a segurança do sistema que possibilita a reconstrução dos arquivos sem perda de informação.
Ele é recomendado para aplicações utilizadas no dia a dia em pequenas e médias instalações (até 8 discos).
O espaço reservado para segurança dos dados nesse tipo de solução sempre será o equivalente a um disco do arranjo, independentemente da quantidade total, sendo que todos terão o mesmo espaço sacrificado. Por isso, quanto mais drives utilizados no array, menor será o desperdício.
Mais sobre o RAID 5
RAID 6
O RAID 6 é um arranjo de discos com características próximas ao RAID 5, mas acrescenta dupla paridade às informações gravadas.
Isso significa que nesse tipo de disk array até dois hard disks podem falhar sem que haja perda de dados, porém o dobro do espaço será utilizado para gravar a paridade e manter a redundância do sistema.
Assim, em servidores ou storages equipados com oito hard disks que precisarem de um arranjo desse tipo, a capacidade de armazenamento total liberada será equivalente ao valor de seis hard disks, pois os outros dois serão usados para manter a redundância de dados.
A medida que aumentarmos o número de HDs nesse arranjo, também minimizaremos o espaço proporcional sacrificado. Esse tipo de sistema pode ser implementado a partir de quatro discos e é usado em situações que demandam maior segurança para as informações armazenadas.
Mais sobre o RAID 6
RAID 10 ou 1+0
Nesse arranjo é feita a combinação de dois ou mais subgrupos de espelhamentos agrupados em uma única matriz. Para implementação de um arranjo RAID 10 são utilizados pelo menos 4 discos rígidos, onde são criadas combinações de dois ou mais grupos de HDs ou módulos SSD para escrita simultânea.
Sua principal característica é que ela une desempenho e segurança em um único agrupamento de discos. Além de oferecer um desempenho superior no momento da transferência dos dados, ela não compromete a integridade das informações caso ocorra algum problema em um dos HDs.
O maior inconveniente para usuários que fazem uso desse tipo de arranjo é o grande número de discos rígidos utilizados para segurança dos dados em relação aos demais, tornando-se economicamente inviável para algumas aplicações.
Mais sobre o RAID 10
Arranjos RAID 50 ou 5+0
Como no arranjo anterior, o RAID 50 (5+0) também combina duas configurações já conhecidas: pelo menos dois arranjos RAID 5 trabalhando em RAID 0.
Com a exigência mínima de dois subgrupos de três HDs, esse nível de arranjo possui um disco de paridade por subgrupo e garante que o sistema continue operante mesmo que dois hard disks falhem simultaneamente, desde que sejam de subgrupos distintos.
Utilizado em sistemas híbridos de armazenamento ou para aplicações que não possuem orçamento para montagem de estruturas de alta redundância, esse arranjo têm como ponto forte sua robustez contra falhas.
Mais sobre o RAID 50
Arranjos RAID 60 ou 6+0
Combinando dois arranjos já abordados, o RAID 60 (6+0) também é um arranjo híbrido que combina duas configurações de matriz de armazenamento em um único pool de discos.
Com exigência de pelo menos 8 hard disks e de dois subgrupos RAID 6 montados no mesmo pool, esse sistema mantém dupla paridade por subgrupo. Isso garante que o sistema continuará funcionando mesmo que quatro drives falhem simultaneamente, sem que haja perda de informações.
Mais sobre o RAID 60
Qual o melhor arranjo de disco para sua aplicação?
Variáveis como performance do equipamento, segurança pretendida e investimento a ser realizado são pontos importantes a serem considerados ao implementar um arranjo de discos.
Todos os níveis de arranjos acima são detalhados em páginas individuais, porém existem ainda outras formas de disk array que não foram abordadas como os arranjos RAID-Z, desenvolvidos pela empresa Sun Microsystems (Oracle).
Esses arranjos possuem um esquema de paridade específico e estão integrados ao sistema de arquivos ZFS. Existem três variações desse tipo de solução: Os arranjos do tipo Z1, Z2 e Z3.
O RAID-Z1 é semelhante ao RAID 5 no sentido de que oferece proteção contra a falha de um único disco, com a diferença de que evita o chamado "buraco de gravação", que é uma falha potencial durante a recuperação de uma matriz após falha de um disco.
Já o disk array montado no formato RAID-Z2 é muito similar ao RAID 6, ou seja, proporciona a proteção contra falhas de até dois hard disks ao mesmo tempo.
O último arranjo é RAID-Z3, exclusivo do sistema de arquivos ZFS, que adiciona um terceiro disco de paridade, permitindo assim a falha de até três discos sem nenhuma perda de dados.
Quer saber mais sobre o assunto? Traga seu projeto e tire suas dúvidas, somos especialistas em servidores, sistemas de armazenamento e soluções de backup.
Armazenamento de dados
Tudo o que você precisa saber sobre soluções de Armazenamento de dados.
NAS server - Um Sistema p/ o Armazenamento de Dados em Rede Seguro
NAS server é um sistema composto por computadores e/ou softwares voltados para armazenar e compartilhar dados em rede. Clique e saiba mais.
Alta disponibilidade chegou para as pequenas e médias empresas
Storages HA podem poupar grandes dores de cabeça futuras para continuidade de qualquer negócio.
NAS Doméstico - Saiba qual storage residencial comprar
Confira dicas de nossos especialistas sobre quais são os melhores storages para sua casa. Não corra riscos, seus dados são importantes.