Atendimento por WhatsApp

O que é Alta disponibilidade ou High Availability

Sistema de alta disponibilidade (em inglês HA ou High-Availability) é uma solução resistente a falhas. Principalmente aplicado a equipamentos de informática e datacenters, esses sistemas são soluções que possuem redundância contra falhas de hardware, software, energia, localização e operação.

Como toda solução sujeita a falhas pode causar verdadeiras catástrofes, garantir a disponibilidade de serviços por tempo integral (24x7) através de sistemas de informação tolerantes a falha é cada vez mais necessário para a continuidade de negócios.

Alta disponibilidade ou High Availability com uma imagem gráfica demonstrando um servidor com falha de acesso aos dados e o outro apresentando em pleno funcionamento

Servidores e storages de alta disponibilidade

Servidores e sistemas de armazenamento de dados (storages) de grandes empresas como bancos, hospitais e órgãos públicos não podem parar, perder informações ou ter interrupções em seus serviços.

Para garantir a ausência total de interrupções desses e de outros serviços geralmente é necessário alocar hardware, software e outros recursos de forma sobressalente (redundante), bem como mantê-los prontos para entrar em funcionamento de forma automática quando algum desses componentes falhar.

Dentre as principais causas de falhas estão os componentes mecânicos que integram essas soluções, como hard disks e/ou placas lógicas de sistemas computacionais e unidades de armazenamento.

Conheça a linha de storages enterprise Infortrend

Como qualquer hardware está sujeito a falhas, seja por fim da vida útil ou por falha de funcionamento, manter ambientes de missão crítica sem nenhum tipo de redundância é muito arriscado.

Assim, quanto maior for a redundância da solução, menor será a probabilidade de interrupções nos serviços prestados e, consequentemente, maior a satisfação dos usuários envolvidos.

Até pouco tempo atrás, tais sistemas exigiam investimentos impensáveis para a maioria das empresas, porém com a constante evolução da tecnologia e redução de custos, surgiram uma série de soluções alternativas, melhorando assim o nível de prestação de serviços como um todo.

Dúvidas? Fale com nosso especialista!

Os níveis de alta disponibilidade

A alta disponibilidade sempre está associada à sistemas tolerantes a falhas, redundância de infraestrutura e componentes, maior segurança e maiores investimentos.

Devido ao custo, implementar todas as soluções necessárias contra falhas em uma pequena ou média empresa nem sempre é possível. Assim, o termo de tolerância a falhas foi subdividida em quatro níveis, onde cada um possui seus benefícios e desafios:

1. Nível Um: Todos os componentes são configurados de forma redundante e não há um único ponto de falha. Este é o sistema mais caro e difícil de alcançar, mas também é o mais confiável.

2. Nível Dois: Um sistema de replicação em tempo real e backup é instalado fora da unidade de negócios. Em caso de falha do sistema primário, o segundo assume as operações. Este nível é mais barato e fácil de implementar do que o anterior, mas não é tão confiável.

3. Nível Três: Um sistema em cluster é usado para que, se um servidor falhar, outro possa assumir sua carga de trabalho. Este nível é mais barato que os anteriores, mas pode ser complexo de configurar e não ser tão confiável quanto os outros níveis.

4. Nível Quatro: Storages ou servidores com controladoras do tipo "ativo-ativo" são usados para que o sistema principal esteja sempre disponível, onde a controladora ou unidade secundária assume a carga de trabalho quando o sistema principal falhar. Este nível é o mais barato e fácil de configurar, mas também o menos confiável.

Storage Qnap na parte frontal com 12 baias e parte traseira com conexões redundantes

O surgimento dos clusters

Clusters são sistemas computacionais construídos através da agregação de módulos de hardware semelhante, que são altamente escaláveis e de custo acessível.

Esse conceito está diretamente relacionado aos sistemas de alta disponibilidade que permitem agregar vários computadores, servidores ou storages como se fossem uma única máquina de grande porte.

Imagem demonstrativa do Sistema de alta disponibilidade Dual-node

Como se pode observar na imagem, não existe um único ponto nesta arquitetura que, ao falhar, implique em indisponibilidade de outro ponto qualquer.

A abreviação SPOF (Single Point Of Failure) é o termo que identifica a busca incessante da vulnerabilidade de um sistema computacional através de testes para localizar e corrigir possíveis pontos de falha.

Geralmente, quanto maior a disponibilidade, maior é a redundância e o custo das soluções. Isso porque, a alta disponibilidade pode ser implementada em níveis, dependendo do tipo de serviço que se pretende disponibilizar.

Por exemplo, soluções HA funcionando em grandes bancos ou UTIs de hospitais possuem níveis diferentes de disponibilidade quando comparados, por exemplo, a empresas de call-center.

O nível de tolerância a falhas depende da atividade que se pretende exercer e dos custos envolvidos, pois as consequências também serão diferentes caso o sistema sofra falhas.

No entanto, empresas que trabalham em horário comercial e não possuem ambientes de missão crítica, podem eventualmente considerar que 90% de disponibilidade são suficientes.

Os sistemas tolerantes à falha estão mais acessíveis

É importante salientar que soluções antes integravam apenas ambientes de maior disponibilidade como arranjos de discos tolerantes a falha (RAID) ou equipamentos com controladoras redundantes estão cada vez mais acessíveis para a maioria da empresas.

Empresas como a Infortrend já possuem em seu portfólio soluções de armazenamento como storages NAS HA, com recursos de replicação em tempo real e controle de funcionamento (conexão heartbeat), proporcionando alta disponibilidade de armazenamento a custos que qualquer empresa pode pagar.

Conheça a linha de storages Infortrend

Tolerância a falhas

A tolerância a falhas consiste, basicamente, em ter hardware e software redundante(s) que entra(m) em funcionamento automaticamente após qualquer detecção de falha no sistema principal.

Sistemas tolerantes a falhas não permitem que serviços sejam interrompidos, porém custam significativamente mais caro que os de alta disponibilidade.

Independentemente da solução adotada, é possível mensurar o grau de disponibilidade de um sistema resistente a falhas através do MTBF - Mean Time Between Failures (tempo médio entre falhas) e do MTTR - Mean Time To Repair (tempo médio de recuperação), que é o tempo médio calculado entre o início do evento (ocorrência da falha) e a recuperação total do sistema.

Assim, o nível de disponibilidade de um sistema pode ser calculado pela fórmula:

Disponibilidade = MTBF / (MTBF + MTTR)

Alta disponibilidade

A alta disponibilidade (HA) é a característica mensurável que garante que um sistema mantenha um nível de desempenho operacional elevado, normalmente baseando-se no tempo de atividade, que é usualmente superior ao oferecido por outras soluções.

Com o nível de concorrência aumentando ano após ano, empresas de diversas áreas tem desenvolvido produtos cada vez mais robustos, bem como melhorado sensivelmente os níveis de SLA (service level agreement), otimizando assim a entrega de soluções e serviços em diversas áreas de negócios.

Conheça a linha de storages all flash Seagate

Mesmo em pequenas e médias empresas já é possível encontrar sistemas de armazenamento robustos funcionando, mantendo suas operações sempre online e com sistemas de contingência bem definidos, como planos de backup corporativos sempre atualizados.

Como a percepção de disponibilidade refere-se à capacidade dos usuários de obter serviços ou bens como acessar um sistema para enviar, atualizar, visualizar ou alterar algum tipo de informação, caso algum usuário não consiga acessar o sistema, o mesmo estará, do ponto de vista do usuário, indisponível.

O termo "downtime" corresponde ao tempo de inatividade de um sistema e é usado para se referir a períodos em que o mesmo não está disponível.

Fale com o especialista
(11) 3475-5000
Produtos relacionados:

Tecnologias

Tudo o que você precisa saber sobre soluções de Tecnologias.

RAID ou Disk Array: Conheça os tipos de Arranjos de Discos
RAID ou Disk Array: Conheça os tipos de Arranjos de Discos

Por que montar um arranjo de discos RAID? Saiba mais porque discos trabalhando em conjunto podem ajudar sua empresa ou residência.

7 erros mais comuns ao comprar um sistema de armazenamento
7 erros mais comuns ao comprar um sistema de armazenamento

Saiba como evitar os erros mais comuns antes de adquirir um servidor ou storage. Confira aqui algumas dicas para facilitar esse processo de compras.

Qual storage comprar, NAS ou DAS?
Qual storage comprar, NAS ou DAS?

Saiba quais são as principais diferenças entre os sistemas de armazenamento NAS ou DAS e escolha qual atende suas necessidades.