- 2 –
Opções válidas
Uma alternativa mais acessível em custos são os equipamentos classificados comode alta disponibilidade (High Availability), que diferem dos tolerantes a falhas emdisponibilidade, visto que ela é desenhada e implementada somente nos elementoscom mais probabilidade de causarem erro, como os discos, por exemplo. Essesequipamentos não são totalmente espelhados, mas o risco de apresentar falha éextremamente pequeno.O índice de uptime (tempo em que todo sistema permanece ativo ou disponível) deum sistema de alta disponibilidade fica na faixa de 99,9% a 99,99%, enquanto queos tolerantes a falha apresentam uptime da ordem de 99,999%. A avaliação dedisponibilidade também deve incluir a redundância de nós, interconexões,controladoras e proteção de falha de energia (nobreaks e geradores). Também deveser considerada a redistribuição de carga depois da falha de um nó e a habilidade detodo o sistema operar durante paralisações planejadas ou não.Outra opção disponível para as empresas é a adoção da tecnologia de cluster quepressupõe a aquisição de outro equipamento, não necessariamente igual aoexistente e que não precise ficar em stand by, mas executando outras funções, e quepode assumir a operação caso o outro equipamento apresente falha. (Iremosabordar a tecnologia cluster com mais detalhes no decorrer do curso). Essatecnologia propicia melhorias significativas no ambiente computacional da empresa,tanto em capacidade, quanto em disponibilidade.Cada nó ou servidor adicional fornece uma escalabilidade quase linear dentro de umsistema em cluster. O mais importante é a capacidade de previsão dessaescalabilidade em relação à capacidade e ao custo, simplificando as operações e asatividades de planejamento. Não apenas o hardware deve ser redundante(duplicado), mas também o software, os aplicativos, o banco de dados e osprotocolos.
A infra-estrutura de TI adequada
Por mais qualidade que se imponha aos equipamentos e por maior que seja arobustez aplicada ao software básico ou à qualidade na metodologia dedesenvolvimento de aplicativos, os sistemas falham. Uma pesquisa realizada peloGartner Group revelou que, em média, 40% dos casos de paralisação nas operaçõesdas empresas (também chamado de downtime) são causados por falhas emaplicações (questões de desempenho ou bugs), 40% por erros de operação e cercade 20% por falhas em sistemas. No caso dos sistemas, 60% das falhas são causadaspor problemas com hardware e menos de 5% dos danos se devem a desastres. Ofator humano também é preponderante no que se refere a falhas, indo desde umsimples tropeço no fio em que está ligada a máquina à fonte de energia, até umcomando errado.