You are on page 1of 8

República de Angola

Ministério da Educação
Complexo Escolar Baptista Da paz

Tema: Clusters

Luanda, aos 10 de Fevereiro de 2023


Elementos do grupo:

Domingos Paulo C. Augusto .................................................................................Nº 07


David Ferreira ........................................................................................................Nº22
Gildo Quipaca ........................................................................................................Nº 21
Samuel ...................................................................................................................Nº
Introdução

O presente trabalho tem como tema Clusters


Cluster : são grupos de servidores que são gerenciados juntos e participam no gerenciamento da carga de
trabalho. Um cluster pode conter nós ou servidores de aplicativos individuais.

Um nó geralmente é um sistema de computador físico com um endereço IP de host distinto que está
executando um ou mais servidores de aplicativos.
Os cluster são responsáveis por balancear o carga a carga de trabalho entre os servidores.
História dos clusters

Cluster é um conjunto de computadores interconectados que funcionam como se fosse um só


grande sistema.

A ideia inicial que conduz ao cluster foi desenvolvida na década de 60 pela IBM como uma
forma de interligar grandes mainframes, visando obter uma solução comercialmente viável de
paralelismo. Nessa época, o sistema HASP (Houston Automated Spooling Program) da IBM e seu
sucessor o JES (Job Entry System) proviam uma maneira de distribuir tarefas nos mainframes
interligados. Pelo menos até 2001, a IBM suportava o cluster de mainframes através do Parallel
Sysplex System, que permitia que hardware, sistema operacional, middleware e software de
gerenciamento do sistema provessem uma notável melhora na performance e custo, permitindo que
usuários de grandes mainframes continuassem utilizando as aplicações existentes.

O cluster ganhou força até que três tendências convergiram, nos anos 1980: microprocessadores
de alta performance, redes de alta velocidade e ferramentas padronizadas para computação distribuída
de alto desempenho. Uma quarta tendência possível é a crescente necessidade de poder de
processamento para aplicações científicas e comerciais unida ao alto custo e a baixa acessibilidade
dos tradicionais supercomputadores.

Estas máquinas dividem entre si as tarefas de processamento e as executam de forma simultânea.


De maneira geral, o Cluster costuma estar ligado a algumas áreas, como:

 Arquitetura de Computação;

 Redes;

 Computação em Nuvem;

 Banco de Dados;

Porém, neste trabalho temos como o foco principal o Cluster Computacional, também
conhecido como Cluster de Rede. Ele atua dividindo uma única tarefa entre todos os computadores

vinculados a ele.
O mais interessante é que, mesmo enquanto esses computadores compartilham os recursos e unem

suas forças, o usuário final não é afetado e, portanto, nem percebe.

O mesmo acontece com o Cluster de Máquinas Virtuais ou Containers. Para o usuário, não faz

diferença o que está acontecendo por trás da requisição, desde que ela seja processada

adequadamente e entregue no tempo esperado.

Como funciona o cluster?

Para entendermos o seu funcionamento, é preciso conhecer a definição de “nó”, que vem do

inglês “node”. Um nó é a cada computador inserido em um Cluster – seja ele virtual ou físico.
Tipos de nó de Cluster

Nó do Driver: O nó do driver mantém informações de estado de todos os notebooks anexados

ao cluster. O nó do driver também mantém o SparkContext, interpreta todos os comandos que você

executa de um notebook ou uma biblioteca no cluster e executa o mestre do Apache Spark que

coordena com os executores do Spark.

O valor padrão do tipo de nó do driver é o mesmo do tipo de nó de trabalho. Você pode escolher um
tipo de nó do driver maior com mais memória se está planejando muitos dados de trabalhados do
Spark e analisá-los no notebook.

Nó de trabalho: Os nós de trabalho do Azure Databricks executam os executores do Spark e outros

serviços necessários para o funcionamento adequado dos clusters. Quando você distribui sua carga

de trabalho com o Spark, todo o processamento distribuído ocorre nos nós de trabalho.

O Azure Databricks executa um executor por nó de trabalho. Portanto, os termos executor e

trabalho são usados de forma intercambiável no contexto da arquitetura do Databricks.

Endereço de nó de trabalho: O Azure Databricks inicializa os nós de trabalho com dois endereços

IP privados cada. O endereço IP privado principal do nó hospeda o tráfego interno do Azure

Databricks. O endereço IP privado secundário é usado pelo contêiner do Spark para comunicação

entre clusters. Esse modelo permite que o Azure Databricks forneça isolamento entre vários clusters

no mesmo workspace.
Outro termo importante é o Clustering, que se refere às tecnologias ou ferramentas envolvidas

com os Clusters.

Esses nodes são interconectados por uma tecnologia de rede, preferencialmente uma que já seja de

conhecimento da empresa, pensando na manutenção e controle de custos.

Cada nó desempenha uma função específica e pré-determinada, sendo possível excluir ou

adicionar novos nós quando necessário, mesmo com o Cluster em funcionamento. Essas ações

não prejudicam o funcionamento do processo, visto que as tarefas são distribuídas automaticamente,

sem gerar pane.

Não existe um limite de nodes que podem ser adicionados em um Cluster, o que é benéfico para as

empresas que se encontram em expansão.

Principais Tipos de cluster

Cluster de alto desempenho: Tem como foco principal resolver problemas que necessitam de

muito processamento, permitindo entregá-los em um tempo hábil e de forma satisfatória.

Um exemplo de uso é em sistemas utilizados em bibliotecas. Isso porque eles necessitam que seja

feita uma análise de uma grande quantidade de dados em um curto espaço de tempo.

Cluster de alta disponibilidade: Seu objetivo é manter a aplicação em pleno funcionamento, ou

seja, evitar que o sistema pare de funcionar durante o processamento das informações. Para atender

esta exigência, o Cluster pode contar com alguns recursos, como:


 Ferramenta de monitoramento para identificação de falha na conexão ou de nós defeituosos;

 Redundância de sistemas;

 Computador substituto para o caso de algum ter problema.

Cluster para balanceamento de carga: Sua missão é dividir as tarefas de forma similar entre os

nós. Ou seja, o foco aqui é fazer com que cada computador receba e atenda uma requisição.
Ele pode ser utilizado em várias aplicações, porém é mais comum na internet. Isso porque esse tipo

de solução tolera o aumento instantâneo no número de requisições, justamente pela capacidade de

distribuir as tarefas entre as máquinas.

É normal, ainda, haver a combinação entre esses tipos. Por exemplo, ter um Cluster montado para

que tenha alta disponibilidade e que trabalhe com balanceamento de carga.

Principais vantagens de utilizar cluster

 Menores custos: É mais barato manter um Cluster do que um único supercomputador para
desempenhar todas as tarefas. Um node tem um custo bem menor e o Cluster pode ser
formado por computadores diferentes entre si.
 Flexibilidade: Sempre que for preciso ampliar a capacidade de um Cluster, basta adicionar
um novo nó que, automaticamente, as tarefas são redistribuídas.
 Disponibilidade do serviço: Mesmo que um nó pare de funcionar, os demais poderão suprir
a sua ausência.

Para que serve a utilização de cluster?

A utilização do cluster vai varia de acordo com o tipo de Cluster utilizado.

Os Clusters de Servidores de Hospedagem de Site, por exemplo, são capazes de fornecer

ambientes extremamente rápidos e escaláveis. Eles funcionam como se fosse um único servidor.

Além disso, a adição de memória, armazenamento e processamento ao conjunto pode ser realizada

de forma rápida e sem levar a interrupções no serviço.

Serviços de Armazenamento em Nuvem, Neste exemplo trata-se de uma solução bem mais

simples e econômica que permite usar vários servidores interconectados.

Empresas, as empresas também podem se beneficiar de Clusters rodando em sua rede local. Com
isso, consegue usar seus programas do dia a dia com muito mais rapidez e agilidade.
Conclusão

Depôs de um uma grande pesquisa e uma breve abordagem concluímos que o cluster é um

agrupamento de computadores com a finalidade de partilhar recursos e assim melhorar a sua

capacidade é desempenho

You might also like