Professional Documents
Culture Documents
Trabalho de Trei - Cluster - D
Trabalho de Trei - Cluster - D
Ministério da Educação
Complexo Escolar Baptista Da paz
Tema: Clusters
Um nó geralmente é um sistema de computador físico com um endereço IP de host distinto que está
executando um ou mais servidores de aplicativos.
Os cluster são responsáveis por balancear o carga a carga de trabalho entre os servidores.
História dos clusters
A ideia inicial que conduz ao cluster foi desenvolvida na década de 60 pela IBM como uma
forma de interligar grandes mainframes, visando obter uma solução comercialmente viável de
paralelismo. Nessa época, o sistema HASP (Houston Automated Spooling Program) da IBM e seu
sucessor o JES (Job Entry System) proviam uma maneira de distribuir tarefas nos mainframes
interligados. Pelo menos até 2001, a IBM suportava o cluster de mainframes através do Parallel
Sysplex System, que permitia que hardware, sistema operacional, middleware e software de
gerenciamento do sistema provessem uma notável melhora na performance e custo, permitindo que
usuários de grandes mainframes continuassem utilizando as aplicações existentes.
O cluster ganhou força até que três tendências convergiram, nos anos 1980: microprocessadores
de alta performance, redes de alta velocidade e ferramentas padronizadas para computação distribuída
de alto desempenho. Uma quarta tendência possível é a crescente necessidade de poder de
processamento para aplicações científicas e comerciais unida ao alto custo e a baixa acessibilidade
dos tradicionais supercomputadores.
Arquitetura de Computação;
Redes;
Computação em Nuvem;
Banco de Dados;
Porém, neste trabalho temos como o foco principal o Cluster Computacional, também
conhecido como Cluster de Rede. Ele atua dividindo uma única tarefa entre todos os computadores
vinculados a ele.
O mais interessante é que, mesmo enquanto esses computadores compartilham os recursos e unem
O mesmo acontece com o Cluster de Máquinas Virtuais ou Containers. Para o usuário, não faz
diferença o que está acontecendo por trás da requisição, desde que ela seja processada
Para entendermos o seu funcionamento, é preciso conhecer a definição de “nó”, que vem do
inglês “node”. Um nó é a cada computador inserido em um Cluster – seja ele virtual ou físico.
Tipos de nó de Cluster
ao cluster. O nó do driver também mantém o SparkContext, interpreta todos os comandos que você
executa de um notebook ou uma biblioteca no cluster e executa o mestre do Apache Spark que
O valor padrão do tipo de nó do driver é o mesmo do tipo de nó de trabalho. Você pode escolher um
tipo de nó do driver maior com mais memória se está planejando muitos dados de trabalhados do
Spark e analisá-los no notebook.
serviços necessários para o funcionamento adequado dos clusters. Quando você distribui sua carga
de trabalho com o Spark, todo o processamento distribuído ocorre nos nós de trabalho.
Endereço de nó de trabalho: O Azure Databricks inicializa os nós de trabalho com dois endereços
Databricks. O endereço IP privado secundário é usado pelo contêiner do Spark para comunicação
entre clusters. Esse modelo permite que o Azure Databricks forneça isolamento entre vários clusters
no mesmo workspace.
Outro termo importante é o Clustering, que se refere às tecnologias ou ferramentas envolvidas
com os Clusters.
Esses nodes são interconectados por uma tecnologia de rede, preferencialmente uma que já seja de
adicionar novos nós quando necessário, mesmo com o Cluster em funcionamento. Essas ações
não prejudicam o funcionamento do processo, visto que as tarefas são distribuídas automaticamente,
Não existe um limite de nodes que podem ser adicionados em um Cluster, o que é benéfico para as
Cluster de alto desempenho: Tem como foco principal resolver problemas que necessitam de
Um exemplo de uso é em sistemas utilizados em bibliotecas. Isso porque eles necessitam que seja
feita uma análise de uma grande quantidade de dados em um curto espaço de tempo.
seja, evitar que o sistema pare de funcionar durante o processamento das informações. Para atender
Redundância de sistemas;
Cluster para balanceamento de carga: Sua missão é dividir as tarefas de forma similar entre os
nós. Ou seja, o foco aqui é fazer com que cada computador receba e atenda uma requisição.
Ele pode ser utilizado em várias aplicações, porém é mais comum na internet. Isso porque esse tipo
É normal, ainda, haver a combinação entre esses tipos. Por exemplo, ter um Cluster montado para
Menores custos: É mais barato manter um Cluster do que um único supercomputador para
desempenhar todas as tarefas. Um node tem um custo bem menor e o Cluster pode ser
formado por computadores diferentes entre si.
Flexibilidade: Sempre que for preciso ampliar a capacidade de um Cluster, basta adicionar
um novo nó que, automaticamente, as tarefas são redistribuídas.
Disponibilidade do serviço: Mesmo que um nó pare de funcionar, os demais poderão suprir
a sua ausência.
ambientes extremamente rápidos e escaláveis. Eles funcionam como se fosse um único servidor.
Além disso, a adição de memória, armazenamento e processamento ao conjunto pode ser realizada
Serviços de Armazenamento em Nuvem, Neste exemplo trata-se de uma solução bem mais
Empresas, as empresas também podem se beneficiar de Clusters rodando em sua rede local. Com
isso, consegue usar seus programas do dia a dia com muito mais rapidez e agilidade.
Conclusão
Depôs de um uma grande pesquisa e uma breve abordagem concluímos que o cluster é um
capacidade é desempenho