1208

IEEE LATIN AMERICA TRANSACTIONS, VOL. 10, NO. 1, JAN. 2012

A Comparative Study On The Architecture Of Social Networks Facing Users’ Great Demand
T. Finger e C. Maciel
Abstract— The social networking sites are places that allow people to share ideas, objectives and values. The challenge for social networking sites has been to keep its services available and functioning properly in order to serve its users and attract new ones. The objective of this research is to present a comparative study of the solutions found by Social Networks - Facebook, MySpace and Twitter - to investigate similarities or differences in the logical architecture of these systems. Such analysis is particularly relevant for those seeking more information on system architecture to meet a great demand of users. Keywords— Systems architecture, Social networks and Web.

I. INTRODUÇÃO S TECNOLOGIAS digitais trouxeram diversas mudanças para a sociedade, e uma delas é a possibilidade de as pessoas se socializarem, independentemente das distâncias que as separam, para compartilhar ideias, objetivos e valores comuns. Essa integração social intensificou-se com o advento das redes sociais na internet, que trouxeram a reboque, a circulação de uma pluralidade de novas informações, cujas trocas sucedem de modo rápido e interativo. Os serviços prestados por redes sociais, como o Facebook, MySpace e o Twitter, são procurados diariamente por cerca de milhões de usuários, o que ocasiona uma enorme quantidade de tráfego de dados. A globalização obriga-os a garantir o acesso de seus usuários num período 24/7 (24 horas por dia, 7 dias por semana), devido a diferenças de fuso horário de até 12 horas, significando que, enquanto numa parte do globo é dia, noutra já é noite. Em geral os sites de redes sociais têm tido muita dificuldade de manter seus serviços operando com qualidade de forma a não só manter seus usuários satisfeitos, como a atrair outros novos. A procura por determinado serviço de uma rede social tanto pode levá-la ao sucesso quanto derrubá-la. A repercussão positiva ou negativa dependerá também da resistência da aplicação ao grande número de acessos. Desafios dos sites de redes sociais têm sido manter essa resistência na aplicação. Porém, o aumento de usuários que irão utilizar o serviço é algo difícil de prever, o sucesso de uma rede social pode acontecer muitas vezes de uma forma rápida, devido a algum evento cultural ou esportivo, ocasionando um número considerável de usuários utilizando os serviços, algo que a aplicação pode não estar preparada. Como ocorreu ao Twitter durante os jogos da Copa do Mundo
T. Finger, Universidade Federal de Mato Grosso (UFMT), Cuiabá, Mato Grosso, Brasil, talita_finger@yahoo.com.br C. Maciel, Universidade Federal de Mato Grosso (UFMT), Cuiabá, Mato Grosso, Brasil, cmaciel@ufmt.br

A

de Futebol, ocasionando períodos de indisponibilidades de uso do serviço [1]. Um desafio, em especial dos engenheiros do Facebook, tem sido manter o site disponível e respondendo adequadamente [2]. Observa-se que muitas das abordagens tradicionais para servir o conteúdo web falham ou simplesmente não são práticas. Considerando o exposto, esta pesquisa tem por objetivo apresentar um estudo comparativo entre as redes sociais Facebook, MySpace e Twitter - a fim de investigar semelhanças ou diferenças existentes na arquitetura desses sistemas. Será utilizado como critérios de avaliação o banco de dados, a linguagem de programação, entre outras soluções comuns encontradas no material disponível para consultas. A escolha dessas redes sociais se deve ao fato de as três possuírem o maior número de visitantes em pesquisas que apresentam dados específicos sobre redes sociais [3]. O estudo foi realizado por meio de pesquisas bibliográficas em livros, revistas, artigos e internet. Dada a dificuldade de encontrar referenciais teóricos que discutam o objeto deste estudo, optou-se pela pesquisa qualitativa, em um esquema interpretativo pós-positivista [4], embasada na lógica e na dedução, a partir de etnografia da performance do ambiente web. Como produto da narração, disponibiliza-se, aqui no artigo, um documento semelhante a um relatório técnico de pesquisa [4]. O método de coleta e análise de dados é baseado na análise textual de documentos técnico-científicos e na observação na web. Para tal, usa-se o método comparativo [4], tendo os indicadores tecnológicos das arquiteturas como alicerce para interpretação das redes sociais. A organização adotada comportou da seguinte forma: a Seção 2 aborda a arquitetura de sistemas e suas principais características. Na terceira são definidas, formalmente, as redes sociais Facebook, MySpace e Twitter e as respectivas arquiteturas. Na Seção 4 foi reservada à comparação dessas arquiteturas, apontando as características e os problemas mais comuns encontrados nesses três ambientes. Por fim, são apresentadas as conclusões obtidas, os problemas enfrentados e algumas sugestões para trabalhos futuros. II. ARQUITETURA DE SISTEMAS Arquitetura de sistemas refere-se à arte ou a técnica de projetar e construir o ambiente de sistemas; a forma como os computadores são organizados, juntamente com suas definições de hardware e de software, interfere especificamente no desempenho do sistema. A arquitetura tem um papel fundamental para manter o funcionamento de um sistema. Uma boa aplicação web tem muitas camadas e cada uma delas fornece uma função especifica. Todas as camadas juntas compõem o aplicativo,

e um motor de busca baseado em palavras-chave para procurar os nomes dos membros [22]. envolvidos em cada interação do usuário [8]. isso sem que haja necessidade de uma mudança drástica em todo o sistema. A arquitetura de aplicação. Uma pluralidade de novas informações passou a circular nos grupos sociais de uma forma mais rápida e interativa a partir do surgimento da internet. No próximo tópico explanam-se as redes sociais escolhidas. Neste estudo são abordadas as plataformas de software dessas redes e comentadas questões sobre a infraestrutura de hardware. Descrita como um processo criativo. essa fase estabelece uma organização de sistema que visa satisfazer os requisitos funcionais (declarações dos serviços que o sistema deve fornecer) e os requisitos não funcionais (restrições sobre os serviços ou funções oferecidas pelo sistema) [6]. Sabendo-se que um sistema pode exigir um ou mais requisitos não funcionais. com a descoberta automática a partir do e-mail da pessoa procurada. A internet evoluiu para uma nova geração de serviços de redes sociais que se caracteriza por novos padrões de acesso determinado por interações sociais entre os usuários e uma quantidade crescente de conteúdos multimídia. tornou-se possível o compartilhamento de informações com outros usuários em diversos lugares no mundo. dependendo dos termos populares disponíveis: “Amigos”. refere-se à concepção e à construção da infraestrutura da aplicação. é bem provável que aja divergência em suas arquiteturas. por meio de objetos que são hospedados no site – uma fotografia. a navegação de grupos de amigos existentes no local. Desde então. compartilham ideias. nas instalações do site. os usuários são solicitados a identificar outras pessoas com quem mantêm relacionamento. Os sites compreendem a categoria de sistemas focados em expor e publicar as redes sociais dos atores. também chamado de usuário ou ator. que sugere amigos de amigos. infraestrutura tende a significar uma combinação de plataforma de hardware e de software. O rótulo atribuído às relações difere. Redes sociais são consideradas estruturas sociais compostas por pessoas que. Um indivíduo. definindo sua identidade virtual. por pinturas rupestres. Alguns sites exigem confirmação de amizade e outros não [37]. por entonações de voz ou por mensagens de texto. III. segundo [5]. possibilitando a interação com outras pessoas já cadastradas. faz-se necessário um projeto de arquitetura bem elaborado. Sites de redes sociais são ambientes que possibilitam a formação de comunidades on-line e o compartilhamento de conteúdos criados pelo usuário [22]. “Contatos” e “Fãs”. No campo das aplicações web. com ênfase na arquitetura de cada uma delas. manutenção e práticas de desenvolvimento. conectadas. os usuários de redes sociais contam. A Tabela I demonstra o número de usuários que utilizam redes sociais. devido as dificuldades de encontrar material nesta área. . Para facilitar a busca de amigos. indivíduos com identidades semelhantes se encontram formando um grupo de discussão.FINGER AND MACIEL : A COMPARATIVE STUDY ON THE ARCHITECTURE 1209 mas aleatoriamente combinadas você irá obter um aplicativo mal construído [5]. um motor de recomendação amigo. Permitem que as pessoas se comuniquem através da internet. cujo foco principal está na exposição pública das redes conectadas aos atores [12]. Um sistema é escalável quando acomoda bem um aumento no número de usuários. Sua capacidade de processamento e armazenamento é realizada pelo aumento de equipamentos. TABELA I CLASSIFICAÇÃO DAS REDES SOCIAIS [3]. por exemplo [7]. Deve-se considerar como todos esses elementos se encaixam para construir uma infraestrutura perfeita para aplicações de grande escala. As redes sociais enfrentam sérios desafios de escalabilidade devido ao seu rápido crescimento e popularidade [9]. cria o seu próprio perfil. objetivos e valores comuns. REDES SOCIAIS A comunicação sempre esteve presente de alguma forma. Assim. seja por sinais. dentro do possível. Esses valores são significativos e tendem a crescer com o passar dos anos. Para evitar transtornos futuros. Um bom jeito de resolver esse caso é usar diferentes estilos de arquiteturas em diferentes partes do sistema [6]. Uma vez cadastrados na rede social.

para o usuário final esse aglomerado aparenta ser apenas um único sistema armazenando e fornecendo informações. passou a utilizar o HBase [15]. Twitter. NO. 1. por exemplo. O HBase é um dos exemplos de banco de dados distribuído não relacional. sua popularidade coloca-o em situações críticas que exigem-lhe muito trabalho para manter o site sempre disponível e funcionando. Para acelerar o acesso. orientado à colunas. Tabelas hash são mantidas em sistemas de caches para responder rapidamente às palavras-chave dos metadados de pesquisa. em detalhes. Essa popularidade é possível por causa da baixa barreira à entrada em comunidades on-line [8]. o usuário pode trocar mensagens privadas e públicas entre os outros participantes. como o YouTube. ainda que não seja uma garantia absoluta. Isso favorece o aumento do número de usuários. ADAPTADA DE [13]. É importante observar as características de cada rede social abordada neste estudo. definidas na Tabela 2. 10. SMS e e-mail. Isso então implica um gigantesco volume de dados para processar atualizações. Cada rede social possui características específicas. conforme descrito na Tabela 2. Além dessas opções. capaz de lidar com o desafio de mantê-la no ar. foi originalmente criado pelo americano Mark Zuckenberg para que alunos do “High School” mantivessem contatos mesmo quando saíssem para estudar em uma universidade [12]. que são apresentados em seu mural. foi desenvolvido o Haystack. remoções e acessos referentes à sua especialidade. pois o acesso a estes é mais lento do à memória cache do computador. O tamanho do sistema de cache é muitas vezes superior a 16 Gigabytes [22]. Outro ofensor do serviço das redes sociais é o avanço tecnológico. Wikipedia. Cada foto armazenada no Haystack gera o armazenamento de mais quatro diferentes resoluções da mesma. Em cada perfil. A Tabela 2 foi elaborada por meio de visitas às redes sociais analisadas. que é um banco de dados criado pelo Google. os de aparelhos telefônicos que permitem aos usuários se manterem on-line o tempo inteiro [10]. dentre várias funcionalidades oferecidas pelo Facebook a seus usuários. LiveJournal. um sistema de alto desempenho para armazenamento e recuperação de fotos [14]. A arquitetura do Facebook é composta de um aparato tecnológico. como o ID do usuário.1210 IEEE LATIN AMERICA TRANSACTIONS. a despeito do crescimento exponencial de usuários. a publicação de álbuns de fotos. Por meio da criação de perfis. Reddit. por exemplo. ferramentas de software utilizadas e características. o Facebook aproveita a memória cache dos servidores para manter os dados mais solicitados. A. a análise referente a cada rede social tratada. JAN. 2012 Porém muitas vezes é difícil prever o aumento de usuários que utilizarão os serviços em um futuro próximo. que combina mensagens de chat. jogos e ferramentas. crescimento esse que independe de níveis socioeconômicos [11]. O HBase é baseado no BigTable. A estrutura planejada pode não adequar devidamente o acréscimo de usuários. TABELA II CARACTERÍSTICAS DAS REDES SOCIAIS ANALISADAS. Muitos dos serviços de redes sociais são projetados de tal forma que qualquer um pode se inscrever e visualizar os conteúdos. um recurso criado pelo Facebook que significa que o usuário gostou do conteúdo compartilhado sem ter que deixar comentários. Mas. É um aglomerado de banco de dados que juntos possibilitam dividir a carga de armazenamento e processamento. como links. O Memcached é uma tabela hash distribuída em vários servidores que tornou-se um componente essencial na arquitetura para enfrentar os desafios de desempenho e escalabilidade. A seguir. etc [22]. A definição de banco de dados distribuído se assemelha ao de sistemas distribuídos. entre eles. Facebook. atualizações de atividade de usuário. publicação de álbum de fotos. bate-papo. VOL. Digg. Para suportar uma. a fim de adquirir uma melhor compreensão do porquê de algumas utilizarem certas ferramentas e outras não. aonde a consulta . além de outros. Haja vista a participação de iniciantes em comunidades de usuários mais experientes. Tem seu uso aplicado por diversos sites. microblog e comentários). lançado em 2004. O usuário pode compartilhar dados. O Facebook funciona através de perfis e comunidades [12]. mas com o lançamento de uma nova versão deste aplicativo. textos (blog. O Facebook está entre os sites de redes sociais com maior número de visitantes por mês em todo o mundo [13]. Esse tipo de problema pode ser confirmado quando determinado web site fica indisponível por excesso de requisições na página solicitada da aplicação. algumas fornecem a possibilidade de inserir vídeos em suas páginas. Todavia. perfis de usuários. os usuários ainda podem criar marcadores de página web. é possível acrescentar módulos de aplicativos. será apresentada. Amazon. Frequentemente usado para acelerar a base de dados em web sites [14]. Facebook O Facebook. o que evita desperdício de tempo em requisições ao banco de dados ou ao disco rígido. O Facebook já utilizou o MySQL e o Cassandra para o sistema de armazenamento de mensagens. mensagens e fotos. com destaque para a arquitetura. A partir desse mural outras pessoas que estejam sob uma mesma rede de amigos podem comentar ou “curtir”. entre outros. no mês de junho de 2011. todos os dias da semana. Memcached é uma das ferramentas que possibilitam um melhor aproveitamento da memória RAM sobressalente de muitos servidores.

a tecnologia de servidor web do Windows. o MySpace garante seu funcionamento com ferramentas diferentes das do Facebook e Twitter. usando o recurso Service Broker do SQL Server 2005. A mudança para uma SAN melhorou o tempo. de acordo com Al-Adwan. Seu sucesso se deu principalmente por permitir um grau de personalização maior em comparação às outras redes sociais [12]. o Facebook formou o Open Compute Project para divulgar as especificações e os designs dos equipamentos de hardware usados em um dos seus centros de dados [20]. Lançado em 2003. e “Reduce”. O MySpace também faz uso de um framework MapReduce para desenvolver e executar aplicações de computação distribuída em conjuntos de servidores Windows: o Qizmt [14]. com menos colunas. a equipe de operações técnicas do Facebook apresentou um gráfico que demonstra o crescimento da quantidade de servidores de 2007 a 2010 [19]. O objetivo do projeto é possibilitar que outras pessoas ajudem a melhorar seus servidores. possui as mesmas funcionalidades de muitas outras redes sociais: definição de perfil. rack de servidores e baterias. e a terceira constitui a de banco de dados [24]. Figura 1. porque todo o seu desempenho em acessar tabelas com menos valores se perde quando é necessário fazer uma análise dos dados. Adaptado de [24]. nos Estados Unidos. Foi também adicionada uma camada de cache entre os servidores web e os servidores de banco de dados com o único objetivo de capturar cópias de dados de memórias frequentemente acessadas. Arquitetura de 3 camadas do MySpace. ele foi concebido para apoiar a computação distribuída de grandes conjuntos de dados sobre um grande número de computadores (clusters). é possível deduzir que o Facebook tem em média 60 mil servidores [19]. . tais como a tela de início de uma sessão. gabinete de servidor. O MySpace criou uma solução interna chamada de Service Dispatcher. 1. envio de mensagens. resultar em gastos desnecessários de sincronização de cópias de dados [22]. cada uma servindo a diferentes funções. trabalhando de forma assíncrona [17]. Posteriormente. processo que reconhece e agrega resultados. uma infraestrutura de data warehouse construída em cima do Hadoop. o MySpace emprega uma arquitetura de três camadas: a camada web. processo que mapeia a requisição em cada computador. além de possuir um serviço muito semelhante ao do YouTube. o desempenho e a confiabilidade. Sobre a infraestrutura do Facebook. deixando-as à disposição do aplicativo web e dispensando a necessidade de um banco de dados de pesquisa [21]. o particionamento pode. No início. na qual utiliza-se o Window Server 2003 e o Internet Information Services (IIS). cada computador da camada de dados tem 4 processadores AMD dual-core e 64 gigabytes (GB) de RAM [24]. MySpace O MySpace era. Essa técnica implica dividir uma tabela em várias outras. O HBase foi escolhido em lugar do Cassandra. que é um modelo de programação que possibilita fácil desenvolvimento de aplicações paralelas escaláveis para processar grandes coleções de dados em cluster de computadores [16]. Recentemente. passou a utilizar uma rede de armazenamento (SAN). Como todas as implementações MapReduce. O Service Dispatcher garante que uma requisição de atualização ao banco seja emitida para todas as cópias de sistemas de banco de dados. O termo MapReduce é a junção de “Map”. Essas especificações incluem placas-mãe. Embora amplamente utilizado. Além de possibilitar uma facilidade maior na distribuição horizontal e fácil replicação. o particionamento vertical é uma abordagem que deve ser considerada com cautela. Qizmt é usado internamente pelo MySpace e tornou-se fonte aberta. tornando a infraestrutura mais eficiente e com o menor custo possível. a seguir. o site de rede social mais utilizado. Se mal feito. fonte de alimentação.FINGER AND MACIEL : A COMPARATIVE STUDY ON THE ARCHITECTURE 1211 torna mais rápida devido ao fato dos dados já entrarem indexados. características dos bancos de dados não relacionais. Apesar de o gráfico não incluir números. criação e manutenção de grupos. por possuir fácil integração com o Hadoop [15]. o compartilhamento de vídeos. Sendo a segunda rede social mais popular do mundo [3]. Foi projetado para escalar uma grande quantidade de dados entre muitos servidores. Resumindo. para permitir uma análise escalável em grandes conjuntos de dados [18]. O Facebook utiliza-o juntamente com o Hive. os perfis de usuário e os blogs [21]. garantindo a sua integridade. que é uma rede projetada para agrupar vários clientes e dispositivos de armazenamento [21]. sendo superado em número de visitantes pelo Facebook no início de 2008 [12]. para não revelar a contagem real da quantidade de servidores. Veja tal estrutura na Fig. a segunda camada é o nível de cache. O Hadoop fornece um armazenamento de sistemas de arquivos distribuídos inspirado pelo MapReduce. exigindo que se acessem muitas outras tabelas em vez de uma só inicialmente. no caso de replicação de dados. com 1 a 2 milhões de usuários. outro banco de dados não relacional orientado a colunas. vice presidente de dados do MySpace [23]. quando o MySpace possuía em faixa de 500 mil contas de usuários cadastrados. B. ele utilizou-se do particionamento vertical para melhorar o desempenho e facilitar a manutenção do banco de dados. Além disso.

e tem utilizado os serviços de computação em nuvem da Amazon para armazenar e distribuir imagens de perfil [34]. que adotou para servidor web os servidores Ruby Unicorn juntamente com o Apache [29]. A estrutura da plataforma social colaborativa é formada por seguidores e pessoas a serem seguidas. JAN. ou seja. Havendo interesse pelas publicações de alguém. A infraestrutura do Twitter vinha sendo gerenciada via contrato de hospedagem pela NTT America. Continuam mantendo o espaço de armazenagem baseados no MySQL porque a alteração de uso para algum outro banco é uma mudança de estratégia [33]. e muitos outros tipos de dados gerados pela aplicação [32]. . A mensagem publicada é chamada de tweet. Figura 2. que opera vários centros de dados no Vale do Silício. Outra ferramenta que o Twitter e o Facebook têm em comum é o Hadoop. O recurso utilizado para manter os dados em cache é o Memcached. de apenas produtos Microsoft. TABELA III COMPARAÇÃO ENTRE ARQUITETURAS DAS REDES SOCIAIS.1212 IEEE LATIN AMERICA TRANSACTIONS. Devido ao despreparo para a popularização de seu site. 10. Arquitetura do Twitter [35]. Até a data de envio deste artigo. ou balanceamento de carga. Em função desse aumento de tráfego. foram buscadas as últimas abordagens utilizadas pelo Twitter. Essa é uma forma de o Twitter reportar o erro aos seus usuários. Biz Stone e Evan Williams ainda em 2006 [12]. basta segui-lo. 2 ilustra tal arquitetura. A Tabela III sumariza os elementos das arquiteturas das três redes sociais analisadas. além de aliviar a carga do banco de dados. o Twitter utiliza o MySQL e o Cassandra. ESTUDO COMPARATIVO A partir das arquiteturas apresentadas nos tópicos anteriores será apresentado um estudo comparativo identificando as características mais comuns encontradas nesses ambientes. todavia. neste estudo foram destacados aqueles disponíveis para análise. É importante ressaltar que existem diversos outros softwares que colaboram na manutenção do desempenho. ele é utilizado para armazenar e processar tweets. a rede social Twitter tem enfrentado transtornos relacionados ao descompasso entre à taxa de crescimento de usuários e a capacidade de hardware e software da empresa [27]. VOL. Essa informação pode ser compartilhada através de um navegador da web. Desenvolvido com o propósito de ser um serviço no qual as pessoas compartilhassem mensagens mais objetivas. C. é executado no Ruby Enterprise Edition [28]. então. desde o ano de 2010. Como banco de dados. o maior desafio do Twitter foi lidar com o crescimento sem precedentes e a constante presença da failwhale. diferentemente do Twitter. Twitter O Twitter foi fundado por Jack Dorsey. A Fig. 1. que ajudam a manter o desempenho das respectivas aplicações. 2012 Toda sua infraestrutura é composta de 3000 servidores web. A estrutura do MySpace é definida. Porém. um servidor Java chamado Blender [36]. que distribui igualmente entre dois ou mais servidores web a execução de um processo. utiliza uma técnica chamada Load Balancer. desde 2009. cadastre-se como seguidor e toda atualização feita pelo seguido estará disponível para seus seguidores. IV. lançando juntamente um substituto para a utilização do Ruby-on-Rails. reservando o banco de dados apenas para backup [30]. o Twitter alegou que iria começar a operar as suas próprias instalações e a realizar estratégias de migração para o novo centro de dados [27]. de um aparelho telefônico ou de alguma outra API (Interface de Programação de Aplicações). arquivos de log. NO. Nos últimos cinco anos. é possível que o Twitter anuncie o uso de novas ferramentas além das que foram citadas aqui. ficando o primeiro para o armazenamento de dados dos tweets [30]. de 140 caracteres ou menos. Essa mudança proporcionou ao Twitter executar três vezes mais requisições de usuários em comparação a estrutura anterior [36]. que será abordado no próximo tópico. No Twitter. A failwhale é uma baleia que aparece quando existe uma demanda muito grande de requisições acima do que o Twitter suporta. acelera o carregamento das páginas [31]. que. O Twitter. 800 servidores de cache e 440 servidores SQL [25]. fica destinado para novos projetos. um dos pontos significativos do Twitter é manter tudo em cache. aumentou muito a quantidade diária de tweets [26]. Recentemente o Twitter aderiu ao Lucene como um novo motor de busca em tempo real. Sem dúvida. e do Facebook que utiliza softwares dirigidos à comunidade de código aberto. praticamente. O uso do Cassandra. sendo que a própria equipe de pesquisa utiliza para armazenamento dos resultados da mineração de dados realizada em toda a base de usuários. pedindo desculpas pelo temporário congestionamento do site. De 2009 até hoje. Para otimizar as atividades realizadas entre os servidores.

essa camada está acoplada ao SAN. Novatec. Brasil. por exemplo. lançar tendências/ ser precursor de ideias para garantir a liderança no segmento de redes sociais. J.pingdom. Brasil. Um método para mensurar o grau de maturidade na tomada de decisão e-democrática. J. C. Setembro. Lancellotti. e para novas pesquisas e projetos. SP. Impact of Social Networking Services on the Performance and Scalability of Web Server Infrastractures. em termos de tempo. é mais eficiente do que buscar a informação solicitada pelo usuário no disco rígido. Pingdom.Universidade Federal Fluminense. Pearson. provavelmente essa não será a última. Cabe ressaltar nesse quesito que. é preciso ser proativo e.com/2009/02/09/facebook-myspacetwitter-social-network. MT. refere-se ao banco de dados utilizado. C. C. Porto Alegre. como comentado anteriormente. ele adquire a mesma disponibilidade de seus serviços. trazendo elementos importantes para a discussão dessa temática. o que na prática significa acrescentar mais máquinas ao aglomerado de máquinas (cluster) de um sistema distribuído. 2008. Muthukkaruppan.compete. porém. como o de educação. 2010. Tecnologias comuns podem ser observadas nas arquiteturas do Facebook e do Twitter. Henderson. Erramilli e P. Assim como pesquisas podem ser desenvolvidas com base nas características abordadas neste estudo. o Facebook e o Twitter utilizam o Memcached. o custo a sustentar será reescrever a aplicação e adaptar para um ambiente distribuído. Brasil. Exploring the software behind Facebook. K. Denzin.pingdom. Brasil. todos se utilizam do modelo de programação MapReduce. a arquitetura utilizada para um tipo específico de armazenamento.FINGER AND MACIEL : A COMPARATIVE STUDY ON THE ARCHITECTURE 1213 Ao observar a Tabela III. http://royal. How Facebook. T. O importante é não parar no tempo. Março. Itália. Setembro. R. comércio ou governo eletrônico. Pujol. Facebook. Barcelona. como Memcached e Hadoop. verifica-se que as três redes sociais possuem uma camada de cache e. por mais que o MySpace se utilize de outras ferramentas. esse tipo de escalonamento deve ser definido logo no início do projeto. Social Networks: Facebook Takes Over Top Spot. 2010. Porto Alegre. I. se possível. também distribuído. o SQL Server. Maciel. Meridional. O'Reilly Media. por falhas de previsão de que ele chegaria a tantas proporções. o Cassandra. criado para processar grandes coleções de dados em clusters de computadores que respondem de forma assíncrona. São Paulo. http://twitter.com/2011/03/29/compete-rankingof-top-50-web-sites-for-february-2011-reveals-familiar-dip/.com/?discover=true&utm_comapign=user_discoverabilit y&utm_content=review&utm_medium=em. http://blog. entre outros. Todas as três redes sociais possuem muitos servidores. Y.compete. Espanha. Pak Multimídia. o HBase. Artmed. Um exemplo desse descompasso evolutivo é o Twitter. Para o processamento e armazenamento dos tweets ele aplica. tal como realizar um estudo de caso utilizando as ferramentas discutidas a fim de adquirir um maior detalhamento das dificuldades de implementação. antes. V. Compete. Além disso. 2007. University of Moderna and Reggio Emilia. Há alguns anos era possível fazer um sistema mais ou menos escalável e adaptá-lo conforme o aumento do número de usuários. Lincoln. No caso do Facebook. V. Pingdom. o MySQL. 2010. dado o caráter sigiloso da informação. Cuiabá. N. 2009. G. Ranking of Top 50 Web Sites for February 2011 Reveals Familiar Dip. Março.com/2010/03/04/how-facebooktwitter-and-other-big-sites-give-back-to-open-source. desde o seu surgimento. [9] [10] [11] [12] [13] [14] [15] . mantendo seu funcionamento a uma grande demanda de usuários. 2010. Escola Regional de Informática SBC-Mato Grosso. Twitter Climbs. RS. Bell. São Paulo. 2011. The Underlying Technology of Messages. 2010. Quanto ao acesso às informações nos bancos de dados. “Um estudo das arquiteturas de armazenamento de dados voltados à Web”. “Scaling Online Social Networks without Pains”. Garcia e R. Engenharia de Software. REFERÊNCIAS [1] [2] [3] [4] [5] [6] [7] [8] Twitter. Para suportar a programação distribuída optaram pelo modelo MapReduce. com relação ao armazenamento de dados. Niterói. Outubro. verificou-se que os bancos de dados utilizados pelo trio são distribuídos. Essa estratégia. 2009. como também é possível discutir o seu uso em outros ambientes. Esse tipo de informação encontra-se segmentado em pequenos trechos de vários sites. 2006. Sebastopol. Siganos. C.com/2010/06/18/the-softwarebehind-facebook. G. Twitter and other big sites give back to Open Source. O Twitter e Facebook fazem uso do Hadoop e o MySpace do Qizmt. Brasil. que é capaz de processar grandes coleções de dados de forma assíncrona. Canali. Redes Sociais na Internet. 2006. RS. O MySpace. Um dos problemas enfrentados no estudo foi a dificuldade em descobrir. Sommerville. 2010. Acredita-se que o levantamento aqui realizado é útil para pesquisas aplicadas ao desenvolvimento e uso de arquiteturas de redes sociais. enquanto no MySpace. aperfeiçoando. O site não conseguiu acompanhar seu próprio crescimento. Outro ponto a destacar. Outro ponto comum encontrado é que as respectivas arquiteturas foram modificadas diversas vezes até chegar à configuração atual e. Não é mais possível ser reativo. Criando aplicações para redes sociais. K. Tese (Doutorado em Computação) . Building Scalable Web Sites. Durante a análise das arquiteturas das redes sociais abordadas. MySpace e Twitter . Maciel. 5th International Workshop on Networking Meets Databases.a fim de investigar semelhanças ou diferenças na arquitetura desses sistemas. sendo ele relacional ou não. inovando e criando novas tecnologias e conceitos. Rodriguez. usa um banco de dados relacional. Compete. continuar sempre buscando. por sua vez. um número que tende a crescer com o aumento de usuários. the world’s largest site. característica desejável quando se precisa aumentar o processamento ou o armazenamento de dados. palestras realizadas por engenheiros de software. 2009. a preferência foi por um banco de dados não relacional. algo comum em serviços de internet que crescem rápido demais. Dada a sua importância. RJ. Investigating Elevated Error Rates. Outro ponto comum às três redes sociais diz respeito à escalabilidade horizontal. porque se o sistema foi desenvolvido sem adequação a computação distribuída. CONCLUSÃO O objetivo desta pesquisa foi apresentar um estudo comparativo das soluções encontradas pelas Redes Sociais Facebook. http://royal. Estados Unidos. http://blog. todas as redes sociais analisadas possuem uma camada de cache para armazenamento temporário dos dados. SP. Finger. O Planejamento da Pesquisa Qualitativa – Teorias e Abordagens. mesmo assim. M. artigos. Brasil. Recuero. CA. Já o Twitter utiliza ambos os tipos de bancos de dados.

twitter. Shao. Outubro. [37] D. Anthony. Março. Application and organization using Hadoop. http://blog. Oxford.html.com/2010/02/15/scalingatmyspace.com/2010/07/cassandra-at-twittertoday. “Graph Twiddling in a MapReduce World”. King. W. Heiliger.mvdirona. Março. 2011. Twitter Search is Now 3x Faster.twitter. Scaling Twitter: Making Twitter 10000 Percent Faster. 2009. com estágio na Universidade de Coimbra. Hamilton.html. Março. 2011.php?note_id=454991608919#. the Winter of 2011. “Map-Reduce-Merge: Simplified Relational Data Processing on Large Clusters”. J.com/archives/2010/06/28/facebookserver-count-60000-or-more/. Cohen. Miller. 2009. A. Brasil (2010). Agosto. Abbott.facebook. Cristiano Maciel possui graduação em Informática pela Universidade Regional do Noroeste do Estado do Rio Grande do Sul (1995). J. e publicações nas áreas de Ciência da Computação e da Educação. Março.microsoft.com/2011/03/building-fasterruby-garbage-collector. Microsoft. http://engineering. Twitter Engineering. B. H. http://www. B. Mestrado em Ciências da Computação pela Universidade Federal de Santa Catarina (1997) e Doutorado em Ciência da Computação pela Universidade Federal Fluminense. Proceedings of the 2010 international conference on Management of data (SIGMOD'10). 2010. 2011. Proceedings of the 2007 ACM SIGMOD international conference on Management of data (SIGMOD '07). http://engineering.1214 IEEE LATIN AMERICA TRANSACTIONS. Yang et al. em Cuiabá (MT). 2009. Adams. Dezembro.html.html. J. Journal of Computer-Mediated Communication. governo eletrônico. E. 2010. http://engineering. http://engineering. banco de dados e redes sociais. "In the Belly of the Whale: Operations at Twitter". Miller. Data Center Knowledge. MySpace Architecture. http://www. S. 2009.com/2011/04/twitter-search-is-now-3xfaster_1656.html. Facebook Server Count: 60.. Obteve o título de especialista em Banco de Dados pela Universidade Federal de Mato Grosso. 10. Twitter Engineering. 2012 [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] http://www. http://www. 4. R.aspx.com/scaling-twitter-making-twitter10000-percent-faster. Jeong e S. Hadoop Wiki. SQL Server Magazine. Liu. ACM. Agosto. MySpace Answers the Question: Why SQL Server. NY. 2010. Boyd e N. interação humano-computador.com/note. 2010. Possui experiência tanto docente quanto administrativa.com/2010/02/measuring-tweets. Building a Faster Ruby Garbage Collector. Especialização em Avaliação Educacional pela Universidade Federal do Mato Grosso (1998). Molnar. History. “On social Web sites”. IEEE Educational Activities Department Piscataway. VOL. http://engineering.twitter. educação a distância e avaliação educacional. Murthy. Computing in Science and Engineering table of contentsarchive. Seus interesses são pelas áreas de aplicações internet. Mato Grosso.000 or More. O. http://engineering. High Scalability. S. J. R. http://www. R.twitter. Estados Unidos. Twitter Engineering. Reino Unido.com/2011/03/great-migrationwinter-of-2011. The Great Migration. 2011. http://www. MySpace Uses SQL Server Service Broker to Protect Integrity of 1 Petabyte of Data.twitter. Estados Unidos. Estados Unidos.apache. Journal Information Systems. “Data warehousing and analytics infrastructure at facebook”. H.com/2010/03/unicorn-power.com/myspace-architecture. Twitter Engineering. Cuiabá.org/hadoop/poweredby. Scaling at MySpace.com/2010/04/memcached-spofmystery. Twitter.twitter. 2011. NY. Kim. Weil. Ellison. . S. Gade. 2007. K. W. N. D. redes sociais. Outubro.sqlmag. J. 2010.com/archives/2011/03/21/twittercompletes-data-center-expansion/?utm-source=feedburner&utmmedium=feed&utmcampaign=feed%3A+datacenterknowledge+%28data+center+knowled ge%29. Building Efficient Data Centers with the Open Compute Project. and Scholarship”.com/note. Data Center Knowledge. Yang. Estados Unidos. High Scalability. K. 2010. Unicorn Rails Server.aspx?casestu dyid=4000004532. Novembro.facebook. http://wiki.datacenterknowledge.html. na qual suas pesquisas se concentram na área de arquitetura de sistemas. 2010. 2010. em Portugal (2008). 1. Lee. M. Talita Finger é graduada em Ciência da Computação pelo Centro Universitário Cândido Rondon. http://highscalability. NJ. Z. Twitter Completes Data Center Migration.twitter. Twitter Engineering. http://perspectives. Abril. Twitter Engineering. Elsevier Science Ltd. Measuring Tweets.aspx. Thusoo. Weaver. Facebook.com/casestudies/case_study_detail. Artigo 11. inteligência artificial. Cuiabá.datacenterknowledge.com/article/scalability/myspaceanswers-the-question-why-sql-server-/5. Mato Grosso. Cassandra at Twitter Today. Sandofsky. 2010. http://highscalability. Atua na área de desenvolvimento de sistemas desde 2005 e atualmente é líder de desenvolvimento de sistemas pela Tecnomapas Ltda e pesquisadora colaboradora pela Universidade Federal de Mato Grosso. Jain. Junho.html. 2009. Volume 35. Nova York. CA. 2010. Volume 11. Edição 2. NO. 2010. Memcached SPOF Mystery. Atualmente é professor adjunto da Universidade Federal de Mato Grosso. Fevereiro. M. Sarma. R. “Social Network Sites: Definition. Estados Unidos. Santa Clara. Brasil (2008). 2007. Nova York. JAN. Outubro. Outubro.php?note_id=10150144039563920. Ed. engenharia de software. In: O'Reilly Velocity Web Performance and Operations Conference. Borthakur.

Sign up to vote on this title
UsefulNot useful