Professional Documents
Culture Documents
Software
Tutoriales,tips,software,basesdedatoseinformacintecnolgica.ApacheHadoop,NodeJS,Android, Java,PHP,HTML5,CSS3,MySQL,MongoDB,NoSQL.
Inicio
Contacto
TutorialdeApacheHadoop
TutorialdeMongoDBconJava
ApacheHadoop:Aplicacionesdistribuidas conpetabytesdedatos
Publicadoel21enero,2013porJosDavidJuradoAlonso
SeguramentealamayoranoossueneennombredeApacheHadoop,apesardequecadavezest adquiriendomspopularidadanesungrandesconocido.ApacheHadoopesunframework desarrolladoenJavaydelicencialibrequepermiteeldesarrollodeaplicacionesdistribuidascon petabytesdedatos. Trasleerelprimerparrfoquedaclaroqueelmotivoprincipalporelquefuedesarrolladoesteframework espoderanalizarygestionarresultadosextraidosdeficherosdegrantamao(petabytes)aunabaja latenciadetiempo,esdecir,rpidamente.EstoesrealmentetilenelmundodelBusinessIntelligence porejemplo. Parasacarelmximopartidoaestatecnologasseusaunsistemadeficherosdistribuido,escalable yporttilescritoenJavaycreadoespecialmenteparatrabajarconficherosdegrantamao,HDFS,el cualtieneentresusprincipalescaractersticasuntamaodebloquemuysuperioralhabitual(64MB) paranoperdertiempoenlosaccesosdelectura.Losficherosconlosquenormalmentevaatrabajar estesistemadeficherossondeltipoWriteoncereadmany(escribeunavezyleemuchasveces). Cmofunciona?Pueslateoraesmuysencilladeentenderaunqueeldesarrollodeaplicacionesde estetipoesotrocantar.PrincipalmentesebasaenelconceptodeMapReduce,elcualexplicaremosen msdetalleenotroartculo.Deestemodo,losficherosdegrantamaosoncortadosentrozosdeun
tamaofijoyrepartidosentreunaseriedenodosworker(mquinasconHDFS)yposteriormentese lanzalaaplicacindesarrolladaparaobtenerinformacin(conteodepalabras,bsquedadeinformacin oerrores,anlisisdetendencias)encadanodo,creandounmapa(Map)conlainformacinbuscada. Alirfinalizandolosnodossutarea,sereducen(Reduce)losdatossegnlalgicadenuestroprograma paraobtenerelresultadofinalydeseado(sifuncionacorrectamenteclaro). Apartedeesto,tienemuchosmsusosconocidos,aplicandoesteconceptoabasesdedatosdegran tamao(CassandraoHIVE(estaltimacreadaparaApacheHadoop))oinclusoparahacerstreamming (hedereconocerqueestoltimomedejimpresionado)ymuchascosasmsqueiremosviendo Esperoqueestaleveintroduccinhayaservidoparaaclararvuestrasdudasytenerunamejor comprensindelafinalidaddeestatecnologasemergente.Enprximosartculosiremos adentrndonosmsenalgunosdesusconceptos,comoMapReduceosuinstalacin,ysobretodo realizaralgunoscasosprcticos. HappyMinds!!! Quizsteintereseverestosartculos: 1. ApacheHadoop:IntroduccinaHDFS EsteartculofuepublicadoenApacheHadoopyetiquetadoApacheHadoop,aplicaciones distribuidas,Cassandra,HIVE,Java,licencialibre,MapReduce,petabytesporJosDavidJurado Alonso.Enlacepermanente[http://www.happyminds.es/apachehadoopaplicaciones distribuidasconpetabytesdedatos/].
operativoGNU/LinuxUbuntu12.10paradespuspoder[...]
Responder