Professional Documents
Culture Documents
Lasmejoresprcticas
AdministracindedatosXML
MatthiasNicola LaboratorioSiliconValleydeIBM
SusanneEnglert LaboratorioSiliconValleydeIBM
Pgina 2
Pgina 3
Resumenejecutivo
EstedocumentopresentalosprincipiosyloslineamientosparautilizarDB2pureXMLpara resolverconeficaciaproblemasdenegociosyparalograrobtenerunaltodesempeoenla administracindedatosXMLenaplicacionesempresariales.Losejemplosqueilustranlas mejoresprcticassebasanenescenariosdeaplicacionesfinancierasrealesymuestrancmo implementarloslineamientos.Losejemplospuedenadaptarseconfacilidadaotrostiposde aplicacionesXML.Estedocumentoabarcalassiguientesreas:
Pgina 4 5
ElporquXML
XMLofreceunaformaneutralyflexibleparaintercambiardatosentresistemas,aplicacionesy organizacionesdiferentes.ConXML,losdatossemantienenenunformatoautodescriptivoyque puedeampliarseparasatisfacerlasnecesidadessiemprecambiantesdelosnegocios.Los documentosXMLutilizanetiquetasparadescribirlosvaloresdelosdatosquecontienen,ascomo elanidadodeetiquetasparaexpresarlasrelacionesjerrquicasqueexistenentreloselementosde losdatos.XMLpuededescribirdatosmuyestructuradoseimponerlaestructuraatravsde esquemasXML;sinembargo,tambinpuededescribirdatossemiestructuradosqueprevalecenen aplicacionesorientadasenelcontenido.
VentajasydesventajasdelosdatosXMLydelosdatosrelacionales
Comounformatodedatosautodescriptivo,XMLpermitequediversosdatos(conosinesquema XML)sealmacenenenunsolodocumentoofilasinsacrificarlacapacidaddeinvestigarode agregarpartesdeesosdatos.LasaplicacionespuedendesarrollarsusesquemasXMLsin provocardaosalesquemasubyacentedelabasededatos.MientrasquelaflexibilidaddeXML significaqueelexaminareinterpretardatosXMLpuedeconsumirmsrecursosdelprocesador y/odeentrada/salidaquesilosmismosdatossealmacenaranenformarelacional,factorescomo lacomplejidaddelesquemapodranhacerqueelalmacenamientodelosdatosresultasepoco prctico.
Pgina 5
SolucionesXMLparalosproblemasdemodelosdedatosrelacionales
Elmodelodedatosdealmacenamientodebeconcordar,enlamedidamsampliaposible,conel modelodeusodevalormselevadoymscrticoparasusdatos.Silosdatosquesemodelanson tabularesdemaneranatural,porloregular,esmejorrepresentarlosenunformatorelacionalque hacerloconelformatoXML.Sinembargo,existenalgunoscasosenlosqueelmodelorelacional noesnecesariamentelamejorelecciny,enocasiones,inclusosetratadeunamalaeleccinpara manejarsusdatos.LassiguientessonalgunassituacionesenlasquelarepresentacinXML tiendeasermsbenficaqueelformatorelacional.
Cuandoelesquemaesvoltil.
Problema con los datos relacionales:Sielesquemadelosdatoscambiaconfrecuencia, entonceslarepresentacindelosdatosenformarelacionaltienecomoresultadoqueseincurreen costosyenunasobrecargaporlamodificacindelesquemarelacional.Mientrasquealgunas formasdemodificacinalesquemasonrelativamentesencillasenlasbasesdedatosrelacionales, comoelagregarunanuevacolumnaaunatabla,otrasformassonmscomplicadas,comoel eliminarunacolumnaoelmodificareltipodeunacolumna.Anas,hayotrasformasde modificacionesdeesquemasquesonabsolutamentedifciles,comolanormalizacindeunatablaen mltiplestablas.Lamodificacindelastablassignificaentoncesquelasaplicacionesnecesitan modificarlasinstruccionesSQLquetienenaccesoastas.
Cuandolosdatossonjerrquicosdemaneraintrnsecaporsunaturaleza.
Problema con los datos relacionales:Losdatosquesonjerrquicosorecursivosdemanera intrnsecaconfrecuenciasondifcilesderepresentarenesquemasrelacionales.Comoejemplosdeesto seincluyenlistasdemateriales,objetosdeingenieraodatosbiolgicos.Laexplosindeunalistade materialespuedealmacenarseenunabasededatosrelacionalperoelreconstruirlaenpartesoensu totalidadpodrarequerirelusorecursivodeSQL.
Pgina 6
Cuandolosdatosrepresentanobjetosdenegocios.
Problema con los datos relacionales:Silosdatosdelaaplicacinrepresentanobjetosde
negocios,comoformulariosdereclamacindeunseguro,entonces,confrecuenciaesbenfico mantenerjuntosloselementosdedatosqueintegranunareclamacinenparticular,enlugarde esparcirlosenunconjuntodetablas.Estoesparticularmenteciertocuandoloselementosdelos datosindividualesdeunformulariodereclamacinnotienensignificadocomercialvlidopors mismosyslopuedeninterpretarseenelcontextodelformulariocompleto.Lanormalizacinde reclamacionesalolargodedocenasdetablasrelacionalessignificaquelaaplicacintieneque lidiarconunafragmentacincomplejaypoconaturaldesusdatosdenegocios.Estoincrementa lacomplejidadylaprobabilidaddequesepresentenerrores.
Cuandolosobjetostienenatributosescasos
Problema con los datos relacionales:Algunasaplicacionestienenungrannmerode posiblesatributos,lamayoradeloscualessonescasos,estoes,losatributossonaplicablesamuy pocosobjetos.Unejemploclsicoesuncatlogodeproductosendondeelnmerodeatributosde losdiferentesproductosesenorme,loqueincluye:tamao,color,peso,longitud,altura,estilo,tipo detejido,voltaje,resolucin,resistenciaalaguayunalistacasiinterminabledeotraspropiedades. Paracualquierproductodado,slounsubconjuntodeestosatributosesrelevante.Unenfoque relacionalposibleesalmacenarestosdatosparatenerunacolumnaporatributo,loquesignificaque ungranporcentajedelasceldasenlatablacontengavaloresNULOS.Estonoesdeseableypuede resultarineficaz.Unenfoquerelacionaldiferenteparaesosdatosescasosesunatablacontres columnasquealmacenevariosparesdenombres/valoresparacadaidentificadordeproducto.Esto significaquelosnombresdelosatributosnosonlosnombresdelascolumnassinovaloresenuna columnadeltipoVARCHAR(delongitudvariable).Estoevitaquelossistemasdebasesdedatos relacionalesestimenconexactitudunaselectividadderestriccionesygenerenplanesdeconsulta eficaces.Asimismo,eldefinireimponerrestricciones,comolasingularidaddeunciertoatributo,es extremadamentecomplejo.
Solucin con datos XML:LabellezadeXMLesqueloselementosylosatributospuedenser opcionales,demodoquesimplementeseomitensinoseaplicanaunproductoespecfico.Nilos valoresNULOSnilosparesdenombres/valoressonnecesarios.ElesquemaXMLpuededefinir ungrannmerodeelementosopcionales;sinembargo,slounoscuantosdestosseutilizan paracualquierobjetodado.Mientrasqueenunatablarelacionalcadafiladebetenerelnmero exactodecolumnas,losdocumentosXMLencolumnasXMLpuedentenerdiferenteselementos deunafilaalaotra.Asimismo,unndiceXMLparaunelementoopcionalsermuypequeosi esteelementoaparecesloenunporcentajepequeodedocumentos(filas).staesunaclara ventajaconrespectoalosndicesrelacionalesquetienenexactamenteunaentradaporfila.
Pgina 7
Cuandolosdatosnecesitanintercambiarse
Problema con los datos relacionales:Siustedexportaunconjuntodefilasdeunatabla relacionalyloenvaaunaaplicacinuorganizacindistinta,eldestinatarionopuedeinterpretar losdatossinlosmetadatosadicionalesquedescribanlascolumnas.Estoesparticularmenteciertosi suesquemarelacionalsehamodificadodesdelaltimavezqueenvilosdatos.
BeneficiosdeDB2pureXMLconrespectoaotrasopcionesde almacenamiento.DadoqueXMLsehavueltocadavezmscrticoparalasoperaciones
deunaempresa,losdocumentosXMLsonactivosquenecesitancompartirse,investigarse, protegerseyactualizarsecontotalcongruenciatransaccional.Enfuncindesuuso,losdatos XMLpodrantambinnecesitartransformarse,auditarseeintegrarseconotrosdatos.Para satisfacerestosrequerimientos,elalmacenamientodedatosXMLensuformatojerrquiconativo enunabasededatosDB2tienediversasventajas,entrelasqueseincluyen:
LaretencindelconocimientosobrelaestructurainternadelosdatosXML.Estotiene laventajaconrespectoalalmacenamientodedocumentosXMLcomoobjetosde caracteresdegrantamao(CLOBs)uobjetosbinariosdegrantamao(BLOBs)enla basededatos.Enparticular,ustedpuederealizarconsultasconfacilidadenlosdatos XMLutilizandoXQuery,XPathySQL/XMLparaaprovecharlaestructuraXMLy puedemejorareldesempeodelasconsultascreandondicesconrespectoalosdatos XML.Adems,puedeactualizar,transformarypublicarconfacilidaddatosXML utilizandoSQL,XQueryyXSLT. ElmantenimientodelanaturalezajerrquicayflexibledelosdatosXML.Estotiene ventajaconrespectoaladescomposicin(fragmentacin)delosdocumentosXMLen tablasrelacionalesendondeunadministradormapealoselementosXMLylos atributoshaciacolumnarelacionales.Despusdelafragmentacin,losvaloresdelos documentosXMLsealmacenanenestastablassinsusetiquetasoriginales.Con frecuencia,lafragmentacinrequiereungrannmerodetablasy,porloregular,esto resultademasiadocomplejoparaserprctico.LasconsultasendocumentosXML descompuestospuedenrequerirunionesSQLcomplejasquetiendenaserdifcilesde desarrollaryafinar.LoscambiosenelesquemaXMLconfrecuenciarompenelmapeo alesquemadelabasededatosrelacional.Estoconllevaincurrirenmantenimiento costosoyqueconllevamuchotiempoloqueanulalaflexibilidadporlaqueporlo regularseeligeXML.EsporestoqueDB2pureXMLlepermiteutilizarunacolumna XMLnicaparaalmacenaryrealizarconsultarendocumentosXMLqueestnbasados endiferentesesquemasXMLoenversionesdiferentesdeunesquemaXMLen evolucin. LaintegracindedocumentosXMLcondatosrelacionalesenunabasededatosnica. Estotieneventajasconrespectoalalmacenamientodedatosrelacionalesenunabasede datosydedocumentosXMLenotrabasededatosexclusivaparaXMLporseparado. Esteenfoquerequierehabilidadesypersonalparaoperarymantenerdossistemasde basesdedatosenlugardeslounsistema.Asimismo,lacombinacindedatosdedos basesdedatosporlogeneralrequierelgicaextraenlaaplicacin,loquecon frecuenciaesdifcileineficaz.CuandoustedalmacenatantodatosXMLcomo
Pgina 8