1

CAPITULO 1
1. CONCEPTOS BÁSICOS: ESTADÍSTICOS E
INFORMÁTICOS A UTILIZARSE.
1.1 Definición de Es!d"sic!
La Estadística se ocupa de los métodos y procedimientos para recoger,
clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando
la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así
como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la
toma de decisiones y en su caso formular predicciones.
Cuando colouialmente se habla de estadística, se suele pensar en una
relaci!n de datos numéricos presentada de forma ordenada y sistem"tica.
#
Esta idea es la consecuencia del concepto popular ue e$iste sobre el
término y ue cada vez est" m"s e$tendido debido a la influencia de nuestro
entorno, ya ue hoy día es casi imposible ue cualuier medio de difusi!n,
peri!dico, radio, televisi!n, etc., no nos aborde diariamente con cualuier tipo
de informaci!n estadística sobre accidentes de tr"fico, índices de crecimiento
de poblaci!n, turismo, tendencias políticas, etc.
%!lo cuando nos adentramos en un mundo m"s específico como es el campo
de la investigaci!n de las Ciencias %ociales& 'edicina, (iología, )sicología,
etc., empezamos a percibir ue la Estadística no s!lo es algo m"s, sino ue
se convierte en la *nica herramienta ue, hoy por hoy, permite dar luz y
obtener resultados, y por tanto beneficios, en cualuier tipo de estudio, cuyos
movimientos y relaciones, por su variabilidad intrínseca, no puedan ser
abordadas desde la perspectiva de las leyes deterministas. )odríamos,
desde un punto de vista m"s amplio, definir la estadística como la ciencia
ue estudia c!mo debe emplearse la informaci!n y c!mo dar una guía de
acci!n en situaciones pr"cticas ue entra+an incertidumbre.
1.# C$!sific!ción de $! Es!d"sic!
)odríamos por tanto clasificar la Es!d"sic! en desc%i&i'!, cuando los
resultados del an"lisis no pretenden ir m"s all" del con,unto de datos, y
-
es!d"sic! infe%enci!$ cuando el ob,etivo del estudio es derivar las
conclusiones obtenidas a un con,unto de datos m"s amplio.
1.( Es!d"sic! desc%i&i'!
.escribe, analiza y representa un grupo de datos utilizando métodos
numéricos y gr"ficos ue resumen y presentan la informaci!n contenida en
ellos. )ara esto se utilizan las tablas y gr"ficos de frecuencias absolutas y
relativas, y los estimadores de las medidas de tendencia central, dispersi!n,
sesgo y /urtosis.
1.(.1 T!)$!s de f%ec*enci!+ es una tabla resumen en la ue se
disponen los datos divididos en grupos ordenados numéricamente,
denominados clases o categorías. El n*mero de datos u observaciones
ue pertenecen a determinada clases de llama f%ec*enci! de c$!se, el
punto medio de cada clase o categoría se llama ,!%c! de c$!se y la
longitud de una clase se conoce como ine%'!$- de c$!se. La f%ec*enci!
!)s-$*! es el n*mero o cantidad de observaciones iguales o
seme,antes ue se encuentran comprendidas dentro de un determinado
intervalo de clase& mientras la f%ec*enci! %e$!i'! es el cociente ue
resulta de dividir la frecuencia absoluta de una clase para la suma total
de frecuencias de todas las clases de una tabla de frecuencias.
0
Re&%esen!ción .%/fic!.0 La representaci!n gr"fica de una distribuci!n de
frecuencias depende del tipo de datos ue la constituya.
1.(.# Re&%esen!ción .%/fic!:
1.(.#.1 .iagrama de sectores& Est" representaci!n gr"fica consiste en
dividir un círculo en tantos sectores circulares como modalidades
presente el car"cter cualitativo, asignando un "ngulo central a cada
sector circular proporcional a la frecuencia absoluta ni, consiguiendo de
esta manera un sector con "rea proporcional también a ni.
1.(.#.# 1istograma& 2l ser esta representaci!n una representaci!n por
"reas, hay ue distinguir si los intervalos en los ue aparecen agrupados
los datos son de igual amplitud o no.
1.(.( Medid!s desc%i&i'!s
Los fen!menos biol!gicos no suelen ser constantes, por lo ue ser"
necesario ue ,unto a una medida ue indiue el valor alrededor del cual se
agrupan los datos, se asocie una medida ue haga referencia a la
variabilidad ue refle,e dicha fluctuaci!n. Estudiaremos los estadísticos ue
nos van a orientar sobre cada uno de estos niveles de informaci!n& valores
alrededor de los cuales se agrupa la muestra, la mayor o menor fluctuaci!n
alrededor de esos valores, nos interesaremos en ciertos valores ue marcan
3
posiciones características de una distribuci!n de frecuencias así como su
simetría y su forma. 45er figura 1.16
Fi1*%! 1.1 'edidas representativas de un con,unto de datos estadísticos
En este sentido pueden e$aminarse varias características, siendo las m"s
comunes&
 La tendencia central de los datos;
 La dispersión o variación con respecto a este centro;
 Los datos ue ocupan ciertas posiciones.
 La simetría de los datos.
 La forma en la ue los datos se agrupan.
1.(.2 Es!d"sic-s de endenci! cen%!$: las tres medidas m"s usuales de
tendencia central son la media, mediana y moda.
7
1.(.2.1 L! Medi!. 8ambién llamada media aritmética, es una medida
descriptiva ue se calcula sumando los valores numéricos y dividiendo
entre el n*mero de valores. 2 la media poblacional se la conoce como μ
4mu6 y la media muestral como x 4$ barra6. C"lculo de la media
poblacional 9&
x
N
µ =

.onde : es el tama+o de la poblaci!n y $ son los valores de los datos de
la poblaci!n.
C"lculo de la media muestral x &
x
x
n
=

.onde n es el tama+o de la muestra y $ son todos los valores ue toma la
muestra.
1.(.2.# L! Medi!n! es el valor central de la variable, es decir,
supuesta la muestra ordenada en orden creciente o decreciente, el valor
ue divide en dos partes la muestra. La principal característica de esta
medida es ue al menos el 3;< de las observaciones son menores o
iguales a ella.
=
Calculo de la mediana& cuando : es impar, hay un término central
1
2
N
x
+

ue ser" el valor de la mediana. Cuando : es par, hay dos términos
centrales la mediana ser" el promedio de estos dos valores.
1.(.2.( L! ,-d! es el valor de la variable ue tenga mayor frecuencia
absoluta, la ue m"s se repite, es la *nica medida de centralizaci!n ue
tiene sentido estudiar en una variable cualitativa, pues no precisa la
realizaci!n de ning*n c"lculo
1.(.3 Medid!s de '!%i!)i$id!d - dis&e%sión
Los estadísticos de tendencia central o posición nos indican donde se sit*a
un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si
esas puntuaciones o valores est"n pr!$imas entre sí o si por el contrario
est"n o muy dispersas. 2lgunas de las principales medidas son&
1.(.3.1 R!n1-. %e obtiene restando el valor m"s ba,o de un con,unto
de observaciones del valor m"s alto, se denota como >. Es f"cil de
calcular y sus unidades son las mismas ue las de la variable, aunue
posee varios inconvenientes&
 :o utiliza todas las observaciones 4s!lo dos de ellas6;
 %e puede ver muy afectada por alguna observaci!n e$trema;
?
 El rango aumenta con el n*mero de observaciones, o bien se ueda
igual. En cualuier caso nunca disminuye.
1.(.3.# 4!%i!n5!. Es una medida de dispersi!n ue mide la tendencia
de las observaciones individuales a desviarse con respecto a la media.
La varianza para los datos de una poblaci!n esta determinada por la
siguiente ecuaci!n&
2
2
( ) x
N
µ
σ

=

.onde $ son los valores de la poblaci!n, μ es la media poblacional y :
es el n*mero de observaciones en la poblaci!n.
1.(.3.( Des'i!ción Es/nd!% también mide la variabilidad de las
observaciones con respecto a la media, es igual a la raíz cuadrada de la
varianza. Esta medida de dispersi!n siempre es positiva y se denota por
σ
. %e calcula a través de la ecuaci!n&
2
( ) x
N
µ
σ

=

1.(.6 Medid!s de &-sición. Las medidas de posici!n o localizaci!n dividen
la distribuci!n en partes iguales, sirven para clasificar a un individuo o
elemento dentro de una determinada poblaci!n o muestra. @stas son&
Cuartiles& divide a la poblaci!n o muestra en cuatro partes iguales.
A
.eciles& divide a la poblaci!n en diez partes iguales.
)ercentiles& divide a la poblaci!n en cien partes iguales.
1.(.7 Si,e%"! de $-s d!-s. %abemos c!mo calcular valores alrededor de
los cuales se distribuyen las observaciones de una variable sobre una
muestra y sabemos c!mo calcular la dispersi!n ue ofrecen los mismos con
respecto al valor de central. :os proponemos dar un paso m"s all" en el
an"lisis de la variable. En primer lugar, nos vamos a plantear el saber si los
datos se distribuyen de forma simétrica con respecto a un valor central, o si
bien la gr"fica ue representa la distribuci!n de frecuencias es de una forma
diferente del lado derecho que del lado izquierdo.
1.(.8 Medid! de !&*n!,ien-+ C*%-sis& La curtosis es una medida del
apuntamiento, ue nos indicar" si la distribuci!n es muy apuntada o poco
apuntada. Este coeficiente lo vamos a denotar por 9 y se calcula seg*n la
siguiente e$presi!n&
1.2 ESTADISTICA INFERENCIAL
1;
El prop!sito de un estudio estadístico suele ser, como hemos venido citando,
e$traer conclusiones acerca de la naturaleza de una poblaci!n. 2l ser la
poblaci!n grande y no poder ser estudiada en su integridad en la mayoría de
los casos, las conclusiones obtenidas deben basarse en el e$amen de
solamente una parte de la muestra, lo ue nos lleva, en primer lugar a la
,ustificaci!n, necesidad y definici!n de las diferentes :cnic!s de ,*es%e-.
Los primeros términos obligados a los ue debemos hacer referencia, ser"n
los de es!d"sic- y esi,!d-%.
.entro de este conte$to, ser" necesario asumir un estadístico o estimador
como una variable aleatoria con una determinada distribuci!n, y ue ser" la
pieza clave en las dos amplias categorías de la inferencia estadística& la
esi,!ción y el c-n%!se de ;i&óesis.
El concepto de estimador, como herramienta fundamental, lo caracterizamos
mediante una serie de propiedades ue nos servir"n para elegir el Bme,orC
para un determinado par"metro de una poblaci!n, así como algunos métodos
para la obtenci!n de ellos, tanto en la estimaci!n puntual como por
intervalos.
11
La tarea fundamental de la estadística inferencial, es hacer inferencias
acerca de la poblaci!n a partir de una muestra e$traída de la misma.
1.2.1 T:cnic!s de ,*es%e- s-)%e *n! &-)$!ción
La teoría del muestreo tiene por ob,etivo, el estudio de las relaciones
e$istentes entre la distribuci!n de un car"cter en dicha poblaci!n y las
distribuciones de dicho car"cter en todas sus muestras.
Las venta,as de estudiar una poblaci!n a partir de sus muestras son
principalmente&
 Coste reducido
 'ayor rapidez
 '"s posibilidad de estudio

.e este modo se ve ue al hacer estadística inferencial debemos
enfrentarnos con dos problemas&
• Elecci!n de la muestra (muestreo).
• E$trapolaci!n de las conclusiones obtenidas sobre la muestra, al resto
de la poblaci!n (inferencia).
1#
1.2.# Ti&-s de e%%-%es
Entre la muestra con la ue se traba,a y la poblaci!n de interés, aparece la
denominada poblaci!n de muestreo& poblaci!n 4la mayor parte de las veces
no definida con precisi!n6 de la cual nuestra muestra es una muestra
aleatoria. En consecuencia la generalizaci!n est" amenazada por dos
posibles tipos de errores& error aleatorio ue es el ue las técnicas
estadísticas permiten cuantificar y críticamente dependiente del tama+o
muestral, pero también de la variabilidad de la variable a estudiar y el error
sistem"tico ue tiene ue ver con la diferencia entre la poblaci!n de
muestreo y la poblaci!n de interés y ue s!lo puede ser controlado por el
dise+o del estudio.
El problema se resuelve en base al conocimiento de la "distribución
muestral" del estadístico ue se use. Concretando, por e,emplo en la media.
%i para cada muestra posible calculamos la media muestral 4 6 obtenemos
un valor distinto 4 es un estadístico& es una variable aleatoria y s!lo
depende de la muestra6, habr" por tanto una fpd para , llamada distribuci!n
muestral de medias. La desviaci!n típica de esta distribuci!n se denomina
error típico de la media. Evidentemente, habr" una distribuci!n muestral para
cada estadístico, no s!lo para la media, y en consecuencia un error típico
para cada estadístico.
1-
%i la distribuci!n muestral de un estadístico estuviera relacionada con alg*n
par"metro de interés, ese estadístico podría ser un estimador del par"metro.
1.3 SISTEMAS DE INFORMACION
%e est" viviendo un mundo ue avanza aceleradamente hacia la
globalizaci!n; un mundo en el ue la informaci!n via,a r"pidamente a
cualuier parte del globo terr"ueo. En este ambiente de cambio acelerado,
Dnternet ,uega un papel fundamental. Esta tecnología ue, al principio de los
a+os =; estuvo restringida al campo de la defensa y el ambiente académico,
comenz! como un e$perimento impulsado por el .epartamento de .efensa
de Estados Enidos. Esa red llamada 2>)2net fue la ue permiti!, por
primera vez, a los investigadores, científicos y académicos de los Estados
Enidos estar en contacto. Fue, la predecesora de la Dnternet. 2unue en
ocasiones no se sepa realmente de ué se trata el Dnternet, cada vez se va
haciendo mas evidente, ue éste prototipo de la Gautopista de la
informaci!nG, visionada por 2l Hore, es la herramienta ue permite acceder y
compartir desde cualuier lugar y a un ba,o precio, una cantidad ingente de
informaci!n hasta ahora ni siuiera vislumbrada.
La r"pida e$pansi!n, gracias a un incremento de su funcionalidad y facilidad
de uso, la ha ale,ado de sus primeros usuarios e$clusivamente militares y
10
científicos, y la ha llevado a incluir una gama de informaci!n ue oscila desde
los temas m"s desconocidos, hasta los de importancia mundial.
.entro de esta vasta y heterogénea cantidad de informaci!n, la 'edicina no
podía ser a,ena, ya ue esta disciplina es una en las ue se usa y necesita
mayor cantidad de informaci!n, adem"s de la importancia ue posee
.

Dnternet y el desarrollo de nuevas tecnologías asociadas, est" revolucionando
campos de la medicina como la educaci!n médica continuada, investigaci!n,
telemedicina, o incluso los sistemas de informaci!n y redes internas de los
centros sanitarios. %in embargo, Dnternet no es s!lo una fuente valiosa para
encontrar lo m"s relevante en investigaci!n y educaci!n médica, sino
también, un importante recurso de informaci!n en el entorno clínico.
La informaci!n médica, en tanto ue conocimiento médico *til para el
cuidado de los pacientes individuales, proviene, por un lado, de la obtenida
del paciente a partir de la historia y e$amen clínico, resultados de pruebas
diagn!sticas, etc. y por otro, de lo ue conocemos como saber médico en
forma de investigaci!n original, revisiones, libros de te$to, guías de pr"ctica
clínica o en forma de e$periencia acumulada por el médico pr"ctico.
El principal atractivo ue ofrece hoy Dnternet, es el servicio denominado
World Wide Web, ue proporciona una interfaz gr"fica donde la informaci!n
13
se presenta en forma de p"ginas unidas con enlaces hiperte$to y por las ue
es f"cil desplazarse para buscar documentos.
En el World Wide Web 4Web o WWW6 los documentos no s!lo est"n en
formato te$to, sino ue pueden contener im"genes, películas, sonidos y
gr"ficos en tres dimensiones, lo ue le da una auténtica capacidad
multimedia. El Ieb permite saltar mediante un GhiperenlaceG de una p"gina a
otra, situadas en el mismo ordenador o en uno remoto, se compone así una
red ue simplifica y agiliza el acceso a la informaci!n, independientemente
de donde ésta se encuentre.
:o s!lo se puede encontrar informaci!n en Dnternet, también se puede
publicar. Ena vez en formato electr!nico, hacer accesible la informaci!n en la
red es relativamente f"cil y econ!mico. )rogramas y protocolos, boletines de
informaci!n terapéutica y otros documentos ue publican las "reas de salud,
ue hasta ahora se comportaban como literatura gris, se hacen ahora visibles
para sus usuarios y toda la comunidad científica. La publicaci!n de libros y
otros materiales en el III permite a+adir a estos documentos la capacidad
multimedia, la posibilidad de unir mediante enlaces a otros documentos,
nueva informaci!n a la ue contiene el te$to original y sobre todo superar uno
de sus mayores handicaps& la actualizaci!n peri!dica.
17
Ena base de datos dedicada a la medicina es 'edline, una de las me,ores y
m"s utilizadas del mundo, la cual gracias a Dnternet, se puede acceder de
forma gratuita.
Las herramientas como el Ieb permiten agrupar en *nico documento la
distinta informaci!n ue genera el encuentro clínico, desde te$to a im"genes
diagn!sticas, pasando por sonidos o gr"ficos. 2 la vez se puede integrar el
registro clínico con los sistemas de gesti!n generales y con recursos médicos
de redes e$ternas como la propia Dnternet. El desarrollo de un sistema de
informaci!n global en las organizaciones sanitarias, se beneficia así de las
potentes soluciones tecnol!gicas creadas y probadas día a día en Dnternet.
Dnternet no es todavía la soluci!n a los problemas de informaci!n planteados
por los médicos. La comple,idad en las herramientas necesarias para su uso,
lo e$tensivo y comple,o de la informaci!n contenida en ella, son razones para
ue el uso de Dnternet sea a*n reducto de entusiastas. 2 esto se a+adiría la
incapacidad de los empleadores o instituciones en las ue los médicos
traba,an, para proporcionar el euipo necesario en el lugar de traba,o.
%in embargo Dnternet est" cambiando la forma en ue las personas acceden
a la informaci!n y se comunican en todo el mundo. La forma de acceder a la
informaci!n médica y los sistemas de informaci!n sanitarios se ver"n
modificados a medio plazo, dando una nueva oportunidad para proporcionar
un me,or cuidado a nuestros pacientes. Dnternet, a poco ue se perfeccione,
1=
ser" esa herramienta física y funcionalmente accesible, ue el médico de
atenci!n primaria necesita en su uehacer diario
.
Los importantes cambios sociales, políticos y econ!micos en las sociedades
est"n condicionando la evoluci!n de los modelos sanitarios y asistenciales
tradicionales. Los cambios demogr"ficos, el incremento de los costos de la
sanidad, la necesidad de me,orar la calidad asistencial, la b*sueda de
euidad social, y la apertura de nuevos mercados, son algunos de los
aspectos ue hacen necesaria una nueva concepci!n de la asistencia
sanitaria en la ue fuera de toda duda, las tecnologías de la informaci!n y la
telecomunicaci!n ,uegan un papel importante.
)or sistemas de informaci!n médica se entiende la parte de la inform"tica
médica ue se ocupa del estudio y utilizaci!n de la inform"tica y de la
informaci!n en el "rea de la %alud y de la asistencia sanitaria.
)or lo tanto, la implementaci!n del sistema de informaci!n para médicos
permitiría al médico, me,orar el acceso a informaci!n complementaria para su
desempe+o y por lo tanto me,oraría la calidad y atenci!n de las personas ue
acuden diariamente a alg*n centro de salud.
1?
1.3.1 Benefici-s !$ i,&$!n!% *n sise,!s de inf-%,!ción &!%!
,:dic-s
2l implementar el sistema de informaci!n para médicos, el usuario podr"
acceder mediante una interfaz sencilla y orientada a los siguientes
beneficios&
1.3.1.1 Información médica de forma continua& El médico se mantendr"
informado sobre la realizaci!n de talleres, cursos, ,ornadas o congresos
ue sean de su interés.
1.3.1.# uto evaluación médica continua& El médico permanecer" en
una constante evaluaci!n supervisada por especialistas en el "rea, para
me,orar sus habilidades y destrezas en el medio. En con,unto de
preguntas, temas y discusi!n de enfermedades ue reuieran un
tratamiento especial con mayor profundidad.
1.3.1.( cceso a información médica en bases de datos reconocidas&
El médico podr" obtener informaci!n médica de avanzada sobre t!picos
de interés en lo referente a la actualidad médica y científica regional,
nacional e internacional. Con la cone$i!n a Dnternet la permitir" acceder a
1A
una ilimitada fuente de informaci!n como al servidor tem"tico de
biosalud, bases de datos como& 'edline, 8o$line, etc.
1.3.1.2 !onsultar casos clínicos a médicos especialistas& El médico
podr" consultar casos clínicos de su pr"ctica diaria, con especialistas en
el "rea, me,orando los resultados médicos con mayor satisfacci!n y
comodidad para el paciente.
1.3.# F%!c!s-s en $! i,&$e,en!ción
1.3.#.1 Compra de hardJare sin tener en cuenta su programaci!n,
generalmente debido a los grupos de mar/eting ue venden m"uinas
asegur"ndoles ue les van a solucionar todos los problemas. El
1ardJare es una parte del plan de informatizaci!n y sus características
deben estar supeditadas a las necesidades del lugar y al tipo de softJare
a utilizar.
1.3.#.# .esconocimiento inform"tico del medio hospitalario. Las
principales, surgen de la falta de especializaci!n en el tema de
inform"tica médica, esto genera un di"logo de sordos entre el profesional
médico y el inform"tico, uien no sabe interpretar las necesidades del
usuario y como consecuencia desarrolla implementaciones poco
#;
pr"cticas ue no se pueden utilizar. 1oy en día la inform"tica médica es
una especialidad. La mayoría de las facultades de medicina est"n
incorporando la materia en el currículo universitaria.
1.3.#.( Falta de planificaci!n. 2l no definir los ob,etivos a corto,
mediano y largo plazo, ni de desarrollar un plan donde se estudia la
asignaci!n de recursos y esto lleva a abortar el proyecto. %in la adecuada
es imposible efectuar una implementaci!n duradera.
1.3.#.2 :o tener en cuenta la evoluci!n del sistema y futuras
adaptaciones a las necesidades del medio. )ermanentemente es
necesario realizar adaptaciones y modificaciones, siendo necesario
contemplar en la implementaci!n de los sistemas el mantenimiento y la
evoluci!n del mismo.
1.3.#.3 :o incorporar las nuevas tecnologías en hardJare y softJare.
La evoluci!n de hardJare es vertiginosa y debe ir adecu"ndose el mismo
en forma permanente. :o e$iste un euipo de computaci!n eterno, sino
m"s bien por el contrario, el hardJare tiene muy corta vigencia 4por m"s
ue siga funcionando varios a+os6 desde el punto de vista tecnol!gico.
#1
1.3.#.6 Falta de decisi!n política para la implementaci!n de la
informatizaci!n. E$iste en muchos sectores ue ponen resistencia a la
incorporaci!n de la inform"tica por diferentes razones. %in una decisi!n
política de implementarla, el plan va indudablemente al fracaso.
1.3.#.7 .esarrollar sistemas aut!nomos y no un sistema global ue
permita la independencia de tareas. %i cada sector tiene su sistema sin
tener en cuenta el proyecto global el sistema no cuenta con una
planificaci!n y va al infortunio.
1.3.#.8 La falta de familiaridad de médicos y paramédicos para con las
computadoras.
1.3.#.< La interfaz con el usuario es lo m"s amigable posible. Ena
interfaz ue dificulte la interacci!n del operador con la computadora es un
factor conocido de rechazo del uso de computadoras. El perfil actual y
futuro de usuario de computadoras es el de un individuo completamente
ignorante del funcionamiento de una computadora, lo cual impone una
conducta a dise+adores y administradores ue es bien clara& proveer
sistemas de computaci!n en los ue él di"logo con el operador sea
simple e impliue el menor esfuerzo de aprendiza,e posible. El concepto
se basa en el reemplazo de los comandos de línea y men*s de los
##
sistemas operativos cl"sicos, por símbolos gr"ficos o iconos ue son
verdaderos representaciones gr"ficas de ob,etos reales. En e,emplo bien
conocido es el reemplazo del comando KborrarL por el de un peue+o
dibu,o de un cesto de basura hacia el cual son desplazadas las
representaciones gr"ficas del archivo a borrar.
1.3.#.1= La falta de soporte técnico multidisciplinario, ue no lleve a cabo
las modificaciones y adaptaciones ue se reuieren en cada sector.
1.6 BASES DE DATOS
(ase de datos es cualuier con,unto de datos organizados para su
almacenamiento en la memoria de un ordenador o computadora, dise+ado
para facilitar su mantenimiento y acceso de una forma est"ndar. La
informaci!n se organiza en campos y registros. En campo se refiere a un tipo
o atributo de informaci!n, y un registro, a toda la informaci!n sobre un
individuo. )or e,emplo, en una base de datos ue almacene informaci!n de
tipo agenda, un campo ser" el :M'(>E, otro el :DF, otro la .D>ECCDN:...,
mientras ue un registro viene a ser como la ficha en la ue se recogen todos
los valores de los distintos campos para un individuo, esto es, su nombre,
:DF, direcci!n... Los datos pueden aparecer en forma de te$to, n*meros,
#-
gr"ficos, sonido o vídeo. :ormalmente las bases de datos presentan la
posibilidad de consultar datos, bien los de un registro o los de una serie de
registros ue cumplan una condici!n. 8ambién es frecuente ue se puedan
ordenar los datos o realizar operaciones sencillas, aunue para c"lculos m"s
elaborados haya ue importar los datos en una ho,a de c"lculo. )ara facilitar
la introducci!n de los datos en la base se suelen utilizar formularios; también
se pueden elaborar e imprimir informes sobre los datos almacenados.
.esde su aparici!n en la década de 1A3;, estas aplicaciones se han hecho
imprescindibles para las sociedades industriales. La primera base de datos
para )C data de 1A?;; era el d(ase DD, desarrollado por el ingeniero
estadounidense Iayne >atliff. .esde entonces, su evoluci!n ha seguido
paralela a la ue ha e$perimentado el softJare, y hoy e$isten desde bases
de datos para una utilizaci!n personal hasta bases de datos corporativas,
soportadas por grandes sistemas inform"ticos.
1ay cuatro modelos principales de bases de datos& el modelo ,er"ruico, el
modelo en red, el modelo relacional 4el m"s e$tendido hoy día; los datos se
almacenan en tablas y se accede a ellos mediante consultas escritas en
%OL6 y el modelo de bases de datos deductivas. Mtra línea de investigaci!n
en este campo son las bases de datos orientadas a ob,eto, o de ob,etos
persistentes.
#0
1.6.1 M--%es de B!ses de D!-s
M.(C Mpen .atabase Connectivity
ML2) Mnline 2nalytical )rocessing
ML8) Mnline 8ransaction %ystem
.%% .ecision %upport %ystem
.282 Iarehouse ML8) P .%%. Ena de las características
principales del data Jarehouse es ue permite ue todos
constantemente procesen y carguen datos. Etilizan las staging
tables esto permite ue el %OL mane,e solo los datos
.282 'arts
Dnformaci!n sobre los motores de bases de datos lo puede consultar en la
bibliografía recomendada en esta tesis.
1.6.# S>L ?S%*c*%ed >*e%@ L!n1*!1eA
Lengua,e de consulta estructurado, en inform"tica, un lengua,e utilizado en
bases de datos para consultar, actualizar y mane,ar bases de datos
relacionales, una base de datos relacional utiliza los valores coincidentes de
campos comunes de dos tablas para relacionar informaci!n de ambas. %e
deriva de un proyecto de investigaci!n de D(', ue cre! el Glengua,e
#3
estructurado de consulta en inglésG 4%EOEEL6 a mediados de la década de
1A=;. El %OL es un est"ndar aceptado en productos de bases de datos, ue
fue utilizado comercialmente por primera vez por la empresa Mracle en 1A=A.
2 pesar de ue no se trata de un lengua,e de programaci!n como puedan
serlo C o )ascal, puede utilizarse en el dise+o de consultas interactivas y
puede incluirse en una aplicaci!n como un con,unto de instrucciones de
mane,o de datos 4sentencias6. )or e,emplo, bas"ndose en soportes e$ternos
al propio lengua,e y aun al propio programa ya compilado 4como es un
servidor o un motor %OL ue haga de puente entre la aplicaci!n, el sistema
operativo y las bases de datos6, lengua,es como 5isual (asic o CQCPP
pueden incluir sentencias %OL en su c!digo.
2unue en el mercado se pueden encontrar diversas variantes 4dialectos6 del
lengua,e %OL, todos tienen un mínimo com*n basado en el est"ndar 2:%D
%OL de 1A?7, con e$tensiones propietarias. .esde 1AA1 se fueron realizando
progresos para disponer de un est"ndar cada vez m"s completo, conocido
como %2H %OL, propiciado por el denominado %OL 2ccess Hroup.
El %OL est"ndar cuenta con elementos destinados a la definici!n,
modificaci!n, control, protecci!n de los datos y acceso a bases de datos
distribuidas en una red, haciendo factible ue varios usuarios puedan
consultar la misma base de datos de forma simult"nea. .ebido a su
#7
simplicidad, ue proviene de ser sint"ctica y gramaticalmente cercano al
lengua,e natural, pueden utilizarlo tanto los usuarios técnicos como los ue
no lo son; esto, unido a su potencia, lo ha hecho muy popular.
1.6.( C-,&-nenes de$ S>L
El lengua,e %OL est" compuesto por comandos, cl"usulas, operadores y
funciones de agregado. Estos elementos se combinan en las instrucciones
para crear, actualizar y manipular las bases de datos.
1.6.(.1 C-,!nd-s. E$isten dos tipos de comandos&
a6 Los DDL ?D!! Definii-n L!n1*!1eA ue permiten crear,
eliminar y modificar tablas, campos e índices en la base de
datos, con las instrucciones Create, .rop y 2lter
respectivamente.
b6 Los DML ?D!! M!ni&*$!i-n L!n1*!1eA ue permiten generar
consultas para ordenar, filtrar y e$traer datos de la base de
datos, con las instrucciones %elect, Dnsert, Epdate, .elete.
#=
1.6.(.# C$/*s*$!s. Las cl"usulas son condiciones de modificaci!n
utilizadas para definir los datos ue desea seleccionar o manipular. Entre
ellas est"n&
a6 F%-,& 8abla de la cual se van a seleccionar los registros.
b6 B;e%e: Condiciones ue deben reunir los registros a
seleccionar.
c6 .%-*& )@& %eparar en grupos específicos los registros
seleccionados.
d6 C!'in1:Especifica condiciones ue deben satisfacer cada
grupo.
e6 O%de% )@: )ara ordenar los registros.
1.6.(.( O&e%!d-%es Ló1ic-s
a6 And: Eval*a dos condiciones y devuelve un valor de verdad
s!lo si ambas son ciertas, es el ByC l!gico.
b6 O%: Eval*a dos condiciones y devuelve un valor de verdad si
alguna de las dos es cierta, es el BoC l!gico.
c6 N-: .evuelve el valor contrario de la e$presi!n, es la
negaci!n l!gica.
#?
1.6.(.2 O&e%!d-%es de C-,&!%!ción
a6 D 'enor ue
b6 E 'ayor ue
c6 DE .istinto de
d6 DF 'enor ! igual ue
e6 EF 'ayor ! igual ue
f6 F Dgual ue
g6 BeGeen, especifica un intervalo de valores
h6 LiHe, se utiliza para comparar un modelo
i6 In, especifica registros de una bases de datos.
1.6.(.3 F*nci-nes de !1%e1!d-
Las funciones de agregado se usan dentro de una cl"usula %ELEC8
en grupo de registros para devolver un *nico valor ue se aplica a un
grupo de registros. 8enemos&
a6 A4.: Calcula el promedio de un campo determinado
b6 COUNT: .evuelve el n*mero de registros de la selecci!n
c6 SUM: .evuelve la suma de los valores de un campo
determinado
d6 MAI .evuelve el m"$imo valor de un campo especificado
e6 MIN: .evuelve el mínimo valor de un campo especificado
#A
La base de datos posee adem"s ob,etos como&
a6 8abla
b6 Rndice
c6 5ista
d6 )rocedimientos almacenados
e6 Funci!n o rol
f6 .esencadenador
1.7 LEN.UAJES DE PRO.RAMACIKN
2l desarrollarse las primeras computadoras electr!nicas, se vio la necesidad
de programarlas, es decir, de almacenar en memoria la informaci!n sobre la
tarea ue iban a e,ecutar. Las primeras se usaban como calculadoras
simples; se les indicaban los pasos de c"lculo, uno por uno.
Los lengua,es m"s primitivos fueron los lengua,es de m"uina. Esto, ya ue
el hardJare se desarroll! antes del softJare, y adem"s cualuier softJare
finalmente tiene ue e$presarse en el lengua,e ue mane,a el hardJare.
La programaci!n en esos momentos era sumamente tediosa, pues el
programador tenía ue Gba,arseG al nivel de la m"uina y decirle, paso a
paso, cada punto de la tarea ue tenía ue realizar. 2dem"s, debía
e$presarlo en forma numérica; y por supuesto, este proceso era propenso a
-;
errores, con lo ue la productividad del programador era muy limitada. %in
embargo, hay ue recordar ue en estos momentos, simplemente a*n no
e$istía alternativa.
El primer gran avance ue se dio, como ya se coment!, fue la abstracci!n
dada por el Lengua,e Ensamblador, y con él, el nacimiento de las primeras
herramientas autom"ticas para generar el c!digo m"uina. Esto redu,o los
errores triviales, como podía ser el n*mero ue correspondía a una
operaci!n, ue son sumamente engorrosos y difíciles de detectar, pero
f"ciles de cometer. %in embargo, a*n auí es f"cil para el programador
perderse y cometer errores de l!gica, pues debe ba,ar al nivel de la forma en
ue traba,a el C)E, y entender bien todo lo ue sucede dentro de él.
Con el desarrollo en los 3;Ss y 7;Ss de algoritmos de m"s elevado nivel, y el
aumento de poder del hardJare, empezaron a entrar al uso de computadoras
científicos de otras ramas; ellos conocían mucho de Física, Ouímica y otras
ramas similares, pero no de Computaci!n, y por supuesto, les era
sumamente complicado traba,ar con lengua,e Ensamblador en vez de
f!rmulas. 2sí, naci! el concepto de Lengua,e de 2lto :ivel, con el primer
compilador de FM>8>2: 4FM>mula 8>2:slation6, ue, como su nombre
indica, inici! como un GsimpleG esfuerzo de traducir un lengua,e de f!rmulas,
al lengua,e ensamblador y por consiguiente al lengua,e de m"uina. 2 partir
de FM>8>2:, se han desarrollado innumerables lengua,es, ue siguen el
mismo concepto& buscar la mayor abstracci!n posible, y facilitar la vida al
-1
programador, aumentando la productividad, encarg"ndose los compiladores
o intérpretes de traducir el lengua,e de alto nivel, al lengua,e de computadora.
1ay ue notar la e$istencia de lengua,es ue combinan características de los
de alto nivel y los de ba,o nivel 4es decir, Ensamblador6. 'i e,emplo favorito
es C& contiene estructuras de programaci!n de alto nivel, y la facilidad de
usar librerías ue también son características de alto nivel; sin embargo, fue
dise+ado con muy pocas instrucciones, las cuales son sumamente sencillas,
f"ciles de traducir al lengua,e de la m"uina; y reuiere de un entendimiento
apropiado de c!mo funciona la m"uina, el uso de la memoria, etcétera. )or
ello, muchas personas consideramos a lengua,es como C 4ue fue dise+ado
para hacer sistemas operativos6, lengua,es de nivel medio.
1.7.1 CTML.0 C-nce&-s .ene%!$es
8odas las p"ginas IE( han sido creadas usando un lengua,e especial
conocido como 1yperte$t 'ar/up Langua,e 418'L6, ue permite organizar
te$to, gr"ficos, animaci!n y sonido en documentos ue un Jeb broJser
4programa ue interpreta este lengua,e y visualiza la informaci!n en la
pantalla del computador6 pueda reconocer. 18'L es el lengua,e ue hace el
hiperte$to e hipermedia posibles.
2unue 18'L es en verdad un lengua,e, no es del tipo de lengua,es ue
típicamente est"n asociados a las computadoras y el desarrollo de softJare.
-#
:o es necesario estudiar durante a+os o tener una colegiatura para
aprenderlo. En lugar de esto, 18'L es un legua,e amigable ue
pr"cticamente cualuier persona puede usar después de uno o dos días.
18'L es un legua,e ue define un con,unto de reglas y procedimientos para
preparar te$to ue va a ser distribuido, interpretado y presentado en forma
electr!nica; con 18'L, se rodea al te$to y sus referencias a archivos con
directivas especiales conocidas como tags. Los tags son usados para
especificar c!mo el te$to y los archivos aparecer"n en la pantalla cuando
ellos sean visualizados por un Jeb broJser.
El uso de tags para especificar los documentos ue se usar"n para
publicaciones electr!nicas es muy sencillo. %e puede usar un procesador de
palabras est"ndar y agregar los tags de 18'L necesarios y lograr" tener una
p"gina IE(.
Lo ue hace realmente poderoso al 18'L es su habilidad de organizar
cualuier n*mero de archivos en una sola p"gina. Los archivos ue aparecen
en una p"gina pueden estar localizados en la misma computadora ue
contiene la p"gina o en cualuier lugar de la IE(. Cada archivo es
almacenado de forma independiente con respecto a las p"ginas IE( ue las
visualizan. Lo ue hace el 18'L es guardar referencias a los archivos
necesarios, diciéndole al broJser donde ubicarlos, de manera ue se puedan
ubicar en cualuier lugar de la Jeb. En conclusi!n una p"gina Jeb es un
bloue de te$to o p"ginas de te$to con enlaces 4referencias6 a im"genes,
--
animaciones, sonido y otros archivos ue un broJser los recepciona, procesa
y visualiza.
1.7.# ASP ?Aci'e Se%'e% P!1esA
%on p"ginas Jeb din"micas ue contienen c!digo similar al de 5isual (asic,
ue se e,ecutan del lado del servidor y general c!digo 18'L del lado del
cliente. %on usadas para acceder a base de datos o realizar alguna
transacci!n solicitada por el usuario desde otra p"gina Jeb.
2ctive %erver )ages 42%)6 no se trata de un lengua,e de programaci!n sino
de una tecnología ue permite introducir codificaci!n en las p"ginas Jebs
para hacerlas din"micas e interactivas. 2 través de esta tecnología podemos
utilizar diferentes lengua,es de programaci!n para realizar las distintas
acciones ue deseemos.
El ob,etivo est"ndar de 2%) es permitir el uso de casi cualuier lengua,e de
programaci!n. %in embargo, dado ue se trata de una tecnología creada por
'icrosoft, el lengua,e ue utiliza b"sicamente es el 5(%cript y, en segundo
lugar el T%cript. El 5(%cript es una versi!n especial del 5isual (asic, con el
cual comparte la mayoría de sus funciones y mandatos. El T%cript es la
versi!n de Tava%cript realizada por 'icrosoft.
-0
.ado ue 2%) es una tecnología de 'icrosoft, s!lo tiene un funcionamiento
correcto con los servidores ue utilizar IindoJs, pero no con los ue
emplean Eni$ u otros sistemas. En estos casos se deben utilizar otras
técnicas de programaci!n como, por e,emplo, el denominado )1), ue viene
a ser euivalente del 2%). )ara probar nuestras paginas antes de instalarlas
en el servidor de Dnternet, debemos antes instalar un servidor en nuestro
sistema.
El servidor ue utilizar los sistemas de IindoJs es el denominado BDnternet
Dnformation %erverC 4D%%6, ue es un servidor de gran capacidad, potencia y
fle$ibilidad. Este servidor se est" utilizando no s!lo en Dnternet sino también
en Dntranets corporativas. E$iste una especie de versi!n reducida para
intranets y para ordenadores particulares ue se denomina B)ersonal Ieb
%erverC 4)I%6. 2mbos servidores se pueden obtener a través del Mption
)ac/ de IindoJs.