You are on page 1of 46

eUNIVERSO Y MUESTRAS

Se entiende por UNIVERSO o POBLACIN la totalidad


de individuos o elementos en los cuales puede
presentarse determinada caracterstica susceptible de
ser estudiada. Una MUESTRA a su vez, es una parte o
grupo del universo.

As por ejemplo si con el fin de conocer la estatura


media de los 5.000 alumnos de la escuela de medicina
escogemos un grupo representativo de 500 de ellos, el
universo en estudio estar formado por la totalidad de
los 5.000, y la muestra consistir de los 500 escogidos.

Las anteriores definiciones ameritan algunas explicaciones. En primer lugar, las


unidades que se estudian pueden ser personas, animales o cosas que pueden
ser conglomerados de unidad experimental, como ser una familia, una colonia
de parsitos o un bloque de viviendas. En segundo lugar, los trminos universo
y muestra son conceptos relativos, pues un conjunto de individuos puede ser
considerado como un universo para ciertos estudios o como una muestra para
otros. As por ejemplo los alumnos de la Universidad Central constituyen una
muestra con respecto a la totalidad de los universitarios del pas, pero
constituyen el universo pera dicha Universidad en particular.

Los universos pueden ser finitos e infinitos. El universo se denomina finito,


cuando est formado por un nmero limitado de unidades, como sera el
nmero de alumnos de la Universidad, de mdicos en Venezuela, etc., se
denomina infinito, cuando cuenta con un nmero ilimitado de unidades: el
nmero de estrellas en el cielo, de insectos en la naturaleza, etc., son
universos infinitos que nunca podrn ser cuantificados. En ocasiones, el
universo que se estudia puede ser hipottico y entonces se le considera como
infinito. As por ejemplo, si con el fin de ensayar una nueva droga contra la
fiebre Tifoidea se la prueba en una muestra de 20 enfermos, el universo
correspondiente estar constituido por todos los pacientes que actualmente
tienen la enfermedad y por todas las personas que alguna vez puedan
adquirirla. Igualmente, si a determinado individuo se le mide la presin arterial
en tres oportunidades diferentes, esas tres mediciones constituyen una
muestra del universo de infinitas mediciones que en dicho individuo pueden
practicarse.

VENTAJAS DEL EMPLEO DE MUESTRAS

Hay varias razones por las cuales el estudio de una muestra es preferible al de
total del universo.

Ante todo, es evidente que el estudio de muestras es el nico practicable


cuando se trata de universos infinitos o de universo limitado pero muy extenso,
pues ningn investigador sera capaz de estudiarlo en su totalidad. Lo mismo
es valedero para aquellas investigaciones en las cuales el proceso de
observacin destruye al individuo que se estudia, como en el caso en que se
prueba la accin de ciertos frmacos en animales de experimentacin. Pero
an en el caso en que se quiera estudiar un universo perfectamente limitado,
debemos decidirnos por la muestra, pues su utilizacin tiene las siguientes
ventajas:

1. Ahorra tiempo, dinero y trabajo.

2. Permite una gran exactitud en el


estudio.

En el primer punto no necesita mayores comentarios. Si quisiramos conocer


cualquier caracterstica de los 100.000 estudiantes de nuestra Universidad
Central, digamos su metabolismo basal, y para ello escogemos una muestra de
10.000 alumnos, el tiempo y el dinero y el trabajo sern aproximadamente una
dcima parte de que se invertir en el estudio de toda la poblacin estudiantil.
Por lo dems, aunque parezca paradjico que una muestra pueda dar mayor
exactitud que en el estudio de todo el universo, ello se explica fcilmente, pues
los errores debido al observador, al objeto observado y al mtodo de
observacin, pueden disminuirse y controlarse ms efectivamente.

En efecto, como ser menor el nmero de investigadores que intervengan en el


estudio, ser mucho ms fcil conseguir buenos especialistas y entrenarlos
uniformemente; como se usarn nuevos instrumentos de investigacin, stos
podrn vigilarse y calibrarse ms cuidadosamente, y como sern menos los
individuos a estudiar, ser posible estudiarlos ms adecuadamente, de tal
manera que todos estos estn en optimas condiciones de estudio. Todo lo
anterior disminuir los errores en las observaciones y por lo tanto, los
resultados obtenidos tendrn mayor exactitud.

DESVENTAJAS DEL EMPLEO DE MUESTRAS

Al lado de ventajas sealadas, la nica desventajas del uso de muestras, es el


llamado error de muestreo, el cual sumado a los 3 tipos de errores antes
mencionados, podra invalidar nuestro estudio.

Este error por muestreo es una constancia de la variabilidad de las


poblaciones. Como los individuos de toda poblacin son muy variables, los
diferentes grupos o muestras que debemos formar con ellos diferirn tambin
unos de otros como nosotros solamente estudiamos una muestra para
generalizar luego a toda la poblacin, los resultados sern algo distintos segn
la muestra que hallamos escogido, esta diferencia entre el valor dado por la
muestra y el verdadero valor del universo constituye el error por muestreo, a
condicin desde luego, que en uno y en otro caso se utilicen idnticos mtodos
de estudio, pues en caso contrario, gran parte de dicha diferencia pudiera ser
divida a errores inherentes a los mtodos empleados.

Con el fin de aclarar el anterior concepto, supongamos una poblacin de 4


personas que tuvieran respectivamente 5, 3, 2 y 10 bolvares. El capital total de
esta poblacin es de Bs. 20, o sea, un promedio de bolvares 5 por persona
(20/4 = 5). Si se desconociera dicho promedio y para averiguarlo se toma una
muestra de 2 personas, digamos las dos primeras (Bs. 5 y Bs. 3),
concluiramos a travs de esta pequea muestra, que el capital promedio de
cada persona de la poblacin es de Bs. 4, cuando en realidad vimos que era 5.
Esa diferencia de 1 bolvar entre el valor de la muestra y el valor del universo
constituye el error por muestreo.

La presencia del error por muestreo parecera indicar que el estudiar una
muestra en vez de la totalidad del universo, es desfavorable y no ventajoso
como hemos indicado. Sin embargo, conviene tener presente, en primer lugar,
que el error por muestreo suele ser mucho menos importante que los errores
debidos al observador, al mtodo de observacin y a los individuos estudiados,
y en segundo lugar, que el error por muestreo puede medirse estadsticamente
y en cierto modo, puede disminuirse a voluntad, tan solo con aumentar el
tamao de la muestra.

Por lo tanto como una muestra bien tomada permite un mejor control de los
errores debido al observador, al mtodo de observacin y a los individuos
estudiados y como por otra parte, el error por muestreo puede medirse y
disminuirse, se comprende fcilmente el por qu hemos dicho que los
resultados a partir de una muestra, son mucho ms exactos que aquellos
obtenidos del estudio de todo universo.

CONDICIONES DE UNA BUENA MUESTRA

Por lo dicho anteriormente, se deduce que no todas las muestras contienen


informacin a cerca de la poblacin de donde proceden y por consiguiente, la
muestra debe ser escogida en tal forma, que la informacin buscada se
encuentre en ella.

Las condiciones que una muestra deben tener para que sea buena, es decir para que
rinda la mayor utilidad posible, son dos. La muestra debe ser adecuada en:

a. Cantidad

b. Calidad

CANTIDAD DE INDIVIDUOS EN LA MUESTRA

El que una muestra sea buena en CANTIDAD, quiere decir que debe incluir un
nmero ptimo y mnimo de individuos. Hay frmulas estadsticas que
estudiaremos luego, mediante las cuales podemos calcular el nmero de
individuos que debemos incluir en cada investigacin, pero mientras tanto, las
siguientes consideraciones ayudarn a aclarar este punto.

Supongamos una lista de alumnos de los cuales 15 son hombres y una mujer.
Si de esta lista extraemos el nombre de un alumno y ste es un hombre, a
nadie se la ocurrira tomar esto como evidencia para afirmar que estos son del
sexo masculinos. Es evidente que en el mejor de los casos, se necesitar
extraer cuando menos dos nombres para afirmar que hay hombres y mujeres
en el curso, pero podra suceder que los 15 primeros nombres que extraigamos
sean de varones, en este caso extremo, sera necesario ver la totalidad de la
lista para asegurar con absoluta seguridad cual es la composicin verdadera
del curso. De la misma manera, si entre los 16 alumnos del curso hubiera 4 de
cada una de las regiones geogrficas del pas, sera imposible afirmar tal
hecho, con una muestra que tuviera menos de 4 individuos.

Los ejemplos anteriores aunque aparentemente pueriles, permiten sealar que


el nmero de individuos que deben incluirse en la muestra, depende, entre otros de 2
factores, a saber:

. La frecuencia con la cual el fenmeno que se estudia se encuentra en el


universo, pues es evidente que si una enfermedad representa tan solo en el 1%
de la poblacin, habr necesidad de estudiar por lo menos 100 casos para tener
la posibilidad de hallar una persona enferma, mientras que, si su frecuencia
fuera el 50%, al menos tericamente, de cada 2 personas que se estudien se
encontrar una enferma.

b. La variabilidad del universo que se estudia pues se comprende que si todos


los individuos que lo forman fueran exactamente iguales, bastara con estudiar
uno solo para conocer todo el universo en el caso opuesto, en que todos los
individuos fueran completamente diferentes. Habra que estudiarlos en su
totalidad.

CALIDAD DE LA MUESTRA

El que una muestra sea buena en CALIDAD, quiere decir que debe reflejar
fielmente las caractersticas del universo del cual procede y diferir de l slo en
el nmero de unidades incluidas.
Los aspectos referentes a la calidad de la muestra, son ms importantes que
los referentes a su cantidad y no debe pensarse que la calidad de la muestra
depende de su cantidad. Si queremos estudiar las caractersticas del pueblo
Venezolano, y nos emperamos en estudiar a los habitantes de Mrida,
aunque estudiaramos a todos ellos, nuestra muestra no sera representativa
de todo el pas.

MUESTRAS REPRESENTATIVAS Y MUESTRAS SELECCIONADAS

Lo anterior quiere decir que si queremos generalizar que lo que es cierto en la


muestra es cierto tambin en todo el universo, entonces la muestra debe ser
perfectamente representativa en l. Si la muestra no es representativa de su
universo, se dice que es una muestra seleccionada y generalmente no es
conveniente trabajar con tales muestras.

Al hablar de muestras seleccionadas debe tenerse en cuenta que este adjetivo


tiene en Estadstica un significado diferente al que se le da en la vida habitual.
En el lenguaje corriente se llama seleccionado algo que es excelente o de
ptima calidad. En estadstica por el contrario, una muestra seleccionada
puede ser mala, ya que por definicin, ella no representa su universo. No
quiere decir que una muestra seleccionada sea intil, significa tan slo, que es
necesario considerar ciertas limitaciones en las conclusiones que de ellas se
deriven. Por lo dems una muestra seleccionada, que no es representativa
para determinado problema, puede ser representativa para otro.

As por ejemplo los estudiantes de la facultad de ingeniera forman una mala


muestra para un estudio que tuviera por fin, averiguar la proporcin de hombres
y de mujeres en al Universidad Central, pues pocas mujeres eligen esta
carrera, pero formaran una muestra adecuada, si el problema fuera conocer el
porcentaje de catlicos en la universidad, pues aparentemente no hay alguna
relacin entre los sentimientos religiosos y la eleccin de la carrera que se
estudia.

La seleccin puede ser voluntaria o involuntaria. En el primer caso el


investigador conoce las limitaciones del material que est estudiando y las
conclusiones que derive debe estar de acuerdo con ellas. Un investigador, por
ejemplo que estudie las variaciones del peso de un grupo de escolares de 8
aos, no podr generalizar sus hallazgos a escolares de todas las edades sino
exclusivamente al grupo de edad investigado.

El segundo caso es ms importante, porque a menudo se ignora dicha


seleccin, se prender generalizar a toda una poblacin, conclusiones que no
le corresponden. Generalmente este error se comete por una de las 3 causas
siguientes:

a. Porque se toma la muestra de un sector del universo,


creyendo equivocadamente que dicho sector constituye
todo el universo.

S se quisiera estudiar por ejemplo, el ingreso promedio del obrero venezolano


y para ello se obtuviera una muestra que incluyera solamente a los
trabajadores del Zulia, el promedio obtenido no sera valido para toda
Venezuela, pues se sabe perfectamente que todos los salarios en el Zulia son
mucho ms altos que en el resto del pas, a causa de las explotaciones
petroleras. Una muestra adecuada debera incluir trabajadores de los diferentes
Estados de la nacin.

Como un segundo ejemplo, supongamos que se desea hacer un estudio para


averiguar la letalidad por Fiebre Tifoidea, sea la proporcin de enfermos de
Fiebre Tifoidea que fallecen, se sabe que la letalidad de la enfermedad varia en
las diversas edades y depende del estado nutritivo del paciente y del momento
en que se inicia el tratamiento, una buena muestra por lo tanto, debe incluir
pacientes de diversa edades, tanto desnutridos como bien nutridos y en
diferentes etapas de la enfermedad.

Si para dicho estudio se escogiera la muestra en el Hospital Vargas de


Caracas, tal muestreo no nos revelara la verdadera letalidad de la Fiebre
Tifoidea, pues como se sabe, a dicho hospital solo asisten personas adultas,
generalmente pobres y desnutridas y en estado grave, pues los casos benignos
permanecen en sus domicilios, las conclusiones reveladas de un estudio como
el anterior, podran generarse solamente a enfermos de condiciones
semejantes a lo/as estudiados (adultos, desnutridos, etc.), pero sera errneo el
pretender aplicarlas a otras circunstancias.

b. Porque el mtodo de escogencia de los individuos no es


el azar, el cual como veremos enseguida es el nico
procedimiento que nos garantiza un buena escogencia. Tal
error se comete siempre que se trabaja con muestras de
conveniencia.

c. Porque una vez obtenida la muestra, existen


circunstancias que nos impide estudiar a los individuos
escogidos. La muestra puede haber sido escogida de toda
la poblacin y por un procedimiento al azar, con lo cual se
eliminan las 2 causas de error acabadas de estudiar, pero si
no es posible escoger la informacin de las personas que
deben estudiarse, ciertos segmentos de la poblacin no van
a quedar representados. Esto sucede por ejemplo, en
encuestas mediante cuestionarios postales, pueden general
quienes contestan pueden ser muy diferentes de quienes no
lo hacen. En Venezuela, por ejemplo, una encuesta en tal
forma sera contestada solamente por una clase social
relativamente alta, ya que los pobres son generalmente
analfabetos.

TIPOS DE MUESTRAS

Hay dos clases de muestras:

a. Muestras de Conveniencia.
b. Muestras Probabilsticas.

MUESTRAS DE CONVENIENCIA

Entran en aquellas caractersticas todas aquellas muestras en las cuales, los


individuos se escogen con base en la opinin de un experto por considerarlos
representantes tpicos del universo que se quiera conocer.

Si se deseara por ejemplo, averiguar los porcentajes de hombres y mujeres en


la Universidad, en vez de obtener una muestra de las diferentes facultades que
la integran, podramos limitarnos al estudio de un grupo de alumnos de aquella
Facultad que nos parezca ms representativa en relacin al sexo de sus
integrantes. Sin embargo, la validez de los resultados obtenidos depender
exclusivamente del aserto que hayamos tenido al seleccionar como tpica dicha
facultad.
Tal es la desventaja de este tipo de muestra: aun cuando los resultados pueden
ser bastante fidedignos, estamos en incapacidad de juzgar objetivamente sobre
su precisin. Hace falta, pues, un mecanismo ms objetivo de apreciacin, que
ofrezca garantas de representatividad y que a la vez nos permita medir la
exactitud de los resultados encontrados. Esto se logra con las muestras
probabilsticas.

MUESTRAS PROBABILSTICAS

Son aquellas en que cada individuo de la poblacin tiene una probabilidad


perfectamente conocida de ser incluido en la muestra. No es ni siquiera
necesario que los individuos tengan un igual chance de pertenecer a la
muestra, basta con que tengan cualquier posibilidad (diferente de cero) de
formar parte de ella y que esa probabilidad sea conocida.

La eleccin de una muestra probabilstica requiere 2 condiciones


fundamentales;

En primer lugar como acaba de mencionarse es esencial que la probabilidad


de elegir a cada individuo sea perfectamente conocida, pues si no lo es, no
ser posible calcular los errores que pueda cometerse al hacer su escogencia
as por ejemplo, muchas muestras de opinin pueden ser representativas de su
universo, pero por no llenar el anterior requisito, estamos en incapacidad de
juzgar objetivamente sobre su representatividad.

En segundo lugar, es indispensable que los individuos se elijan al azar, sin


permitir la intervencin de ningn factor que favorezca la eleccin de unos en
detrimento de los otros.

Elegir los individuos al azar no quiere decir elegirlos sin ton ni son, a nuestra
voluntad o a voluntad de otros, quiere decir elegirlos por un mtodo
perfectamente estudiado en tal forma que la voluntad no tenga ninguna
participacin en dicha eleccin tal como se hace en el popular juego de la
lotera o bingo, en el cual la obtencin de cualquier nmero es obra de la
suerte. Veremos enseguida, que slo para aquellos casos en los cuales el azar
se utiliza como sistema de eleccin de los individuos, ha sido imposible
determinar y valorar la variacin que es dado esperar entre diversas muestras.

DEMOSTRACION PRACTICA

Antes de seguir adelante, conviene recurrir a una cualquiera de las


demostraciones ya clsicas, con el fin de entender la verdadera importancia del
azar en la obtencin de muestras.

Con tal fin vamos a presentar los resultados de una de estas demostraciones,
obtenidas en el ltimo curso de mdicos higienistas. La demostracin consisti
en colocar 500 metras blancas y 500 metras negras en una caja y despus de
mezclarlas cuidadosamente se pidi a los alumnos del curso que sacarn, sin
ver, muestras de 10 metras.
Cada vez que se extraa una muestra se anotaba el nmero de metras blancas
obtenidas y luego de retornar las 10 metras a la caja se mezclaban
convenientemente antes de obtener otra muestra en esta forma se obtuvieron
150 muestras en total, las cuales se presentan en el cuadro No. 1, clasificadas
de acuerdo al nmero de metras blancas.

Antes de comenzar los resultados obtenidos, obsrvese que esa demostracin


no es tan terica como parece y que ella es equivalente a muchos problemas
prcticos. La caja con 1.000 metras blancas o negras pudiera ser una
poblacin de 1.000 habitantes, unos sanos y otros enfermos de la cual un
primer investigador obtuvo una muestra de 10 individuos con el fin de conocer
el porcentaje de enfermos, luego un segundo investigador hizo lo mismo y as
sucesivamente hasta que 150 personas distintas estudiaron dicha poblacin:

Cuadro No. 1
Distribucin de 150 Muestras de 10 metras cada una de acuerdo al
nmero de metras blancas obtenidas
(Metras blancas en el universo 50%)

Metras Blancas por Nmero de Muestras


Muestra Obtenidas
0 0
a) 3
b) 6
c) 20
d) 30
e) 36
f) 28
g) 18
h) 8
i) 1
j) 0
Total 150

TIPOS DE MUESTREO

El objeto de encontrar los pasos para una encuesta por muestreo es recalcar
que el muestreo es un negocio prctico y exige muchas y diversas habilidades.
En algunos pasos, como por ejemplo en la definicin de la poblacin, en la
determinacin de los datos a recoger y de los mtodos de medicin, y en la
organizacin del trabajo de campo, poco o nada tiene que ver la teora del
muestreo. Aunque estos asuntos no se discutirn en el resto del libro, hay que
tener presente su importancia. El muestreo requiere atencin en todas las
fases de la actividad: un trabajo mediocre en una de ellas puede arruinar toda
la encuesta
El propsito de la teora del muestreo es que ste sea ms eficiente. Su
objetivo es desarrollar mtodos de seleccin de muestras y de estimacin, que
proporcionen, al menor costo posible, estimaciones con la suficiente exactitud
para nuestros propsitos. Este principio de exactitud especfica a costo mnimo
aparece una y otra vez en la presentacin de la teora

Para aplicar este principio, debemos ser capaces de predecir en cualquier


mtodo de muestreo que se considere, la precisin y el costo esperados.
Respecto a la precisin, no podremos predecir cul ser el error de una
estimacin en una situacin especfica, porque esto implicara el conocimiento
del verdadero valor de la poblacin. En lugar de ello, la precisin de un
procedimiento de muestreo se juzga al examinar la distribucin de frecuencia
generada para las estimaciones, suponiendo que el proceso de muestreo se
aplica varias veces a la misma poblacin. Desde luego, sta es la tcnica
estndar con la que se juzga la precisin eUna simplificacin adicional que
podemos hacer, consiste en suponer, lo que es razonable en la prctica si se
trata de muestras de tamao comn, que las estimaciones de muestra tienen
una distribucin aproximadamente normal. Con una estimacin distribuida en
forma normal se conoce la distribucin de frecuencias, si son conocidas la
media y la desviacin estndar o la varianza. Una parte considerable de la
teora del muestreo se ocupa de encontrar frmulas para estas medias y
varianzas

Hay dos diferencias entre la teora estndar de encuestas por muestreo y la


teora clsica del muestreo como aparece en los libros de estadstica
matemtica. En la teora clsica, las mediciones hechas sobre las unidades de
muestreo de la poblacin suele suponerse que siguen una distribucin de
frecuencia de forma matemtica conocida, como sera la distribucin normal,
cuyos parmetros, media y varianza, por ejemplo, se estimaran a partir de los
datos de las muestras. Por otro lado, en la teora de las encuestas por
muestreo, se supone que slo se dispone de una informacin muy limitada
sobre dicha distribucin, y sobre todo, no se supone conocida su forma
matemtica, as que el enfoque se puede describir como independiente de un
modelo o de una distribucin de frecuencia. Esta es una actitud natural para
encuestas muy grandes en las que se efectan numerosas mediciones
diferentes de las unidades que siguen diversas distribuciones de frecuencia.

Para las encuestas en las que slo se realizan pocas mediciones en cada
unidad, el estudio de sus distribuciones de frecuencia puede justificar la
hiptesis de que son de forma matemtica conocida, lo que permite la
aplicacin de la teora clsica

Otra diferencia es que las poblaciones en una encuesta tienen un nmero finito
de unidades. Los resultados son ligeramente ms complicados cuando el
muestreo es de una poblacin finita y no de una infinita. Por razones prcticas,
a menudo se ignoran estas diferencias en los resultados para poblaciones
finitas e infinitas.
Requisitos de una muestra.

Cualitativamente debe ser buena, vale decir representativa del Universo al que
pertenece. Una muestra representativa debe ser:

i. Homognea. Estar compuesta slo por elementos que pertenecen al


universo previamente definido.
ii. Adecuada. Al incluir todas las variaciones esenciales de las
caractersticas relevantes de los elementos del universo.

iii. No viciada. Al presentar esas variaciones en mas o menos la misma


frecuencia con que ocurren en el universo.

Parmetros Poblacionales y Estadsticos

Son los valores de diversas medidas descriptivas de la poblacin y son la


Mediana (Md), los Percentiles y la Varianza (S ).

Cuando estas medidas se obtienen de una muestra con el propsito de estimar


un parmetro de una poblacin reciben el nombre de Estadgrafo, Estadsticos
Muestrales o simplemente Estadstico.

Distribucin Muestral

Es la determinacin de un Estadgrafo o sea la distribucin de todas las


muestras de tamao n que pueden extraerse de una poblacin

Para determinar la distribucin muestral de un estadgrafo se utiliza el Teorema


del Lmite Central.

Teorema del Lmite Central

Consiste en la distribucin muestral de la media muestral (x).

Si de una poblacin infinita, cuya media es u y cuya varianza es S, se


seleccionan al azar muestra de tamao n. Como sera la distribucin muestral
de las medias?

Si n es lo suficiente grande, las X muestrales se distribuirn casi normalmente y


adems la media de todas las muestra ser igual a u, o sea a la media de la
poblacin, as mismo la varianza de las medias de las muestras (S x) ser
igual a la varianza de la poblacin dividida entre las muestras de tamao n (S
x = S/n).

Intervalos de Confianza

Una estimacin de un intervalo de un parmetro es un segmento en el continuo


de la escala de los nmeros en algn punto del cual se supone se halla el valor
del parmetro a estudiar.
Ej. Si de S a Sx es 68% o sea dentro de 1 desviacin tpica respecto a la media
(u) , a estos intervalos se les conoce con el nombre de intervalos de confianza
del 68%, 95% y 99% respectivamente se designan con la letra .

Un intervalo de confianza es aquel en el cual se conoce la probabilidad de que


un parmetro se halle dentro de sus lmites.

Dependiendo de cual sea el intervalo de confianza se correlaciona con un valor


denominado lmite o nivel de confianza que se denota con la letra z.

68 z = 1.65
95 z = 1.96
99 z = 2.58

Tamao de la muestra

Al trabajar con muestras se plantean 2 interrogantes.

Cuando tomar la muestra?

Como tomarla?

Calculo del tamao ptimo de n.

1. Heterogeneidad de elementos que conforman N.


2. Del tamao de N.
3. Del nivel de confianza () que se quiere.

4. Del Error que estamos dispuestos a aceptar (Error mximo admisible


del 1 al 15%).

Muestra ptima en poblaciones finitas.

Muestra ptima en poblaciones infinitas.

Los procedimientos de muestreo considerados comparten las siguientes


propiedades matemticas
Podemos definir el conjunto de muestras distintas S1, S2,, Sv, que el
procedimiento es capaz de elegir si se aplica a una poblacin
especfica. Esto significa que podemos decir con precisin cules son
las unidades del muestreo que pertenecen a S1, S2, etc.

Supongamos, por ejemplo, que la poblacin consta de seis unidades,


numeradas de 1 a 6. Un procedimiento comn para elegir una muestra
de tamao 2 ofrece tres posibilidades S1(1,4); S2(2,5); S3(3,6).
Ntese que no se incluyen todas las posibles muestras de tamao 2

1. Cada muestra posible Si tiene asignada una probabilidad de


seleccin i
2. Se selecciona una de las Si por un proceso aleatorio, en el que
cada Si tiene una probabilidad p i de ser elegida. En el ejemplo
anterior, podramos asignar la misma probabilidad a cada muestra.
Posteriormente, la seleccin se podra realizar al elegir un nmero
aleatorio entre 1 y 3. Si el nmero es j , se toma la muestra S j

3. El mtodo para calcular la estimacin a partir de la muestra debe


ser definido y debe conducir a una estimacin nica para cualquier
muestra especfica. Podemos decir, por ejemplo, que la estimacin
es el promedio de las mediciones correspondientes a las unidades
individuales de la muestra

Para todo procedimiento de muestreo que satisfaga estas condiciones,


podemos calcular la distribucin de frecuencia de las estimaciones, podemos
calcular la distribucin de frecuencia de las estimaciones que genera el
proceso, si se aplica repetidamente a la misma poblacin. Sabemos la
frecuencia con que se elige cualquier muestra Si, y sabemos cmo calcular la
estimacin a partir de los datos de Si . Por lo tanto, es claro que se puede
desarrollar una teora de muestreo para cada procedimiento de este tipo,
aunque los detalles del desarrollo puedan ser intrincados. Un mtodo de esta
clase se conoce con el nombre de muestreo probabilista

En la prctica, rara vez se extrae una muestra de probabilidad dando las Si y


los nmeros i como se esboz anteriormente. Es un trabajo muy laborioso
para una gran poblacin, en la cual un procedimiento de muestreo puede
producir billones de muestras posibles. Por lo general, la extraccin se hace al
especificar probabilidades de inclusin en la muestra para las unidades
individuales y extraer unidades, una a la vez, o en grupos, hasta constituir la
muestra del tamao y tipo deseado. Desde el punto de vista terico, basta
saber que si quisiramos, podramos especificar las subcolecciones Si y las
i , siempre y cuando tuviramos tiempo ilimitado para hacerlo
ALTERNATIVAS AL MUESTREO PROBABILISTA

A continuacin veremos algunos tipos comunes de muestreo no probabilistas

La muestra es una parte de la poblacin fcilmente accesible.


Una muestra de carbn en un vagn abierto se puede tomar a 15
o 20 cm. de la parte superior
La muestra se selecciona a la ventura. Al tomar diez conejos de
una jaula en un laboratorio, el investigador puede sacar aquellos
que alcance con la mano, sin una planeacin consciente
Con una poblacin pequea pero heterognea, el investigador
inspecciona la totalidad de sta y selecciona una pequea
muestra de unidades tpicas, es decir, unidades que a su
parecer estn cercanas al promedio de la poblacin. Este mtodo
algunas veces es llamado de juicio o de seleccin intencional

La muestra consta esencialmente de voluntarios, en estudios en


los cuales el proceso de medicin es desagradable o penoso para
la persona que est siendo investigada

En condiciones adecuadas cualquiera de estos mtodos puede dar


resultados tiles. Sin embargo, no son los indicados para el desarrollo de
una teora de muestreo, ya que no involucran ningn elemento aleatorio en
el procedimiento de seleccin. Casi la nica manera de examinar qu tan
bueno puede ser uno de los mtodos es encontrar una situacin en la cual
los resultados sean conocidos, ya sea para la poblacin total o para una
muestra basada en probabilidades y posteriormente hacer una
comparacin. Pero aun as, si un mtodo resulta adecuado en la
comparacin, puede ser inadecuado al variar las condiciones

En relacin con lo anterior (muestreos probabilistas y no probabilistas)


sealamos que algunos de los primeros usos del muestreo que hicieron los
gobiernos a nivel urbano o nacional, desde 1850, tenan como finalidad
reducir los costos de las estimaciones de los resultados de un censo. Para
los tributos ms importantes del censo, se calculaban los totales de la
ciudad o el pas, aprovechando completamente la informacin obtenida del
censo. Para las mediciones restantes se tomaba una muestra que variaba
entre el 15 y el 25% de los formularios devueltos despus del censo, con
objeto de aligerar el trabajo de estimacin de los totales de la ciudad o el
pas para dichas mediciones. Se usaron dos mtodos diferentes para la
seleccin de la muestra. El primero, llamado de seleccin aleatoria es una
aplicacin del muestreo de probabilidad segn el cual cada unidad de la
poblacin (cada formulario devuelto despus del censo) tiene la misma
oportunidad de ser incluido en la muestra. Para este mtodo se constat
que, como se dijo anteriormente, con ayuda de la teora del muestreo y la
distribucin normal es posible predecir, en forma aproximada y con los datos
de la muestra, la magnitud del error esperado en las estimaciones hechas a
partir de la muestra. Ms an, en los tems ms importantes para los que se
dispona de los datos completos que suministr el censo, es posible, hasta
cierto grado verificar la exactitud de las predicciones

El segundo mtodo es la seleccin a propsito. Esta no se defina en


detalle, pero presentaba dos rasgos comunes. La unidad de muestreo
consista en grupos de formularios, a menudo relativamente grandes. Por
ejemplo, en el censo italiano de 1921, el pas tena 8354 comunas
agrupadas en 214 distritos. Al extraer una muestra del 14%, los estadsticos
italianos Gini y Galvani seleccionaron a propsito 29 distritos, en lugar de
1250 comunas. En segundo lugar, los 29 distritos se eligieron de tal modo
que la muestra proporcionara estimaciones exactas para 7 importantes
variables de control, cuyos resultados eran conocidos para todo el pas, y
con esto se esperaba que la muestra diera buenas estimaciones de las
otras variables altamente correlacionadas con las de control

En la dcada de los 20, el Instituto Estadstico Internacional nombr una


comisin para estudiar las ventajas y desventajas de los dos mtodos. El
informe de Jensen (1926) pareci favorecer el mtodo de seleccin a
propsito. Sin embargo, este mtodo se abandon relativamente pronto
como tcnica de muestreo para obtener estimaciones nacionales en las
encuestas que medan muchas variables, ya que careca de la flexibilidad
que ofrecan los mtodos de muestreo probabilista desarrollados
posteriormente, no poda predecir a partir de la muestra la exactitud
esperada en las estimaciones y usaba unidades de muestreo demasiado
grandes. Gini y Galvani concluyeron que el mtodo de muestreo
denominado muestreo aleatorio estratificado que utiliza la comuna como
unidad de muestreo, habra dado mejores resultados que su mtodo

Mtodos de Muestreo

1. Probabilsticos.

Todos los elementos de la poblacin tienen la misma probabilidad de ser


escogidos y formar parte de la muestra.

1.1 Condiciones:

a. Probabilidad (p) de eleccin de cada individuo de la muestra va a


ser diferente a cero y perfectamente conocida.

b. Azar. Todos los individuos que forman parte de la muestra deben


ser elegidos al azar.

1.2 Tipos de Muestreo Probabilsticos

1. Aleatorio Simple. Todos los elementos de la poblacin tienen la


misma probabilidad de formar parte de la muestra. Tipos. Lotera
o Tmbola, Tabla de Nmeros aleatorios o Random.
2. Muestreo Sistemtico. Es un procedimiento de seleccin muy til
y fcil de aplicar, consiste en seleccionar dentro de una poblacin
N a un nmero de n elementos a partir de un intervalo K. K es un
intervalo que va a estar determinado por el tamao de la
poblacin y el tamao de la muestra. K=N/n
3. Muestreo Estratificado Proporcional al Azar. Se estratifica la
muestra en relacin a estratos o categoras que se presentan en
la poblacin que son relevantes para los objetivos de la
investigacin y de cada estrato se extrae al azar una proporcin
equivalente al tamao de la muestra hasta completarla.

4. Muestreo por conglomerados o Racimos. Se utiliza en casos


donde el investigador se ve limitado por recursos financieros, por
tiempo o distancia geogrfica. Implica diferenciar la unidad de
anlisis y la unidad muestral. La unidad de anlisis se refiere a
quienes van a ser medidos, los sujetos . La unidad muestral se
refiere al racimo a travs del cual se logra el acceso a la unidad
de anlisis. El muestreo por racimo implica una seleccin en 2
etapas, ambas con procedimientos probabilsticos.

2. No Probabilsticos.

No todos los elementos de la poblacin tienen la misma probabilidad de ser


seleccionados por lo que no es una muestra representativa. La seleccin
puede ser voluntaria o involuntaria. Ej. Muestreo con voluntarios. Constituido
por personas que se ofrecen a participar en un estudio, ello facilita la labor,
pero la muestra obtenida no es representativa de la poblacin. Por
Conveniencia.

Los procedimientos de muestreo considerados comparten las siguientes


propiedades matemticas
1. Podemos definir el conjunto de muestras distintas S1, S2,, Sv,
que el procedimiento es capaz de elegir si se aplica a una
poblacin especfica. Esto significa que podemos decir con
precisin cules son las unidades del muestreo que pertenecen a
S1, S2, etc.

Supongamos, por ejemplo, que la poblacin consta de seis


unidades, numeradas de 1 a 6. Un procedimiento comn para
elegir una muestra de tamao 2 ofrece tres posibilidades S1(1,4);
S2(2,5); S3(3,6). Ntese que no se incluyen todas las posibles
muestras de tamao 2
2. Cada muestra posible Si tiene asignada una probabilidad de
seleccin i

3. Se selecciona una de las Si por un proceso aleatorio, en el


que cada Si tiene una probabilidad p i de ser elegida. En el
ejemplo anterior, podramos asignar la misma probabilidad a
cada muestra. Posteriormente, la seleccin se podra realizar
al elegir un nmero aleatorio entre 1 y 3. Si el nmero es j , se
toma la muestra S j

4. El mtodo para calcular la estimacin a partir de la muestra


debe ser definido y debe conducir a una estimacin nica
para cualquier muestra especfica. Podemos decir, por
ejemplo, que la estimacin es el promedio de las mediciones
correspondientes a las unidades individuales de la muestra

Para todo procedimiento de muestreo que satisfaga estas condiciones,


podemos calcular la distribucin de frecuencia de las estimaciones,
podemos calcular la distribucin de frecuencia de las estimaciones que
genera el proceso, si se aplica repetidamente a la misma poblacin.
Sabemos la frecuencia con que se elige cualquier muestra Si, y
sabemos cmo calcular la estimacin a partir de los datos de Si . Por lo
tanto, es claro que se puede desarrollar una teora de muestreo para
cada procedimiento de este tipo, aunque los detalles del desarrollo
puedan ser intrincados. Un mtodo de esta clase se conoce con el
nombre de muestreo probabilista

En la prctica, rara vez se extrae una muestra de probabilidad dando las


Si y los nmeros i como se esboz anteriormente. Es un trabajo muy
laborioso para una gran poblacin, en la cual un procedimiento de
muestreo puede producir billones de muestras posibles. Por lo general,
la extraccin se hace al especificar probabilidades de inclusin en la
muestra para las unidades individuales y extraer unidades, una a la vez,
o en grupos, hasta constituir la muestra del tamao y tipo deseado.
Desde el punto de vista terico, basta saber que si quisiramos,
podramos especificar las subcolecciones Si y las i , siempre y
cuando tuviramos tiempo ilimitado para hacerlo

ALTERNATIVAS AL MUESTREO PROBABILISTA

A continuacin veremos algunos tipos comunes de muestreo no


probabilistas

La muestra es una parte de la poblacin fcilmente accesible.


Una muestra de carbn en un vagn abierto se puede tomar a
15 o 20 cm. de la parte superior
La muestra se selecciona a la ventura. Al tomar diez conejos
de una jaula en un laboratorio, el investigador puede sacar
aquellos que alcance con la mano, sin una planeacin
consciente
Con una poblacin pequea pero heterognea, el investigador
inspecciona la totalidad de sta y selecciona una pequea
muestra de unidades tpicas, es decir, unidades que a su
parecer estn cercanas al promedio de la poblacin. Este
mtodo algunas veces es llamado de juicio o de seleccin
intencional

La muestra consta esencialmente de voluntarios, en estudios


en los cuales el proceso de medicin es desagradable o
penoso para la persona que est siendo investigada

bbbEn condiciones adecuadas cualquiera de estos mtodos puede dar


resultados tiles. Sin embargo, no son los indicados para el desarrollo
de una teora de muestreo, ya que no involucran ningn elemento
aleatorio en el procedimiento de seleccin. Casi la nica manera de
examinar qu tan bueno puede ser uno de los mtodos es encontrar una
situacin en la cual los resultados sean conocidos, ya sea para la
poblacin total o para una muestra basada en probabilidades y
posteriormente hacer una comparacin. Pero aun as, si un mtodo
resulta adecuado en la comparacin, puede ser inadecuado al variar las
condiciones

bbbEn relacin con lo anterior (muestreos probabilistas y no


probabilistas) sealamos que algunos de los primeros usos del muestreo
que hicieron los gobiernos a nivel urbano o nacional, desde 1850, tenan
como finalidad reducir los costos de las estimaciones de los resultados
de un censo. Para los tributos ms importantes del censo, se calculaban
los totales de la ciudad o el pas, aprovechando completamente la
informacin obtenida del censo. Para las mediciones restantes se
tomaba una muestra que variaba entre el 15 y el 25% de los formularios
devueltos despus del censo, con objeto de aligerar el trabajo de
estimacin de los totales de la ciudad o el pas para dichas mediciones.
Se usaron dos mtodos diferentes para la seleccin de la muestra. El
primero, llamado de seleccin aleatoria es una aplicacin del muestreo
de probabilidad segn el cual cada unidad de la poblacin (cada
formulario devuelto despus del censo) tiene la misma oportunidad de
ser incluido en la muestra. Para este mtodo se constat que, como se
dijo anteriormente, con ayuda de la teora del muestreo y la distribucin
normal es posible predecir, en forma aproximada y con los datos de la
muestra, la magnitud del error esperado en las estimaciones hechas a
partir de la muestra. Ms an, en los tems ms importantes para los
que se dispona de los datos completos que suministr el censo, es
posible, hasta cierto grado verificar la exactitud de las predicciones

bbbEl segundo mtodo es la seleccin a propsito. Esta no se defina en


detalle, pero presentaba dos rasgos comunes. La unidad de muestreo
consista en grupos de formularios, a menudo relativamente grandes.
Por ejemplo, en el censo italiano de 1921, el pas tena 8354 comunas
agrupadas en 214 distritos. Al extraer una muestra del 14%, los
estadsticos italianos Gini y Galvani seleccionaron a propsito 29
distritos, en lugar de 1250 comunas. En segundo lugar, los 29 distritos
se eligieron de tal modo que la muestra proporcionara estimaciones
exactas para 7 importantes variables de control, cuyos resultados eran
conocidos para todo el pas, y con esto se esperaba que la muestra
diera buenas estimaciones de las otras variables altamente
correlacionadas con las de control

bbbEn la dcada de los 20, el Instituto Estadstico Internacional nombr


una comisin para estudiar las ventajas y desventajas de los dos
mtodos. El informe de Jensen (1926) pareci favorecer el mtodo de
seleccin a propsito. Sin embargo, este mtodo se abandon
relativamente pronto como tcnica de muestreo para obtener
estimaciones nacionales en las encuestas que medan muchas
variables, ya que careca de la flexibilidad que ofrecan los mtodos de
muestreo probabilista desarrollados posteriormente, no poda predecir a
partir de la muestra la exactitud esperada en las estimaciones y usaba
unidades de muestreo demasiado grandes. Gini y Galvani concluyeron
que el mtodo de muestreo denominado muestreo aleatorio estratificado
que utiliza la comuna como unidad de muestreo, habra dado mejores
resultados que su mtodo

Mtodos de Muestreo

1. Probabilsticos.

Todos los elementos de la poblacin tienen la misma probabilidad de ser


escogidos y formar parte de la muestra.

1.1 Condiciones:
a. Probabilidad (p) de eleccin de cada individuo de la muestra
va a ser diferente a cero y perfectamente conocida.

b. Azar. Todos los individuos que forman parte de la muestra


deben ser elegidos al azar.

1.2 Tipos de Muestreo Probabilsticos

1. Aleatorio Simple. Todos los elementos de la poblacin tienen


la misma probabilidad de formar parte de la muestra. Tipos.
Lotera o Tmbola, Tabla de Nmeros aleatorios o Random.
2. Muestreo Sistemtico. Es un procedimiento de seleccin muy
til y fcil de aplicar, consiste en seleccionar dentro de una
poblacin N a un nmero de n elementos a partir de un
intervalo K. K es un intervalo que va a estar determinado por
el tamao de la poblacin y el tamao de la muestra. K=N/n
3. Muestreo Estratificado Proporcional al Azar. Se estratifica la
muestra en relacin a estratos o categoras que se presentan
en la poblacin que son relevantes para los objetivos de la
investigacin y de cada estrato se extrae al azar una
proporcin equivalente al tamao de la muestra hasta
completarla.

4. Muestreo por conglomerados o Racimos. Se utiliza en casos


donde el investigador se ve limitado por recursos financieros,
por tiempo o distancia geogrfica. Implica diferenciar la
unidad de anlisis y la unidad muestral. La unidad de anlisis
se refiere a quienes van a ser medidos, los sujetos . La
unidad muestral se refiere al racimo a travs del cual se logra
el acceso a la unidad de anlisis. El muestreo por racimo
implica una seleccin en 2 etapas, ambas con procedimientos
probabilsticos.

2. No Probabilsticos.

bbbNo todos los elementos de la poblacin tienen la misma probabilidad


de ser seleccionados por lo que no es una muestra representativa. La
seleccin puede ser voluntaria o involuntaria. Ej. Muestreo con
voluntarios. Constituido por personas que se ofrecen a participar en un
estudio, ello facilita la labor, pero la muestra obtenida no es
representativa de la poblacin. Por Conveniencia.
Error Estandar
Al Trabajar con muestras como no se estudia la totalidad de los individuos de
una poblacin se incurre en el error por muestreo el cual puede medirse a
travs de una constante estadstica denominada Error Estndar (E.E.)

Origen del Error Estndar

Si de N se obtiene un nmero x de n del mismo tamao y a cada muestra se le


calcula su promedio, estos se distribuyen alrededor del verdadero valor del
universo formando una curva normal, entnces puede afirmarse que ninguna
muestra difiere del valor del N en mas de 3 veces la DE, pues se sabe que en
el +/- 3 DE se encuentra el 100% del rea de la curva

Si con la finalidad de conocer el verdadero valor del promedio de determinado


N, se obtiene una n y se calcula su promedio, este ser exactamente igual al
del N, pero si se conoce la DE de un conjunto de n extradas de dicho N,
bastara tomar DE para determinar los lmites dentro de los cuales se
encuentra el promedio del N.

EE es la DE de un conjunto de muestras obtenidas de


determinado N que puede estimarse con bastante exactitud
a partir de una sola muestra.

Clculo del Error Estndar

Eex=DE/Vn

Pasos.

1. Calcular el X de la serie.
2. Calcular la DE.

3.Dividir DE/Vn
EE%=Vp.q/n

p.% de personas con x caractersticas.

q. % de personas que no poseen x caracterstica

Interpretacin del EE

X 1 EE incluye el 68% de las observaciones

X 2 EE incluye el 95% ( el 5% Difiere de N)

X 3 EE incluye el 99% ( el 1% Difiere de N)

Usos del EE.

1. Para conocer dentro de que lmites se encuentra el verdadero valor


del universo.
2. Para estimar el tamao que debe tener una muestra para lograr
determinada precisin.

3. Para saber si una muestra procede o no de determinado N.

TEMA N 3: PRUEBA DE SIGNIFICANCIA ESTADISTICA

PRUEBAS DE SIGNIFICANCIA ESTADISTICA

INTRODUCCION

La realizacin de cualquier estudio clnico-epidemiolgico pretende poner de


manifiesto al final del mismo si existe o no asociacin entre diferentes
variables. Esta asociacin puede ser resultado de que realmente exista la
asociacin indicada, pero esta asociacin tambin puede ser producto del azar,
de la presencia de sesgos o de la presencia de variables de confusin.

Una de las aplicaciones de la estadstica es hacer inferencias a poblaciones, a


partir de muestras. En la realizacin de este proceso inferencial, siempre existe
el riesgo de error o imprecisin ya sea por el azar o la variabilidad biolgica del
fenmeno a estudiar. La carencia de error aleatorio debido al azar se conoce
como precisin. Cuanto ms grande es el tamao muestral, mayor es la
precisin y la variabilidad explicada por el azar disminuye. Esta posibilidad de
error o falta de precisin, siempre que no existan sesgos o variables de
confusin, se corrige aumentando el tamao de la muestra. De cualquier
manera el papel del azar debe ser siempre contemplado, evaluado y medido,
realizando test de hiptesis o construyendo intervalos de confianza para
conocer la precisin de nuestra estimacin dentro de una seguridad
previamente definida.

Desde el punto de vista clnico la significacin estadstica no resuelve todos los


interrogantes que hay que responder ya que la asociacin estadsticamente
significativa puede no ser clnicamente relevante y adems la asociacin
estadsticamente significativa puede no ser causal. En definitiva podemos
encontrar asociaciones "estadsticamente posibles y conceptualmente
estriles".

SIGNIFICANCIA ESTADISTICA:

A pesar de las limitaciones de la estadstica, el trmino "estadsticamente


significativo" invade la literatura mdica y se percibe como una etiqueta que
indicase "garanta de calidad". El considerar el trmino significativo implica
utilizar trminos comparativos de dos hiptesis. Los test de hiptesis son test
de significacin estadstica que cuantifican hasta que punto la variabilidad de la
muestra puede ser responsable de los resultados de un estudio en particular.
La Ho (hiptesis nula) representa la afirmacin de que no hay asociacin entre
las dos variables estudiadas y la H a (hiptesis alternativa) afirma que hay algn
grado de relacin o asociacin entre las dos variables. Nuevamente la
estadstica nos muestra su utilidad ya que nos ayuda a tomar la decisin de
que hiptesis debemos elegir. Dicha decisin puede ser afirmada con una
seguridad que nosotros previamente decidimos. El nivel de significacin se
estableci siguiendo los comentarios del estadstico Fisher que seal "...es
conveniente trazar una lnea de demarcacin a partir de la cual podamos decir:
o bien hay algo en el tratamiento...". El mecanismo de los diferentes test se
realiza aunque con matices siempre de la siguiente forma: En primer lugar se
mira la magnitud de la diferencia que hay entre los grupos a comparar (A y B).
Si esta magnitud o valor absoluto es mayor que un error estndar definido
multiplicado por una seguridad definida, concluimos que la diferencia es
significativa entre A y B. Por tanto aceptamos la hiptesis alternativa y
rechazamos la hiptesis nula.

Ejemplo:

Disponemos de 2 tratamientos ( A y B). El tratamiento A lo reciben 25 pacientes


y el tratamiento B otros 25 pacientes. 15 pacientes responden favorablemente
al tratamiento A y 20 al tratamiento B. Existe diferencia significativa entre
ambos tratamientos?

Ho (hiptesis nula) = No hay diferencia entre ambos tratamientos.

Ha (hiptesis alternativa) = S existe diferencia.

Tratamiento N Porcentaje de respuesta


A 25 15/25 = 0.60
B 25 20/25 = 0.80
( P1 - P2 )es mayor que el producto de 1.96 *
Si
el error estndar,
conclumos que la diferencia es
significativa.

( P1-P2) = (0,60-0,80)= 0,20

p= P1 + P2 = 0,60 + 0,80 = 0,7

22

z 95% :1,96

E 5%: 0,05

Error estndar = = 0.1296

Error estndar * 1.96 = 0.1296 * 1.96 = 0.25

Como quiera que la diferencia =

(P1-P2) = ( 0,60- 0,80) = 0,20

no supera el valor 0.25 concluimos que la diferencia entre 0.60 y 0.80 no es


estadsticamente significativa. A la vista de los resultados no podemos aceptar
la Ha (hiptesis alternativa).

El proceso de aceptacin o rechazo de la hiptesis lleva implcito un riesgo que


se cuantifica con el valor de la "p", que es la probabilidad de aceptar la
hiptesis alternativa como cierta, cuando la cierta podra ser la hiptesis nula.

El valor de "p" que indica que la asociacin es estadsticamente significativa ha


sido arbitrariamente seleccionado y por consenso se considera en 0.05. Una
seguridad del 95% lleva implcito una p < de 0.05 y una seguridad del 99%
lleva implcita una p < 0.01. Cuando rechazamos la H o (hiptesis nula) y
aceptamos la Hao (hiptesis nula) que afirma que ambas variables no estn
asociadas o correlacionadas. (hiptesis alternativa) como probablemente cierta
afirmando que hay una asociacin, o que hay diferencia, estamos diciendo en
otras palabras que es muy poco probable que el azar fuese responsable de
dicha asociacin. Del mismo modo si la p>0.05 decimos que el azar no puede
ser excluido como explicacin de dicho hallazgo y no rechazamos la H.

Conviene por otra parte considerar que la significacin estadstica entre dos
variables depende de dos componentes fundamentales. El primero es la
magnitud de la diferencia a testar. Cuanto ms grande sea la diferencia entre
las dos variables, ms fcil es demostrar que la diferencia es significativa. Por
el contrario si la diferencia entre ambas variables es pequea, las posibilidades
de detectar diferencias entre las mismas se dificulta. El segundo componente
fundamental a tener en cuanta al testar diferencias entre dos variables es el
tamao muestral. Cuanto ms grande sea dicho tamao muestral ms fcil es
detectar diferencias entre las mismas. Pequeas diferencias se pueden
detectar con grandes tamaos muestrales y grandes diferencias entre variables
necesitan muchos menos pacientes o individuos a ser estudiados. Cualquier
diferencia puede ser estadsticamente significativa si se dispone del suficiente
nmero de pacientes.

Ejemplo:

En el ejemplo anterior objetivamos que no hay diferencia entre 60% y 80%.


Supongamos que realizamos ahora el estudio con 900 pacientes en cada
grupo:

( P1-P2) es mayor que el producto de 1.96 *


Si
el error estndar,
concluimos que la diferencia es
significativa.

P1-P2= (0,60-0,80) = 0,20

p= P1+P2 = 0,60 +0,80 = 0,7

22

z: 1,96

Error estndar = 0.01296

Error estndar * 1.96 = 0.01296 * 1.96 = 0.025

Como quiera que la diferencia = ( P1-P2)= (0,60-0,80) = 0,20

supera el valor 0.0423 concluimos que la diferencia entre 0.60 y 0.80 s es


estadsticamente significativa. A la vista de los resultados por tanto rechazamos
la Ho (hiptesis nula) y aceptamos la H a (hiptesis alternativa) como
probablemente cierta. Como podemos objetivar en este segundo ejemplo ahora,
si podemos decir que la diferencia entre 60% y 80% es estadsticamente
significativa (p< 0.05).

El tamao muestral afecta a la probabilidad de la significacin estadstica a


travs del error estndar que se hace ms pequeo cuantos ms pacientes
tenga el estudio. As pues el valor de la "p" es funcin de la magnitud de la
diferencia entre los dos grupos o dos variables y del tamao de la muestra. Por
esta razn una pequea diferencia puede ser estadsticamente significativa si
disponemos de un tamao muestral lo suficientemente grande y por el contrario
un efecto o diferencia relativamente grande puede no alcanzar la significacin
estadstica si la variabilidad es grande debida a un pequeo tamao muestral.
Por estas razones los valores de la "p" deben ser considerados solo como una
gua y no como base de conclusiones definitivas e irrevocables.

Ji ( chi) Cuadrado (x2) :

Es un procedimiento de la estadistica inferencial no parametrica que permite


determinar si hay relacin entre las variables de estudio, el propsito
fundamental consiste en comparar las frecuencias observadas, con las
frecuencias esperadas a fin de determinar si hay o no diferencias
estadisticamente significativas que permiten decidir si el resultado es casual o
no casual.

Para aplicar el chi cuadrado hay que cumplir 3 supuestos:

1. que la muestra sea representativa


2. Que los datos esten en forma de frecuencia
3. variables independientes

Kruskal -wallis (H):

En estadstica, el test de Kruskal-Wallis (de William Kruskal y W. Allen Wallis)


es un estadstico no paramtrico para testear si un grupo de datos proviene de
la misma poblacin. Intuitivamente, es idntico al ANOVA con los datos
reemplazados por categoras. Es una extensin del test de la U de Mann-
Whitney para 3 o ms grupos.

Ya que es un test no paramtrico, el test de Kruskal-Wallis no asume


normalidad en los datos, en oposicin al tradicional ANOVA. Si asume bajo la
hiptesis nula que los datos vienen de la misma distribucin. Una forma comn
en que se viola este supuesto es con datos heterocedsticos.

Mtodo

1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al


menor un rango de 1, al segundo un 2, y as hasta el n-simo. Si existen
datos que se repiten, se asigna el rango promedio a cada uno de ellos (si
existen cuatro datos idnticos que ocupan los rangos 11, 12, 13 y 14, se
les asigna un rango de 12,5 a los cuatro).

2. Aplicar formula:

H = 12 x sumatoria Ti2 3 ( N + 1 )

N ( N-1) ni

12 y 3 son constantes
ni= tamao que hay en cada grupo

Ti: Suma al cuadrado de cada uno de los rangos o ordenes.

Algunas definiciones de interes

VARIABLES:

Son elementos que pueden asumir diferentes valores, que pueden ser
medidos.

Tipos de variables:

1. Cuantitativos: numeros, cifras, cantidades Ejemplo: peso, talla, TA


2. Cualitativas: Cualidad o caracteristicas: sexo, raza, escolaridad,
profesion, nacionalidad
3. Continuas: asume valores entre dos valores, valores decimales
( peso,edad)
4. Discretas: no acepta valores intermedios ( n de hijos)
5. Independientes: ser refiere a la causa del fenomeno
6. dependiente: efecto del fenomeno de estudio
7. Dicotimicas admte dos valores (sexo: M y F)
8. Tricotimicas: admite de 3 a 6 valores ( estado civil)
9. Policotimicas: Mas de 6 valores menos de 20 ( colores)

TEMA N 4: CURVA NORMAL

INTRODUCCION
En la prctica e investigacin clnica, el termino de "normal" es de uso rutinario.
As, el medico y el investigador clnico pueden afrontar las siguientes
preguntas: Un hallazgo clnico determinado indica enfermedad?, o la cifra
obtenida de un examen de laboratorio, en un individuo, es normal o anormal?
por ello, conviene revisar los conceptos que suelen fundamentar la
demarcacin entre lo llamado normal de lo anormal, as como las limitantes yf
problemas prcticos inherentes a los mtodos utilizados en este proceso.

En la revisin se analizaran dos enfoques conceptuales comnmente utilizados


en la definicin del termino "normal".

Existe un punto de vista, con orientacin fundamentalmente estadstico en


donde el trmino " normal" es sinnimo de usual o frecuente, sin que
necesariamente se asocie a la ausencia de un estado mrbido y lo anormal,
por el contrario es sinnimo de lo infrecuente o poco usual. este enfoque lo
denominaremos definicin aislada ( o univariada) de normalidad , puesto que lo
normal, las caractersticas clnicas o los valores de una medicin, que se
encuentren dentro de los lmites de un espectro de caractersticas o de valores,
que por su frecuencia son los esperados o usuales de una poblacin de
referencia ( habitualmente de individuos " sanos"). La demarcacin de lo usual
o frecuente generalmente se hace con base en algn modelo matemtico
terico, como lo es la distribucin de Gauss.

Por otra parte, existe el enfoque, de orientacin predominantemente mdica, en


el cual lo "normal" es sinnimo de sano; es decir cuando el individuo se ajusta
a una norma, la cual no necesariamente corresponde a lo usual.
Este enfoque lo denominaremos la definicin correlacionada o multivariada de
normalidad, ya que existe la asociacin entre un intervalo de mediciones de
una variable y algun atributo biolgico. As, una cierta caractersticas clnica o
medicin se dir que es "anormal" cuando corresponda a una manifestacin de
enfermedad, cuando prediga un mayor riesgo a padecerla o una determinada
evolucin patolgica o bien cuando justifique la administracin de una medida
teraputica.

CONCEPTO AISLADO DE NORMALIDAD:


Bajo este enfoque la definicin de los normal esta basada en un concepto
estrictamente univariado, es decir es generada mediante la delimitacin de un
intervalo de valores ( que se considerarn como normales) dentro del espectro
de una sola variable (o medicin), tal como el peso, la talla o los nivles sericos
de alguna sustancia qumica. estos valores limites demarcarn una zona que
se decidir representen lo habitual o usual, generalmente con base unicamente
en un concepto estadstico o un modelo matemtico en particular.
habiendo decidido que la "normalidad" sea delimitada de esta manera, el
siguiente paso es escoger un metodo matemtico para definir los valores
numericos que haran la divisin entre lo "normal" y lo "anormal", as como
seleccionar al grupo de individuos en quienes se hagan las mediciones de las
variables en cuestin. de tal manera que la decisin estadistica de cul sera el
intervalo de lo normal implica definir el tamao, la localizacin y la simetria de
una zona de demarcacin.
definir el tamao en la zona, se refiere a contestarse las siguientes preguntas
Que proporcion de los valores, en una serie de mediciones, se va a
considerar como valores normales o habituales? o que proporcin como
valores "anormales" o no habituales?Dicho de otra manera Que tan comun
debe ser la medicin para que se le considere como "anormal". bajo este
enfoque aislado Fisher, considera al 95% de los valores centrales dentro de
una distribucin de mediciones como las comunes y al 5% restante de los
infrecuentes

LA CURVA NORMAL O DE GAUSS


Entre las numerosas curvas matemticas descritas se encuentra la
denominada curva de Gauss, curva normal o de campana.

La campana de Gauss, curva de Gauss o curva normal, es una funcin de


probabilidad continua, simtrica, cuyo mximo coincide con la media (m) y que
tiene dos puntos de inflexin situados a ambos lados de la media, a una
distancia (d) de ella.
Esta curva fue descrita por el matemtico alemn Carl Friederich Gauss,
estudiando los errores que se producen al medir reiteradamente una cierta
magnitud.

La gran importancia de esta distribucin se debe a la enorme frecuencia con la


que aparece en las situaciones ms variadas:

Caracteres morfolgicos de individuos

Caracteres fisiolgicos

Caracteres sociolgicos

Caracteres fsicos

DisNormal01.svg (Imagen SVG, nominalmente 1700 700 pixels, tamao de


archivo: 13 KB)

La curva normal en una curva en forma de campana, perfectamente simtrica,


de tal manera, que una perpendicular que pase por el vrtice la divide en 2
mitades exactamente iguales. dicha perpendicular representa el promedio
aritmtico.

Puede observarse que en cada mitad, la curva es primero cncava hacia


arriba, y luego cncava hacia abajo, habindose dado el nombre de " punto de
inflexin" a aquel en el cual la curva cambia de direccin. Hay por consiguiente,
2 puntos de inflexin, uno izquierdo y otro derecho.

La distancia que separa cada punto de inflexin de la linea central que


representa el promedio, constituye una desviacin estndar. Aunque
tericamente la curva nunca toca la horizontal, para propsitos practico, puede
considerarse que la totalidad de su rea se encuentra comprendida entre dos
lineas verticales, situadas a 3 DE a cada lado del promedio.

Los matemticos han demostrado que aproximadamente un 68 % de todo el


rea de la curva se encuentra comprendida entre las dos verticales que pasan
por los puntos de inflexin, lo cual equivale a decir que el 68 % del rea se
encuentra entre el promedio mas una desviacin estndar y el promedio menos
una desviacin estndar. Igualmente se ha visto que entre el promedio mas
menos 2 DE se encuentran aproximadamente el 95% de del rea de la curva y
que prcticamente el 100% del rea de la curva se encuentra entre el promedio
mas menos 3 DE.

Lo anterior es importante por dos razones principales. En primer lugar, porque


ya sealamos que los resultados dados por el azar siguen una curva normal, y
en segundo lugar porque se ha visto que casi todas las constantes fisiolgicas
de los individuos ( peso, talla, tensin arterial , etc.) y en general las diferentes
caractersticas de toda la poblacin se distribuyen formando una curva normal.

esto quiere decir que las propiedades de la curva normal pueden aplicarse a
cualquier caracterstica que tenga una distribucin normal, y asi por ejemplo, si
la edad de un grupo de individuos es 30 aos y la DE = 3 aos, entonces:

Aproximadamente el 68% de los individuos tienen entre 27 y 33 aos (X +- 1


DE = 30+-1x3)

Aproximadamente el 95% de los individuos tienen entre 24 y 36 aos (X +- 2


DE = 30+-2x3)

Prcticamente la totalidad de los individuos tienen entre 21 y 39 aos (X +- 3


DE = 30+-3x3).

A travs del ejemplo anterior puede verse como el promedio y la DE bastan


para resumir un estudio. debe advertirse sin embargo que:

1. Cuando la serie es muy pequea las anteriores propiedades de la DE


son difciles de comprobar
2. Para que la interpretacin sea correcta se requiere, que las
caractersticas estudiadas semeje en curva normal. Si tal similitud no
existe, es preferible recurrir a la mediana y a los percentiles para resumir
la serie, o conformarse con analizar esta mediante el uso de
porcentajes.

Tomado de : Fayad. Cmel. Estadistica Medica y planificion de la salud ULA.


2002
Realizado por: Dra. Rosa Arcia. Medico Familiar
TEMA N 5: MEDIDAS DE DISPERSION

MEDIDAS DE DISPERSIN

INTRODUCCION:

El conocimiento de la forma de la distribucin y del respectivo promedio de una


coleccin de valores de una variable, puede servir para tener una idea bastante
clara de la conformacin, pero no de de la homogeneidad de cada una de los
valores con respecto a la medida de tendencia central aplicada.

En el caso de las variables con valores que pueden definirse en trminos de


alguna escala de medida de igual intervalo, puede usarse un tipo de indicador
que permite apreciar el grado de dispersin o variabilidad existente en el grupo
de variantes en estudio.

A estos indicadores les llamamos medidas de dispersin, por cuanto que


estn referidos a la variabilidad que exhiben los valores de las observaciones,
ya que si no hubiere variabilidad o dispersin en los datos inters, entonces no
habra necesidad de la gran mayora de las medidas de la estadstica
descriptiva.

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersin nos dicen hasta que punto
estas medidas de tendencia central son representativas como sntesis de la
informacin. Las medidas de dispersin cuantifican la separacin, la dispersin,
la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirn comparar varias
muestras.

LA DISPERSIN

Al igual que sucede con cualquier conjunto de datos, la media, la


mediana y la moda slo nos revelan una parte de la informacin que
necesitamos acerca de las caractersticas de los datos. Para aumentar
nuestro entendimiento del patrn de los datos, debemos medir tambin
su dispersin, extensin o variabilidad.

La dispersin es importante porque:

Proporciona informacin adicional que permite juzgar la confiabilidad de la


medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posicin central es menos representativa de los datos.

Ya que existen problemas caractersticos para datos ampliamente


dispersos, debemos ser capaces de distinguir que presentan esa
dispersin antes de abordar esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no
se desea tener una amplia dispersin de valores con respecto al centro
de distribucin o esto presenta riesgos inaceptables, necesitamos tener
habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones ms grandes.

Pero si hay dispersin en la mayora de los datos, y debemos estar en


capacidad de describirla. Ya que la dispersin ocurre frecuentemente y su
grado de variabilidad es importante, cmo medimos la variabilidad de una
distribucin emprica?. Vamos a considerar slo algunas medidas de dispersin
absolutas: el rango, la varianza, la desviacin estndar y el coeficiente de
variacin.

MEDIDAS DE VARIABILIDAD MS USADAS

RANGO
DESVIACION ESTANDAR
VARIANZA
COEFICIENTE DE VARIACION
DECILES
CUARTILES
PERCENTILES.

EL RANGO O AMPLITUD( R ):

Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin


agrupar, el rango se define como la diferencia entre el valor ms alto (X n Xmax.)
y el mas bajo (X1 Xmin) en un conjunto de datos.

Rango para datos no agrupados;

R = Xmx.-Xmn = Xn-X1

Ejemplo:

Se tienen las edades de cinco estudiantes


universitarios de Ier ao, a saber: 18,23, 27,34 y 25.,
para calcular la media aritmtica (promedio de las
edades, se tiene que:

R = Xn-X1 ) = 34-18 = 16 aos

Con datos agrupados no se saben los valores mximos y mnimos. Si no hay


intervalos de clases abiertos podemos aproximar el rango mediante el uso de
los lmites de clases. Se aproxima el rango tomando el limite superior de la
ltima clase menos el limite inferior de la primera clase.
DESVIACIN ESTNDAR: ( DE, S) en series no agrupadas:

La desviacin Estndar consiste en averiguar en cuanto difiere cada


observacin ( xi) del promedio general del grupo. Como esta suma siempre es
0 ( cero), se eleva cada desviacin al cuadrado para hacer desaparecer el
signo. la suma de estos cuadrados se divide entre el numero de observaciones
menos uno ( n-1), por ultimo se extrae la raz cuadrada para volver a la unidad
de origen.

Ejemplo:
das de hospitalizacion en 7 pacientes con bronquitis
( calculo de la desviacin estndar)
numero del das de valores xi
paciente hospitalizacin al cuadrado
primero 1 1
segundo 2 4
tercero 3 9
cuarto 7 49
quinto 11 121
sexto 12 144
sptimo 13 169
total 49 497
Los pasos a seguir son los siguientes:
1. Sumar la observaciones = 49
2. Elevar al cuadrado cada observacin y sumar esta columna =497
3. Elevar al cuadrado las suma de las observaciones obtenidas en el
primer paso y dividir por el numero de observaciones= ( 49) 2 /7 = 343
4. restar este ultimo valor a la suma de cuadrados obtenida en el paso 2
( 497-343) = 154
5. Dividir por el numero de observaciones menos 1, ( n-1) y extraer la raz
cuadrada.
6. S= 5,07 ( este valor es la desviacin Estndar)

Desviacin estndar en series agrupadas

Los diferentes pasos que deben seguirse para el calculo de la Desviacin


Estndar aparecen resumidos en el siguiente cuadro, cuyas primeras cuatro
columnas se utilizan para calcular el promedio conforme ya se estudio
previamente.

Pto. producto
Peso en N de medio de de la producto
kilos Personas la columnas x2 de la
Kilos fi clasede 2 x 3Prs . columnas
la case 2 x3 3x4
20-24 4 22 88 484 1936
25-29 8 27 216 729 5832
30-34 9 32 288 1024 9216
35-39 10 37 370 1369 13690
40-44 7 42 294 1764 12348
45-49 6 47 282 2209 13254
50-54 6 52 312 2704 16224
total 50 1850 72500

pasos:

1.Obtener los valores fi Xi multiplicando las cifras de la columna 2 por la columna 3 y


sumar estos valores (=1.850)
2.Obtener los valores fi X2i multiplicando las cifras de las columnas 3 y 4 y sumar
dichos valores ( =72.500)
3.Elevar al cuadrado la suma fi Xi obtenida en el primer paso y dividir por el nmero de
observaciones ( 1.850 al cuadrado sobre 50= 68.450)
4.Restar este ultimo valor a la suma de cuadrados, o sea ( 72.500- 68.450= 4.050).
5.Dividir el resultado de esta resta entre ( n-1) y extrae la raz cuadrada
4.050/50 = 9,1 Kg

LA VARIANZA (S2 2 ):

La varianza es una medida de dispersin relativa a algn punto de referencia.


Ese punto de referencia es la media aritmtica de la distribucin. Ms
especficamente, la varianza es una medida de que tan cerca, o que tan lejos
estn los diferentes valores de su propia media aritmtica. Cuando ms lejos
estn las X i de su propia media aritmtica, mayor es la varianza; cuando ms
cerca estn las Xi a su media menos es la varianza.

Dado un conjunto de observaciones, tales como X 1, X2, , Xn, la


varianza denotada usualmente por la letra minscula griega
(sigma) elevada al cuadrado (2)y en otros casos S2 segn otros
analistas, se define como: el cuadrado medio de las
desviaciones con respecto a su media aritmtica"

Matemticamente, se expresa como:

Ejemplo:

Se tienen las edades de cinco estudiantes


universitarios de Ier ao, a saber: 18,23, 25, 27, y
34. Al calcular la media aritmtica (promedio de las
edades, se obtuvo 25.4 aos, encontrar la varianza
de las edades de estos estudiantes:
Para calcular se utiliza una tabla estadstica de
trabajo de la siguiente manera:

Xi ( Xi - ) ( Xi - )2

18 (18 25.4)=-7.4 (-7.4)2=54.76

23 (23 25.4)=-2.4 (-2.4)2= 5.76

25 (25 25.4)=-0.4 (-0.4)2= 0.16

27 (27 25.4)= 1.6 ( 1.6)2= 2.56

34 (34 25.4)= 8.6 ( 8.6)2 =73.96

Total xxxx 137.2

S2= 137.2/5=27.4 aos

Respuesta: la varianza de las edades es de 27.4


aos

La varianza para datos agrupados

Si en una tabla de distribucin de frecuencias. Los puntos medios


de las clases son X1, X2, , Xn; y las frecuencias de las clases f 1,
f2, , fn; la varianza se calcula as:

(Xi-)2f1

2 = ----------------

fi

Sin embargo la formula anterior tiene algn inconveniente para su


uso en la practica, sobre todo cuando se trabaja con nmeros
decimales o cuando la media aritmtica es un nmero entero.
Asimismo cuando se trabaja con mquinas calculadoras, La tarea
de computar la varianza se simplifica utilizando la formula de
computacin que se da a continuacin:

Xi2fi - [(Xifi)2/N]

2 = ----------------------------

N donde N=fi
Ejemplo:

Se tienen los datos de una muestra de 30 cuentas


por cobrar de la tienda Cabreras y Asociados
dispuestos en una tabla de distribucin de
frecuencias, a partir de los cuales se deber calcular
la varianza, para lo cual se construye la siguiente
tabla estadstica de trabajo, si se calcul
anteriormente la media aritmtica y se fij en 43.458
(ver ejemplo del calculo en "media aritmtica para
datos agrupados) de la siguiente manera

= 21,649.344 / 30 = 721.645

Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645

Propiedades de la varianza :

o s siempre un valor no negativo, que puede ser igual o distinta de


0. Ser 0 solamente cuando Xi=
o La varianza es la medida de dispersin cuadrtica optima por ser
la menor de todas.
o Si a todos los valores de la variable se le suma una constante la
varianza no se modifica.

El Coeficiente de Variacin de Pearson (C.V.)

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersin nos dicen hasta que punto
estas medidas de tendencia central son representativas como sntesis de la
informacin. Las medidas de dispersin cuantifican la separacin, la dispersin,
la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirn comparar varias
muestras.

El problema de las medidas de dispersin absolutas es que normalmente son


un indicador que nos da problemas a la hora de comparar. Comparar muestras
de variables que entre s no tienen cantidades en las mismas unidades, de ah
que en ocasiones se recurra a medidas de dispersin relativas.

Un problema que se plantea, tanto la varianza como la desviacin estndar,


especialmente a efectos de comparaciones entre distribuciones, es el de la
dependencia respecto a las unidades de medida de la variable. Cuando se
quiere comparar el grado de dispersin de dos distribuciones que no vienen
dadas en las mismas unidades o que las medias no son iguales se utiliza el
llamado "Coeficiente de Variacin de Pearson", del que se demuestra que
nos da un nmero independiente de las unidades de medidas empleadas, por
lo que entre dos distribuciones dadas diremos que posee menor dispersin
aquella cuyo coeficiente de variacin sea menor., y que se define como la
relacin por cociente entre la desviacin estndar y la media aritmtica; o
en otras palabras es la desviacin estndar expresada como porcentaje
de la media aritmtica.

Definicin del Coeficiente de Variacin

CV= s/x2

Donde: C.V. representa el nmero de veces que la


desviacin tpica contiene a la media aritmtica y
por lo tanto cuanto mayor es CV mayor es la
dispersin y menor la representatividad de la media.

Propiedades del Coeficiente de Variacin :

o Si a todos los valores de la variable se le suma una misma


constante el coeficiente de variacin queda alterado .

Ejemplo:

Suponga que Usted trabaja en una compaa de ventas, que


ofrece como premio de incentivo al mejor vendedor del trimestre
anterior las entradas al palco empresarial en la serie final de
bisbol de las grandes ligas en los Estados Unidos (E,E,U,A,).

De los registrosde ventas se tienen los siguientes datos de


ventas, expresados en porcentajes de cumplimiento de las metas
fijadas mensualmente:

Vendedor A 95 105 100

Vendedor B 100 90 110

El promedio trimestral de cumplimiento de las metas de ventas de


ambos vendedores es igual y equivale al 100%, pero Ud. Slo le
puede dar el premio de incentivo a uno de ellos. Cul usted
escogera?. En base a que criterio. Explique.

Este problema se resuelve utilizando el coeficiente de variacin,


para estos efectos es necesario encontrar la desviacin estndar
trimestral de las ventas de cada uno de la siguiente manera:
Vendedor A

Xi ( Xi - ) ( Xi - )
2

95 95 100 = -5 (-5)2 = 25

105 105 100 = 5 ( 5)2 = 25

100 100 100 = 0 ( 0)2 = 0

Total XXX 50

La desviacin estndar es =(50/3) = 16.667 = 4.08, luego


entonces el coeficiente de variacin es igual a:

4.08

C.VA= --------- = ----------- = 0.0408

100

Vendedor B

Xi ( Xi - ) ( X i - )2

100 100 100 = 0 ( 0 )2 = 0

90 90 100 = -10 (-10)2 = 100

110 110 100 = 10 ( 10)2 = 100

Total XXX 200

La desviacin estndar es =(200/3) = 66.667 = 8.16, luego


entonces el coeficiente de variacin es igual a:

8.16

C.VB= --------- = ----------- = 0.0816

100
Respuesta: Dado que el vendedor A tiene menor coeficiente
de variacin, A l le corresponde recibir el premio de
incentivo.

As como las medidas de tendencia central nos permiten identificar el punto


central de los datos, las Medidas de dispersin nos permiten reconocer que
tanto se dispersan los datos alrededor del punto central; es decir, nos indican
cuanto se desvan las observaciones alrededor de su promedio aritmtico
(Media). Este tipo de medidas son parmetros informativos que nos permiten
conocer como los valores de los datos se reparten a travs de eje X, mediante
un valor numrico que representa el promedio de dispersin de los datos. Las
medidas de dispersin ms importantes y las ms utilizadas son la Varianza y
la Desviacin estndar (o Tpica).

Lomadee, una nueva especie en la web. La mayor Plataforma de Afiliados de Latinoamrica.

1. VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada
uno de los valores respecto a su punto central (Media ). Este promedio es
calculado, elevando cada una de las diferencias al cuadrado (Con el fin de
eliminar los signos negativos), y calculando su promedio o media; es decir,
sumado todos los cuadrados de las diferencias de cada valor respecto a la
media y dividiendo este resultado por el nmero de observaciones que se
tengan. Si la varianza es calculada a una poblacin (Total de componentes de
un conjunto), la ecuacin sera:

Ecuacin 5-6

Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( )


representa la media poblacional y (N) es el nmero de observaciones tamao
de la poblacin. En el caso que estemos trabajando con una muestra la
ecuacin que se debe emplear es:

Ecuacin 5-7

Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( )
representa la media de la muestra y (n) es el nmero de observaciones
tamao de la muestra. Si nos fijamos en la ecuacin, notaremos que se le resta
uno al tamao de la muestra; esto se hace con el objetivo de aplicar una
pequea medida de correccin a la varianza, intentando hacerla ms
representativa para la poblacin. Es necesario resaltar que la varianza nos da
como resultado el promedio de la desviacin, pero este valor se encuentra
elevado al cuadrado.

2. Desviacin estndar o Tpica


Esta medida nos permite determinar el promedio aritmtico de fluctuacin de
los datos respecto a su punto central o media. La desviacin estndar nos da
como resultado un valor numrico que representa el promedio de diferencia
que hay entre los datos y la media. Para calcular la desviacin estndar basta
con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:

Ecuacin 5-8

Para comprender el concepto de las medidas de distribucin vamos a suponer


que el gerente de una empresa de alimentos desea saber que tanto varan los
pesos de los empaques (en gramos), de uno de sus productos; por lo que opta
por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos
tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos
respectivamente.

Por lo que su media es:

La varianza sera:

Por lo tanto la desviacin estndar sera:

Con lo que concluiramos que el peso promedio de los empaques es de 507


gramos, con una tendencia a variar por debajo o por encima de dicho peso en
12 gramos. Esta informacin le permite al gerente determinar cuanto es el
promedio de perdidas causado por el exceso de peso en los empaques y le da
las bases para tomar los correctivos necesarios en el proceso de empacado.
Atrs
Medidas Tendencia Central
Siguiente
Medidas de Distibucin
SECCIONES
Varianza y desviacin estndar
La desviacin slo significa qu tan lejos de lo normal

Desviacin estndar
La desviacin estndar () mide cunto se separan los datos.

La frmula es fcil: es la raz cuadrada de la varianza. As que, "qu es la varianza?"

Varianza
la varianza (que es el cuadrado de la desviacin estndar: 2) se define as:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los nmeros)


2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia
elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (Por qu al cuadrado?)

Ejemplo
T y tus amigos habis medido las alturas de vuestros perros (en milmetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviacin estndar.

Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5
as que la altura media es 394 mm. Vamos a dibujar esto en el grfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:

2062 + 762 + (-224)2 + 362 + (-94)2 108,520


2
Varianza: = = = 21,704
5 5

As que la varianza es 21,704.

Y la desviacin estndar es la raz de la varianza, as que:

Desviacin estndar: = 21,704 = 147

y lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas estn a


distancia menos de la desviacin estndar (147mm) de la media:
As que usando la desviacin estndar tenemos una manera "estndar" de saber qu es
normal, o extra grande o extra pequeo.

Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... pero que
no se enteren!

*Nota: por qu al cuadrado?

Elevar cada diferencia al cuadrado hace que todos los nmeros sean positivos (para
evitar que los nmeros negativos reduzcan la varianza)

Y tambin hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es
mucho ms grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, as que lo deshacemos
(con la raz cuadrada) y as la desviacin estndar es mucho ms til.

Volver arriba

Cmo calcular el valor medioExactitud y precisinCalculadora de desviacin


estndarDatos, Probabilidad y Estadstica

Cmo calcular la media


El valor medio (tambin se llama la media) es simplemente el promedio de los
nmeros.

Es fcil de calcular: slo suma los nmeros, despus divide por cuntos nmeros hay.
(En otras palabras es la suma dividida por la cuenta).

Ejemplo 1:
Cul es la media de estos nmeros?

3, 10, 5

Suma los nmeros: 3 + 10 + 5 = 18

Divide por cuntos nmeros hay (tenemos 3 nmeros): 18 3 = 6

La media es 6

Ejemplo 2:
Mira estos nmeros:

3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23,
29

La suma de estos nmeros es igual a 330

Hay quince nmeros.

La media es igual a 330 15 = 22

El valor medio de los nmeros de arriba es 22

Nmeros negativos
Qu hacemos con los nmeros negativos? Sumar un nmero negativo es lo mismo que
restarlo (quitndole el signo menos). Por ejemplo 3 + (-2) = 3-2 = 1. Sabiendo esto,
vamos a hacer un ejemplo:

Ejemplo 3:
Calcula la media de estos nmeros:

3, -7, 5, 13, -2

La suma de estos nmeros es 3-7+5+13-2 = 12

Hay 5 nmeros.

La media es igual a 12 5 = 2.4

La media de los nmeros de arriba es 2.4

Cmo calcular la moda o valor modal


La moda es simplemente el valor que aparece ms veces.

Para calcular la moda tienes que ordenar los nmeros que te dan.

Mira estos nmeros:

3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29

Ordenados quedan:

3, 5, 7, 12, 13, 14, 20, 23, 23, 23, 23, 29, 39, 40, 56
As es ms fcil ver qu nmeros aparecen ms veces.

En este caso la moda es 23.

Cmo calcular la mediana


Es el nmero en el medio de una lista ordenada.

Para calcular la mediana, ordena los nmeros que te han dado segn su valor y
encuentra el que queda en el medio.

Mira estos nmeros:

3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23,
29

Si los ordenamos queda:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40,
56

Hay quince nmeros. El del medio es el octavo nmero:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40,
56

La mediana de este conjunto de valores es 23.

(Fjate en que no importan mucho los otros nmeros de la lista)

PERO si hay una cantidad par de nmeros la cosa cambia un poco.

En ese caso tenemos que encontrar el par central de nmeros, y despus calcular su
valor medio. Esto se hace simplemente sumndolos y dividiendo entre dos.

Lo vemos mejor con un ejemplo:

3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12, 56, 23, 29

Si ordenamos los nmeros nos queda:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

Ahora hay catorce nmeros as que no tenemos slo uno en el medio, sino un par:
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

En este ejemplo los nmeros intermedios son 21 y 23.

Para calcular el valor en medio de ellos, sumamos y dividimos entre 2:

21 + 23 = 44
44 2 = 22

As que la mediana en este ejemplo es 22.

Distribucin normal estndar

Esta curva "de campana" es la distribucin normal estndar.

Puedes usar la tabla de abajo para saber el rea bajo la curva desde la lnea central hasta
cualquier lnea vertical "a valor Z" hasta 3, en incrementos de 0.1

Esto te dice qu parte de la poblacin est dentro de "Z" desviaciones estndar de la


media.

En lugar de una tabla LARGA, hemos puesto los incrementos de 0.1 hacia abajo, y los
de 0.01 de lado.

Por ejemplo, para saber el rea debajo de la curva entre 0 y 0.45, ve a la fila de 0.4, y
sigue de lado hasta 0.45, all pone 0.1736

Como la curva es simtrica, la tabla vale para ir en las dos direcciones, as que 0.45
negativo tambin tiene un rea de 0.1736

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990