Professional Documents
Culture Documents
Primera edicin:
Lima, 2008.
Serie:
Textos de la Maestra en Educacin.
Rector
Decano
Director de la UPG
Dedicatoria
Para Sandra Natalia (Mara Estela)
Para Ernesto Alonso (Violeta Alicia)
CONTENIDO
Prefacio
Agradecimientos
Introduccin
001
1.2.
Definicin de estadstica
002
1.3.
Investigacin cientfica
004
1.4.
005
1.5.
Paradigmas de la investigacin
005
1.6.
Clasificacin de la estadstica
008
Introduccin
010
2.2.
Poblacin
011
2.3.
Muestra
012
2.4.
Muestra aleatoria
012
2.5.
013
2.6.
Parmetro
014
2.7.
Estadstico
015
2.8.
Distribucin muestral
017
2.9.
Estimacin
022
023
025
026
Ejercicios propuestos
027
Introduccin
029
3.2.
029
3.3.
032
3.4.
3.5.
039
3.8.
041
1 2 , de poblaciones normales
044
044
050
12
, de poblaciones normales independientes
22
3.9.
033
054
Ejercicios propuestos
056
060
Introduccin
066
4.2.
Conceptos bsicos
067
4.3.
075
4.4.
076
4.5.
082
4.6.
Para
085
4.7.
088
089
092
4.8.
100
4.9.
104
4.10. Para
1 2
de poblaciones binomiales
Ejercicios propuestos
110
112
Introduccin
116
5.2.
117
5.3.
118
5.4.
119
5.5.
120
5.6.
122
5.7.
125
5.8.
131
5.9.
134
141
Ejercicios propuestos
143
Introduccin
145
6.2.
Prueba binomial
146
6.3.
Prueba U de Mann-Whitney
149
6.4.
155
6.5.
Prueba de Kruskal-Wallis
159
6.6.
Prueba de Kolmogorov-Smirnov
164
Ejercicios propuestos
168
Introduccin
170
7.2.
Tablas de contingencia
170
7.3.
Estadstica Chi-cuadrado
171
7.4.
172
7.5.
176
Ejercicios propuestos
180
Anexo
Uso de Excel en el clculo de los valores de algunas variables aleatorias
000
PREFACIO
Los clculos que se presentan para aplicar las herramientas de la inferencia estadstica son
para que los lectores entiendan sus cmo y porqu y, asimismo, la interpretacin de los
resultados obtenidos. Dejamos bien en claro que en ningn momento se pretende adiestrar a
lo lectores en clculos, sino en que aprendan los conocimientos tericos estadsticos de la
inferencia (saber), apliquen las herramientas estadsticas (saber hacer) y desarrollen una
actitud positiva hacia la estadstica. Esto es, que la estadstica no solamente es clculo, o el
simple uso de las frmulas o expresiones que aparecen en ste y en diversos libros de
estadstica, sino razonamiento crtico basado en evidencias objetivas que se obtienen de la
poblacin bajo estudio (ser).
Una vez que el lector haya asimilado los conocimientos estadsticos, y sus aplicaciones, que
brindamos en el presente libro, estar en la capacidad de usar software estadstico, que es un
instrumento comparable a una calculadora. El aprendizaje de estadstica usando software
estadstico no debe reducirse, sin embargo, a manipulaciones mecnicas, pues ste sirve como
apoyo del profesor para mostrar, en forma precisa y rpida, los grficos y clculos
estadsticos.
VIOLETA ALICIA NOLBERTO SIFUENTES
MARA ESTELA PONCE ARUNERI
AGRADECIMIENTOS
Al Dr. Elas Meja Mejia, Director de la Unidad de Post Grado de la Facultad de Educacin
de la Universidad Nacional Mayor de San Marcos, por brindarnos la oportunidad de entregar
al mundo acadmico el presente libro, en particular a los maestristas de la mencionada
facultad, que lo usaran como gua para el aprendizaje del Curso de Estadstica Inferencial, en
el plan de estudios vigente. Tambin por considerarnos como docentes de tan prestigiada
unidad de post grado.
A nuestros alumnos, por la paciencia e inters en aprender estadstica, por sus comentarios y
sugerencias para con nuestro desempeo docente.
A todos los lectores docentes, alumnos, empresarios, en general todos aquellos que tomaran
decisiones basadas en evidencias objetivas, en concordancia con el mundo en que vivimos,
caracterizado por el constante aprendizaje y el manejo adecuado de la informacin, en
particular de la informacin estadstica.
Asimismo a los que nos hagan llegar sus comentarios, observaciones y dudas respecto a lo
tratado en el presente libro, los mismos que contribuirn con la enseanza y la difusin de la
estadstica.
Finalmente a nuestras familias, por el apoyo, comprensin y aliento, para con el desarrollo del
presente libro.
CAPTULO 1
1.1. INTRODUCCIN
Educacin
que
se
encuentra
disponible
en
la
pgina
web:
Es el acto de valorar una realidad que forma parte de un proceso cuyos momentos
previos son la fijacin de las caractersticas de la realidad a valorar y de la recogida de
informacin sobre la misma, y cuyas etapas posteriores son la informacin y/o toma de
decisiones en funcin del juicio de valor emitido.
9
Por tanto, si el educador desea evaluar el rendimiento escolar, es necesario conocer las
caractersticas de esta realidad escolar, llamada estadsticamente, poblacin. Si est en
condiciones de recolectar los datos de toda la poblacin se denomina censo, es decir datos de
todos y cada uno de los escolares para lograr los objetivos propuestos, o por el contrario, si
toma o selecciona un grupo de escolares, se denomina una muestra representativa (muestra
probabilstica o aleatoria) de escolares, y a travs de la muestra intentar conocer la realidad
de la poblacin escolar.
Cuando se trabaja con una muestra probabilstica y queremos conocer a la poblacin, a partir
de los datos muestrales, empleamos los mtodos que ofrece la Estadstica Inferencial, que en
el presente libro nos ocupar varios captulos.
Este libro es a nivel bsico, tratando de ser lo ms amigable posible, tomando en cuenta que
nos dirigimos a profesionales no estadsticos, en particular de la Educacin.
La ciencia formada por un conjunto de teoras y tcnicas cuantitativas, que tienen por
objeto la organizacin, presentacin, descripcin, resumen y comparacin de conjunto
de datos numricos, obtenidos de poblaciones en su conjunto de individuos o
fenmenos o bien de muestras que representan las poblaciones estudiadas, asi como el
estudio de su variacin, propiedades, relaciones, comportamiento probabilstico de
10
Montgmery, Douglas (1985), define a la Estadstica como: El arte de tomar decisiones acerca
de un proceso o una poblacin con base en un anlisis de la informacin contenida en una
muestra tomada de la poblacin.
mbitos; en particular respecto a los alumnos sobre rendimiento acadmico, aptitud cientfica,
desarrollo social y la desercin entre otros. Tambin respecto al docente sobre su desempeo
en aula, su formacin acadmico-profesional, los recursos didcticos que emplea y la
produccin cientfica, entre otros. Respecto al sistema educativo, financiamiento de la
educacin, gestin acadmica, informtica educativa y modelos educativos, entre otros.
Todos estos problemas no pueden ser resueltos por iniciativas subjetivas, por pareceres o
lluvia de ideas; sino en base a informacin valida y confiable, esto es, tener informacin lo
ms prximo a la realidad bajo estudio. Indudablemente esto se logra empleando la ciencia
llamada Estadstica.
Para resolver estos problemas se debe seguir de manera organizada, sistemtica y planificada,
es decir debemos realizar Investigacin Cientfica.
Es una forma especial de buscar el conocimiento, presenta toda una serie de caractersticas
que la diferencian de otras formas de abordar la realidad, como son el conocimiento emprico
espontneo y el razonamiento especulativo. A continuaciones se presentan algunas
definiciones:
12
4. Es lgica y objetiva.
En relacin a las funciones que realiza la ciencia, los objetivos fundamentales de una
Investigacin Cientfica son:
13
En este caso, los mtodos estadsticos cumplen funciones cognoscitivas importantes como
herramienta de investigacin cientfica, por tanto el proceso de investigacin cientfica
encuentra su fundamento metodolgico en la concepcin cientfica general de la realidad
objetiva. Pero cmo conocer la realidad?
Para sintetizar, estos dos paradigmas, se presenta la siguiente tabla, disponible en:
www.fisterra.com/mbe/investiga/cuanti_cuali/cuanti_cuali.asp (22.03.08).
14
Tabla N 1.1
Ventajas y desventajas entre mtodos cualitativos y cuantitativos
Mtodos cualitativos
Mtodos cuantitativos
Propensin a "comunicarse con" los Propensin a "servirse de" los sujetos del
sujetos del estudio.
estudio.
Se limita a preguntar.
Se limita a responder.
los
cualitativos:
Son
Podemos afirmar que como todo mtodo cientfico, se debe reconocer sus ventajas y
desventajas, lo importante es determinar el momento adecuado para aplicarlo en el desarrollo
de la investigacin cientfica.
para solucionar problemas de una investigacin cientfica, sta debe reunir ciertas
caractersticas.
En otros casos ser necesario emplear ambos paradigmas, como por ejemplo cuando se trata
de evaluar la Calidad de la Educacin, en particular la Educacin Superior, no es suficiente
uno de ellos se deben emplear ambas. La realidad es muy compleja, multifactorial, dinmica,
por lo tanto, ambos paradigmas se complementan, no son excluyentes.
Una vez establecido el objeto de estudio en base a los conocimientos tericos, se inicia la
etapa de Diseo Metodolgico (Diseo), donde se define el proceso de recoleccin de datos,
delimitando las unidades bajo estudio y las variables a medirse, que permitan contestar las
preguntas formuladas, en el proyecto de investigacin cientfica. Es indudable que, la
Estadstica es una poderosa herramienta para planificar y desarrollar el Diseo Metodolgico.
Los datos obtenidos, de la realidad investigada, se analizan aplicando los mtodos y tcnicas
estadsticas para contrastar sus posibles divergencias con las consecuencias que se deducen de
las hiptesis. Por tanto nos preguntamos:
Cmo se llevar a cabo el estudio para investigar sobre diferentes problemas y aristas
del trabajo educativo, para el logro de sus objetivos y/o verificacin de sus hiptesis?
Cmo se realizar la investigacin, a fin de maximizar la validez y confiabilidad de la
informacin y reducir errores en los resultados?
Las respuestas que ustedes proporcionen dejan notar la relacin que existe entre Estadstica e
Investigacin Cientfica.
16
Rama de la Estadstica que trata sobre la descripcin y anlisis estadstico de una poblacin,
que resumen y presenta datos obtenidos de la poblacin o de una muestra, mediante mtodos
adecuados.
Tiene como objetivo, caracterizar los datos, de manera grfica o analtica, para resaltar las
propiedades de los elementos bajo estudio.
Tiene como objetivo, generalizar las propiedades de la poblacin bajo estudio, basado en los
resultados de una muestra representativa de la poblacin.
17
En cuanto a la Probabilidad, Juez Martel, Pedro y Diez Vegas, Francisco Javier (1997),
manifiestan que: Hoy en da la Probabilidad y la Estadstica, ntimamente unidas en s,
desempean un papel fundamental en prcticamente todos los campos del saber, tanto en las
ciencias naturales como en las ciencias humanas, papel que va cobrando cada vez mayor
importancia.
RECUERDE
Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin
del problema que se investiga, o por una mala recoleccin de datos. Una investigacin
que empieza mal, con seguridad termina mal.
CON DATOS DE MALA CALIDAD, NO SER POSIBLE DAR RESPUESTA
ADECUADA A UN PROBLEMA CIENTFICO
Nosotros recordamos al estudiante que los mtodos estadsticos son las herramientas ms
peligrosas en manos de gente inexperta. Pocas materias tiene una aplicacin tan amplia;
Ninguna requiere tal cuidado en su aplicacin.
18
CAPTULO 2
ESTADSTICA INFERENCIAL
2.1. INTRODUCCIN
Ejemplo 2.1
Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como son:
19
2. Para el prximo ao el mtodo identificado como el mejor, dar buenos resultados, para
el alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin Bsica
Secundaria?
Los casos de incertidumbre y toma de decisiones son resueltos por la Estadstica Inferencial,
por supuesto apoyado por la probabilidad.
20
2.2. POBLACIN
X 1 , X 2 , X 3 , ..., X N
Ejemplo 2.2
X 1 , X 2 , X 3 , ..., X 300
financieros, metodolgicos u otros no ser posible entonces se debe trabajar con una muestra
extrada de la poblacin bajo estudio.
2.3. MUESTRA
Sierra Bravo (1991) anota que: Una muestra en general, es toda parte representativa de la
poblacin, cuyas caractersticas debe reproducir en pequeo lo ms exactamente posible.
Para que sea representativa se debe seleccionar empleando el muestreo, tpico importante de
la Estadstica, con la finalidad de que los resultados de esta muestra sean validos para la
poblacin de la que sea obtenido la muestra. Esta generalizacin se realiza empleando la
estadstica inferencial.
Ejemplo 2.3
Puesto que la seleccin de los alumnos, en este caso es seis, es aleatoria o al azar:
X1, X 2 , X 3 , X 4 , X 5 , X 6
Constituye variables aleatorias. Se admite que son independientes y cada una con la misma
distribucin que la variable aleatoria X. En un sentido matemtico el trmino muestra
aleatoria, se refiere, no a seis alumnos seleccionados para este estudio sino a las seis variables
aleatorias X 1 , X 2 , X 3 , X 4 , X 5 , X 6 asociadas con los alumnos.
23
Ejemplo 2.4
Para el caso del ejemplo 2.3, una vez identificados los seis alumnos, podemos determinar los
valores numricos de las seis variables aleatorias X 1 , X 2 , X 3 , X 4 , X 5 , X 6 . Supongamos que el
primer alumno seleccionado ha obtenido 13 en la prueba de educacin ambiental en este caso,
la variable aleatoria X 1 toma el valor x1 = 13.
Ahora estamos utilizando el termino muestra aleatoria no para referirnos a los alumnos
seleccionados o a las variables aleatorias asociados con ellos sino a los seis valores numricos
x1 , x2 , x3 , x4 , x5 , x6 que toman respectivamente cada una de las seis variables aleatorias.
2.6. PARMETRO
Sierra Bravo (1991) indica que parmetro deriva del vocablo griego parmetreo que significa
medir una cosa con otra:
24
En estadstica se refiere a los valores o medidas que caracterizan una poblacin como
por ejemplo la media y la desviacin tpica de una poblacin () Son cantidades
indeterminadas constantes o fijas respecto a una condicin o situacin que caracteriza
a un fenmeno en un momento dado que ocurre en una poblacin.
Se suele representar a un parmetro mediante letras griegas, por ejemplo la media poblacional
se representa mediante x y se lee como media poblacional de la variable aleatoria X, la
varianza poblacional se representa mediante x2 y se lee como varianza poblacional de la
variable aleatoria X.
En trminos prcticos un parmetro es un valor que resulta al emplear los valores que se
obtiene de una poblacin.
Ejemplo 2.5
Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, estos se
promedia, entonces x = 14.78 es el parmetro correspondiente. Para su clculo se ha
empleado la siguiente expresin, llamada media poblacional:
x =
X
i =1
(2.1)
Si de estos 300 alumnos 198 son mujeres, entonces la proporcin poblacional de mujeres
representada por x = 0.66 (66%). Para su clculo se ha empleado la siguiente expresin,
llamada proporcin poblacional:
x =
X
i =1
N
25
(2.2)
1 si alumna
Xi =
0 si alumno
2.7. ESTADSTICO
Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la muestra en
relacin al valor poblacional que se asume es constante.
Ejemplo 2.6
Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, una vez
identificados los seis alumnos, obtienen las siguientes calificaciones x1 = 13, x2 = 10, x3 =
13, x4 = 14, x5 = 11, x6 = 10 la media obtenida de los seis alumnos es de 11,83, llamada
media muestral y se representa mediante x , cuya expresin es:
x=
i =1
(2.3)
El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido por
6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de calificacin en
la prueba de educacin ambiental.
26
(x x )
n
S =
i =1
(2.4)
Para su clculo, disponemos de la tabla, 2.1, en la que mostramos paso a paso el uso de la
expresin (2.4) sabiendo que x = 11,83:
Tabla 2.1
Clculos para obtener el valor de la varianza (ejemplo 2.6)
xi
(x x )
(x x )
13
1,17
1,3689
10
-1,83
3,3489
13
1,17
1,3689
14
2,17
4,7089
11
-0,83
0,6889
10
-1,83
3,3489
Total
71
0,02*
14,8334
Unidad
Tericamente:
(x
n
i =1
x =0
El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de cada
valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que
dividido por 6 es justamente 2,4722.
27
S = + S2
(2.5)
Ejemplo 2.7
28
Tabla 2.2
Resultados de posibles muestras de tamao 2
Muestras
Medias muestrales
Posibles
13,11
12
13,7
10
11,13
12
11,7
7,13
10
7,11
Tabla 2.3
Distribucin muestral de la media muestral
Frecuencia
Frecuencia relativa
2/6 = 0.33
10
2/6 = 0.33
12
2/6 = 0.33
muestrales
29
La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus propiedades:
()
1. E x =
()
2. V x = 2 / n
4. Sea X 1 , X 2 , X 3 , ..., X n una muestra aleatoria de tamao n, de una distribucin con media
poblacional y varianza poblacional 2 . Entonces para n grande, la variable aleatoria:
(2.6)
/ n
s2 =
1
n 1
(x
n
i =1
(2.7)
( )
1. E s 2 = 2
(n 1)s 2
2
p=
nA
n
(2.8)
31
(1 ) / n
Z=
p
(1 ) / n
(2.8.)
Ejemplo 2.8
32
Tabla 2.4
Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)
Docentes
Edad (1)
Investigador (2)
Remuneracin (3)
34
38
49
42
35
44
30
36
43
10
47
11
39
12
46
13
48
14
36
15
44
(1)
(2)
(3)
2. Docentes maduros.
2. No.
Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error
estndar.
33
MEDIA MUESTRAL
La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y
varianza poblacional, 2 = 30 aos2.
Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene s 2 =
33,21 aos2.
En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:
x =
5,48 5,48
= 1,42 aos
=
15 3,87
PROPORCIN MUESTRAL
Para la segunda variable, interesa que el docente encuestado indique que la profesin de
investigador es una profesin atractiva para docentes jvenes ( A ). La muestra aleatoria es
igual a 15 docentes (n = 15) .
En esta poblacin se asume que la proporcin poblacional de docentes que consideran que la
profesin de investigador es una profesin atractiva para docentes jvenes es igual a 0,71
( = 0,71) .
De la tabla contamos que nA = 9, es decir, 9 docentes afirman que la profesin de
investigador es una profesin atractiva para docentes jvenes, entonces empleando la
expresin 2.8 se obtiene:
p=
9
= 0,6 (60%)
15
34
Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una
profesin atractiva para docentes jvenes.
p =
(1 )
n
0,71(1 0,71)
0,71(0,29)
0,2059
=
=
= 0,0137 = 0,1170
15
15
15
2.9. ESTIMACIN
Estimacin proviene del latn estimatio y significa estimacin, precio y valor que se da
a una cosa. En estadstica es la operacin que mediante la inferencia un parmetro,
utilizando datos incompletos procedentes de una muestra, se trata de determinar el
valor del parmetro. Pero los valores de la muestra estn sujetos al error muestral esto
es a las fluctuaciones de la muestra.
1. Estimacin puntual.
Ejemplo 2.9
(X )
investigador educativo debe ser bien remunerado (Y ) , para distinguir entre estimador y
estimacin:
Variable
Parmetro
Estimador
Estimacin
x=
x
i =1
= x = 40,73 aos
X
1
s =
n 1
2
(x
i =1
36
x)
2 = s 2 = 33,21 aos2
p=
nA
n
= p = 0,7333 (73,33%)
PRUEBA DE HIPTESIS
Proceso mediante el cual, a partir de los valores de una muestra aleatoria se decide si se
rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la
poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por tomar
una decisin.
Ejemplo 2.10
Explicar cul rama de la Inferencia Estadstica emplear, para lograr cada objetivo.
Solucin
37
2:
1 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios
de 8 aos de edad que asisten a IE Estatales.
2 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios
de 8 aos de edad que asisten a IE Privados.
Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener un
valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de manera
independiente de cada tipo de institucin educativa.
Para el logro del objetivo 2. Se desea verificar que los promedios poblacionales 1 y 2 son
diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de 2
( 1 2 ) o equivalentemente 1 - 2 = 0.
En este caso se parte del supuesto que no existe diferencias entre el nivel promedio
poblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE
38
Estatales y Privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el cual
se somete a prueba 1 - 2 = 0.
ESTADSTICA PARAMTRICA
Segn Sierra Bravo (1991) es parte de la estadstica que exige determinados requisitos para
emplear en la inferencia estadstica generalmente requiere para su uso el supuesto de
normalidad es decir que las muestras aleatorias se extraen de poblaciones que estn
normalmente distribuidas o aproximadamente.
Ejemplo 2.11
En este caso se debe elegir una muestra aleatoria de la poblacin conformada por nios de
esta poblacin, es decir, nios de 10 aos de edad con secuelas neurolgicas derivadas de
hiperbilirubenia al nacer.
sencillo.
Para estudiar a este parmetro se requiere evaluar a la muestra aleatoria de esta poblacin
antes de la capacitacin especial y despus de la capacitacin especial, es decir los parmetros
para este esquema, sujetos a estudio estadstico son:
39
ESTADSTICA NO PARAMTRICA
Ejemplo 2.12
EJERCICIOS PROPUESTOS
RESUMEN
1.1.
Defina la poblacin.
1.2.
Defina la muestra.
1.3.
1.4.
RESUMEN
El objetivo de esta investigacin fue identificar la percepcin que tienen los estudiantes
universitarios respecto a sus habilidades de investigacin, para lo cual se utiliz un
instrumento llamado Autoevaluacin de habilidades de investigacin (Rivera, Torres,
Garca Gil de Muoz, Salgado, Arango, Caa y Valentn, 2005). Participaron 119 estudiantes
de los cuales 73.7 % fueron mujeres y 26.3 % hombres, entre ellos, el 88.2 % se encontraba
realizando estudios de licenciatura y el 11.8 % de posgrado. Se cont con representantes de
cuatro reas de conocimiento: Ciencia y tecnologa, Ciencias humanas, Ciencias econmico
administrativas, y Educacin. La confiabilidad del instrumento aplicado fue alta (Alfa de
Cronbach = 9557). Se encontr que la mayora de los estudiantes asignan calificaciones altas
a sus habilidades de investigacin y que por lo general los hombres y las mujeres evalan sus
habilidades de investigacin de manera semejante; cuando aparecen diferencias significativas,
son los hombres quienes se asignan puntajes ms altos. Se discuten las diferencias entre los
resultados arrojados por este cuestionario con los de otras estrategias de evaluacin.
En base a este resumen, plantear como sera la aplicacin de la inferencia estadstica bajo el
enfoque de:
2.1.
Estimacin de parmetros.
2.2.
43
CAPTULO 3
ESTIMACIN DE PARAMTROS
3.1. INTRODUCCIN
Los estimadores son variables aleatorias, veamos un ejemplo cuando se estima la varianza de
una poblacin en base a una nuestra aleatoria difcilmente se puede esperar que el valor de la
varianza que obtenemos, a partir de los valores de la muestra aleatoria extrada, sea
exactamente igual al valor de la varianza poblacional 2 ; pero debemos esperar que ambos,
la varianza muestral y la varianza poblacional, estn lo ms cerca posible; Esto es el valor del
estadstico y el parmetro tomen valores muy similares.
s2 2
Pero el investigador no tiene la posibilidad o no puede disponer de los datos de toda la
poblacin, entonces debe usar las diversas propiedades estadsticas de los estimadores para
que decida cul es el estimador ms apropiado, cul expone a un riesgo menor, cul dar la
mayor informacin al costo ms bajo, y as podemos seguir enunciando propiedades ptimas.
No se tiene la certeza que los estimadores tengan el valor del parmetro, por ello debemos
considera sus propiedades.
3.2.1. INSESGAMIENTO
No hay estimadores perfectos que siempre nos van a dar los valores exactos del parmetro
pero es razonable que un estimador debe hacerlo al menos en el promedio, esto es su valor
44
esperado debe ser igual al parmetro que se supone estima. Es este caso se dice que es
estimador es insesgado.
()
Ejemplo 3.1
El estimador s 2 es insesgado de 2 , por que:
( )
E s2 = 2
Es decir en promedio el estimador s 2 es igual a 2
Si tenemos que escoger uno entre varios estimadores insesgados de un parmetro dado, se
suele tomar aquel cuya distribucin muestral tenga la varianza ms pequea, por tanto el
estimador seleccionado de varianza ms pequea es eficiente.
Ejemplo 3.2
( )
( ) ( )
3.2.3. CONSISTENCIA
45
lim P(
< c =1
3.2.4. SUFICIENCIA
Ejemplo 3.3
La media muestral es un estimador suficiente porque para su clculo se utiliza todos los datos
de la muestra. Recuerde el clculo:
x=
x
i =1
3.2.5. ROBUSTEZ
46
Ejemplo 3.4
Consideremos los datos de la variable edad en aos cumplidos, del ejemplo 2.8, a fin de
calcular la mediana, para ello previamente ordenamos los datos de manera ascendente.
Orden
10
11
12
13
14
15
Edad
30
34
35
36
36
38
39
42
43
44
44
46
47
48
49
Recuerde que x = 40,73 aos, con respecto a la mediana esta subestimada, esto se debe a la
presencia de edades extremas bajas.
Slo por cuestiones didcticas, vamos a asumir que la edad 49 no es tal, sino es 68, veamos
que ocurre con los valores de la media aritmtica y la mediana, observe ahora los datos
ordenados de manera ascendente son:
Orden
10
11
12
13
14
15
Edad
30
34
35
36
36
38
39
42
43
44
44
46
47
48
68
Ahora la x = 42 aos y est afectada por el valor extremo alto 58, la media se sobreestima,
pero la mediana no cambia, por que el valor extremo alto no le afecta, ya que para el clculo
de la mediana solo interesa el valor de la variable que est en el lugar o posicin central. Por
tanto la mediana es una estadstica que tiene la propiedad de robustez, por que su valor no se
afecta por valores extremos.
47
3.3.
ESTIMACIN
DE
PARMETROS
MEDIANTE
INTERVALOS
DE
CONFIANZA
P[LI LS ] = 1
Donde
(3.1)
las veces que el intervalo contendr al parmetro cuando el muestreo se repite un determinado
nmero de ocasiones.
Este valor (1-) se conoce como nivel de confianza. El nivel de confianza se fija de antemano
y su valor debe ser grande. A menudo se usa como valores de como 0.10, 0.05, 0.01, de
esta manera los niveles de confianza son 0.90, 0.95 y 0.99, respectivamente. A diferencia del
estimador puntual que solo plantea un nico valor, el intervalo de confianza brinda un
conjunto de posibles valores, respaldado por la probabilidad de que contenga el valor del
parmetro.
48
La siguiente teora est basada en el libro de Freund, E. John, et al (2000) y brindamos las
aplicaciones paso a paso a fin que se entienda el uso, el clculo y la interpretacin del
intervalo de confianza.
3.4. INTERVALO DE CONFIANZA PARA ESTIMAR LA MEDIA DE UNA
POBLACIN NORMAL
El parmetro , media poblacional, se obtiene de datos poblacionales, al estudiar una
variable cuantitativa continua.
Las estimaciones mediante intervalos los haremos empleando los datos recolectados de la
muestra aleatoria, que mediante los mtodos de la Estadstica Inferencial, se podr realizar
conclusiones de la poblacin, es decir, los resultados de la muestra se generalizan para la
poblacin, con cierta probabilidad de confianza.
La ventaja de estimar aun parmetro mediante intervalo de confianza es que, para su clculo
se considera la variabilidad del estimador puntual, llamado error estndar, del cual hemos
tratado en la seccin 2.8.
49
RECUERDE
Un intervalo de confianza o estimacin mediante intervalo de confianza es un conjunto
de valores que probablemente contiene al valor del parmetro (expresin 3.1)
RECUERDE
Si los datos no se han recolectado adecuadamente, sin el debido cuidado, pueden
resultar intiles, aunque se el tamao de la muestra sea grande.
2 ES CONOCIDA
Si x es la media de una muestra aleatoria de tamao n obtenida de una poblacin normal con
varianza poblacional 2 conocida, entonces:
z
,
x
+
z
/
2
/
2
n
n
(3.1)
50
Lmite inferior
x z / 2
Lmite superior
x + z / 2
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar de la media muestral, ver seccin 2.8.1.
Los valores de los lmites contienen al estimador puntual x , al valor de este estimador para
obtener los lmites inferior y superior se disminuye y adiciona z / 2
respectivamente.
valores del parmetro , de una poblacin normal, basado en una muestra aleatoria de
tamao n y cuando la varianza poblacional 2 es desconocida depende de dos factores: la
probabilidad de confianza que elija el investigador y del error estndar del estimador puntual
de , que es la x , esto es,
. Como tambin del valor del valor del estimador puntual del
parmetro.
51
Grfico N 3.1
Particin de la distribucin normal estandarizada para obtener
un intervalo de confianza para
N (0,1)
Ejemplo 3.5
17
13
14
15
13
17
13
52
12
16
15
10
11
13
15
Solucin
2 = 7,43
El nivel de confianza que se emplear es 0.95 o del 95%
Para estimar empleamos la expresin 3.1, los valores de la abscisa normal estandariza se
presenta en el siguiente grfico.
x z / 2
Lmite superior:
x + z / 2
2,73
= 13,2 1,96
= 13,2 1,34 = 11,86
16
2,73
= 13,2 + 1,96
= 13,2 + 1,34 = 14,54
n
16
53
Si x es la media de una muestra aleatoria de tamao n obtenida de una poblacin normal con
varianza poblacional 2 desconocida, entonces:
s
s
, x + t / 2
x t / 2
n
n
(3.2)
Lmite inferior:
x t / 2
s
n
Lmite superior:
x + t / 2
s
n
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar de la media muestral, pero cuando la varianza poblacional, 2 , se desconoce, por
tanto se usa como estimador de 2 a la cuasivarianza, seccin 2.8.2:
s2 =
1
n 1
(x
n
i =1
54
Los valores de los lmites contienen al estimador puntual x , al valor de este estimador para
obtener los lmites inferior y superior se disminuye y adiciona t / 2
s
respectivamente.
n
Grfico N 3.2
Particin de la distribucin t-Student para obtener
un intervalo de confianza para
t ( n 1)
t / 2
t / 2
El valor t / 2 es la cuantila (abscisa) de la distribucin t-Student con n-1 grados de libertad, tal
que la probabilidad hacia la derecha es / 2 .
Ejemplo 3.6
Como parte de la evaluacin de la calidad del aprendizaje en escolares del segundo grado de
primaria de Instituciones Educativas estatales, el equipo evaluador ha elegido al azar a 20
nios de esta poblacin. Se les aplico una prueba de aritmtica que consta de 30 problemas
para este nivel, los autores de la prueba indican los escolares de este grado escolar debe
emplear en promedio 40 minutos, para resolver estos problemas.
55
El equipo evaluador desea estimar el tiempo promedio que emplean todos los nios de este
nivel de estudios para resolver esta prueba, si se sabe que el tiempo tiene distribucin normal.
50
48
48
55
40
52
57
55
47
46
43
49
51
50
53
48
50
46
43
45
Solucin
t ( 19 )
2,093
- 2,093
56
x t / 2
4,36
s
= 48,8 2,093
= 48,8 2,04 = 46,76
n
20
Lmite superior:
x + t / 2
4,36
s
= 48,8 + 2,093
= 48,8 + 2,04 = 50,84
n
20
Por tanto, se espera con un 95% de probabilidad de confianza que el tiempo promedio
poblacional empleado para resolver los 30 problemas, est comprendido entre 46,76 y 50,84
minutos. La estimacin intervlica indica que esta poblacin est fuera de control, por que la
norma indica que el tiempo promedio poblacional empleado es de 40 minutos, valor que no
pertenece al intervalo de confianza obtenido.
3.5.
INTERVALO
DE
CONFIANZA
PARA
ESTIMAR
LA
VARIANZA
(n 1) s 2 (n 1) s 2
,
2
2 / 2
1 / 2
(3.3)
Lmite superior:
(n 1) s 2
12 / 2
(n 1) s 2
2 / 2
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar estimado de la varianza muestral s 2 .
57
Los valores de los lmites contienen al estimador puntual. En el siguiente grfico, se muestra
la particin de la distribucin Chi-cuadrado para obtener un intervalo de confianza al (1 )
100%, para 2 .
Grfico N 3.3
Particin de la distribucin Chi cuadrado para obtener
un intervalo de confianza para 2
Ejemplo 3.7
Considerar el ejemplo 3.6, para estimar mediante intervalo de confianza a 2 , varianza
poblacional del tiempo empleado para resolver los 30 problemas. Interprete.
Solucin
El nivel de confianza que se emplear es 0.95 o del 95 %. Para estimar 2 , mediante
intervalo de confianza usamos la expresin 3.3; Los valores de la abscisa de la distribucin
chi cuadrado con n-1 = 19 grados de libertad se presenta en el siguiente grfico:
58
(219)
32,85
8,91
Lmite superior:
(n 1) s 2
2
1 / 2
(n 1) s 2
/ 2
2
19(19,01)
= 10,99
32,85
19(19,01)
= 40,54
8,91
Por tanto se espera con un 95% de probabilidad de confianza, que la varianza poblacional del
tiempo empleado para resolver los 30 problemas, est comprendido entre 10,99 y 40,54
minutos2.
3.5.
p z / 2
p (1 p )
, p + z / 2
n
p (1 p )
(3.4)
p z / 2
p(1 p)
n
Lmite superior:
p + z / 2
p(1 p)
n
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar estimado de la proporcin muestral.
Los valores de los lmites contienen al estimador puntual p , al valor de este estimador para
obtener los lmites inferior y superior se disminuye y adiciona z / 2 p(1 p) respectivamente.
n
Grfico N 3.4
Particin de la distribucin normal estandarizada
para obtener un intervalo de confianza para
N (0,1)
60
Se solicita que estime la proporcin de alumnos de esta Facultad con actitud positiva hacia la
autoevaluacin de la calidad educativa.
Solucin
61
Los valores requeridos, para el clculo del intervalo de confianza correspondiente son:
p=
247
= 0,6786, z / 2 = 1,645.
364
Lmite inferior:
p z / 2
p(1 p)
=
n
0,6786(1 0,6786)
= 0,6786 0,0245 = 0,6541
0,6786 1,645
364
Lmite superior:
p + z / 2
p(1 p)
=
n
0,6786(1 0,6786)
= 0,6786 + 0,0245 = 0,7031
0,6786 1,645
364
Por tanto se espera que con un 90% de probabilidad de confianza, que la proporcin de
alumnos de esta Facultad con actitud positiva hacia la autoevaluacin de la calidad educativa
est comprendida entre 0,6541 (65,41%) y 0,7031 (70,31%).
62
Cuando en una investigacin deseamos comparar a dos grupos o poblaciones, empleando los
valores de una variable aleatoria, estamos realizando anlisis de diferencias.
Estas poblaciones pueden ser independientes o relacionadas, por tanto las muestras aleatorias
que servirn para realizar inferencias mediante intervalos de confianza tambin estn en ese
sentido, veamos.
Proponemos el siguiente caso, el coordinador del curso Ciencia y Ambiente a fin de mejorar
el rendimiento de sus alumnos dispone de dos mtodos de enseanza:
1. Resolucin de problemas.
2. Discusin de casos.
El coordinador desea saber con cul mtodo los alumnos, de la Institucin educativa donde
trabaja, obtienen mejor rendimiento; entonces realiza el estudio entre alumnos del tercer grado
de secundaria de dos secciones. A una seccin le asigna aleatoriamente el mtodo resolucin
de problemas y a la otra seccin, el mtodo discusin de casos.
Es obvio que cada mtodo de enseanza se desarrolla independientemente uno del otro. A
este tipo de diseo se le llama de muestras independientes y la comparacin se realiza en base
al rendimiento de los dos grupos.
El rendimiento de los alumnos se mide mediante una prueba diseada por el coordinador, que
debe ser vlida y confiable.
63
3.5.1.1.CUANDO
LAS
VARIANZAS
POBLACIONALES
12
22
SON
DESCONOCIDAS PERO 12 = 22
(x
x 2 t / 2 S p
1 1
+
n1 n2
(3.5)
1 2 .
Donde:
S p2 =
(3.6)
Esto es la distribucin de probabilidad t-Student es el soporte para obtener los lmites y son:
Lmite inferior:
(x
Lmite superior:
(x
1 1
+
n1 n2
1 1
+
n1 n2
x 2 t / 2 S p
x 2 + t / 2 S p
64
Ejemplo 3.9
Empleando las TICs no solo requiere los conocimientos mnimos sobre el hardware y el
software a emplearse, sino buscar informacin relevante para la enseanza, crear materiales,
digitales o multimedia para la docencia y la investigacin del curso que se imparte.
Grupo control
13
9,5
12
13 11,5
12
9,5
12
17
12 13,5
mental
13
17
17,5
15 15,5
12
12 10,5
14 17,5
15 15,5
10 13,5
14
15
16
16 14,5 14,5
Solucin
X: Calificacin de la prueba que mide el nivel de conocimientos sobre Historia del Per. Esta
variable aleatoria tiene distribucin normal con parmetros:
65
Grupo control
S p2 =
Grupo control
x 2 = 15,1 y s 22 = 2,38
Grupo experimental :
S p2 =
S p = 2,69 = 1,64
Para calcular los lmites se requiere, el valor de t 0, 025 = 2,024 con 38 grados de libertad, y
1 1
1
1
+
=
+
= 0,32 .
n1 n2
20 20
66
Lmite inferior:
(x
x 2 t / 2 S p
1 1
+
= (11,45 15,1) (2,024 )(1,64 )(0,032) = 3,76
n1 n2
Lmite superior:
(x
x 2 + t / 2 S p
1 1
+
= (11,45 15,1) + (2,024 )(1,64 )(0,032) = 3,54
n1 n2
3.5.1.2.CUANDO
LAS
VARIANZAS
POBLACIONALES
12
22
SON
DESCONOCIDAS, PERO 12 22
(x
x 2 t / 2
s12 s 22
+
n1 n 2
(3.7)
1 2 .
Donde:
67
s12 s 22
+
n1 n2
s12
n1
n1 1
s 22
n2
(3.8)
n2 1
(x
1 x 2 t / 2
s12 s22
+
n1 n2
Lmite superior:
(x
1 x 2 + t / 2
s12 s22
+
n1 n2
Ejemplo 3.9
Para evaluar el desempeo docente entre profesores de idioma ingls, que ensean a alumnos
del tercer grado de secundaria, se compara la produccin de textos entre alumnos de profesor
de lengua nativa castellana (PLNC) y profesor de lengua nativa inglesa (PLNI).
Se evala mediante una prueba adecuada cuyo escala es de 0-10 puntos, para muestras
aleatorias independientes de alumnos de cada una de dos secciones con profesores de lengua
nativa castellana e inglesa; asimismo el puntaje tiene distribucin normal con varianzas
desconocidas y diferentes. Los puntajes obtenidos son:
68
PLNC
PLNI
SOLUCIN
Grupo PLNC
Grupo PLNI
Grupo PLNI
x 2 = 6,1 y s 22 = 1,78
69
Para calcular los lmites se requiere, el valor de t 0, 05 pero previamente se debe calcular los
grados de libertad segn la expresin 3.8:
s12 s 22
+
n1 n2
2,10 1,78
2
16 + 20
[
0,22]
0,0484
=
=
=
=
= 32,27
2
2
2
2
2 2
2 2
[0,131] + [0,089] 0,0011 + 0,0004
s1
s2
2,10
1,78
16
20
15
19
n1 + n2
+
15
19
n1 1 n2 1
Lmite inferior:
(x
x 2 t / 2
s12 s22
2,10 1,78
+
= (5,69 6,1) (1,694)
+
= 0,41 0,79 = 1,2
n1 n2
16
20
Lmite superior:
(x
x 2 + t / 2
s12 s 22
2,10 1,78
+
= (5,69 6,1) + (1,694)
+
= 0,41 + 0,79 = 0,38
n1 n2
16
20
Por tanto se espera con un 90% de probabilidad de confianza, que la diferencia del puntaje
promedio poblacional de produccin de textos entre los alumnos cuyo profesor de ingls es de
lengua nativa castellana y de profesor de lengua inglesa, est comprendida entre -1,2 y 0,38.
70
Proponemos el siguiente caso, el profesor del curso Ciencia y Ambiente observa que sus
alumnos tienen bajo rendimiento, por tanto decide cambiar de mtodo de enseanza y elige
mtodo de resolucin de problemas debido a que ha ledo en revistas de investigacin
educativa que ha dado buenos resultados, esto es, incrementa el rendimiento de los alumnos
del mencionado curso.
A fin de comprobarlo que se elige al azar una muestra de alumnos del tercer grado de
secundaria, para realizar el ensayo con una muestra aleatoria de alumnos, pero antes de
aplicar el presente mtodo mide el rendimiento del sus alumnos, y tambin los vuelve a medir
al final del curso empleando el mtodo alternativo para la enseanza del presente curso.
Es obvio que a cada alumno que participa en el ensayo, se mide su rendimiento en el presente
curso en dos momentos o bajo dos condiciones distintas antes y despus de emplear el mtodo
alternativo. El rendimiento de los alumnos se mide mediante una prueba diseada que debe
ser vlida y confiable.
En este caso la muestra es relacionada porque son dos mediciones del rendimiento que se
obtiene de cada alumno en dos situaciones distintas. A las muestras relacionadas, tambin se
les llama apareadas.
Ahora veamos al intervalo de confianza para estimar 1 2 , usando muestras relacionadas.
d t / 2
sd
n
(3.9)
71
Donde:
n
d=
d
i =1
(d
i =1
(3.10)
S d2 =
n 1
(3.11)
d t / 2
sd
n
Lmite superior:
d + t / 2
sd
n
Ejemplo 3.10
La gestin del director de una institucin educativa, es uno de los factores que afecta la
calidad de la educacin superior. Con la finalidad de mejorar la gestin se dispone de un
programa basado en talleres que permiten mejorar el liderazgo, se dispone de 15 directores a
quines se les aplica una prueba antes y despus de la capacitacin, que mide el estilo de
liderazgo. Se trata de una prueba cuya escala es de 10 a 50, a mayor puntaje, el liderazgo es
ptimo.
72
Sujeto
Antes
13
16
10
17
13
13
15
17
12
Despus
19
10
17
22
23
32
42
30
10
Sujeto
10
11
12
13
14
15
16
17
Antes
18
12
14
14
12
15
19
20
Despus
28
28
26
32
32
31
33
42
Solucin
Para usar la expresin 3.9, se requiere trabajar en base a las diferencias muestrales, para tal
efecto disponemos de la siguiente tabla:
Sujeto
Antes Despus
di
13
19
-6
16
10
10
17
-7
17
22
-5
13
23
-10
13
32
-19
15
42
-27
17
30
-13
12
10
10
18
28
-10
11
12
28
-16
12
14
26
-12
13
14
32
-18
14
12
32
-20
73
15
15
31
-16
16
19
33
-14
17
20
42
-22
Total
-207
Clculo de la media de las diferencias muestrales, usando la expresin 3.11, requiere calcular
la media de las diferencias muestrales:
d=
d
i =1
207
= 12,18
17
(d
n
S d2 =
i =1
) (d
n
n 1
i =1
12,18)
16
11234
= 702,1
16
Usando nivel de confianza 0,95 (95 %), el valor t0, 025 = 2,12 con n 1 = 16 grados de
libertad.
Lmite inferior:
d t / 2
sd
26,5
= 12,18 ( 2.129)
= 12,18 ( 2,12)(5,93) = 12.18 12,57 = 24,75
n
20
Lmite superior:
d t / 2
sd
26,5
= 12,18 ( 2.129)
= 12,18 + ( 2,12)(5,93) = 12.18 + 12,57 = 0,39
n
20
74
Por tanto se espera con un 95% de probabilidad de confianza, que la diferencia del puntaje
promedio poblacional antes de la capacitacin y despus de la capacitacin, est comprendida
entre -24,75 y 0,39. Como podemos notar, el lmite inferior es negativo y el superior es
positivo, el intervalo contiene al valor cero; esto significa que hay posibilidad que 1 2 =
0, por tanto, se recomienda revisar o mejorar la capacitacin, a fin que ambos lmites sean
negativos.
12
POBLACIONALES, 2 , DE POBLACIONES NORMALES INDEPENDIENTES
2
Si s12 y s22 son las varianza de muestras aleatorias independientes de tamaos n1 y n2 de
poblaciones normales, entonces:
,
F
F
/2
1 / 2
(3.12)
12
Es un intervalo de confianza del (1 )100% de probabilidad de confianza para estimar 2 .
2
Los valores de los lmites contienen a los estimadores puntuales de 12 y 22 que son s12 y s22
respectivamente.
12
.
22
75
Grfico N 3.5
Particin de la distribucin F-Fisher para obtener un intervalo de confianza
F( n1 1, n2 1)
F / 2
F1 / 2
s12 / s22
F1 / 2
Lmite superior:
s12 / s22
F / 2
Ejemplo 3.11
76
Solucin
X: Calificacin de la prueba que mide el nivel de conocimientos sobre Historia del Per. Esta
variable aleatoria tiene distribucin normal con parmetros, que se describen en el desarrollo
del ejemplo 3.9.
Para estimar
12
, empleamos la expresin 3.12, las estadsticas que obtienen de cada muestra
22
son:
Grupo Control:
s12 = 2,99
Grupo Experimental:
s 22 = 2,38
Los tamaos de muestras n1 = 20 y n2 = 20, por tanto las cuantilas de la distribucin FFisher con 19 y 19 grados de libertad, se muestran en el siguiente grfico:
F(19,19 )
0,396
2,526
Lmite inferior:
Lmite superior:
12 = 22
3.7. INTERVALO DE CONFIANZA PARA ESTIMAR LA DIFERENCIA DE
PROPORCIONES
POBLACIONALES,
1 2 ,
DE
POBLACIONES
BINOMIALES INDEPENDIENTES
( p1 p2 ) z / 2
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
(3.13)
Lmite inferior:
( p1 p2 ) z / 2
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
Lmite superior:
( p1 p2 ) + z / 2
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
78
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar estimado de la diferencia de proporciones poblacionales. En este caso la particin de
la distribucin normal estandarizada es como la del grfico 3.4.
Ejemplo 3.12
Entre varias preguntas que comprende el cuestionario aplicado, una de ellas es: Los datos
que recolecta su universidad garantiza la validez de las evaluaciones?
Universidad
Tamao de
No
Muestra
Estatal
1650
496
1154
Privada
0970
361
609
Solucin
Universidad estatal
n1 = 1650
Universidad privada
n2 = 970
p1 =
1154
= 0,6963 y 1 p1 = 0,3037
1650
Universidad privada:
p2 =
609
= 0,6278 y 1 p2 = 0,3722
970
80
Lmite inferior:
p1 (1 p1 ) p 2 (1 p 2 )
0,6963(0,3037) 0,6278(0,3722)
0,2115 0,2337
+
=
+
=
+
= 0,00013 + 0,00024
n1
n2
1650
970
1650
970
= 0,00037 = 0,0192
Lmite inferior:
( p1 p2 ) z / 2
p1 (1 p1 ) p2 (1 p2 )
+
= 0,0685 1,645(0,0192) = 0,0685 0,0316 = 0,0369
n1
n2
Lmite superior:
( p1 p2 ) + z / 2
p1 (1 p1 ) p 2 (1 p 2 )
+
= 0,0685 + 1,645(0,0192) = 0,0685 + 0,0316 = 0,1001
n1
n2
Como observamos los lmites son valores positivos y no cubre el valor cero, por tanto la
proporcin poblacional de docentes que laboran en Universidades Estatales y que responden
que los datos recolectados por su Universidad no garantiza la validez de las evaluaciones es
mayor que de los docentes de Universidades Privadas.
EJERCICIOS PROPUESTOS
1. Se emplea un mtodo que consiste en usar un manual auto instructivo acompaado del
video correspondiente, para aplicar un programa de capacitacin industrial. Las
calificaciones (0 - 100) obtenidas al final de la capacitacin, al aplicar una prueba
adecuada a una muestra aleatoria de alumnos son:
71
75
68
59
70
66
78
79
68
73
55
63
72
56
72
66
60
58
62
70
10
14
8
11
11
12
9
9
10
5
13
17
11
18
9
10
13
12
11
16
8
12
10
11
14
10,4
12,7
10,2
9,9
9,5 12,9
11 10,7 10,1
10
8 11,3
82
11
12
8,2
9 11,6 10,7
9,4
9,1
10 11,4
X1
X2
X1
X2
X1
X2
X1
X2
X1: Cuenta con por lo menos un personal con formacin en bibliotecologa universitaria.
0: No
1: S
1: S
6.1.
Proporcin poblacional de bibliotecas que cuentan con por lo menos un personal con
formacin en bibliotecologa universitaria.
83
6.2.
7.
Se aplica una prueba a los docentes de instituciones educativas de gestin estatal del
nivel secundaria y primaria para evaluar la gestin de la alta direccin de la UGEL
correspondiente. La prueba tiene puntajes comprendidos entre 10 - 30, a mayor
puntaje indica que los docentes consideran que le servicio es eficiente y adems los
puntajes de esta prueba tiene distribucin normal de probabilidad con varianza
poblacional igual a 100 para cada nivel. Se han obtenido las siguientes estadsticas:
Nivel
Media muestral
Varianza muestral
Primaria
16,55
14,252
Secundaria
20,03
12,897
7.1.
poblacionales.
7.2.
8.
EAP
Muestra Aleatoria
De acuerdo
Administracin
309
188
Economa
400
247
84
9.
Masculino
Femenino
60
47
63
38
33
41
47
57
49
23
35
28
56
62
71
28
51
42
66
58
68
42
35
46
70
61
59
29
31
31
50
51
52
30
37
47
61
67
64
50
22
48
66
48
53
38
38
30
70
59
65
36
31
50
50
68
59
47
40
35
9.1.
9.2.
10.
85
rea
Muestra Aleatoria
328
261
500
385
Ingenieras
Ciencias
Bsicas
Alumno Antes
Despus
17
22
16
19
11
16
20
27
20
24
15
21
20
24
18
19
23
23
10
24
24
11
18
24
12
18
20
13
14
19
86
14
13
18
15
18
23
16
14
18
17
14
21
18
18
26
19
21
28
20
17
23
21
15
21
22
21
27
23
12
17
24
14
18
25
21
21
26
20
26
27
26
28
La gestin del director de una Institucin Educativa es un factor clave para lograr la
calidad educativa. Preocupados por esta situacin un equipo multidisciplinarios elabora
una capacitacin especial, para formar directores con suficiente capacidad de gestin. Para
validarlo emplea una muestra aleatoria de 34 directores de Instituciones Educativas de
gestin estatal, estos docentes son evaluados antes y al final de la capacitacin sobre
diversos aspectos de la gestin. A mayor puntaje obtenido indica mayor capacidad de
gestin para con la direccin de la Institucin Educativa. Los resultados son:
Director
10
11
12
Antes
20
19
16
23
23
18
23
21
26
27
21
21
Despus
26
23
20
31
28
22
28
23
27
32
28
24
Director 13
14
15
16
17
18
19
20
21
22
23
24
Antes
17
16
21
17
17
21
24
20
18
24
15
17
Despus
21
22
25
21
25
30
32
25
23
29
21
22
87
Director 25
26
27
28
29
30
31
32
33
34
Antes
24
20
18
23
21
26
27
21
21
17
Despus
30
27
25
30
23
27
32
26
24
23
88
CAPTULO 4
Introduccin
En una investigacin no solo se requiere estimar un parmetro, sino que el investigador puede
proponer hipotticamente un valor o valores para el parmetro; valor basado en su propia
experiencia profesional o segn oriente el marco terico, de la investigacin. Por tanto, es
necesario decidir si se considera ese supuesto o se rechaza, obviamente se efecta en base a
datos obtenidos de una muestra aleatoria, y empleando la prueba de hiptesis estadsticas o
llamado tambin contraste de hiptesis estadstica, o simplemente prueba de hiptesis.
Para verificar las hiptesis estadsticas se deben realizar pruebas estadsticas especficas, si
tiene como requisito, que la distribucin de probabilidad sea conocida empleamos este
captulo, sino se debe usar las pruebas de hiptesis estadsticas paramtricas.
EN RESUMEN
Una prueba de hiptesis es el proceso mediante el cual, a partir de los valores de
una muestra aleatoria extrada de una poblacin bajo estudio, se decide si mantiene
el supuesto que plantea el investigador para el parmetro, o se rechaza; con cierta
probabilidad de error (riesgo) por tomar una decisin.
89
Grfico N 5.1
Proceso de la prueba de hiptesis estadstica
POBLACIN
MUESTREO
MUESTRA ALEATORIA
HIPTESIS: SUPUESTO
PARA EL PARMETRO
(PARA VERIFICAR)
INFERENCIA
ESTADISTICA
Para la poblacin se plantea un supuesto para el parmetro, de sta se extrae una muestra
aleatoria, los datos recolectados de ella se usan para generalizarlo en toda la poblacin,
mediante el proceso de la prueba de hiptesis.
Conceptos bsicos
Es una conjetura o supuesto que el investigador plantea para el parmetro, que puede o no ser
verdadera, relativa a una o ms poblaciones. Las hiptesis estadsticas pueden ser simples o
compuestas, tambin nulas o alternativas.
forma funcional de la distribucin subyacente sino tambin los valores de todos los
parmetros.
Ejemplo 4.1
Se sabe que el tiempo promedio requerido para resolver un problema sencillo en nios de 10
aos de edad con secuelas neurolgicas es igual a 4.23 minutos, suponiendo que se especifica
el tamao de la muestra (una muestra de nios de esta poblacin) y que la distribucin
poblacional (el tiempo requerido para resolver el problema) es normal, entonces la hiptesis:
Pero si hubiese conjeturado que el tiempo promedio requerido para resolver un problema
sencillo en nios de 10 aos de edad con secuelas neurolgicas es mayor de 4.23 minutos, se
trata de una hiptesis compuesta porque no asigna un valor especifico al parmetro , esto
es, la hiptesis: > 4.23 es una hiptesis compuesta.
Supuesto que indica que el valor del parmetro, es constante, que no ha sufrido cambios, es
nula. Equivalentemente que la poblacin permanece constante, la hiptesis nula se plantea
generalmente con la intencin de rechazarla. Se representa mediante H 0 .
91
Ejemplo 4.2
Como parte de la evaluacin de la calidad del aprendizaje en escolares del segundo grado de
primaria de instituciones educativas estatales, el equipo evaluador ha elegido al azar a 20
nios de esta poblacin. Se les aplico una prueba de aritmtica que consta de 30 problemas
sencillos, y se obtiene en promedio 51,5 minutos. Los autores de la prueba indican que el nio
de este grado escolar debe emplear en promedio para resolverla 40 minutos y con varianza
poblacional igual a 576 (minutos)2.
Solucin
Bajo la hiptesis nula se est indicando que la media poblacional no ha sufrido cambios, se
mantiene como 40 minutos, pero en la hiptesis alternativa se indica el cambio, en el sentido
que la media poblacional es mayor 40 minutos, pero basado en los problemas de aprendizaje
que los alumnos evidencian.
Equivalentemente:
H 0 : = 40
H 1 : > 40
92
Cuando la hiptesis alternativa indica cambio en una sola direccin, (> <), con respecto a la
hiptesis nula, se dice que la prueba de hiptesis es unilateral. Pero cuando la hiptesis
alternativa no indica direccin determinada para el cambio se dice que la prueba es bilateral.
Ejemplo 4.3
H 1 : > 40
Por definicin en la hiptesis nula se indica que no hay diferencia, por tanto la media
poblacional es 40 minutos.
La hiptesis alternativa indica la diferencia en una sola direccin, mayor de 40, basado en lo
que evidencian los escolares.
93
Ejemplo 4.4
H 1 : 12 22
Por definicin en la hiptesis nula se indica que no hay diferencia, por tanto la diferencia de
varianzas poblacionales es cero (nula), no hay variacin o cambios respecto a al varianza
entre los dos grupos poblacionales.
La hiptesis alternativa indica diferencias, porque no hay una propuesta que oriente la
direccin de esa diferencia.
Los errores que podemos cometer cuando realizamos una prueba de hiptesis, se muestran en
la siguiente tabla:
Tabla 4.1
Decisin basada en la prueba estadstica y el estado real
del valor supuesto para el parmetro
DECISIN
Rechazar H 0
No rechazar H 0
ESTADO REAL
H 0 es verdadera
H 0 es falsa
Error de tipo I
OK
OK
Error de tipo II
94
Estos errores deben ser cuantificados, pero en en terminos de probabilidad de riesgo, por que
estamos ante la incertidumbre. Por tanto la probabilidad de cometer Error de tipo I y Error de
tipo II, respectivamente son las siguientes probabilidades condicionales:
P[Rechazar H 0 | H 0 es verdadera] =
(4.1)
(4.2)
Pero una buena prueba estadstica es aquella en donde tanto como son pequeas, porque
permitir tomar una decisin correcta, con menor riesgo para equivocarse.
Tabla 4.2
Decisin basada en la prueba estadstica y el estado real
del valor supuesto del parmetro, trminos de probabilidad
ESTADO REAL
DECISIN
H 0 es verdadera
H 0 es falsa
1-
1-
Rechazar H 0
No rechazar H 0
Al observar la tabla 4.2 se deduce que el rechazo de una hiptesis nula verdadera conduce a
cometer Error de tipo I o , mientra que el norechazo de una hiptesisi nula falsa conduce a
cometer Error de tipo II o .
El error est bajo control del investigador y se elige o establece antes de realizar la prueba
de hiptesis, es el nivel de significancia para la prueba de hiptesis, entonces como se puede
controlar , tambin 1- est controlada.
95
Cuando se rechaza la hiptesis nula, se dice que hay significancia estadstica, pero cuando no
se rechaza la hiptesis nula significa que no existe suficiente informacin como para
rechazarla, es errado afirmar que se acepta la hiptesis nula. No se puede aceptar algo que no
sabemos que sea verdadero o falso.
Que una prueba sea estadsticamente significativa, es decir, rechazar la hiptesis nula no
asegura que la hiptesis alternativa sea cierta ante la evidencia de datos muestrales, sino que
los datos muestrales discrepan con el supuesto bajo la hiptesis nula.
Recuerde que la muestra es aleatoria, los estadsticos tambin lo son y por puesto que la
estadstica que se usan para someter a prueba hiptesis estadsticas.
Por tanto se recomienda a los lectores no ser mecanicistas y estar dependiendo del valor
Ahora se usan los softwares estadsticos como SPSS, MINITAB, SAS, entre otros y es
preocupante ver como se usa de manera indiscriminada, sin sustento, se cree que es solo
poner los datos y ver el resultado si es o no estadsticamente significativo. No hay que
contentarse con que sea estadsticamente significativo sino que sea relevante la investigacin.
4.2.10.1
Estadstico de prueba
Para rechazar o no la hiptesis nula se toma una muestra aleatoria de la poblacin bajo estudio
y los resultados contenida en ella se usa en expresiones llamadas estadsticos o estadsticas de
prueba e indican el grado de discrepancia entre la hiptesis nula y los datos muestrales que
estn resumidos en las estadsticas.
Ejemplo 4.5
Asumiendo, para el ejemplo 4.2, que el tiempo para resolver 30 problemas sencillos se
distribuye como normal de probabilidad y con varianza poblacional igual a 4,47 (minutos)2, la
estadstica para someter a prueba las hiptesis:
H 0 : = 40
H 1 : > 40
Es:
Z=
x 0
/ n
~ N (0,1)
x 0
/ n
La media muestral x , es el valor que se obtiene en base a los datos de la muestra s 51,5
minutos.
Siendo 0 =40 minutos, que es el valor asumido, para la media poblacional, bajo la hiptesis
nula.
, es el error estndar de la media muestral, ver seccin 2.8.1, cuyo valor es:
24
24
=
= 5,37
20 4,47
Podemos afirmar que la estadstica para la prueba de hiptesis es una medida de contraste
entre la informacin muestral y lo que se asume o conjetura para el parmetro, bajo la
hiptesis nula.
4.2.10.2
Regin de rechazo
Al conjunto de valores de la estadstica de prueba para los que la hiptesis nula se rechaza se
llama regin de rechazo o regin crtica.
98
Ejemplo 4.6
Continuando con el desarrollo del ejemplo 4.5, la regin crtica o de rechazo, se establece
tomando en cuenta que la prueba de hiptesis unilateral, con desigualdad mayor que (>)
entonces la regin de rechazo va en ese sentido; una regin de rechazo unilateral, porque
mientras mayor sea el valor de la estadstica Z, la evidencia muestral no estar a favor del
supuesto sino se le rechazar.
Si elegimos =0,05, entonces z / 2 =1,645 (valor crtico), por tanto la regin de rechazo,
indica que si el valor de la estadstica Z >1,645 se rechaza la hiptesis nula; en caso contrario
no se rechaza.
En el ejemplo 4.5, se calculo el valor de la estadstica: Z= 2,14, este valor es mayor de 1,645,
por tanto se rechaza la hiptesis nula, al 5% de nivel de significacin, esto es, ante la
evidencia de la muestra, se puede asumir que el promedio poblacional para desarrollar la
presente prueba se ha incrementado, por tanto el investigador debe tomar la decisin ms
adecuada para que el promedio para esta poblacional no sea mayor de la norma (40 minutos).
4.2.10.3
Es la probabilidad, que mide el riesgo que tiene el investigador cuando al obtener un cierto
valor de la estadstica, se rechaza la hiptesis nula. (SPSS le llama Sig).
99
4.3.
La prueba de hiptesis brinda las herramientas estadsticas para someter a prueba las hiptesis
estadsticas y tambin modelos tericos, para ambos casos es conveniente seguir la siguiente
secuencia, ya sea cuando se realizan los clculos de forma manual o auxilindose de un
software estadstico.
100
4.4.
Se aconseja que el lector A este nivel de estudio es importante que se tenga bien en cuenta los
conceptos y la aplicacin tanto de la estadstica descriptiva como de la estimacin mediante
intervalos; as como plantear adecuadamente las hiptesis nula y alternativa.
La prueba de hiptesis es paramtrica por que se aplica solo para muestras aleatorias que
provienen de poblaciones con distribuciones de probabilidad conocida, que generalmente es la
distribucin de probabilidad normal.
Iniciamos las pruebas de hiptesis para el parmetro la media poblacional, , bajo dos
aspectos cuando se conoce la varianza poblacional y cuando es desconocida.
4.4.1. Cuando 2 se conoce
Sea
(I)
(II)
(III)
H 0 : 0
H 0 : 0
H 0 : = 0
H1 : > 0
H1 : < 0
H1 : 0
Se emplea la estadstica:
Z=
x 0
~ N (0,1)
/ n
101
(4.1)
H0 .
/2
z / 2
/2
z / 2
Z < z / 2
rechaza H 0 .
102
Obs. Cuando la muestra es grande de una poblacin que no sea normal, pero tiene varianza
finita, se usa el TLC, para usar esta prueba an cuando no se conozca la varianza poblacional,
se aproxima su valor con la varianza muestral. Ver seccin 2.8.1 (pg. 18)
Ejemplo 4.7
21
16
16
19
13
15
19
14
19
20
16
19
20
16
19
13
16
12
14
15
13
16
12
15
16
16
17
15
14
16
16
18
17
19
18
19
17
18
16
19
El equipo evaluador considera que por diversos factores que la duracin promedio de los
estudios se ha incrementado. La muestra aleatoria apoya este supuesto? Asumir que la
muestra tiene comportamiento normal de probabilidad.
Solucin
H 1 : > 14
2. = 0,05
3. Estadstica para la prueba es (4.1), por que para el caso se conoce la varianza poblacional y
adems la variable aleatoria bajo estudio tiene distribucin normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 , es:
N (0,1)
= 0,05
1,645
16,48 14
2,48
2,48
=
=
= 1,97
8 / 6,33 1,26
8 / 40
104
Sea
(I)
(II)
(III)
H 0 : 0
H 0 : 0
H 0 : = 0
H1 : > 0
H1 : < 0
H1 : 0
Se emplea la estadstica:
T=
x 0
s/ n
~ t (n 1)
(4.2)
t (n 1)
t ( n 1)
105
H0 .
H0 .
t (n 1)
/2
/2
t / 2
t / 2
T < t / 2
rechaza H 0
Obs. Esta prueba es recomendable cuando el tamao de la muestra es pequeo.
Ejemplo 4.8
2475 2685 3125 3004 3325 3692 3325 1875 2895 3125 2725
3325 3625 3325 2925 2625 3125 2925 3325 3625
Verificar si lo manifestado por los egresados tiene sustento, considerando los resultados que
da la muestra aleatoria. Las remuneraciones tienen distribucin normal de probabilidad.
106
Solucin
H 1 : > 2800
2. = 0,05
3. Estadstica para la prueba es (4.2), por que para el caso no se conoce la varianza poblacional y
adems la variable aleatoria bajo estudio tiene distribucin normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 , es:
t (19 )
= 0,05
1,729
x = 3053,80 soles, 0 = 2800 soles, s = 98,09 soles y n= 20, reemplazando en (4.2), estos
valores:
107
T=
3053,80 2800
438,67 / 20
253,80
253,80
=
= 2,59
438,67 / 4,47 98,09
4.5.
Sea
(I)
(II)
(III)
H 0 : 2 02
H 0 : 2 02 H 0 : 2 = 02
H 1 : 2 > 02
H 1 : 2 < 02 H 1 : 2 02
Se emplea la estadstica:
X2 =
(n 1)s 2
2
0
~ (2n 1)
(2n 1)
2
108
(4.3)
H0 .
(2n 1)
12
H0 .
/2
(2n 1)
/2
12
H0 .
Ejemplo 4.9
Considere el caso del ejemplo 2, para verificar si la varianza poblacional puede ser a lo sumo
190000 (soles)2.
109
Solucin
3. Estadstica para la prueba es (4.3), por que la variable aleatoria bajo estudio tiene distribucin
normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 , es:
(220 )
= 0,05
30,144
110
(19)192433,75 3656241,25
=
= 19,24
190000
190000
4.6.
Sea
Para
(I)
(II)
(III)
H0 : 0 H0 : 0 H0 : = 0
H1 : > 0 H 1 : < 0 H 1 : 0
Se emplea la estadstica:
p 0
Z=
0 (1 0 )
~ N (0,1)
n
I. Cuya regin de rechazo de tamao est dada por:
N (0,1)
z
111
(4.4)
N (0,1)
H0 .
/2
z / 2
/2
z / 2
Ejemplo 4.10
Solucin
No
H 1 : < 0,5
2. = 0,05
3. Estadstica para la prueba es (4.4), por que para el caso el tamao de muestra es grande y se
somete a prueba a un parmetro de la poblacin binomial.
113
N (0,1)
= 0,05
-1,645
p=
254
= 0,3719 (Proporcin muestral de docentes que van a participar en la mencionada
683
Z=
0,3719 0,5
0,5(1 0,5)
683
0,1281
0,25
683
0,1281
0,0004
0,1281
= 6,405
0,02
Este tipo de pruebas es muy til cuando se desea realizar anlisis de diferencias entre dos
grupos poblacionales, que pueden ser independientes o relacionadas.
114
Relacionadas, se refiere a que los mismos elementos o unidades estadsticas muestrales, se les
mide la misma variable en dos condiciones distintas.
Sea
de una poblacin
n1 obtenida
(I)
(II)
(III)
H 0 : 1 2 0 H 0 : 1 2 0 H 0 : 1 2 = 0
H 1 : 1 2 > 0 H 1 : 1 2 < 0 H 1 : 1 2 0
Se emplea la estadstica:
Z=
(x
x 2 0
12
n1
22
~ N (0,1)
n2
z
115
(4.5)
N (0,1)
/2
z / 2
/2
z / 2
Obs. Cuando la muestra es grande de una poblacin que no sea normal, pero tiene varianza
finita, se usa el TLC, para usar esta prueba an cuando no se conozca la varianza poblacional,
se aproxima su valor con la varianza muestral, para cada poblacin.
116
Ejemplo 4.11
Se aplica una prueba a los docentes de instituciones educativas de gestin estatal del nivel
secundaria y primaria para evaluar la gestin de la alta direccin de la UGEL correspondiente.
La prueba tiene puntajes comprendidos entre 10 -30, a mayor puntaje indica que los docentes
consideran que le servicio es eficiente y adems los puntajes de esta prueba tiene distribucin
normal de probabilidad con varianza poblacional igual a 100 para cada nivel. Se ha obtenido
las siguientes estadsticas:
Nivel
Media muestral
Varianza muestral
Primaria
16,55
14,252
Secundaria
20,03
12,897
Los docentes de ambos niveles evalan de igual forma, en promedio, la gestin de la alta
direccin de la UGEL correspondiente? En cada poblacin los puntajes tienen distribucin
normal de probabilidad.
Solucin
117
H 1 : 1 2 0
2. = 0,05
3. Estadstica para la prueba es (4.5), por que para el caso se conocen las varianzas poblacionales
y adems la variable aleatoria bajo estudio tiene distribucin normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 , es:
N (0,1)
/2
/2
1,96
1,96
x1 = 16,55 , n1 = 60 y 12 = 100
x 2 = 20,03 , n2 = 60 y 22 = 100
16,55 20,03
100 100
+
60 40
3,48
1,67 + 2,5
3,48
= 0,83
4,17
118
En este caso, hay que distinguir si las varianzas poblacionales son iguales o diferentes, para
ambos casos la distribucin de probabilidad soporte es la t-Student.
Para verificar si son iguales s no las varianzas poblacionales, se usa una prueba estadstica,
que ms adelante se tratar.
Sea
(I)
(II)
(III)
H 0 : 1 2 0 H 0 : 1 2 0 H 0 : 1 2 = 0
H 1 : 1 2 > 0 H 1 : 1 2 < 0 H 1 : 1 2 0
Se emplea la estadstica:
T =
(x
x2 0
~ t (n )
1
1
Sp
+
n1 n 2
1
119
(4.6)
S p2 =
t (n )
t (n )
t (n 1)
/2
/2
t / 2
t / 2
120
Ejemplo 4.12
Conociendo los efectos que produce el Plomo (Pb) en sangre, en el desarrollo psicomotor de
los nios, se consider necesario profundizar la evaluacin de ciertos parmetros de este tipo
de desarrollo (coordinacin visomanual y aprendizaje de la escritura), en los nios que viven
en distritos de extrema pobreza y que cerca de sus viviendas existen depsitos de metales con
alto contenido de plomo.
Las autoridades de salud indican que el nivel de plomo en sangre permisible es menos de 10
mg/dL. Se elige una muestra aleatoria de nios de edades entre 6 y 8 aos, que estudian y
viven cerca a estos depsitos, y se aplica el Test de Berry para medir los parmetros del
desarrollo psicomotor mencionados. En base a la siguiente informacin verificar que Los
nios que tienen niveles de plomo no permisible (mayor o igual a 10 mg/dL) tienen en
promedio el desarrollo psicomotor menor que los que tienen niveles permisibles de plomo en
base a la siguiente informacin:
Nivel de Pb
(mg/dL)
Nios
Media
Varianza
muestral
muestral
10
24
7,59
< 10
31
10,73
1,613
Los puntajes de este test tienen distribucin normal de probabilidad, en cada grupo y con
varianzas poblacionales desconocidas e iguales,
Solucin
121
H 1 : 1 2 < 0
2. = 0,05
3. Estadstica para la prueba es (4.6), por que para el caso no se conocen las varianzas
poblacionales y son iguales. Adems la variable aleatoria bajo estudio tiene distribucin
normal de probabilidad.
t (53)
= 0,05
1,674
S p2 =
n1 + n2 2
S p2 =
53
53
S p = 1,35 = 1,16
7,59 10,73
1,16
1
1
+
24 31
3,14
1,16 0,042 + 0,032
3,14
1,16 0,074
3,14
3,14
=
= 9,937
1,16(0,272) 0,316
Sea
(I)
(II)
H 0 : 1 2 0 H 0 : 1 2 0 H 0 : 1 2 = 0
H 1 : 1 2 > 0 H 1 : 1 2 < 0 H 1 : 1 2 0
123
(III)
Se emplea la estadstica:
T=
(x
x 2 0
2
1
2
2
s
s
+
n1 n2
~ t( )
(4.7)
s12 s 22
+
n1 n2
s12
s 22
n1 + n2
n1 1 n2 1
t ( )
t( )
0
124
H0 .
H0 .
t ( )
/2
/2
t / 2
t / 2
Obs. Esta prueba es recomendable cuando los tamaos de muestra son pequeos.
Ejemplo 4.13
Se realiza un estudio para mejorar el aprendizaje del curso de matemticas en nios del primer
grado de educacin secundaria de colegios estatales, basada en una muestra aleatoria de 40
nios, de esta poblacin que tienen caractersticas similares tanto acadmicas como
psicolgicas. La mitad nios se les enseo matemticas de manera tradicional (pizarra, tiza y
materiales didcticos elaborados por el profesor) y a la otra mitad se le enseo matemticas
empleando computadora adems de lo que tradicionalmente se emplea. Los resultados
muestrales de los promedios del rendimiento en este curso, a mitad del ao escolar, son:
Grupo
Enseanza tradicional
Media
Desviacin estndar
muestral
muestral
11,35
2,13
16,50
1,19
Enseanza tradicional y
uso de computadora
125
Los promedios tienen distribucin normal de probabilidad, en cada grupo y con varianzas
poblacionales desconocidas y diferentes. El responsable del estudio considera que ensear
matemticas de manera tradicional y usando computadora mejora el rendimiento de estos
alumnos.
Solucin
H 1 : 1 2 < 0
2. = 0,05
3. Estadstica para la prueba es (4.6), por que para el caso no se conocen las varianzas
poblacionales y son iguales. Adems la variable aleatoria bajo estudio tiene distribucin
normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 , pero previamente se debe calcular los grados de
libertad empleando la expresin (3.8):
126
2
s12 s 22
2,132 1,19 2
4
,
54
1
,
42
+
+
20 + 20
n1 n2
20
20
=
=
=
2
2
2
2
2
2
s12
s 22
2,132
1,19 2
4,54
1,42
20
20
20 + 20
n1 + n2
+
19
19
19
19
n1 1 n2 1
5,96
2
20
[
0,298]
0,089 0,089
=
=
=
=
= 29,67
2
2
[0,227] + [0,071] 0,052 + 0,005 0,057 0,003
19
19
19
19
19
El mximo entero de 29,67 es 29 ; por tanto los grados de libertad son 29. Por tanto la regin
de rechazo es:
t (53)
= 0,05
1,699
11,35 16,50
4,54 1,42
+
20
20
5,15
5,96
20
5,15
0,298
5,15
= 9,43
0,546
matemticas con mtodo tradicional y usan computadora. Cabe indicar que en el rendimiento
promedio en matemticas influye el mtodo empleado.
4.8
Las medias pueden ser comparas bajo el supuesto que las diferencias muestrales tiene
distribucin de probabilidad normal. Para someter apruebas las hiptesis estadsticas, tal que
la hiptesis nula considerada es 1 2 = D :
(I)
(II)
(III)
H0 : D 0 H0 : D 0 H 0 : D = 0
H1 : D > 0 H1 : D < 0 H1 : D 0
Se emplea la estadstica:
T=
d
Sd / n
~ t (n 1)
(4.8)
t (n 1)
128
t (n 1)
/2
/2
t / 2
t / 2
Ejemplo 4.14
129
escolares de ambos sexos. Antes de la intervencin educativa y tres meses despus se midi
esta intervencin empleando una prueba vlida y confiable. Dando los siguientes resultados:
Alumno
10
Antes
21
12
11
18
20
15
20
18
23
16
Despus
27
17
16
23
24
21
24
19
23
19
Alumno
11
12
13
14
15
16
17
18
19
20
Antes
18
18
14
20
17
14
14
18
21
17
Despus
24
20
19
27
22
18
21
26
28
23
Solucin
130
Diferencia
muestra
Alumno Antes Despus
(d i )
21
27
-6
12
17
-5
11
16
-5
18
23
-5
20
24
-4
15
21
-6
20
24
-4
18
19
-1
23
23
10
16
19
-3
11
18
24
-6
12
18
20
-2
13
14
19
-5
14
20
27
-7
15
17
22
-5
16
14
18
-4
17
14
21
-7
18
18
26
-8
19
21
28
-7
20
17
23
-6
Total
-96
H1 : D < 0
2. = 0,05
131
3. Estadstica para la prueba es (4.7), por que se trata de muestra apareada o relacionada.
Adems las diferencias muestrales bajo estudio tiene distribucin normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 es:
t (19 )
= 0,05
1,729
d=
d
i =1
96
= 4,8
20
(d
n
S d2 =
i =1
) (d
20
n 1
i =1
( 4,8) )
19
81,2
= 4,27
19
s d = 4,27 = 2,07
4,8
2,07 / 20
4,8
4,8
=
= 10,435
2,07 / 4,47 0,46
132
4.9.
Sea
hiptesis:
(I)
(II)
(III)
H 0 : 12 22 H 0 : 12 22 H 0 : 12 = 22
H 1 : 12 > 22 H 1 : 12 < 22 H 1 : 12 22
Se emplea la estadstica:
s12
F = 2 ~ F( n1 1,n2 1)
s2
(4.9)
F(n1 1,n2 1)
F
Rechazar H 0 , si el valor de la estadstica
F > F
133
F(n1 1,n2 1)
F1
Rechazar H 0 , si el valor de la estadstica
H0 .
/2
F(n1 1, n2 1)
/2
F1 / 2
F / 2
se rechaza H 0 .
Ejemplo 4.15
Considere los datos del ejemplo 4.13, para verificar si se puede considerar que las varianzas
poblaciones, de los grupos poblaciones bajo estudio, son diferentes.
134
Solucin
3. Estadstica para la prueba es (4.9), por que la variable aleatoria bajo estudio tiene distribucin
normal de probabilidad.
4. La regin de rechazo, de tamao = 0,05 es:
F(19,19 )
/2
/2
0,396
1,369
135
4,54
= 3,2
1,42
4.10. Para
Sea
1 2
de poblaciones binomiales
1 ;
y sea normal
n1 obtenida
n 2 suficientemente grandes.
Para someter a prueba las hiptesis:
(I)
(II)
(III)
H 0 : 1 2 0
H 0 : 1 2 0 H 0 : 1 2 = 0
H1 : 1 2 > 0
H1 : 1 2 < 0 H1 : 1 2 0
136
de una poblacin
muestra aleatoria de
2,
con
n1
Se emplea la estadstica:
Z=
Siendo
p1 p 2
1 1
p (1 p ) +
n1 n2
~ N (0,1)
(4.10)
n = n1 + n2 .
I. Cuya regin de rechazo de tamao
N (0,1)
N (0,1)
137
/2
z / 2
/2
z / 2
Ejemplo 4.16
Se realiza un estudio para mejorarla enseanza del curso estadstica inferencial en alumnos de
pregrado, del tercer ciclo de estudios, para tal efecto se realiza un estudio basal en muestras
aleatorias de alumnos de este ciclo de estudios de las EAP de Gentica y Biotecnologa y de
la EAP Sociologa, al final del curso y se les pide que interpreten la estimacin de la media
poblacional mediante intervalo de confianza, entre otras preguntas. Los resultados son:
EAP
Muestra
Interpretacin
correcta
Gentica y Biotecnologa
060
46
Sociologa
070
50
Total
130
96
138
Solucin
Incorrecto
1 :
n1 =60 y p1 =
46
= 0,7667 (proporcin muestral obtenida con la muestra de la poblacin 1).
60
n2 =70 y p2 =
50
= 0,7143 (proporcin muestral obtenida con la muestra de la poblacin 2).
70
139
H1 : 1 2 0
8. = 0,05
N (0,1)
/ 2 = 0,025
1,96
/ 2 = 0,025
1,96
p=
Z=
Z=
96
= 0,7385 y 1 p = 0,2615 , reemplazando en (4.10), los valores obtenidos:
130
0,7667 0,7143
1
1
0,7385(0,2615) +
60 70
0,0524
0,0524
=
0,1931(0,0167 + 0,0143)
0,1931(0,0310)
0,0524 0,0524
=
= 0,6761
0,006 0,0775
140
APLICACIONES
4.1 Una reportera de la revista PENTIUM elige una muestra aleatoria de 30 lectores docentes
universitarios y les pregunta:
Hace cuantos aos compr su primera computadora para realizar tareas acadmicas en su
hogar? Las respuestas son:
10
11
11
11
10
4.2 En una capacitacin sobre manejo de Internet para gestin del conocimiento, dirigida a
docentes de ciencias sociales del nivel superior; se aplic una prueba de entrada y se pregunta
a los 276 asistentes: Sabe que es URL?, 53 dicen que s. Se presume que en esta poblacin
el 30% de docentes si saben lo que es URL Podemos considerar tal presuncin?
141
4.3 En la autoevaluacin de una facultad se aplica un cuestionario que mide la satisfaccin de los
docentes de los departamentos acadmicos, respecto a la gestin y funcionamiento de la
facultad, que se refiere a las facilidades que tiene para su desarrollo profesional, al
reconocimiento de su trabajo, participacin en la toma de decisiones, entre otros. El
cuestionario tiene una escala de 20 a 80, a mayor puntaje indica alta satisfaccin de los
docentes encuestados. Los datos segn sexo del docente son:
Masculino
Femenino
60
47
56
66
70
50
61
66
70
50
47
57
62
58
61
51
67
48
59
68
63
49
71
68
59
52
64
53
65
59
38
23
28
42
29
30
50
38
36
47
33
35
51
35
31
37
22
38
31
40
41
28
42
46
31
47
48
30
50
35
2) Verificar si en promedio las docentes de esta facultad muestran menor satisfaccin sobre la
gestin y funcionamiento de la misma, respecto a los docentes.
4.4 En los previos a un examen los alumnos padecen de alto nivel de estrs, estudios
especializados reportan que en la Facultad de Ciencias Matemticas un 60% de alumnos
padecen de estrs. Se cree que este porcentaje poblacional ha decrecido ltimamente por que
se cuenta con asesora especializada desde el semestre anterior. Para verificar este supuesto se
elige una muestra aleatoria de 417 alumnos, de esta poblacin, a dos das del examen y se
encuentra que 159 tienen alto nivel de estrs. La asesora especializada es efectiva?
Ciclo de
Si estn de
Muestra
Estudios
acuerdo
Tercero
280
56
Noveno
159
56
Total
439
112
Se considera que los alumnos del ltimo ao son ms tolerantes por tanto la proporcin
poblacional de stos alumnos que estn de acuerdo que una autoridad favorezca a sus amigos
docentes para su ratificacin y/o promocin docente, es mayor que en la poblacin de los
alumnos del tercer ciclo de estudios. Es significativo este supuesto?
4.6 Estudiosos de las ciencias sociales indican que el origen socio-econmico y socio-educativo
de las personas opera como un factor importante en la determinacin de sus posibilidades y de
sus logros; motivo por el cual se desea saber si los alumnos del nivel primaria que provienen
de hogares con alto clima educativo en el hogar (padres con ms de 13 aos de estudios) tiene
mayor rendimiento acadmico que los alumnos que provienen de hogares con bajo clima
educativo en el hogar (padres de 0 a 6 aos de estudios). Los resultados al aplicar una prueba
de comprensin lectora a muestras de alumnos son:
56
45
35
46
45
35
56
25
35
47
62
53
66
54
47
55
43
35
26
35
33
26
46
56
20
34
56
43
52
36
49
24
56
43
52
36
49
24
Clima
57
60
61
66
57
70
63
57
42
54
educativo
64
55
68
56
70
59
53
60
59
49
alto
58
51
59
47
Clima
educativo
bajo
1) Verificar si la varianza del puntaje de la prueba de comprensin lectora del grupo de clima
educativo bajo es diferente del grupo de clima educativo alto.
143
2) El promedio del puntaje de la prueba de comprensin lectora del grupo de clima educativo
bajo es menor que del grupo de clima educativo alto?
4.7 La conciencia ambiental en los ciudadanos es un problema no solo para municipios, tcnicos
y polticos sino tambin para las autoridades educativas, en particular para los de al educacin
superior. En tal sentido, sea ha diseado una capacitacin que permite una formacin con
conciencia ambiental crtica en estudiantes universitarios, para verificar si produce cambios
positivos se elige al azar a una muestra aleatoria de 26 estudiantes de este nivel. A esta
muestra se evala empleando una prueba confiable y vlida antes de iniciarse la capacitacin
y cuando concluye sobre conciencia ambiental crtica. Las diferencias de los puntajes
obtenidos (antes- despus) son:
-6
-5
-5
-5
-3
-3
-4
-7
-8
-9
-5
-7
-5
-6
-3
-5
-5
-7
-4
-8
-7
-4
-4
-7
-7
-4
-7
4.8 En un estudio sobre el nivel de conocimientos que tiene el profesor de nivel primaria recin
graduado de los recursos de la TIC, para el aprendizaje de sus alumnos. Se aplico un
cuestionario (0 - 20) para tal fin a una muestra de 25 docentes de esta poblacin, siendo los
resultados:
10
14
8
11
11
12
9
9
10
5
13
17
11
18
9
10
13
12
11
16
8
12
10
11
14
144
4.10 Se est planificando implementar la enseanza del idioma chino mandarn en la Facultad de
Ciencias Empresariales de una Universidad estatal, los resultados basados en muestras
aleatorias son:
EAP
Muestra Aleatoria
De acuerdo
Administracin
309
188
Economa
400
247
4.11 La gestin del director de una Institucin Educativa es un factor clave para lograr la calidad
educativa. Preocupados por esta situacin un equipo multidisciplinarios elabora una
capacitacin especial, para formar directores con suficiente capacidad de gestin. Para
validarlo emplea una muestra aleatoria de 34 directores de Instituciones Educativas de gestin
estatal, estos docentes son evaluados antes y al final de la capacitacin sobre diversos
aspectos de la gestin. A mayor puntaje obtenido indica mayor capacidad de gestin para con
la direccin de la Institucin Educativa. Los resultados son:
Director
10
11
12
Antes
20
19
16
23
23
18
23
21
26
27
21
21
Despus
26
23
20
31
28
22
28
23
27
32
28
24
Director
13
14
15
16
17
18
19
20
21
22
23
24
Antes
17
16
21
17
17
21
24
20
18
24
15
17
Despus
21
22
25
21
25
30
32
25
23
29
21
22
Director
25
26
27
28
29
30
31
32
33
34
145
Antes
24
20
18
23
21
26
27
21
21
17
Despus
30
27
25
30
23
27
32
26
24
23
146
CAPTULO 5
5.1
Introduccin
UNIDAD ESTADSTICA
Ingresos
Egresos
Peso
Edad
Ingresos generados
Gastos
en
prueba
habilidad verbal
La naturaleza e intensidad de las relaciones entre variables pueden ser examinadas por medio
del anlisis de regresin y correlacin, dos tcnicas estadsticas relacionadas pero que sirven
para propsitos diferentes.
En este captulo analizaremos conjuntamente dos variables cuantitativas, una de ellas llamada
variable dependiente o de respuesta (y) cuyo comportamiento se debe o se explica por otra
variable llamada independiente (x), a sta ltima se le denomina tambin variable explicativa
o variable regresora.
Pero en muchas situaciones no es suficiente una variable regresora para explicar la variable de
respuesta, por el contrario se necesita ms de una variable; por ejemplo para explicar las
calificaciones obtenidas por los estudiantes de las maestras en Educacin en su primer
semestre:
147
Calificaciones
en la Maestra
Presentaremos en primer lugar el modelo de regresin lineal simple para estudiar la naturaleza
de la relacin entre una variable regresora (x) y una variable de respuesta (y); para luego
presentar el modelo de regresin lineal mltiple cuando el comportamiento de una variable de
respuesta (y) es explicado por un conjunto de variables regresoras (x1, x2, x3,.xp)
5.2
Para obtener un modelo que permita explicar los puntajes en estrategias metodolgicas (y)
obtenidas por las Promotoras Educativas Comunitarias a partir de los puntajes en estilos de
aprendizaje(x), se selecciona una muestra de 39 PEC (Promotoras Educativas Comunitarias)
que atienden a nios y nias de 3 a 5 aos, en las regiones de extrema pobreza, la que
proporcion los siguientes resultados:
19
11
16
21
25
31
15
28
12
26
22
20
32
16
25
13
15
23
33
33
17
28
14
12
24
35
34
23
15
27
25
22
35
10
27
16
13
26
37
36
20
23
17
11
27
29
37
25
18
18
28
25
38
15
19
26
29
13
39
10
20
20
14
30
15
148
40
30
yi = 3,423 + 3,494xi
20
10
En el grfico de dispersin de las variables, observamos que la relacin es como sigue: cuanto
mayor es el puntaje de estilos de aprendizaje, mayor es el puntaje en estrategias
metodolgicas.
Lo que significa que para analizar los datos y determinar si el puntaje de estilos de
aprendizaje es significativo para explicar la naturaleza de los puntajes en estrategias
metodolgicas utilizaremos el analisis de regresin lineal simple.
149
Pero cuando se desea explicar la naturaleza de la variable puntajes que se obtiene en la prueba
para evaluar las estrategias metodolgicas empleadas por las PEC en relacin a ms de una
variable independiente o regresora, el analisis de datos se hace mediante el anlisis de
regresion lineal mltiple.
Es de gran utilidad en el estudio de la relacin entre dos variables, los puntos graficados nos
mostrarn la naturaleza y la fuerza de la relacin entre dichas variables:
Es de gran utilidad en el estudio de la relacin entre dos variables, los puntos graficados nos
mostrarn la naturaleza y la fuerza de la relacin entre dichas variables:
Grfico 5.2
**
** * * *
* * * **
* * * *****
** * * **
* * *
** *
* *
* * * *
* * * ***
* * * * * **
* * * * * * *
*
* * * *
* * * *
*****
* * * ** *
* * * * * **
* * * * * * *
*
* *
** *
* *
* ** *
En el grfico (a), las variables (x, y) se incrementan mostrando una tendencia lineal; en el
grfico (b) las variables muestran una relacin inversa y lineal, al incrementarse los valores de
x disminuyen los valores de y; y en el caso (c) no se observa ninguna relacin entre las
variables.
150
5.4.
y = 0 + 1x +
(5.1)
Donde:
Supuestos:
5.5.
El modelo de regresin lineal simple ajustado, se obtiene en base a los datos de una muestra:
y = 0 + 1x
(5.2)
Donde:
y
0
Para estimar los parmetros del modelo se utiliza el Mtodo de los mnimos cuadrados, que
es un procedimiento que permite encontrar los estimadores de los parmetros del modelo, que
minimiza la suma de los cuadrados de las desviaciones entre los valores de la variable de
respuesta (valores de la muestra) y los valores estimados de la variable de respuesta(obtenidos
en la ecuacin estimada de regresin):
mn SCE
= mn ( yi y i )
i =1
Donde:
yi
yi
Grfico 5.3
152
Utilizando el clculo diferencial se puede demostrar que los valores que minimizan la
expresin (5.3), se pueden obtener a partir de las siguientes ecuaciones:
SC E
0
= 0
i =1
0 , 1
SCE
1
=0
y i = n 0 + 1
i =1
i =1
i =1
i =1
xi yi = 0 xi + 1 xi2
0 , 1
xi
(5.5)
o = y 1 x
n
1 =
n xi y i - xi y i
i=1
i=1
n
n
i=1
i=1
x - xi
i=1
n
2
i
Ejemplo 5.1: Para obtener un modelo que permita explicar los puntajes en estrategias
metodolgicas (y) obtenidas por las Promotoras Educativas Comunitarias a partir de los
puntajes en estilos de aprendizaje, se obtuvieron los siguientes resultados:
153
yi = 3, 423+ 3, 494xi
La pendiente es 3,494 y se puede interpretar como el incremento promedio en el puntaje de
las estrategias metodolgicas de las PEC, debido a sus puntajes de estilo de aprendizaje.
Como los valores de la variable puntajes de estilo de aprendizaje, estn cerca al origen (ver
Grfico 5.1), el valor 3,423 es el puntaje promedio de las estrategias metodolgicas de las
PEC.
La Tabla 5.1 muestra los clculos previos para obtener las estimaciones de los parmetros del
modelo.
5.6.
Realizado el ajuste, queremos determinar Qu tan bien se ajusta el modelo a los datos? Una
medida de evaluacin del ajuste global del modelo es el coeficiente de determinacin.
5.6.1 Coeficiente de determinacin R2. Es una medida que se utiliza para evaluar la
bondad del ajuste del modelo de regresin lineal simple.
Luego de realizar el ajuste del modelo, se tiene para una observacin lo siguiente:
154
Grfico 5.4
y
y = 0 + 1 x
(*)
(***)
y
(**)
yi y
yi y
yi yi
Pero adems:
2
n
y y
i=1 i
de los residuos
R2 =
SCR
SCT
155
2
n
yi yi
i=1
Si la expresin (5.7) se divide entre SCT y reemplazamos la expresin (5.8) en (5.7) se tiene:
SCE
2
R = 1
= 1
SCT
( y
y )
( y
y)
i =1
n
i =1
S:
R2 0 el modelo no representa adecuadamente a los datos, las variaciones de la variable de
respuesta no son explicadas por el modelo de regresin estimado.
R2 1 el modelo representa adecuadamente a los datos, es decir casi todas las variaciones de
la variable de respuesta son explicadas por el modelo de regresin estimado.
Ejemplo 5.2
Calcular e interpretar el coeficiente de determinacin para los datos del ejemplo 5.1
1330,08618
2
R =1
= 0, 5145
2739,6924
Significa que el 51.45% de las variaciones de los puntajes obtenidos por las PEC en
estrategias metodolgicas es explicado por los puntajes de estilos de aprendizaje.
La tabla 5.1 muestra los clculos realizados para obtener el valor del coeficiente de
determinacin.
156
Ejemplo 5.3
En muchos casos resulta conveniente utilizar un modelo de regresin lineal simple sin
ordenada en el origen, es decir:
y = 1x
Donde:
n
1 =
xy
i
i =1
n
x
i =1
2
i
3887
1 =
= 4,148
937
y = 4,148x
2
R = 1
( y
i =1
y )
y
i =1
157
2
i
1386,830
2
R = 1
= 0, 9208
17511
Es decir, que el 92,08% de las variaciones de los puntajes obtenidos por las PEC en
estrategias metodolgicas es explicado por los puntajes de estilos de aprendizaje.
En este caso el modelo de regresin lineal simple sin ordenada en el origen, es el que mejor se
ajusta a los datos de las PEC.
Para probar la significancia del modelo de regresin lineal simple, se tiene la siguiente
hiptesis:
Ho: 1 =0
H1 : 1 0
Fuente de
Suma de
Grados de
variacin
Cuadrados
libertad
Cuadrado Medio
Regresin
SCR
CMR=SCR/1
Residuos
SCE
n-2
CME=SCE/n-2
Total
SCT
n-1
158
Fc
CMR/CME
Ejemplo 5.4
Para los datos del ejemplo anterior, la tabla de anlisis de varianza, proporciona los siguientes
resultados:
Fuente
de Suma
de Grados
de Cuadrado Medio
variacin
Cuadrados
libertad
Regresion
1409,60622
CMR=1409,60622
Residuos
1330,08618
37
CME=35,9482751
Total
2739,6924
38
0.05;1,37
Fc
39,21207
hiptesis nula, y concluimos que el modelo de regresin lineal es apropiado para explicar los
puntajes de estrategias metodolgicas a partir de los puntajes de estilos de aprendizaje.
El anlisis de los residuos permite validar algunos de los supuestos del modelo de regresin
lineal como son: linealidad, varianza constante, independencia, normalidad, etc.; es un
mtodo efectivo para detectar deficiencias en el modelo, utilizando diversos tipos de grficos.
Los residuos adems permiten detectar observaciones que pueden considerarse como
discordantes.
El residuo est definido como: e i = y i y i
159
Grfico 5.5
15,00000
10,00000
ei
5,00000
0,00000
-5,00000
observaciones discordantes.
-10,00000
16
-15,00000
5,00000
10,00000
15,00000
20,00000
25,00000
30,00000
35,00000
yi_ajustado
Grfico 5.6
15,00000
10,00000
5,00000
ei
-5,00000
-10,00000
16
-15,00000
Los grficos muestran que la PEC nmero 16, ubicada en la esquina inferior del lado
derecho, puede ser considerada como una observacin discordante.
160
Grfico 5.7
10
Grfico
de
probabilidad
residuos
del
modelo
tienen
-5
presencia
de
datos
discordantes.
-10
16
-15
-15
-10
-5
10
15
Observed Value
El grfico muestra que los residuos del modelo se pueden considerar como aproximadamente
simtricos, pero con la presencia de un dato discordante la PEC nmero 16.
En las siguientes pginas, se muestran las tablas con los resultados utilizados para los
ejemplos de esta seccin.
Tabla 5.1
x*y
x2
e=(y - )
(y - )2
(y 19.46)2
19
76
16
17,40071
1,59929
2,55773
0,21160
28
168
36
24,38960
3,61040
13,03495
72,93160
25
150
36
24,38960
0,61040
0,37258
30,69160
28
168
36
24,38960
3,61040
13,03495
72,93160
23
138
36
24,38960 -1,38960
1,93100
12,53160
27
162
36
24,38960
2,61040
6,81416
56,85160
23
115
25
20,89516
2,10484
4,43036
12,53160
161
25
100
16
17,40071
7,59929
57,74920
30,69160
15
60
16
17,40071 -2,40071
5,76341
19,89160
10
20
80
16
17,40071
2,59929
6,75630
0,29160
11
16
80
25
20,89516 -4,89516
23,96257
11,97160
12
26
156
36
24,38960
1,61040
2,59337
42,77160
13
15
30
10,41182
4,58818
21,05142
19,89160
14
12
48
16
17,40071 -5,40071
29,16768
55,65160
15
27
108
16
17,40071
92,14635
56,85160
16
13
91
49
27,88405 -14,88405
221,5350
41,73160
17
11
44
16
17,40071 -6,40071
40,96910
71,57160
18
18
72
16
17,40071
0,59929
0,35915
2,13160
19
26
130
25
20,89516
5,10484
26,05941
42,77160
20
14
42
13,90626
0,09374
0,00879
29,81160
21
25
75
13,90626 11,09374
123,0710
30,69160
22
20
40
10,41182
9,58818
91,93325
0,29160
23
33
198
36
24,38960
8,61040
74,13891
183,3316
24
35
280
64
31,37850
3,62150
13,11527
241,4916
25
22
132
36
24,38960 -2,38960
5,71021
6,45160
26
37
296
64
31,37850
5,62150
31,60128
307,6516
27
29
174
36
24,38960
4,61040
21,25575
91,01160
28
25
125
25
20,89516
4,10484
16,84973
30,69160
29
13
39
13,90626 -0,90626
0,82131
41,73160
30
15
60
16
17,40071 -2,40071
5,76341
19,89160
31
15
75
25
20,89516 -5,89516
34,75288
19,89160
32
16
96
36
24,38960 -8,38960
70,38547
11,97160
33
17
68
16
17,40071 -0,40071
0,16057
6,05160
34
6,91737
-5,91737
35,01527
340,7716
35
10
30
13,90626 -3,90626
15,25890
89,49160
36
20
140
49
27,88405 -7,88405
62,15827
0,29160
37
28
16
17,40071 -10,40071
108,1748
155,2516
38
10,41182 -6,41182
41,11140
239,0116
39
6,91737
8,51105
239,0116
162
9,59929
-2,91737
TOTAL
759
179
3887
1330,08618 2739,6924
937
Tabla 5.2
x*y
x2
e=(y - )
(y - )2
y2
19
76
16
16,59338
2,40662
5,79180
361
28
168
36
24,89007
3,10993
9,67164
784
25
150
36
24,89007
0,10993
0,01208
625
28
168
36
24,89007
3,10993
9,67164
784
23
138
36
24,89007
-1,89007
3,57238
529
27
162
36
24,89007
2,10993
4,45178
729
23
115
25
20,74173
2,25827
5,09979
529
25
100
16
16,59338
8,40662
70,67121
625
15
60
16
16,59338
-1,59338
2,53887
225
10
20
80
16
16,59338
3,40662
11,60504
400
11
16
80
25
20,74173
-4,74173
22,48399
256
12
26
156
36
24,89007
1,10993
1,23193
676
13
15
30
8,29669
6,70331
44,93434
225
14
12
48
16
16,59338
-4,59338
21,09917
144
15
27
108
16
16,59338 10,40662
108,2977
729
16
13
91
49
29,03842 -16,03842
257,2309
169
17
11
44
16
16,59338
-5,59338
31,28593
121
18
18
72
16
16,59338
1,40662
1,97857
324
19
26
130
25
20,74173
5,25827
27,64941
676
20
14
42
12,44504
1,55496
2,41791
196
163
(y - )2
y2
12,44504 12,55496
157,6271
625
8,29669
11,70331
136,9674
400
198
36
24,89007
8,10993
65,77089
1089
280
64
33,18677
1,81323
3,28782
1225
22
132
36
24,89007
-2,89007
8,35253
484
26
37
296
64
33,18677
3,81323
14,54075
1369
27
29
174
36
24,89007
4,10993
16,89149
841
28
25
125
25
20,74173
4,25827
18,13287
625
29
13
39
12,44504
0,55496
0,30798
169
30
15
60
16
16,59338
-1,59338
2,53887
225
31
15
75
25
20,74173
-5,74173
32,96745
225
32
16
96
36
24,89007
-8,89007
79,03343
256
33
17
68
16
16,59338
0,40662
0,16534
289
34
4,14835
-3,14835
9,91208
35
10
30
12,44504
-2,44504
5,97821
100
36
20
140
49
29,03842
-9,03842
81,69304
400
37
28
16
16,59338
-9,59338
92,03300
49
38
8,29669
-4,29669
18,46156
16
39
4,14835
-0,14835
0,02201
16
TOTAL
759
179
3887
937
1386,380
17511
x*y
x2
21
25
75
22
20
40
23
33
24
35
25
e=(y - )
Ejercicios propuestos
2 3
5 6
8 9 10 11 12 13 14 15 16 17 18 19 20 21
3 1
5 0
3 1
12 10 9 10 13 9 14 13 8 11
9 11 15
9 11 12 10 12 12 11 12
5.2.Los tericos monetaristas sostienen que el Producto Nacional Bruto (billones de dlares)
est fundamentalmente determinado por la oferta monetaria (billones de dlares).
PNB
OFERTA
MONETARIA
1127,0
237,5
1156,7
2423
1181,4
247,4
1219,4
252,9
1365,0
257,6
1287,8
261,7
1319,7
265,3
1352,7
268,7
1370,9
272,7
10
1391,0
276,5
11
1424,4
279,4
12
1441,3
282,2
13
1433,6
282,6
14
1460,6
287,8
165
5.3 La esperanza de vida femenina parece ser el factor principal en la mortalidad infantil en los
pases de Latinoamrica, el informe proporcionado por la OMS en 1990, muestra lo siguiente:
Mortali- Esperanza
Pas
dad
de vida
infantil
femenina
Bolivia
75,0
64
Brasil
66,0
67
Colombia
28,0
75
Cuba
10,2
78
Chile
14,6
78
Ecuador
39,0
73
El Salvador
41,0
69
Guatemala
57,0
67
Hait
109,0
47
Honduras
45,0
70
d) Qu porcentaje de la variabilidad de la
mortalidad infantil es explicada por la
esperanza de vida femenina?
Mxico
35,0
77
e)
Nicaragua
52,5
67
Panam
16,5
78
Paraguay
25,2
75
Per
54,0
67
Rep.
51,5
70
Uruguay
17,0
77
Venezuela
28,0
76
Dominicana
166