You are on page 1of 13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

Escuela de ciencias bsicas tecnologas e Ingeniera


Inferencia Estadstica
2011 Intersemestral

TRABAJO COLABORATIVO No. 2


INFERENCIA ESTADISTICA

Presentado por Grupo 46:


HUMBERTO PERDOMO TRUJILLO
COD 83237201
MILTON FERNEY PARRA MEDINA
COD:83169930
MANUEL ALFONSO RINCON MENDEZ
COD 83232445

Presentado a:
Prof. Danis Brito

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD 2011

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

1/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

INTRODUCCION

La mayora de las decisiones tomadas por los seres humanos en muchas reas de su
desempeo se hacen con base en creencias que se tienen en relacin a un concepto de
realidad. Cada una de estas creencias o supuestos origina una hiptesis, que es una
proposicin avanzada con posibilidad de ser verdadera. Surge entonces la necesidad de que
la decisin sea tomada con base en la prueba de dicha hiptesis, mediante un mtodo
sistemtico de evaluar creencias sobre la realidad que requiere de la confrontacin de esa
creencia con evidencia y as decidir si es aceptable o por el contrario debe descartarse.
Este marco conceptual servir no solo para la toma de decisiones, sino tambin para extraer
conclusiones sobre las caractersticas desconocidas de una poblacin cuando se desea
conocer la homogeneidad que existe entre varias medias mustrales, midiendo la
variabilidad entre estas, tcnica que se conoce como anlisis de varianza. De esta manera
se determina cules son las variables independientes de importancia en un estudio, y en qu
forma interactan y afectan la respuesta, de manera que sirven para determinar si se rechaza
una hiptesis o no.
El propsito de este trabajo es que como estudiantes nos apropiemos e interactuemos con
cada uno de los conceptos de tal forma, que los podamos poner en prctica para un mejor
desenvolvimiento en problemas en los que se desee comprobar la efectividad de estndares
preestablecidos, como lo es el caso de la prueba de hiptesis que nos permite comprobar
con mayor certeza el grado de acierto en la fijacin de estas dificultades, por ende la prueba
de hiptesis, anlisis de varianza y estadstica no paramtrica nos servir de apoyo para el
anlisis y estudio de la presente unidad.
Esta actividad se realiz con la masiva participacin de los integrantes de este grupo
colaborativo, mostrando dinamismo y armona.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

2/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

OBJETIVOS

OBJETIVO GENERAL
Adquirir y entender los conocimientos bsicos de la Unidad 2 que nos servirn de base para
solucionar problemas relacionados con esta rea en el campo profesional y personal.
OBJETIVOS ESPECIFICOS
Conocer las herramientas provenientes de la Inferencia Estadstica, con la intencin
de utilizarlas en campos de la ciencia, la tecnologa y en nuestra vida cotidiana.
Aprender a trabajar en grupo, aportando ideas significativas para la solucin de
problemas asignados, y posteriormente debatir con los compaeros para lograr una
respuesta bien estructurada.
Aprender conceptos bsicos y tiles la Inferencia Estadstica, y con ello alcanzar
con los objeticos del curso y poder aplicarlos en nuestros campos profesional, ya
que esta herramienta matemtica es muy verstil y tiene mucha aplicabilidad.
Trabajar en equipo, para dar los puntos de vistas de cada integrante del grupo y
luego debatir la solucin de cada problema.
Aplicar los fundamentos tericos en los que se basa la prueba de hiptesis
estadstica, considerada como alternativa para toma de decisiones.
Conocer las diversas tcnicas que ofrece la inferencia estadstica de manera, que
sean herramientas poderosas en la evaluacin, ratificacin y extraccin de
conclusiones sobre caractersticas de una poblacin partiendo del buen trato
estadstico que sobre una muestra de la misma se haga.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

3/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

CUERPO DEL TRABAJO


1. Establezca la diferencia entre: Nivel de significacin y potencia de una prueba;
pruebas paramtricas y pruebas No paramtricas:
NIVEL DE SIGNIFICACION
Es
un
resultado
se
denomina
estadsticamente significativo cuando no
es probable que haya sido debido al azar.
Una
"diferencia
estadsticamente
significativa" solamente significa que
hay evidencias estadsticas de que hay
una diferencia; no significa que la
diferencia sea grande, importante, o
significativa en el sentido estricto de la
palabra.

POTENCIA DE UNA PRUEBA


Es la probabilidad de rechazar la
hiptesis nula cuando de hecho esta es
falsa y debera ser rechazada. Una
manera en que podemos controlar la
probabilidad de cometer un error del
tipo II en un estudio, consiste en
aumentar el tamao de la muestra.
Tamaos ms grandes de muestra, nos
permitirn detectar diferencias incluso
muy pequeas entre las estadsticas de
muestra y los parmetros de la
poblacin.

2. Para tomar la decisin en un contraste de hiptesis se puede comparar el P-Valor


con el nivel de significacin. Explique cules son las condiciones en trminos de
magnitud de estos factores para rechazar una hiptesis unilateral derecha o
unilateral izquierda.
Se debe realizar un procedimiento de contraste por medio del cual se toma una
decisin basada en la muestra aleatoria seleccionada de la poblacin en estudio.
Para llevar a cabo este procedimiento es necesario seleccionar un estadstico de
contraste, calcularlo con base en la muestra y luego tomar la decisin de rechazar o
no H0, dependiendo de si este estadstico es o no consistente con H0. Es decir, si el
valor calculado del estadstico es muy diferente del valor supuesto en H0,
suponiendo que sta es cierta, entonces se rechaza H0. Sin embargo, si el valor
calculado del estadstico de contraste es consistente con lo supuesto en H0, entonces
no hay razn suficiente para rechazar H0 en favor de la Ha. En resumen, el
estadstico de contraste es una variable aleatoria cuya distribucin se conoce, en el
supuesto de que H0 es verdadera y sirve para tomar la decisin de rechazar o no H0.
3. Qu significan el error tipo I y el error tipo II. Explique su interpretacin con un
ejemplo:
Error Tipo I: Es el error que se comete cuando el investigador no acepta la hiptesis
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

4/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

nula (Ho) siendo sta verdadera en la poblacin.


Ejemplo: Cuando un investigador necesita saber las causas por las cuales una
poblacin determinada presenta altos niveles de desercin escolar. Plantea como
hiptesis nula que se debe a causas culturales; sin embargo, este mismo investigador
rechaza su propia hiptesis; sin embargo, se comprueba que era cierta.
4. Explique cules son los supuestos de homogeneidad, homocedasticidad,
independencia y Normalidad, que deben cumplirse para validar un anlisis de
varianzas.
La nocin de homogeneidad define a la igualdad mayor o menor de los valores de
una variable o de una combinacin de caractersticas en un conjunto geogrfico. Los
parmetros de dispersin estadstica, en particular la varianza, miden su inversa, la
heterogeneidad.
Dos variables estadsticas son estadsticamente independientes cuando el
comportamiento estadstico de una de ellas no se ve afectado por los valores que
toma la otra; esto es cuando las relativas de las distribuciones condicionadas no se
ven afectadas por la condicin, y coinciden en todos los casos con las frecuencias
relativas marginales.
La homocedasticidad se presenta en un modelo cuando los errores presentan en
todas las observaciones de la variable endgena la misma varianza. Dado que
hablamos de varianza, la homocedasticidad es un concepto estadstico.
Un modelo estadstico relaciona el valor de una variable a predecir con el de otras.
Si el modelo es insesgado, el valor predicho es la media de la variable a predecir. En
cualquier caso, el modelo nos da una idea del valor que tomar la variable a
predecir.
La normalidad es una de las distribuciones de muestreo ms utilizadas.
Caracterizada por una media poblacional y una varianza poblacional 2. Estos
parmetros se aproximan por los estadsticos y S2. Muchos datos en realidad siguen
una distribucin normal y los que no, si se tienen suficientes datos, se pueden
agregar para que los datos agregados sigan una distribucin aproximadamente
normal (Teorema del
Lmite Central)
5. Comprueben a partir de dos muestras independientes de igual tamao de

hombres y mujeres, la opinin de acuerdo o desacuerdo con algn tema de su


inters, a travs del contraste de una hiptesis, en la que se establezca si existen
diferencias de opinin entre los hombres y mujeres sobre el tema de inters
consultado. Interprete los resultados a que quiere llegar este caso. Para dar
respuesta a este caso utilice los pasos para el contraste de una hiptesis.
CONTRASTE DE HIPOTESIS EJEMPLO.
1. Establecimiento de las hiptesis nula y Hiptesis nula: Las mujeres hablan
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

5/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

alternativa.
- La hiptesis nula H0 ser aceptada si
los datos de la muestra no evidencian que
es falsa.
- La hiptesis alternativa H1 es la
afirmacin que se acepta si se rechaza la
hiptesis nula.
2.
Determinacin del criterio de
contraste.
Se debe especificar el nivel de
significacin, el tipo de distribucin y los
valores crticos. Al tomar una decisin
respecto a una hiptesis, existen las
cuatro situaciones posibles que se
indicaron en la tabla anterior.
3. Clculo del estadstico de prueba.
El estadstico de prueba es un valor
obtenido a partir de la informacin de la
muestra para compararlo con el criterio
de contraste y rechazar o aceptar la
hiptesis. Depende de la distribucin que
se utilice, de modo que los ms utilizados
en el mbito de laboratorios para la
media y la desviacin estndar de la
muestra son los siguientes:
Toma de la decisin y conclusiones de
tipo estadstico.
Una regla de decisin supone establecer
las condiciones sobre las cuales la
hiptesis nula es rechazada o no
rechazada.
- Si el estadstico de prueba queda dentro
de la zona crtica, la hiptesis nula deber
ser aceptada.
- Si el estadstico de prueba queda fuera
de la zona crtica, la hiptesis nula deber
ser rechazada.

ms que los hombres.


Hiptesis alterna: Los dos gneros
hablan por igual.

El criterio de contraste son la cantidad


de palabras promedio que cada uno de
los gneros utiliza diariamente. Que
ambos gneros hablan en promedio
16.000 palabras por da mientras est
despierto. Segn estudio realizado en
EEUU y Mexico.
Cantidad de palabras por minuto en una
muestra de 400 personas durante todo
un da, dando como resultado:
16.215 para mujeres
15.669 para hombres
Siendo
iguales

resultados

estadsticamente

Se rechaza la hiptesis nula, debido a


los resultados estadsticos del estudio.
Se acepta la hiptesis alterna, ya que los
resultados la corroboran.

6. Establezca las consideraciones que deben hacerse para seleccionar entre un


modelo paramtrico o sus correspondiente no paramtrico.
Una hiptesis estadstica es una asuncin relativa a una o varias poblaciones, que puede ser
cierta o no. Las hiptesis estadsticas se pueden contrastar con la informacin extrada de
las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

6/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

hiptesis formulada con intencin de rechazarla se llama hiptesis nula y se representa por
H0. Rechazar H0 implica aceptar una hiptesis alternativa (H1). La situacin se puede
esquematizar: H0 cierta H0 rechazada H0 no rechazada.
Ejemplo
Se toman datos sobre un nuevo parque de diversiones, calificando el parque de diversiones
de 1 a 10, donde 1 es muy malo y 10 es muy bueno.
Tema encuestado:
Calificacin del parque de diversiones
Respuestas posibles: Valores entre 1 y 10
Cantidad de hombres:20
Cantidad de mujeres: 20
Mujeres
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Calificacin
8
9
7
10
7
6
5
9
8
8
9
5
6
5
6
6
8
6
7
6

Hombres
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Calificacin
3
9
10
6
8
9
7
8
4
6
9
8
9
9
8
8
8
8
8
7

Se desea probar la diferencia de opinin entre hombres y mujeres, con un nivel de


significancia del 0.05
Definiendo las medias poblacionales:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

7/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

1 = 7.05
2 = 7.6
Desarrollo
Paso 1:
Se plantean las hiptesis Nula H0 y la Alternativa H1
H0: 1 = 2 Las dos medias son iguales
H1: 1 2 Las dos medias son diferentes
Paso 2:
Se elige el nivel de significancia, que en este caso se ha planteado en 0.05 y se utiliza la
distribucin t student ya que las muestras son menores que 30.
Los grados de libertad para este caso son:
20 + 20 2 = 38
Ahora, como la hiptesis alternativa H1 est planteada como diferente, la prueba es de dos
colas.
Paso 3:
Como son dos muestras se debe calcular las medias y las varianzas de cada grupo:

n
S

Hombres
7.6
20
1.73

Mujeres
7.05
20
1.50

Para el clculo del valor estadstico se usa la siguiente frmula:

El valor estadstico aplicando la frmula es:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

8/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

Paso 4:
Debido a que el nivel de significancia es de 0.05 y dado que la hiptesis alternativa
planteada no seala una direccin, se debe trabajar con una prueba de dos colas.
La grfica entonces es:

Paso 5:
Despus de hacer el respectivo anlisis se decide no rechazar la hiptesis nula (H0) dado
que el valor del estadstico de prueba 1.07 y se ha ubicado en la zona de aceptacin de
dicha hiptesis; se concluye entonces que no existe diferencia en la opinin (de acuerdo o
desacuerdo) entre los 20 hombres y las 20 mujeres con relacin al gusto por del parque de
diversiones, con un nivel de significancia del 5%.
7. Una de las opciones que tiene la estadstica para realizar inferencia sobre los
parmetros de una poblacin es la prueba de hiptesis. Explique las ventajas y
desventajas con respecto al otro mtodo de estimacin.
VENTAJAS
DESVENTAJAS
No incorpora los supuesto restrictivos El uso de pruebas no paramtricas con
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

9/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

de las pruebas paramtricas.

datos que pueden manejarse con pruebas


paramtricas produce un desperdicio de
informacin.
No requiere que la poblacin subyacente La aplicacin de algunas de las pruebas
este normalmente distribuido.
no paramtricas puede ser laboriosa para
muestras grandes.
El uso de rangos permite menos errores.
8. Los dos mtodos No paramrtico para realizar una bondad de ajuste de los datos
de una variable con respecto a una distribucin de probabilidad son: El de Chicuadrado y el de Kolmogorov - Smirnov . Explique en qu condiciones debe
usarse cada uno de ellos.
La prueba Chi-cuadrado es otro tipo de prueba que se utiliza para contrastar
hiptesis, usada en aquellos casos en que se asume que la distribucin de datos no
se ajusta a la distribucin normal, y por lo tanto no es significativo usar t de Student.
Se asume que cuanto menor sea el valor de chi-cuadrado calculado ms se
aproximan entre si los comportamientos de las dos muestras (cuando son dos), o
mejor se aproxima el comportamiento de una sola muestra al valor hipottico de la
media asumido para la poblacin. La prueba Kolmogorov - Smirnov debe usarse
cuando la variable de anlisis es continua. Sin embargo, si la prueba se usa cuando
la distribucin de la poblacin no es continua, el error que ocurre en la probabilidad
resultante est en la direccin segura. Es decir, cuando se rechaza la hiptesis nula,
tenemos verdadera confianza en la decisin. Tambin puede aplicarse para tamaos
demuestra pequeos, lo que no sucede con la chi cuadrado.
9. El anlisis de varianza es una tcnica estadstica utilizada para medir el efecto
que tiene cada uno de los niveles en que se clasifica una variable sobre otra
variable que representa las repuestas a las mediciones realizadas una
experimentacin. Explique las condiciones que se deben imponer a las dos
variables y los supuestos que deben cumplirse para que tenga validez el uso de
esta tcnica.
Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de
hiptesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:1. Cada
conjunto de datos debe ser independiente del resto. 2. Los resultados obtenidos para
cada conjunto deben seguir una distribucin normal. 3. Las varianzas de cada
conjunto de datos no deben diferir de forma significativa.
Cuando se utiliza la tcnica anova se deben cumplir los siguientes supuestos: 1. Las
personas de los diversos subgrupos deben seleccionarse mediante el muestreo
aleatorio, a partir de poblaciones normalmente distribuidas. 2. La varianza de los
subgrupos debe ser homognea. 3. Las muestras que constituyen los grupos deben
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

10/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

ser independientes. Amenos de que las muestras sean independientes, y que por lo
tanto, generen estimaciones de varianza independientes, la razn de las varianzas
inter e intra no adoptar la distribucin F.
10. Existen dos tipos de modelo de anlisis de varianza: de efectos fijos y de efectos
aleatorios. Explique el significado cada uno de ellos en un anlisis de varianza.
Anlisis de varianza de efectos fijos
El modelo de efectos fijos de anlisis de
la varianza se aplica a situaciones en las
que el experimentador ha sometido al
grupo o material analizado a varios
factores, cada uno de los cuales le afecta
slo a la media, permaneciendo la
"variable respuesta" con una distribucin
normal.
Este modelo se supone cuando el
investigador se interesa nicamente por
los niveles del factor presentes en el
experimento, por lo que cualquier
variacin observada en las puntuaciones
se deber al error experimental.

Anlisis de varianza de efectos


aleatorios
Los modelos de efectos aleatorios se
usan para describir situaciones en que
ocurren diferencias incomparables en el
material o grupo experimental. El
ejemplo ms simple es el de estimar la
media desconocida de una poblacin
compuesta de individuos diferentes y en
el que esas diferencias se mezclan con
los errores del instrumento de medicin.
Este modelo se supone cuando el
investigador est interesado en una
poblacin de niveles, tericamente
infinitos, del factor de estudio, de los
que nicamente una muestra al azar (t
niveles) estn presentes en el
experimento.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

11/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

CONCLUSIONES

Del anterior trabajo se puede concluir no solo la importancia que tiene la inferencia
estadstica hoy da sino tambin como podemos llegar a aplicar dichos conceptos en las
diferentes ciencias del saber.
Despus de haber realizado a plenitud este trabajo, se ha visto ms detalladamente y con
ms exactitud las pruebas de hiptesis, anlisis de varianza y estadstica no paramtrica;
estos temas estn relacionados en cierta forma ya que para dar solucin a algunos de los
problemas planteados se necesita de la unin de todos los conceptos adquiridos en el curso.
Se debe entender que el desarrollo dinmico de estos ejercicios entre los compaeros del
grupo es una gran herramienta y oportunidad de aprendizaje e intercambio de opiniones.
El trabajo realizado permiti poder interpretar y aplicar los conceptos adquiridos en el
transcurso del curso, facilitando el entendimiento y desarrollo de los ejercicios propuestos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

12/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


Escuela de ciencias bsicas tecnologas e Ingeniera
Inferencia Estadstica
2011 Intersemestral

REFERENCIAS

Rondn Duran, Jorge Eliecer (2010). Mdulo de Calculo Diferencial. Segunda


Edicin, Bogot Colombia. UNIVERSIDAD NACIONAL ABIERTA Y A
DISTANCIA.
Pruebas no paramtricas. Recuperado el da 10 de Julio de 2011 de:
http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation
Errores de Tipo I y de Tipo II. Recuperado el da 13 de Julio de 2011 de:
http://es.wikipedia.org/wiki/Errores_de_tipo_I_y_de_tipo_II
Pruebas paramtricas. Recuperado el da 15 de Julio de 2011 de:
http://members.fortunecity.com/bucker4/estadistica/paramdesc.htm
El anlisis de la varianza. Recuperado el da 19 de Julio de 2011 de:
http://www.quimica.urv.es/quimio/general/anovacast.pdf
Kelsey IL, Thompson WD, Evans A. Methods in observational epidemiology. New
York. Oxford University Press 1986.
Anderson D. Sweeney D. Williams T. Estadstica para administracin y economa,
International Thomson Editores. Mxico. 1999.
Montgomery D.Runger G. Probabilidad y estadstica aplicadas a la ingeniera,
McGraw-Hill. Mxico 1996.
Criterios para seleccionar una prueba estadstica. Recuperado el da 12 de Julio de
2011 de:
http://members.fortunecity.com/bucker4/estadistica/criteriosselecprueb.htm.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

13/13

You might also like