You are on page 1of 5

5. ESTADSTICA ANALTICA 5.

1 Diseo de experimentos y anlisis de varianza El diseo de un experimento est compuesto de las siguientes fases:

Planteamiento del problema] Suele iniciarse con una fijacin de objetivos o algunas preguntas como cul ser la media de esta poblacin respecto a tal caracterstica?, se parecen estas dos poblaciones?, hay alguna relacin entre? En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las variables, etctera. Se analizan tambin en este punto los medios de los que se dispone y el procedimiento a seguir. Elaboracin de un modelo] Se establece un modelo terico de comportamiento de la variable de estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los posibles modelos son distribuciones de probabilidad. Extraccin de la muestra Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una pequea parte de la poblacin. Tratamiento de los datos] En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media muestral, la varianza muestral Los mtodos de esta etapa estn definidos por la estadstica descriptiva. Estimacin de los parmetros] Con determinadas tcnicas se realiza una prediccin sobre cules podran ser los parmetros de la poblacin. Contraste de hiptesis] Artculo principal: contraste de hiptesis

Los contrastes de hiptesis son tcnicas que permiten simplificar el modelo matemtico bajo anlisis. Frecuentemente el contraste de hiptesis recurre al uso de estadsticos mustrales. Conclusiones] Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden servir para tomar decisiones o hacer predicciones. El estudio puede comenzar de nuevo a partir de este momento, en un proceso cclico que permite conocer cada vez mejor la poblacin y caractersticas de estudio. 5.2 Regresin Simple y correlacin El problema radica en encontrar aquella recta que mejor ajuste a los datos. Tradicionalmente se ha recurrido para ello al mtodo de mnimos cuadrados, que elige como recta de regresin a aquella que minimiza las distancias verticales de las observaciones a la recta. Ms concretamente, se pretende encontrar a y b tales que:

Resolviendo este problema mediante un sencillo clculo de diferenciacin, se obtienen los estimadores mnimo cuadrticos de los coeficientes de la recta de regresin:

5.3 Regresin Mltiple y Correlacin

La regresin lineal mltiple (RLM) es un modelo que permite estudiar estos efectos. El modelo es

a0: media de Y cuando todas las Xi son cero (cuando no tiene sentido Xi=0, p.e. edad, se interpreta como la media de Y que no depende de las Xi). ai: cambio en la media de Y cuando Xi aumenta una unidad permaneciendo constantes las dems. Las asunciones del modelo son una generalizacin de las de RLS y dado el resultado de RLS no vamos a distinguir entre modelo I y II. La estimacin de los coeficientes tambin se hace por mnimos cuadrados o mxima verosimilitud y se obtienen los mismos resultados. Estos resultados, usando notacin matricial, son (incluyen como caso particular la RLS):

siendo la matriz columna de coeficientes estimados, Y la matriz columna de observaciones de la variable dependiente y X la denominada matriz de diseo

es decir la matriz de datos con una primera columna de 1's. Estos coeficientes se distribuyen como una normal multivariante cuya matriz de medias son los verdaderos coeficientes y matriz de varianzas-covarianzas

un buen estimador de 2 es

que se distribuye como una c2 con n - (k+1) grados de libertad 5.4 Teora del Muestreo

Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis.

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. La variabilidad es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere investigar en alguna investigacin anterior o en un ensayo previo a la investigacin actual. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechaz se la hiptesis es la variabilidad megativa, denotada por q. Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Adems, cuando se habla de la mxima variabilidad, en el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5. Una vez que se han determinado estos tres factores, entonces se puede calcular el tamao de la muestra como a continuacin se expone. Hablando de una poblacin de alrededor de 10,000 casos, o mnimamente esa cantidad, podemos pensar en la manera de calcular el tamao de la muestra a travs de las siguientes frmulas. Hay que mencionar que estas frmulas se pueden aplicar de manera aceptable pensando en instrumentos que no incluyan preguntas abiertas y que sean un total de alrededor de 30. Vamos a presentar dos frmulas, siendo la primera la que se aplica en el caso de que no se conozca con precisin el tamao de la poblacin, y es:

donde: n es el tamao de la muestra;

Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; E es la precisin o error.

ACTIVIDAD Se trat a 5 enfermos de hepatitis con un mismo frmaco, variando el tratamiento en las cantidades diarias suministradas. Medido el nmero de das que cada enfermo tard en sanar, se tiene: mg. de 10 20 30 40 50 frmaco Das en 20 18 15 12 10 sanar 0 0 0 0 0 Calcular la regresin lineal Calcular el coeficiente de relacin Se trat a 5 enfermos de hepatitis con un mismo frmaco, variando el tratamiento en las cantidades diarias suministradas. Medido el nmero de das que cada enfermo tard en sanar, se tiene: mg. de 10 20 30 40 50 frmaco Das en 20 18 15 12 10 sanar 0 0 0 0 0 Disear el modelo de hiptesis

You might also like