INSTITUTO TECNOLOGICO DE CULIACAN

Unidad 2, 3 y 4

Alumno: Castilla Ruiz Gloria Estefania

No. Control: 09170482

Fecha de entrega: 22 de Julio de 2011

UNIDAD 2 VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Definición de variable aleatoria discreta. Funcion de probabilidad y de distribución de una variable aleatoria. Valor esperado.Caso Discreto Definición Una variable aleatoria (v.a.) es discreta si los valores que asigna forman un conjunto contable (finito o infinito). Ejemplo Sea son el número de caras al lanzar dos monedas. Los valores que asigna , el cual es un conjunto contable (finito).

FUNCION DE PROBABILIDAD Sea una variable discreta. La colección de números propiedades: que satisface las

. Se llamará una función de probabilidad o función de masa de probabilidad de la variable aleatoria discreta Ejemplo de 2 dados Se realiza el siguiente experimento: se lanzan dos dados, uno rojo y otro azul. El espacio muestral para este experimento es: .

En este caso debido a que el espacio muestral es finito.En una función de probabilidad sobre una sigma álgebra asociada al espacio muestral es dada por: : donde es definida como Explicación: Esta es una de las maneras de definir una función de probabilidad sobre la sigma álgebra. y la letra representa l aprobabilidad de un evento para representa la probabilidad para un elemento . álgebra que fué denotado anteriormente como Explicación: Observe que la letra la variable aleatoria del espacio muestral. entonces la variable aleatoria los elementos de espacio muestral como se muestra Aquí toma los valores De esta manera se dice que la variable aleatoria La función de probabilidad para la variable continuación: se determina como se muestra a El valor se obtiene de la función de probabilidad definida sobre la sigma . se define la función de probabilidad para cada elemento de como: Sea la variable aleatoria que representa la suma de los números obtenidos en asigna números reales a cada uno de las caras.

Análogamente la probabilidad para los otros valores de la variable se presenta en la siguiente tabla: Probabilid ad = = = = = = = = = = = = = = = = = = = = Para poder observar mejor el comportamiento de la distribución de la probabilidad de la variable observe la figura que se presenta a continuación. .

En la gráfica se observa que la distribución de probabilidad es simétrica esto implica que las medidas de tendencia: Media Aritmética. VALOR ESPERADO Los promedios son parte de nuestro diario vivir. son iguales. defina por y sea una función real definida Caso discreto . Observe que lo más probable que puede ocurrir al lanzar dos es que la suma de las caras sea 7. El objetivo de esta seccióon es mostrar algunas características numéricas de una distribución poblacional. entre otros. Mediana y La moda . Sea sobre una variable aleaoria definida sobre . el promedio de temperatura en Agosto. La manera de calcular estas medidas se estudia en la lección Valor esperado. El más comun promedio utilizado en estadística es la media o valor esperado o esperanza matemática. el promedio de edad de los trabajadores de una empresa. Nosotros escuchamos el promedio de lluvia en una ciudad en un año.

Sea X la variable aleatoria que ensayos o pruebas. Sea y veces). o sea que cada la probabilidad de éxito cada vez que el experimento se realiza la probabilidad de fracaso. Criterios o propiedades para definir la Distribución Binomial . Los términos o calificativos de "éxito y fracaso" son solo etiquétas y su interpretación puede no corresponder con el resultado positivo o negativo de un experimento en la realidad. Ejemplo Éxito podría ser hallar en un ensayo específico que la unidad es defectuosa al examinarla. o el valor .Suponga Si esperado de que es una variable aleatoria es discreta. investigación). El interés se centra éxitos en esos representa el número de éxitos en los en conocer la probabilidad de obtener exactamente ensayos. producción. Cada experimento aleatorio consiste en una serie de ensayos o pruebas repetidas realizadas en idénticas condiciones ( uno de ellos es independiente de los demás. Tiene que ver con el experimento aleatorio que produce en cada ensayo o prueba uno de dos resultados posibles mutuamente excluyentes: ocurrencia de un criterio o característica específico (llamado éxito) y no ocurrencia de éste (llamado fracaso). entonces se define la media de por DISTRIBUCION BINOMIAL Notación: Definición Es una de las distribuciones de probabilidad más útiles ( control de calidad.

5. Son pruebas con reemplazamiento o con reposición. número de éxitos al La función de probabilidad de X en esas condiciones será: Para entero y Planteamiento Básico Supongamos un proceso productivo en serie de una misma unidad y metalmecánica y en él que: Probabilidad de una unidad defectuosa : probabilidad de unidad no defectuosa: . .El experimento aleatorio consiste en ensayos o pruebas repetidas. Para garantizar que los ensayos resulten independientes hacemos la selección con reemplazamiento o sustitución.La probabilidad del llamado éxito ( cada ensayo o prueba. 2.Cada uno de los ensayos o pruebas arroja solo uno de dos resultados posibles resultados: éxito ó fracaso. El interés recae en hallar la probabilidad de obtener realizar ensayos del mismo E. e idénticas y fijadas antes del experimento (pruebas de Bernoulli). pemanece costante para 4. Supongamos que el interés está en evaluar el proceso mediante una muestra aleatoria de 4 unidades y por tanto se define la v. 3.A.Cada prueba o ensayo se repite en idénticas condiciones y es independiente de las demás. podemos definir estos criterios: 1. .Resumiendo. Cuando estas propiedades se cumplen en el experimento aleatorio se dice que el constituye un proceso de Bernoulli y cada uno de los ensayos que lo conforman se llama experimento de Bernoulli.a X como el número de unidades defectuosas en la muestra.

. Sea B=bueno y D= defectuoso. Como no importa el orden de aparición de la unidad defectuosa sino que aparezca exactamente una unidad con esa característica tenemos: o sea: defectuosa para cada posible resultado de una unidad Como son cuatro resultados los que satisfacen el interés específico de una unidad defectuosa entonces Si generalizamos: donde: son las distintas es la maneras como probabilidad de los éxitos . éxitos en cada una de las maneras distintas de producirse Para el caso del ejemplo: Consideremos el caso ya no de puede asumir X en las cuatro pruebas. Se puede entonces notar que los eventos favorables a constiuyen el subconjunto . Por lo tanto el esta conformado por 16 resultados posibles . sino todos los valores que .Supongamos que centramos nuestro interes en unidad defectuosa en las cuatro pruebas o ensayos. defectuoso... éxitos se producen dentro de los ensayos..

binomial X tiene como varianza Por lo tanto su desviación estandar: .a. a veces largas o laboriosas. Tomemos como ejemplo la distribución binomial de parámetros y Características de la distribución binomial.Como de son 4 ensayos y consideramos todos los posibles valores entonces la Los valores de se pueden calcular por medios electrónicos ó utilizando las tablas de la distribución binomial que proporcionan la solución de estas operaciones. hacer su gráfica y definir sus principales características. Tendencia central: = aplicando la definición de valor esperado se obtiene que para esta distribución : Dispersión ó variación: : = lo que conduce a que una v. Con los resultados de esos cálculos podemos construir la tabla de distribución de probabilidades. Asimetria ó deformacíon (Forma): con base en la razón entre los momentos centrales de orden dos y tres como quedo definido antes: .

sobre la base de que si: Generalmente la distribución binomial es sesgada ó asimetrica hacia la derecha. Para el caso considerado y utilizando tanto la metodología tradicional de la definición de conceptos como usando las fórmulas simplificadas. tenemos: Tota l 0 . tambien . sesgo que se va perdiendo cuanto más grande sea el valor de y en la medida en que se acerque a limite en el cual se torna simétrica (por lo tanto (# de pruebas) tienda a ). Su sera: función de distribución acumulada DISTRIBUCION HIPERGEOMETRICA .

los cuales una parte: 2. En efecto. Cada elemento puede ser caracterizado como éxito ó fracaso. Sus aplicaciones estan en areas con uso considerable de muestreo de aceptación. de "son éxitos". Criterios ó propiedades que la caracterizan. Por ejemplo. La diferencia mas simple con la binomial es la forma de aplicar el muestreo. pues no se puede hacer reposición directamente. donde los elementos de la muestra se toman todos a la vez y no individualmente ó donde el elemento seleccionado no se reintegra al experimento ó a la muestra nuevamente. etc. si en el control de calidad se pierde el elemento que se prueba. Se plantéa entonces la prueba sin reposición. y otra parte: son "fracasos". . tomada de una población de muestra aleatoria (sin reposición) de tamaño tamaño y de la cual satisface una caracteristica ó propiedad (éxito) antes del muestreo y no la satisface (fracaso). en: : Muestreo con reemplazamiento e independencia de pruebas ó ensayos. 1. : Muestreo sin reemplazamiento y sin independeencia entre pruebas ó ensayos. La población del conjunto de unidades ó elementos es de orden fínito. fabricación de piezas. pruebas electronicas y de aseguramiento de la calidad. Definición En la distribución Hipergeométrica cantidad de resultados éxitos en una .Notación: Definición Muchas veces en la práctica es difícil realizar pruebas con reposición ó reemplazamiento.

Interesa entonces la productos defectuosos (Exito). entonces el número de formas de seleccionar obtener sera: productos defectuosos esta ligado con el número de formas de productos no defectuosos.A. o sea: Planteado así el (E. Supongamos un lote de Obtenemos muestra de probabilidad de sacar productos de los cuales: productos.) Podemos hacer el siguiente raciocinio: De una población de de de elementos se pueden extraer muestras de tamño ). productos no defectuosos entre Como es el mismo evento compuesto.3. No son pruebas repetidas. El tamaño de la muestra aleatoria es grande relativamente en comparación con el tamaño de la población. Se obtiene una muestra aleatoria de elementos todos a la vez (sin reemplazamiento) y no de forma independiente. Generalmente: 5. todos a la vez. Se busca la probabilidad de resultados ó elementos y número de éxitos a partir de los fracasos a partir de los elementos asi clasificados. 4. Luego el total de formas posibles Combinando los casos . el número de formas de defectuosos de formas de obtener de ellos será: y entonces sera el número de de ellos. Al extraer muestras obtener productos formas diferentes (distintas muestras de tamaño tamaño productos. al obtener una muestra aleatoria de tamaño Planteamiento:.

Se examina en . Nota: Algunos tratadistas simbolizan esta distribución con: Características de la Distribución Hipergeométrica. de las cuales generalmente 5 salen defectuosas.Los parámetros de la distribución Hipergeométrica son entonces: Tamaño de población. En la practica. Por ello hay quienes aplican la forma simplificada ó de recurrencia: Ejemplo En una empresa industrial diariamente se producen 90 unidades de unidad metalmecánica. si cero La función de distribución acumulativa quedará definida entonces por: . Número de elementos de (éxitos). con una caracteristica ó propiedad específica Tamaño de muestra aleatoria extraida. no se aplica el pues su valor tendera a Pueden ser calculos tediosos ó laborosos cuando es grande.

un dia cualquiera una muestra de 5 unidades. para que resolviendo permite definir la tabla de distribución de probabilidad: Calculamos el valor de sus principales medidas características: Media: = Que simplificadamente: Varianza: ó tambien. y que aún de forma mas simplificada: Sesgo: Hacia la derecha ó positivo como se vé graficamente. Hallar la probabilidad de unidades defectuosas. aqui: pues y pues . Además.

Se le llama distribución de los "eventos raros" pues se usa como aproximación a la binomial cuando el tamaño de muestra es grande y la proporción de éxitos es pequeña. Número de personas que llegan a un taller automotriz en un lapso de tiempo específico.. lugares. espacios) . minuto. galón.en piezas similares de un material .) Area: (Segmento de linea. ademas con una probabilidad de ocurrencia pequeña. etc. . pues fue el primero en describirla. Número de interrupciones en servicios de energía en intervalos de un dia. Cantidad de átomos que se desintegran en sustancia radioactiva. Volumen:( Litro. Número de impulsos electrónicos errados transmitidos durante espacio de tiempo específico.DISTRIBUCION DE POISON Notación: X Introducción Llamada asi por su autor Siméon Denis Poisson. probabilista del siglo XIX. Se da un intervalo de medida que divide un todo de números reales y donde el contéo de ocurrencias es aleatorio. Esos intervalos de medida pueden referirse a: Tiempo: (Segundo . dia. semana. Número de accidentes automovilísticos en un cruce específico durante una semana. pulgada cuadrada. etc. Centimetro cuadrado. Criterios ó propiedades 1. etc). Esa división puede ser un subintervalo de medida. se define una variable aleatoria que representa el número de éxitos independientes que ocurren para intervalos de medida específicos ( tiempos. hora.) Ejemplo Número de defectos por . onza. Es una generalización de la distribución binomial cuando sobre un . Número de llamadas telefónicas que ingresan a un conmutador por minuto.

Definición Sea una variable aleatoria que representa el número de eventos aleatorios independientes que ocurren con igual rapidez en un intervalo de medida. se define toda una familia de probabilidades de sea menor ó Poisson. Ejemplo El número promedio de partículas radioactivas que registra un contador en un milisegundo en la realización de un experimento aleatorio es de cinco (5) .2. planteada entonces como: Los resultados de las probabilidades individuales para valores de serán más pequeños conforme la variable aleatoria toma valores cada vez más grandes. son procesos de Poisson. La probabilidad de que un solo resultado ocurra en un intervalo de medida muy corto ó pequeño es la misma para todos los demás intervalos de igual tamaño y es proporcional a la longitud del mismo ó al tamaño de medida. es independiente de los demás intervalos ó subintervalos. y Número de ocurrencias especificas para el cual se desea conocer la probabilidad respectiva. 3. La probabilidad de que una variable aleatoria de Poisson igual a un valor de se halla por la función de distribución acumulativa. se dice. 4. se expresa por: Donde es parámetro de tendencia central de la distribución y representa el número promedio ó cantidad esperada de ocurrencias (éxitos) del evento aleatorio por unidad de medida ó por muestra. El número de ocurrencias ó de resultados en el intervalo ó subintervalo de medida. Procesos que se ajustan a estos criterios. por eso se dice que el proceso de Poisson no tiene memoria. Se tiene entonces que la función de probabilidad de esta variable. La probabilidad de que más de un resultado ocurra en un intervalo ó subintervalo corto es tan pequeña que se considera insignificante (cercana ó igual a cero). Segun sea el valor de de .

partículas. dando: y valores de más grandes pero con probabilidad mas pequeña. el cual debe ser conocido. Veamos una gráfica de funciones de probabilidad para . diferentes valores de Se puede calcular un coeficiente de asimetría mediante la expresión observar que mientras en una distribución binomial: puede dar que Alternativa: Si se da la probabilidad de tener. Acudiendo a las tablas existentes para tal fín ó a los medios electrónicos. Es de en Poisson se ocurrencias en un intervalo veces mayor que el de refencia en la medición entonces la distribución de probabilidades de Y número de éxitos en la nueva unidad de referencia viene dada por . de manera exacta. Hallar la probabilidad de que se registre distinto número de partículas en un mismo milisegundo. se llega a construir la tabla de distribución de probabilidades. Se nota el y y no es tan sesgada a la derecha por el punto de inflexión entre valor Características de la distribución de Poisson Valor Esperado: Varianza: Forma ó sesgo: Hacia la derecha ó con sesgo positivo y que se va perdiendo a medida que crece.

Como ejemplo este caso se pueden considerar variables tiempo. Hallar la probabilidad de que en 15 minutos se reciban exactamente 20 pulsos.Función de densidad y acumulativa. Esto es. Definición de variable aleatoria continua. es decir. el conjunto es un intervalo sobre . Distribuciones uniforme y exponencial. que una frecuencia de 6 pulsos por minuto es eqyivalente a una de 1 por minutos.donde Promedio de ocurrencias por intervalo ó unidad de medida Número de intervalos ó unidades de medida considerada en X y especificados. Valor esperado.CASO CONTINUO Una variable es llamada continua si toma todos sus valores sobre un intervalo de la recta real. edad y estatura. Aplicaciones de modelos de variables aleatorias continuas. Distribución normal. FUNCION DE DENSIDAD . Aqui Ejemplo y El número de pulsos que llegan a un contador GEIGER se presentan en promedio de 6 pulsos por minuto.

Esta es una función integrable que satisface que como se puede observar en la figura 1. Este teorema nos sirve para determinar cuando una función integrable sobre es una función de densidad de alguna variable aleatoria continua Ejemplo Sea una función sobre dada por .Sea una variable aleatoria definida sobre La tal que función de densidad es dada por alguna función integrable sobre para evento Teorema todo Sea una variable aleatoria definida sobre y satisface: . Toda función que es integrable sobre es la función de densidad de alguna variable aleatoria continua . para todo .

Figura 1. El más comun promedio utilizado en estadística es la media o valor esperado o esperanza matemática. Sea sobre una variable aleaoria definida sobre . el promedio de edad de los trabajadores de una empresa. defina por y sea una función real definida Caso continuo . entre otros. el promedio de temperatura en Agosto. El objetivo de esta seccióon es mostrar algunas características numéricas de una distribución poblacional. Nosotros escuchamos el promedio de lluvia en una ciudad en un año. Gráfico de función de probabilidad Además Sea el evento A= como entonces la probabilidad de A puede ser calculada VALOR ESPERADO Los promedios son parte de nuestro diario vivir.

puesto que: = para en otro caso. " Sea la variable aleatoria X que puede asumir valores con idéntica probabilidad. Si es una variable aleatoria continua y la función de densidad o el valor . cada una de las seis caras posibles conforman el espacio muestral: La v. . Así por ejemplo cuando se lanza un dado correcto.a X: número de puntos en la cara superior del dado tiene una distribución de probabilidad Uniforme discreta. entonces se define la media de por esperado de DISTRIBUCION UNIFORME Notación: X UD( ) Definición Es la más simple de todas las distribuciones modelo y en ella la variable aleatoria asume cada uno de los valores con una probabilidad idéntica. Entonces la distribución uniforme discreta viene dada por: O sea que el parámetro clave en esta distribución es =número de valores que asume la variable aleatoria X y que sería un parámetro de contéo.Suponga que de .

El valor esperado y varianza de una distribución discreta uniforme se obtienen así: Valor esperado ( ) Varianza ( Para el caso del lanzamiento del dado: el valor esperado y la varianza del número de puntos en la cara superior son: Ejercicio .a. discreta. es en este caso la altura de Planteemos sus características principales de tendencia central y dispersión.La representación gráfica de esta distribución de probabilidad puede hacerse con un histograma para v.

la cual indica el número de veces que ocurre un evento en una unidad de tiempo. que Lo que permite construir la función de distribución acumulada así: . Es decir. Esa selección se hace al azar utilizando papeleta con números.(Walpole. a. pág 122) Selección de un empleado entre equipo de 10 con el fin de supervisar un proyecto especifico.? y DISTRIBUCION EXPONENCIAL Notación: Introducción Antes de introducir la variable exponencial puede mirarse un origen natural de ésta a partir de una variable aleatoria Poisson.Cuál es la probabilidad de que el número de la papeleta seleccionado sea menor de 4? ( b.Cuál es la media y la varianza de la distribución de probabilidad del número de la papeleta. en el periodo hasta el tiempo está dada por: De esta manera. Si se escribe la función de probabilidad Poisson de la siguiente manera: la probabilidad de que no ocurra algún evento. puede definirse ahora una variable aleatoria continua mide el tiempo que tarda en ocurrir el primer evento de Poisson.

por ejemplo. distancia entre eventos. cantidad de metros de carretera que deben recorrerse hasta que aparezca el primer bache. etc.Al derivar. se tiene la función de densidad de la variable Definición La variable aleatoria que es igual a la distancia (o tiempo) entre ocurrencias tiene una distribución sucecesivas de un proceso Poisson con media exponencial con parámetro Función de densidad de Probabilidad: Valor esperado: Observaciones: Varianza: 1. cantidad de que deben inspeccionarse en una hacienda hasta que aparezca el primer cafetal de broca. En la definición de la variable aleatoria exponencial. ésta se plantea como tiempo que tarda en ocurrir el primer evento Poisson. Sin embargo. esta definición puede hacerse extensiva a las demás unidades de medición consideradas en los eventos de Poisson. con respecto a aleatoria exponencial . 2. volumen entre eventos. Ejemplo Supóngase que la duración de los instrumentos electrónicos D distribuciones Exponenciales asi : D D y D tienen . En el lenguaje de las aplicaciones también se utiliza la distribución exponencial para modelar tiempo entre eventos.

El instrumento dos tiene mayor probabilidad de tener duración de 45 o más horas.Proporciona la base de la inferencia estadística clásica debido a su relación con el teorema del límite central. la mediana y la moda tienen el mismo valor cuando la variable aleatoria se distribuye normalmente. 2. Es decir. DISTRIBUCION NORMAL Importancia de la distribución normal La distribución normal es de suma importancia en estadística por tres razones principales: 1.33 desviaciónes estándar.Numerosas variables continuas de fenómenos comportarse probabilisticamente mediante ésta.Su grafica tiene forma acampanada. es decir. 3. el alcance intercuartil está contenido dentro de un intervalo de dos tercios de una desviación estándar por debajo de la media a dos tercios de una desviación estándar por encima de la media. Propiedades de la distribución normal 1. Comprueba los anteriores resultados utilizando la función de distribución.Es el límite al que convergen tanto variables aleatorias continuas como discretas.El valor esperado.Su dispersión media es igual a 1. 3. . aleatorios tienden a 2. en cada caso.Cual se debe preferir para usarlo durante un periodo de 45 horas? Debería preferirse aquel instrumento que de mayor garantía de duración para un mínimo de tiempo como el requerido. debe calcularse la probabilidad de que el instrumento dure por lo menos 45 horas.

donde Así.El dominio de la variable aleatoria normalmente distribuida generalmente caerá dentro de 3 desviaciones estándar por encima y por debajo de la media. 4.71828 es la constante matemática aproximada por 3. . se donde es la constante matemática aproximada por 2.14159 Parámetros es cualquier valor de la variable aleatoria continua. A continuación se presentan las gráficas de las funciones de densidad Normal con el objetivo de observar cambios en la distribución de probabilidad: .Sus mediciones de tendencia central tienen bastante parecido. algunas de las variables que observamos sólo pueden aproximar estas propiedades. Así que si el fenómeno puede mediarse aproximadamente mediante la distribución normal se tendrá: 1. 2. El modelo matemático El modelo o expresión matemática que representa una función de densidad de probabilidad se denota mediante el símbolo tiene la siguiente función de probabilidad.En la práctica.Que el polígono puede verse en forma de campana y simétrico.El valor intercuartil puede diferir ligeramente de 1.33 desviaciones estándar. Para la distribución normal. 3.

se pueden listar otras . pero cambia la varianza. Ejemplo: caso 2: Cuando se mantiene la misma varianza.caso 1: Cuando se mantiene la misma media. al examinar la primera y segunda derivada de propiedades de la curva normal: . pero cambia la media. Ejemplo: ( y ) Ahora.

.La moda.1. Función de Densidad Normal (0. 2.La curva tiene sus puntos de inflexión en si . 4. ésta se puede llevar a un nuevo conjunto de observaciones de una variable aleatoria normal con media cero y varianza 1.La curva es simétrica alrededor de un eje vertical a través del valor esperado .1) Gráfico 6. A dicha transformación se le conoce como estadarización de la variable aleatoria normal : Definición La distribución de probabilidad de una variable aleatoria normal con media cero y varianza 1 se llama distribución normal estándar. es cóncava hacia abajo 3. que es el punto sobre el eje horizontal donde la curva es un máximo ocurre cuando . .La curva normal se aproxima al eje horizontal de manera asintótica conforme nos alejamos de la media en cualquier dirección. y es cóncava hacia arriba en cualquier otro punto. Haciendo una transformación a la variable aleatoria normal .

Por ejemplo.En la distribución normal estándar se sabe que las áreas se distribuyen de la siguiente manera: Función de Densidad Normal (0. Así pues.07 y es 0. para leer el área de probabilidad bajo la curva hasta .9418.1) Manejo de tablas La tabla anexa representa las probabilidades o áreas bajo la curva normal calculadas hasta los valores partículares de interés (Transformados). leemos esta fila hasta que intersecamos la columna que contiene el lugar de centésimas del valor ( ). nos tabla hasta que ubiquemos el valor de interés detenemos en la fila . Al observar la tabla se observa que todos los valores deben registrarse primero con hasta dos lugares decimales. en el cuerpo de la tabla.5 con la columna z=0. podemos recorrer hacia abajo la columna Z de la (en décimas). . la probabilidad tabulada para z=1. A continuación.57 corresponde a la intersección de la fila z=1. Por tanto.

Si una variable aleatoria tiene una varianza o desviación estándar pequeña. el área entre cualesquiera dos números es la probabilidad de que la variable aleatoria tome un valor entre estos números.k σ (x + µ)2 ƒ (x) dx + µ+ k σ∫∞ (x + µ)2 ƒ (x) dx .κ σ < X < µ + κ σ) ≥ 1 – 1–κ2. por lo tanto.k σ∫ µ+ k σ (x + µ)2 ƒ (x) dx + µ+ k σ ∫∞ (x + µ)2 ƒ (x) dx ≥ -∞∫ µ. En el histograma de probabilidad. Por lo tanto. Teorema de Chebyshev: La probabilidad de que cualquier variable aleatoria X. L. una desviación estándar pequeña debería tener la mayor parte de su área cercana a µ. Es decir P (µ . Como el área bajo una curva de distribución de probabilidad. suma 1. tome un valor dentro de la κ desviaciones estándar de la media es al menos 1 – 1 / κ2. Chebyschev (1821–1894) descubrió que la fracción de área entre cualesquiera dos valores simétricos alrededor de la media esta relacionada con la desviación estándar. la probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo alrededor de la media es mayor que para una variable aleatoria similar con una desviación estándar mayor si pensamos en la probabilidad en términos de una área. esperaríamos una distribución continua con un valor grande de σ que indique una variabilidad mayor y. El área se extiende mucho más que. o de un histograma de probabilidad. esperaríamos que el área este extendida.k σ (x + µ)2 ƒ (x) dx + µ. Lo cual indica una distribución mas variable de mediciones o resultados el matemático ruso P. Podemos argumentar lo mismo para una distribución discreta.Teorema de Chebyshev. debido a Chebyshev da una estimación conservadora de la probabi8lidad de que una variable aleatoria tome un valor dentro de κ desviaciones estándar de su media para cualquier numero real κ proporcionaremos la demostración solo para el caso continuo y se deja el caso discreto como ejercicio. El siguiente teorema. Prueba: por nuestra definición anterior de la varianza de X escribimos σ2 = E [ (X .µ)2] = -∞∫∞ (x + µ)2 ƒ (x) dx = -∞∫ µ. esperaríamos que la mayoría de los valores se agrupan alrededor de la media. Sin embargo.

Una variable aleatoria X tiene una media µ = 8 una varianza σ 2 = 9.k σ k2 σ2 ƒ (x) dx + µ+ k σ ∫∞ k2 σ2 ƒ (x) dx Y que -∞ ∫ µ. El uso del teorema de Chebyshev se restringe a situaciones donde se desconoce la forma de la distribución.µ | ≥ k σ.κ σ < X < µ + κ σ) = µ.8 < 6) = 1 – P [8 – (2) (3) < X < 8 + (2) (3)] 8 < 6) ≤ ¼.8 | ≥ 6).µ)2 ≥ k2 σ2 en ambas integrales restantes se sigue que σ2 ≥ -∞ ∫ µ. es decir tres cuartos o mas de las observaciones de cualquier distribución yacen en el intervalo una µ ± 2 σ.8 | ≥ 6) = 1 – P (| X . Es decir. Solución a) P (−4 < X < 20) = P[ 8 – (4) (3) < X < 8 + (4) (3) ] ≥ 15/14 b) P (| X . Por lo cual queda establecido el teorema. sabemos que la probabilidad de una variable aleatoria que cae dentro de dos desviaciones estándar de la media no puede ser menor que 3/4. por esta razón los resultados son generalmente débiles el valor que el teorema proporciona es solo un limite inferior.’‘’ . y distribución de probabilidad desconocida. b) P (| X . De aquí P (µ . Para k = 2 el teorema establece que la variable aleatoria x tiene una probabilidad de al menos 1 – 1 /22 = 3/4 de caer dentro de dos desviaciones estándar de la media. EJEMPLO: 1..8 | < 6) = 1 – P (. Encuentre a) P (−4 < X < 20). El teorema de Chebyshev tiene una valides para cualquier distribución de observaciones y. Por esta razón llámanos al teorema resultado de distribución libre cuando se supongan distribuciones específicas. el teorema que al menos ocho novenos de las observaciones de cualquier distribución caen en el intervalo µ ± 3 σ.k σ∫ µ+ k σ ƒ (x) dx ≥ 1 – 1_κ2.Ya que la segunda de las tres integrales es no negativa así como | x .6 < X . pero nunca sabemos cuanto podría ser en realidad únicamente cuando se conoce la distribución de probabilidad podemos determinar probabilidades exactas. De manera similar. para cualquier x ≥ µ + k σ o x ≤ µ .k σ ƒ (x) dx + µ+ k σ ∫∞ ƒ (x) dx ≤ 1_κ2.k σ tenemos que (x .

. no disponemos de la desviación standard de la población. sino de una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos calcular Z. en lugar de m.Distribución T de Student En la generalidad de los casos. Nótese que utilizamos S. la Desviación Standard de una Muestra. 2. El estadístico T tiene una distribución que se denomina distribución T de Student.. que está tabulada para 1. porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad. En estos casos calculamos el estadístico T: con donde S es la desviación standard muestral. etc. calculada con n-1 grados de libertad. 3.. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación standard de la población. . grados de libertad de la muestra con la cual se calculó la desviación standard. la Desviación Standard de la Población.

un método para hacer esta prueba es el de bondad de ajuste o chi-cuadrado. en la medida que aumentemos el número de observaciones de la muestra. la realidad coincidirá perfectamente con la teoría y por el contrario. Sea m el número de clases y nj el número de observaciones en cada clase (frecuencias observadas). Las diferencias entre lo observado y lo esperado dan las discrepancias entre la teoría y la realidad. La información debe estar presentada en un cuadro de distribución de frecuencias. Si no hay diferencias. Los pasos a seguir son: Hipótesis H0 : La variable tiene distribución X con tales parámetros H1 : La variable no tiene la distribución X Estadistica de Trabajo . la desviación standard calculada estará mas próxima a la desviación standard de la población y entonces la distribución T correspondiente se acerca a la distribución normal standard. Cuando los grados de libertad tienden a infinito. El uso de la distribución T presupone que la población con que estamos trabajando tiene una distribución normal. Se trata de comparar los valores o frecuencias observadas (nj ) con las frecuencias que habría en cada grupo o clase o sea el valor esperado (ej ) si se cumple la hipótesis nula (H0 ). si las diferencias son grandes indica que la realidad y la teoría no se parecen. la distribución T tiende a coincidir con la distribución normal standard. Es decir.La distribución T es mas ancha que la distribución normal tipificada Para un número de grados de libertad pequeño. Distribucion X2(CHI-CUADRADA) En algunos casos se necesita probar si una variable o unos datos siguen determinada distribución de probabilidad.

La regla de decisión se observa en la figura 3.20 Regla de decisión: prueba bondad de ajuste .(3. Si esto no ocurre se unen las clases adyacentes hasta cumplir el requisito. Al unir las clases se disminuirán los grados de libertad de la chi-cuadrado.15) nj : frecuencia observada en la muestra ej : frecuencia esperada según la distribución teórica n: tamaño de la muestra Nota. Figura 3. El número de observaciones esperadas en cada clase debe ser mayor o igual a 5. ej 5. es decir.20.

pero su asimetría disminuye cuando aumentan los grados de libertad del numerador y denominador. Hay una distribución F por cada par de grados de libertad. Parámetros: Grados de libertad asociados al numerador y denominador • • • ¿Cómo se deduce una distribución F? • Extraiga k pares de muestras aleatorias independientes de tamaño n < 30. . CARACTERISTICAS • Una variable con distribución F es siempre positiva por lo tanto su campo de variación es 0 " F " " La distribución de la variable es asimétrica. extraídas de una población normal.DISTRIBUCIÓN F DE FISHER Considerando dos muestras aleatorias independientes. de tamaño n1 y n2. el estadístico F será DEFINICIÓN Una variable F se define como el cociente entre dos variables ji-cuadrado divididas por sus correspondientes grados de libertad.

do http://www.• Calcule para cada par el cociente de variancias que proporciona un valor de F.edu.unal.co/cursos/sedes/manizales/4030006/docs_curso/cont enido.com/distribuciones-de-probabilidad_1.virtual.unal.html .co/unvPortal/courses/searchCoursesByName.http://html. Graficar los valores de F de los k pares de muestras.virtual.html http://www. • Distribución F para diferentes grados de libertad Bibliografia.edu.rincondelvago.

UNIDAD 3 ESTIMACIÓN Y PRUEBA DE HIPÓTESIS .

y dicha probabilidad no es nula para ningún elemento. (En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilistico. consiguientemente. aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y. todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Es decir. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: El método otorga una probabilidad conocida de integrar la muestra a cada elemento de la población.) .-Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. los más recomendables. por ejemplo los estudios de caso-control. Los métodos de muestreo no probabilisticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.1. por tanto. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son. donde los casos no son seleccionados aleatoriamente de la población.

. El número i que empleamos como punto de partida será un número al azar entre 1 y k. tablas de números aleatorios. Este procedimiento. pero en lugar de extraer n números aleatorios sólo se extrae uno. números aleatorios generados con una calculadora u ordenador. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres.Entre los métodos de muestreo probabilísticos más utilizados en investigación encontramos: • • • • Muestreo aleatorio simple Muestreo estratificado Muestreo sistemático Muestreo polietápico o por conglomerados Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa. numerar todos los elementos de la población. atractivo por su simpleza. i+3k. i+k.. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede . i+2k.. si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres. siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. Muestreo aleatorio sistemático: Este procedimiento exige. es decir se toman los individuos de k en k.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Se parte de ese número aleatorio i.i+(n-1)k. etc. no podría haber una representación de los dos sexos. que es un número elegido al azar.. como el anterior. y los elementos que integran la muestra son los que ocupa los lugares i.

. Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población. el estado civil. edades. pues exige un conocimiento detallado de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad. es decir. por ejemplo.). a la que llamamos conglomerado. por ejemplo. y puede ser de diferentes tipos: Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales. La distribución de la muestra en función de los diferentes estratos se denomina afijación. Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados. Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. En otras ocasiones se pueden utilizar conglomerados no naturales como. etc. etc. que las unidades muéstrales son los elementos de la población. los departamentos universitarios. Cada estrato funciona independientemente. son conglomerados naturales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". las urnas electorales. el municipio de residencia. (Tamaño geográfico.estratificar. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. según la profesión. Las unidades hospitalarias. Tiene poca aplicación ya que no se suele conocer la desviación.. pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. . el sexo.. de modo que se considera la proporción y la desviación típica. sexos. una caja de determinado producto.. En ocasiones las dificultades que plantean son demasiado grandes.

. este número lo tomaríamos como estimativo de .-ESTIMACIÓN PUNTUAL Si a partir de las observaciones de una muestra se calcula un solo valor como estimación de un parámetro de la población desconocido. Decimos que 6´2 es una estimación puntual de . Sea X la variable aleatoria que indica la nota obtenida por cada estudiante. el procedimientose denomina estimación puntual. Por ejemplo queremos estimar la nota media de los alumnos de bachiller en la asignatura de matemáticas que notaremos .2. Si al tomar una muestra de 100 estudiantes obtenemos que la media es 6´2. Tomamos una muestra de tamaño n y denotamos la nota media de la muestra.

se define como el valor esperado de (T.)2 . lo que quiere decir que T tiende a producir respuestas numéricas próximas al parámetro . Para indicar que T es un estimador del parámetro Con esto queremos decir que empleamos la expresión dada mediante T para obtener valores próximos al valor del parámetro.consistencia y suficiencia. PROPIEDADES DE UN ESTIMADOR Existe una propiedad que comprende conjuntamente las propiedades de insesgamiento y eficiencia. debemos aceptar que hay una tendencia para que los valores (T. Para poder utilizar la información que se tenga de la mejor forma posible. eficiencia. Una es la “fuerza” o intensidad con la que tiende a dar esos valores(insesgamiento) y la otra es la “fuerza” que tenga para no permitir que se aparte de del camino que lo conduce a (eficiencia). pero a menudo hay limitaciones de tiempo y de recursos y se tendrá que trabajar con unas cuántas observaciones. escribimos =T . Sea T un estimador del parámetro . Es muy probable que haya error cuando un parámetro es estimado. Esta dos condiciones matemáticamente quedan establecidas y precisadas en el teorema siguiente: TEOREMA Si T es un estimador del parámetro .) sean pequeños.). se necesita identificar las estadísticas que sean “buenos” estimadores. ECM(T) = V[T] – [ -E(T)]2 . y así lo será también la diferencia (T. Hay cuatro criterios que se suelen aplicar para determinar si una estadística es un buen estimador: Insesgamiento. El error cuadrático medio de T. Si éste es pequeño. Se trata del error cuadrático medio.)2] ¿Cuál es la información que nos proporciona el error cuadrático medio? Nos referimos al promedio de los cuadrados de las observaciones. Es cierto que si el número de observaciones al azar se hace suficientemente grande.Un estimador puntual T de un parámetro es cualquier estadística que nos permita a partir de los datos muestrales obtener valores aproximados del parámetro . El poder que tenga T para producir valores próximos a depende de dos condiciones básicas. denotado ECM(T). éstas proporcionarían un valor que casi sería semejante al parámetro. ECM(T) = E[(T.

es decir -E(T).E(T). Para ello debemos tomar aquel que tenga menor error cuadrático medio.)2] = E[T2 . Xn una muestra aleatoria de una población de media desconocida y varianza =81.E(T)]2. Consideremos T1= yT2= como estimadores de la media. Estudiaremos un ejemplo que nos muestra como las dos propiedades anteriores pueden no ser suficientes paradeterminar el mejor estimador: Ejemplo: Sea X1. lo que indica que T tiende a dar valores próximos al parámetro. Pero nosotros pretendemos es contar con criterios que garanticen una buena selección del estimador.. Supongamos que tenemos que escoger uno de los dos estimadores.2 E(T) + 2 = (E(T2) –[E(T)]2) + ([E(T)]2. De esta expresión deducimos que el error cuadrático medio sera pequeño en la medida que lo sea su varianza y lo mismo ocurra con [ -E(T)]2. . si obtenemos el error cuadrático medio para el primer estimador utilizando el teorema anterior obtenemos haciendo lo mismo para el segundo estimador obtenemos .. el hecho de que -E(T) sea pequeño quiere decir que E(T) tiende al valor a medida que el experimento se repite. X2.Demostración: ECM(T) = E[(T. La diferencia -E(T) se llama sesgo del estimador.2 T + 2 2 ] = E(T2)-E(2 T)+E( 2 2 ) = E(T2) -2 E(T) + E( ) = E(T2) – [E(T)]2 + [E(T)]2 .. . Trabajando con las fórmulas podemos observar que va a depender del valor de la media. Para precisar estos criterios estudiaremos el error cuadrático medio en sus partes y así iniciamos el estudio de la diferencia . sin importar el valor particular del parámetro objeto de estudio. En este ejemplo observamos que para escoger el mejor estimador tendríamos que saber cuál es el verdadero valor de la media poblacional. El valor pequeño de la varianza quiere decir que T presenta poca variabilidad.2 E(T) + ) = V(T) + [ .

.. . . y uno de ellos es Continuando con el ejemplo escogeríamos la media muestral como mejor estimador de la media. TEOREMA: Sea X1. . si se cumple que Volviendo al ejemplo anterior tendríamos que la media muestral es un estimador insesgado de la media de la población mientras queT2 no lo es. entonces escoja el insesgado. También podemos decir que un estimador insesgadoes aquel que tiene sesgo igual a cero. Entonces: . X2.Se dice que una estadística T es un estimador insesgado de E(T)= para cualquier valor de . de esto podemos deducir la siguienteREGLA DE PROCEDIMIENTO: REGLA 1 : Si tenemos T1 y T2 estimadores del parámetro insesgado. Los siguientes gráficos ilustran el significado de estimador insesgado y estimador sesgado .. y es un estimador insesgado de b)T2=S2 es un estimador insesgado de La propiedad de insesgamiento nos garantiza que las estimaciones que hagamos con el estimador se encuentran alrededor del parámetro en cuestión. Xn una muestra aleatoria de cierta distribución de media varianza a)T1= .

la probabilidad de que se acerque al parámetro va siendo mayor. Tenemos que tener en cuenta otras propiedades de los estimadores consistencia y eficiencia. Un estimador T del parámetro es suficiente cuando es capaz de sustraer de la muestra toda la información que ésta contengaacerca del parámetro. . cuando Es decir un estimador es consistente si a medida que aumenta el tamaño de la muestra. ambos insesgado. . La consistencia se refiere al comportamiento de un estimador. a medida que la muestra se va tomando de un tamaño mayor. así llegamos a la SEGUNDA REGLA DE PROCEDIMIENTO : REGLA 2 : Si tenemos T1 y T2 estimadores del parámetro entonces escoja el de menor varianza. si se cumple que . T es un estimador consistente para n tiende a infinito.Una vez que tenemos dos estimadores con el mismo sesgo deberíamos tener otra regla que nos permita elegir uno en lugar del otro.

por ejemplo. Nos proponemos determinar dos números entre los cuales se halla el parámetro estudiado con cierta certeza. Llegamos a que y A partir de estas ecuaciones obtenemos a = yb= . Sabemos que si X sigue una normal de media y varianza entonces la media muestral sigue una normal de la misma media y de varianza la varianza poblacional partida por n. Con lo que obtendríamos . . Ejemplo Tratamos de obtener un intervalo de confianza para la media de una población normal.-ESTIMACIÓN POR INTERVALOS DE CONFIANZA.3. la media . En realidad hay infinitos pares de números para los que se cumple la ecuación anterior. Vamos a determinar a y b tales que P[a< <b]=0´95. El procedimiento para obtener un intervalo (de confianza) para un parámetro. requiere de la determinación de un estimador del parámetro y de la distribución del estimador. De éstos vamos a escoger el par de números que se hallan situados simétricamente respecto de cero en la distribución normal. Para calcular estos valores es necesario estandarizar X: = 0´95. tamaño de la muestra. Por lo tanto = 0´95.

se llama longitud del intervalo. Un intervalo de confianza para un parámetro es un intervalo construido alrededor del estimador del parámetro de tal manera que podemos esperar que el verdadero valor del parámetro quede incluido en dicho intervalo. El valor 1´96 se debe a que pedíamos una probabilidad de 0´95.)=0´95. se llama intervalo (aleatorio) de confianza para A partir de los datos muestrales podemos determinar el valor de y obtenemos así un intervalo numérico. (1. Para indicar el intervalo para cualquier valor de probabilidad podemos utilizar la expresión . Esta situación la representaremos en el siguiente gráfico: .En general el nivel de confianza se expresa en la forma 100(1. En el ejemplo el nivel de confianza es del 95%. El intervalo . Expresión que puede simplificarse . El nivel de confianza de un intervalo es una probabilidad(expresada en porcentaje) que representa la seguridad de que el intervalo encierra el verdadero valor del parámetro . .O lo que es lo mismo .)%. El valor representa la probabilidad de que el parámetro quede fuera del intervalo y en este caso es 0 ´5.

/2)% ya que la porción de área que no será cubierta por el intervalo debe tener una medida de tamaño y se toma como norma general de procedimientoque se reparta en partes iguales entre las dos colas. Los tres conceptos básicos que encierra un intervalo quedan resumidos en la expresión general para un intervalo de confianza: ESTIMADOR Ejemplo: Sea X la variable aleatoria que se utiliza para designar el peso de un pasajero de avión y que interesa conocer . Para ello tomamos una muestra de 36 pasajeros y obtenemos una media muestral de 160 libras. Calcula el intervalo del 95% de confianza. t .) .Para cada nivel de confianza existe un valor de tabla ( normal. (ERROR ESTÁNDAR) . el peso medio de todos los pasajeros. F) asociado al nivel de confianza dado. Este valor se llama coeficiente de confiabilidad y se denota: NORMAL DISTRIBUCIÓN T JI CUADRADO DISTRIBUCIÓN F Si queremos un intervalo con un nivel de confianza de 100(1. Supongamos que la distribución de los pasajeros sea normal con desviación estándar 36. (COEF.)%. DE CONF.. . en la tabla correspondiente buscaremos un valor de variable para el que el área de cola superior(también inferior) sea del 100(1.

Tenemos las siguientes propiedades sobre la longitud del intervalo: PROPIEDAD 1. el nivel de confianza debe ser alto. reemplazamos los valores (1´96). una probabilísticay otra práctica. Estas propiedades se deducen de la expresión de la longitud del intervalo L= .(30/6). Como podemos ver si la varianza se considera fija la fórmula está sujeta a dos números cuyas acciones se contraponen en cuanto a la longitud.168´23]. Suelen presentarse dos interpretaciones para un intervalo de confianza.169 Si nos hubieran pedido un intervalo del 90% de confianza tendríamos 160 ´645). Para un nivel de confianza y una varianza dadas cuando el tamaño de la muestra aumenta la longitud del intervalo disminuye. Por lo tanto el intervalo pedido es: [150´2.(30/6).172´88].. el nivel de confianza y el tamaño de la muestra. (1 Podríamos construir también un intervalo de confianza del 99% obteniendo 160 (2´575). Al observar los intervalos podemos notar que a medida que se aumenta el nivel de confianza la longitud del intervalo también aumenta como podemos ver en la figura. Veamos cómo son en el caso de la media: Desde un punto de vista de la probabilidad se dice: “En el muestreo aleatorio simple de una población normal de media y varianza conocida. el . . Para un tamaño de muestra y una varianza dada a medida que aumenta el nivel de confianza también lo hace la longitud del intervalo PROPIEDAD 2.El intervalo está dado por la expresión y obtenemos 160 ´8]. Para que un intervalo sea tomado en cuenta con algún interés.(30/6). Y el intervalo sería [147´13. Y el intervalo pedido es [151´78.

de 100 intervalos obtenidos por la fórmula anterior 95 de ellos contendrán el verdadero valor del parámetro. EJERCICIO 3 EJERCICIO 2 EJERCICIO 1 . De la interpretación probabilística se desprende la práctica que se establece así: ”Si se realiza un muestreo aleatorio simple en una población normal con media y varianza conocida . 95 de ellas(aproximadamente) producirán intervalos que contendrán el verdadero peso promedio . MEDIA POBLACIÓN NORMAL VARIANZA CONOCIDA O VARIANZA DESCONOCIDA Y N>30 POBLACIÓN NORMAL VARIANZA DESCONOCIDA Y N<30 DIFERENCIA POBLACIONES NORMALES INDEPENDIEN TES. incluirá la media desconocida Aplicando esto al ejemplo anterior podemos decir que de 100 muestras de tamaño 36 que escojamos de los pasajeros del avión.100(1- )% de todos los intervalos de la forma ”. O lo que es lo mismo. se tiene el 100(1)% de confianza de que el intervalo particular desconocido ” contendrá el verdadero valor del parámetro En el ejemplo diremos que tenemos una confianza o certeza del 95% de que el verdadero peso promedio de los pasajeros del avión está entre 150´2 y 169´8 libras.

DE MEDIAS POBLACIONES NORMALES INDEPENDIEN TES. COCIENTE MUESTRAS DE INDEPENDIEN VARIANZAS TES DE POBLACIONES NORMALES b= .VARIANZAS CONOCIDAS. VARIANZAS IGUALES DESCONOCIDA S SE RECOMIENDA PROPORCIÓ EL USO DE N ESTA FÓRMULA EN MUESTRAS DE TAMAÑO GRANDE DIFERENCIA DE PROPORCIO NES SE RECOMIENDA EL USO DE ESTA FÓRMULA EN MUESTRAS DE TAMAÑO GRANDE POBLACIONES NORMALES EJERCICIO 5 EJERCICIO 4 EJERCICIO 6 VARIANZA EJERCICIO 7 EJERCICIO 8 .

El resultado del test puede ser “rechazar H0 en favor de H1 ” o “no rechazar H0” (también puede “no hacerse nada” y pedir más datos antes de decidir). Por otro lado. disminuyendo la distorsión que pudieran producir sus propios deseos o gustos. etc.Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación hecha sobre el valor de uno o más parámetros poblacionales. se define la hipótesis alternativa (H1). En principio se establece una hipótesis nula (H0) y se analiza si la información estadística obtenida es suficiente o no para rechazarla. El uso y formulación correcta de las hipótesis le permiten al investigador poner a prueba aspectos de la realidad. sobre mejoras introducidas (por ej.5. que sería la afirmación a “aceptar” cuando la H0 es rechazada. Pueden ser sometidas a prueba y demostrarse como probablemente correctas o incorrectas sin que interfieran los valores o creencias del individuo. sobre la independencia (o correlación) de distintas variables. en tratamientos o procesos). .-Pruebas de hipótesis Generalidades e importancia de los ensayos de hipótesis. sobre la forma específica de la distribución de una determinada característica.

Por lo general. < 50 cm/s H1. En esta situación. lo que se desea es formular una hipótesis alternativa unilateral. . 50 cm/s. tales como las especificaciones de diseño o ingeniería. se conoce como hipótesis nula. El interés se centra sobre la rapidez de combustión promedio. entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro. recibe el nombre de hipótesis La proposición Ho. la proposición alternativa. el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones. ó H1. o de obligaciones contractuales. Puede ser resultado de la experiencia pasada o del conocimiento del proceso. Cuando el valor del parámetro proviene de consideraciones externas. mientras que H1. el objetivo de la prueba de hipótesis es verificar la teoría o modelo. 2. el interés recae en decir si la rapidez de combustión promedio es o no 50 cm/s. De manera específica. = 50 cm/s 50 cm/s = 50 cm/s. = 50 cm/s Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio. 3.Hipotesis nula o Hipotesis alterna Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones. > 50 cm/s = 50 cm/s Ho. Esto puede expresarse de manera formal como Ho. En este caso. Puesto que la hipótesis alternativa especifica valores de que pueden ser mayores o menores que 50 cm/s. el valor del parámetro de la población especificado en la hipótesis nula se determina en una de tres maneras diferentes: 1. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo estudio. H1. también se conoce como hipótesis alternativa bilateral. Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. como en Ho. no proposiciones sobre la muestra. En algunas situaciones.

Usualmente esto es imposible en muchas situaciones prácticas. Los procedimientos de prueba de hipótesis dependen del empleo de la información contenida en la muestra aleatoria de la población de interés. si bien se une otros valores. entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado. La hipótesis alternativa.- . Esta probabilidad. es la afirmación contradictoria a Ho. Si por ejemplo se escoge el nivel de significación 0. lo cual quiere decir que tal hipótesis tiene una probabilidad 0. tenemos un 95% de confianza de que hemos adoptado la decisión correcta. es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada. es frecuente un nivel de significación de 0. representada por H1. En tal caso decimos que la hipótesis ha sido rechazada al nivel de significación 0.05 ó 0.05.01. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con certidumbre. Si esta información es consistente con la hipótesis. La hipótesis nula se rechaza en favor de la hipótesis alternativa. de manera que los resultados obtenidos no influyan en nuestra elección. sin embargo si esta información es inconsistente con la hipótesis. suele especificar antes de tomar la muestra. la "creencia a priori"). la máxima probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error de tipo I.05 (ó 5%) al diseñar una regla de decisión. Niveles de Significación.Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el nombre de prueba de hipótesis. a menos que pueda examinarse a toda la población. Es decir. y ésta es la hipótesis del investigador. La hipótesis nula. se llama nivel de significación. se continúa creyendo en la validez de la hipótesis nula. Entonces. En la práctica. se concluye que esta es falsa. representada por Ho.Al contrastar una cierta hipótesis. Si la muestra no contradice decididamente a Ho. se concluye que ésta es verdadera. denota a menudo por se. sólo si la evidencia muestral sugiere que Ho es falsa. es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir. las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho. Por tanto. Regla de decisión.05 de ser falsa.

porque para cualquier tamaño de la muestra. En ambos casos.El promedio aritmético poblacional es un indicador muy importante. si aceptamos una hipótesis que debiera ser rechazada. diremos que se cometió un error de tipo II. y no es una cuestión sencilla. Esta regla especifica la acción a tomar para cada resultado muestral posible. se ha producido un juicio erróneo. y debe alcanzarse un compromiso que disminuya el error más grave. En la práctica. un tipo de error puede ser más grave que el otro.Si rechazamos una hipótesis cuando debiera ser aceptada. ha aumentado o ha disminuído. por lo tanto. Pruebas de Hipótesis para la media. A través de la prueba de hipótesis se determina si la media poblacional es significativamente mayor o menor que . diremos que se ha cometido un error de tipo I. Errores de tipo I y de tipo II.Un regla de decisión indica las condiciones bajo las cuales se rechaza la hipótesis nula. frecuentemente se desea probar si dicho promedio ha permanecido igual. La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra que no siempre es posible. Para que las reglas de decisión (o no contraste de hipótesis) sean buenos. Por otra parte. deben diseñarse de modo que minimicen los errores de la decisión. un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo.

algún valor supuesto. Hipótesis Se puede plantear uno de los siguientes tres tipos de hipótesis: - Prueba de hipótesis a dos colas H0 : H1 : =k k

- Prueba de hipótesis a una cola superior H0 : =k ó ó H0 : H1 : k >k

H1 : >k

- Prueba de hipótesis a una cola inferior H0 : =k ó ó H0 : k

H1 : < k

H1 : < k

En las distribuciones en el muestreo se vió que para el caso de la media, hay tres situaciones, por consiguiente la estadística de trabajo a utilizar depende de los supuestos de la población y del tamaño de la muestra. Prueba de hipótesis para la media si la población de donde se obtiene la muestra tiene distribución normal con conocida. La estadística de trabajo a usar corresponde a la expresión (1.6):

(3.1) Donde: (H0). es el valor que se está suponiendo en la hipótesis nula

REGLA DE DECISION - Si se ha planteado la hipótesis alternativa como: H1 : k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia

en la figura 3.1

Figura 3.1 Regla de decisión para una prueba de hipótesis a dos colas. y pertenecen a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir:

- Si se ha planteado la hipótesis alternativa como: H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, como se aprecia en la figura 3.2

Figura 3.2 Regla de decisión para una prueba de hipótesis a una cola superior. pertenece a una distribución normal estándar. Si el valor de

la estadística de trabajo (Zx) es menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

Si se ha planteado la hipótesis alternativa como: H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, como se aprecia en la figura 3.3

Figura 3.3 Regla de decisión para una prueba de hipótesis a una cola inferior. Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

EJEMPLO Un proceso manufacturero usado por una fábrica durante los últimos años da una producción media de 100 unidades por hora con una desviación estándar de 8 unidades. Se acaba de introducir en el mercado una nueva máquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que está ahora en uso, si la media de producción de la nueva máquina es de más de 150 unidades por hora, su adopción daría

Con ésta información qué decisión se debe tomar si se asume un nivel de confianza del 99 por ciento.1 por el planteamiento de la hipótesis alternativa se trabaja a una cola superior. por lo tanto.4. la estadística de trabajo está en la zona de rechazo de la hipótesis nula. Para decidir si se debiera comprar la nueva máquina. solo se compra la máquina si la producción es de mas de 150 unidades por hora.bastantes beneficios. Según el enunciado. por lo tanto se usa la expresión 3. con una confiabilidad del 99 por ciento el valor de Z es 2. se acepta que la producción promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva máquina. En la distribución normal.33. como puede observarse en la figura 3. . Solución . hallándose un promedio de 160 unidades por hora. por lo tanto las hipótesis son: H0 : = 150 H1 : > 150 Para elegir la estadística de trabajo se tiene en cuenta que se conoce la varianza poblacional. a la gerencia de la fábrica se le permite hacer un ensayo durante 35 horas.

para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duración promedio de 45.4 Regla de desición para una prueba de hipótesis a una cola inferior. según experiencias registradas es de 46.96 y 1. como estadística de trabajo se utiliza la expresión 3.050 Teniendo en cuenta que el tamaño de la muestra es grande. Como puede observarse en la figura 3.2 Por la hipótesis alternativa.050 kms. con una confiabilidad del 95 . la regla de decisión es a dos colas. por consiguiente. con una desviación estándar de 3.96. los correspondientes valores de Z son -1.050 46. La tabla a utilizar es la de la distribución normal.050 kms. La estadística de trabajo a usar es la expresión (1. el valor de la estadística de trabajo está en la zona de rechazo de la hipótesis nula. EJEMPLO La duración promedio de las llantas producidas por una fábrica de llantas.Figura 3. Se desea probar si el promedio poblacional ha cambiado.7): REGLA DE DECISION Es la misma que en el caso anterior y depende en todo caso de la hipótesis alternativa. Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n 30 de una población con cualquier distribución.5. Asumiendo un nivel de confianza del 95 por ciento. Solución H0: H1 : = 46.070 kms.

se toma una muestra aleatoria de doce (12) sobres de café de una empacadora. por sobre.97 grs.5 Regla de decisión para una prueba de hipótesis a dos colas Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n<30 .9): (3.8): ) la estadística de (3. con una desviación estándar de 0.por ciento se acepta que la duración promedio de las llantas ha cambiado. La compañía empacadora afirma que el peso promedio mínimo del café es de 16 grs. Se encuentra que el peso promedio del contenido de café de cada sobre es 15. Puede aceptarse ésta . En este caso se tienen dos situaciones.15. • Si se utiliza la varianza sin corregir ( trabajo es la expresión (1.4) EJEMPLO En su calidad de comprador comercial para un supermercado.3) • Si se utiliza la varianza corregida la estadística de trabajo es la expresión (1. dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Figura 3.

afirmación si se asume un nivel de confianza del 90 por ciento? Solución Se desea probar si el peso mínimo es de 16 grs., es decir mayor o igual a 16 grs., así que las hiipótesis adecuadas son: H0 : H1 : 16 < 16

Teniendo en cuenta que el tamaño de la muestra es pequeño, como estadística de trabajo se utiliza la expresión 3.3 Teniendo en cuenta que el tamaño de la muestra es pequeño, como estadística de trabajo se utiliza la expresión 3.3

Como lo indica la hipótesis alternativa, se trabaja a una cola inferior en la tabla de la distribución t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es - 1,363 Como puede observarse (figura 3.6), la estadística de trabajo (0,663) está ubicada en la zona de no rechazo de la hipótesis nula, por lo tanto, con un nivel de confianza del 90 por ciento no se rechaza que los empacadores de café tienen la razón, por lo tanto se concluye que el peso promedio de los sobres de café es mayor o igual a 16 grs.

Figura 3.6 Regla de decisión para una prueba de hipótesis a una

cola inferior

Pruebas de hipótesis para la proporción.Frecuentemente se desea estimar la proporción de elementos que tienen una característica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza información cualitativa y se está interesado en verificar un supuesto acerca de la proporción poblacional de elementos que tienen determinada característica, es útil trabajar con la prueba de hipótesis para la proporción. HIPÓTESIS Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de hipótesis: - Prueba de hipótesis a dos colas H0 : H1 : =k k

- Prueba de hipótesis a una cola superior H0 : =k ó ó H0 : H1 : k >k

H1 : > k

- Prueba de hipótesis a una cola inferior H0 : H1: =k <k ó ó H0 : H1 : k <k

Cuando se va a estimar una proporción el tamaño de la muestra (n) siempre debe ser mayor a 30, por lo tanto se tiene un solo caso. La estadística de trabajo a utilizar es la expresión (1.13):

(3.5) REGLA DE DECISION Si se ha planteado la hipótesis alternativa como: H1: k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.1 y pertenecen a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si < Zp < no se rechaza H0 . - Si se ha planteado la hipótesis alternativa como: H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, vease figura 3.2 pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp < no se rechaza H0 . - Si se ha planteado la hipótesis alternativa como: H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, vease figura 3.3 Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0 . EJEMPLO Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fábrica guardan las formas especificadas. Un exámen de 200 de esas piezas reveló que 160 de ellas no eran defectuosas. Pruebe si lo que

el valor de la estadística de trabajo se encuentra en la zona de rechazo de la hipótesis nula. por consiguiente. correspondiente a Z en la distribución normal es -1.64 el valor Como puede observarse en la figura 3.7.5 Asumiendo una confiabilidad del 95 por ciento.9 < 0. Figura 3.7 Regla de decisión para una prueba de hipótesis a una cola inferior .9 Para realizar una prueba de hipótesis para la proporción se utiliza la expresión 3. con una confiabilidad del 95 por ciento se concluye que la afirmación del fabricante no es cierta.afirma el fabricante es cierto. Solución H0 : H1 : 0.

Prueba de hipótesis a una cola superior H0 : H1 : =k >k ó ó H0 : H1 : k >k . lo cual se hace con la prueba de hipótesis para la varianza.6) . • Si se utiliza la varianza sin corregir ( expresión (1. Hipótesis Se puede plantear uno de los siguientes tres tipos de hipótesis: .Prueba de hipótesis a una cola inferior H0 : H1 : =k <k ó ó H1 : H1 : k <k En este caso se tienen dos situaciones.Prueba de hipótesis a dos colas H0 : H1 : =k k .4): ) la estadística de trabajo es la (3. dependiendo de si se utiliza la varianza muestral sin corregir o corregida.Prueba de hipótesis para la varianza.Es frecuente que se desee comprobar si la variación o dispersión de una variable ha tenido alguna modificación.

por lo tanto. quedando el nivel de significancia ( ) en la parte superior de la distribución.9 . . vease figura 3. Es decir.7) REGLA DE DECISION . en caso contrario se rechaza H0 lo cual implica aceptar H1 .• Si se utiliza la varianza corregida.5): (3. el nivel de significancia ( ) se divide en dos partes iguales. si <T< no se rechaza H0. quedando estos valores en los extremos de la distribución como se aprecia en la figura 3. la estadística de trabajo es la expresión (1. se tiene una prueba de hipótesis a una cola superior. Si el valor de la estadística de trabajo (T) está entre y no se rechaza la hipótesis nula.Si se ha planteado la hipótesis alternativa como: H1 : k se tiene una prueba de hipótesis a dos colas.8 Regla de decisión para una prueba de hipótesis a dos colas y pertenecen a una distribución X2 con (n-1) grado de libertad.Si se ha planteado la hipótesis alternativa como: H1 : > k.8 Figura 3.

pero se cree que últimamente ha aumentado.5 5. Se toma una muestra aleatoria de válvulas a las que se les mide su diámetro. Si el valor de la estadística de trabajo (T) es mayor que Z no se rechaza la hipótesis nula. . en caso contrario se rechaza H0 lo cual implica aceptar H1 .6 5. Es decir. Si el valor de la estadística de trabajo (T) es menor que no se rechaza la hipótesis nula. si T < no se rechaza H0 . quedando el nivel de significancia ( ) en la parte inferior de la distribución.10 Regla de decisión para una prueba de hipótesis a una cola inferior Z pertenece a una distribución X2 con (n-1) grado de libertad.10 Figura 3.9 Regla de decisión para una prueba de hipótesis a una cola superior Z1.4 5.8 5. en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir.5 5.Figura 3. obteniéndose los siguientes resultados en pulgadas: 5.4 5. se tiene una prueba de hipótesis a una cola inferior. si T >Z no se rechaza H0. EJEMPLO Se supone que los diámetros de cierta marca de válvulas están distribuídos normalmente con una varianza poblacional de 0.4 5.7 . vease figura 3.Si se ha planteado la hipótesis alternativa como: H1 : < k.pertenece a una distribución X2 con (n-1) grado de libertad.6 5.4 5.2 pulgadas 2 .

Solución Se cree que la varianza poblacional ha aumentado.2.11 Regla de decisión para una prueba de hipótesis a una cola superior . en la tabla de la distribución chi-cuadrado con 9 grados de libertad. Como puede observarse en la figura 3.6 Asumiendo un nivel de confianza del 95 por ciento.919.2 > 0.11.Con ésta información pruebe si lo que se cree es cierto. por consiguiente con una confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado. Figura 3. es decir es superior a 0. por lo tanto: H0 : H1 : = 0.2 Para realizar esta prueba de hipótesis se utiliza la expresión 3. se obtiene un valor para Z de 16. el valor de la estadística de trabajo se ubica en la zona de no rechazo de la hipótesis nula.

Prueba de hipótesis a dos colas H0 : H1 : = ó ó H0 : H1 : =k k .Prueba de hipótesis a una cola superior H0 : H1 : = > ó ó H0 : H1 : k >k .Prueba de hipótesis para la diferencia de medias. Hipótesis Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hipótesis: .Se tienen dos poblaciones y se toman muestras aleatorias independientes de tamaños n 1 y n 2 . se puede comparar el comportamiento de dichas poblaciones a través de los promedios.

la estadística de trabajo es la expresión (1. .2 pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo está entre y no se rechaza la hipótesis nula. el nivel de significancia ( ) se divide en dos partes iguales.10): (3.. en caso contrario se rechaza H0 lo cual implica aceptar H<sub>1 . en caso contrario se rechaza H o lo cual implica aceptar H 1 . quedando estos valores en los extremos de la distribución como se aprecia en la figura 3. Es decir. por lo tanto. se tiene una prueba de hipótesis a una cola superior.Si se ha planteado la hipótesis alternativa como: H1 : > ó H1 : > k. si las muestras se obtienen de poblaciones con distribución normal.Prueba de hipótesis a una cola inferior H0 : H1 : = < ó ó H0 : H1 : k <k La estadística de trabajo depende de las características de las poblaciones y del tamaño de las muestras. .Si se ha planteado la hipótesis alternativa como: H1 : > ó H1 : > k se tiene una prueba de hipótesis a dos colas.1 y pertenecen a una distribución Normal estándar. con varianzas poblacionales conocidas .Si se ha planteado la hipótesis alternativa como: . Es decir. Si el valor de la estadística de trabajo es menor que se acepta la hipótesis nula. Prueba de hipótesis para la diferencia de medias.9) REGLA DE DECISION . quedando el nivel de significancia ( ) en la parte superior de la distribución. como se aprecia en la figura 3.

500 El tamaño de las muestras es grande y las varianzas poblacionales son conocidas. quedando el nivel de significancia ( ) en la parte inferior de la distribución.600. por lo tanto: H0 : H1 : 1. en la tabla de la distribución normal se tiene un valor de Z de -1. Es decir. por consiguiente la estadística de trabajo a utilizar es la expresión 3.H1 : < ó H1 : < k.500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio diario es de $34. por .9 Para un nivel de confianza del 95 por ciento. Pruebe la hipótesis con un nivel de confianza del 95 por ciento. Como puede observarse en la figura 3.13.64. Con la información de un censo realizado el año anterior sabe que la desviación estándar del ingreso diario de la primera comunidad es de $1. EJEMPLO Un constructor está considerando dos lugares alternativos para construir un centro comercial.500 < 1. Como los ingresos de los hogares de la comunidad son una consideración importante en ésta selección. se tiene una prueba de hipótesis a una cola inferior. desea probar que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad en cuando menos $1.500 diarios.500 o más.400 Para una muestra aleatoria de 30 hogares de la primera comunidad.800 y la de la segunda es de $2. en caso contrario se rechaza H0 lo cual implica aceptar H1 . encuentra que el ingreso diario promedio es de $35. Solución Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1.3 Z pertenece a una distribución Normal estándar. la estadística de trabajo se ubica en la zona de aceptación de la hipótesis nula. Si el valor de la estadística de trabajo es mayor que Z no se rechaza la hipótesis nula. como se aprecia en la figura 3.

pero n1 30 y n2 30 y varianzas poblacionales desconocidas .10) REGLA DE DECISIÓN La regla de decisión es la misma que en caso anterior y en todo caso.lo tanto. la diferencia entre el ingreso promedio por hogar en las dos comunidades es mayor a $1.110 lbs .. Una muestra de 100 alambres de acero producidos por la fábrica B presenta una resistencia promedio a la ruptura de 1. con una desviación estándar de 120 lbs .230 lbs . con una confiabilidad del 95 por ciento. solo que se reemplaza la varianza poblacional por la muestral: (3. depende de la hipótesis alternativa. Figura 3. con una desviación estándar de 90 lbs . Con base en ésta información pruebe si la resistencia promedio a la rotura de los alambres de acero de la marca A es significativamente mayor que la de los alambres de acero de la marca B.13 Regla de decisión para una prueba de hipótesis a una cola inferior Prueba de hipótesis para la diferencia de medias si las muestras se obtienen de poblaciones con distribuciones diferentes a la normal.. Solución . la estadística de trabajo es igual al caso anterior.500 diarios. Asuma un nivel de confianza del 99 por ciento. EJEMPLO Una muestra de 80 alambres de acero producidos por la fábrica A presenta una resistencia promedio a la ruptura de 1.

con una confiabilidad del 99 por ciento se acepta que la resistencia promedio de los alambres de la marca A es significativamente mayor que la resistencia promedio de los alambres de la marca B. como puede observarse en la figura 3.10 Con un nivel del confianza del 99 por ciento. en la tabla de la distribución normal el valor de Z es 2.11): (3. la estadística de trabajo está en la zona de rechazo de la hipótesis nula.H0 : A = B H1 : A > B El tamaño de las muestras es grande. las varianzas poblacionales son desconocidas. Figura 3. por consiguiente. con varianzas poblacionales iguales pero desconocidas y n1 <30 y n2 <30 .14 Regla de decisión para una prueba de hipótesis a una cola superior Prueba de hipótesis para la diferencia de medias si las muestras se obtienen de poblaciones con distribución normal.11) REGLA DE DECISIÓN . la estadística de trabajo es la expresión (1. por la tanto la estadística de trabajo a utilizar es la expresión 3.14.33.

Para tal efecto se tomó una muestra aleatoria de 25 bolsas. midiéndose la cantidad de cera en cada lado de esas bolsas. Solución Con la información suministrada se obtienen los estimadores necesarios: En consideración a que el tamaño de las muestras es pequeño.4. lo cual se hace con la prueba de hipótesis para el cociente de varianzas. Cuando se tienen muestras pequeñas y se va a realizar una prueba de hipótesis para la diferencia de medias.3 y si son diferentes se aplica el caso 3.6. Nota .8: . obteniéndose los siguientes resultados: Con base en esta información cuál es su conclusión?. pero los valores de la tabla se hallan en una distribución t con (n1 +n2 -2) grados de libertad. Si las varianzas son iguales se aplica el caso 3.6. EJEMPLO Se desea probar si la cantidad promedio de cera superficial en el lado interno (I) de las bolsas de papel encerado es mayor que la cantidad promedio en el lado externo (E). primero se debe probar si las varianzas poblacionales son iguales o diferentes. H0 : H1 : / / =1 1 Para la estadística de trabajo se utiliza la expresión 3. se debe probar si las varianzas poblacionales son iguales o diferentes. Asuma un nivel de confianza del 90 por ciento.La regla de decisión es la misma que en los casos anteriores. antes de realizar la prueba de hipótesis para la diferencia de medias.

05 es 0. para realizar la prueba de hipótesis para la diferencia de medias se usa la expresión 3. el valor de Z 0.505 y el valor de Z 0.16.3. el valor de Z es 1.11 H0 : I E H1 : I > E Con una confiabilidad del 90 por ciento. Como las varianzas poblacionales son iguales. . Como puede observarse en la figura 3. por lo tanto.Con una confiabilidad del 90 por ciento.98.15. con una confiabilidad del 90 por ciento se concluye que la cantidad promedio de cera en el lado interno no es mayor que la cantidad promedio de cera en el lado externo.95 es 1. por consiguiente las varianzas poblacionales son iguales. en la tabla de la distribución t con 48 grados de libertad. como puede observarse en la figura 3. la estadística de trabajo cae en la zona de no rechazo de la hipótesis nula. la estadística de trabajo se encuentra en la zona de no rechazo de la hipótesis nula. en la tabla de la distribución F con 24 grados de libertad en el numerador y 24 grados de libertad en el denominador.

Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaños n 1 y n 2.Prueba de hipótesis a dos colas H0 : 1 = 2 ó H0 : 1 . se puede comparar el comportamiento de dicha característica en las poblaciones a través de la diferencia de proporciones. para observar una característica o cualidad.Figura 3. Hipótesis Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hipótesis: .16 Regla de decisión para una prueba de hipótesis a una cola superior Pruebas de hipótesis para la diferencia de proporciones.2 = k .

Si se ha planteado la hipótesis alternativa como: H1 : 1 2 ó H1 : p 1 . como se aprecia en la figura 3. el nivel de significancia ( ) se divide en dos partes iguales. si < Zp1-p2 < no se rechaza H0 .p 2 ¹ k se tiene una prueba de hipótesis a dos colas. quedando el nivel de significancia ( ) en la parte superior de la distribución.14: (3.2 > k . se tiene una prueba de hipótesis a una cola superior.2 .2 H1 : 1 < 2 H1 : 1 .1 y pertenecen a una distribución Normal estándar. en caso contrario se rechaza H0 lo cual implica aceptar H1 .Prueba de hipótesis a una cola superior H0 : 1 = 2 ó H0 : 1 .2 k . Es decir.2 > k. quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.Si se ha planteado la hipótesis alternativa como: H1 : 1 > 2 ó H1 : 1 .14) REGLA DE DECISION Como en los casos anteriores depende del tipo de hipótesis que se haya planteado.2 k H1 : 1 > 2 H1 : 1 . . .2 < k k La estadística de trabajo es la expresión 1. Si el valor de la estadística de trabajo (Zp1-p2 ) está entre y no se rechaza la hipótesis nula.H1 : 1 2 H1 : 1 .Prueba de hipótesis a una cola inferior H0 : 1 = 2 ó H0 : 1 . por lo tanto.

. Es decir. Prueba de hipótesis para la relación de varianzas. quedando el nivel de significancia ( ) en la parte inferior de la distribución. Si el valor de la estadística de trabajo (Zp1-p2) es mayor que Z no se rechaza la hipótesis nula.pertenece a una distribución Normal estándar.2 < k. . si Zp1-p2 > Z no se rechaza H0 . si Zp1-p2 < no se rechaza H0 . Es decir. en caso contrario se rechaza H0 lo cual implica aceptar H1 . como se aprecia en la figura 3. se tiene una prueba de hipótesis a una cola inferior.Si se ha planteado la hipótesis alternativa como: H1 : 1 < 2 ó H1 : 1 . se puede comparar la homogeneidad o variabilidad de dichas poblaciones a través de una prueba de hipótesis para el cociente de varianzas.Si de dos poblaciones con distribución normal se seleccionan dos muestras aleatorias independientes de tamaños n1 y n2 . Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra tenga mayor varianza. Si el valor de la estadística de trabajo es menor que no se rechaza la hipótesis nula. en caso contrario se rechaza H o lo cual implica aceptar H1 . Es decir que la población 1 será la que tenga mayor varianza muestral.3 Z pertenece a una distribución Normal estándar.

Hipótesis Se puede plantear uno de los siguientes tres tipos de hipótesis: . quedando el nivel de significancia ( ) en la parte superior de la distribución.8 y pertenecen a una distribución F con (n1 -1) grado de libertad en el numerador y (n2-1) grado de libertad en el denominador.15) (3. el nivel de significancia ( ) se divide en dos partes iguales. Si el valor de la estadística de trabajo (T) está entre y no se rechaza la hipótesis nula. en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir. si < T < no se rechaza H0 . quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.Prueba de hipótesis a una cola inferior H0 : H1 : = < ó ó H0 : H1 : / / 1 <1 La estadística de trabajo es la expresión (1. se tiene una prueba de hipótesis a una cola superior.8) REGLA DE DECISION Si se ha planteado la hipótesis alternativa como: H1 : ó H1 : / 1 se tiene una prueba de hipótesis a dos colas.Prueba de hipótesis a dos colas H0 : H1 : = ó ó H0 : H1 : / / =1 1 . como se aprecia en la figura 3. .Prueba de hipótesis a una cola superior H0 : H1 : = > ó ó H0 : H1 : / / 1 >1 .9 .Si se ha planteado la hipótesis alternativa como: H1 : > ó H1 : / > 1 . por lo tanto.

a no se rechaza la hipótesis nula. EJEMPLO Dos fuentes de materias primas están siendo consideradas. Asuma un nivel de confianza del 99 por ciento.12. Si el valor de la estadística de trabajo (T) es menor que Z 1.94. Con base en ésta información se puede concluir que la varianza de la fuente A es significativamente mayor que la de la fuente B?.Z 1. se obtiene un valor para Z de 4.a pertenece a una distribución F con (n 1 -1) grado de libertad en el numerador y (n 2 -1) grado de libertad en el denominador. Es decir.Si se ha planteado la hipótesis alternativa como: H1 : < ó H1 : / < 1 . si T > Z a no se rechaza H0 . en la tabla de la distribución F con 9 grados de libertad en el numerador y 10 grados de libertad en el denominador. Ambas fuentes parecen tener características similares. Una muestra de 10 grupos de la fuente A produce una varianza de 250 y una muestra de 11 grupos de la fuente B produce una varianza de 195. en caso contrario se rechaza H o lo cual implica aceptar H 1 . no se puede rechazar que la variabilidad de las dos fuentes de materia prima es igual. con una confiabilidad del 99 por ciento. se tiene una prueba de hipótesis a una cola inferior. quedando el nivel de significancia ( ) en la parte inferior de la distribución. Como puede observarse en la figura 3. .10 Z a pertenece a una distribución F con (n1 -1) grado de libertad en el numerador y (n2 -1) grado de libertad en el denominador. Solución H0: H1 : A= A> B B Con un nivel de confianza del 99 por ciento. Si el valor de la estadística de trabajo (T) es mayor que Z a no se rechaza la hipótesis nula. en caso contrario se rechaza H o lo cual implica aceptar H 1 .a no se rechaza H o . si T < Z 1. el valor de la estadística de trabajo está en la zona de no rechazo de la hipótesis nula. . por lo tanto. Es decir. como se aprecia en la figura 3. pero no se está seguro de su homogeneidad.

la rechazamos. 3. con lo cual la decisión se deberá tomar de manera subjetiva). Despejamos de aquí el valor de p. AJUSTE DE UNA SERIE DE DATOS A UNA DISTRIBUCIÓN BINOMIAL: Disponemos de una serie de k datos que toman los valores 0.. Calculamos los valores teóricos de p (X = r).. Si la diferencia es "suficientemente pequeña" aceptamos como buena la aproximación Binomial. (nota: la fundamentación estadística que nos permitiría decidir de manera objetiva si la diferencia entre los datos teóricos y los reales es "suficientemente pequeña" escapa de los objetivos de esta unidad didáctica. Estadistica no paramétrica.Figura 3.12 Regla de decisión para una prueba de Hipótesis a una cola superior Ajuste de distribuciones de frecuencia a distribuciones de probabilidad. Calculamos la media de los k datos y la igualamos a la Esperanza teórica de la Binomial (n · p). 2. multiplicándolos por k para obtener los valores teóricos de cada posible valor de la variable aleatoria en series de k datos.- . Para saber si estos datos siguen pueden aproximarse por una distribución binomial: 1.n. si no. 1. . .

Esta propiedad es necesaria para que la prueba de hipótesis sea válida. denominadas ESTADÍSTICA PARAMÉTRICA y son aplicadas básicamente a variables contínuas. si hay menor número de diferenciaspositivas entonces “valor-p”=2P1 y si hay igual número de diferencias positivas y negativas entonces. intervalos de confianza y prueba de hipótesis son.• Las técnicas estadísticas de estimación de parámetros. Esto se llama estadística no paramétrica. Si n>20 se puede usar aproximación Normal a una Binomial con p = q = 0. Si la hipótesis alterna es "menor que" y el número de diferencias positivas es mayor que el número de diferencias negativas entonces “valor-p” = P2 en caso contrario “valor-p” = P1 . puesto que la probabilidad de que un dato sea mayor o menor que la mediana es ½. en conjunto. Ha: La mediana es menor (mayor ó distinta) del valor dado. para calcular los “valores-p”. La prueba estadística está basada en la distribución Binomial con probabilidad de éxito p=½. en un gran numero de casos no se puede determinar la distribución original ni la distribución de los estadísticos por lo que en realidad no tenemos parámetros a estimar.5. “valor-p”=1. • Sin embargo. . Cuando la hipótesis alterna es de dos lados y el número de diferencias positivas son mayores que el número de diferencias negativas entonces el “valor-p” = 2P2. • En ESTADÍSTICA PARAMÉTRICA se asume que la población de la cual la muestra es extraída es normal o aproximadamente normal. Para calcularla se determinan las diferencias de los datos con respecto al valor dado de la mediana y se cuentan los signos positivos y negativos. Ho: La Mediana poblacional es igual a un valor dado. Estas técnicas se basan en especificar una forma de distribución de la variable aleatoria y de los estadísticos derivados de los datos. Prueba de los Signos Se usa para hacer pruebas de hipótesis acerca de la mediana de una población. Tenemos solo distribuciones que comparar.

De la misma forma. . .serán parecidos. X2 .. por ejemplo antes y después del tratamiento. Ahora la hipótesis nula es que esas diferencias proceden de una distribución simétrica en torno a cero y si fuera cierta los valores deR+ y R.(Xn. X2M0. se reflejará en un valor mayor de R+. (X2. Xn-M0.. Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas.Y1). Si hubiera dos o más diferencias con igual valor (empates).. y la suma de rangos negativos R-. X2-Y2. ahora calcularemos las diferencias X1-Y1.Yn). aquellas en las que Xi es mayor que M0 y R.. asignándoles su rango (número de orden). Xn-Yn y las ordenaremos en valor absoluto. Si la hipótesis nula es cierta ambos estadísticos deberán ser parecidos. . Se calcula las diferencias X1-M0. Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi).la suma de todos los rangos correspondientes a las diferencias negativas. Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos. asignándoles el rango correspondiente. Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor.5 a ambas).Y2). mientras que si nuestros datos tienen a ser más altos que la mediana M0. . se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 2... Xn los valores observados. . si la mayor de las dos sumas de rangos es excesivamente grande. y al contrario si son más bajos. y sea X1. que podemos denominar (X1.Prueba de Wilcoxon de los rangos con signo Esta prueba nos permite comparar nuestros datos con una mediana teórica (por ejemplo un valor publicado en un artículo). . Si la hipótesis nula fuera cierta estas diferencias se distribuirían de forma simétrica en torno a cero.. lo que es equivalente.. o. Prueba de Wilcoxon para contrastar datos pareados El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores. Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequeña para ser atribuida al azar.

1. es idéntico al ANOVA con los datos reemplazados por categorías. es el promedio de rij. bajo la hipótesis nula. El estadístico donde:   está dado por: . el denominador de la expresión para K es Note que exactamente 2. ni es el número de observaciones en el grupo i rij es el rango (entre todas las observaciones) de la observación j en el grupo i N es el número total de observaciones entre todos los grupos    . donde G es el número de grupos de diferentes rangos repetidos. y ti es el número de observaciones repetidas dentro del grupo i que tiene observaciones repetidas para un determinado . Se puede realizar una . Es una extensión de la prueba de la U de MannWhitney para 3 o más grupos. Una forma común en que se viola este supuesto es con datos heterocedásticos. Sí asume. repetidos dividiendo K por . Allen Wallis) es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente.Prueba de Kruskal-Wallis La prueba de Kruskal-Wallis (de William Kruskal y W. que los datos vienen de la misma distribución. la prueba de Kruskal-Wallis no asume normalidad en los datos. Luego corrección para los valores . Ya que es una prueba no paramétrica. en oposición al tradicional ANOVA.

es/descartes/web/materiales_didacticos/Distribucion _binomial/binomial.co/cursos/ciencias/2001091/html/capitulo_5/leccion_ 05_02.pdf http://www.edu.html http://www. Esta corrección hace cambiar a K muy poco al menos que existan un gran número de observaciones repetidas.est. Finalmente. Si algún ni es pequeño ( < 5) la distribución de K puede ser distinta de la chi-cuadrado.educacion.htm http://www.unal.uc3m.org/noparame. el p-value es aproximado por .es/esp/nueva_docencia/colmenarejo/ciencias_actuariales/es tad_actuarial_I/doc_grupo15/archivos/Problemas3.htm . Bibliografía.virtual. 3.valor.http://recursostic.seh-lelha.

UNIDAD 4 ANÁLISIS DE LA REGRESIÓN .

mientras que si nuestro objetivo es construir un modelo explicativo. Para ello lo primero que habría que definir es qué entendemos por "mejor modelo". Se utiliza fundamentalmente en estudios en los que no se puede controlar por diseño los valores de las variables independientes. Se trata de modelos explicativos.Terminologia de la regresión.Se conoce como análisis de regresión multivariante al método estadístico que permite establecer una relación matemática entre un conjunto de variables X1. • La disponibilidad y facilidad de uso del software que permite la construcción de modelos de regresión nos ha hecho olvidar que se trata de técnicas complejas. Un problema fundamental que se plantea a la hora de construir un modelo multivariante es qué factores X1. X2 . X2 . como suele ocurrir en los estudios epidemiológicos y observacionales. buscaremos que las estimaciones de los coeficientes de la ecuación sean precisas. más acertadas.. Si buscamos un modelo predictivo será aquél que nos proporcione predicciones más fiables. Los objetivos de un modelo de regresión puede ser dos: • Obtener una ecuación que nos permita "predecir" el valor de Y una vez conocidos los valores de X1. Cumplidos esos objetivos es claro que otra característica deseable de nuestro modelo es que sea lo más sencillo posible. Xk. y se comunica los resultados como si la propia ecuación de regresión fuera sin más un "artículo de fe" que no necesitara de una cuidadosa validación. . Xk (covariantes o factores) y una variable dependiente Y. muy utilizados cuando se busca encontrar qué variables afectan a los valores de un parámetro fisiológico. de tal manera que estimemos el mejor modelo posible a partir de los datos de nuestro estudio. Xk incluir en la ecuación. X2 . Cuantificar la relación entre X1. X2 . ya que a partir de ellas vamos a efectuar nuestras deducciones.. Se conocen como modelos predictivos. que requieren un cierto conocimiento de la metodología estadística subyacente.. o cuáles son los posibles factores de riesgo que pueden influir en la probabilidad de que se desarrolle una patología. e incluso una ausencia total de esa explicación.. por lo que nos encontramos con excesiva frecuencia una pobre utilización de las técnicas de regresión y una peor descripción de cómo se emplearon en cada caso concreto. Xk y la variable Y con el fin de conocer o explicar mejor los mecanismos de esa relación.

. : f (X1. X2. θ : Parámetro Desconocido. La estimación puntual de un parámetro de una población es un solo valor numérico de un estadístico que corresponde a este parámetro.Xn) m. a.Estimación de parámetros Estimación: El proceso de estimación en inferencia estadística puede ser descrito como el proceso de estimar un parámetro a partir del estadístico correspondiente. Dar un valor numérico que aproxime en forma muy cercana al parámetro poblacional. Por Intervalo. tal como usar una media muestral (Estadístico) para estimar la media poblacional. X3. La estimación de parámetros puede ser: • • Puntual o Por Punto. El número obtenido cuando se evalúa el estimador para una muestra particular. (parámetro).…. de tamaño n. se denomina Estimación del Parámetro. Estimación Puntual: Objetivo. Un estadístico utilizado para aproximar a un parámetro de una población se denomina Estimador del Parámetro. Estadístico. Sea X una variable aleatoria de interés con distribución de probabilidad f (x).

X: Nº de elementos en la muestra con característica de interés. : : Estimador puntual de µ.Estimador. σ2 : Varianza Poblacional. “Proporción de elementos con cierta característica de interés en un universo dado. Otros Parámetros de Interés: P: Proporción Poblacional (proporción binomial). : Estimación puntual de µ. porque al evaluarlo para una muestra es concreto. Por ejemplo: µ=θ es un posible estimador de µ. da un solo numero o punto. .” = Estimador puntual de P.

µ2. σ : Desviación estándar de una población. P1 – P2 Estimador puntual para P1 – P2 Diferencia entre dos proporciones muéstrales. Estimador puntual de σ. Xn m. X1.…. X2. de tamaño n. µ1 . basadas en dos muestras aleatorias independientes. Diferencia entre las medias de dos muestras aleatorias independientes.µ2: Diferencia de dos medias poblacionales. Estimador puntual de µ1 . Estimador puntual de Sea X una variable aleatoria con media µ desconocida y varianza σ2.Estadístico: Estimador puntual de σ2. . Razón de dos varianzas poblacionales. a.

Xn) Estimadores posibles para µ ¿Cuál es el mejor? Antes de responder a esta pregunta debemos decidir que propiedades son deseables en un estimador puntual. en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple. X2.…. Se puede decir que Y depende de X.θ=µ = f (X1. donde una variable depende de la otra variable. "Y es una función de X" . Obviamente queremos que el estimador produzca estimaciones que puedan esperarse sean próximas en valor al parámetro que se esta estimando. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables. Prueba de hipótesis en la regresión lineal simple La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios.

También se le llama REGRESANDO ó VARIABLE DE RESPUESTA. Los valores de la variable independiente X son fijos. explicativa o de predicción y una variable Y. llamada independiente. 2. predecir. En el Modelo de Regresión Simple se establece que Y es una función de sólo una variable independiente. ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEAL SIMPLE En el estudio de la relación funcional entre dos variables poblacionales. llamada dependiente o variable respuesta. medidos sin error. una variable X. presenta la siguiente notación: Y=a+bX+e Donde: a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y. b es el coeficiente de regresión poblacional (pendiente de la línea recta) e es el error SUPOSICIONES DE LA REGRESIÓN LINEAL 1. y X es la variable independiente.Y = f(X) Como Y depende de X. Y es la variable dependiente. La variable Independiente X se le denomina VARIABLE EXPLICATIVA ó REGRESOR y se le utiliza para EXPLICAR Y. una dependiente y otra independiente y se representa así: Y = f (X) "Y está regresando por X" La variable dependiente es la variable que se desea explicar. razón por la cual se le denomina también Regresión Divariada porque sólo hay dos variables. En el Modelo de Regresión es muy importante identificar cuál es la variable dependiente y cuál es la variable independiente. La variable Y es aleatoria .

Elmétodo de estimación es el de Mínimos Cuadrados. Las variancias de las subpoblaciones Y son todas iguales.3. es decir. Los valores de Y están normalmente distribuidos y son estadísticamente independientes. Un valor negativo de b sería interpretado como la magnitud del decremento en Y por cada unidad de aumento en X. mediante el cual se obtiene: Luego. . Todas las medias de las subpoblaciones de Y están sobre la recta. en una unidad. 6. ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL Consiste en determinar los valores de "a" y "b " a partir de la muestra. Indica el número de unidades en que varía Y cuando se produce un cambio. existe una distribución normal de valores de Y (subpoblaciones Y) 4. la ecuación de regresión muestral estimada es Que se interpreta como: a es el estimador de a Es el valor estimado de la variable Y cuando la variable X = 0 b es el estimador de b . 5. en X (pendiente de la recta de regresión). es el coeficiente de regresión Está expresado en las mismas unidades de Y por cada unidad de X. Para cada valor de X. encontrar los valores de a y b con los datos observados de la muestra.

es decir. Correlación. i Yi Yi r=−ˆ . Coeficiente de . Prueba determinación. También se acostumbra usar el Residual estandarizado.Análisis residual.Medición de la adecuación del modelo de regresión lineal simple. el cual se obtiene al dividir elresidual entre la desviación estándar del residual (siempre que hagamos análisis de residuales debemos utilizar Residual estandarizado). que es similar al anterior pero eliminando de los cálculos la observación cuyo residual se desea hallar. de falta de ajuste. El residual puede ser considerado como el error aleatorio i e observado. Análisis de Residuales Un residual i r es la diferencia entre el valor observado Yi y el valor estimado por la linea de regresión Yi ˆ . y el Residual estudentizado "deleted".

c) Si hay valores anormales en la distribución de errores (Si se usa Residual estandarizado. La primera manera es escogiendo el botón Graphs de la ventana de diálogo Regression.El análisis de residuales permite cotejar si las suposiciones del modelo de regresi ón se cumplen. cualquier observación con un residual mayor de 2 o menor de 2 es considerado “ outlier”) d) Si hay varianza constante (propiedad de Homocedasticidad) y e) Si hay independencia de los errores. El análisis de residuales se puede llevar a cabo gráficamente o en forma analítica. las cuales pueden obtenerse de dos maneras. Prueba de falta de ajuste FALTA DE AJUSTE La falta de ajuste o prueba de la ``bondad de ajuste'' del modelo de regresión se expresa mediante las siguientes tres hipótesis equivalentes: (1 ) EL MODELO DE REGRESIÓN SIMPLE ES CORRECTO EL MODELO DE REGRESIÓN SIMPLE NO ES CORRECTO (2 ) NO HAY FALTA DE AJUSTE HAY FALTA DE AJUSTE (3 ) . En este texto sólo consideraremos un análisis gráfico. Se puede detectar: a) Si efectivamente la relación entre las variables X e Y es lineal. b) Si hay normalidad de los errores.

¿ Cúal es la estadística de prueba para probar la hipótesis de falta de ajuste? la estadística de prueba es que sigue una distribución y con grados de libertad en el numerador grados de libertad en el denominador Suma cuadrados del error puro Donde: de Suma cuadrados de de la falta de ajuste media de las respuestas en el valor respuesta observada de . independencia y homogeneidad de varianza Se tiene duda de: el ajuste a una linea recta Existan: varias observaciones de la variable repuesta para al menos un valor de .¿ Qué se requiere para la aplicaci'ón de esta prueba? Los siguientes supuestos sobre la variable error se han cumplido: La normalidad.

valor estimado de la respuesta para el valor de en valor . Nota: Idealmente podemos encontrar que la prueba para falta de ajuste es no significativa. Entonces se debe intentar descubrir donde y como ocurre esta. No significante . Desafortunadamente esto no garantiza que el modelo será satisfactorio como ecuación de predicción. La falta de ajuste suele utilizarse en diseño experimental cuando los niveles de factor de estudio son cuantitativos. 2. y la hipótesis de significancia de la regresión es rechazada. Haga click en los números para conocer sobre: . Significante . Esto indica que el modelo aparentemente es inadecuado. Si el valor calculado de la estadística es: el 1. Esto indica que aparentemente no existe razón para dudar de la adecuación del modelo bajo esta prueba y tanto los cuadrados medios de la falta de juste y el error puro pueden tomarse como estimados de .

excepto que contienen más términos y pueden servir relaciones más complejas que una línea recta.incluyen más de un término. son los llamados coeficientes de regresión.En este capítulo se estudiaran los modelos de regresión múltiple. es la variable aleatoria error que se supone que tiene que los errores son no correlacionados. Algunos otro modelos como y y . son las observaciones de las variables fíjas independientes. Un modelo de regresión múltiple se expresa demanera general como donde es la observación de la variable aleatoria dependiente.Modelo de regresión múltiple. Estos son similares a los modelos de regresión lineal simple.

. El modelo se puede expresar como el . SCI. 0 14. es listada abajo como y . 171) Seis ejecuciones fueron hechas a varias condiciones de saturación transisomers . De igual manera el el modelo para los correspondientes niveles de 66.Estos modelo se pueden expresar de la forma general de un modelo de de regresión multiple dada en modelo haciendo Ejemplo (tomado de Draper 1998. 0 43. 5 21. 0 22. 0 7. 0 12. 0 36. Sólo los modelos de regresión múltiple con dos variables independientes pueden ser graficados. 2 21.6 38 41 34 35 31 34 29 32 47. ejer D pag. 3 36. La respuesta. 5 18. 0 23. 0 10. 5 14. 0 El gráfico para los datos del ejemplo es dado en la figura 1. y haciendo y . 0 29. .

Figura 1. Diagrama de dispersión para los datos del ejemplo Prueba de hipótesis de regresión lineal multiple Los ejemplos ejemplos 1 y 2 pueden ser probados con la estadística de prueba dada por : específicamente par el ejemplo sería y para el ejemplo sería .

Con las son y las ecuaciones linealmente independientes. es y es . Si es no singular se puede estimar a La suma de cuadrados residual del modelo completo está dada por Esta suma tiene grados de libertad. es: donde es como . Prueba de la Hipótesis Lineal General Suponga que el modelo bajo consideración es asumido correcto. de las cuales solamente linealmente independientes. Exprese matricialmente la hipótesis para determinar la matriz funciones lineales de los parámetros Paso 2. obtenga la solución de parámetros. para poceder con la prueba haga lo siguiente: Paso 1. y así los parámetros en términos de los otros Paso 3. Reemplace esas soluciones en el modelo original obtendrá el modelo reducido .Las hipótesis de los ejemplos y deben ser probados de otra manera. La hipótesis lineal a ser probada es Se tiene que representa ecuaciones. A continuación se presenta la manera general de probar una Hipótesis Lineal General.

la cual tiene como grados de libertad: grados de libertad. Obtenga la estadística de prueba.donde: es un vector de orden es la nueva matriz diseño de orden . obtenga la suma de cuadrados residuales del modelo reducido como con grados de libertad. Paso 7. y es de Paso 4. Si es no singular. Obtenga la suma de cuadrados de la hipótesis nula. Estime el vector de parámetros del modelo reducido. La diferencia entre las sumas de cuadrados del modelo reducido y el modelo completo. expresión Paso 5. mediante la parámetros a ser estimados. el modelo Observe que: La porque en reducido se tienen menos parámetros que en el modelo completo Paso 6. La estadística de prueba para probar la hipótesis es dada por . determinan la llamada Suma de cuadrados debida a la hipótesis nula o Esto es.

. Forma General de $H_{0} :C \beta=0$ De manera general estadística es la Prueba Estadística por para probar vs. La prueba estadística utilizada es La cual asumiendo que la hipótesis nula es cierta se distribuye de libertad en el numerador y con grados grados de libertad en el denominador. Esta prueba determina si existe una relación lineal entre la variable respuesta regresoras y alguna de las variables .la cual se distribuye . La hipótesis estadística adecuada es Al rechazar la hipótesis nula se concluye que al menos una de las variables regresoras contribuye significativamente al modelo. esta es una prueba exacta. Si los errores son normalmente distribuidos e independientes. la prueba Luego . tiene una distribución PRUEBA DE LA SIGNIFICANCIA DE LA REGRESION La prueba de significancia de la regresión es una de la pruebas de hipótesis utilizadas para medir la bondad de ajuste del modelo.

Se rechaza la hipótesis nula si el valor calculado de la estadística de prueba es mayor que el valor teórico de la distribución Ejempl o La hipótesis es dada por .00 entonces se rechaza la hipótesis nula lo cual significa que al menos una de las variables regresoras significativamente al modelo. La prueba estadística utilizada es Luego como el valor P=0. PRUEBA DE REGRESION LA SIGNIFICANCIA PARA CADA o contribuye DE LA COEFICENTE La prueba individual de un coeficiente de regresión puede se útil para determinar si: Se incluyen otra variable regresora Se elimina una una o más variables regresoras presentes en el modelo La adición de variables regresoras en el modelo implica: La SC incremente La SC disminuya .

También se puede determinar la contribución en la SC .pero se debe decidir si el incremento en la SC es tan significativo que justifique la inclusión de otra variable regresora en el modelo. no se debe apresurar en eliminar una variable regresora cuando la prueba no sea significativa. es decir se está determinando la contribución de dado que las otras variables regresoras estan presentes en el modelo. por medio del método de Suma de Cuadrados Extra (link:cap5\leccion8\suma-extra. Por ello.tex) Ejemp lo . ya que la inclusión de variables que no deberían ser incluidas puede aumentar la SC . La hipótesis nula se rechaza si: con grados del libertad del Importa nte 1. de la variable regresora dado que las otras variables regresoras están presentes en el modelo. La prueba estadística para la hipótesis es donde es el elemento de la diagonal de la matriz correspondiente a . es un indicador de que la variable regresora puede ser eliminada del modelo. 2. La hipótesis para probar la significancia dede cualquier coeficiente de regresión es Si la hipótesis nula no es rechazada. La prueba estadística se distribuye error. Esta prueba es una prueba marginal.

3081 0.0726 11.4899 2 1 9. La tercera fila prueba la hipótesis es significativamente contribuye significativamente al .0932349 8 2 1 Los errores estándar de los parámetros son las raíces de los elementos de la diagonal de la matriz de varianza-covarianza del vector de parámetros estimados hallada en ejemplo de la Lección anterior La primera fila prueba la hipótesis de la cual se concluye que el intercepto es significativamente diferente de cero.000 0. La segunda fila prueba la hipótesis de la cual se concluye que el coeficiente de regresión diferente de cero y por tanto la variable modelo.Los programas estadísticos producen una tabla para la prueba de cada coeficiente Estima Error do estándar CONSTAN -94.300978 5 T Valor p 0.000 9.505 0.552 9.8015 0.000 6 2 1.96343 TE X1 X2 2.

es una generalización del valor de definida en la lección de Rcuadrado definida para una línea recta. Se define como el cociente entre la variabilidad explicada por la regresión y la variabilidad total. Utilid ad Se utiliza para medir la reducción en la variabilidad total de inclusión de las variables regresoras debido a la no . es significativamente contribuye significativamente al EL COEFICIENTE DE DETERMINACION O ESTADISTICA R2 El coeficiente de determinación o coeficiente de correlación múltiple al cuadrado. Un valor grande de . ya que mide la capacidad predictiva del modelo ajustado. esto es: algunas otras formas de presentar el coeficiente de determinación son: Algunas de las equivalencias anteriores pueden verse a partir de la demostración de . es una medida descriptiva que sirve para evaluar la bondad de ajuste del modelo a lo datos. El coeficiente de determinación múltiple.de la cual se concluye que el coeficiente de regresión diferente de cero y por tanto la variable modelo.

Si existe error puro. esto alcance el valor de . entonces una medida de la utilidad de los términos en el modelo diferentes de La estadística 2 R ajustada Como alternativa al uso de como medida de la idoneidad de un modelo. cuando deben elegir una . sería que se tuviera un perfecto ajuste de los . no puede "forzarce" hacia con sólo agregar más y más variables independientes al modelo. La única . mide la correlación entre y y . es imposible que manera en que podría dar datos en el cual 3. es si . Adicionar variables al modelo siempre incrementa el valor de .necesariamente implica que el modelo es bueno. lo cual es un improbable evento en la práctica. Es posible que modelos con valor de predicción o estimación. Si modelo 4. es . 2. OBSERVACIO NES 1. algunos analistas prefieren el valor más conservador de medida de la idoneidad de un modelo. denotado por . es común que se informe el coeficiente de determinación múltiple ajustado. esta dado por Se observa que muestra toma en cuenta ("ajusta por") tanto el tamaño de la siempre es menor como el número de parámetros del modelo. (suponiendo que el ha sido ajustado). que y lo que es más importante . ya sea que las variables contribuyan o no al grande sean malos en la modelo. Por ello.

el vector de residuales matricial como : se puede escribir en forma . y no debemos depender únicamente de sus valores para decidir si un modelo es útil o no para predir la variable respuesta Ejemp lo Para los datos del ejemplo se tiene que Lo cual significa que el modelo.Tenga cuenta que: en La estadística y son medidas descriptivas. Ahora el valor de es de la variabilidad total es explicada por el RESIDUALES Y SUS PROPIEDADES Definici ón Si el modelo postulado es y es no singular.

y . La matriz de varianza-covarianza de es definida como Demostración: Como el vector entonces como . se sigue que . reemplazando el valor de se tiene 2. la cual Algunas propiedades del vector de residuales son: 1. Demostración: Utilizando el resultado obtenido en del vector de residuales como podemos determinar el valor esperado . El valor esperado del vector de residuales es el vector nulo.Donde la matriz es simétrica e idempotente Propieda des es llamada matriz "sombrero".

tenemos y como cuando .y la matriz de varianza-covarianza de es definida como y utilizando la equivalencia para el vector de residuales dada en . entonces y como es simétrica es idempotente entonces Otra manera de obtener el anterior resultado es utilizando la equivalencia dada en y utilizando se tiene Ahora .

. entonces Forma explicita (esconder) 3. . El vector se distribuye normal. por tanto el vector de residuales también se distribuirá normal.entonces el vector de residuales De la equivalencia obtenida en es función del vector aleatorio error el cual se distribuye normal.si como es simétrica es idempotente.

aunque se asuma el supuesto de no correlación de las variables aleatorias . y su forma explícita. Esto es. implica la normalidad de las y como el vector de residuales es función es normal. y así la correlación entre el residual y es dada por Tenga cuenta que: en Los residuales siempre están correlacionados. . 4. Los residuales son correlacionados De la expresión dada en .Otra manera es observar que el supuesto dado al modelo sobre la normalidad de las variables aleatorias error variables aleatorias del vector . se observa que si existe covarianza entre dos residuales diferentes. entonces se tiene que el vector Luego el vector de residuales varianza covarianza se distribuye normal con media cero y matriz de .

uprag.pdf http://www.co/cursos/ciencias/2007315/lecciones_html/capitulo_ 6/leccion2/distrib-residuales.edu/residuales1.unal.edu.vitutor.html .virtual.html http://www.com/trabajos27/regresion-simple/regresion-simple.monografias.Bibliografia.shtml http://math.http://www.com/estadistica/inferencia/estimaciones.

Sign up to vote on this title
UsefulNot useful