You are on page 1of 21

Charles Alfred arias 0842 Oscar duvan mendez 0851 Laudith romero lopez 08 Luz ismelda serrano 0862

HISTORIA DE LA ESTADSTICA Desde el inicio de la civilizacin han existido formas sencillas de estadstica, puesto que en la antigedad se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas que eran de importancia en aquellas civilizaciones. El trmino estadstico es ampliamente percibido y pronunciado a diario desde diversos sectores activos de la sociedad. No obstante, hay una gran diferencia entre el sentido del trmino cuando se utiliza en el lenguaje corriente, generalmente al anteceder una citacin de carcter numrico, y lo que la estadstica significa como ciencia. La razn o razones que motivaron al hombre en un momento de su desarrollo a tomar en cuenta datos con propsitos estadsticos, posiblemente se encuentra si se toma en cuenta que es difcil suponer un organismo social, sea cual fuere la poca, sin la necesidad, casi instintiva, de recoger aquellos hechos que aparecen como actos esenciales de la vida; y as, al ubicarnos en una etapa del desarrollo de la estadstica podemos especular que se convirti en una aritmtica estatal para asistir al gobernante que necesitaba conocer la riqueza y el nmero de los sbditos entre otros, con el objeto de recaudar impuestos o presupuestar la guerra. Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o cosas. Hacia el ao 3000 a.C. los babilonios usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y sobre las especies vendidas o cambiadas mediante trueque.

ESTADISTICA DESCRIPTIVA Es una parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la poblacin las primeras conclusiones obtenidas tras un anlisis descriptivo, su poder inferencial es mnimo y debera evitarse tal proceder. Otras ramas de la estadstica se centran en el contraste de hiptesis y su generalizacin a la poblacin. Algunas de las tcnicas empleadas en este primer anlisis de los datos se enumeran ms abajo en el listado de conceptos bsicos. Bsicamente, se lleva a cabo un estudio calculando una serie de

medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. DISTRIBUCION DE FRECUENCIA La estadstica descriptiva analiza, estudia y describe a la totalidad de los individuos de una poblacin, su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. El proceso que sigue la estadstica descriptiva para el estudio de una cierta poblacin consta de los siguientes pasos: 1 Seleccin de caracteres dignos de ser estudiados. 2 Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres seleccionados. 3 Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro de cada carcter. 4 Representacin grfica de los resultados (elaboracin de grficos estadsticos). 5 Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una distribucin estadstica.

Poblacin: En estadstica el concepto de poblacin va ms all de lo que comnmente se conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio determinado. En otras palabras, la poblacin se define como la totalidad de los valores posibles (mediciones o conteos) de una caracterstica particular de un grupo especificado de personas, animales o cosas que se desean estudiar en un momento determinado. As, se puede hablar de la poblacin de habitantes de un pas, de la

poblacin de estudiantes universitarios de la zona sur del Estado Anzotegui, de la poblacin de casas de la Urbanizacin Los Ros de la ciudad de El Tigre, el rendimiento acadmico de los estudiantes del IUTJAA, el nmero de carros marca Corola de la ciudad de El Tigre, la estatura de un grupo alumnos del IUTJAA, la talla, etc. Muestra: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que sirve para representarla. Segn el DRAE, es una parte o porcin extrada de un conjunto por mtodos que permiten considerarla como representativa del mismo. Entonces, una muestra no es ms que una parte de la poblacin que sirve para representarla. La muestra debe obtenerse de la poblacin que se desea estudiar; una muestra debe ser definida sobre la base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia. Muestreo: Es el procedimiento mediante el cual se obtiene una o ms muestras de una poblacin determinada. Existen dos tipos de muestreos a saber: Los Parmetros: Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve a cabo sobre todos los elementos que integran una poblacin determinada, los mismos suelen representarse con letras griegas. El valor de un parmetro poblacional es un valor fijo en un momento dado. Ejemplo: La media Aritmtica =m (miu), La desviacin Tpica = s, (Sigma) etctera. Dato estadstico: Es un conjunto de valores numricos que tienen relacin significativa entre s. Los mismos pueden ser comparados, analizados e interpretados en una investigacin cualquiera. Se puede afirmar que son las expresiones numricas obtenidas como consecuencia de observar un individuo de la poblacin; por lo tanto, son las caractersticas que se han tomado en cuenta de cualquiera poblacin para una investigacin determinada. Frecuencia: La frecuencia es el nmero de veces que se repite (aparece) el mismo dato estadstico en un conjunto de observaciones de una investigacin determinada, las frecuencias se les designan con las letras fi, y por lo general se les llaman frecuencias absolutas. Distribucin de Frecuencia: En estadstica existe una relacin con cantidades, nmeros agrupados o no, los cuales poseen entre s caractersticas similares. Existen investigaciones relacionadas con los precios de los productos de la dieta diaria, la estatura y el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura del medio ambiente, las calificaciones de los estudiantes, etc., que pueden adquirir diferentes valores gracias a una unidad apropiada, que recibe el nombre de variable. La representacin numrica de las variables se denomina dato estadstico.

La distribucin de frecuencia es una disposicin tabular de datos estadsticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados ypara datos agrupados o de intervalos de clase.

Distribucin de frecuencia para datos no Agrupados: Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias. Distribucin de frecuencia de clase o de datos Agrupados: Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentra ordenada en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva. La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad.

Componentes de una distribucin de frecuencia de clase 1.- Rango o Amplitud total (recorrido).- Es el lmite dentro del cual estn comprendidos todos los valores de la serie de datos, en otras palabras, es el nmero de diferentes valores que toma la variable en un estudio o investigacin dada. Es la diferencia entre el valor mximo de una variable y el valor mnimo que sta toma en una investigacin cualquiera. El rango es el tamao del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribucin de frecuencia se designa con la letra R. 2.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados con caractersticas comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos lmites. Para organizar los valores de la serie de datos hay que determinar un nmero de clases que sea conveniente. En otras palabras, que ese nmero de intervalos no origine un nmero pequeo de clases ni muy grande. Un nmero de clases pequeo puede ocultar la naturaleza natural de los valores y un nmero muy alto puede provocar demasiados detalles como para observar alguna informacin de gran utilidad en la investigacin. Tamao de los Intervalos de Clase Los intervalos de clase pueden ser de tres tipos, segn el tamao que estos presenten en una distribucin de frecuencia: a) Clases de igual tamao, b) clases desiguales de tamao y c) clases abiertas. 3.-Amplitud de Clase, Longitud o Ancho de una Clase La amplitud o longitud de una clase es el nmero de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo ms importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la prctica. 4.-Punto medio o Marca de clase El centro de la clase, es el volar de los datos que se ubica en la posicin central de la clase y representa todos los dems valores de esa clase. Este valor se utiliza para el clculo de la media aritmtica. 5.-Frecuencia de clase La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el nmero total de valores de las variables que se encuentran presente en una clase determinada, de una distribucin de frecuencia de clase.

6.- Frecuencia Relativa La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribucin de frecuencia de clase entre el nmero total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %). 7.-Frecuencias acumuladas Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribucin de frecuencia de clase, esto se logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ltima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser menor que (fa< que) y frecuencias acumuladas mayor que (fa>que). 8.- Frecuencia acumulada relativa La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribucin de frecuencia de clase entre el nmero total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias acumuladas relativas porcentuales y las mismas se designan as: far %. La mediana La mediana (Md) es una medida de posicin que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parmetro que est en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribucin en una forma tal que a cada lado de la misma queda un nmero igual de datos. Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la posicin que esta ocupa en esa serie de datos; para ello hay que determinar si la serie de datos es par o impar, luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en la serie de valores, luego la mediana ser el nmero que ocupe el lugar de lo posicin encontrada. La moda La moda es la medida de posicin que indica la magnitud del valor que se presenta con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se repite en un conjunto de datos. De las medias de posicin la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observacin de los datos en estudio

puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.

Desviacin tpica o estndar Es la medida de dispersin ms utilizada en las investigaciones por ser la ms estable de todas, ya que para su clculo se utilizan todos los desvos con respecto a la media aritmtica de las observaciones, y adems, se toman en cuenta los signos de esos desvos. Se le designa con la letra castellana Cuando se trabaja con una muestra y con la letra griega minscula s (Sigma) cuando se trabaja con una poblacin. Es importante destacar que cuando se hace referencia a la poblacin l nmero de datos se expresa con N y cuando se refiere a la muestra l nmero de datos se expresa con n. La desviacin tpica se define como: Interpretacin de la desviacin estndar La desviacin tpica como medida absoluta de dispersin, es la que mejor nos proporciona la variacin de los datos con respecto a la media aritmtica, su valor se encuentra en relacin directa con la dispersin de los datos, a mayor dispersin de ellos, mayor desviacin tpica, y a menor dispersin, menor desviacin tpica. Varianza Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene expresada con las mismas letras de la desviacin tpica pero elevada al cuadrado, as S2 y s2. Las frmulas para calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas races, las cuales desaparecen al estar elevados el primer miembro al cuadrado.

Cuartiles: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Ordenamos los datos de menor a mayor.

Ejercicio de cuartiles Calcular los cuartiles de la distribucin de la tabla:

fi [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 8 10 16 14 10 5 2 65

Fi 8 18 34 48 58 63 65

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

Deciles Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.

Ejercicio de deciles Calcular los deciles de la distribucin de la tabla: fi [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 8 10 16 14 10 5 2 65 Clculo del primer decil Fi 8 18 34 48 58 63 65

Clculo del segundo decil

Clculo del tercer decil

Clculo del cuarto decil

Clculo del quinto decil

10

Clculo del sexto decil

Clculo del sptimo decil

Clculo del octavo decil

Clculo del noveno decil

Percentiles Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana. Ejercicio de percentiles Calcular el percentil 35 y 60 de la distribucin de la tabla: fi [50, 60) [60, 70) 8 10 Fi 8 18

11

[70, 80) [80, 90) [90, 100) [100, 110) [110, 120)

16 14 10 5 2 65

34 48 58 63 65

DISTRIBUCIONES DISCRETAS: Las distribuciones discretas son aquellas en las que la variable puede pude tomar un nmero determinado de valores: Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un nmero de 1 al 6; en una ruleta el nmero puede tomar un valor del 1 al 32. Las distribuciones continuas son aquellas que presentan un nmero infinito de posibles soluciones: Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una poblacin (72,5 aos, 7,513 aos, 72, 51234 aos). Distribuciones discretas: Bernoulli. La distribucin de Bernoulli es el modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); p probabilidad de ser admitido en una universidad (o te admiten o no te admiten); p probabilidad de acertar una quiniela (o aciertas o no aciertas) Al haber nicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de xito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificndose que: p+q=1 Veamos los ejemplos antes mencionados:

12

Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1 Ejemplo 3: Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + Distribuciones discretas: Binomial. La distribucin binomial parte de la distribucin de Bernoulli: La distribucin de Bernoulli se aplica cuando se realiza una sola vez un experimento que tiene nicamente dos posibles resultados (xito o fracaso), por lo que la variable slo puede tomar dos valores: el 1 y el 0 La distribucin binomial se aplica cuando se realizan un nmero" de veces el experimento de Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido xitos Ejemplo: se tira una moneda 10 veces: cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10 La distribucin de probabilidad de este tipo de distribucin sigue el siguiente modelo:

0,99999

Ejemplo 1: Cul es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? k " es el nmero de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6) n" es el nmero de ensayos. En nuestro ejemplo son 10 p " es la probabilidad de xito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La frmula quedara:

13

Luego, P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 2: Cul es la probabilidad de obtener cuatro veces el nmero 3 al lanzar un dado 8 veces? k " (nmero de aciertos) toma el valor 4 n" toma el valor 8 p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666) La frmula queda:

Luego, P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el nmero 3 al tirar un dado 8 veces. Distribuciones discretas: Poisson. La distribucin de Poisson parte de la distribucin binomial: Cuando en una distribucin binomial se realiza el experimento un nmero "n" muy elevado de veces y la probabilidad de xito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribucin de Poisson: Se tiene que cumplir que: p " < 0,10 p * n " < 10 La distribucin de Poisson sigue el siguiente modelo:

Vamos a explicarla: El nmero "e" es 2,71828 l " = n * p (es decir, el nmero de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de xito en cada ensayo) k " es el nmero de xito cuya probabilidad se est calculando Veamos un ejemplo: La probabilidad de tener un accidente de trfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, cul es la probabilidad de tener 3 accidentes?

14

Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribucin de Poisson.

Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de trfico en 300 viajes es del 8,9% Otro ejemplo: La probabilidad de que un nio nazca pelirrojo es de 0,012. Cul es la probabilidad de que entre 800 recin nacidos haya 5 pelirrojos?

Luego, P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recin nacidos es del 4,6%. DISTRIBUCIONES MUESTRALES En estudios pasados de Estadsticas centramos nuestra atencin en tcnicas que describen los datos, tales como organizar datos en distribuciones de frecuencias y calcular diferentes promedios y medidas de variabilidad. Estbamos concentrados en describir algo que ya ocurri. Tambin comenzamos a establecer los fundamentos de la estadstica inferencial, con el estudio de los conceptos bsicos de la probabilidad, las distribuciones de probabilidad discretas y continuas. Distribuciones que son principalmente generadas para evaluar algo que podra ocurrir. Ahora veremos otro tipo de distribucin de probabilidad, que se llaman distribuciones mustrales. Por qu muestrear? Muestrear es una forma de evaluar la calidad de un producto, la opinin de los consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es una parte de la poblacin. Poblacin es el total de resultados de un experimento. Hacer una conclusin sobre el grupo entero (poblacin) basados en informacin estadstica obtenida de un pequeo grupo (muestra) es hacer una inferencia estadstica. A menudo no es factible estudiar la poblacin entera. Algunas de las razones por lo que es necesario muestrear son: 1. La naturaleza destructiva de algunas pruebas

15

2. La imposibilidad fsica de checar todos los elementos de la poblacin. 3. El costo de estudiar a toda la poblacin es muy alto. 4. El resultado de la muestra es muy similar al resultado de la poblacin. 5. El tiempo para contactar a toda la poblacin es inviable. Distribucin Muestral de las Medias El ejemplo de los ratings de eficiencia muestra como las medias de muestras de un tamao especfico varan de muestra a muestra. La media de la primera muestra fue 101 y la media de la segunda fue 99.5. En una tercera muestra probablemente resultara una media diferente. Si organizamos las medias de todas las posibles muestras de tamao 2 en una distribucin de probabilidad, obtendremos la distribucin muestral de las medias. Distribucin muestral de las medias. Es una distribucin de probabilidad de todas las posibles medias mustrales, de un tamao de muestra dado, seleccionada de una poblacin. Teorema central del lmite La distribucin de medias mustrales tiende hacia una distribucin normal, aunque las muestras procedan de una distribucin no normal. Incrementando el nmero de muestras extradas de la poblacin, la distribucin de sus medias tiende a normalizarse. (n > 30)

16

DISTRIBUCIN DE STUDENT O DISTRIBUCIN t En muchos casos se seleccionan de una poblacin normal, muestras de tamao pequeo n < 30 y x desconocido El estadstico t ser DEFINICIN Una variable con distribucin t de Student se define como el cociente entre una variable normal estandarizada y la raz cuadrada positiva de una variable 2 dividida por sus grados de libertad. CARACTERISTICAS La distribucin se denomina distribucin de Student o distribucin t. Es simtrica, con media de 0, y variancia mayor que 1. Es ms achatada que la normal y adopta diferentes formas, segn el nmero de grados de libertad. La variable t se extiende desde -a +. A medida que aumenta los (n -1) grados de libertad la distribucin t se aproxima en su forma a una distribucin normal. El parmetro de la distribucin es (n-1) grados de libertad, originando una distribucin diferente para cada tamao de muestra. Cmo se deduce una distribucin de t? Extraigo K muestras de tamao n < 30.

17

Calculo para cada muestra el valor de t. Grafique la distribucin para cada tamao muestral Distribucin t para diferentes grados de libertad (n-1)

DISTRIBUCIN CHI_ CUADRADO Para muestras extradas de una poblacin normal con variancia 2, con tamao n < 30, siendo S2 la variancia de la muestra entonces el estadstico 2 ser DEFINICIN Una variable Chi cuadrado se define como la suma de n variables normales estandarizadas elevadas al cuadrado. CARACTERISTICAS Por definicin, una variable 2 adopta valores positivos: 0 " 2 " ". La distribucin es asimtrica positiva. A medida que aumenta el tamao de la muestra la curva es menos asimtrica, aproximndose a una curva normal. Para cada tamao muestral, se tendr una distribucin 2 diferente.

18

El

caracteriza a una distribucin 2 son sus grados de libertad (n-1), originado una distribucin para cada grado de libertad,

parmetro

que

Cmo se deduce una distribucin 2? Extraer K muestras de tamao n < 30 Para cada muestra, por ejemplo n = 5, transformamos cada valor de x: x1, x2, x3, x4 y x5 en Z: z1, z2, z3, z4 y z5, utilizando: Para cada muestra calculamos: Entonces podramos escribir , as: (1) Si cambiamos en (1) la media poblacional por X, resulta: (2) Dado que: , despejando tenemos: , al reemplazar en (2) llegamos a: Finalmente si se calcula para cada una de las K muestras y se grafica en un eje de coordenadas el 2 se genera una distribucin de 2 con (n-1) grados de libertad. Distribucin de ji-cuadrado para algunos valores de grados de libertad.

19

DISTRIBUCIN F DE FISHER Considerando dos muestras aleatorias independientes, de tamao n1 y n2, extradas de una poblacin normal, el estadstico F ser DEFINICIN Una variable F se define como el cociente entre dos variables ji-cuadrado divididas por sus correspondientes grados de libertad. CARACTERISTICAS Una variable con distribucin F es siempre positiva por lo tanto su campo de variacin es 0 " F " " La distribucin de la variable es asimtrica, pero su asimetra disminuye cuando aumentan los grados de libertad del numerador y denominador. Hay una distribucin F por cada par de grados de libertad. Parmetros: Grados de libertad asociados al numerador y denominador Cmo se deduce una distribucin F? Extraiga k pares de muestras aleatorias independientes de tamao n < 30.

20

Calcule para cada par el cociente de variancias que proporciona un valor de F. Graficar los valores de F de los k pares de muestras. Distribucin F para diferentes grados de libertad

21

You might also like