You are on page 1of 241

ESTADSTICA I

CLAVE MC 03

NDICE

PROPSITO GENERAL

PRESENTACIN

MAPA CONCEPTUAL

OBJETIVO GENERAL DEL CURSO

10

UNIDAD 1 INTRODUCCIN MAPA CONCEPTUAL INTRODUCCIN 1.1 COVERTIR TANTO PORCIENTO A DECIMALES Y VICEVERSA ACTIVIDADES DE APRENDIZAJE 1.2 NOTACIN CIENTFICA ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN UNIDAD 2 FUNDAMENTOS DE ESTADSTICA MAPA CONCEPTUAL INTRODUCCIN 2.1 DEFINICIN Y OBJETO DE LA ESTADSTICA ACTIVIDADES DE APRENDIZAJE 2.2 ESTADSTICA DESCRIPTIVA Y ESTADSTICA INFERENCIAL ACTIVIDADES DE APRENDIZAJE 2.3 VARIABLES DISCRETAS Y CONTINUAS ACTIVIDADES DE APRENDIZAJE 2.4 FUENTE DE DATOS ACTIVIDADES DE APRENDIZAJE 2.5 LA ESTADSTICA EN LA INVESTIGACIN ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN

11 12 13 14 15 15 18 20 21 22 23 24 28 28 29 29 32 32 33 33 34 35

UNIDAD 3 RECOPILACIN DE LA INFORMACIN: TEORA DEL MUESTREO MAPA CONCEPTUAL INTRODUCCIN 3.1 POBLACIN Y MUESTRA ACTIVIDADES DE APRENDIZAJE 3.2 ESTIMADORES Y PARMETROS ACTIVIDADES DE APRENDIZAJE 3.3 MUESTREO PROBABILSTICO Y NO PROBABILSTICO ACTIVIDADES DE APRENDIZAJE 3.4 MUESTREO ALEATORIO SIMPLE ACTIVIDADES DE APRENDIZAJE 3.5 MUESTREO ESTRATIFICADO ACTIVIDADES DE APRENDIZAJE 3.6 MUESTREO POR CONGLOMERADOS ACTIVIDADES DE APRENDIZAJE 3.7 OTROS DISEOS Y PROCEDIMIENTOS DE MUESTREO, JUICIO Y CONVENIENCIA ACTIVIDADES DE APRENDIZAJE 3.8 ERROR DE MUESTREO Y DE LA MUESTRA ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN UNIDAD 4 ORGANIZACIN DE DATOS MAPA CONCEPTUAL INTRODUCCIN 4.1 ANLISIS EXPLORATORIO DE DATOS: DIAGRAMA DE TALLOS Y HOJAS ACTIVIDADES DE APRENDIZAJE 4.2 ESCALAS DE MEDICIN,: NOMINAL, ORDINAL, DE INTERVALO Y DE RAZN ACTIVIDADES DE APRENDIZAJE 4.3 TABLAS DE FRECUENCIA PARA VARIABLES DISCRETAS Y CONTINUAS ACTIVIDADES DE APRENDIZAJE 4.4 INTERVALO DE CLASE Y LMITES DE CLASE ACTIVIDADES DE APRENDIZAJE 4.5 ANCHURA DE INTERVALO DE CLASE ACTIVIDADES DE APRENDIZAJE 4.6 MARCA DE CLASE ACTIVIDADES DE APRENDIZAJE 4.7 DISTRIBUCIN DE FRECUENCIA RELATIVA Y ACUMULADA PARA VARIABLES DISCRETAS Y CONTINUAS ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN

37 38 39 40 42 42 43 44 46 46 51 51 52 52 54 54 55 55 56 57 59 60 61

62 64 64 67 68 73 73 75 76 79 79 80 81 85 86

UNIDAD 5 PRESENTACIN DE DATOS: GRFICAS Y CURVAS MAPA CONCEPTUAL INTRODUCCIN 5.1 GRFICA PARA DATOS CUALITATVOS: GRFICA DE BARRAS Y DE PASTEL ACTIVIDADES DE APRENDIZAJE 5.2 GRFICA PARA DATOS CUANTITATIVOS: HISTOGRAMAS, POLGONOS DE FRECUENCIA Y OJIVAS ACTIVIDADES DE APRENDIZAJE 5.3 GRFICAS DE LINES DE SERIES DE TIEMPO ACTIVIDADES DE APRENDIZAJE 5.4 DIAGRAMAS DE CAJA ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN UNIDAD 6 MEDIDAS DE POSICIN DE TENDENCIA CENTRAL MAPA CONCEPTUAL INTRODUCCIN 6.1 MEDIA ARITMTICA O PROMEDIO PARA DATOS AGRUPADOS Y NO AGRUPADOS ACTIVIDADES DE APRENDIZAJE 6.2 MEDIANA PARA DATOS AGRUPADOS Y NO AGRUPADOS ACTIVIDADES DE APRENDIZAJE 6.3 LA MODA ACTIVIDADES DE APRENDIZAJE 6.4 LA MEDIA GEOMTRICA ACTIVIDADES DE APRENDIZAJE 6.5 PROMEDIO MVIL ACTIVIDADES DE APRENDIZAJE 6.6 MEDIA ARMNICA ACTIVIDADES DE APRENDIZAJE 6.7 DECILES, CUARTILES Y PERCENTILES ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN

87 88 89

90 94 94 100 101 102 103 105 106

109 110 111

112 118 118 122 122 124 124 126 126 132 132 132 133 141 142

UNIDAD 7 MEDIDAS DE VARIABILIDAD DE DISPERSIN MAPA CONCEPTUAL INTRODUCCIN 7.1 RANGO ACTIVIDADES DE APRENDIZAJE 7.2 DESVIACIN MEDIA ABSOLUTA ACTIVIDADES DE APRENDIZAJE 7.3 VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS

144 145 146 147 147 148 150 150

ACTIVIDADES DE APRENDIZAJE 7.4 DESVIACIN ESTNDAR ACTIVIDADES DE APRENDIZAJE 7.5 COEFICIENTE DE VARIACIN ACTIVIDADES DE APRENDIZAJE 7.6 MEDIDAS DE FORMA: ASIMETRA Y CURTOSIS ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN

152 152 154 154 155 155 159 160

UNIDAD 8 PROBABILIDAD MAPA CONCEPTUAL INTRODUCCIN 8.1 PROBABILIDAD CLSICA, FRECUENCIAL Y SUBJETIVA ACTIVIDADES DE APRENDIZAJE 8.2 EXPERIMENTOS, EVENTOS Y ESPACIOS MUESTRALES ACTIVIDADES DE APRENDIZAJE 8.3 REGLAS DE CONTEO: COMBINACIONES Y PERMUTACIONES ACTIVIDADES DE APRENDIZAJE 8.4 REGLAS DE LA PROBABILIDAD ACTIVIDADES DE APRENDIZAJE 8.5 EVENTOS DEPENDIENTES, INDEPENDIENTES Y CONDICIONALES ACTIVIDADES DE APRENDIZAJE 8.6 TEOREMA DE BAYES ACTIVIDADES DE APRENDIZAJE 8.7 DIAGRAMA DE RBOL ACTIVIDADES DE APRENDIZAJE 8.8 ESPERANZA MATEMTICA ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN UNIDAD 9 VARIABLES ALEATORIAS DISCRETAS Y SU DISTRIBUCIN DE PROBABILIDAD MAPA CONCEPTUAL INTRODUCCIN 9.1 PROBABILIDAD CLSICA, FRECUNCIAL Y SUBJETIVA ACTIVIDADES DE APRENDIZAJE 9.2 DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA ACTIVIDADES DE APRENDIZAJE 9.3 DISTRIBUCIN BERNOULLI ACTIVIDADES DE APRENDIZAJE 9.4 DISTRIBUCIN BINOMINAL Y MULTINOMINAL ACTIVIDADES DE APRENDIZAJE 9.5 DISTRIBUCIN DE POSSION

162 163 164 165 166 166 171 171 174 175 179 179 181 182 184 184 185 185 187 188

191 192 193 194 197 198 200 200 201 201 204 204

ACTIVIDADES DE APRENDIZAJE 9.6 DISTRIBUCIN GEOMTRICA ACTIVIDADES DE APRENDIZAJE 9.7 DISTRIBUCIN HIPERGEOMTRICA ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN

205 206 209 209 211 212

GLOSARIO

214

ANEXO

234

BIBLIOGRAFA

240

PROPSITO GENERAL
Fungir como una gua terica y didctica para el estudiante orientndolo en las bases y conceptos generales de la estadstica, as como brindar un contenido que le ayude mediante claros ejemplos a reforzar los conocimientos bsicos y a desarrollar su capacidad de anlisis matemtico.

PRESENTACIN
La aplicacin de las matemticas es constante, es universal; no es posible llevar a cabo un desarrollo social en ausencia de sta ciencia. El uso y manejo correcto de los nmeros, son en la actualidad responsabilidad y obligacin social, su uso es global; sin embargo, muchas ramas se has desprendido de las matemticas permitiendo el perfeccionamiento de ciertas reas y una mejor calidad en procesos de diferentes clases. Tal es el caso de la estadstica, definida como una rama de las matemticas, que se refiere a la recoleccin, estudio e interpretacin de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales ciencias de la salud como la Psicologa y la Medicina, y usada de manera muy importante en la toma de decisiones en reas de negocios e instituciones gubernamentales.

An cuando el perfil profesional del estudiante puede o no ser completamente afn empleo de la estadstica como herramienta profesional; sin embargo, debido a complejidad de la vida socialmente hablando, es de gran utilidad llevar a cabo por menos un estudio bsico de estadstica, pues sta siempre ser de gran ayuda para correcta toma de decisiones.

al la lo la

MAPA CONCEPTUAL
ESTADSTICA I

ESTADISTICA I

1. SDGSDFGASDA DFSDGFSDFGDF

2. FUNDAMENTOS DE ESTADSTICA

3. RECOPILACION DE INFORMACIN: TEORA DEL MUESTREO

4. PRESENTACIN DE DATOS, GRAFICAS Y CURVAS

5. MEDIDAS DE POSICIN DE TENDENCIA CENTRAL

6. MEDIDAS DE VARIABILIDAD O DE DISPERSIN

7. PROBABILIDAD

8. VARIABLES ALEATORIAS DISCRETAS Y SU DISTRIBUCIN DE PROBABILIDAD

10

GENERAL DEL CURSO

El estudiante explicar los fundamentos de la estadstica y sus aplicaciones en la investigacin; aplicar las tcnicas de muestreo de manera pertinente a la situacin que le requiera realizarlo; aplicar funciones de la estadstica para la organizacin y presentacin de datos cuantitativos; aplicar las medidas de tendencia central y variabilidad en problemas especficos de su profesin; estudiante comprender las reglas bsicas de la probabilidad.

11

UNIDAD 1 INTRODUCCIN

El estudiante reafirmar conceptos bsicos de matemticas.

Temario: 1. INTRODUCCIN 1.1 CONVERTIR TANTO PORCIENTO A DECIMALES Y VICEVERSA 1.2 NOTACIN CIENTFICA

12

MAPA CONCEPTUAL INTRODUCCIN

1. INTRODUCCIN

1.1CONVERTIR TANTO PORCIENTO A DECIMALES Y VICEVERSA

1.2 NOTACION CIENTIFICA

13

INTRODUCCIN
En esta unidad se repasarn las matemticas bsicas, con la finalidad de no generar problemas una vez iniciado el curso. Se trabajar en el tanto por ciento y la notacin cientfica.

14

1. INTRODUCCIN
1.1 CONVERTIR TANTO POR CIENTO A DECIMALES Y VICEVERSA

El estudiante aplicar de forma adecuada el tanto por ciento.

Se debe recordar siempre que un por ciento significa un centsimo. Lo dice la palabra misma: por ciento es por cien, se est comparando con cien: si 15% de la populacin son ancianos, significa que 15 personas de cada cien son ancianos. 1% es un centsimo o 0.01 4% es cuatro centsimos o 0.04 12% es doce centsimos o 0.12 89% es 89 centsimos o 0.89 100% es cien centsimos o 1 145% es 145 centsimos o 1.45 Convertir un nmero decimal en tanto por ciento Y viceversa, si tiene un nmero decimal, slo observa cuntos centsimos tiene. Por eso se debe entender que la primera cifra decimal despus del punto significa los dcimos, y la segunda cifra despus del punto significa las centsimos. 0.08 tiene 8 centsimos o 8% 0.2 no tiene dos cifras decimales; entonces pongamos un cero al lugar de la segunda cifra decimal: 0.2 es igual a 0.20. entonces tiene 20 centsimos o 20%. 1.1 - tambin pongamos un cero y es 1.10. Es ms de uno; tiene ms de 100 centsimos; 1.10 tiene 110 centsimos; y es 110%. 0.495 tiene tres cifras decimales. Cuando se convierte a tanto por ciento, el porcentaje tendr un punto decimal. 0.495 tiene 49 centsimos; y un medio centsimo adems. Por eso 0.495 es 49 1/2 % o normalmente escribimos 49.5% 0.3829 es 38.29% 1.078 es 107.8%

15

ACTIVIDAD DE APRENDIZAJE El estudiante realizar los siguientes ejercicios. Instrucciones: Convertir los decimales en tanto por ciento y viceversa, como se indica

1a. 2a. 77.40%= 3a. 4a. 63.31%= 5a. 54.98%= 6a. 40.56%=

=0.8779

1b. 2b. 65.34%=

=0.1058

1c. 2c. 67.71%=

=0.7605

=0.765

3b. 4b. 50.74%= 5b. 47.45%= 6b.

=0.9492

3c. 7.99%= 4c. 54.29%= 5c. 65%=

=0.3129

6c.

=0.0601

1.2

NOTACIN CIENTFICA

El estudiante comprender la notacin cientfica.

La notacin cientfica (o notacin ndice estndar) es un modo conciso de representar un nmero utilizando potencias de base diez. Los nmeros se escriben como un producto: a 10k, (siendo a un nmero mayor o igual que 1 y menor que 10, y k un nmero entero). Esta notacin se utiliza para poder expresar fcilmente nmeros muy grandes. La notacin cientfica utiliza un sistema llamado coma flotante, o de punto flotante en pases de habla inglesa y en algunos hispanohablantes.

16

Escritura

100 = 1 101 = 10 102 = 100 103 = 1 000 104 = 10 000 105 = 100 000 106 = 1 000 000 109 = 1 000 000 000 1010 = 10 000 000 000 1020 = 100 000 000 000 000 000 000 1030 = 1 000 000 000 000 000 000 000 000 000 000

10 elevado a una potencia entera negativa n es igual a 1/10n o, equivalentemente 0, (n1 ceros) 1: 1 10 = 1/10 = 0,1 3 10 = 1/1000 = 0,001 9 10 = 1/1 000 000 000 = 0,000 000 001

Por tanto, un nmero como: 156 234 000 000 000 000 000 000 000 000 puede ser escrito como 1,562341029, y un nmero pequeo como 0,000 000 000 023 4 puede ser escrito como 2,341011.

Usos Por ejemplo, la distancia a los confines observables del universo es ~4,61026m y la masa de un protn es ~1,6710-27 kilogramos. La mayora de las calculadoras y muchos programas de computadora presentan resultados muy grandes y muy pequeos en notacin cientfica; los nmeros 10 generalmente se omiten y se utiliza la letra E para el exponente; por ejemplo: 1,56234 E29. Ntese que esto no est relacionado con la base del logaritmo natural tambin denotado comnmente con la letra e.

La notacin cientfica es altamente til para anotar cantidades fsicas, pues pueden ser medidas solamente dentro de ciertos lmites de error y al anotar slo los dgitos significativos se da toda la informacin requerida sin malgastar espacio.

Para expresar un nmero en notacin cientfica debe expresarse en forma tal que contenga un dgito (el ms significativo) en el lugar de las unidades, todos los dems dgitos irn entonces despus del separador decimal multiplicado por el exponente de 10 respectivo. Ej. 238294360000 = 2,3829436E11 y 0,000312459 = 3,12459E-4.

17

Operaciones matemticas con notacin cientfica Suma y resta Siempre que las potencias de 10 sean las mismas, se debe sumar las mantisas, dejando la potencia de 10 con el mismo grado (en caso de que no tengan el mismo exponente, debe convertirse la mantisa multiplicndola o dividindola por 10 tantas veces como sea necesario para obtener el mismo exponente): Ejemplo: 2 104 + 3 104 = 5 104

Para sumar y restar dos nmeros (o ms) debemos tener el mismo exponente en las potencias de base diez. Tomamos como factor comn el mayor y movemos la coma flotante, en los menores, tantos espacios como sea necesario, elevando los correspondientes exponentes hasta que todos sean iguales. Ejemplo: 2 104 + 3 105 - 6 103 (tomamos el exponente 5 como referencia) 0,2 105 + 3 105 - 0,06 105 3,14 105 Multiplicacin Se multiplican los coeficientes y se suman a la vez los exponentes: Ejemplo: (4105)(2107) = 81012 Divisin Se dividen las mantisas y se restan los exponentes (numerador_denominador): Ejemplo: (41012)/(2105) =2107 Adems se pueden pasar los dos nmeros al mismo exponente y luego nada ms multiplicar Potenciacin Se potencia la mantisa y se multiplican los exponentes: Ejemplo: (3106)2 = 91012

Radicacin Se debe extraer la raz de la mantisa y dividir el exponente por el ndice de la raz: Ejemplos:

18

ACTIVIDADES DE APRENDIZAJE El estudiante realizar los siguientes ejercicios:

1.

Sita en la escala de potencias de 10: b) 3,67.104 c) 0,23.102 d) 8,92.10-3 e) 3,34.10-1

a) 7,2.105

2.

Expresa en notacin cientfica e indica el orden de magnitud de las siguientes cantidades: *Nota: El orden de magnitud se calcula a partir del valor absoluto del nmero 300 000 000 b) 0,000 000 1 e) -7894,34 h) -5,5 c) 0,000 000 62 f) 456,987

a)

d) -18 400 000 000 g) 0, 000 000 000 93

3.

Expresa en notacin decimal b) -6,3456. 10-6 c) 5,112. 10-3 d) 1,43. 10-5

a) 4. 103

4.

Realiza la operacin: (0. 00000000000000000000000663 . 30,000,000,000) : 0.00000009116 *Nota: Es incomodo trabajar con esas cantidades, pasa primero a notacin cientfica

5.

Efecta los productos y cocientes siguientes usando las propiedades de las potencias: a.

9.10 5.10 1,5.10


-3 -4 8

b.

1,6.10 5.10 4.10


-2 5 -6

7,2.10 c. 1,2.10 3.10


-6 -6 -1

6.

Efecta las siguientes operaciones con cantidades expresadas en notacin cientfica. Expresa el resultado tambin en notacin cientfica: a) 3,74.10-10 . 1,8.1018 c) 1,2.102 +1,8.103 b) 5,4.108.6,8.1012 d) 2,5.10-3-7,3.10-5

19

e) 5,6.10-2(4,2.102 + 3,3.103)
7.

f) 9,8.10-3 + 3,2.102

Efecta las siguientes operaciones con cantidades expresadas en notacin cientfica. Expresa el resultado tambin en notacin cientfica: a) 3.10-1 5.10-2 + 3.10-3 b)

3,2.10 7.0,7 (2.1014 )(6.10 5 )

8.

Efecta las siguientes operaciones con cantidades expresadas en notacin cientfica. Expresa el resultado tambin en notacin cientfica: a) (3.105)(8.10-4) b)

5.10 5 3.10 7 2.103 3

c) 6,12.10-5 + 7,29.10-10

20

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si es falso. (Recuerde que la forma de evaluar esta seccin es aciertos menos errores).

1.

Se debe recordar siempre que un por ciento significa una dcima parte 3 105 + 6 105 = 9 105 0.0320 = 32% La notacin cientfica (o notacin ndice estndar) es un modo conciso de representar un nmero utilizando potencias de base diez. Los nmeros se escriben como un producto: a 10k. En las operaciones de multiplicacin con notacin cientfica, se multiplican los coeficientes y se restan a la vez los exponentes

( )

2. 3. 4.

( ) ( ) ( )

5.

( )

21

UNIDAD 2 FUNDAMENTOS DE ESTADSTICA

El estudiante se introducir en los aspectos fundamentales, tanto de conceptos bsicos y de operatividad de la estadstica, as como su aplicacin y relacin con su formacin profesional. Temario:

1.

FUNDAMENTOS DE ESTADSTICA 2.1 2.2 2.3 2.4 2.5 DEFINICIN Y OBJETO DE LA ESTADSTICA ESTADSTICA DESCRIPTIVA Y ESTADSTICA INFERENCIAL VARIABLES DISCRETAS Y CONTINUAS FUENTE DE DATOS LA ESTADSTICA EN LA INVESTIGACIN

22

MAPA CONCEPTUAL
FUNDAMENTOS DE ESTADISTICA

2. FUNDAMENTOS DE ESTADISTICA

2.1 DEFINICIN Y OBJETO DE LA ESTADSTICA

2.2 ESTADSTICA DESCRIPTIVA Y ESTADSTICA INFERENCIAL

2.3 VARIABLES DISCRETAS Y CONTINUAS

2.4 FUENTE DE DATOS

2.5 LA ESTADSTICA EN LA INVESTIGACIN

23

INTRODUCCIN
En esta unidad se vern mtodos para recopilar informacin, los tipos de parmetros, tipos de muestreo y como calcular el tamao de la muestra as como el error de muestreo.

24

2. FUNDAMENTOS DE LA ESTADSTICA
2.1 DEFINICIN Y OBJETO DE LA ESTADSTICA

El estudiante reconocer el concepto y el objeto de la estadstica. Historia de la Estadstica Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.

En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab, general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin.

Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del imperio.

Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy pocas operaciones Estadsticas, con la notable excepcin de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra.

25

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos.

Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. En 1662, el capitn John Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre el nmero de personas que moriran de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabra esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Polticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el anlisis estadstico.

Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica.

Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica. En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compaas de seguros.

26

Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas cientficos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el trmino latino status, que significa estado o situacin; Esta etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica revela el sentido cuantitativo de las ms variadas situaciones.

Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia.

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin, que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.

Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior desarrollo del clculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Fsica como resultado de las investigaciones atmicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las fsicas. Etapas de Desarrollo de la Estadstica La historia de la estadstica est resumida en tres grandes etapas o fases. 1.- Primera Fase: Los Censos. Desde el momento en que se constituye una autoridad poltica, la idea de inventariar de una forma ms o menos regular la poblacin y las riquezas existentes en el territorio est ligada a la conciencia de soberana y a los primeros esfuerzos administrativos.

2.- Segunda Fase: De la Descripcin de los Conjuntos a la Aritmtica Poltica. Las ideas mercantilistas extraan una intensificacin de este tipo de investigacin. Colbert multiplica las encuestas sobre artculos manufacturados, el comercio y la poblacin: los

27

intendentes del Reino envan a Pars sus memorias. Vauban, ms conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se seala como el verdadero precursor de los sondeos. Ms tarde, Bufn se preocupa de esos problemas antes de dedicarse a la historia natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penltimo es autor de la famosa Aritmtica Poltica. Chaptal, ministro del interior francs, publica en 1801 el primer censo general de poblacin, desarrolla los estudios industriales, de las producciones y los cambios, hacindose sistemticos durante las dos terceras partes del siglo XIX. 3.- Tercera Fase: Estadstica y Clculo de Probabilidades. El clculo de probabilidades se incorpora rpidamente como un instrumento de anlisis extremadamente poderoso para el estudio de los fenmenos econmicos y sociales y en general para el estudio de fenmenos cuyas causas son demasiados complejas para conocerlos totalmente y hacer posible su anlisis.

Definicin de Estadstica La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma de decisin ms efectiva.

Otros autores tienen definiciones de la Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo de los colectivos; otros la definen como la expresin cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y anlisis. La ms aceptada, sin embargo, es la de Minguez, que define la Estadstica como La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima.

Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y en masculino, se refiere a una medida derivada de una muestra.

28

Utilidad e Importancia Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas descriptivas. Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones.

ACTIVIDAD DE APRENDIZAJE

El estudiante investigar de acuerdo a la bibliografa sugerida, porqu es importante la estadstica dentro de su carrera y elaborar un mapa conceptual con la informacin obtenida. Se entregar de manera impresa la siguiente sesin.

2.2

ESTADSTICA DESCRIPTIVA Y ESTADSTICA INFERENCIAL

El estudiante reconocer y diferenciar la estadstica descriptiva y la estadstica inferencial

La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica Descriptiva y la Inferencial. Estadstica Descriptiva: consiste sobre todo en la presentacin de datos en forma de tablas y grficas. Esta comprende cualquier actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales. Estadstica Inferencial: se deriva de muestras, de observaciones hechas slo acerca de una parte de un conjunto numeroso de elementos y esto implica que su anlisis requiere de generalizaciones que van ms all de los datos. Como consecuencia, la caracterstica ms importante del reciente crecimiento de la

29

estadstica ha sido un cambio en el nfasis de los mtodos que describen a mtodos que sirven para hacer generalizaciones. La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada.

ACTIVIDAD DE APRENDIZAJE

El estudiante realizar un anlisis de mnimo una cuartilla, mencionando ejemplos de estadstica descriptiva y estadstica inferencial. Se entregar impreso la siguiente sesin.

2.3 VARIABLES DISCRETAS Y CONTINUAS

El estudiante comprender y explicar las variables discretas y continuas. En lneas anteriores se ha sealado que el objeto de estudio de la Estadstica son las poblaciones y que estas estn formadas por entes o elementos. El nmero total de los mismos determina el tamao de la poblacin. Para estudiar una poblacin, lo primero que debe hacerse es observarla de alguna de las formas que ya se ha sealado en las lneas anteriores. Pero observar una poblacin es equivalente a observar sus elementos. Ahora bien, esos elementos poseen una serie de caractersticas que son las que realmente se observan. Por ejemplo, el conjunto de todas las empresas industriales radicadas en Espaa constituyen una poblacin. Los elementos de esa poblacin son las empresas. Pero una empresa no se observa en abstracto. Lo que realmente tiene inters son las distintas caractersticas de esas empresas, como, por ejemplo, el nmero de empleados, el volumen de ventas, los costes salariales, los gastos en publicidad, los beneficios de las mismas, la naturaleza de los productos que fabrican, etc. A todas estas caractersticas de los elementos de una poblacin se les conoce de forma genrica como caracteres. Estos ltimos, segn su naturaleza, pueden ser de tipo cuantitativo o cualitativo. Para el ejemplo anterior, seran caracteres cuantitativos el nmero de empleados, el volumen de ventas, los costes salariales, los gastos en publicidad, los beneficios de las mismas, etc., mientras que sera cualitativo la naturaleza de los productos que fabrican. Hay que sealar que, en general, cualquier carcter de tipo cuantitativo se puede ofrecer en trminos cualitativos. As, si el nmero de empleados lo agrupamos en intervalos se podra hablar de empresas pequeas, medinas y grandes, siendo ahora el carcter tamao de la empresa de naturaleza cualitativa. De manera similar se podra proceder con los dems. Pero en estadstica es ms habitual hablar de variables que de caracteres cuantitativos y de atributos en lugar de caracteres cualitativos. Las variables son susceptibles de medirse en trminos

30

cuantitativos y a cada una de esas posibles mediciones o realizaciones se les conoce como valores, datos u observaciones. A su vez, en funcin del nmero posible de valores que tome una variable, a las mismas se las puede clasificar en discretas y continuas. Sern discretas cuando el nmero de valores sea finito o infinito numerable, mientras que una variable ser continua cuando el nmero de sus valores sea infinito no numerable. En los casos en los que las variables toman infinitos valores, la prctica habitual es agruparlos en intervalos, como se muestra en las Tabla 1, para variable continua, y en la Tabla 2 para discreta. Variable discreta, aquella que entre dos valores prximos puede tomar a lo sumo un nmero finito de valores. Ejemplos: el nmero de miembros de una familia, el de obreros de una fbrica, el de alumnos de la universidad, etc. Variable contina la que puede tomar los infinitos valores de un intervalo. En muchas ocasiones la diferencia es ms terica que prctica, ya que los aparatos de medida dificultan que puedan existir todos los valores del intervalo. Ejemplos, peso, estatura, distancias, etc.

La variable se denota por las maysculas de letras finales del alfabeto castellano. A su vez cada una de estas variables puede tomar distintos valores, colocando un subndice, que indica orden.
X = (X1, X2, ......

X n)

31

Los atributos no pueden medirse como ocurre con las variables. Lo nico que puede hacerse con ellos es describirlos mediante palabras y clasificarlos en categoras no numricas que sean mutuamente excluyentes. A cada una de estas categoras se le denomina modalidades. Un ejemplo es el que se recoge en la Tabla 3.

32

En algunos casos, las modalidades de un atributo pueden ser objeto de ordenacin, como se recoge en la tabla 4.

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar un anlisis de mnimo una cuartilla, mencionando ejemplos de variables discretas, y variables continuas. Se entregar impreso la siguiente sesin.

2.4

FUENTE DE DATOS

El estudiante identificar las fuentes de datos en la estadstica. En los apartados anteriores se ha sealado que el objetivo de la Estadstica es el estudio de los fenmenos de masas. Pero ello requiere el manejo de una informacin numrica amplia. La cuestin inmediata que surge es saber a dnde se puede recurrir para encontrar esa informacin necesaria y sin la cual el anlisis estadstico no se puede realizar. En definitiva, se trata es de conocer las fuentes que suministran informacin de carcter estadstico. Estas fuentes son susceptibles de clasificarse segn distintos criterios. Atendiendo al agente que elabore esa informacin, la misma puede agruparse en endgena y exgena. La primera sera la que elabora el propio investigador. En este caso, la operacin estadstica conducente a recabar los datos necesarios para la realizacin del anlisis estadstico se supone que la lleva a cabo el propio investigador. Ser l quien se encargue de observar los distintos caracteres, cuantitativos o cualitativos, relevantes de los elementos de una poblacin. El resultado

33

ser una base de datos, obtenida mediante una muestra, o cualquiera de los otros procedimientos indicados con anterioridad, que permitir el correspondiente anlisis estadstico. Esta situacin se da cuando no existe fuente alternativa exgena capaz de facilitar esa informacin. Pero qu se entiende por fuente exgena? En general, la podemos definir como aquella cuyo objeto principal es la obtencin de informacin estadstica pero que no acta como usuaria.

Las fuentes exgenas son mltiples y a su vez se las puede clasificar en dos categoras distintas. Por un lado estn las fuentes oficiales o pblicas y, por otro, las privadas. De todas ellas las que generan mayor volumen de informacin son las primeras, es decir, las oficiales o pblicas. Estas ltimas se pueden clasificar, a su vez, segn el mbito espacial en que desarrollan sus competencias en materia estadstica.

ACTIVIDAD DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un cuadro sinptico en el que se expongan las diferentes fuentes de datos. Se entregar de manera impresa la siguiente sesin. 2.5 LA ESTADSTICA EN LA INVESTIGACIN

El estudiante conocer y ejemplificar la estadstica en la investigacin. Mtodo Estadstico El conjunto de los mtodos que se utilizan para medir las caractersticas de la informacin, para resumir los valores individuales, y para analizar los datos a fin de extraerles el mximo de informacin, es lo que se llama mtodos estadsticos. Los mtodos de anlisis para la informacin cuantitativa se pueden dividir en los siguientes seis pasos:

1. Definicin del problema. 2. Recopilacin de la informacin existente. 3. Obtencin de informacin original. 4. Clasificacin. 5. Presentacin.

34

6. Anlisis. Errores Estadsticos Comunes Al momento de recopilar los datos que sern procesados se es susceptible de cometer errores as como durante los cmputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitacin y que no son tan fcilmente identificables.

Algunos de estos errores son: Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilacin y en el anlisis de la informacin. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinin que a aquellos que la contradicen. Un caso extremo de sesgo sera la situacin donde primero se toma una decisin y despus se utiliza el anlisis estadstico para justificar la decisin ya tomada.

Datos no comparables: el establecer comparaciones es una de las partes ms importantes del anlisis estadstico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables. Proyeccin descuidada de tendencias: la proyeccin simplista de tendencias pasadas hacia el futuro es uno de los errores que ms ha desacreditado el uso del anlisis estadstico.

Muestreo Incorrecto: en la mayora de los estudios sucede que el volumen de informacin disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la poblacin a que pertenece la muestra. Si la muestra se selecciona correctamente, tendr bsicamente las mismas propiedades que la poblacin de la cual fue extrada; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada.

ACTIVIDADES DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un resumen con un contenido mnimo de dos cuartillas en el que explique la importancia de la estadstica en la labor de investigacin. Se entregar de manera impresa la siguiente sesin.

35

1.

INSTRUCCIONES: LEA DETENIDAMENTE Y ANOTE DENTRO DEL PARNTESIS V SI EL ENUNCIADO ES VERDADERO Y F SI EN FALSO. (RECUERDE QUE LA FORMA DE EVALUAR ESTA SECCIN ES ACIERTOS MENOS ERRORES). 1. Una fuente exgena es aquella cuyo objeto principal es la obtencin de informacin estadstica pero que no acta como usuaria. La Estadstica descriptiva se deriva de muestras, de observaciones hechas slo acerca de una parte de un conjunto numeroso de elementos y esto implica que su anlisis requiere de generalizaciones que van ms all de los datos; investiga o analiza una poblacin partiendo de una muestra tomada. Las variables sern discretas cuando el nmero de valores sea finito o infinito numerable, mientras que una variable ser continua cuando el nmero de sus valores sea infinito no numerable. ( )

2.

3.

2.

INSTRUCCIONES: LEA DETENIDAMENTE Y CONTESTE EN LOS ESPACIOS EN BLANCO LA RESPUESTA CORRECTA.

1.

Las se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones.

2.

El conjunto de los mtodos que se utilizan para medir las caractersticas de la informacin, para resumir los valores individuales, y para analizar los datos a fin de extraerles el mximo de informacin, es lo que se llama .

3.

La estadstica comprende cualquier actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales.

36

4.

En estos casos se dice que hay un cuando el individuo da mayor peso a los datos que apoyan su opinin que a aquellos que la contradicen. Un caso extremo de sera la situacin donde primero se toma una decisin y despus se utiliza el anlisis estadstico para justificar la decisin ya tomada.

5.

La en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma de decisin ms efectiva.

37

UNIDAD 3 RECOPILACIN DE INFORMACIN: TEORA DEL MUESTREO

El estudiante distinguir y ejecutar el tipo y procedimiento para la seleccin de su muestra de tal forma que resulte ser significativa y representativa de toda su poblacin.

Temario: 3. RECOPILACIN DE INFORMACIN: TEORA DEL MUESTREO 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 POBLACIN Y MUESTRA ESTIMADORES Y PARMETROS MUESTREO PROBABILSTICO Y NO PROBABILSTICO MUESTREO ALEATORIO SIMPLE MUESTREO ESTRATIFICADO MUESTREO POR CONGLOMERADOS OTROS DISEOS Y PROCEDIMIENTOS DE MUESTREO. JUICIO Y CONVENIENCIA ERROR DE MUESTREO Y DE LA MUESTRA

38

MAPA CONCEPTUAL RECOPILACIN DE INFORMACIN: TEORA DEL MUESTREO

3. RECOPILACIN DE INFORMACIN: TEORA DEL MUESTREO

3.1 POBLACIN Y MUESTRA

3.2 ESTIMADORES Y PARMETROS

3.3 MUESTREO PROBABILSTICO Y NO PROBABILSTICO

3.4 MUESTREO ALEATORIO SIMPLE

3.5 MUESTREO ESTRATIFICADO

3.6 MUESTREO POR CONGLOMERADOS

3.7 OTROS DISEOS Y PROCEDIMIENTOS DE MUESTREO. JUICIO Y CONVENIENCIA

3.8 ERROR DE MUESTREO Y DE LA MUESTRA

39

INTRODUCCIN
En esta unidad se vern mtodos para recopilar informacin, los tipos de parmetros, tipos de muestreo y como calcular el tamao de la muestra as como el error de muestreo.

40

3. RECOPILACIN DE INFORMACIN Y TEORA DEL MUESTREO


3.1 POBLACIN Y MUESTRA

El estudiante reconocer y explicar los conceptos de poblacin y muestra. Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes.

"Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). Una poblacin en estadstica es el conjunto de todas las observaciones en las que estamos interesados. Se llama tamao de la poblacin al nmero de individuos que la componen, siendo cada posible observacin un individuo; as pues, las poblaciones pueden ser finitas e infinitas. Cada observacin en una poblacin es un valor de una variable aleatoria X con una funcin de probabilidad o densidad determinada f(x) Normalmente, se denomina a las poblaciones con el nombre de la distribucin de la variable; es decir, hablaremos de poblaciones normales, binomiales, etc.

Para estudiar una poblacin existen dos posibilidades. Una de ellas consiste en estudiar todos sus elementos y sacar conclusiones; la otra consiste en estudiar slo una parte de ellos, una muestra, elegidos de tal forma que nos digan algo sobre la totalidad de las observaciones de la poblacin. El mejor mtodo ser el primero, cuando es posible, lo cual slo ocurre en las poblaciones finitas y razonablemente pequeas; en el caso de poblaciones muy grandes o infinitas ser muy difcil o imposible realizar un estudio total. En este caso necesitaremos tomar una muestra y nos surgir el problema de cmo hacer para que la muestra nos diga algo sobre el conjunto de la poblacin.

Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra.

41

Muestra: "Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991).

"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974).

La condicin ms obvia que se le puede pedir a una muestra es que sea representativa de la poblacin. Est claro que si no conocemos la poblacin no podemos saber si la muestra es representativa o no. La nica forma de tener cierta garanta de que esto ocurra es tomar nuestra muestra de forma que cada individuo de la poblacin y cada subgrupo posible de la poblacin tengan igual probabilidad de ser elegidos. A este tipo de muestras se les llama muestras aleatorias o muestras al azar.

Una muestra aleatoria de tamao n es un conjunto de n individuos tomado de tal manera que cada subconjunto de tamao n de la poblacin tenga la misma probabilidad de ser elegido como muestra; es decir, si la poblacin tiene tamao N, cada una de las combinaciones posibles de n elementos debe ser equiprobable. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.

Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.

42

Los sistemas de muestreo se basan normalmente en la asignacin de un nmero a cada uno de los individuos de la poblacin y la posterior obtencin de una muestra de n nmeros aleatorios que se obtendr por sorteo utilizando bolas numeradas, ordenadores, etc.

ACTIVIDADES DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un anlisis en una cuartilla, en el que se explique la diferencia entre la muestra, y la poblacin. Se entregar impreso la siguiente sesin. 3.2 ESTIMADORES Y PARMETROS

El estudiante comprender y distinguir los estimadores y lo parmetros.

Los dos problemas fundamentales que estudia la inferencia estadstica son el Problema de la estimacin y el Problema del contraste de hiptesis. Cuando se conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los parmetros que la determinan, estamos en un problema de inferencia estadstica paramtrica; por el contrario, cuando

43

no se conoce la forma funcional de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica. Nosotros nos vamos a limitar a problemas de inferencia estadstica paramtrica, donde la variable aleatoria objeto de estudio sigue una distribucin normal, y slo se estimarn los parmetros que la determinan, la media y la desviacin tpica.

Estadstico: Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin de los parmetros. Parmetro: Son las medidas o datos que se obtienen de la poblacin.

Se llama parmetros poblacionales a cantidades que se obtienen a partir de las observaciones de la variable y sus probabilidades y que determinan perfectamente la distribucin de esta, as como las caractersticas de la poblacin, por ejemplo: La media, , la varianza 2, la proporcin de determinados sucesos, P.

Los Parmetros poblacionales son nmeros reales, constantes y nicos. Parmetros muestrales Los Parmetros muestrales son resmenes de la informacin de la muestra que nos "determinan" la estructura de la muestra. Los Parmetros muestrales no son constantes sino variables aleatorias pues sus valores dependen de la estructura de la muestra que no es siempre la misma como consecuencia del muestreo aleatorio. A estas variables se les suele llamar estadsticos.

Los estadsticos se transforman en dos tipos: estadsticos de centralidad y estadsticos de dispersin.

ACTIVIDADES DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un mapa conceptual en el que se explique la diferencia entre los estimadores y los parmetros. Se entregar impreso la siguiente sesin.

44

3.3

MUESTREO PROBABILSTICO Y NO PROBABILSTICO

El estudiante reconocer y distinguir los conceptos de muestreo probabilstico y no probabilstico MUESTREO En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una poblacin), se selecciona una muestra, entendiendo por tal una parte representativa de la poblacin.

El muestreo es por lo tanto una herramienta de la investigacin cientfica, cuya funcin bsica es determinar que parte de una poblacin debe examinarse, con la finalidad de hacer inferencias sobre dicha poblacin. La muestra debe lograr una representacin adecuada de la poblacin, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha poblacin que son importantes para la investigacin. Para que una muestra sea representativa, y por lo tanto til, debe de reflejar las similitudes y diferencias encontradas en la poblacin, es decir ejemplificar las caractersticas de sta.

Los errores ms comunes que se pueden cometer son:

1.- Hacer conclusiones muy generales a partir de la observacin de slo una parte de la Poblacin, se denomina error de muestreo.

2.- Hacer conclusiones hacia una Poblacin mucho ms grandes de la que originalmente se tomo la muestra.

Error de Inferencia. En la estadstica se usa la palabra poblacin para referirse no slo a personas si no a todos los elementos que han sido escogidos para su estudio y el trmino muestra se usa para describir una porcin escogida de la poblacin.

45

TIPOS DE MUESTREO Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos. I. Muestreo probabilstico Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables. II. Mtodos de muestreo no probabilsticos A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la poblacin), pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa.

En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilstico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la poblacin.

Entre los mtodos de muestreo no probabilsticos ms utilizados en investigacin encontramos:

1.- Muestreo por cuotas: Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.

46

2.- Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. Tambin puede ser que el investigador seleccione directa e intencionadamente los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).

3.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

4.- Muestreo Discrecional A criterio del investigador los elementos son elegidos sobre lo que l cree que pueden aportar al estudio.

ACTIVIDADES DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un anlisis en una cuartilla en el que se explique la diferencia entre el muestreo probabilstico y el no probabilstico. Se entregar de manera impresa la siguiente sesin.

3.4

MUESTREO ALEATORIO SIMPLE

El estudiante reconocer y utilizar el muestreo aleatorio simple. Todos los individuos tienen la misma probabilidad de ser seleccionados. La seleccin de la muestra puede realizarse a travs de cualquier mecanismo probabilstico en el que todos los elementos tengan las mismas opciones de salir. Por ejemplo uno de estos mecanismos es utilizar una tabla de nmeros aleatorios, o tambin con un ordenador generar nmeros aleatorios, comprendidos entre cero y uno, y multiplicarlos por el tamao de la poblacin, este es el que vamos a utilizar.

47

El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande.

Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k.

El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. TAMAO DE MUESTRA A la hora de determinar el tamao que debe alcanzar una muestra, hay que tomar en cuenta varios factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello, antes de presentar algunos casos sencillos de clculo de tamao de muestra delimitaremos estos factores.

Para calcular el tamao de una muestra se necesitan los siguientes factores: 1. El porcentaje de confianza con el cual se quiere generalizar los datos de muestra hacia la poblacin total.

2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin.

48

3. El nivel de variabilidad que se calcula para comprobar la hiptesis.

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto, para el estudio, o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%.

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o a la inversa: rechazar la hiptesis verdadera por considerarla falsa. Al igual que en el caso de confianza, si se quiere eliminar el riesgo de error y considerando como 0% entonces, la muestra es del mimo tamao que la poblacin, por lo que conviene correr con cierto riesgo de equivocarse.

Comnmente se acepta entre 4% y 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

NOTA. Para verificar los niveles de confianza ser necesario utilizar la siguiente tabla:

NIVEL DE CONFIANZA Z

99.7 %
3.00

99 %
2.58

98 %
2.33

96 %
2.05

95.45 %
2.00

95 %
1.96

90%

80 %
1.28

68.27 %
1.00

50%

1.645

0.6745

Para estimar el tamao de muestra necesario para realizar una investigacin se debe de aplicar la siguiente frmula:

Donde: n= Tamao de la muestra, z= Nivel de confianza, 2,58 para el 99% p= Variabilidad positiva q= 1- p Variabilidad negativa B o e = Precisin o error admitido .

49

Ejemplo: Supngase que por estudios anteriores, se tiene conocimiento de que la proporcin de deportistas entre los estudiantes de una universidad es del 0.65. Se pregunta Qu tamao deber tomarse la muestra si se quiere que el error no exceda un 15% y un grado de confianza del 99%?

SOLUCIN: Tomemos en cuenta que se sabe que la proporciones de estudiantes que practica un deporte en esa universidad es del 0.65, se puede utilizar este valor como una estimacin de la proporcin verdadera, en cuyo caso nos valdremos de la frmula anterior para calcular el tamao de la muestra.

n= Tamao de la muestra, z= 99% = 2.58 p= 0.65 q= 1- 0.65= 0.35 B o e = 0.15

sustituyendo, tendremos: n = (2.58)2 (0.65) (0.35) = (6.6564)(0.2275) = 1.14331 Esto quiere decir que la muestra ser de 67. (0.15)2 0.0225 0.0225

= 67.3036

En el caso de que s se conozca el tamao de la poblacin, cuando la variable crtica es dicotmica o binomial, para la estimacin de proporciones poblacionales o universos considerados finitos, entonces el tamao de la muestra se determinar con la siguiente frmula:

n = ( z )2 N ( e )2

(p) (q) N + [ ( z )2

. sta frmula se usa para N > 30 (p)(q) ]

n = ( z )2 N ( e )2

(p) (q) ( N 1 ) + [ ( z )2

. sta frmula se usa para N < 30 (p)(q) ]

50

Donde: n= Tamao de la muestra, z= Nivel de confianza, 2,58 para el 99% p= Variabilidad positiva q= 1- p Variabilidad negativa B o e = Precisin o error admitido N 0 Tamao de la poblacin

Ejemplo: Supngase que por estudios anteriores, se tiene conocimiento de que la proporcin de deportistas entre los estudiantes de una universidad es del 0.65. Se pregunta Qu tamao deber tomarse la muestra si se quiere que el error no exceda un 15% y un grado de confianza del 99%? Se sabe que la poblacin estudiantil es de 8,000.

SOLUCIN: Tomemos en cuenta que se sabe que la proporciones de estudiantes que practica un deporte en esa universidad es del 0.65, se puede utilizar este valor como una estimacin de la proporcin verdadera, en cuyo caso nos valdremos de la frmula anterior para calcular el tamao de la muestra. Recordemos que nuestra poblacin es de 8,000 estudiantes, por lo tanto utilizaremos nuestra segunda frmula:

n= Tamao de la muestra, z= 99% = 2.58 p= 0.65 q= 1- 0.65= 0.35 B o e = 0.15 N= 8,000 n = ( z )2 N Sustituyendo: ( e )2 N + [ ( z )2

(p) (q)

. sta frmula se usa para N > 30

(p)(q) ] = (2.58)2

n = ( z )2 N ( p ) ( q ) 1 2 , 1 1 4 . 6 4 8= 66.7421 ( e )2 N + [ ( z )2 180+1.514331 (p)(q) ]

(8000 )

(0.65)

(0.35)

(0.15)2 (8,000) + [ ( 2.58 )2 (0.65 ) (0.35 ) ]

Esto quiere decir que nuestra muestra sera de 67 estudiantes.

51

ACTIVIDADES DE APRENDIZAJE

Resolver los siguientes ejercicios (???), para determinar el tamao de la muestra. La resolucin de los ejercicios ser entregada de manera impresa la siguiente sesin.

3.5

MUESTREO ESTRATIFICADO

El estudiante reconocer y ejemplificar el muestreo estratificado. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados adecuadamente en la muestra.

Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades,...).

La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de diferentes tipos: Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.

Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato. Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin.

52

ACTIVIDADES DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un anlisis en una cuartilla en el que por medio de ejemplos se explique qu es el muestreo estratificado. Se entregar de manera impresa la siguiente sesin. 3.6 MUESTREO POR CONGLOMERADOS

El estudiante conocer y ejemplificar el muestreo por conglomerados.

Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales.

En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos.

53

54

ACTIVIDADES DE APRENDIZAJE

Basndose en el estudio de la bibliografa sugerida, realizar un anlisis en una cuartilla en el que se explique por medio de ejemplos en qu consiste el muestreo por conglomerados.

3.7

OTROS DISEOS Y PROCEDIMIENTOS DE MUESTREO. JUICIO Y CONVENIENCIA

El estudiante describir el muestreo de juicio y conveniencia.

Muestreo de juicio Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida dada. Una muestra de juicio es llamada una muestra probabilstica, puesto que este mtodo est basado en los puntos de vista subjetivos de una persona y la teora de la probabilidad no puede ser empleada para medir el error de muestreo, Las principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es bajo. Muestreo por conveniencia Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamao tiene igual probabilidad de ser seleccionada de la poblacin. Para obtener una muestra aleatoria simple, cada elemento en la poblacin tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este mtodo pude ser reemplazado por una tabla de nmeros aleatorios.

Cuando una poblacin es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos ms comunes de muestreo aleatorio modificado son sistemticos, estratificados y de conglomerados.

55

ACTIVIDADES DE APRENDIZAJE

Basndose en el estudio de la bibliografa sugerida, realizar un anlisis en el que se explique por medio de ejemplos en qu consiste el muestreo por juicio y conveniencia.

3.8

ERROR DE MUESTREO Y DE LA MUESTRA

El estudiante describir el error de muestreo y de la muestra.

Al momento de recopilar los datos que sern procesados se es susceptible de cometer errores as como durante los cmputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitacin y que no son tan fcilmente identificables.

Algunos de estos errores son: Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilacin y en el anlisis de la informacin. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinin que a aquellos que la contradicen. Un caso extremo de sesgo sera la situacin donde primero se toma una decisin y despus se utiliza el anlisis estadstico para justificar la decisin ya tomada. Datos no comparables: el establecer comparaciones es una de las partes ms importantes del anlisis estadstico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables. Proyeccin descuidada de tendencias: la proyeccin simplista de tendencias pasadas hacia el futuro es uno de los errores que ms ha desacreditado el uso del anlisis estadstico. Muestreo Incorrecto: en la mayora de los estudios sucede que el volumen de informacin disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la poblacin a que pertenece la muestra. Si la muestra se selecciona correctamente, tendr bsicamente las

56

mismas propiedades que la poblacin de la cual fue extrada; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada

ACTIVIDADES DE APRENDIZAJE

Basndose en el estudio de la bibliografa sugerida, realizar un anlisis por medio de ejemplos en el que se exponga qu son los errores de muestreo y de la muestra. Se entregar de manera impresa la siguiente sesin.

57

INSTRUCCIONES: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto

y subraye la

1)

Total de observaciones, concebibles en un fenmeno determinado. A) Muestreo B) Poblacin C) Muestreo aleatorio simple D) Muestreo aleatorio estratificado

2) Ciencia cuyo objetivo es reunir informacin cuantitativa concerniente a individuos o grupos, series de hechos, etc. Y deducir de ello gracias al anlisis de estos datos unos significados. A) Estadstica B) Estadstica Inferencial C) Estadstica Descriptiva D) Mtodo estadstico

INSTRUCCIONES: Lea detenidamente respuesta.

y conteste en los espacios en blanco la

1. El tiene los siguientes pasos: definicin de problema, recopilacin de la informacin, obtencin de la informacin, clasificacin, presentacin y anlisis de informacin.

2. Se dice que hay un cuando el individuo da mayor peso a los datos que apoyan su opinin que a aquellos que la contradicen.

3. Los son resmenes de informacin de la muestra que nos "determinan" la estructura de la muestra.

la

58

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (recuerde que la forma de evaluar esta seccin es aciertos menos errores).

1. 2.

La estadstica se divide en estadstica descriptiva e inferencial. La estadstica es la ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima, apoyndose en el uso de grficos. Es la frmula para calcular el tamao de la muestra cuando se conoce la poblacin

( ) ( )

3.

( )

4.

La muestra es una parte o proporcin del total de las observaciones. La estadstica inferencial comprende cualquier actividad relacionada con los datos y est diseada para resumir los mismos sin factores pertinentes adicionales. Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal.

( )

5.

( )

6.

( )

59

UNIDAD 4
ORGANIZACIN DE DATOS

El estudiante comprender analizar y ejecutar el tipo de procedimientos para la organizacin y distribucin de datos.

Temario: 4. ORGANIZACIN DE DATOS 4.1 4.2 4.3 4.4 4.5 4.6 4.7 ANLISIS EXPLORATORIO DE DATOS: DIAGRAMA DE TALLOS Y HOJAS ESCALAS DE MEDICIN: NOMINAL, ORDINAL, DE INTERVALO Y DE RAZN TABLAS DE FRECUENCIA PARA VARIABLES DISCRETAS Y CONTINUAS INTERVALO DE CLASE Y LMITES DE CLASE ANCHURA DE INTERVALO DE CLASE MARCA DE CLASE DISTRIBUCIN DE FRECUENCIA RELATIVA Y ACUMULADA PARA VARIABLES DISTRETAS Y CONTINUAS

60

MAPA CONCEPTUAL ORGANIZACIN DE DATOS 4. ORGANIZACIN DE DATOS

4.1 ANLISIS EXPLORATORIO DE DATOS: DIAGRAMA DE TALLOS Y HOJAS

4.2 ESCALAS DE MEDICIN: NOMINAL, ORDINAL, DE INTERVALO Y DE RAZN

4.3 TABLAS DE FRECUENCIA PARA VARIABLES DISCRETAS Y CONTINUAS

4.4 INTERVALO DE CLASE Y LMITES DE CLASE

4.5 ANCHURA DE INTERVALO DE CLASE

4.6 MARCA DE CLASE

4.7 DISTRIBUCIN DE FRECUENCIA RELATIVA Y ACUMULADA PARA VARIABLES DISTRETAS Y CONTINUAS

61

INTRODUCCIN
En esta cuarta etapa, se pretende mostrar la forma adecuada de organizar los datos que ha arrojado una investigacin, para ello ser necesario disear diagramas de tallo y hoja, conocer las diferentes escalas de medicin, realizar tablas de distribucin de frecuencia y elaborar grficos.

62

4. ORGANIZACIN DE DATOS
4.1 ANLISIS EXPLORATORIO DE DATOS: DIAGRAMA DE TALLOS Y HOJAS

El estudiante conocer el diagrama de tallo y hojas, y lo usar para ordenar los datos de una investigacin. Una tcnica de recuento y ordenacin de datos la constituye los diagramas de Tallos y Hojas. Un diagrama donde cada valor de datos es dividido en una "hoja" (normalmente el ltimo dgito) y un "tallo" (los otros dgitos). Por ejemplo "31" sera dividido en "3" (tallo/ decena) y "1" (hoja/ unidad). Los valores del "tallo" se escriben hacia abajo (vertical) y los valores "hoja" van a la derecha (horizontal) del los valores tallo. El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes individuales dentro de cada grupo.

EJEMPLO: Supongamos la siguiente distribucin de frecuencias 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40 que representan la edad de un colectivo de N = 20 personas y que vamos a representar mediante un diagrama de Tallos y Hojas. Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.

A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo

Por ltimo reordenamos las hojas y hemos terminado el diagrama

63

Los expertos dirn que dicha representacin es un histograma y, en efecto, as es. Los diagramas de Tallos y Hojas adems de ser fciles de elaborar, presentan ms informacin que los histogramas, como veremos ms adelante.

Existe tambin el diagrama de doble tallo o tronco y hojas. En esta grfica duplicamos el nmero de posiciones del tronco dividiendo por la mitad el intervalo que cubre a cada decena.

Con los mismos datos estableceremos el diagrama doble tallo y hoja:

Tallo 2 2 3 3 4 4

Hojas 0 3 4 4 4 5 9 1 1 3 4 6 6 7 9 9 0 0 1 5

Podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribucin 35 38 32 28 30 29 27 19 48 40 39 24 24 34 26 41 29 48 28 22 De ella podemos elaborar sus diagramas de Tallos y Hojas y compararla con la anterior.

64

ACTIVIDADES DE APRENDIZAJE

El estudiante elaborar diversos ejercicios (semejantes al que se presenta) de diagrama de tallo y hoja, en base a la bibliografa sugerida. La siguiente base de datos representa el tiempo (en minutos) que tarda la realizacin de un determinado examen clnico. Construya un diagrama de tallo y hojas.

1 47 21 38 55 4.2

43 40 7 48 27

16 14 28 36 6

28 36 49 22 23

27 23 31 29 42

25 32 22 12 21

26 15 24 32 58

25 31 26 11 23

22 19 41 34 35

26 25 45 42 13

ESCALAS DE MEDICIN: NOMINAL, ORDINAL, DE INTERVALO Y DE RAZN

El estudiante reconocer y distinguir las escalas de medicin.

Para realizar un correcto anlisis de los datos es fundamental conocer de antemano el tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes estadsticos. La clasificacin ms convencional de las escalas de medida las divide en cuatro grupos denominados Nominal, Ordinal, Intervalo y Razn. 1. NOMINAL Son variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia. Este tipo de variables slo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignacin de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lgico. Un ejemplo de este tipo de variables es el Gnero ya que nosotros podemos asignarle un valor a los (A) hombres y otro diferente a las mujeres (B) y por ms machistas o feministas que seamos no podramos establecer que uno es mayor que el otro. O Bien se clasificar a una muestra de personas de acuerdo a la religin que profesan: (1) Cristianos, (2) Judos, (3) Musulmanes, (4) Otros y (5) Sin creencia alguna.

65

A 2. ORDINAL

Son variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia contando con un orden lgico. Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categora es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de educacin, ya que se puede establecer que una persona con ttulo de Postgrado tiene un nivel de educacin superior al de una persona con ttulo de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categoras, ya que no es cuantificable o medible.

3. INTERVALO Son variables numricas cuyos valores representan magnitudes y la distancia entre los nmeros de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicacin y la divisin no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

66

4. RAZN Las variables de razn poseen las mismas caractersticas de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operacin Aritmtica (Suma, Resta, Multiplicacin y Divisin) y Lgica (Comparacin y ordenamiento). Este tipo de variables permiten el nivel ms alto de medicin. Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida.

Debido a la similitud existente entre las escalas de intervalo y de razn, SPSS las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuacin los diferentes procedimientos estadsticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.

No todos los procedimientos estadsticos son realmente tiles para la totalidad de los niveles de medida. Cada uno de los tipos de medida posee ciertas caractersticas, las cuales debemos tener en cuenta en el momento de realizar un anlisis descriptivo. En la tabla encontrars algunos de los procedimientos que resultan ventajosos en los anlisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que esta tabla es slo una muestra de las medidas que se pueden emplear; en algunos textos de estadstica aparecen tablas ms amplias y detalladas de los procedimientos.

67

TABLAS DE FRECUENCIA PARA VARIABLES DISCRETAS Y CONTINUAS

ACTIVIDADES DE APRENDIZAJE.

Renase en un equipo de 3 4 estudiantes y realicen lo siguiente:

De manera individual mencione para cada uno de los siguientes casos, que tipos de variables se estn usando:

68

a) Nmero de msculos de los animales vertebrados. b) Intencin de voto. c) Velocidad que, en un instante dado, llevan las motocicletas que circulan por las carreteras y calles de una gran ciudad espaola. d) Talla de pantalones de los alumnos de tu centro. e) Tipos de zumos que prefieren los adolescentes. f) Temperatura mnima en tu ciudad cada da del ao. g) Las marcas de los coches que circulan en Espaa. h) Deporte practicado por los chicos y chicas de tu centro. i) La duracin de cada pila elctrica producida por una empresa durante un semestre.

4.3

TABLAS DE CONTINUAS

FRECUENCIA

PARA

VARIABLES

DISCRETAS

El estudiante conocer y usar las tablas de frecuencia para variables discretas y continuas. El principal objetivo de la estadstica descriptiva es sintetizar conjuntos de datos mediante tablas o grficos resumen, con el fin de poder identificar el comportamiento caracterstico de un fenmeno y facilitar su anlisis exhaustivo. Frecuencia

Es el nmero de veces que se repite, es decir que aparece, el mismo dato estadstico en un conjunto de observaciones de una investigacin determinada; la frecuencia se designa como: fi

Distribucin de frecuencia: Es una disposicin tabular de datos estadsticos ordenados ascendente o descendentemente con la frecuencia (fi) de cada dato.

Ejemplo: Los datos representan los aos de servicio de 60 empleados de la empresa Mcperro. 10 9 3 5 4 5 6 7 8 9 10 8 4 8 6 3 8 10 7 10 8 3 5 7 8 6 10 9 7 8 5 3 8 7 8 10 8 10 8 7 7 9 8 7 6 5 7 8 8 9 8 10 7 6 7 8 6 7 6 10

69

Procedimiento: Ordenar los datos de menor a mayor, elaborar cuadro de distribucin de frecuencia. Ordena de mayor a menor, usaremos diagrama de tallo y hoja. DIAGRAMA TALLO Y HOJA 3 4 5 6 7 8 9 10 Aos de Serv. 4 2 5 7 12 16 5 9 Frecuencia 0 0 0 0 0 0 0 1 3333 44 55555 6666666 777777777777 8888888888888888 99999 0000000010

Cualquier investigacin que se emprenda puede conducir a la acumulacin de valores cuantitativos y cuasi-cualitativos correspondientes a las diversas medidas efectuadas. Esta posibilidad, convierte a la estadstica en una herramienta vital para el tratamiento de volmenes de datos mediante tablas resmenes conocidas como "Tablas de Frecuencia". Cuando los datos son agrupados, la interpretacin resulta ser ms sencilla. Tablas de Frecuencia: Tablas estadsticas que agrupan diversos valores de una variable, simplificando los datos.

Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se denominan "series estadsticas", tambin conocidas como "distribucin estadstica".

Clasificacin de las series estadsticas: 1. Series temporales o cronolgicas; estas se definen como una masa o conjunto de datos producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo.

Ejemplo:

70

Produccin nacional de madera en Rola en m Rollizos (periodo 1993 1998) Aos Produccin (m rollizos) 1993 1994 1995 1996 1997 1.161.061,454 981.668,626 1.087.926,142 1.440.306,250 1.618.075,000

1998 1.027.177,876 Fuente: MARN D.G.S Recurso Forestal. 1999 CVG PROFORCA

Es importante resaltar que cuando se trata de series temporales o cronolgicas, se debe especificar el instante o el periodo de tiempo a los que se refiere los caracteres en estudio.

Cuando nos referimos a instantes de tiempo, por el hecho de que la observacin se hace en un momento especfico de tiempo.

Ejemplo: Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada ao entre 1997 2001. 2. Series atemporales; cuando las observaciones de un fenmeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu el tiempo no va incluido a cada observacin, puesto que es el mismo tiempo para todas ellas. Este tipo de observacin proporciona una "visin instantnea" de los fenmenos o caracteres de los componentes del colectivo en estudio.

Ejemplo: Las notas de las participantes en la materia de estadstica I en el periodo acadmico que termin en septiembre del 2001. 3. Series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.

71

El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que cada dato se repite, recibe el nombre de tabulacin. Ejemplo: Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla

5 6 3 4

6 3 4 3

5 4 6 6

4 5 5 4

3 4 3 6

Tabulando los datos tenemos Nios distribuidos por edades:

Edad (variable) 3 4 5 6 Total =

N de nios (Frecuencia) 5 6 4 5 20

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se refieran a atributos o variables respectivamente.

4. Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades. Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el atributo, "frecuencia cualitativa".

72

Ejemplo: Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I, respecto a su estado civil.

Estudiantes de la materia Estadsticas I, clasificados por su estado civil. Estado civil Solteros Casados Viudos Divorciados N de Estudiantes (frecuencia) 18 12 1 4

5. Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable.

Ejemplo: Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad. Edad (en aos) 19 20 25 28 32 42 Total = N de estudiantes (frecuencia) 12 2 8 6 4 3 35

6. Series especiales o geogrficas: es aquella que est formada por los valores que toman una variable en funcin del espacio geogrfico. Los cuadros estadsticos estn compuestos por las siguientes partes: 1. Ttulo 2. Encabezado 3. Concepto o columnas 4. Cuerpo

73

5. Nota de encabezado 6. Nota de pie 7. Fuente de datos

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para distinguir las variables discretas y continuas de la bibliografa recomendada.

El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto de la dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos, y ha obtenido los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

Se pide: a) Cul es la poblacin objeto de estudio? b) Qu variable estamos estudiando? c) Qu tipo de variable es? d) Construir la tabla de frecuencias e) Cul es el nmero de familias que tiene como mximo 2 hijos?

4.4 INTERVALO DE CLASE Y LMITES DE CLASE

El estudiante conocer y aplicar el rango de clase y lmites de clase. RANGO El rango de clase, conocido tambin como amplitud de clase o recorrido de clase, es el lmite dentro de los cuales estn comprendidos los valores de la serie de datos, en

74

otras palabras, es el nmero de diferentes valores que toma la variable en un estudio de investigacin dada. Es la diferencia entre el valor mximo de una variable y el valor mnimo que sta toma en una investigacin cualquiera. El rango de una distribucin de frecuencia se designa con la letra R.

UM normalmente es igual a 1, y se obtiene al obtener la diferencia entre 2 o ms datos consecutivos de la serie de valores, sin embargo puede ser menor a la unidad. EJEMPLO OBSERVACIONES A 6, 9 , 11, 12, 19, 20, 26, 27, 32, 33, 39 1 B 0.5, 0.6, 0.10, 0.11, 0.19, 0.21, 0.22 0.1 C 6, 9, 21, 33, 39, 48 3

UNIDAD DE MEDIDA

Para calcular el rango se utiliza la siguiente frmula:

R= XM - Xm + UM
Dnde: R= Rango XM =Dato mayor Xm = Dato menor UM= Unidad de Medida, que por lo general es la unidad.

Con los siguientes datos, que corresponden a los aos de servicio de 60 empleados de la empresa X, calcule el rango de la distribucin de la frecuencia: 3 4 8 5 7 8 5 8 3 3 9 10 4 6 5 8 8 7 5 3 7 7 7 6 6 8 8 8 6 7 7 10 6 10 5 8 8 7 10 8 7 6 9 10 9 10 8 7 10 9 7 8 8 6 8 10 8 7 9 10

R= XM - Xm + UM

SUSTITUYENDO

R= 10 3 + 1 = 8, ENTONCES EL RANGO ES IGUAL A 8. ANCHURA O INTERVALO DE CLASE Son las divisiones o categoras en las cuales se agrupa un conjunto de datos ordenados con caractersticas comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores

75

comprendidos entre los dos lmites (lmite Superior de la Clase y Lmite Inferior de la Clase). LMITE O FORNTERA DE CLASE Las clases de una distribucin de frecuencia indican las cotas o fronteras de cada clase en la distribucin, las clases estn formadas por dos nmeros denominados lmites aparentes (LA), ejemplo 32 37 ; el primero de estos dos (32) se llama lmite inferior aparente (LIA) y el segundo (37) se le denomina lmite superior aparente (LSA). LMITES REALES Los lmites reales o verdaderos de una clase son aqullos que se obtienen restndole media unidad de medida al lmite aparente inferior de una clase y sumndole media unidad de medida al lmite superior aparente de las diferentes clases, es decir, son valores no observables de la variable en estudio, puesto que no lo registra la unidad utilizada. Y se denominarn lmite inferior real (LIR) y lmite superior real (LSR).

En el ejemplo anterior, los lmites reales aparentes quedaran: CLASE 32-37 LIA 32 LSA 37 LIR 31.5 LSR 37.5

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular el rango, identificar los limites aparentes superior e inferior, as como calcular los lmites superior real y lmite inferior real de la bibliografa recomendada Calcule con los siguientes datos el rango y los limites de clase real y aparente. CLASE 57 8 10 11 13 14 16 17 19 20 22 fi 5 10 15 18 11 5 LIA LSA LIR LSR

76

4.5 ANCHURA DE INTERVALO DE CLASE

El estudiante conocer y calcular la anchura de intervalo de clase. TIPOS DE INTERVALOS DE CLASE CLASE DE IGUAL TAMAO Este tipo de clase es el ms utilizado en los clculos estadsticos; cuando todas las clases son del mismo tamao, los clculos relacionados con la distribucin de frecuencia son simplificados grandemente. En trminos generales, este tipo de distribucin es el que se utiliza comnmente en casi todas las investigaciones. Ejemplo: CLASE 57 8 10 11 13 14 16 17 19 20 22 Totales fi 5 10 15 18 11 5 64

CLASE DESIGUAL DE TAMAO Los intervalos de clase son desiguales no son frecuentes en el anlisis estadstico, la utilizacin de los mismos se debe evitar; sin embargo, en algunas investigaciones es indispensable su utilizacin; tal es el caso de las investigaciones que tienen como propsito particular analizar valores que varan en un amplio recorrido de la variable. Cuando se utiliza este tipo de clase de los intervalos de clase deberan ser incrementados de una forma ordenada, de ser posible. Este tipo de clases se utiliza algunas veces para reportar datos relacionados con valuaciones de activos o ingresos personales. Ejemplo: CLASE 100 499 500 999 1000 4999 5000 9999 10000 24999 25000 - 50000 AMPLITUD 399 499 3999 4999 14999 25000

77

CLASE ABIERTA Son aquellas en la que uno de sus dos los lmites de clase no est definido numricamente. Este tipo de clase se utiliza cuando las distribuciones poseen algunos datos u observaciones que son mucho mayores o mucho ms pequeos que los dems y se quiere condensar en uno solo. En lo posible se debe tratar de evitar este tipo de clase ya que en estas condiciones no es posible definir el punto medio de la distribucin, por lo cual se hace difcil la representacin grfica y en realizar otros clculos con los datos que se presentan en los cuadros estadsticos. Sin embargo, existen investigaciones en donde la aplicacin de las clases abiertas es conveniente, por cuanto, la existencia de valores de la serie de datos son mucho menores o mucho mayores que el resto de la serie. Ejemplo: CLASE Menos de 150,000 150,000 239,000 340,000 429,000 430,000 519,000 520,000 609,000 610,000 699,000 700,000 789,000 790,000 y ms TOTALES fi 67 36 10 8 7 8 7 7 135 ? 194,500 384,500 474,500 564,500 654,500 744,500 ?

LA AMPLITUD DE CLASE, LONGITUD O ANCHO DE UNA CLASE Es el nmero de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo ms importante es dar un ancho de longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la prctica. Existe una frmula para determinar Ic y se expresa as:

Ic = R NC
Donde: Ic = Amplitud de clase R= Rango NC = Nmero de clases

78

Con la frmula anterior se puede determinar Ic, conociendo el rango y el nmero de clases. Cuando se tenga duda en determinar la amplitud de clase de una serie de valores, es de gran utilidad utilizar el mtodo sugerido por Hebert, A. Sturges el cual establece que: Ic = R 1 + 3.322 (log N)

Donde: Ic = Amplitud de clase R= Rango N = Nmero total de datos Nota: Normalmente el resultado final es un nmero fraccionario, el cual no es adecuado para la prctica, sin embargo, se puede aplicar la tcnica de redondeo para convertirlo en un nmero entero. Nosotros utilizaremos el mtodo de Sturges para determinar el Ic de una distribucin de frecuencia de clase siempre y cuando el mismo sea aplicable. Ejemplo: Sean los siguientes datos horas extras laboradas por obreros en un mes. Calcule el rango y el intervalo de clase

22 32 54 56 45

39 33 56 33 43

37 26 57 58 40

28 60 58 40 28

23 39 39 36 60

39 33 40 25 41

24 40 34 42 37

38 27 45 33 42

31 34 53 45 31

35 22 52 55 45

36 30 52 29 30

28 31 28 52 28

23 37 36 38 40

27 33 37 28 37

38 41 40 38 28

40 39 26 38 44

22 58 34 32 40

23 59 25 42 39

36 56 23 53 57

27 41 32 58 60

=100 DATOS R = XM Xm + UM R = 60 22 + 1 R = 38+1 R = 39 Ic = R 1 + 3.322 (log n) Ic = 39 1+3.322 (log 100) Ic = 39 1+3.322(2) Ic = 39 1+6.644 Ic = 39 7.644 Ic = 5.102040816

Por lo tanto, el ancho de la clase ser de 5.

79

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular el intervalo de clase de la bibliografa recomendada Calcule con los siguientes datos el rango y el intervalo de clase.

1 47 21 38 55

43 40 7 48 27

16 14 28 36 6

28 36 49 22 23

27 23 31 29 42

25 32 22 12 21

26 15 24 32 58

25 31 26 11 23

22 19 41 34 35

26 25 45 42 13

4.6 MARCA DE CLASE

El estudiante conocer y calcular la marca de clase de una serie de datos. Marca de clase: Es el punto medio de una clase y se obtiene sumando los lmites inferiores (LIA) y superiores de una clase (LSA) y dividiendo el resultado entre dos. La marca de clase la denotaremos como MC

MC = LIA + LSA 2 Donde: M C Marca de clase LIA Lmite inferior aparente LSA Lmite superior aparente

80

Ejemplo: De la siguientes tabla de obtenga la marca de clase CLASE 57 8 10 11 13 14 16 17 19 20 22 Totales fi 5 10 15 18 11 5 64 (LIA + LSA )/2 (5 + 7 )/2 (8 + 10 )/2 (11 + 13 )/2 (14 + 16 )/2 (17 + 19 )/2 (20 + 22 )/2 MC 6 9 12 13 18 21

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular la marca de clase de la bibliografa recomendada Calcule con los siguientes datos la marca de clase. CLASE 57 8 10 11 13 14 16 17 19 20 22 fi 5 10 15 18 11 5 MC

81

4.7 DISTRIBUCIN DE FRECUENCIA RELATIVA Y ACUMULADA PARA VARIABLES DISTRETAS Y CONTINUAS

El estudiante conocer y aplicar la frecuencia relativa y acumulada para variables discretas y continuas. Como vimos anteriormente, la frecuencia es el nmero de veces que se presenta cada valor de la variable. Frecuencia absoluta (fa o fi): Llamaremos as al nmero de repeticiones que presenta una observacin. Se representa por ni.

F1 + F2 + F3 + .FK = N
Frecuencia relativa (fr): Es la frecuencia absoluta dividida por el nmero total de datos, se suele expresar en tanto por uno, siendo su valor -isimo

fi

ni n

La suma de todas las frecuencias relativas, siempre debe ser igual a la unida o 100%. Frecuencia absoluta acumulada (faa): es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La ltima frecuencia absoluta acumulada es igual al n de casos: N1 = n1 N2 = n1+ n2 Nn = n1 + n2

+ . . . . . . + nn-1 + nn=n

Frecuencia relativa acumulada (far), es el resultado de la suma de los distintos valores de la frecuencia relativa, el total de estos valores nos dar como resultado la unidad o el 100% H1 = F1/n H2 = F2/n ----------------------------Hk = Fk/n

82

DISTRIBUCIN DE FRECUENCIAS PARA VALORES NO AGRUPADOS

Ejemplo: En la tabla adjunta se da la distribucin de los 500 hogares de un barrio segn el nmero de sus miembros.

83

DISTRIBUCIN DE FRECUENCIAS PARA VALORES NO AGRUPADOS

Ejemplo 2. La distribucin del presupuesto semanal en alimentacin de un conjunto de 265 familias expresado en euros es el que figura en la tabla siguiente:

84

En este caso se trata de una variable continua con sus valores agrupados en intervalos cuya amplitud es variable. Este tipo de intervalos permite tratar de forma distinta a los valores de la variable, segn donde se localice la mayor parte de las observaciones. En este sentido la amplitud de los intervalos es inversa a la frecuencia de los mismos. Esta forma de proceder evita que la mayor parte de las observaciones se concentre en un solo intervalo o en unos pocos. Frecuencia acumulada menor que (faa < que). Son aquellas frecuencias acumuladas que se forman con el fa o fi de los valores ms pequeos de las variables de cada clase hacia los valores mayores de la misma. Para graficar los polgonos de frecuencias acumuladas (ojiva) fa <que, se utilizan como variables independientes los lmites superiores de cada clase y como ordenada los diferentes valores de la fa <que. Frecuencia acumulada mayor que (faa > que). Son aquellas frecuencias acumuladas que se forman con el fa o fi de los valores mayores de las variables de cada clase hacia los valores menores de la misma. Para graficar los polgonos de frecuencias acumuladas (ojiva) fa >que, se utilizan como variables independientes los lmites inferiores de cada clase y como ordenada los diferentes valores de la fa >que en el plano cartesiano. Ejemplo: CLASE 57 8 10 11 13 14 16 17 19 20 22 Totales fi 5 10 15 18 11 5 64 (faa < que) 5
15 30 48 59 64

(faa > que) 64 59 49 34 16 5

85

Existe una variacin de la Frecuencia acumulada mayor y menor que utilizarse la frecuencia relativa. Ejemplo: CLASE 57 8 10 11 13 14 16 17 19 20 22 Totales fi fr far (faa < que) 5
15 30 48 59 64

y puede

5 10 15 18 11 5 64

7.81%
15.63% 23.44% 28.13% 17.18% 7.81%

7.81%
23.44% 46.88% 75.01% 92.19% 100%

(faa > que) 64 59 49 34 16 5

(far < que) 7.81%


23.44% 46.88% 75.01% 92.19% 100%

(far > que) 100% 92.19% 76.56% 53.12% 24.99% 7.81%

100%

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular la frecuencia acumulada, frecuencia relativa, frecuencia acumulada relativa, frecuencia acumulada < que, frecuencia acumulada > que, frecuencia acumulada relativa < que y frecuencia acumulada relativa > que de la bibliografa propuesta. Calcule con los siguientes datos las frecuencias vistas en este captulo: En una investigacin fueron consultados 350 matrimonios relativamente jvenes sobre la edad de la esposa, se confecciona la siguiente tabla CLASE 15 19 20 24 25 29 30 34 35 39 40 44 45 49 fi 23 28 76 54 60 42 67 fr far (faa < que) (faa > que) (far < que) (far > que)

86

1.

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (recuerde que la forma de evaluar esta seccin es aciertos menos errores). 1. El rango es la diferencia entre el valor mximo de una variable y el valor mnimo que esta toma en una investigacin cualquiera. La frecuencia relativa es la suma sucesiva de cada una de las clases de fr. El lmite de clase es la divisin o categora en la cual se agrupa un conjunto de datos ordenados con caractersticas comunes. ( )

2. 3.

( ) ( )

2.

INSTRUCCIONES: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto

y subraye la

1) Nmero de veces que se repite el mismo dato estadstico en un conjunto de observaciones de una investigacin determinada. A) Frecuencia B) Frecuencia Relativa C) Frecuencia Absoluta D) Frecuencia Acumulada

3.

INSTRUCCIONES: Lea detenidamente y conteste en los espacios en blanco la respuesta correcta. 1. La determina LIA + LSA / 2. es el punto medio de una clase y se

2. La se obtiene de las sumas sucesivas de la frecuencia de cada una de las clases.

3. Para obtener el

real aparente de la clase.

se le suma 0.5

al

87

UNIDAD 5 PRESENTACIN DE DATOS: GRFICAS Y CURVAS

El estudiante determinar la grfica que mejor represente sus datos organizados.

Temario: 5. PRESENTACIN DE DATOS: GRFICAS Y CURVAS 5.1 5.2 5.3 5.4 GRFICA PARA DATOS CUALITATIVOS: GRFICA DE BARRAS Y DE PASTEL GRFICA PARA DATOS CUANTITATIVOS: HISTOGRAMAS, POLGONOS DE FRECUENCIA Y OJIVAS GRFICAS DE LNEAS DE SERIES DE TIEMPO DIAGRAMAS DE CAJA

88

MAPA CONCEPTUAL
PRESENTACIN DE DATOS: GRFICAS Y CURVAS

5. PRESENTACIN DE DATOS: GRFICAS Y CURVAS

5.1 GRFICA PARA DATOS CUALITATIVOS: GRFICA DE BARRAS Y DE PASTEL

5.2 GRFICA PARA DATOS CUANTITATIVOS: HISTOGRAMAS, POLGONOS DE FRECUENCIA Y OJIVAS

5.3 GRFICAS DE LNEAS DE SERIES DE TIEMPO

5.4 DIAGRAMAS DE CAJA

89

INTRODUCCIN
En esta unidad podremos apreciar los principales medios a travs de los cuales podremos llevar una direccin efectiva dentro de una organizacin

90

5. PRESENTACIN DE DATOS: GRFICAS Y CURVAS


5.1 GRFICA PARA DATOS CUALITATIVOS: GRFICA DE BARRAS Y DE PASTEL

El estudiante diferenciar y aplicar las grficas para datos cualitativos (barras y pastel) GRAFICA DE BARRAS El tipo de representacin grfica depende en gran medida de la naturaleza del carcter de los elementos de la poblacin con el que se est trabajando. As, si se trata de una variable se recurrir al diagrama de barras en el caso de que sea discreta y sus valores no estn agrupados.

Este diagrama se realiza haciendo uso de un sistema cartesiano en el que sobre el eje de abscisas se ponen los valores de la variable y sobre el de ordenadas las frecuencias, tanto absolutas (ni) como relativas (fi). Un ejemplo de este tipo de grfico es el que se da en la Figura 1, donde se han representado los datos.

Ejemplo 1. Hay que sealar que la anchura de las barras ser, en cualquier caso, una cuestin de esttica, pues la misma no hace alusin, en ningn caso, ni al valor de la variable ni la frecuencia del mismo. Dicho de otra forma, la superficie de la misma es independiente de la magnitud que se representa. En este sentido tan vlido es el diagrama dado en la Figura 1 como el de la Figura 2.

Tanto en la Figura 1 como en la Figura 2 se ha representado las frecuencias absolutas. Pero estas figuras no habran cambiado para nada si en su lugar si se hubiera trabajado con las frecuencias relativas. La nica diferencia es que el eje de ordenadas tomara como valor mximo la unidad, pero la proporcin entre las barras no cambia de un grfico a otro.

91

92

Otro ejemplo de su representacin, en forma horizontal:

GRAFICA CIRCULAR O DE PASTEL, TARTA O PAY La grfica de pastel (tambin llamado grfico de sectores es una grfica que consiste en representar por medio de una circunferencia los datos de una investigacin. Por lo que se dividen los sectores en variables de estudio. Esta grfica se dividir en tantos sectores como variables tenga la investigacin en estudio; la magnitud de cada sector se encontrar en relacin directa con la magnitud de la variable a representar con 360. En general los datos que se representan por medio de esta diagrama son parte componentes de un total.

Para su elaboracin se procede de la siguiente forma: se considera la circunferencia como representacin total de la investigacin de estudio, por tal motivo, se dividir la superficie en las secciones que tenga la investigacin, las superficies sern proporcionales a la magnitud que corresponda a cada una de ellas.

93

EJEMPLO:

En general, son muy variados los estilos para las grficas circulas, de pay, de pastel o de tarta. EJEMPLOS:

94

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para elaborara grficas de pastel y de barras, de la bibliografa recomendada. Elabore una grfica de pay y una de barras con los siguientes datos obtenidos en una investigacin fueron consultados 350 matrimonios acerca de los lugares que prefieren visitar con sus hijos en verano y, se confeccion la siguiente tabla: Clase Museos Parque de diversiones Parque acutico Playa Zoolgico Teatro Acuario Cine Otros TOTALES Fi 8 45 50 63 47 12 18 33 24 350 Far

360

5.2 GRFICA PARA DATOS CUANTITATIVOS: HISTOGRAMAS, POLGONOS DE FRECUENCIA Y OJIVAS

El estudiante reconocer y representar grficamente los datos cuantitativos en histogramas, polgonos de frecuencia y ojivas. Cuando la naturaleza de la variable sea continua, entonces la representacin grfica ms adecuada es el histograma o tambin conocido como histograma de frecuencias. Este tipo de grficos podra utilizarse tambin en los casos de variables discretas con valores agrupados, aunque no resulta aconsejable hacer uso de los histogramas para variables discretas por los problemas que conlleva asimilar una variable discreta a otra de tipo continuo.

Un histograma se realiza tambin haciendo uso de un sistema cartesiano, donde sobre el eje de abscisas se llevan los valores de la variable. Pero ahora ya no se trata de

95

valores puntuales, sino de intervalos, y sobre stos se levantan rectngulos, que tienen por base la amplitud del intervalo y por altura su frecuencia. El rea de esos rectngulos deber ser siempre proporcional a la frecuencia, de manera que cuando la amplitud de los intervalos no sea constante, entonces la altura de los rectngulos no ser la frecuencia sino lo que se conoce como densidad de frecuencia. Ejemplo:
Clase 20 24 25 29 30 34 35 39 40 44 45 49 50 54 55 59 60 64 Fi 8 15 16 21 16 4 6 11 3 Fa 8 23 39 60 76 80 86 97 100

POLIGONO DE FRECUENCIA Es un diagrama de lneas que representa los puntos medios y las respectivas frecuencias de clase. En una representacin grfica cerrada de una distribucin de frecuencia. Es otra forma de graficar valores de una distribucin de frecuencia de clase. No existe ninguna razn estadstica para seleccionar los polgonos de frecuencia en vez de los histogramas, o viceversa, los histogramas, simplemente representan una manera de graficar y los polgonos de frecuencia otra; la diferencia radica en que una barra vertical rectangular representa una clase y su frecuencia en el histograma y un punto cumple la misma funcin en el polgono de frecuencia.

96

Caractersticas de los polgonos de frecuencias


No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cuantitativos. El punto con mayor altura representa la mayor frecuencia. Suelen utilizarse para representar tablas tipo B. El rea bajo la curva representa el 100% de los datos. El polgono de frecuencia est diseado para mantener la misma rea de las columnas. Analicemos una porcin de nuestro grfico para probar esta afirmacin:

Observe que cada lnea corta una porcin de la columna, pero a su vez, agrega una porcin adicional. Ambas porciones son iguales (triangulo rectngulos iguales), manteniendo el rea global en el grfico.

Ej e m p l o : L a s t e m p e r a t u r a s e n u n d a d e o t o o d e u n a c iu d a d h a n s uf r ido las s ig uient es var iac iones:

Hora 6 9 12 15 18 21 24

Temperatura 7 12 14 11 12 10 8

OJIVA La ojiva es una grfica asociada a la distribucin de frecuencias, es decir que en ella se permite ver cuntas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los nmeros asignados a cada intervalo.

La ojiva apropiada para informacin que presente frecuencias mayores que el dato que se est comparando tendr una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendr una pendiente positiva. Una grfica

97

similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por esto la aplicacin de la tcnica es parcial): Un extremo de la ojiva no se amarra al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma: La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est sobre la frontera de clase 4:00 se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el nmero de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de observaciones antes de la hora que seala la frontera).

Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que, que se acaba de usar, pero con una distribucin porcentual:

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se dira: despus de las 4:00

98

horas). De forma anloga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el nmero de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de observaciones antes de la hora que seala la frontera).

Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que, que se acaba de usar, pero con una distribucin porcentual:

OTROS GRFICOS Pictograma: Se suele utilizar para expresar un atributo. Se suelen utilizar iconos que se identifiquen con la variable (ejemplo los habitantes de una ciudad) y su tamao suele guardar relacin con la frecuencia

99

Cartograma se representa mediante un diagrama convencional insertado en un mapa geogrfico de una zona. Por ejemplo en un mapa de la Sudamrica representando el analfabetismo.

100

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para elaborara grficas de frecuencia, histogramas y ojivas, de la bibliografa recomendada. En una investigacin fueron consultados 350 matrimonios relativamente jvenes sobre la edad de la esposa, se confecciona la siguiente tabla, elabore la grfica polgono de frecuencia, histogramas, pictogramas y ojivas. CLASE 15 19 20 - 24 25 - 29 30 - 34 35 - 39 40 44 45 - 49 fi 23 28 76 54 60 42 67 fr far (faa < que) (faa > que) (far < que) (far > que)

101

5.3 GRFICAS DE LNEAS DE SERIES DE TIEMPO

El estudiante reconocer y representar grficamente las lneas de series de tiempo.

Toda institucin, ya sea la familia, la empresa o el gobierno, necesita realizar planes para el futuro si desea sobrevivir o progresar. La planificacin racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsin se suele basar en lo ocurrido en el pasado. La tcnica estadstica utilizada para hacer inferencias sobre el futuro teniendo en cuenta lo ocurrido en el pasado es el ANLISIS DE SERIES TEMPORALES.

SERIES TEMPORALES: Tratamos de hacer predicciones sobre esa magnitud, teniendo en cuenta sus caractersticas histricas o del pasado. Se define una serie temporal (tambin denominada histrica, cronolgica o de tiempo) como un conjunto de datos, correspondientes a un fenmeno econmico, ordenados en el tiempo.

Ejemplos: N de accidentes laborales graves en las empresas de ms de 500 empleados de Sevilla, durante los ltimos 5 aos. Ventas de nuestra empresa en los ltimos 10 aos. Cantidad de lluvia cada al da durante el ltimo trimestre.

Los datos siguientes corresponden al nmero de contratos nuevos realizados por las empresas de menos de 10 empleados, durante el perodo 1996-2000.

102

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para elaborara grficas de series de tiempo, de la bibliografa sugerida. Elabore el siguiente ejercicio: Supongamos que tenemos el nmero de kg de carne de vaca consumidos por trimestre durante los ltimos aos en unos grandes almacenes.

Elabore la grfica de series de tiempo.

103

5.4 DIAGRAMAS DE CAJA

El estudiante reconocer y utilizar los diagramas de caja.

Utilizando un diagrama de tallo y hojas, podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribucin 35 38 32 28 30 29 27 19 48 40 39 24 24 34 26 41 29 48 28 22 De ella podemos elaborar sus diagramas de Tallos y Hojas y compararla con la anterior.

Teniendo en cuenta que con las representaciones anteriores los datos estn ordenados, podemos aprovechar estas disposiciones para representar los diagramas de Cajas y Bigotes (boxplots o box and whiskers). Estos diagramas se basan en los siguientes parmetros de la distribucin: valor mnimo, los cuartiles Q 1, Q 2 y Q 3 y el valor mximo. Para la primera distribucin

Cuartiles Cuartil Primero (Q1). Es el valor mayor que el 25% de los valores de la distribucin. Para la misma, como N = 20 resulta que N/4 = 5; la media aritmtica de dicho valor y el siguientes es (24 + 25) / 2 = 24,5 que es el primer cuartil. Anlogamente se calculan los restantes cuartiles. El Segundo Cuartil Q2 es, evidentemente, la mediana de la distribucin

Su diagrama de Cajas y Bigotes es

El bigote de la izquierda representa al colectivo de edades

104

(Xmn, Q1); la primera parte de la caja a (Q1, Q2), la El Tercer Cuartil es segunda (Q2, Q3) y el bigote de la derecha viene dado por el valor que (Q3, Xmx). sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta (39 + 39) / 2 = 39 Podemos obtener abundante informacin de una distribucin a partir de dichas representaciones. Veamos alguna. La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la poblacin estn ms dispersas que entre el 50% y el 75%.

El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms jvenes estn ms concentrados que el 25% de los mayores.

El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 aos. Seguro que t podrs obtener ms informacin (Utiliza la mediana!). Por ltimo, comparamos, mediante los diagramas de Cajas y Bigotes, las dos distribuciones tratadas.

105

A partir de dicha comparacin puede obtenerse bastante informacin de ambas distribuciones

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para bibliografa sugerida.

elaborara diagramas de caja, de la

106

1.

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (recuerde que la forma de evaluar esta seccin es aciertos menos errores). 1. El diagrama de cajas y bigotes se basa en los siguientes parmetros de la distribucin: valor mnimo, los cuartiles Q 1, Q 2 y Q 3 y el valor mximo. El polgono de frecuencia es un diagrama de lneas que representa los puntos medios y las respectivas frecuencias de clase. En una representacin grfica cerrada de una distribucin de frecuencia. Cuando la naturaleza de la variable sea discreta, entonces la representacin grfica ms adecuada es el histograma o tambin conocido como histograma de frecuencias. La ojiva es una grfica asociada a la distribucin de frecuencias, es decir que en ella se permite ver cuntas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los nmeros asignados a cada intervalo. ( )

2.

3.

4.

2.

INSTRUCCIONES: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto

y subraye la

1. Diagrama en forma de columna, conjunto de rectngulos paralelos en el que la base representa la clase de la distribucin y en su altura la magnitud que alcanza la frecuencia correspondiente. A) B) C) D) Grfica de barras Polgono de frecuencia Histograma Ojiva

107

3.

INSTRUCCIONES: Lea detenidamente y conteste en los espacios en blanco la respuesta correcta.

1. La grfica de consiste en representar por medio de una circunferencia o crculo las magnitudes que expresan los datos de un estudio determinado. 2. El _es un diagrama de lneas que representa los puntos medios y las respectivas frecuencias de una distribucin de frecuencia de clase. 3. La grfica se elabora con los valores de las frecuencias acumuladas (menor que y mayor que) y los lmites de las clases de una distribucin de frecuencia. La lnea puede ser ascendente o descendente. 4. Se define una como un conjunto de datos, correspondientes a un fenmeno econmico, ordenados en el tiempo.

INSTRUCCIONES: Observe detenidamente los siguientes grficos y escriba el tipo de grfico que corresponda, segn sea el caso.

108

109

UNIDAD 6 MEDIDAS DE POSICIN DE TENDENCIA CENTRAL

El estudiante distinguir y ejecutar el tipo de procedimiento de anlisis que mejor se adecue para la interpretacin de sus datos. Temario:

6.

MEDIDAS DE POSICIN DE TENDENCIA CENTRAL 6.1 6.2 6.3 6.4 6.5 6.6 6.7 MEDIA ARITMTICA O PROMEDIO PARA DATOS AGRUPADOS Y NO AGRUPADOS MEDIANA PARA DATOS AGRUPADOS Y NO AGRUPADOS LA MODA LA MEDIA GEOMTRICA PROMEDIO MVIL MEDIA ARMNICA DECILES, CUARTILES Y PERCENTILES

110

MAPA CONCEPTUAL MEDIDAS DE POSICIN DE TENDENCIA CENTRAL

6. MEDIDAS DE POSICIN DE TENDENCIA CENTRAL

6.1 MEDIA ARITMTICA O PROMEDIO PARA DATOS AGRUPADOS Y NO AGRUPADOS

6.2 MEDIANA PARA DATOS AGRUPADOS Y NO AGRUPADOS

6.3 LA MODA

6.4 LA MEDIA GEOMTRICA

6.5 PROMEDIO MVIL

6.6 MEDIA ARMNICA

6.7 DECILES, CUARTILES Y PERCENTILES

111

INTRODUCCIN
En esta unidad se describirn las medidas de tendencia central o los valores tpicos de un conjunto de observaciones presentadas.

112

6.

MEDIDAS DE POSICIN DE TENDENCIA CENTRAL


6.1 MEDIA ARITMTICA O PROMEDIO PARA DATOS AGRUPADOS Y NO AGRUPADOS

El estudiante aplicar la media aritmtica o ponderada para datos agrupados y no agrupados.

Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo nmero. Para tal fin, desde luego, no se usar el valor ms elevado ni el valor ms pequeo como nico representante, ya que solo representan los extremos ms bien que valores tpicos. Entonces sera ms adecuado buscar un valor central. Las medidas que describen un valor tpico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos ms bien que a individuos. Un promedio es una caracterstica de grupo, no individual. Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.

Entre las medidas de tendencia central tenemos:


Media Mediana Moda Cuartiles Deciles Percentiles

La medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente abreviada como media.

La media aritmtica de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n. La media para datos no agrupados Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores dividida entre el nmero total de valores. Para encontrar la media de una muestra se usa la siguiente frmula:

113

Donde: = es la media de la muestra es la suma de todos los valores de la muestra = N= Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin es en ml: 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la media aritmtica de estas observaciones? es el nmero de elementos de la muestra

85.4 + 85.3 + 84.9 + 85.4 + 84.0 = 5 = 85.0

La media para datos agrupados Frecuentemente los datos ests agrupados y presentados en forma de distribucin de frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales. Por consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en base a la distribucin de frecuencias.

La media aritmtica de una muestra de datos organizados en una distribucin de frecuencias se calcula de la siguiente manera:

Donde: = Xi = ni = simboliza la media de la muestra es la marca de clase es la frecuencia de clase es la suma de los productos de f por X es la suma de las frecuencias de clase

= n

114

Ejemplo: Calcular la media aritmtica de la siguiente distribucin de frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche. Como vemos es la distribucin de frecuencia que elaboramos en la seccin anterior. CLASE Frecuencia duracin de las bateras (meses) Nmero de bateras 15 19 20 24 25 29 30 34 35 39 40 44 45 49 2 1 4 15 10 5 3

Damos como un hecho que ya sabemos elaborar una distribucin de frecuencias, si se quiere ver como se elabor vaya a la seccin de ese tema en este mismo sitio.

Primeramente, de la distribucin de frecuencias que ya tenemos, utilizaremos la marca de clase y la frecuencia de clase, para despus calcular el producto fX y proceder finalmente a calcular la sumatoria fX y aplicar la frmula. LI LS X o MC fi o ni 15 19 20 24 25 29 30 34 35 39 40 44 45 49 17 22 27 32 37 42 47 2 1 4 15 10 5 3 n =40 (x.fi) 34 22 108 480 370 210 141 = 1365

1365 = 40 = 34.12

115

116

117

118

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular la media para datos agrupados y no agrupados, de la bibliografa sugerida. Elabore los siguiente ejercicio:

a) Con los siguientes datos, calcule la media para datos agrupados.

Clase 10-20 20-40 40-50 50-70 70-80 80-100

Fi 15 30 45 60 75 90

b) Con los siguientes datos calcule la media para datos no agrupados.


1 47 43 40 16 14 28 36 27 23 25 32 26 15 25 31 22 19 26 25

6.2

MEDIANA PARA DATOS AGRUPADOS Y NO AGRUPADOS

El estudiante resolver problemas respecto a la media para datos agrupados y no agrupados. La mediana datos no agrupados Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la media aritmtica no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana.

La mediana (Me) es el punto medio de los valores de una serie de datos despus de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos.

119

Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la mediana de las observaciones muestreadas? 85.4 85.4 85.3 Me 84.9 84.0

Ejemplo: Una muestra de los honorarios de paramdicos cargados por la clnica Baltimore revel estas cantidades: $35, $29, $30, $25, $32, $35. Cul es la mediana? 25 29 30 Me 32 35 35

Cuando los datos se encuentran ya acoplados en una tabla de frecuencia, se podr realizar el procedimiento anterior, o bien el siguiente: Tabla de frecuencia

120

Donde: Me = Mediana ni = Son las frecuencias de los datos Sustituyendo: Me = 3+4+9+10+7+2 = 35 = 17.5 2 2 La mediana para datos agrupados Cuando los datos se encuentran agrupados en una distribucin de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos:

1. Calcular el valor n / 2 2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o mayor que n / 2. 3. Aplicando la siguiente frmula con los valores del intervalo mediano:

Donde: Me = Mediana L i - 1 = Lmite inferior de la clase de la mediana ni = Frecuencia de la clase de la mediana N = Total de datos o frecuencias N i - 1 = Frecuencia acumulada anterior a la mediana a = Intervalo de clase de la clase de la mediana

121

PROPIEDADES DE LA MEDIANA

122

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular la mediana para datos agrupados y no agrupados, de la bibliografa sugerida. Elabore los siguientes ejercicios: a) Con los siguientes datos, calcule la mediana para datos agrupados. Clase 1 12 13 24 25 36 37 48 49 - 60 fi 5 14 19 9 3

b) Con los siguientes datos calcule la mediana para datos no agrupados.


1 47 43 40 16 14 28 36 27 23 25 32 26 15 25 31 22 19 26 25

6.3 LA MODA

El estudiante solucionar problemas de moda para datos agrupados y no agrupados. La moda para datos no agrupados La moda (Mo) es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal y nominal. La moda. Es el valor de la observacin que aparece ms frecuentemente. Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la moda de las observaciones muestreadas? Mo = 85.4 La moda para datos agrupados

123

Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada por la marca de clase del intervalo que contenga la frecuencia de clase ms grande. Si hay dos intervalos contiguos con frecuencia mxima la moda ser la media aritmtica de las dos marcas de clase.

Si hay dos o ms intervalos no contiguos con frecuencia de clase mxima habr dos o ms modas que sers las marcas de clase de dichos intervalos.

124

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para calcular la moda para datos agrupados y no agrupados, de la bibliografa sugerida. Elabore los siguientes ejercicios:

c) Con los siguientes datos, calcule la moda para datos agrupados. Clase 1 12 13 24 25 36 37 48 49 - 60 fi 5 14 19 9 3

d) Con los siguientes datos calcule la moda para datos no agrupados.


1 48 43 40 16 14 28 36 27 23 25 32 26 15 25 31 22 19 26 25

6.4 LA MEDIA GEOMTRICA

El estudiante aplicar la media geomtrica en los casos presentados.

Sea una distribucin de frecuencias (x i , n i ). La media geomtrica, que denotaremos por G. se define como la raz N-sima del producto de los N valores de la distribucin.

Si los datos estn agrupados en intervalos, la expresin de la media geomtrica, es la misma, pero utilizando la marca de clase (Xi). El empleo ms frecuente de la media geomtrica es el de promediar variables tales como porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas.

125

Ventajas e inconvenientes: En su clculo intervienen todos los valores de la distribucin. Los valores extremos tienen menor influencia que en la media aritmtica. Es nica. Su clculo es ms complicado que el de la media aritmtica.

Adems, cuando la variable toma al menos un xi = 0 entonces G se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las races de ndice par de nmeros negativos.

Ejemplo Las tasas de crecimiento de la economa de un pas durante diez aos son las que aparecen en la tabla siguiente:

Se trata de un promedio que, para su clculo, al igual que la media aritmtica, hace uso de toda la informacin de la variable. Sin embargo es menos sensible a los valores extremos de lo que lo es la media aritmtica. Frente a estas ventajas o virtudes, este nuevo promedio tiene algunas limitaciones. Entre ellas destacaremos:

a) es menos intuitivo que la media aritmtica; b) su clculo no es tan inmediato;

126

c) en ocasiones no queda determinada.

Si algn valor de la variable es nulo, entonces G se anula. Si la variable toma valores negativos este promedio da problemas. La media geomtrica se utiliza especialmente para promediar porcentajes, tasas, nmeros ndices, etc., y siempre que la variable presente variaciones acumulativas.

ACTIVIDADES DE APRENDIZAJE

El estudiante realizar ejercicios para bibliografa sugerida. 6.5 PROMEDIO MVIL

calcular la media geomtrica, de la

El estudiante aplicar el promedio mvil.

Consiste en obtener un valor futuro de la variable de estudio a partir de una serie histrica de los valores de la variable. El procedimiento consiste en obtener una media aritmtica eligiendo de antemano el tamao de la muestra e incorporando al promedio obtenido el valor de la variable siguiente hasta completar toda la serie histrica.

Para pronostica el valor futuro se procede a obtener el error cuadrtico medio y ste valor obtenido se le incorpora al ltimo promedio obtenido y as sucesivamente. Con este mtodo lo que se hace es suavizar la serie promediando los valores de la misma para periodos de tiempo fijos pero que se desplazan a lo largo de todo el horizonte de la serie. El resultado de este proceso mecnico es la eliminacin de los movimientos a corto y medio plazo as como las irregularidades debidas a factores no controlables ni predecibles. Es decir, a la serie se le quitan tres de sus componentes y se le deja solo la cuarta, la tendencia. La idea que subyace detrs de este mtodo es que la media de cualquier conjunto de valores sirve para eliminar la dispersin o variabilidad de la serie motivada por factores coyunturales o espordicos. Este mtodo de suavizado consiste, como se ha indicado, en promediar la serie. Estos promedios sern las medias aritmticas de un conjunto k de valores consecutivos, con el requisito de que k sea inferior al total de observaciones. El procedimiento especfico sera el siguiente. Supngase que k es un entero impar. Entonces las sucesivas medias se obtendran de forma siguiente:

127

A la media * t y se le llama centrada porque al ser impar el nmero de sumandos con el que se ha obtenido, la media resultante se le hace corresponder con la observacin del momento t, que es el valor central de la suma. Segn esta expresin de clculo, la primera media que se puede calcular es la correspondiente al grupo de valores cuya observacin central se corresponde al instante:

Siendo en este caso la primera observacin y0, Una vez obtenida esa media, la siguiente se calcula para los k valores que tienen por observacin central la del periodo t+1, y as sucesivamente. Esta forma de obtener medias eliminando la primera observacin del grupo y aadiendo la siguiente es lo que le da el adjetivo de mvil a las mismas. Par fijar un poco las ideas supongamos que k=5. En tal caso, las sucesivas medias mviles vendran dadas por:

Ahora bien, si k fuera par, entonces la media de esos k valores no se correspondera con ninguno de los observados de la serie original, sino con el punto medio de los dos centrales. Pero ese instante no es observable (t= (k- 1 )/2), no sera un entero), por lo que las medias calculadas de esta forma habra que promediarlas de dos en dos y de

128

forma sucesiva para que el resultado si fuera una serie de valores (medias) centrados, es decir, que se correspondan con valores para periodos o instantes de tiempo observados.

Esta serie no centrada se obtendra mediante la expresin:

Otra cuestin importante a la hora de calcular las medias mviles es determinar cuntas observaciones deben tomarse en cada caso. Si k es muy grande entonces el proceso de suavizado puede llegar a ser tan fuerte que se pierda ms informacin de la deseada. Piense en la situacin extrema de que k fuera igual al total de observaciones. En ese caso solo habra una media, por lo que el suavizamiento de la serie sera mximo, tanto que no habra ni tendencia ni componente alguna. Por esta razn k no debe ser demasiado grande, pues se podra incurrir en un suavizado excesivo. En general, cuanto mayor es k, menor ser el nmero de trminos de la serie suavizada resultante (se pierden observaciones al principio y al final de la serie). En conclusin, si se toma un grupo de observaciones muy alto se incurre en el peligro de perder informacin por dos vas: a) la serie se suaviza ms de lo necesario, ocultando ciertos movimientos tendenciales; b) el nmero de trminos de la nueva serie se reduce considerablemente, y perder datos nunca es bueno.

Por el contrario, si k es muy pequeo entonces no se conseguirn eliminar todas las perturbaciones ajenas a la tendencia. De forma similar a como se razon antes, si k=1, entonces la serie original y la suavizada coinciden, con lo cual no se ha conseguido nada. En algunos casos, ese valor de k es fcil de determinar. As ocurre cuando la serie muestra un patrn de comportamiento que se repite de manera sistemtica cada k periodos de tiempo. Tal sera el caso de la estacionalidad. Si se trabaja con datos mensuales y la serie est sometida a un esquema de estacionalidad que se repite todos los aos, entonces la forma de suavizar esa serie y eliminar la componente estacional sera tomar una media mvil de doce meses (k = 12). A la serie resultante se le habran eliminado dos componentes: la estacionalidad y las variaciones

129

accidentales. Pero al ser k par, la serie resultante no estara centrada, por lo que habra que volver a tomar medias mviles con k = 2. Una vez que de la serie original se han eliminado esas dos componentes cabra preguntarse cmo proceder con las variaciones cclicas. En este caso la eleccin de k es ms difcil, pues los ciclos no son movimientos de la serie que se repitan con una periodicidad fija, como ocurre con la estacionalidad. En estos casos, si esa periodicidad no puede determinarse de forma clara y sin que perjudique notoriamente a los resultados, la mejor forma de proceder es trabajar con lo que ha dado en denominarse componente ciclo-tendencia.

En el esquema presentado hasta el momento, para la obtencin de la tendencia mediante medias mviles, se ha trabajado con el supuesto de que los datos tenan una periodicidad inferior al ao (semestres, cuatrimestres, trimestres, meses, etc.) lo que implicaba aceptar la posibilidad de que esa serie presentara estacionalidad. Ahora bien, si los datos fueran anuales entonces la estacionalidad quedara descartada, pues las nicas componentes de la serie seran la tendencia, los ciclos y las variaciones accidentales. Esta nueva situacin nos lleva a que sea poco verosmil que la serie presente un esquema repetitivo a lo largo del tiempo tan estable como presentaban las variaciones estacionales. Ante estas circunstancias se hace difcil saber cul debiera ser el nmero adecuado de observaciones que debieran tomarse para calcular las medias mviles. La forma de salir de esta situacin incmoda es obtener medias mviles de tres o cinco datos (nmero impar y pequeo) para de esa forma eliminar la componente accidental. Una vez que se ha procedido de esta forma, la serie suavizada resultante contiene una mezcla de ciclo-tendencia. Si la componente cclica fuera regular con periodos definidos y fijos, entonces la tendencia se obtendra aplicando una media mvil con un k igual a la longitud del ciclo. Pero es poco probable que los ciclos tengan ese comportamiento tan sistemtico, por lo que quizs la mejor solucin sea, como se indic en el prrafo anterior, no manipular ms los datos y trabajar con esa mixtura de componentes ciclo-tendencia.

Este mtodo de obtencin de la tendencia presenta, frente a su sencillez, algunos inconvenientes que deben ser sealados. Al igual que en el mtodo grfico, tambin aqu se introduce un cierto grado de subjetividad, pues la eleccin del nmero de observaciones a promediar queda a la eleccin del analista y, salvo que sea muy claro cul debe ser ese nmero (caso de la estacionalidad), esa decisin no siempre es la acertada, por lo que los valores de la componente tendencia variaran segn quin los calcule. Por otro lado, esta forma de obtener la tendencia no permite alcanzar el objetivo de la prediccin en el anlisis de las series temporales, pues la tendencia obtenida mediante medias mviles no permite que se proyecte hacia el futuro.

Ejemplo. Obtngase la tendencia de la serie que se muestra en la siguiente Tabla mediante medias mviles.

En este caso, dado que los datos son mensuales y la serie muestra una clara componente estacional que se repite todos los aos, el periodo de la media mvil debe

130

ser de doce datos (doce meses). Pero al ser par el valor de k se deben tomar medias mviles en dos ocasiones. Primero con k=12 y despus con k = 2, para de esta forma obtener una serie centrada, que ser la tendencia, pues, como puede observarse, la serie original, para el conjunto de aos considerado, no muestra componente cclica clara. Los resultados de estas operaciones son los que aparecen en las dos Tablas posteriores. Adicionalmente, en la Figura, se ha vuelto a representar la serie original y la suavizada que recoge la tendencia. Esta ltima tiene menos observaciones que la primera. En este caso se ha perdido doce datos, seis al inicio y seis al final. La forma en la que se han obtenido esos datos es la siguiente:

131

132

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas del promedio mvil, de la bibliografa sugerida. 6.6 MEDIA ARMNICA

El estudiante aplicar la media armnica en diversas situaciones.

La media armnica, que representaremos por H, se define como sigue:

Obsrvese que la inversa de la media armnica es la media aritmtica de los inversos de los valores de la variable. No es aconsejable en distribuciones de variables con valores pequeos. Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc. Ventajas e inconvenientes: En su clculo intervienen todos los valores de la distribucin. Su clculo no tiene sentido cuando algn valor de la variable toma valor cero. Es nica.

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de media armnica, de la bibliografa sugerida.

133

6.7 DECILES, CUARTILES Y PERCENTILES

El estudiante interpretar los deciles, cuartiles y percentiles. CUARTILES Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. No son cuatro como pensamos al inicio, son tres cuartiles los que dividirn en cuatro partes la curva normal, y se denotan por Q1, Q2 y Q3:

Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos agrupados es la siguiente:

134

k= 1,2,3 Donde: Lk = Lmite real inferior de la clase del cuartil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente:

El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones.

Frmula de Q1, para series de Datos agrupados:

Donde: L1 = lmite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase

El segundo cuartil Q2, (coincide, es idntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores.

Frmula de Q2, para series de Datos agrupados:

Donde: L1 = lmite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase

135

El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones. Frmula de Q3, para series de Datos agrupados:

Donde: L1 = lmite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil. Para Datos No Agrupados Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las siguientes frmulas:

El primer cuartil:

Cuando n es par:

Cuando n es impar:

Para el tercer cuartil

Cuando n es par:

Cuando n es impar:

DECILES Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de

136

datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.

Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento acadmico.

Ya sabemos que para dividir la curva normal en diez partes debemos de tener nueve Deciles.

Datos Agrupados Para datos agrupados los deciles se calculan mediante la frmula.

k= 1,2,3,... 9 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra frmula para calcular los deciles: El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones.

137

El quinto decil corresponde a la mediana.

El noveno decil supera al 90% y es superado por el 10% restante.

Donde (para todos): L1 = lmite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:

Cuando n es par: Cuando n es impar: Siendo A el nmero del decil. CENTILES O PERCENTILES Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99.

138

EJEMPLO GRFICA PERCENTIL

139

Datos Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la frmula:

k= 1,2,3,... 99 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k

Otra forma para calcular los percentiles es: Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.

El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.

El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:

140

Para los percentiles, cuando n es par:

Cuando n es impar: Siendo A, el nmero del percentil.

Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75. EJEMPLO Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla: Salarios (I. De Clases) 200-299 300-299 400-499 500-599 600-699 700-800 No. De Empleados (f1) 85 90 120 70 62 36 fa 85 175 295 365 427 463

Como son datos agrupados, se utiliza la frmula

Siendo, La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30. Entonces,

141

El primer cuartil: 115.5 85 = 30.75 Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posicin: 324.1 295 = 29.1 Li = 500, fi = 70

El percentil 30

Posicin:

138.9 85 = 53.9 fi = 90

Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los empleados.

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de cuartiles, deciles y percentiles, de la bibliografa sugerida.

142

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (Recuerde que la forma de evaluar esta seccin es aciertos menos errores).

1.

La moda de los siguientes datos: 10, 9, 7, 5, 8, 7, 6, 7, 5, 8. Es 7 La media de 9,3,8,9,8,9,18 es 9. La desviacin media de los siguientes datos 2,3,6,8 y 11; es de 2.8 Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. La media de 175, 136, 165, 178 y 159 es de 162.6

2. 3. 4.

( ( (

) ) )

5.

) y subraye la

INSTRUCCIONES: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto

1)

Calcule la mediana de asistencia a 13 clases de psicologa si asistieron : 40, 32, 37, 30, 40, 24, 40, 38, 35, 40, 28, 32 y 37 personas. A) 37 B) 37.5 C) 38 D) 40

2)
A) B) C) D)

= fi*x n

Esta frmula corresponde a:

Media datos agrupados Mediana datos agrupados Media datos no agrupados Mediana datos no agrupados Es el dato que aparece con mayor frecuencia, es una coleccin de datos. A) B) C) D) Moda Media Mediana Desviacin media

3)

143

4)

9 golfistas registraron los siguientes hoyos 4 3 4 5 4 3 3 4 3; la media es: A) B) C) D) 3 3.5 3.6 4

5)

A 18 clases de una academia de baile de asistieron: 26, 25, 28, 23, 25, 24, 24, 21, 23, 26, 28, 26, 24, 32, 25, 27, 24 y 27 personas; la moda es: A) B) C) D) 24 25 25.4 26 = Li + N/2 - fa F Mediana C . Esta frmula corresponde a:

6)
A) B) C) D)

Media datos agrupados Mediana datos agrupados Media datos no agrupados Mediana datos no agrupados

INSTRUCCIONES: Lea detenidamente respuesta correcta.

y conteste en los espacios en blanco la

1. El _es un valor representativo de un conjunto de datos; se obtiene de la sumatoria de todos los datos, dividindose entre el total de los mismos.

2. El consiste en obtener un valor futuro de la variable de estudio a partir de una serie histrica de los valores de la variable. El procedimiento consiste en obtener una media aritmtica eligiendo de antemano el tamao de la muestra e incorporando al promedio obtenido el valor de la variable siguiente hasta completar toda la serie histrica.

3. La curva sesgada a la de tendencia central en el siguiente orden: moda, mediana y media.

tiene las medidas

5. La curva sesgada a la de tendencia central en el siguiente orden: media, mediana y moda.

tiene las medidas

6. Consiste en ordenar los datos en forma creciente o decreciente y el valor medio se denomina _.

144

UNIDAD 7 MEDIDAS DE VARIABILIDAD DE DISPERSION

El estudiante distinguir y aplicar los diferentes tipos de medidas de dispersin, as como sus ventajas y desventajas de cada uno de ellos.

Temario: 7. MEDIDAS DE VARIABILIDAD O DE DISPERSIN 7.1 RANGO 7.2 DESVIACIN MEDIA ABSOLUTA 7.3 VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS 7.4 DESVIACIN ESTNDAR 7.5 COEFICIENTE DE VARIACIN 7.6 MEDIDAS DE FORMA: ASIMETRA Y CURTOSIS

145

MAPA CONCEPTUAL MEDIDAS DE VARIABILIDAD DE DISPERSION

7. MEDIDAS DE VARIABILIDAD DE DISPERSION

7.1 RANGO

7.2 DESVIACIN MEDIA ABSOLUTA

7.3 VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS

7.4 DESVIACIN ESTNDAR

7.5 COEFICIENTE DE VARIACIN

7.6 MEDIDAS DE FORMA: ASIMETRA Y CURTOSIS

146

INTRODUCCIN
En esta unidad se tratarn las medidas de dispersin para datos agrupados y no agrupados.

147

7. MEDIDAS DE VARIABILIDAD O DE DISPERSIN


7.1. RANGO

El estudiante aplicar el rango como una medida de dispersin. Se denomina rango o rango estadstico al intervalo de menor tamao que contiene a los datos; es calculable mediante la resta del valor mnimo al valor mximo; por ello, comparte unidades con los datos. Permite obtener una idea grosera de la dispersin estadstica de los datos.

Por ejemplo, para una serie de datos de carcter cuantitativo como es la estatura tal y como: x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155 es posible ordenar los datos como sigue: x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185 donde la notacin x(i) indica que se trata del elemento i-simo de la serie de datos. De este modo, el rango sera la diferencia entre el valor mximo ( k) y el mnimo; o, lo que es lo mismo: W = x(k) x(1) En nuestro ejemplo, con cinco valores, nos da que W = 185-155 = 30.

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de rango, de la bibliografa sugerida.

148

7.2

DESVIACIN MEDIA ABSOLUTA

El estudiante aplicar la desviacin media en datos agrupados y no agrupados.

La desviacin media mide la cantidad promedio que varan los datos respecto a su media. La definicin es:

Desviacin media. Es la media aritmtica de los valores absolutos de las desviaciones de los datos respecto a su media. Desviacin media datos no agrupados

Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la desviacin media de las observaciones muestreadas? X 85.4 85.4 85.3 X+ 0.4 + 0.4 + 0.3 |X 0.4 0.4 0.3 0.1 1.0 = 2.2 = 2.2 = 0.44 |

84.9 - 0.1 84.0 - 1.0

149

5 Desviacin media para datos agrupados En el caso de que los datos se encuentren agrupados en una distribucin de frecuencia la frmula es:

Ejemplo:
xi [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 1 2.5 1 7.5 2 2.5 2 7.5 3 2.5 fi 3 5 7 4 2 21 xi fi 3 7.5 8 7.5 1 57.5 110 65 4 57.5 |x - x| 9 .286 4 .286 0 .714 5 .714 1 0.174 |x - x| fi 2 7.858 2 1.43 4 .998 2 2.856 2 1.428 9 8.57

Ventajas y Desventajas de la desviacin media La desviacin media tiene dos ventajas. Utiliza para su cmputo todos los elementos de la serie de datos y es fcil de entender. Sin embargo, es difcil trabajar con valores absolutos y por ello la desviacin media no es usada frecuentemente. Cuando la suma de las desviaciones parciales absolutas es igual a cero, la desviacin media no es una medida de variabilidad aceptable. Por ejemplo, tenemos dos series de datos:

A = { 0, 50, 100 } B = { 49, 50, 51 }

150

Claramente observamos que la serie B tiene una dispersin mayor que la serie A, sin embargo en ambos casos la desviacin media es cero.

ACTIVIDADES DE APRENDIZAJE El estudiante resolver problemas de desviacin media para datos agrupados y no agrupados, de la bibliografa sugerida.

7.3 VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS

El estudiante aplicar la varianza en datos agrupados y no agrupados.

Varianza. Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media de una distribucin estadstica La varianza se representa por VARIANZA PARA DATOS NO AGRUPADOS

Ejercicio: Calcular la varianza de la distribucin9, 3, 8, 8, 9, 8, 9,18

VARIANZA PARA DATOS AGRUPADOS

151

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores

Calcule la Varianza de los siguientes datos agrupados:

xi [10, 20) [20, 30) [ 30, 40) [40, 50) [50, 60 [ 60, 70) [70, 80) 15 25 35 45 55 65 75

fi 1 8 10 9 8 4 2 42

xi f i 15 200 350 405 440 260 150 1 820

xi 2 f i 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

Propiedades de la varianza

152

1. La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales 2. Si a todos los valores de la variable se les suma un nmero la varianza no vara 3. Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dicho nmero 4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total

1. Observaciones sobre la varianza 2. La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas 3. En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza 4. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de varianza para datos agrupados y no agrupados, de la bibliografa sugerida. 7.4 DESVIACIN ESTNDAR

El estudiante aplicar la desviacin estndar, datos agrupados y no agrupados

La desviacin tpica o desviacin estndar es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin La desviacin tpica se representa por

153

Desviacin estndar o tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores

Ejercicios de desviacin tpica. Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9,18.

Desviacin tpica para datos agrupados

154

Calcular la desviacin tpica de la distribucin de la tabla :: [10, 20) [20, 30) [ 30, 40) [40, 50) [50, 60) [ 60, 70) [70, 80) xi 15 25 35 45 55 65 75 fi 1 8 10 9 8 4 2 42 xi f i 15 200 350 405 440 260 150 1 820 xi 2 f i 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de desviacin tpica o estndar para datos agrupados y no agrupados, de la bibliografa sugerida. 7.5 COEFICIENTE DE VARIACIN

El estudiante aplicar el coeficiente de variacin

El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media

155

El coeficiente de variacin se suele expresar en porcentajes.

El coeficiente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s. La mayor dispersin corresponder al valor del coeficiente de variacin mayor Ejercicio Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin?

La primera distribucin presenta mayor dispersin

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de coeficiente de variacin, de la bibliografa sugerida. 7.6 MEDIDAS DE FORMA: ASIMETRA Y CURTOSIS

El estudiante comparar las medidas de asimetra y curtosis.

Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la forma de la distribucin, es frecuente que los valores de una distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.

156

As<0

As=0

As>0 Asimetra Positiva a la Derecha.

Asimetra Negativa a Simtrica la Izquierda

Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios: Comparando la Media y la Moda. Comparando los valores de la variable con la media.

Comparando la Media y la Moda:

Si la diferencia es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una medida relativa, ya que est influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetra como:

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson.

El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todos los valores de la variable, as que es una medida que se basar en las diferencias , como vimos en el caso de la dispersin si medimos la media de esas desviaciones sera nulas, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo.

157

Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la siguiente expresin:

Curtosis
El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. Se definen 3 tipos de distribuciones segn su grado de curtosis: Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). g 2 = 0 (distribucin mesocrtica) .

Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.

g2 > 0(distribucin leptocrtica )

158

Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable. g2 < 0 (distribucin platicrtica)

El Coeficiente de Curtosis viene definido por la siguiente frmula:

Donde: n = total de datos xi = Cada uno de los datos xm = Media Los resultados pueden ser los siguientes: g 2 = 0 (distribucin mesocrtica) . g2 > 0(distribucin leptocrtica ). g2 < 0 (distribucin platicrtica) . Ejemplo: Vamos a calcular el Coefiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos, recordemos que la media de esta muestra es 1,253
Variable (Valor) Frecuencias absolutas Simple fi 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 1 4 4 2 1 2 3 3 4 3 3 Acumulada fa 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple fr 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada far 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

159

S ((xi - xm)^4)*ni 0,00004967

S ((xi - xm)^2)*ni 0,03046667

Luego: (1/30) * 0,00004967 g2 --------------------------------------- - 3 = -1,39 = ---((1/30) * (0,03046667))^2

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de una distribucin platicrtica, es decir, con una reducida concentracin alrededor de los valores centrales de la distribucin, aunque tampoco en este caso esta deviacin de la simetra est suficientemente alejada del 0 para ser considerada significativa (se encuentra entre -2 y 2).

ACTIVIDADES DE APRENDIZAJE

El estudiante resolver problemas de medidas de forma, de la bibliografa sugerida.

160

INSTRUCCIONES: LEA DETENIDAMENTE LOS SIGUIENTES CONCEPTOS SUBRAYE LA RESPUESTA A LA QUE CORRESPONDA DICHO CONCEPTO

1)
A) B) C) D)

De los siguientes datos: 9, 7, 11, 10, 13 y 7. El resultado de 9.5 corresponde a: Media Varianza Desviacin media Desviacin estndar

2)

Analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. A) B) C) D) Varianza datos no agrupados Varianza datos agrupados Coeficiente de variacin Coeficiente de curtosis

INSTRUCCIONES: LEA DETENIDAMENTE Y CONTESTE EN LOS ESPACIOS EN BLANCO LA RESPUESTA.

1. Al grado en que los datos numricos tienden a extenderse alrededor de un valor medio, se le llama 2. La se obtiene de la frmula:

3. La es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media de una distribucin estadstica

4. El tpica de una muestra y su media

es la relacin entre la desviacin

161

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (recuerde que la forma de evaluar esta seccin es aciertos menos errores). 1. La varianza es la caracterstica de una muestra o poblacin que cuantifica ( ) su dispersin o variabilidad. Se utiliza para calcular la desviacin estndar de datos agrupados: ( )

2.

3.

Se denomina rango estadstico al intervalo de menor tamao que contiene ( ) a los datos; es calculable mediante la resta del valor mnimo al valor mximo; por ello, comparte unidades con los datos La distribucin mesocrtica presenta un reducido grado de concentracin ( ) alrededor de los valores centrales de la variable. La desviacin media mide la cantidad promedio que varan los datos ( ) respecto a su media

4.

5.

6.

El rango intercuartlico divide a los valores muestrales, una vez ( ) ordenados, en cuatro partes homogneas en cuanto a nmero de observaciones

INSTRUCCIONES: Observe las siguientes grficas, y mencione el tipo de asimetra que cada una tiene.

162

UNIDAD 8 PROBABILIDAD

El estudiante diferenciar los tipos de eventos asociados con los experimentos aleatorios. Adems calcular y evaluar el valor numrico de su probabilidad.

Temario:

8.

PROBABILIDAD 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 PROBABILIDAD CLSICA, FRECUENCIAL Y SUBJETIVA EXPERIMENTOS, EVENTOS Y ESPACIOS MUESTRALES REGLAS DE CONTEO: COMBINACIONES Y PERMUTACIONES REGLAS DE LA PROBABILIDAD EVENTOS DEPENDIENTES, INDEPENDIENTES Y CONDICIONALES TEOREMA DE BAYES DIAGRAMA DE RBOL ESPERANZA MATEMTICA

163

MAPA CONCEPTUAL PROBABILIDAD 8. PROBABILIDAD

8.1 PROBABILIDAD CLSICA, FRECUENCIAL Y SUBJETIVA

8.2 EXPERIMENTOS , EVENTOS Y ESPACIOS MUESTRALES

8.3 REGLAS DE CONTEO: COMBINACIONES Y PERMUTACIONES

8.4 REGLAS DE LA PROBABILIDAD

8.5 EVENTOS DEPENDIENTES, INDEPENDIENTES Y CONDICIONALES

8.6 TEOREMA DE BAYES

8.7 DIAGRAMA DE RBOL

8.8 ESPERANZA MATEMTICA

164

INTRODUCCIN

En esta unidad, se conocern las reglas de la probabilidad que deben observarse; se incluyen postulados bsicos, relacin entre las probabilidades y el teorema de Bayes. Se presentan tambin combinaciones, permutaciones y la esperanza matemtica.

165

8. PROBABILIDAD
8.1 PROBABILIDAD CLSICA, FRECUENCIAL Y SUBJETIVA

El estudiante diferenciar la probabilidad clsica, frecuencial y subjetiva. El concepto de probabilidad nace con el deseo del hombre de conocer con certeza los eventos futuros. Es por ello que el estudio de probabilidades surge como una herramienta utilizada por los nobles para ganar en los juegos y pasatiempos de la poca. El desarrollo de estas herramientas fue asignado a los matemticos de la corte. Con el tiempo estas tcnicas matemticas se perfeccionaron y encontraron otros usos muy diferentes para la que fueron creadas. Actualmente se contino con el estudio de nuevas metodolgicas que permitan maximizar el uso de la computacin en el estudio de las probabilidades disminuyendo, de este modo, los mrgenes de error en los clculos

A travs de la historia se han desarrollado tres enfoques conceptuales diferentes para definir la probabilidad y determinar los valores de probabilidad:

El enfoque clsico: Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo tiempo), entonces la probabilidad de que ocurra A es: P(A) = (x+z) x

El enfoque clsico de la probabilidad se basa en la suposicin de que cada resultado sea igualmente posible. Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda aplicarse) calcular el valor de probabilidad antes de observar cualquier evento de muestra.

Ejemplo: Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de sacar una piedra roja en un intento es:

P(A) = 9 = 0.375 o 37.5% 9+15 El enfoque de frecuencia relativa: Tambin llamado Enfoque Emprico, determina la probabilidad sobre la base de la proporcin de veces que ocurre un evento favorable en un numero de observaciones. En este enfoque no ese utiliza la suposicin previa de

166

aleatoriedad. Porque la determinacin de los valores de probabilidad se basa en la observacin y recopilacin de datos. Ejemplo: Se ha observado que 9 de cada 50 vehculos que pasan por una esquina no tienen cinturn de seguridad. Si un vigilante de transito se para en esa misma esquina un ida cualquiera Cul ser la probabilidad de que detenga un vehculo sin cinturn de seguridad? P(A) = 50 9 = 0.18 o 18%

Tanto el enfoque clsico como el enfoque emprico conducen a valores objetivos de probabilidad, en el sentido de que los valores de probabilidad indican al largo plazo la tasa relativa de ocurrencia del evento.

El enfoque subjetivo: Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte de un individuo de que un evento ocurra, basado en toda la evidencia a su disposicin. Bajo esta premisa se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de ocurrencia del evento. Es decir, que el evento ocurrir o no ocurrir esa sola vez. El valor de probabilidad bajo este enfoque es un juicio personal.

ACTIVIDADES DE APRENDIZAJE

Basndose en la bibliografa sugerida, realizar un mapa conceptual en el que se explique la probabilidad clsica, frecuencial, y subjetiva. Se entregar de manera impresa la siguiente sesin. 8.2 EXPERIMENTOS, EVENTOS Y ESPACIOS MUESTRALES

El estudiante y explicar el concepto de experimento, espacio muestral y evento.

Cada vez que realizamos un clculo matemtico para resolver un problema fsico, estamos aplicando un modelo matemtico a un fenmeno de la realidad. Como sabemos un fenmeno es algo observable y que en la mayora de los casos es, adems, cuantificable. Podemos decir que la estadstica tiene por objeto el estudio y comportamiento de fenmenos. Estos fenmenos son a su vez el resultado de una

167

experimentacin, por lo que podemos hablar indistintamente de fenmenos y experimentos aleatorios. De forma especfica se dice que un experimento aleatorio es aquel que puede concretarse en al menos dos resultados posibles, con incertidumbre en cuanto a cul de ellos tendr lugar. Los experimentos se pueden clasificar en deterministas y aleatorios. Los primeros son aquellos que repetidos en idnticas condiciones nos llevan siempre al mismo resultado. Por el contrario, para el segundo tipo de experimentos nos encontramos que, incluso aunque las condiciones del experimento no cambien, el resultado del experimento es impredecible antes de realizarlo. (Antes de lanzar una moneda al aire no sabremos si saldr cara o cruz. Tambin son experimentos aleatorios la cotizacin de las acciones de una empresa, sus beneficios, sus ventas, su periodo de actividad, etc.). En general diremos que las caractersticas de un experimento aleatorio son las siguientes:

a) el experimento se puede repetir u observar de forma indefinida en circunstancias prcticamente muy similares. b) Aunque no podemos predecir el resultado particular del experimento, si que podemos conocer el conjunto de todos los posibles resultados. c) Si el experimento se repite pocas veces, los resultados parecen mostrar un comportamiento catico, mientras que si se repite un nmero infinito de veces empieza a detectarse una regularidad en el comportamiento de los resultados.

Hemos sealado antes que una de las caractersticas del experimento aleatorio es que, aunque los resultados individuales no son predecibles con anterioridad, en cambio s que podemos saber cul es el conjunto de todos sus posibles resultados. Pues bien, a ese conjunto de posibles resultados le llamaremos espacio muestral y lo representaremos en adelante por la letra E. As pues, E ser un conjunto formado por los resultados del experimento. Estos resultados elementales de un experimento tienen la caracterstica de que no son descomponibles. A partir de ellos surge el concepto de suceso o evento. Un suceso o evento ser un conjunto de resultados elementales del experimento. Antes de continuar con el concepto de suceso o evento conviene sealar que un espacio muestral puede ser finito ( si est formado por un conjunto finitos de resultados) o infinito. Dentro los espacios infinitos se puede diferenciar entre los infinitos numerables e infinitos no numerables. Tanto a los espacios finitos como a los infinitos numerables se les suele conocer como espacios discretos, mientras a que los infinitos no numerable se conoce tambin como continuos.

168

Habindose definido previamente el concepto de suceso, a continuacin vamos a dar una tipologa de los mismos dentro de la cual se distingue: suceso elemental, suceso compuesto (consta de dos o ms sucesos elementales), suceso seguro o universal (coincide con el espacio muestral) y suceso imposible (no contiene ningn elemento del espacio muestral E y por tanto no ocurrir nunca y lo denotaremos por ).

Ejemplo 1. En el experimento que consiste en lanzar un dado de seis caras vamos a concretar los conceptos de suceso elemental, suceso compuesto o evento, suceso seguro, suceso imposible, espacio muestral y naturaleza del mismo.

En este experimento si admitimos que cada una de las caras se identifican por los enteros que van del 1 al 6, de forma que a la cara uno se la identifica por el valor 1, a la dos por el valor 2, y as sucesivamente, entonces los sucesos elementales de este experimento, que representaremos por ei, sern los enteros e1 =1, e2 =2, e3 =3, e4 =4, e5=5, e6 =6. A partir de stos se pueden definir otros eventos. As, el evento A = nmero par se define como A = {2, 4, 6}, el evento B = nmero primo viene dado por B = {1, 2, 3, 5}, etc. A su vez el suceso seguro en este experimento es E = que salga alguna cara y est formado por E = {1, 2, 3, 4, 5, 6}. Sobre un experimento aleatorio se puede definir ms de un suceso imposible, aunque todos ellos satisfacen la definicin dada con anterioridad. As en este ejemplo sera sucesos imposibles los siguientes: = que sal la cara siete, = obtener la cara dos y medio, etc. Finalmente el espacio muestral asociado a este experimento vendra dado por E = {1, 2, 3, 4, 5, 6}, es decir, el conjunto de todos los resultados posibles del mismo. En este caso se trata de un espacio finito y, por lo tanto, discreto.

Ejemplo 2. Sea el experimento que consiste en contar el nmero de mujeres en una muestra de 12 parlamentarios seleccionados al azar. En este caso el espacio muestral correspondiente a este experimento viene dado por E = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}, que tambin es finito y discreto. Para este experimento tambin se puede definir distintos tipos de eventos como: A = que el nmero de mujeres sea mayora; b = que el nmero de mujeres sea al menos tres; etc.

169

Ejemplo 3. Sea el experimento que consiste en contar el nmero de personas que llega a la caja de un supermercado durante un mes. El espacio muestral de este experimento viene dado por E = {0, 1, 2, 3, 4, 5, ........}. En este caso estamos ante un espacio infinito numerable y, en consecuencia, tambin discreto.

Ejemplo 4. Sea el experimento que consiste en anotar el instante en que se recibe una llamada telefnica a lo largo de un da. Si se admite que esa llamada puede ocurrir en cualquier instante de ese intervalo de 24 horas, entonces el espacio muestral ser E = {el intervalo de tiempo correspondiente a las 24 horas}, que origina un espacio infinito no numerable, es decir, continuo. OPERACIONES DE LOS SUCESOS O EVENTOS Una vez que se ha dado el concepto de suceso o evento, a continuacin se van a definir las operaciones ms habituales que pueden realizarse con los mismos. a) Suceso contenido en otro. Se dice que A est contenido en B y lo indicaremos por A B si todos los elementos de A pertenecen a B. Ejemplo 5. A partir del experimento definido en el Ejemplo 2, vamos a definir los sucesos A = que haya 8 9 mujeres y B = que haya mayora de mujeres. En este caso se dice que A B.

b) Igualdad de sucesos. Se dice que A y B son dos sucesos iguales si se cumple simultneamente que A ByB A.

Ejemplo 6. Con el mismo experimento del Ejemplo 2 se puede definir los sucesos A = mayora de mujeres y B = al menos siete mujeres. Aqu se cumple que A A, por lo que A = B. ByB

c) Unin de sucesos. Dados dos sucesos A y B, se define la unin de ambos como otro suceso, que indicaremos por A B, que est formado por los elementos pertenecientes a A, o a B o a los dos a la vez.

Ejemplo 7. Con el mismo experimento del Ejemplo 2 se puede definir los sucesos A = al menos siete mujeres y B = ms de cinco mujeres pero menos de diez. En este caso: A = {7, 8, 9, 10, 11, 12} B = {6, 7, 8, 9}

170

Por lo que A B = {7, 8, 9, 10, 11, 12} {6, 7, 8, 9}={6, 7, 8, 9, 10, 11, 12}

d) Interseccin de sucesos. Dados dos sucesos A y B, se define la interseccin de ambos como otro suceso, que representamos por A B, compuesto por resultados comunes a A y B simultneamente.

Ejemplo 8. Con el mismo experimento del Ejemplo 2 se pueden definir los sucesos A = al menos siete mujeres y B = ms de cinco mujeres pero menos de diez. En este caso: A = {7, 8, 9, 10, 11, 12} B = {6, 7, 8, 9} Por lo que A 9} B = {7, 8, 9, 10, 11, 12} {6, 7, 8, 9} = { 7, 8,

e) Sucesos disjuntos, incompatibles o mutuamente excluyentes. Dados dos sucesos A y B, se dicen que ambos son incompatibles, disjuntos o mutuamente excluyentes si la presencia de uno impide la del otro. En tal caso ocurre que A B= .

Ejemplo 9. Con el mismo experimento del Ejemplo 2 se pueden definir los sucesos A = al menos siete mujeres y B = no ms de cinco mujeres. En este caso: A = {7, 8, 9, 10, 11, 12} B = {0, 1, 2, 3, 4, 5} Por lo que A B = {7, 8, 9, 10, 11, 12} {0, 1, 2, 3, 4, 5} =

f) Complementario o contrario. Dado un suceso A, se define el complementario de A como otro suceso que ocurre cuando no ocurre A y que representaremos por A. Ejemplo 10. Con el mismo experimento del Ejemplo 2 se puede definir el sucesos A = al menos siete mujeres. El complementario de este suceso es: A= { 0, 1, 2, 3, 4, 5, 6}

171

ACTIVIDADES DE APRENDIZAJE

En base a la bibliografa sugerida realizar un anlisis de por lo menos una cuartilla de contenido, en el que se explique la diferencia existente entre espacio muestral, evento, y eventos. Se entregar de manera impresa la siguiente sesin Realice diversas operaciones de los sucesos o eventos, de la bibliografa sugerida. 8.3 REGLAS DE CONTEO: COMBINACIONES Y PERMUTACIONES

El estudiante diferenciar la combinaciones y permutaciones.. Anlisis Combinatorio El anlisis combinatorio es la rama de las matemticas que estudia los diversos arreglos o selecciones que podemos formar con los elementos de un conjunto dado, los cuales nos permite resolver muchos problemas prcticos, y nos va servir para resolver y comprender problemas sobre probabilidades. Tcnicas fundamentales del Anlisis Combinatorio En la mayora de los problemas de anlisis combinatorio se observa que una operacin o actividad aparece en forma repetitiva y es necesario conocer las formas o maneras que se puede realizar dicha operacin. Para dichos casos es til conocer determinadas tcnicas o estrategias de conteo que facilitarn el clculo sealado. Estas tcnicas son: la tcnica de la multiplicacin, la tcnica de la permutacin y la tcnica de la combinacin.

La Tcnica de la Multiplicacin Segn La tcnica de la multiplicacin, si hay m formas de hacer una cosa y hay n formas de hacer otra cosa, hay m x n formas da hacer ambas cosas

En trminos de frmula Nmero total de arreglos = m x n Esto puede ser extendido a ms de dos eventos. Para tres eventos, m, n, y o:

172

Nmero total de arreglos = m x n x o

Ejemplo: Un vendedor de autos quiere presentar a sus clientes todas las diferentes opciones con que cuenta: auto convertible, auto de 2 puertas y auto de 4 puertas, cualquiera de ellos con rines deportivos o estndar. Cuntos diferentes arreglos de autos y rines puede ofrecer el vendedor?

Para solucionar el problema podemos emplear la tcnica de la multiplicacin, (donde m es nmero de modelos y n es el nmero de tipos de rin). Nmero total de arreglos = 3 x 2

No fue difcil de listar y contar todos los posibles arreglos de modelos de autos y rines en este ejemplo. Suponga, sin embargo, que el vendedor tiene para ofrecer ocho modelos de auto y seis tipos de rines. Sera tedioso hacer un dibujo con todas las posibilidades. Aplicando la tcnica de la multiplicacin fcilmente realizamos el clculo: Nmero total de arreglos = m x n = 8 x 6 = 48 La Tcnica de la Permutacin Es un conjunto de nmeros o elementos (n) tomados de r en r a la vez y cuyos arreglos responden a un orden determinado. Nos interesa el orden en que estos se hacen.

Como vimos anteriormente la tcnica de la multiplicacin es aplicada para encontrar el nmero posible de arreglos para dos o ms grupos. La tcnica de la permutacin es aplicada para encontrar el nmero posible de arreglos donde hay solo u grupo de objetos. Como ilustracin analizaremos el siguiente problema:

Tres componentes electrnicos - un transistor, un capacitor, y un diodo - sern ensamblados en una tablilla de una televisin. Los componentes pueden ser ensamblados en cualquier orden. De cuantas diferentes maneras pueden ser ensamblados los tres componentes?

Las diferentes maneras de ensamblar los componentes son llamadas permutaciones, y son las siguientes: TDC TCD DTC DCT CDT CTD

Permutacin: Todos los arreglos de r objetos seleccionados de n objetos posibles

173

La frmula empleada para contar el nmero total de diferentes permutaciones es:


r Pn = nPr =

Donde: nPr es el nmero de permutaciones posible n es el nmero total de objetos r es el nmero de objetos utilizados en un mismo momento (1 en 1, 2 en 2, 3 en 3, etc.)

nPr=

n! (n r )!

3! ( 3 3 )!

3x2 1

=6

Ejemplo: Suponga que hay ocho tipos de computadora pero solo tres espacios disponibles para exhibirlas en la tienda de computadoras. De cuantas maneras diferentes pueden ser arregladas las 8 mquinas en los tres espacios disponibles? n! (n r )! = 8! ( 8 3 )! = 8! 5! = 336

nPr=

En el anlisis anterior los arreglos no presentan repeticiones, es decir, no hay dos espacios disponibles con el mismo tipo de computadora. Si en los arreglos se permite la repeticin, la frmula de permutaciones es la siguiente: n Pr = nr Para ilustrar el punto, queremos saber cuntas series de 2 letras se pueden formar con las letras A, B, C, si se permite la repeticin? Las permutaciones son las siguientes: AA, AB, AC, BA, CA, BB, BC, CB, CC

Usando la frmula: n Pr = nr = 3P2 = 32 = 9

La Tcnica de la Combinacin En una permutacin, el orden de los objetos de cada posible resultado es diferente. Si el orden de los objetos no es importante, cada uno de estos resultados se denomina combinacin. Por ejemplo, si se quiere formar un equipo de trabajo formado por 2 personas seleccionadas de un grupo de tres (A, B y C). Si en el equipo hay dos

174

funciones diferentes, entonces si importa el orden, los resultados sern permutaciones. Por el contrario si en el equipo no hay funciones definidas, entonces no importa el orden y los resultados sern combinaciones. Los resultados en ambos casos son los siguientes:

Permutaciones: AB, AC, BA, CA, BC, CB Combinaciones: AB, AC, BC Combinaciones: Es el nmero de formas de seleccionar r objetos de un grupo de n objetos sin importar el orden.

La frmula de combinaciones es:

r n

= nCr =

Ejemplo: En una compaa se quiere establecer un cdigo de colores para identificar cada una de las 42 partes de un producto. Se quiere marcar con 3 colores de un total de 7 cada una de las partes, de tal suerte que cada una tenga una combinacin de 3 colores diferentes. Ser adecuado este cdigo de colores para identificar las 42 partes del producto?

Usando la frmula de combinaciones: nCr= n! r! (n r )! = 7! 3! ( 7 3 )! = 7! 3! 4! = 35

El tomar tres colores de 7 posibles no es suficiente para identificar las 42 partes del producto.

ACTIVIDADES DE APRENDIZAJE

Realice diversas operaciones de combinacin y permutacin, de la bibliografa sugerida.

175

8.4 REGLAS DE LA PROBABILIDAD

El estudiante concoer y comprender las reglas de la probabilidad.

Probabilidad axiomtica. Para dar esta definicin es preciso, previamente, definir el concepto de s-lgebra de Boole. Un s-lgebra de Boole, que representaremos por A=P(E), es una familia de sucesos no vaca, la cual contiene necesariamente los sucesos y E y que, adems, es cerrada para las operaciones de complementacin y de unin de infinitos subconjuntos numerables de E, sien E el espacio muestral del experimento. En base a este concepto, la probabilidad axiomtica se define como una funcin de conjunto, que llamaremos P, cuyo dominio es el slgebra de Boole y cuyo recorrido es el intervalo cerrado [0,1] si adems satisface los tres axiomas siguientes (axiomas de Kolmogorov):

A continuacin vamos enunciar una serie de teoremas sobre probabilidad, de gran utilidad, que se deducen de los axiomas anteriores.

1. Para cualquier suceso AA se verifica que la probabilidad de su complementario

Para demostrar este teorema partimos de que:

176

Por otro lado segn los axiomas segundo y tercero se tiene que:

por lo que:

2. La probabilidad del suceso imposible es nula.

Si en el teorema 1 se hace que

por lo que

3. La probabilidad P es montona no decreciente, es decir, para cualesquiera sucesos A, , tales que , entonces .

Para demostrar este teorema se parte de que

Pero segn los axiomas primero y tercero resulta que

4. Para cualquier suceso


La primera desigualdad de este teorema es el primero de los axiomas. En cuanto a la segunda se tiene que , por lo que, segn el teorema anterior, resulta que:

5. Regla de la suma. Para cualesquiera sucesos A , .

se verifica que

177

Para demostrar este teorema vamos a expresar los sucesos de los siguientes sucesos disjuntos:

y A como la unin

A su vez, la probabilidad de los mismos, segn el tercero de los axiomas, viene dada por:

De la segunda probabilidad se deduce que

Si ahora se sustituye este resultado en P

se llega a que

Ejemplo 12. Sean A y B dos sucesos tales que: P

178

Ejemplo: La probabilidad de que las acciones de una empresa financiera coticen al alza es 0,8, mientras que esa probabilidad para una empresa del sector nuevas tecnologas es 0,4. A su vez, la probabilidad de que las dos coticen al alza es 0,3. Obtenga las siguientes probabilidades:

a) que coticen al alza al menos una de las dos empresas; b) que ninguna de las dos cotice al alza; c) que solo cotice una al alza.

Para dar solucin a este ejercicio vamos a proceder en primer lugar a definir los siguientes sucesos: A = la empresa del sector financiero cotiza al alza. B = la empresa del sector nuevas tecnologas cotiza al alza. C = al menos una empresa cotiza al alza. D = ninguna de las dos empresas cotiza al alza. E = solo una empresa cotiza al alza.

a) A partir del enunciado sabemos que P(A) = 0,8; P(B) = 0,4 y P( Con ello tenemos que: P(C)= P( B) = P(A) + P(B) P(A B) = 0,8 + 0,4 0,3 = 0,9

B) = 0,3.

c) El suceso D se puede expresar como:

Este resultado nos lleva a que:

d) El suceso E se puede expresar como

Pero como se trata de la unin de dos sucesos disjuntos, entonces la probabilidad del suceso E es:

179

Ahora bien

A su vez:

Todo ello nos permite escribir:

ACTIVIDADES DE APRENDIZAJE

Ejemplifique las reglas de la probabilidad, tome de referencia la bibliografa sugerida.

8.5 EVENTOS DEPENDIENTES, INDEPENDIENTES Y CONDICIONALES

El estudiante concoer y diferenciar eventos dependientes, independientes y condicionales.. Eventos Independientes Dos o ms eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso tpico de eventos independiente es el muestreo con reposicin, es decir, una vez tomada la muestra se regresa de nuevo a la poblacin donde se obtuvo.

180

Dos eventos, A y B, son independientes si la ocurrencia de uno no tiene que ver con la ocurrencia de otro. Por definicin, A es independiente de B si y slo si:

Esto implica que:

Independientes es diferente a mutuamente exclusivos.

Ejemplo: Lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo lanzamiento.

Eventos dependientes Dos o ms eventos sern dependientes cuando la ocurrencia o no-ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso, empleamos entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento relacionado. La expresin P(A|B) indica la probabilidad de ocurrencia del evento A s el evento B ya ocurri. Se debe tener claro que A|B no es una fraccin. P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A)

Probabilidad Condicional Si A y B son dos eventos en S, la probabilidad de que ocurra A dado que ocurri el evento B es la probabilidad condicional de A dado B, y se denota .

181

La probabilidad condicional por definicin es:

, dado P(B) > 0

Ejemplo:

Para un dado, si s que cay impar, cul es la probabilidad de 3?

Similarmente:

De donde:

Esta expresin se conoce como el Teorema de Bayes, que en su forma ms general es:

El denominador se le conoce como el teorema de la probabilidad total.

Teorema 4: Si B1,B2,...,Bk representan una particin (exclusivos, exhaustivos y mayores a cero) de S, y A es un evento respecto a S, entonces la probabilidad de A la podemos escribir como:

ACTIVIDADES DE APRENDIZAJE

Desarrolle ejercicios de eventos dependientes, independientes y condicionales, de la bibliografa sugerida.

182

8.6 TEOREMA DE BAYES

El estudiante concoer y aplicar el teorema de Bayes. El Teorema de BAYES se apoya en el proceso inverso en el Teorema de la Probabilidad Total.

Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente).

Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?).

La frmula del Teorema de Bayes es:

Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema tambin exige que el suceso A forme un sistema completo.

Primer ejemplo. El parte meteorolgico ha anunciado tres posibilidades para el fin de semana: a) Que llueva: probabilidad del 50%. b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%. Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente:

a) Si llueve: probabilidad de accidente del 20%. b) Si nieva: probabilidad de accidente del 10% c) Si hay niebla: probabilidad de accidente del 5%.

183

Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no sabemos que tiempo hizo (llovi, nev o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades:

Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el 20%).

Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori".

Vamos a aplicar la frmula:

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el da del accidente (probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%

184

ACTIVIDADES DE APRENDIZAJE

Elabore ejercicios del teorema de Bayes, de la bibliografa sugerida.

8.7 DIAGRAMA DE RBOL

El estudiante aplicar el diagrama de rbol. Un diagrama de rbol es una representacin grfica que ilustra las formas en las que se llevan a cabo las agrupaciones de elementos.

Ejemplo: Una persona tiene 4 camisas de color azul, negro, verde y beige; as mismo tiene 5 pantalones azul marino, negro, gris, beige y caf. de cuntas formas diferentes puede vestirse esta persona? Si llamamos C1,C2,C3 y C4 a las diferentes camisetas y P1,P2,P3,P4 y P5 a los distintos pantalones, obtendramos el diagrama de rbol que se muestra en la figura 1. Si contamos los resultados, comprobamos que obtenemos los 20 que indicaba el principio de la multiplicacin.

185

En los diagramas de rbol se emplea una nomenclatura propia, que describimos a continuacin:

rbol: es el diagrama completo. Raz: es el punto en el cual se origina el rbol. En la figura, la raz sera el punto desde donde parten las cuatro flechas que llegan hasta las cuatro opciones de camiseta. Ramas: son las distintas bifurcaciones. En la figura se corresponden con las flechas del grfico. Nodos o nudos: son los puntos desde los que surgen nuevas bifurcaciones. En la figura, los nodos seran los puntos en los que tenemos las 4 opciones de camiseta: C1,C2,C3 y C4. Hojas: son los puntos finales, desde los cuales no surgen nuevas bifurcaciones. En la figura, las hojas son los puntos correspondientes a las 5 opciones de pantaln (todos los nombrados como P1,P2,P3,P4 y P5, 20 puntos en total). Nivel: es el nmero de ramas que separa a un nodo u hoja de la raz. La raz corresponde al nivel 0 y, en la figura, las opciones de camiseta estarn en el nivel 1 y las de pantaln en el nivel 2. Camino: es cualquier recorrido por las ramas del rbol, desde la raz hasta alguna de sus hojas. En la figura tenemos 20 caminos diferentes.

ACTIVIDADES DE APRENDIZAJE

Elabore ejercicios del diagrama de rbol, de la bibliografa sugerida. 8.8 ESPERANZA MATEMTICA

El estudiante concocer y resolver problemas de esperanza matemtica.

En estadstica la esperanza matemtica (o simplemente esperanza) o valor esperado de una variable aleatoria es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Por ejemplo, en un juego de azar el valor esperado es el beneficio medio.

186

Si todos los sucesos son de igual probabilidad la esperanza es la media aritmtica.

La esperanza matemtica de una funcin g(X) est dada por

[4.3] donde f(X) es, respectivamente, la funcin de probabilidad o la funcin densidad de probabilidad y g(X) es cualquier funcin de valores reales que est definida para todos los valores posibles de X.

Ejemplo. La probabilidad de que una casa de cierto tipo quede destruida por un incendio en cualquier perodo de doce meses es de 0.005. Una compaa de seguros ofrece al propietario una pliza de seguros contra incendio por $20,000.00 (dlares) a un ao con una prima de $150.00 dlares. Cul es la ganancia esperada de la compaa?

Solucin: Sea S = {se incendie, no se incendie}, el espacio muestral, La variable aleatoria asociada es X = {0,1}, donde 0 significa que se incendie y 1 que no se incendie (estos valores son arbitrarios). g(X) representa la ganancia de la compaa por cada casa asegurada (sin tomar en cuenta gastos). La situacin se explica mejor en una tabla.

Evento Se incendie No se incendie

X 0 1

g(X) -$19,850.00 +$150.00

f(X) 0.005 0.995

En caso de que la compaa asegure 20,000 casas, su ganancia esperada sera de $1,000,000.00 (sin tomar en cuenta gastos).

La esperanza matemtica de una funcin g(X) est definida por:

187

PROPIEDADES DE LA ESPERANZA MATEMTICA Proposicin: E[a g(X) +b h(X)] = a E[g(X)]+b E[h(X)]; a, b constantes. [4.4]

Demostracin:

Nota si X es discreta, la demostracin se hace en la misma forma, usando sumatorias en vez de integrales. Proposicin: E[c1 X + c2] = c1 E [X] + c2 [4.5] Demostracin:

ACTIVIDADES DE APRENDIZAJE

Elabore ejercicios de esperanza matemtica, de la bibliografa sugerida.

188

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (recuerde que la forma de evaluar esta seccin es aciertos menos errores). 1. 2. La probabilidad 0, significa que algo nunca va a suceder. El experimento aleatorio es el que puede dar lugar a ms de un resultado, por lo que, no se puede predecir uno de ellos en una prueba particular. La combinacin es todo arreglo de elementos donde nos interesa el lugar o posicin donde son colocados lo elementos. Con las cifras 1,2,3,4,5 y 6. Se pueden hacer 120 nmeros con 3 cifras que sean diferentes? El diagrama de rbol es la representacin grfica til para identificar los puntos muestrales de un experimento con varias etapas. ( ( ) )

3.

4.

5.

INSTRUCCIONES: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto 1. a) b) c) d)

y subraye la

Son el conjunto de posibles resultados de un experimento aleatorio. Espacio muestral Evento simple Evento imposible Experimento determinstico

2. Es todo aquel resultado o grupo de resultados que pueden dar origen a un experimento aleatorio a) b) c) d) Experimento aleatorio Evento dependiente Evento excluyente Evento

3. Son aquellos eventos que no pueden ocurrir simultneamente al realizar una sola vez un experimento. a) b) Compuesto Imposible

189

c) d)

Dependiente Mutuamente excluyente

4. Una moneda de $ 5.00 pesos se lanza al aire 8 veces, Cul es la probabilidad de que por lo menos aparezcan 6 soles? a) b) c) d) 14.45% 25% 50% 75%

5. Es el producto de todos los nmeros consecutivos decrecientes que comienzan en 1 hasta n, entonces. a) b) c) d) Combinacin Permutacin Variacin Factorial

6. Cul es la probabilidad de sacar 2 ases consecutivos en 2 cartas tomadas al azar de un juego ordinario de una baraja de 40 cartas, si no se sustituye la primera carta antes de sacar la segunda carta? a) b) c) d) .0777% .777% 7.77% 77.7%

7. Se denomina as al conjunto de todos los resultados posibles de un experimento. a) b) c) d) Muestra Estadstica Probabilidad Espacio muestral y conteste en los espacios en blanco la

INSTRUCCIONES: Lea detenidamente respuesta correcta.

1. La es la posibilidad de que algo pase. Se expresa como fraccin o decimales que estn entre 1 y 0. 2. El experimento es en el que es posible predecir el resultado final de ese proceso, aun sin haberlo realizado. 3. Los eventos son aquellos sucesos constituidos por todos los eventos simples de un espacio muestral

190

4. La es la combinacin lineal de un conjunto de variables formadas en la tcnica multivariante mediante la derivacin de los pesos empricos aplicados a un conjunto de variables especificadas por el investigador. 5. El de una variable aleatoria discreta, se puede considerar como su promedio ponderado sobre todos los resultados posibles siendo las ponderaciones la probabilidad relacionada con cada uno de los resultados.

6.

nPr

= n

! es la frmula para las i. (n-r)!

7.

nCr

= n

! es la frmula para las i. r! (n-r)!

191

UNIDAD 9 VARIABLES ALEATORIAS DISCRETAS Y SU DISTRIBUCIN DE PROBABILIDAD

El estudiante identificar los tipos de variables aleatorias relacionadas con experimentos aleatorios discretos y con base a sus valores probabilsticos, podr describir su comportamiento. Calcular las probabilidades asociadas a eventos de datos provenientes de variables aleatorias: Bernoulli, Binomial, Multinomial, de Poisson, Geomtrica, Hipergeomtrica y analizar los tipos de variables aleatorias.

Temario:

9.

VARIABLES ALEATORIAS PROBABILIDAD 9.1 9.2 9.3 9.4 9.5 9.6 9.7

DISCRETAS

SU

DISTRIBUCIN

DE

PROBABILIDAD CLSICA, FRECUENCIAL Y SUBJETIVA DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA DISTRIBUCIN BERNOULLI DISTRIBUCIN BINOMIAL Y MULTINOMIAL DISTRIBUCIN DE POISSON DISTRIBUCIN GEOMTRICA DISTRIBUCIN HIPERGEOMTRICA

192

MAPA CONCEPTUAL VARIABLES ALEATORIAS DISCRETAS Y SU DISTRIBUCIN DE PROBABILIDAD

9. VARIABLES ALEATORIAS DISCRETAS Y SU DISTRIBUCION DE PROBABILIDAD

9.1PROBABILIDA D CLSICA, FRECUENCIAL Y SUBJETIVA

9.2 DISTRIBUCIN DE PROBABILIDA D DE UNA VARIABLE ALEATORIA DISCRETA

9.3 DISTRIBUCIN

9.4 DISTRIBUCIN BINOMIAL Y MULTINOMIAL

9.5 DISTRIBUCIN DE POISSON

9.6 DISTRIBUCIN GEOMTRICA

9.7 DISTRIBUCIN HIPERGEOMTRICA

193

INTRODUCCIN
En el estudio de variables, casi siempre se le da inters a las probabilidades con que toman los diversos valores dentro de su amplitud, especficamente en las distribuciones de probabilidad. A la presentacin de las variables aleatorias y las distribuciones de la probabilidad, seguir el anlisis de algunas distribuciones.

194

9. VARIABLES ALEATORIAS DISCRETAS Y SU DISTRIBUCIN DE PROBABILIDAD


9.1 PROBABILIDAD CLSICA, FRECUENCIAL Y SUBJETIVA

El estudiante concocer y diferenciar la probabilidad clsica, frecuencial y subjetiva.

El concepto de probabilidad es muy antiguo y a lo largo de la historia se ha definido de distintas formas, aunque todas ellas mantienen en comn las caractersticas bsicas del concepto. En general cuando hablemos de probabilidad lo haremos siempre en referencia a la probabilidad de un suceso y la entenderemos como una medida cuantificada de la verosimilitud de ocurrencia de un suceso frente a los dems sucesos del experimento. Pero qu duda cabe que esta definicin no es del todo buena, pues se utiliza el trmino verosimilitud para definir la probabilidad, cuando el mismo es un sinnimo de lo que se quiere definir. Tambin podra hablarse del grado de incertidumbre en la ocurrencia de los resultados de un experimento. En cualquier caso la probabilidad de un suceso es una medida cuantificable que toma valores entre cero y uno a diferencia del concepto de posibilidad que es una medida cualitativa. Una vez que se ha dado el concepto de probabilidad en sentido amplio debemos sealar que a lo largo de la historia podemos encontrar tres formas distintas de definir o interpretar la probabilidad. Cada uno de ellas responde a un tipo de experimento distinto. En concreto, supongamos que queremos calcular la probabilidad de los siguientes sucesos:

Obtener un seis al lanzar un dado honesto. Obtener un seis al lanzar un dado cargado. Que la tasa de crecimiento del VAB de Espaa sea superior al 4%.

Para obtener esas probabilidades hay que recurrir a enfoque o definiciones distintas.

En realidad esos enfoques sirven para establecer reglas de asignacin de probabilidades a los sucesos ms que para definir la probabilidad. Probabilidad clsica o a priori (Regla de Laplace) Si el experimento que estamos realizando da lugar a un espacio muestral E que es finito y cuyos resultados son conocidos de antemano y equiprobables o simtricos, entonces, la probabilidad del suceso A perteneciente a E se define como el cociente de los resultados favorables a A respecto del total de resultados posibles.

195

A esta expresin se le conoce como regla de Laplace.

Este concepto de probabilidad est ntimamente ligado a los juegos de azar. Esta definicin satisface tres propiedades:

1) No negatividad, 2) Certeza,

3) Aditividad. Si A y B son dos sucesos del espacio E y ambos son mutuamente excluyentes, entonces la probabilidad de

Antes de finalizar con este concepto de probabilidad hay que sealar la razn de su denominacin. As el adjetivo clsica hace alusin a que fue la forma en la que los primeros estadsticos abordaron este concepto. A su vez el trmino a priori se refiere a que la probabilidad de cualquiera de los sucesos de este tipo de experimentos es conocida incluso antes que los mismos tengan lugar. De hecho no es necesario realizar el experimento para conocer las probabilidades de sus resultados. Probabilidad frecuencial o a posteriori. En este caso la probabilidad de un suceso A se define como el lmite de una frecuencia relativa, cuando el experimento se realiza un nmero infinito de veces. Formalmente diremos que:

Esta definicin de probabilidad cumple tambin las tres propiedades enunciadas en el caso anterior. Con este concepto de probabilidad lo que se pretende es dar respuesta a experimentos en los que no se cumplen los requisitos sealados antes, en especial el de equiprobabilidad o simetra de los resultados. Esta circunstancia conlleva que la probabilidad de cada resultado no sea conocido de antemano, siendo necesaria la realizacin del experimento para la cuantificacin de la misma.

196

Con esta definicin se puede determinar la probabilidad de: las caras de un dado cuando el mismo est cargado; pieza defectuosa en la produccin de una empresa; accidente de trfico; factura impagada; cliente moroso; que el cliente de un establecimiento comercial sea menor de 25 aos; que los ingresos de una persona sea superior a la media; etc.

La probabilidad definida bajo este enfoque tambin satisface las tres propiedades dadas anteriormente. Ejemplo. Los 1000 empleados de una empresa, segn la edad y el sexo de los mismos, vienen dados en la siguiente tabla de doble entrada.

Obtenga la probabilidad de que elegido un empleado al azar el mismo sea:

a) Hombre b) Mujer c) Menor de 30 aos d) De 30 o ms aos e) Mujer menor de 30 aos f) Hombre de 30 y ms aos

Antes de calcular esas probabilidades vamos a definir simblicamente cada uno de esos sucesos:

A = el empleado seleccionado es hombre B = el empleado seleccionado es mujer C = el empleado seleccionado es menor de 30 aos D = el empleado seleccionado tiene 30 o ms aos

197

Definidos los sucesos de esta forma, las probabilidades pedidas son:

a) P(A) = (700/1000) = 0,7 b) P(B) = (300/1000) = 0,3 c) P(C) = (350/1000) = 0,35 d) P(D) = (650/1000) = 0,65 e) P(B C) = (100/1000) = 0,10 f) P(A D) = (450/1000) = 0,45

Probabilidad subjetiva. Hay determinados experimentos aleatorios que no son susceptibles de realizarse y sus resultados no son equiprobables. Imaginemos que se quiere determinar la probabilidad: de que la economa de Espaa crezca en el prximo ao un 3%; que las acciones de una empresa se revaloricen en un 10% en un mes; que una empresa presente suspensin de pagos; que un nuevo producto sea bien acogido en el mercado; que ocurra un accidente nuclear; etc. En estas circunstancias, donde los experimentos solo se pueden realizar una vez o ninguna o que se puedan repetir pero en condiciones distintas, no son aplicables ninguna de las dos definiciones dadas anteriormente, por lo que no es posible asignar probabilidades mediante un procedimiento objetivo, debiendo recurrir a procedimientos de tipo subjetivo, a opiniones de expertos. En estos casos la probabilidad expresa un grado de creencia o confianza individual en relacin con la ocurrencia o no de un determinado suceso. Se trata de un juicio personal sobre el resultado de un experimento aleatorio. Adems debemos admitir la posibilidad de que distintos sujetos asignen probabilidades diferentes al mismo suceso. No obstante esta definicin de probabilidad tambin satisface las tres propiedades vistas antes.

ACTIVIDADES DE APRENDIZAJE

Elabore algunos ejemplos de las probabilidades vistas aqu.

198

9.2 DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA

El estudiante diferenciar la distribucin de probabilidad de una variable aleatoria discreta. Recordemos inicialmente que existen las variables aleatorias, siendo aquellas que se asocian a la ocurrencia de un fenmeno aleatorio. Cuando una de estas variables aleatorias toma diversos valores, la probabilidad asociada a cada uno de tales valores puede ser organizada como una distribucin de probabilidad, la cual es la distribucin de las probabilidades asociadas a cada uno de los valores de la variable aleatoria.

Las distribuciones de probabilidad pueden representarse a travs de una tabla, una grfica o una frmula, en cuyo caso tal regla de correspondencia se le denomina funcin de probabilidad. Consideraremos primero las distribuciones de probabilidad para variables discretas. Por ejemplo: Consideremos a la variable aleatoria X como la cantidad de guilas observadas cuando se lanzan dos volados. El espacio muestral es el conjunto {AA, AS, SA, SS} y se puede ver que la variable X puede tomar como valores 0, 1 y 2.

Calculando las probabilidades tenemos: P(de no observar guilas) P(de observar una guila) P(de observar dos guilas) = P(SS) = P(SA AS) = P(AA) = = = P(X=0) P(X=1) P(X=2) = = =
2

/4

Si ahora se organizan estos resultados con el siguiente formato X 0 1 2 P(X=x)


2

/4

se podr explicar por qu se usa el nombre "distribucin de probabilidad". E, incluso, con esta informacin se puede construir una grfica de barras o un histograma como el que sigue:

199

Las propiedades de las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las distribuciones de variables continuas, se repetirn de manera muy similar:

1. 0 P(X=x) 1. 2. SP(X=x) = 1, o que es lo mismo: la suma de todas las probabilidades de los eventos posibles de una variable aleatoria es igual a la unidad. Hay que hacer notar que estas propiedades se enuncian suponiendo que conocemos el valor de la probabilidad, pero en la realidad esto no ocurre, es decir que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva a modelos tericos que estiman los resultados, los principales son los que a continuacin se presentan.

Modelos de distribuciones de probabilidad de variables discretas

Uniforme. Es la distribucin donde todos los eventos elementales tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la funcin P(X=x)=1/6 para valores de x=1,2,3,4,5,6. Binomial. Es la que maneja la distribucin de la probabilidad de obtener cierta cantidad de xitos al realizar una cantidad de experimentos con probabilidad de xito constante y con ensayos independientes. Geomtrica. Es la distribucin de la probabilidad de realizar cierto nmero de experimentos antes de obtener un xito. Hipergeomtrica. Es similar a la binomial, pero con un tamao de muestra grande en relacin al tamao de la poblacin. La funcin de Excel que proporciona sus valores es DISTR.HIPERGEOM De Poisson. Es la distribucin de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar. La funcin de Excel que da los valores de la distribucin es POISSON

200

ACTIVIDADES DE APRENDIZAJE

Elabore ejercicios, de probabilidad de una variable aleatoria discreta de la bibliografa sugerida.

9.3

DISTRIBUCIN BERNOULLI

El estudiante aplicar la distribucin de Bernoulli.

La distribucin de Bernoulli es el modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso:

Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0

Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); p probabilidad de ser admitido en una universidad (o te admiten o no te admiten); p probabilidad de acertar una quiniela (o aciertas o no aciertas) Al haber nicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de xito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificndose que: p+q=1 Veamos los ejemplos antes mencionados : Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1

201

Ejemplo 3: Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + 0,99999 = 1

ACTIVIDADES DE APRENDIZAJE Elabore ejercicios de la distribucin de Bernoulli, de la bibliografa sugerida.

9.4

DISTRIBUCIN BINOMIAL Y MULTINOMIAL

El estudiante aplicar la distribucin binomial y multinomial. La distribucin binomial parte de la distribucin de Bernoulli:

La distribucin de Bernoulli se aplica cuando se realiza una sola vez un experimento que tiene nicamente dos posibles resultados (xito o fracaso), por lo que la variable slo puede tomar dos valores: el 1 y el 0

La distribucin binomial se aplica cuando se realizan un nmero "n" de veces el experimento de Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido xitos Ejemplo: se tira una moneda 10 veces: cuntas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10

La distribucin de probabilidad de este tipo de distribucin sigue el siguiente modelo:

202

Ejemplo 1: Cul es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? " k " es el nmero de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6) " n" es el nmero de ensayos. En nuestro ejemplo son 10 " p " es la probabilidad de xito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La frmula quedara:

Luego, P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 2:Cul es la probabilidad de obtener cuatro veces el nmero 3 al lanzar un dado 8 veces?

" k " (nmero de aciertos) toma el valor 4 " n" toma el valor 8 " p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666)

La frmula queda:

Luego, P (x = 4) = 0,026

Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el nmero 3 al tirar un dado 8 veces.

203

La distribucin multinomial es una generalizacin de la distribucin binomial. En este caso, en un experimento interesa estudiar no la ocurrencia de un nico suceso o la de su contrario, sino la de varios sucesos (tres o ms). La distribucin multinomial, M(n,p1,...,pn) proporciona probabilidades de obtener, en m repeticiones independientes de un experimento, x1 veces el suceso A1, x2 veces el suceso A2,..., xn veces el suceso An, donde dichos sucesos forman una particin del espacio muestral, es decir, donde , por tanto, se cumple tal que . para y

As, considerando que Xi es el nmero de veces que se presenta el suceso Ai en las m repeticiones tenemos que la variable n-dimensional (X1, X2, ..., Xn) sigue una distribucin multinomial de parmetros n, p1, ..., pn y su funcin de probabilidad es

para

con

Hay que tener en cuenta que si (X1, X2, ..., Xn) es una variable multidimensional entonces existe una relacin lineal entre sus componentes ya que X1+ X2+ ...+ Xn = m, por lo que, una de las variables, por ejemplo Xn, se puede poner como combinacin lineal del resto, Xn=m-X1- X2- ...- Xn-1. Por tanto, el fenmeno que describe la variable (X1, X2, ..., Xn) queda igualmente descrito por una variable de una dimensin menor, (X1, X2, ..., Xn-1), sin que esta prdida de dimensin suponga una prdida de informacin.

Por ejemplo, una variable multinomial de dimensin dos (X1, X2), M(n,p1,p2), se puede describir considerando una cualquiera de sus componentes que tiene una distribucin binomial, por lo que en realidad esta variable es unidimensional y no bidimensional. Adems, cada una de las n variables, Xi, que forman una multinomial M(n,p1,...,pn) siguen distribuciones binomiales B(m,pi), es decir, las distribuciones marginales de una multinomial son binomiales, por tanto, la esperanza y la varianza de cada una de estas variables es, E[Xi]=mpi y Var(Xi)=mpi(1-pi). Adems la covarianza entre dos cualesquiera de sus componentes es, .

Estos momentos de las variables componentes de una multinomial se pueden agrupar en forma de matriz dando lugar a las denominadas matriz de esperanzas y matriz de varianzas-covarianzas, que recogen las caractersticas tericas principales de la distribucin multinomial (medias, varianzas y covarianzas)

204

Ejemplo: El entrenador de un equipo de baloncesto opina que los jugadores A, B y C tienen similares aptitudes para ser titulares del equipo en la posicin de base. As, determina que juegen el mismo nmero de minutos cada partido. Se sabe que el 40% de las canastas son de C, mientras que A y B consiguen un 30% de encestes. Calcular la probabilidad de que en un partido con 9 encestes de dos puntos, A consiguiera dos, B tres y C cuatro. Sea la variable tridimensional que recoge el nmero de encestes de A, de B y de C, respectivamente. Dicha variable es una multinomial con n=9, p1=0.3, p2=0.3 y p3=0.4. As,

ACTIVIDADES DE APRENDIZAJE

Elabore ejercicios con la distribucin binomial y multinomial de la bibliografa sugerida.

9.5

DISTRIBUCIN DE POISSON

El estudiante aplicar la distribucin de Poisson. La distribucin de Poisson sigue el siguiente modelo:

Vamos a explicarla: El nmero "e" es 2,71828

205

" l " = n * p (es decir, el nmero de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de xito en cada ensayo) " k " es el nmero de xito cuya probabilidad se est calculando

Veamos un ejemplo: La probabilidad de tener un accidente de trfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, cual es la probabilidad de tener 3 accidentes? Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribucin de Poisson.

Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de trfico en 300 viajes es del 8,9%

Otro ejemplo: La probabilidad de que un nio nazca pelirrojo es de 0,012. Cul es la probabilidad de que entre 800 recin nacidos haya 5 pelirrojos?

Luego, P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recin nacidos es del 4,6%.

ACTIVIDADES DE APRENDIZAJE Elabore ejercicios con la distribucin de Poisson de la bibliografa sugerida.

206

9.6 DISTRIBUCIN GEOMTRICA

El estudiante aplicar la distribucin geomtrica.

La distribucin geomtrica es un modelo adecuado para aquellos procesos en los que se repiten pruebas hasta la consecucin del xito a resultado deseado y tiene interesantes aplicaciones en los muestreos realizados de esta manera. Tambin implica la existencia de una dicotoma de posibles resultados y la independencia de las pruebas entre s.

Proceso experimental del que se puede hacer derivar Esta distribucin se puede hacer derivar de un proceso experimental puro o de Bernoulli en el que tengamos las siguientes caractersticas

El proceso consta de un nmero no definido de pruebas o experimentos separados o separables. El proceso concluir cuando se obtenga por primera vez el resultado deseado (xito).

Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A

La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no A es q siendo (p + q = 1).

Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las pruebas ,son independientes (si se trata de un proceso de "extraccin" ste se llevar a , cabo con devolucin del individuo extrado) . (Derivacin de la distribucin). Si en estas circunstancias aleatorizamos de forma que tomemos como variable aleatoria X = el nmero de pruebas necesarias para obtener por primera vez un xito o resultado A , esta variable se distribuir con una distribucin geomtrica de parmetro p.

Obtencin de la funcin de cuanta

207

De lo dicho anteriormente, tendremos que la variable X es el nmero de pruebas necesarias para la consecucin del primer xito. De esta forma la variables aleatoria toma valores enteros a partir del uno; 1,2,

La funcin de cuanta P(x) har corresponder a cada valor de X la probabilidad de obtener el primer xito precisamente en la X-sima prueba. Esto es, P(X) ser la probabilidad del suceso obtener X-1 resultados "no A" y un xito o resultado A en la prueba nmero X teniendo en cuenta que todas las pruebas son independientes y que conocemos sus probabilidades tendremos:

dado que se trata de sucesos independientes y conocemos las probabilidades

luego la funcin de cuanta quedara

Algunos autores consideran la aleatorizacin como "nmero de pruebas anteriores al primer xito". De esta manera el conseguir el xito a la primera sera X=0 . En la siguiente representacin grfica de la funcin de cuanta de la geomtrica puede apreciarse este tipo de aleatorizacin, sin embargo nosotros preferimos, por razones ACTIVIDADES DE APRENDIZAJE, utilizar la aleatorizacin antes comentada

208

Funcin de distribucin

En base a la funcin de cuanta se puede expresar la funcin de distribucin de la siguiente manera.

desarrollando la expresin tendramos de La Funcin Generatriz de Momentos (F.G.M.) quedara: donde

por lo que queda establecida que la F.G.M. tiene la expresin

En base a la FGM podemos obtener la media y varianza:

As Haciendo t =0 tendramos que La varianza sera

Haciendo t =0 tendramos que

209

De esta manera Luego La moda es el valor de la variable que tiene asociada mayor probabilidad el valor de su funcin de cuanta es el mayor. Es fcil comprobar (vase simplemente la representacin grfica anterior) que distribucin geomtrica es siempre 1. .Por lo tanto la media de la

En cuanto a la mediana Me ser aquel valor de la variable en el cual la funcin de distribucin toma el valor 0,5. As

por lo que :

ACTIVIDADES DE APRENDIZAJE Elabore ejercicios con la distribucin geomtrica de la bibliografa sugerida.

9.7

DISTRIBUCIN HIPERGEOMTRICA

El estudiante aplicar la distribucin Hipergeomtrica.

La distribucin hipergeomtrica multivariante H(N,m,p1,...,pn) es una generalizacin de la distribucin hipergemetrica. Proporciona probabilidades de extraer x1 bolas del color 1, x2 bolas del color 2,...y xn bolas del color n de una urna en la que hay N1,...Nn bolas de colores diferentes (N=N1++Nn).

210

Realizamos m extracciones sin reposicin , y consideramos las variables, Xi, nmero de bolas extradas de color i (i = 1, 2, ..., n). La variable n-dimensional (X1, X2, ..., Xn) sigue una distribucin hipergeomtrica multivariante de parmetros N, m, p1, ..., pn, donde , es decir, la proporcin de bolas de color i-simo (i= 1, 2,..,n) en la primera extraccin.

NOTA: Si las extracciones se hiciesen con reposicin entonces se tratara de una distribucin multinomial. La funcin de probabilidad de la distribucin hipergeomtrica multivariante es

para

con (i = 1, 2,..., n).

Adems, igual que en la distribucin anterior, hay que tener en cuenta que existe una relacin lineal entre las variables componentes, X1+ X2+ ...+ Xn = m, por lo que, una de las variables, por ejemplo Xn, se puede poner como combinacin lineal del resto, Xn=m-X1- X2- ...- Xn-1. Por tanto, el fenmeno que describe la variable (X1, X2, ..., Xn) queda igualmente descrito por una variable de una dimensin menor, (X1, X2, ..., Xn1), sin que esta prdida de dimensin suponga una prdida de informacin.

Anlogamente, una variable hipergeomtrica multivariante de dimensin dos (X1, X2), H(N,m,p1,p2), se puede describir considerando una cualquiera de sus componentes que tiene una distribucin hipergeomtrica, por lo que en realidad esta variable es unidimensional y no bidimensional.

Adems, cada una de las n variables, Xi, que forman una hipergeomtrica H(N,m,p1,...,pn) siguen distribuciones hipergeomtricas univariantes H(N,m,pi), es decir, las distribuciones marginales de una hipergeomtrica multivariante son hipergeomtricas, por tanto, la esperanza y la varianza de cada una de estas variables es, E[Xi]=mpi y Var(Xi)=mpi(1-pi)(N-m)/(N-1). Adems la covarianza entre dos cualesquiera de sus componentes es,

211

. Estos momentos de las variables componentes de una hipergeomtrica multivariante se pueden agrupar en forma de matriz dando lugar a las denominadas matriz de esperanzas y matriz de varianzas-covarianzas, que recogen las caractersticas tericas principales de la distribucin hipergeomtrica multivariante (medias, varianzas y covarianzas)

donde

Ejemplo: En un equipo de baloncesto con 12 jugadores, han hecho una comisin de 4 representantes. En la plantilla hay 3 pivotes, 3 base y 6 aleros. Cul es la probabilidad de que haya 2 bases y 2 pivotes?

Tenemos una variable tridimensional que recoge el nmero de pivotes, bases y aleros, respectivamente, que forman parte de la comisin. Dicha variable es una hipergeomtrica multivariante con N=12, n=4, N1=3, N2=3 y N3=6. As,

ACTIVIDADES DE APRENDIZAJE

Elabore ejercicios con la distribucin hipergeomtrica de la bibliografa sugerida.

212

INSTRUCCIONES: Lea detenidamente y anote dentro del parntesis v si el enunciado es verdadero y f si en falso. (recuerde que la forma de evaluar esta seccin es aciertos menos errores).

1.

Una variable aleatoria es una funcin que asocia un nmero real a cada elemento de un espacio muestral

( )

2.

La distribucin binomial, en un experimento interesa estudiar no la ( ) ocurrencia de un nico suceso o la de su contrario, sino la de varios sucesos (tres o ms). En la distribucin uniforme todos los eventos elementales tienen la misma probabilidad. ( )

3.

4.

Una probabilidad sencilla quiere decir que slo un evento puede ( ) llevarse a cabo; se le conoce como probabilidad incondicional En este caso la probabilidad de un suceso A se define como el lmite ( ) de una frecuencia relativa, cuando el experimento se realiza un nmero infinito de veces. Esto corresponde a la probabilidad clsica. La distribucin hipergeomtrica es una distribucin de probabilidad discreta con tres parmetros discretos N, d y n. ( )

5.

6.

INSTRUCCIONES: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto

y subraye la

1. Es una distribucin discreta, que expresa la probabilidad de que un nmero de eventos ocurran en un periodo de tiempo determinado, suponiendo que son independientes y que se conoce su tasa promedio. a) b) c) d) Distribucin binomial Distribucin multinomial Distribucin de Poisson Distribucin geomtrica

213

INSTRUCCIONES: Lea detenidamente respuesta correcta.

y conteste en los espacios en blanco la

1. En estadstica y probabilidad, la distribucin es una distribucin de probabilidad discreta que expresa la probabilidad de que un nmero de eventos ocurra en un periodo de tiempo determinado, suponiendo que son independientes y que se conoce su tasa promedio. 2. La es aquella cuyo resultado vara segn la muestra de una distribucin de probabilidad.

3. Los de las probabilidades son los fundamentos bsicos de las reglas del clculo de las posibilidades de eventos. 4. Se denomina a aquel en el cual se encuentran todos los elementos contenidos en el conjunto universal que no se encuentra en otro conjunto dado.

5. Esta distribucin es un caso especial de la binomial, ya que se desea que ocurra un xito por primera y nica vez en el ltimo ensayo que se realiza el experimento. En aleatoria de la probabilidad y la estadstica la es una de dos distribuciones de probabilidad discretas. 6. La de un suceso es una medida cuantificable que toma valores entre cero y uno a diferencia del concepto de posibilidad que es una medida cualitativa. 7. Los experimentos solo se pueden realizar una vez o ninguna o que se puedan repetir pero en condiciones distintas, no son aplicables ninguna de las dos definiciones dadas anteriormente, por lo que no es posible asignar probabilidades mediante un procedimiento objetivo, debiendo recurrir a procedimientos de tipo a opiniones de expertos.

214

AJUSTE DE BONFERRONI: Tcnica estadstica que ajusta el nivel de significacin en relacin al nmero de pruebas estadsticas realizadas simultneamente sobre un conjunto de datos. El nivel de significacin para cada prueba se calcula dividiendo el error global de tipo I entre el nmero de pruebas a realizar. El ajuste de Bonferroni se considera conservador. AMPLITUD O RANGO: La diferencia entre el valor mximo y mnimo de los valores de una variable. En la amplitud de una variable se encuentran comprendidos el 100% de los valores muestrales ANACOVA o ANCOVA: Anlisis de la covarianza. Es una tcnica estadstica que combina ANOVA (pues compara medias entre grupos) y anlisis de regresin (ajusta las comparaciones de las medias entres los grupos por variables continuas o covariables) ANOVA: Anlisis de la varianza. Es una tcnica estadstica que sirve para decidir/determinar si las diferencias que existen entre las medias de tres o ms grupos (niveles de clasificacin) son estadsticamente significativas. Las tcnicas de ANOVA se basan en la particin de la varianza para establecer si la varianza explicada por los grupos formados es suficientemente mayor que la varianza residual o no explicada REA BAJO LA CURVA entre dos puntos: Si la curva viene dada por una funcin de densidad terica, representa la probabilidad de que la variable aleatoria tome un valor dentro del intervalo determinado por esos dos puntos BONFERRONI: Ver ajuste de bonferroni

CARACTERSTICAS: Propiedades de las unidades o elementos que componen las muestras. Se miden mediante variables. Se asume que los individuos presentan diferentes caractersticas. CARTOGRAMAS. Son grficos en los que se puede agrupar para una misma clase diferentes frecuencias, por lo que se hace apropiado su uso cuando se desea analizar diferentes resultados obtenidos, con diferentes frecuencias pero con una misma clase.

215

CAUSALIDAD: Relacin entre causa y efecto. Generalmente identificadas como variables. No hay que confundir causalidad con correlacin. La correlacin mide la similitud estructural numrica entre dos variables. Normalmente la existencia de correlacin es condicin necesaria para la causalidad. COEFICIENTE DE CORRELACIN: Estadstico que cuantifica la correlacin. Sus valores estn comprendidos entre -1 y 1 COEFICIENTE DE DETERMINACIN: Es el cuadrado del coeficiente de correlacin. Expresado en tanto por ciento mide el grado de informacin compartida entre dos variables continuas COEFICIENTES DE REGRESIN: En un modelo de regresin lineal son los valores de a y b que determinan la expresin de la recta de regresin y=a + bx COEFICIENTE DE VARIACIN: Es una medida de dispersin relativa. No tiene unidades y se calcula dividiendo la cuasi-desviacin tpica entre la media muestral. Se suele expresar en tanto por ciento COMBINACIONES: selecciones diferentes de artculos tales que las secuencias alternativas posibles entre los componentes de cualquier seleccin se consideran inmateriales.

CONTRASTE BILATERAL: Contraste de hiptesis en la que la hiptesis alternativa da opcin a igualdad o superioridad CONTRASTE DE HIPTESIS: Es el proceso estadstico que se sigue para la toma de decisiones a partir de la informacin de la muestra. Comparando el valor del estadstico experimental con el valor terico rechazamos o no la hiptesis nula.

CONTRASTE UNILATERAL: Contraste de hiptesis en la que la hiptesis alternativa da opcin a solo igualdad o a solo superioridad CORRELACIN: Expresa la concordancia entre dos variables segn el sentido de la relacin de estas en trminos de aumento disminucin COVARIABLES: Variables continuas independientes que junto a una o ms variables grupo de tratamiento sirven para explicar una variable respuesta continua. Supongamos que pretendemos explicar las diferencias existentes en el nivel de cortisol en sangre por grupo de tratamiento A/B, teniendo en cuenta el peso. La variable peso es una covariable

216

COVARIANZA: Representa la media del producto de las desviaciones de dos variables en relacin a su media. CUARTILES: Existen tres cuartiles: Q!, Q2 y Q3. Estos nmeros dividen a los valores muestrales , una vez ordenados, en cuatro partes homogneas en cuanto a nmero de observaciones. As Q1 determina el valor que hace que haya un 25% de valores muestrales por debajo de ste, y un 75% por encima de ste. Q2 es la mediana CUASIVARIANZA: Caracterstica de una muestra o poblacin que cuantifica su dispersin o variabilidad. La cuasivarianza se obtiene multiplicando la varianza por n / (n-1). La cuasivarianza muestral es un estimador centrado (no sesgado) de la varianza poblacional. DATOS ALEATORIOS: Es la obtencin de datos realizada a partir de una poblacin a los cuales no se les ha dado ninguna prioridad. DATO ESTADSTICO: Los datos que se considera participan en el estudio estadstico se conoce como datos estadsticos, ms concretamente, se consideran como los valores que se pueden obtenerse de la observacin para formar la muestra. DATOS CENSURADOS: En anlisis de supervivencia son datos donde no se conoce el tiempo total hasta la aparicin del fracaso/xito bien porque el individuo se retir del estudio bien porque se acab el estudio (datos con censura administrativa) Existen datos censurados por la izquierda y por la derecha. DATOS PAREADOS: Datos de poblaciones dependientes, donde los datos de las variables van emparejados por individuos, en contraposicin con los datos independientes DECILES: Corresponden a los percentiles 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% , 90% y 100% DESCRIPTIVA: Parte de la estadstica que resume la informacin de la muestra. La informacin recogida y resumida en los estadsticos se usa para la estimacin de parmetros poblacionales DESVIACIN ESTANDAR (TPICA): Caracterstica de una muestra o poblacin que cuantifica su dispersin o variabilidad. Tiene las mismas unidades que la variable. la desviacin tpica es invariante con respecto al origen de la distribucin. Su cuadrado es la varianza

217

DIAGRAMA DE PUNTOS (scatter plot): ES un grfico bidimensional o tridimensional que muestra la variacin de los valores muestrales de dos o tres variables. DIAGRAMAS DE BARRAS: Representacin grfica para las variables discretas Se utiliza para representar datos cualitativos y cuantitativos, con datos de tipo discreto. En el eje x se representan los datos ordenados en clases mientras que en el eje y se pueden representar frecuencias absolutas o relativas. DIAGRAMA DE RBOL: Figura para definir el espacio muestral de experimentos aleatorios de pasos mltiples.

DIAGRAMAS DE VENN: Figuras grficas que en forma simblica describen espacios muestrales y eventos aleatorios DIAGRAMA DE SECTORES Este tipo de diagramas puede ser de dos tipo, se puede considerar una figura geomtrica en la que la informacin se distribuye dentro de la figura como puede ser una dona o un anillo en el que cada porcin dentro de la figura representa la informacin porcentual del total de datos. La segunda opcin es la utilizacin de pasteles en los que una porcin del pastel determinada por sectores individuales la informacin para ese sector especifico. DIFERENCIAS ESTADISTICAMENTE SIGNIFICATIVAS: Las diferencias entre lo observado y lo supuesto en la hiptesis nula no puede ser explicado por el azar DIFERENCIAS RELEVANTES: Diferencia esperada o definida a priori con un valor conceptual intrnseco. No confundir diferencias estadsticamente significativas que establece si una diferencia, cualquiera que sea su valor DIMENSIN: Si estudiamos una nica variable la dimensin es uno, si estudiamos la informacin de dos variables en forma conjunta la dimensin es dos,... DISPERSIN: Ver estadsticos de dispersin

DISTRIBUCIN DE DATOS: En la realizacin de un experimento, corresponde a la recogida de los datos experimentales para cada individuo y cada variable DISTRIBUCIONES DE FRECUENCIAS Se le conoce con este nombre al conjunto de clases que aparecen con su frecuencia correspondiente, generalmente mediante una tabla estadstica.

218

DISTRIBUCIN NORMAL O DE GAUSS: Es una distribucin terica de probabilidad que se usa tanto en la estadstica aplicada como en la terica. Aparece en la prctica con mucha frecuencia como consecuencia del importante resultado que establece el teorema central del lmite. Tiene una forma en forma de campana, y viene caracterizada por nicamente dos valores: la media y la varianza. DISTRIBUCIN T STUDENT: Distribucin terica de probabilidad. Se usa para la comparacin de dos medias en poblaciones independientes y normales ECUACIN DE LA REGRESIN: Ver recta de regresin

ERROR ALFA: Es el error que se comete cuando se rechaza una hiptesis nula cuando sta verdadera. Error de tipo I ERROR ALFA GLOBAL: Es el error alfa que se comete por hacer mltiples comparaciones. ERROR BETA: Es el error que se comete cuando no se rechaza una hiptesis nula siendo sta falsa. Error de tipo II ERROR DE PRIMERA ESPECIE: Ver error alfa

ERROR DE SEGUNDA ESPECIE: Ver error beta

ERROR DE TIPO I: Ver error alfa

ERROR DE TIPO II: Ve error beta

ERROR ESTANDAR DE LA MEDIA: Es el cociente entre la cuasivarianza muestral y la raz cuadrada del tamao muestral ERROR ESTANDAR DE LOS RESIDUOS: Estadstico de dispersin de los valores de los residuos despus de la regresin. ERROR FALSO NEGATIVO: Ver error beta

ERROR FALSO POSITIVO: Ver error alfa

219

ESCALA: La distribucin de datos puede recogerse en distintas escalas: nominal, dicotmica, discreta o continua ESPECIFICIDAD DE UN TEST DIAGNSTICO: Representa la probabilidad de que un individuo este sano habiendo dado negativo en el test diagnstico ESTADSTICA INFERENCIAL O INDUCTIVA. Sirve extrapolar los resultados obtenidos en el anlisis de los datos y a partir de ello predecir acerca de la poblacin, con un margen de confianza conocido. Se apoya fuertemente mediante el clculo de probabilidades.

ESTADSTICA DESCRIPTIVA O DEDUCTIVA. Se construye a partir de los datos y la inferencia sobre la poblacin no se puede realizar, al menos con una confianza determinada, la representacin de la informacin obtenida de los datos se representa mediante el uso de unos cuantos parmetros, tablas y algunas graficas planteadas de tal forma que den importancia los mismos datos a travs de parmetros que caractericen la distribucin. ESTADGRAFO es el trmino utilizado para designar a la persona dedicada a las tareas propias de la estadstica, aunque en ocasiones tambin es frecuente que se utilice para designar a la variable que define una distribucin estadstica, de esta forma es comn escuchar el trmino estadgrafo de prueba. EXPERIMENTO ALEATORIO. Experimento en el que existen diferencias de una muestra a otra, cuyas muestras pese a ser de una misma poblacin son diferentes. ESTADSTICO DE CONTRASTE EXPERIMENTAL Se utiliza para realizar las pruebas o contrastes de hiptesis. Depende de la muestra. Su valor hay que compararlo con el valor crtico dado en las tablas de distribucin tericas ESTADSTICOS Son funciones de la muestra. Su valor variar segn la muestra, pero nos permite hacer estimaciones de parmetro poblacionales o construir estadsticos experimentales para tomar decisiones. Este trmino que se utiliza para designar al profesional que se dedica al anlisis de la informacin estadstica, al que en ocasiones tambin se le conoce como estadgrafo. ESTADSTICOS DE CENTRALIZACIN: Son estadsticos que nos resumen la informacin de la muestra dndonos informacin acerca del valor donde parece concentrarse la distribucin de datos

220

ESTADSTICOS DE DISPERSIN: Son estadsticos que nos resumen la informacin de la muestra dndonos informacin acerca de la magnitud del alejamiento de la distribucin de datos en relacin a un valor central o de concentracin de los datos ESTADSTICOS DE FORMA: Son aquellos que nos hablan de la forma de la distribucin de datos en cuanto a su simetra y su apuntamiento ESTADO DE LA NATURALEZA: La naturaleza funciona segn una determinada hiptesis que desconocemos. La tcnicas estadsticas nos cuantifican el error que cometemos cuando tomamos decisiones en la prediccin de cul es la hiptesis con la que la naturaleza trabaja. Estos errores son los del tipo I y II ESTIMACIN: Tcnicas estadsticas que a partir de la informacin de la estadstica descriptiva pretenden conocer cmo es la poblacin en global. Existen tcnicas de estimacin puntuales y por intervalos de confianza ESTIMADO: Valor experimental que se toma como candidato al valor poblacional desconocido ESTIMADOR: Funcin de la muestra que sirve para dar valores candidatos a los valores desconocidos poblacionales. ESPACIO MUESTRAL: lista de todos los resultado bsicos de un experimento aleatorio. EVENTO ALEATORIO: cualquier subconjunto del espacio muestral.

EVENTO COMPUESTO: cualquier combinacin de dos o ms resultados bsicos.

EVENTO SIMPLE: cualquiera de los resultados bsicos de un evento aleatorio.

EVENTOS COLECTIVAMENTE EXHAUSTIVOS: eventos aleatorios diferentes que conjuntamente contiene todos los resultados bsicos en el espacio muestral. EVENTOS COMPATIBLES: eventos aleatorios diferentes que tiene al menos algunos resultados bsico en comn.

221

EVENTOS COMPLEMENTARIOS: dos eventos aleatorios tales que precisamente todos los resultados bsicos que no estn contenidos en uno estn contenidos en el otro. EVENTOS DEPENDIENTES: dos eventos aleatorios tales que la probabilidad de un evento es afectada porque ocurra el otro evento; en consecuencia, p(A) no es igual a p (AB). EVENTOS INDEPENDIENTES: dos eventos aleatorios tales que la probabilidad de un evento no es afectada por el acontecimiento del otro evento; por lo tanto, p (A) = p (AB). EVENTOS MUTUAMENTE EXCLUSIVOS: eventos aleatorios diferentes que no tienen resultados bsicos en comn. EXPERIMENTO ALEATORIO: cualquier actividad que resulte en uno, y slo uno, de varios resultados bien definidos pero que no permite decir por anticipado cul de stos prevalecer en cualquier ejemplo particular. FACTOR: Variable que se incluye en un modelo con el propsito de explicar la variacin en la variable respuesta. Ver variable independiente o explicativa FACTOR DE CLASIFICACIN: Es una variable que se usa para clasificar los datos experimentales en grupos. Los factores de clasificacin son variables nominales. Cada factor de clasificacin se compone de niveles. As la variable "Fumador" codificada como "nunca", "ex fumador", "fumador actual" es un factor de clasificacin con tres niveles FACTORIAL: producto de una serie de nmeros enteros positivos que desciende de un nmero dado, n, hasta 1. FRECUENCIA ABSOLUTA f(xi) se determina como el nmero de veces que se repite un dato xi. Las frecuencias absolutas representan el recuento de los valores de una variable discreta de forma que su suma nos da el tamao muestral. FRECUENCIA ABSOLUTA ACUMULADA Fi Para un determinado valor se considera como la frecuencia de cada dato xi mas la suma de los valores anteriores a dicha suma.

222

FRECUENCIA RELATIVA HI es el cociente fi /N , donde N es el nmero total de datos. Las relativas son las absolutas divididas por el tamao muestral .Las frecuencias relativas sumarn 1 100 segn se expresen en tanto por uno o en tanto por ciento FRECUENCIA RELATIVA ACUMULADA Hi /N es el cociente Fi

FUNCIN: Funcin matemtica. Expresin que liga dos o ms variables de forma determinstica FUNCIN ACUMULADA DE SUPERVIVENCIA: Funcin estadstica que presenta la proporcin de individuos que mueren entre dos tiempos dados. FUNCIN DE DENSIDAD DE SUPERVIVENCIA: Nos da el momento crtico de mayor tasa de fallos o muertes en trminos absolutos, por ello no da una medida del riesgo en un momento dado FUNCIN DE RIESGO DE SUPERVIVENCIA: Nos da una media de la predisposicin al fallo en funcin del tiempo FUNCIN TERICA DE PROBABILIDAD: Idealizacin matemtica que nos permite calcular probabilidades de que una variable tome un valor (caso discreto) o rango de valores (caso continuo) FUNCIN TERICA DE PROBABILIDAD DE SUPERVIVENCIA: Probabilidad de que un individuo sobreviva un tiempo mayor que t GAUSSIANA: Ver distribucin normal GRADO DE CONFIANZA: Ver nivel de confianza

GRADOS DE LIBERTAD: El nmero de datos que se pueden variar para que a un total fijo podamos reconstruir dicho total. As la media tiene n-1 grado de libertad, pues si conocemos el valor de esta podemos variar n-1 datos ya que restante vendr fijado. En una tabla 4x3 , si nos dan las frecuencias marginales podremos variar las frecuencias de (4-1)x(3-1)=3x2=6 celdas, quedando forzosamente determinadas las frecuencias de las celdas restantes. As, los grados de libertad seran en este caso de 6 HETEROCEDASTICIDAD: Hiptesis de no igualdad de varianzas poblacionales en distintos grupos

223

HIPTESIS: Cualquier teora que formule posibles lneas de trabajo experimental. Ver hiptesis nula y alternativa HIPOTESIS ALTERNATIVA: Aquella que queremos probar. Representa la hiptesis renovadora HIPOTESIS NULA: Aquella que queremos rechazar. Representa a la situacin actual

HISTOGRAMAS: Es un grfico en forma de barras de una variable continua que se ha discretizado en intervalos, de forma que la altura de las barras en cada intervalo indica la frecuencia relativa en ste. . Los histogramas de frecuencias son grficas que representan un conjunto de datos que se emplean para representar datos de una variable cuantitativa. En el eje horizontal o de las abscisas se representan los valores tomados por la variable, en el caso de que los valores considerados sean continuos la forma de representar los valores es mediante intervalos de un mismo tamao llamados clases. En el eje vertical se representan los valores de las frecuencias de los datos. Las barras que se levantan sobre la horizontal y hasta una altura que representa la frecuencia. Un punto importante en el manejo de la informacin bajo el uso de histogramas es el hecho de poder comparar, bajo un proceso en control, que a medida que se crecen las clase tiene aproximadamente la forma de una campana centrada, es la de una de las distribuciones ms importantes conocidas como frecuencia normal o gaussiana. HOMOCEDASTICIDAD: Hiptesis de igualdad de varianzas poblacionales en distintos grupos IMPRECISION: Error que se comete en la prediccin

INDEPENDENCIA: Son datos que no estn ligados entre si

INFERENCIA: Trmino utilizado para indicar la prediccin hecha acerca de una poblacin.

INTERVALO DE PROBABILIDAD: Proporcin de casos entre dos valores definidos de la muestra INTERVALOS CONFIDENCIALES: Intervalos de confianza. Intervalos fiduciales. Incluyen una cota mnima y mxima del verdadero parmetro poblacional con un determinado nivel de confianza

224

JACKNIFE: Mtodo estadstico de estimacin por intervalos de confianza basado en la simulacin con reeemplazamineto, propuesto por TuKey JUEGO DE SUMA CERO: En la teora de juegos, juego en el que lo que unos ganan es a costa de lo que otros exactamente pierden LEY DE LA ADICIN: ley de la teora de probabilidades que se usa para calcular la probabilidad para que ocurra la unin de dos o ms eventos; segn la ley general, para cualesquiera dos eventos p(A o B) = p(A) + p(B) - p(A y B); segn la ley especial para dos eventos mutuamente exclusivos, p(A o B) = p(A) + p (B).

LEY DE LA MULTIPLICACIN: ley de teora de probabilidades que se usa para calcular la probabilidad para una interseccin de dos o ms eventos; segn la ley general para cualesquier dos eventos, p(A y B) = p(A) p(BA) y tambin p(A y B) y tambin p(A y B) = p(B) p(AB); segn la ley especial para eventos independientes, p(A y B) = p(A) p(B). LEY DE LOS GRANDES NMEROS: ley que enuncia lo siguiente: la probabilidad de una desviacin significativa de un valor de probabilidad empricamente determinado, a partir de uno tericamente determinado, es menor cuanto mayor sea el nmero de repeticiones del experimento aleatorio en cuestin. LIMITES CONFIDENCIALES: Extremos de los intervalos confidenciales

MAXIMO: Es un valor muestral de forma que por encima de este no hay valores muestrales MARCA DE CLASE: Es el punto medio de una clase y se determina por la semisuma del LIA + LSA Marca de clase = LIA + LSA 2

MEDIANA: Corresponde al percentil 50%. Es decir, la mediana hace que haya un 50% de valores muestrales inferiores a ella y un 50% de valores muestrales superiores a ella. MEDIA: Es una medida de centralizacin para una variable continua. Se obtiene sumado todos los valores muestrales y dividiendo por el tamao muestral

225

MNIMO: Es un valor muestral de forma que por debajo de este no hay valores muestrales MODA: Es el valor que ms se repite en una variable nominal

MODELO: Intento matemtico / estadstico para explicar una variable respuesta por medio de una o ms variables explicativas o factores MUESTRAS: Subgrupos de observaciones de la poblacin de estudio. Es un subconjunto de datos tomados de la poblacin, cuya finalidad es la de realizar inferencias acerca de la poblacin a partir del comportamiento de sus elementos. Es claro que si la muestra es un subconjunto de la poblacin entonces la muestra tendr un nmero menor de elementos. La naturaleza de la muestra radica en la optimizacin de los recursos, por ejemplo, si deseamos hacer un estudio acerca de las lecturas que a los estudiantes de Michoacn les gusta leer, el estudio implicara considerar a los estudiantes de lugares remotos, resultando difcil desde el punto de vista econmico, sin embargo la estadstica plantea mtodos mediante los cuales con una eleccin adecuada del tamao de muestra podemos predecir a partir de una muestra las preferencias que tienen los estudiantes acerca del tipo de lectura. NIVEL DE CONFIANZA: Se define como 1 menos el nivel de significacin. Se suele expresar en tanto por ciento NIVEL DE SIGNIFICACIN: La probabilidad de rechazar una hiptesis nula verdadera; es decir, la probabilidad de cometer un error de tipo I NIVELES DE CLASIFICACIN: Los distintos posibles valores que pueden aparecer en una variable explicativa nominal u ordinal NORMAL: Ver distribucin de probabilidad normal

NMEROS: Ver valores numricos

OBSERVACION: Sinnimo de caso registro e individuo

ODDS: Nombre ingles para designar la medida del efecto relacionada, en una tabla de frecuencias 2 por 2, con la razn de los productos cruzados. ORDEN DE UNA MATRIZ: Es el numero que designa, en una matriz cuadrada, el numero de filas o columnas

226

ORTOGONAL: Se dice de las variables y en general de las funciones que son independientes. P (p- valor): El nivel de significacin observado en el test. Cuanto ms pequeo sea, mayor ser la evidencia para rechazar la hiptesis nula PARMETROS: Son valores desconocidos de caractersticas de una distribucin terica. El objetivo de la estadstica es estimarlos bien dando un valor concreto, bien dado un intervalo confidencial PEARSON ( r de Pearson) .Ver coeficiente de correlacin

PERCENTILES: Un percentil 90% corresponde a un valor que divide a la muestra en dos, de forma que hay un 90% de valores muestrales inferiores a ste, y un 10% de valores muestrales superiores a ste. Los percentiles 25%, 50%, 75% son el primer, segundo y tercer cuartil respectivamente PERMUTACIONES: arreglos ordenados distinguibles de artculos, todos los cuales se han sacado de un grupo dado de artculos. PICTOGRAMA: El pictograma consiste en la utilizacin de smbolos utilizados para representar un conjunto de datos, en el caso de la representacin de datos individuales a travs de barras hemos utilizado los pictogramas, sin embargo en reas especificas convendra analizar el conjunto de datos. PIRMIDE DE POBLACIN: Este grfico se construye utilizando pirmides para construir la representacin de los datos bajo cierta clase, la diferencia de informacin considerada entre cada clase ser dada por el tamao de la pirmide. En ocasiones la frecuencia de cada clase se coloca en el extremo superior de cada clase, sin embargo tambin, al igual que en las anteriores puede resultar til colocar informacin, como el porcentaje de informacin en la punta de cada pirmide. POBLACIONES: Conjunto de individuos de inters. Normalmente no se dispone de informacin de toda la poblacin y se recurre a muestras. Es conjunto de elementos que tiene caractersticas comunes, al menos una. Por ejemplo, una poblacin es el grupo de estudiantes de un pas. En el caso particular de la estadstica la poblacin constituye el objeto de estudio, es decir, la poblacin es el conjunto de individuos o entes que constituyen el objeto de estudio sobre el que se desea predecir un comportamiento a partir del estudio. POLGONO DE FRECUENCIA: Representaciones grficas alternativas al histograma de frecuencias. Estos se construyen a partir de los puntos medios de cada clase. La

227

utilizacin de los puntos medios o marcas de clase son llevados al escenario grfico mediante la utilizacin de los polgonos de frecuencias. Se construye uniendo los puntos medios de cada clase localizados en las tapas superiores de los rectngulos utilizados en los histogramas de las grficas. Su utilidad se hace necesaria cuando desean destacarse las variables de tendencia central, como son media, modas y medianas. PORCENTAJES: Proporciones expresadas en tanto por ciento

POTENCIA DE LA PRUEBA: (1-beta). Es decir la probabilidad de rechazar una hiptesis nula siendo sta falsa. Se suele expresar en tanto por ciento PREVALECIA: Cociente entre el nmero de individuos que poseen una caracterstica (p. ej. enfermedad) entre el total de la poblacin PROBABILIDAD: Asignacin de un nmero entre cero y uno a cada resultado experimental. PROBABILIDAD CONDICIONAL: medida en que ocurre un evento en particular, dado que otro evento ya ha ocurrido o es seguro que ocurra. PROBABILIDAD CONJUNTA: medida de la verosimilitud del acontecimiento simultneo de dos o ms eventos. PROBABILIDAD INCONDICIONAL: medida de la verosimilitud de que ocurra un evento particular, sin considerar si ocurre otro evento. PROBABILIDAD OBJETIVA: medida numrica de casualidad que estima la verosimilitud de un acontecimiento especfico (evento A) de un experimento aleatorio repetible (segn el mtodo clsico, es igual al nmero de resultados bsicos igualmente probables favorables al acontecimiento del evento A dividido entre el nmero de resultados bsicos igualmente probables posibles; segn el mtodo emprico, es igual al nmero de veces que ocurri el evento A en el pasado durante un gran nmero de experimentos, dividido entre el nmero mximo de veces que el evento a pudo haber ocurrido durante estos experimentos.) PROBABILIDAD POSTERIOR: informacin nueva. probabilidad previa modificada con base en

228

PROMEDIO: Es la cantidad que se obtiene al sumar el conjunto de datos que intervienen en la muestra entre el total de datos, este tambin es conocido como media aritmtica o simplemente media y se calcula como: xi x n PROPORCION: Nmero de individuos que verifican una condicin entre el total del tamao muestral. Se puede expresar en tanto por uno o en tanto por cien PRUEBA CHI CUADRADO: Se utiliza para analizar tablas de contingencia y comparacin de proporciones en datos independientes

PRUEBA DE F: Prueba estadstica que sirve para comparar varianzas. El estadstico F experimental es el estadstico de contraste en el ANOVA y otras pruebas de comparacin de varianzas PRUEBA DE FISHER: Es la prueba estadstica de eleccin cuando la prueba de chi.cuadrado no puede ser empleada por tamao muestral insuficiente. PRUEBA DE LOS SIGNOS: Prueba estadstica que sirve para comparar dos variables en trminos de diferencias positiva o negativa, y no en trminos de magnitud PRUEBA DE MCNEMAR: Prueba estadstica que sirve para comparar proporciones en datos pareados PRUEBA NO PARAMTRICA: Tcnica estadstica que no presupone ninguna distribucin de probabilidad terica de la distribucin de nuestros datos. PRUEBA PARAMETRICA: En contraposicin de la tcnicas no paramtricas, las tcnicas paramtricas si presuponen una distribucin terica de probabilidad subyacente para la distribucin de los datos. Son ms potentes que las no paramtricas.

PRUEBA T DE STUDENT : Se utiliza para la comparacin de dos medias de poblaciones independientes y normales PUNTO DE INFLEXIN : Representan los puntos de una funcin matemtica donde la curva pasa de ser cncava a convexa o recprocamente

229

RANGO: Diferencia entre el valor mximo y mnimo de un muestra o poblacin. Solo es vlido en variables continuas. Es una mala traduccin de ingls "range". Amplitud RANGO INTERCUARTILICO: La diferencia entre el percentil 75% y el percentil 25%

RAZN DE VEROSIMILITUDES: Combina resultados de varios tests diagnsticos dando una probabilidad de enfermedad en base a ese conjunto de resultados en forma global RECTA DE REGRESIN: Es el modelo que sirve para explicar una variable respuesta continua en trminos de un nico factor o variable explicativa RECORRIDO DE UNA DISTRIBUCIN: Ver rango.

REGRESION: Tcnica estadstica que relaciona una variable dependiente (y) con la informacin suministrada por otra variable independiente (x).ambas variables deben ser continuas. Si asumimos relacin lineal, utilizaremos la regresin lineal simple. Entre las restricciones de la RLS se incluyen: Los residuos deben ser normales Las observaciones independientes. La dispersin de los residuos debe mantenerse a lo largo de la recta de regresin REGRESIN LINEAL MLTIPLE: El modelo de regresin lineal mltiple sirve para explicar una variable respuesta continua en trminos de varios factores o variables explicativas continuas REGRESIN POLINMICA: ES un tipo especial de regresin mltiple donde aparecen como variables independientes un nica variable y potencias de sta (al cuadrado, al cubo.) RELACIN LINEAL: Ver recta de regresin

RESIDUOS: Residuales. Distribucin de valores muestrales calculados como la diferencia entre el valor de la variables respuesta (y) y el estimado del modelo de regresin ( ^y). La distribucin de residuos es importante como indicador del cumplimiento de las condiciones de aplicacin de las tcnicas de correlacin, as como de la bondad del ajuste. SECTORES CIRCULARES: Forma de representacin en forma de tarta de variables discretas nominales

230

SENSIBILIDAD DE UN TEST DIAGNSTICO: Representa la probabilidad de que un individuo est enfermo habiendo dado positivo en el test diagnstico SESGO: La diferencia entre el valor del parmetro y su valor esperado. Tambin se utiliza en contraposicin de aleatorio, as una muestra sesgada es no aleatoria SIMETRIA: Es una medida que refleja si los valores muestrales se extienden o no de igual forma a ambos lados de la media. SPEARMAN (rho de Spearman): Coeficiente de correlacin ordinal anlogo al coeficiente r de Pearson de correlacin lineal SUMATORIO: Estadstico descriptivo que suma los valores numricos de los datos muestrales de distribuciones continuas TABLAS DE CONTINGENCIA: Tablas de 2 o ms variables, donde en cada celda se contabilizan los individuos que pertenecen a cada combinacin de los posibles niveles de estas variables TABLAS DE FRECUENCIAS: Ver tablas de contingencia

TABLA DEL ANOVA: Es una forma de presentar la variabilidad observada en una variable respuesta en trminos aditivos segn las distintas fuentes de variacin: modelo y residual TAMAO MUESTRAL: Nmero de individuos u observaciones que componen la muestra TECNICAS DE CORRELACION: Ver coeficiente de correlacin

TECNICAS DE REGRESION: Ver recta de regresin y regresin lineal mltiple

TECNICAS NO PARAMETRICAS: Son tcnicas estadsticas que no presuponen ningn modelo probabilstico terico. Son menos potentes que las tcnicas paramtricas, aunque tienen la ventaja que se pueden aplicar ms fcilmente TEOREMA DEL LIMITE CENTRAL: Resultado bsico en la estadstica que afirma que la distribucin de las medias muestrales ser normal para un n suficientemente grande con independencia de la distribucin de datos de partida

231

TRANSFORMACIONES: Cambios de escala con el propsito de conseguir linealidad, normalidad en los datos UNIDAD: Concepto primario relacionado con los componentes elementales de la muestras estadsticas. Sinnimo, pero no esencialmente idntico, de caso , observacin , registro o individuo UNIVERSO: Conjunto infinito de elementos o unidades generado por un modelo terico. Conjunto real de todos los elementos que comparten unas condiciones de admisin en el conjunto

VALORES NUMRICOS: Resultados de las variables para cada individuo en la muestra de estudio. Su naturaleza puede ser nominal, dicotmica, ordinal o continua VALORES NUMRICOS: Resultados de las variables para cada individuo en la muestra de estudio. Su naturaleza puede ser nominal, dicotmica, ordinal o continua VALOR PREDICTIVO POSITIVO DE UN TEST DIAGNOSTICO: La probabilidad de que un individuo est enfermo si el test diagnstico da positivo VALOR PREDICTIVO NEGATIVO DE UN TEST DIAGNOSTICO: La probabilidad de que un individuo est enfermo si el test diagnstico da negativo VARIABLE: Objeto matemtico que puede tomar diferentes valores. Generalmente asociado a propiedades o caractersticas de las unidades de la muestra. Lo contrario de variable es constante. VARIABLE ALEATORIA: Variable cuyo resultado vara segn la muestra segn una distribucin de probabilidad VARIABLES ALEATORIAS CONTINUAS. Permiten una infinidad de valores al azar dentro de un intervalo, considerndose variables continuas precisamente por la posibilidad de poder tomar cualquier valor dentro de una infinidad de valores. VARIABLES ALEATORIAS DISCRETAS. Las variables cuya naturaleza toma un nmero finito de valores enteros, tales como: los estudiantes de la escuela de medicina de una universidad, los alumnos reprobados en la materia de matemticas, el nmero de peces en un estanque, el nmero de cursos que un estudiante debe cursar para graduarse, etctera. El conjunto de valores que podra de tomar una variable aleatoria discreta puede ser finita o infinita numerable.

232

VARIABLE CONTINUA: Aquella que puede tomar una infinidad de valores, de forma que dados dos valores cualesquiera, tambin pueda tomar cualquier valor entre dichos valores VARIABLES CUALITATIVAS. Son aquellas variables que como su nombre lo indica estn relacionadas con sus caractersticas exteriores. VARIABLES CUANTITATIVAS. Estas variables son caracterizadas por alguna informacin numrica que se le puede asociar a los individuos de la una poblacin. Esta caracterizacin puede ser clasificada en discreta y continua. Variables nominales. Son aquellas variables que son descritas por algunas caractersticas de sus integrantes. VARIABLES CUANTITATIVAS determinado por valores enteros. DISCRETAS. Son aquellas cuyo valor est

VARIABLES CUANTITATIVAS CONTINUAS. Son aquellas cuyo valor est determinado por valores reales, generalmente esas variables pueden tomar toda una gama de valores dentro de la recta real. VARIABLES CUASICUANTITATIVA. Son variables nominales que a pesar de ello se pueden ordenar entre ellas, ejemplo de ellas los pueden representar los valores que pueden tomar los corredores en una competencia, en la forma en que llegan a la meta, primer lugar, segundo lugar, etc. VARIABLE DEPENDIENTE: Ver variable respuesta

VARIABLE DISCRETA: Variable que toma un nmero finito o infinito de valores, de forma que no cubre todos los posibles valores numricos entre dos dados, en contraposicin de las continuas VARIABLE EXPLICATIVA: Ver variable independiente

VARIABLE INDEPENDIENTES O EXPLICATIVAS: Variables que no sirven para construir un modelo que explique el comportamiento de una o ms variables respuesta VARIABLE RESPUESTA O DEPENDIENTE: Variable objeto del estudio y que sus resultados se pretenden explicar por medio de las variables llamadas explicativas o independientes

233

VARIABLES: Describen caractersticas en las observaciones realizadas

VARIANZA: Caracterstica de una muestra o poblacin que cuantifica su dispersin o variabilidad. La varianza tiene unidades al cuadrado de la variable. Su raz cuadrada positiva es la desviacin tpica. La varianza muestral es un estimador sesgado de la varianza poblacional X2 Chi- cuadrado: Ver prueba de Chi cuadrado

WILCOXON: Prueba estadstica no paramtrica para la comparacin de dos muestras (dos tratamientos). Las distribuciones de datos no necesitan seguir la distribucin normal . Es por tanto una prueba menos restrictiva que la prueba t-Student.

234

ANEXOS

TABLA PARA NIVEL DE CONFIANZA EN CLCULO DE TAMAO DE UNA MUESTRA


NIVEL DE CONFIAN ZA Z
99.7 %

99 % 2.5 8

98 % 2.3 3

96 % 2.0 5

95.45 % 2.00

95 % 1.9 6

90%

80 % 1.2 8

68.27 % 1.00

50%

3.0 0

1.64 5

0.67 45

235

236

237

238

239

240

Allen, W. (2002) Estadstica aplicada a los negocios y la economa (3 ed) Mxico: Mxico: McGraw-Hill. Anderson Sweenley Williams (1998) Estadstica para administracin y economa. Mxico: Math Learning

Daniels, W. (1981) Estadstica con Aplicaciones a las Ciencias Sociales y a la Educacin. Mxico: McGraw Hill

Douglas, L., Mason, R. y Williams, M. (2004) Estadstica para la Administracin y la Economa (3 ed.). Mxico: McGraw-Hill

Ferris J. (2002) Estadstica para Ciencias sociales. Mxico: Mc Graw Hill

Freund, J. E. y Gary A. (1994). Estadstica elemental. Mxico: Prentice-Hall Hispanoamericana, SA (8 edicin.)

Fuenlabrada, S. (2004) Probabilidad y estadstica. Mxico: Mc Graw Hill. Mxico

Garca, P., A. (Textos Universitarios.) Elementos de Mtodo Estadstico. Mxico: Universidad Nacional Autnoma de Mxico John E. Freud Irwin Miller Marylees Miller. (2002)Estadstica matemtica con aplicacin. Mxico: Prentice Hall John E. Freud Simon A. Gary (2003). Estadstica elemental. (8 edicin) Mxico: Prentice Hall

Johnson, R.(1999) Estadstica Elemental. Mxico: Trillas

241

Kohler, H. (2005) Estadstica para negocios y economa. Mxico: CECSA

Leonard, K.(1998) Estadstica aplicada a la administracin y la economa (3 ed.). Mxico: McGraw-Hill

Levin R. (1996) Estadstica para Administradores. Mxico: Prentice Hall

Mendenhall, W.; D.D. Wackerly y R.L. Scheaffer.(2001) Estadstica Matemtica con Aplicaciones. Mxico: Grupo Editorial Iberoamrica

Mendenhall, W. (1998) Estadstica para Administradores, Segunda Edicin, Mxico: Grupo Editorial Iberoamrica

Montgomery, D.C. y Runger G.C. (1996) Probabilidad y Estadstica Aplicadas a la Ingeniera, Primera Edicin Mxico: Mc Graw Hill

Pea, D.; Romo J. (1997) Introduccin a la Estadstica para las Ciencias Sociales. Mxico: Mc Graw Hill

Spiegel, M.R.(1970) Estadstica Graw Hill

Primera Edicin Serie Schaum Mxico: Mc

Stevenson W. J. (1993) Estadstica para administracin y economa. Mxico: Harla

Richard, L. y David, R.(2004) Estadstica para Administracin y Economa (7 ed.). Mxico: Pearson Educacin

Ritchey, F. (2002) Estadstica para las Ciencias Sociales. Mxico: McGraw Hill

Weimer, R.C. (1996) Estadstica. Segunda Edicin. Mxico: CECSA