1.

ESTADISTICA DESCRIPTIVA Y FUNDAMENTOS DE PROBABILIDAD
1.1. Notación De Sumatoria
Consideremos las siguientes sumas:

Para

1.2. Datos No agrupados 1.2.1. Medidas de Tendencia Central y de posición
Medidas de tendencia central: Son indicadores estadísticos que muestran hacia que valor (o valores) se agrupan los datos.
Esta primera parte la dedicaremos a analizar tres medidas de tendencia central: La media aritmética La moda La mediana En el suplemento de este capitulo incluiremos otras medidas de tendencia central.

Media aritmética (µ o X ): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.

Esta apreciación nos sugiere dos formas de representar la media aritmética. obteniéndose así la Varianza. las diferencias se elevan al cuadrado y después se suman entre sí. Las más frecuentes son: amplitud. Las ventajas son: ii. b. Varianza poblacional: se simboliza por . En notación compacta es: c. varianmcia o varianza y el coeficiente de variación. 1. mientras que n el de la muestra). Medidas de dispersión La dispersión de un conjunto de observaciones se refiere a la variedad que muestran éstas.2. a. Pobre por solo tomar dos datos La Varianza: Es una medida de la dispersión de los datos alrededor de una media.2. Amplitud: (R): Es la diferencia entre el valor más pequeño (xs) y el más grande (xl) en un conjunto de observaciones. Media aritmética para datos no agrupados Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muéstrales : N ∑ ∝ = i=1 X i n ∑ X= i=1 X i N n Población Muestra Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica el tamaño de la población. Cálculo: se resta la media de cada uno de los valores individuales. Para valores iguales NO hay dispersión. Luego esta suma se divide entre el tamaño de la muestra menos 1. Mide la cantidad total de variabilidad presente en el conjunto de datos. Simplicidad del cálculo mm.Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como muéstrales: sin agruparlos o agrupándolos en tablas de frecuencias. iii.

. Ventajas: Es independiente de la unidad de medición. 3. Desventajas: No funciona bien cuando se quiere comparar la dispersión de dos conjuntos de datos.S peso litros. Varianza de la muestra: se simboliza por c. por lo que no es una medida adecuada de dispersión si se pretende expresar este concepto en término de las unidades originales. Entonces la desviación estándar es igual a la raíz cuadrada de la varianza. Colesterol: Mgr/l00 ml suero V.b. Niños diferentes edades: Kl – libras Una medida de la varianza relativa NO absoluta es el coeficiente dee variación: La desviación estándar se presenta como un porcentaje de la media. Las dos variables involucradas tienen medidas en diferentes unidades. Ejemplo: 2. Poblacional La varianza representa unidades al cuadrado.

0 578.0 2086.5 FRECUENCIA ACUMULADA 5 5 .5 74.5 218.5 345.5 44.5 FRECUENCIA ACUMULADA 5 24 34 47 5! 55 57 5 19 10 13 4 4 3 57 1. Hacer suposiciones respecto a los valores cuando se calcula una medida descriptiva a partir de datos agrupados. las observaciones individuales pierden su identidad. Datos Agrupados 1. todos los valores que caen dentro (le mm intervalo tic clase específico se localizan en: 1. pero sí la distribución de frecuencia.0 258. Tabla de frecuencias INTERVALO 10—19 20—29 30—39 40—49 50—59 60—69 70—79 TOTAL FRECUENCIA MEDIA DE CLASE 14.5 34.5 MIFI 72.3. Se multiplica el punto medio por la frecuencia correspondiente. pero los valores reales no se pueden determinar.5 MIFI 72. Es posible determinar el número de observaciones que caen dentro de varios intervalos de clase. La Media: Suposición.1.5 54. INTERVALO 10—19 FRECUENCIA MEDIA DE CLASE 14.3.2. se suman esos productos y se divide entre la suma de frecuencia.0 149.5 64. Medidas de tendencia Central Muchas veces no se tiene acceso a los datos originales.3. Punto medio del intervalo: 2.1. Cuando los datos se agrupan.5 24.5 465.

3.5 74. después de que el límite inferior del intervalo que contiene a la mediana ha sitio alcanzado.0 2086. Medidas de dispersión Cálculo de la desviación típica para datos agrupados en clases y agrupados por frecuencias Método largo: Se aplica la siguiente fórmula S= ∑ fx 2 donde x = x m − x y f es la frecuencia absoluta de cada intervalo.5 24 34 47 5! 55 57 Mediana: Suposición: los datos están distribuidos uniformememite a través del intervalo.5 218. Método abreviado o corto: La fórmula a utilizar es: . fi = frecuencia del intervalo que contiene a la mediana 1.5 345.0 258. Donde: Li = límite inferior real dcl intervalo que contiene la mediana Vi = límite superior real del intervalo que contiene a la mediana .5 465.0 578.20—29 30—39 40—49 50—59 60—69 70—79 TOTAL 19 10 13 4 4 3 57 24.3. N = número total de observaciones j = número de observaciones que faltan para alcanzar a la mediana.5 64.0 149.5 54.5 34.5 44.

Comparemos.S=I ∑ fd 2  ∑ fd   −     2 donde: I: amplitud de la clase D: distancia en clases desde cada una en concreto a la clase que contiene a la media supuesta A. esta información puede ser errónea. estas dos series: Serie 1: 1 5 7 7 8 9 9 10 17 Serie 2: 2 4 6 8 10 12 14 16 18 . pues el hecho de que no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad. S= ∑ (x − x ) 2 Veamos ahora cómo se calcula la desviación media en el caso de datos agrupados en intervalos. Es la medida de dispersión más sencilla y también. La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribución. por tanto. AMPLITUD TOTAL O RECORRIDO El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. por ejemplo. Además. la que proporciona menos información. Es decir. DM = ∑ n ⋅x i RANGO.

utilizando determinadas distribuciones probabilísticas. los resultados de éstas se pueden utilizar para analizar datos estadísticos. Ejemplo: 5! = 5 * 4 * 3 * 2 * 1 en notación: n! = n * (n-1) * (n-2) * .4. será pues.. bastante restringido. TEORÍAS DE CONTEO Permutaciones y combinaciones: Contar el número de eventos que cumplen con algún conjunto de condiciones. ¿En cuantas formas se pueden acomodar en una incubadora? 4! =4 3 * 2 * 1 = 24 maneras Para saber cuales son las formas de colocarlos se realiza un diagrama de árbol . pero están desigualmente agrupadas. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. con gran exactitud. 1 por definición 0! = 1 otra notación: 5! = 5 * 4! n! = n (n-l) Los factoriales sc usan para saber el número de formas en que se pueden organizar los objetos. 1. la segunda se distribuye uniformemente a lo largo de todo el recorrido. El uso de esta medida de dispersión. Sirven para calcular la probabilidad de un evento cuando el número de eventos posibles es muy grande. Ejemplo: cuatro envases con medio de cultivo y en cada uno de ellos se incuba un organismo diferente. Factoriales: Dado un número entero positivo n el producto de todos los enteros desde n hasta 1 se llama factorial de n y se denota como n!.Ambas series tienen rango 16. Muchos conjuntos de datos se pueden aproximar. Conjunto y técnicas de conteo El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística.. pues mientras la primera tiene una mayor concentración en el centro.

. p(A1∪A2∪.. entonces la p(A∪B) = p(A) + p(B) Generalizando: Si se tienen n eventos mutuamente excluyentes o exclusivos A1.... Axiomas y Teoremas Para el cálculo de probabilidades hay que tomar en cuenta los Axiomas Teoremas que a continuación se enumeran. En algunas referencias se usa la letra griega mayúscula omega...A continuación se presentan alguna técnicas que serán útiles.. Principio multiplicativo Principio aditivo Permutaciones Permutaciones con repetición Pruebas ordenadas Combinaciones Particiones ordenadas Diagrama de árbol Problemas propuestos 1.... entonces la probabilidad de que ocurra φ debe ser cero. para representar el espacio muestral.5.. p δ) = 1 3) i A y B son eventos mutuamente excluyentes.. Notación. entonces. 1.6. 0 ≤ p(A) ≥ 1 2) a probabilidad de que ocurra el espacio muestral δ debe de ser 1..+ p(An) TEOREMAS TEOREMA 1. 1) a probabilidad de que ocurra un evento A cualquiera se encuentra entre cero y uno....∪An) = p(A1) + p(A2) + .An.... Si φ es un evento nulo o vacío. A2. Ω. A cada elemento del espacio muestral se conoce como punto muestral (elemento o miembro del espacio muestral). A3. Espacio muestral y eventos EL ESPACIO MUESTRAL ES UN CONJUNTO FORMADO POR TODOS LOS POSIBLES RESULTADOS DE UN EXPERIMENTO ALEATORIO. El espacio muestral de un experimento se denota por medio de la letra S.

B=A∪(B \ A) y p(B)=p(A) +p(B \ A). luego p(A)=p(A \ B) + p(A∩B). por tanto. DEMOSTRACIÓN: Si A∪B = (A \ B) ∪ B. luego entonces si p(B \ A)≥0 entonces se cumple que p(A)≤p(B). LQQD TEOREMA 5. por tanto. (A \ B) y A∩B.LQQD TEOREMA 3. p(Ac)= 1 . Si un evento A ⊂ B. entonces la p(A) ≤ p(B). entonces. entonces p(Aφ∪)=p(A) +p(φ)=p(A). A y B \ A (B menos A). La p( A \ B )= p(A) – p(A∩B) DEMOSTRACIÓN: Si A y B son dos eventos cualquiera. por tanto. por lo que p(A ∪ B) = p(A \ B) + p(B) y del teorema anterior tomamos que p(A \ B) = p(A) – p(A∩B). LQQD TEOREMA 4. La probabilidad del complemento de A.p(φ)=0 DEMOSTRACIÓN: Si sumamos a φun evento A cualquiera. DEMOSTRACIÓN: Si separamos el evento B en dos eventos mutuamente excluyentes. Para dos eventos A y B. p(Ac)= 1 – p(A) DEMOSTRACIÓN: Si el espacio muestral δ. entonces el evento A se puede separar en dos eventos mutuamente excluyentes. p(A \ B) = p(A) – p(A∩B). A y Ac luego δ=A∪Ac.p(A) . Ac debe ser. como φ y A son dos eventos mutuamente excluyentes. por tanto p(δ)=p(A) + p(Ac) y como en el axioma dos se afirma que p(δ)=1. se divide en dos eventos mutuamente exclusivos. donde (A \ B) y B son eventos mutuamente excluyentes. LQQD TEOREMA 2. LQQD . p(A∪B) = p(A) + p(B) – p(A∩B). p(A∪B)=p(A) + p(B) – p(A∩B). por tanto. A=(A \ B)∪(A∩B).

Las probabilidades asociadas a cada uno de los elementos del espacio muestral deben ser mayores o iguales a cero. 2. Σpi = 1 En caso de que no se cumpla con las características antes mencionadas. que contiene n elementos {a1.. Espacio infinito equiprobable Sea δ un espacio muestral que contiene n elementos. a2.. si a cada uno de los elementos de δ le asignamos una probabilidad igual de ocurrencia. el que debe cumplir con las siguientes características: 1) Las probabilidades asociadas a cada uno de los elementos de δ deben ser mayores o iguales a cero. si deseamos determinar la probabilidad de que ocurra un evento A cualquiera. Sea δ el espacio muestral....an}. pi ≥ 0.1. entonces. entonces estamos transformando este espacio muestral en un espacio finito equiprobable. entonces estamos transformando este espacio muestral en un espacio finito de probabilidad. δ = {a1.an}. Solo en el caso de espacios finitos equiprobables. pi = 1/n por tener n elementos δ. . 2) La sumatoria de las probabilidades asociadas a cada uno de los elementos de δ debe de ser igual a 1.. a3. p(A) = r*1/n = r/n p(A) = maneras de ocurrir el evento A/ Número de elementos del espacio muestral r = maneras de que ocurra el evento A 1/n = probabilidad asociada a cada uno de los elementos del espacio muestral n = número de elementos del espacio muestral ESPACIOS FINITOS DE PROBABILIDAD. el que debe cumplir con las siguientes condiciones: 1.. pi≥0.7. a3. entonces no se trata de un espacio finito de probabilidad.. entonces no se trata de un espacio finito equiprobable. Σ pi = 1 En caso de que no se cumpla con las condiciones anteriores.. a2. La sumatoria de las probabilidades asociadas a cada elemento del espacio muestral debe de ser igual a 1... si a cada uno de los elementos de δ le asignamos una probabilidad pi ≥ 0.

. Sucesos independientes INDEPENDENCIA Dos sucesos son independientes si y sólo si p(A Si dos sucesos son independientes B) = p(A) p(B). entonces deseamos determinar una probabilidad de tipo condicional. la que se determina como se muestra.1. donde p(E)>0. dado que E ya ocurrió. Probabilidad condicional e independencia Sea δ un espacio muestral en donde se ha definido un evento E. si deseamos determinar la probabilidad de que ocurra un evento A (el que también es definido en el mismo espacio muestral). P( A ∩ E ) = Ι A ∩ EΙ Ιδ Ι P( E ) = ΙEΙ Ι δΙ Por tanto: P( A | E ) = Ι A ∩ EΙ Ι EΙ Donde: A∩E= número de elementos comunes a los eventos A y E E= número de elementos del evento E Luego entonces podemos usar cualquiera de las dos fórmulas para calcular la probabilidad condicional de A dado que E ya ocurrió. p( A | E ) = p( A ∩ E ) p( E ) Donde: p(AE) = probabilidad de que ocurra A dado que E ya ocurrió p(A∩E) = probabilidad de que ocurra A y E a un mismo tiempo p(E) = probabilidad de que ocurra E Luego.8.

n. El problema que resuelve el teorema de Bayes o teorema sobre la probabilidad de causas es obtener las probabilidades a posteriori. Esta propiedad coincide más con la idea intuitiva de independencia y algunos textos la dan como definición. .. evidentemente: ..An} un conjunto de sucesos incompatibles cuya unión es el conjunto total y tales que la probabilidad de cada uno de ellos es distinta de cero... enunciado por Thomas Bayes. donde B es un suceso cualquiera que se sabe realizado. en la teoría de la probabilidad. Teorema de bayes Ya que nos hemos referido a él en diferentes apartados de nuestro libro..así como las probabilidades condicionadas P(B/Ai). A2.Ai..A2... esto es.. veamos que el famoso teorema de Bayes.1.. sin embargo. 1..y del mismo modo p(B|A) = p(B). Se tiene. i = 1. Sea {A1. P(B|Ai) es la probabilidad de B en la hipótesis Ai. ∪ A2 ∪A1 j≠ si i ∅ Aj = ∩Ai Se suponen conocidas las probabilidades P(Ai) -que se acostumbran a denominar “probabilidades a priori”. Hay que notar. P(Ai|B) son las probabilidades a posteriori. Sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B|Ai). llamadas “verosimilitudes”.. que ambas definiciones no son estrictamente equivalentes.∀Esto se cumple Una explicación más detallada del concepto sería la siguiente.. Sean los sucesos elementales y mutuamente excluyentes: A1. . la probabilidad P(Ai|B) viene dada por la expresión: donde: P(Ai) son las probabilidades a priori. An tales que constituyen un sistema completo de sucesos cuya unión es el espacio muestral E.. Entonces.. tales que: An = E∪ . es el resultado que da la distribución de probabilidad condicional de una variable aleatoria A dada B en términos de la distribución de probabilidad condicional de la variable B dada A y la distribución de probabilidad marginal de sólo A.. esto es. las P(Ai/B).

del 3%. será: Del mismo modo. Sin embargo. – 24h..). + P(B∩A1) + P(B∩P(B) = P(B = P(A1) • P(B/A1) + P(A2) • P(B/A2) + + P(An) • P(B/An) Resultando. Una vez realizadas las pruebas pertinentes se observa que un sistema psicológico (individuo) afectado de dislalia posee un promedio diario de expresión verbal del 50% por la mañana (8h.. – 20h. la expresión general: Sea. En esencia. ¿Cuál es la probabilidad de producir una palabra defectuosa según cada fase del día? Solución: P(D/M) = 0’03→P(M) = 0’50 P(D/T) = 0’04→P(T) = 0’30 P(D/N) = 0’05→P(N) = 0’20 Así pues. 30% por la tarde (14h. Los porcentajes de palabras defectuosamente pronunciadas son. como ejemplo de aplicación. por otra parte: An)∩ (B∪ ∪A2) ∩ (B∪A1) ∩ An) = (B∪ . lógicamente. en definitiva. se cumplirá que: An) =∩A2) + . por la tarde. se tendrá: que también podría haberse obtenido. por la aplicación individualizada de la fórmula correspondiente.) y 20% por la noche (20h. – 14h. El teorema puede servir entonces para indicar cómo debemos modificar nuestras probabilidades subjetivas cuando recibimos información adicional de un experimento. los seguidores de la estadística tradicional sólo admiten probabilidades basadas en experimentos repetibles y que tengan una confirmación empírica mientras que los llamados “estadísticos bayesianos” permiten probabilidades subjetivas.).B) = P(Ai) • P(B/Ai) = P(B) • P(Ai/B)∩P(Ai de donde: Pero. Digamos. por la noche. 4% y 5%. La . ∪ A2 ∪(A1 ∩E = B∩B = B y debido a la incompatibilidad. el siguiente ejercicio. la probabilidad de emitir una palabra defectuosa por la mañana. en definitiva. respectivamente. hay una controversia sobre el tipo de probabilidades que emplea. se tendrá: Por último.. que el teorema de Bayes resulta válido en todas las aplicaciones de la teoría de la probabilidad..

. Serie Schaum. CECSA. L. Spiegel. Segunda Edición. D. (1990). y McClave. J. Primera Edición. S. Como observación. y Runger G. Weimer. Sheaffer. R. (2000). Grupo Editorial Iberoamérica. .L. Walpole. Probabilidad y Estadística para Ingeniería y Ciencias.. Sexta Edición.estadística bayesiana está demostrando su utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y permite revisar esas estimaciones en función de la evidencia. Primera Edición. lo que está abriendo nuevas formas de hacer conocimiento.R. (1996). J.C. E.T. R. (1996). W. Mc Graw Hill. (1998).C. (1998). Prentice Hall. Primera Edición. R. Segunda Edición. R. Probabilidad y Estadística para Ingeniería. (1970).C. Grupo Editorial Iberoamérica. Montgomery. Mendenhall.H. M. Thomson Learning. Probabilidad y Estadística Aplicadas a la Ingeniería. Myers. y Myers. Probabilidad y Estadística para Ingenieros. Mc Graw Hill. Estadística. Estadística. se tiene que: y su demostración resulta trivial. Estadística para Administradores.L. Quinta Edición. Bibliografía Devore.

XY} Definimos los sucesos A = {varón} = {xY. Aparezcan dos águilas. B = {enfermo} = {xY} A ∩ B = {xY} por lo tanto p(A) = 0. Determine la probabilidad de que gane A o B.0 ¿Cuál es el promedio de notas de los alumnos de la clase? 4. a. b.5 4. Determine la probabilidad de que gane B.. determine la probabilidad de que: a. Aparezcan puros sellos. .-Para un hijo de una mujer portadora de Duchenne.En una competencia de ciclismo participan A. p(B) = 0.Se lanza al aire una moneda normal (una moneda perfectamente equilibrada) tres veces.25 ≠ p(A) p(B) 2. 1.0 3.0 4. Las notas de los alumnos son: 3.2 3. c. XY}.4 3.El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10 alumnos de la clase.8 4. Aparezcan por lo menos dos águilas. B y C. p(A ∩ B) = 0. el sexo y la enfermedad ¿son independientes? Según vimos en el el espacio muestral es Ω = {xX.25..2 3. xY.ACTIVIDADES COMPLEMENTARIAS.5. b. A tiene el doble de posibilidades de ganar que B y B el doble que C..5 2. 3.1 3. XX.

Sign up to vote on this title
UsefulNot useful