You are on page 1of 70

Módulo 1

:
1 ESTADISTICA: DEFINICIÓN

Definición: “Es el conjunto de métodos y técnicas que permiten determinar, de una
muestra debidamente representativa de una población, los valores estadísticos, a fin
de poder inferir sobre los parámetros poblacionales con un cierto grado de bondad"

Esta definición comprende tanto a la estadística descriptiva como a la estadística
inferencial. Mark Berenson y David Levine1, definen Estadística descriptiva como “ El
conjunto de métodos que incluyen la recolección, presentación y caracterización de
un conjunto de datos con el fin de describir apropiadamente sus características”.
Mientras que a la estadística inferencial la definen como “ Conjunto de métodos que
hacen posible la estimación de una característica de la población o la toma de una
decisión referente a una población basándose solo en los resultados de una muestra”.
La comprensión de estas definiciones se ve facilitada si se aclaran convenientemente
algunos términos de las mismas.

1.1 POBLACIÓN:

¿Qué se entiende por población?

Definición: “El conjunto de datos cuantificable pertenecientes al sistema en estudio
constituye la población."

Esto implica que si el sistema en estudio es la producción agrícola ganadera de la
Provincia de Córdoba, entonces el mismo estará constituido por todos los
establecimientos agropecuarios de la Provincia. Si en cambio se pretende estudiar la
edad promedio de los estudiantes de la Universidad Empresarial Siglo 21, la población
estará conformada por todos los estudiantes de esa Institución. Si se presenta en un
Estudio Publicitario, la necesidad de plantear una campaña para promover la venta
de un nuevo perfume en la ciudad de Córdoba, la población a estudiar estará
constituida por todas las mujeres de dicha ciudad en condiciones de seleccionar y
elegir un perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates
producidos en las quintas de los alrededores de la ciudad, entonces todas las quintas
con producción de tomates próxima a la ciudad de Córdoba se constituirán en la
población.
Pudiere ser de importancia para un nuevo gobierno provincial prever el
comportamiento de los contribuyentes a las obligaciones impositivas, en caso de
reducir el monto de los impuestos, en este caso la población estará constituida por
todos los contribuyentes
A fin de poder tomar las medidas más adecuadas será necesario contar con la mayor
información posible, si los datos informativos con los que contamos provienen del
estudio de toda la población, no sería necesario realizar ninguna inferencia, decimos
que se ha efectuado un censo de la población. Pero en ese caso dicha mayor

1
Estadística Básica en Administración pág.2

Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -1-
Profesor: MARIO MARÍN

exactitud va acompañada por un mayor costo y tiempo que evidentemente encarece el
proceso. Es decir, los resultados que puede entregarnos un censo tienen el carácter
de ser exactos, pero los costos que determinan los mismos pueden no justificar
dicha exactitud cuándo, con muestras debidamente seleccionadas se determinan
esos valores con un cierto grado de error que se puede regular y que más adelante
veremos.
Por otra parte en algunas situaciones particulares el censo se presenta impracticable o
puede no ser conveniente. Piense el lector que si el estudio se refiriere al
comportamiento de las abejas en un colmenar, la población tendría el carácter de
infinita y por lo tanto sería imposible censarla.
Supongamos que se desata una epidemia en la población y debemos analizar la
respuesta a un cierto medicamento. Pretender estudiar la respuesta de toda la
población a la nueva droga llevaría un tiempo enorme tal que al cumplirse tal vez no
tendría sentido la aplicación del medicamento.
Una Empresa automotriz recibe de una Autopartista una partida de 500 pernos de
pistón, Recepción debe decidir su aceptación. Dentro de los ensayos a realizar sobre
las piezas, además de dimensiones y dureza se debe efectuar un ensayo de tracción
para el cual sería necesario destruir la pieza, en este caso sería entonces imposible
ensayar todas ellas. Por otro lado, si el verificar las dimensiones constituyere otro
ensayo a realizar, genera en la cantidad de pernos verificados un efecto particular
sobre el operario que lo realiza, lo cual lo lleva a cometer errores, en algunos casos
superiores a los que se cometerían efectuando un muestreo. Tendríamos también
que tener en cuenta el costo de mano de obra que representa la verificación de esos
elementos.
Esto que hemos expresado nos lleva a la necesidad de poder tomar decisiones en
base a las inferencias que sobre una población podemos hacer de resultas del análisis
y estudio de una muestra de la misma.

1.2 MUESTRA:

De acuerdo a lo visto en el ítem anterior, estudiar el comportamiento de una población
a través de un censo, se torna en la mayoría de los casos impracticable, es por esa
razón que el análisis se efectúa por medio de una muestra que esté constituida por
una parte de todos los valores poblacionales.

Definición: “Una muestra estará constituida por un subconjunto de la población ."

Cada uno de los elementos que forman parte de la muestra se denominan
observación.

MUESTRA DEBIDAMENTE REPRESENTATIVA

Si bien es cierto que una muestra está constituida por elementos pertenecientes a la
población, tendremos que comprender que no todo subconjunto de la población se
constituye en una muestra debidamente representativa. Vale tal vez recordar que en
1936 en vísperas a las elecciones presidenciales de EE.UU., la encuestadora
LITERARY DIGEST pronosticó el triunfo del candidato Republicano con un apreciable

Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -2-
Profesor: MARIO MARÍN

margen por sobre su opositor Roosevelt. El pronóstico se basaba sobre los resultados
de una encuesta hecha sobre una muestra de dos millones de habitantes. No
obstante el triunfo fue del candidato demócrata y el error en la inferencia se debía a
que los encuestados fueron seleccionados entre los poseedores de automóviles y
abonados telefónicos. En esos momentos los que estaban mejor posicionados para
poseer automóvil y líneas telefónicas correspondían a la clase media y alta, en su
mayoría con tendencias republicanas, pero el triunfó quedó en manos de Roosevelt
apoyados por la masa poblacional de menores recursos.

Definición: Una muestra se dice que es debidamente representativa de una población
cuando presenta sus mismas características.

Presentar las mismas características que la población implica que, si el 20% de la
población cumple con una determinada propiedad, se espera que el 20% de la
muestra cumpla con esa misma propiedad.
Esto permite disminuir los errores que se cometen cuando se efectúa la inferencia de
los parámetros poblacionales a partir de los valores determinados en la muestra.

1.3. VALORES ESTADÍSTICOS

El estudio realizado sobre una muestra nos permite determinar valores cuyas
características nos referiremos más adelante y a los cuales se los denomina
estimadores pudiendo también tomar el nombre de valores estadísticos, mediante
los cuales se podrá efectuar una correcta estimación sobre los valores de la
población.
Por otra parte, los valores propios de la población toman el nombre de Parámetros.
Si se pretendiere determinar el salario de los empleados metalúrgicos del País,
tomaríamos una muestra constituida por operarios de distintas empresas y distintas
provincias y siempre proporcional al número de operarios de cada lugar, el salario
promedio obtenido en la muestra se denomina estadístico, mientras que el salario
promedio de toda la población obrera metalúrgica se constituye en parámetro

1.4. PARÁMETROS

Definición: Los valores en estudio, que en la muestra toman el nombre de
Estadísticos, en la población se los denominan Parámetros.

Definición: Se define como bondad al margen de seguridad con que se realiza la
inferencia de acuerdo a los estudios realizados sobre la o las muestras.

Aseverar que tal político ganará las próximas elecciones presidenciales no tiene peso
como información si no se lo acompaña con un grado de seguridad. Indicar que las
encuestas los dan ganador por tal cantidad de puntos, solo es tomado en cuenta
cuando se acompaña esa información con una determinada seguridad.

Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -3-
Profesor: MARIO MARÍN

la definición de la misma dependerá del criterio experiencia y capacidad de quien realice la valorización de cada obra. En la localidad de Embalse de Río Tercero. De Córdoba en el corriente año. se los llama observaciones. puede ser la producción avícola en la provincia. se tienen piletas en donde se efectúa la cría de pejerreyes y por lo tanto le será de suma importancia definir. Es decir será necesario efectuar una clasificación de los tipos de datos: Discretos Cuantitativos Continuos Tipos de Datos Nominales Cualitativos Jerarquizados Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -4- Profesor: MARIO MARÍN . las temperaturas máximas diarias durante el mes de marzo en una determinada localidad. las que deben responder a una determinada característica que es la que tenemos en estudio. Para una planta generadora de energía eléctrica. cada una de estas toma el nombre de Variable. Observará el lector que el tipo de dato de cada una de las incógnitas en estudio puede tener características diferentes.2. no hay la menor duda en que. En el estudio de la producción de automóviles. para cada período del proceso el tamaño promedio de los peces. En el caso de pretender determinar el grado de calidad de los maestros plásticos de Córdoba. el número de alumnos ingresados en cada una de las Universidades de la provincia. le es necesario determinar los picos de consumo de energía durante el día y el consumo durante las diferentes épocas del año. Mediante la aplicación de métodos y técnicas estadísticas se estudian estas observaciones y se determinan los estadísticos. ya que la exactitud de la misma dependerá del instrumento con que se realice el proceso. a fin de poder compararlo con las unidades producidas durante el mismo período del año anterior y poder prever la producción para los futuras períodos. la concurrencia a un Centro Comercial. Si dichos datos son obtenidos a través de una muestra. 2. y que de ésta se tendrán Datos y los que corresponden a Observaciones realizadas. no es así en el caso de querer determinar la longitud de los peces que se crían en Embalse. para lo cual será necesario valorizar las obras de cada uno de ellos. Puede ser deseable para la Secretaría de Cultura de la Municipalidad de la ciudad de Córdoba. la cantidad de unidades producidas es un número entero definido. Variable. Al Ministerio de Agricultura y Ganadería. la inversión de dinero en publicidad en los distintos medios durante el año 1998. Datos Debemos tener en cuenta que la Estadística basa su aplicación en el estudio y análisis de números los que se denominan Datos. o a la cantidad de precipitaciones en el sur de la provincia. definir el grado de calidad que poseen los Artistas Plásticos. le será imprescindible definir la cantidad de hectáreas sembradas de maíz en todo el País y en condiciones de ser levantadas en la próxima cosecha. En definitiva cada vez que nos aboquemos a un estudio estadístico debemos de tener en cuenta que dicho estudio corresponde a una Variable.1 TIPO DE VARIABLE En una fábrica de automotores puede considerarse necesario determinar el número de automóviles de cada modelo producidos durante el último trimestre.

decimos que es del tipo continuo Nominales: Cuando los valores que adopta la variable en estudio puede ser clasificada de acuerdo a categorías. Supongamos tener que estudiar el grado de calidad de las obras expuestas por un cierto número de plásticos de Córdoba a fin de asignar los correspondientes premios. tal vez de ser otro el que efectúe el análisis pudiere modificar dicho orden. Sabemos que en este caso se tendrían las categorías de: Soltero casado viudo divorciado O el caso de realizar un estudio en un club social. en donde nos encontraremos con que sus asociados se encuentran categorizados por edad según: Infantiles cadetes mayores En estos casos en donde los datos se pueden agrupar por categorías es necesario introducir. etc. Jerarquizados: Este tipo de dato se presenta cuando es necesario otorgarle a la variable una cierta jerarquía de orden. una cierta codificación. Es decir en definitiva. Como conclusión entonces no podrá en este tipo de variable asegurar la exactitud del cálculo 2. De cualquier manera no se podrán hacer estudios matemáticos entre categorías.2. Las alturas de los alumnos de un curso La longitud de peces en un lago El volumen de precipitaciones anuales etc. esto implica que en el proceso de jerarquizar las obras de cada uno influirá el criterio de quién realiza el estudio. a fin de poder realizar su estudio. tal como lo sería el responder a una encuesta efectuada al personal de una Empresa automotriz y en la cual se plantea la situación de cada uno en cuanto a su estado civil.Discretos: Se dice que un valor es discreto cuando es el resultado de un conteo. Tómense éstos como modelos de datos discretos Continuos: Se dice que una variable es del tipo continuo cuando asume valores dentro de un intervalo de números reales. A tal efecto será necesario acudir al juicio de un perito que permita definir el grado de categoría de cada uno de los participantes. VALORES ESTADÍSTICOS Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -5- Profesor: MARIO MARÍN . cuando el valor del dato u observación se mide en un intervalo. Número de televisores por hogar Cantidad de alumnos aprobados o reprobados en una evaluación Número de habitantes por médicos en una localidad.

Todos los valores que se determinan en la muestra se denominan estadísticos. . . expresábamos la necesidad de poder inferir sobre las características de la población. . . . x = temperatura n = número de observaciones = 11 La Serie simple se puede expresar como: x1 x2 x3 x4 . . mientras que los valores propios de la población se denominan parámetros. . se ha solicitado el registro de las temperaturas mínimas de los últimos once días del mes de julio del año anterior.xn Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -6- Profesor: MARIO MARÍN . . . . obteniendo como respuesta los siguientes datos: -2 0 1 -1 -3 -1 -2 -2 1 0 -2 La primera operación a realizar para el estudio de esa muestra es la de ordenar las observaciones de menor a mayor. -3 -2 -2 -2 -2 -1 -1 0 0 1 1 En este caso. . . la variable en estudio está dada por las temperaturas y cada una de las observaciones corresponderá a un nuevo valor adoptado por la incógnita. El conjunto de observaciones ordenadas de menor a mayor se denomina Serie Simple. . Además los valores estadísticos se pueden clasificar de acuerdo a sus características de la siguiente manera: Media Mediana De tendencia central o posición Moda Valores estadísticos Rango De dispersión Desvío medio Varianza Desviación estándar Coeficiente de variación SERIE SIMPLE A los efectos de preparar un Congreso Internacional en una zona del Sur del País.Al definir los objetivos de la Estadística. . . . . . a través del análisis y estudio de la muestra. . . . . . . . .

MEDIA Se define como media aritmética o promedio de una distribución al cociente entre la suma de todas las observaciones dividido el número total de ellas: Es conveniente aclarar que la media poblacional se define como: x1 + x2 + x3 + . . denominada Distribución de la Variable en estudio 2-3. . + xN µ = -------------------------------- N N tamaño de la población Cuya denotación general es N ∑ xi 1 µ= N Mientras que en la muestra el estadístico x corresponde a la media de la muestra. n Se denota como: n ∑x 1 i x= n El siguiente diagrama representa la analogía entre la media poblacional para una población y la media muestral para una muestra: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -7- Profesor: MARIO MARÍN . . . . + xn x = -------------------------------. x1 + x2 + . . n es el número de observaciones. dónde: x1= -3 y xn = 1 Con todos los valores que adopta la variable en estudio se genera una distribución. . . .

4. en cuenta el siguiente ejemplo: En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de $1000 mensuales. y con un Gerente general cuyo sueldo es de $10.000 µ = ---------------------------------------------.= ------------- 10 10 µ = $ 1900 Esto estaría indicando que el sueldo promedio de los empleados de la empresa es de $1900. tenga Ud. mientras que los valores que se ubican a la derecha serán mayores o eventualmente iguales a él. el sueldo promedio para esa distribución será: 1000 + 1000 + 1000 +. . Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -8- Profesor: MARIO MARÍN . pero debemos tener presente que a su vez es el más sensible a los valores extremos de la distribución Los valores extremos de la distribución pueden influir en el valor de la media y de esa manera hacerle perder su condición de referente. al valor que ocupa el punto medio de la distribución Ocupar el punto medio de la distribución implica que la mediana deja a la izquierda la misma cantidad de valores que a la derecha.= -1 11 Dentro de los valores estadísticos de posición central la media es el de mayor representatividad. Recordar MEDIA Cantidad de elementos Población µ N Muestra x n 2. + 10000 19. Población µ Muestra Tamaño: N x Tamaño: n En nuestro caso: -3+ (-2)+ (-2)+ (-2)+ (-2)+ (-1)+ (- 1)+0+0+1+1 x = -----------------------------------------------------. .000. Todos los valores que se encuentran a la izquierda son menores o eventualmente iguales a él. cifra esta que de ninguna manera representa la realidad. . MEDIANA Se define como Mediana de una distribución.

Suponiendo que se le quitara el último valor a la distribución de temperaturas que estamos analizando. -3 -2 -2 -2 -2 -1 -1 0 0 1 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x5 + x 6 Se tendría en este caso que Me = ------------- 2 Podemos generalizar el valor de la mediana para una distribución de n valores teniendo en cuenta que el número de observaciones sea par o impar: Si n es impar Me = x i donde i = (n+1)/2 Mediana x(n/2) + x(n/2 +1) Si n es par Me = ------------------ 2 Para determinar el valor de la mediana de una serie simple o distribución de frecuencia es necesario tener en cuenta el número de observaciones. Cuando el número de componentes de la distribución es impar. el número de observaciones n = 10 y los dos valores centrales serían x5 y x6.Continuando con el ejemplo referido a las temperaturas en una localidad del Sur: -3 -2 -2 -2 -2 -1 -1 0 0 1 1 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 Me = x6 = -1 Teniendo presente que el número de observaciones n = 11 el valor que ocupa el lugar central de la distribución corresponderá a x 6 y por lo tanto la mediana toma el valor de -1. pero para el caso de que n sea par. esto implica que puede pertenecer a la distribución solo en el caso de que los valores centrales sean iguales: a) 4 6 6 8 Me = 6 b) 2 10 18 20 Me = 14 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -9- Profesor: MARIO MARÍN . el valor de la mediana está dado por el promedio de los dos valores centrales. la mediana pertenece a la distribución y está dada por el valor que ocupa el punto central de la misma. la mediana está perfectamente definida. si n es impar. no se tiene un único valor central. en este caso la mediana estará dada por el promedio de los dos valores centrales. En el caso de que n sea impar.

al número de veces que el mismo se repite. no ocurre lo mismo con la mediana la cual se presenta como insensible a los valores extremos y por lo tanto describe con mayor exactitud las distribuciones en donde los valores extremos son sensibles . En nuestro caso -2 se repite en cuatro oportunidades y por lo tanto éste valor se constituye en moda de la distribución.5. etc.10 - Profesor: MARIO MARÍN . Ejemplo: En la distribución correspondiente a las temperaturas mínimos tomadas en una localidad del Sur del País durante los últimos 10 días.5 4.5 Me = 7. 2.5 9.2 7. No obstante todo esto las propiedades que presenta la media y que veremos más adelante la hace más atractiva para su utilización. Así mismo si se presentare el caso en que todos los valores de la distribución tienen el mismo número de repeticiones.2 8.Son ejemplo de este tipo de distribuciones: a) los ingresos personales b) Las retribuciones generales en una empresa c) Gastos domésticos d) Ingresos netos por hogar. cada uno de ellos se constituirá en una nueva moda.8 7.3 5. En caso de tener dos modas se la denomina bimodal y en caso de tres trimodal. defina para cada valor su frecuencia: -2 -2 -4 -1 -1 -1 0 -3 -2 -1 para -4 su f = 1 -3 su f = 1 -2 su f = 3 -1 su f = 4 0 su f = 1 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . es decir que una distribución puede tener más de una moda.8 6.3 9.c) 4. MODA Se define como Moda de una distribución al valor que más veces se repite. etc. según ya vimos.7 6. FRECUENCIA Dada una distribución se define como Frecuencia de un valor. Mo = -2 Con respecto a este valor es necesario aclarar que si en una distribución se tiene más de un valor con el mismo máximo de repeticiones.3 Observe el lector que a diferencia de la media o promedio la cual se ve influenciada por los valores extremos.7 d) 2 3 3 6 9 Me = 3 e) 3. diremos que dicha distribución no tiene moda.6 Me = 6.6 10 12.

11 - Profesor: MARIO MARÍN . en este caso de acuerdo a su valor numérico y para cada uno de ellos determinamos su frecuencia. pero si clasificamos los valores. por lo tanto pretender operar con una serie simple se tornaría engorroso. de allí que es común encontrar a este tipo de distribución como Distribución de intervalos. a los efectos de facilitar el aprendizaje del alumno subdividiremos este tipo de distribución en dos grupos: 1) cuando la amplitud de intervalo es igual a 1 2) cuando la amplitud del intervalo de clase toma un valor mayor a 1 Caso a analizar Supongamos tener que estudiar el número de accidentes que se producen en una playa de estacionamiento durante los últimos 50 días. DISTRIBUCIÓN DE FRECUENCIA En la mayoría de los casos nos encontraremos con una cantidad de observaciones n que superan los 20. ∑f = 10 Tenga en cuenta que la suma de todas las frecuencias es igual al número total de observaciones.6. Los datos relevados son los siguientes 5 6 4 4 4 3 2 7 5 4 4 1 0 4 2 1 3 2 2 0 1 4 4 7 4 3 2 1 4 2 5 4 3 5 6 7 4 4 5 2 3 6 4 3 1 3 4 4 5 6 Es observable que trabajar con todos los valores como lo presenta la serie simple sería por demás engorroso si no se dispusiera de una computadora. en estos casos será conveniente seleccionar los valores de acuerdo a una determinada clase y determinar de cada una de ellas su frecuencia. podríamos confeccionar una tabla de las siguientes características: Tabla 1. 2.1 Clase xi fi 1 0 2 2 1 5 3 2 7 4 3 8 5 4 16 6 5 5 7 6 4 8 7 3 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .

FRECUENCIA RELATIVA Definición: Se define como frecuencia relativa de un valor y se expresa como fri.2 Clase xi fi xi * fi 1 0 2 0 2 1 5 5 3 2 7 14 4 3 8 24 5 4 16 64 6 5 5 25 7 6 4 24 8 7 3 21 50 177 De esta manera podemos calcular la media como: n ∑ ( xi. efectuaremos el producto de cada valor por su frecuencia y la suma de estos productos lo dividiremos por el número total de observaciones. generemos en la tabla una nueva columna conteniendo los productos de xi * fi. 8 ∑ ( Xi . 54 2. fi fri = ∑f = i Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .54 n El valor de la media o promedio de la distribución es de x = 3.7. Tabla 1. fi ) 1 8 x = ∑ fi 1 Nota: Debemos tener presente que estamos frente a una muestra A los efectos de facilitar los cálculos. ∑f i =i 50 Si ahora analizamos la tabla de esta manera. al cociente entre su frecuencia y la suma de todas las frecuencias (la suma de todas las frecuencias es igual al número de elementos de la distribución). se simplifica enormemente la determinación de la media ya que en lugar de efectuar la suma de todas las observaciones.12 - Profesor: MARIO MARÍN . fi ) i =1 x= = 177 / 50 = 3.

. .+ --.08 8 7 3 21 0. . fi/∑fi) es decir ∑fi 2 Demostración ∑ fri = fr1 + fr2 + fr3 . + fr n Tener en cuenta: El concepto de frecuencia relativa.+ + --.1 7 6 4 24 0. . + fr n f1 f2 f3 fn ∑fi = --.06 50 177 1 Propiedad: La sumas de todas las frecuencias relativas correspondientes a los valores clases de una distribución es igual a 12: ∑ fri = fr1 + fr2 + fr3 . ∑fi = n por lo tanto también se puede expresar ∑fi fr i = --------- n Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la fr de cada clase: Tabla 1-3 Clase xi fi xi * fi fri 1 0 2 0 0. .+ ---. . .04 2 1 5 5 0. la media de una distribución poblacional también se puede expresar como: ∑ (xi.13 - Profesor: MARIO MARÍN .32 6 5 5 25 0. .14 4 3 8 24 0. . . . .16 5 4 16 64 0. fi) µ = -------------. .= 1 ∑fi ∑fi ∑fi ∑fi ∑fi Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .= ∑ (xi. .= ------.1 3 2 7 14 0.

8 FRECUENCIA ACUMULADA Se define como frecuencia acumulada de una clase (por ejemplo i) y se la denota como fai. el x 25. por lo que la mediana será el promedio de los dos valores centrales. podrá visualizar con mayor claridad esta propiedad. el número de observaciones es par.(correspondía al número de accidentes que se produjeron durante los últimos 50 días en una playa de estacionamiento). Si se quiere saber cuántos días se registraron menos de 2 accidentes.1 7 3 2 7 14 0. este análisis indica también que.08 47 8 7 3 21 0. desde la x 23 . Analizando nuestro caso.16 22 5 4 16 64 0. el x n/2 y el x (n/2 + 1).4 Clase xi fi xi * fi fri fai 1 0 2 0 0. cuyo valor es el 4. en este caso le corresponde a la quinta clase. de los 50 días. nos ubicamos en la columna correspondiente a frecuencia acumuladas y determinamos a cuál de las clases le corresponde la menor frecuencia acumulada que contiene a n/2. . b) Más adelante cuando efectuemos su graficación Ud. es decir 7. del total de días analizados. lo que implica que de los 50 días analizados solo en 7 de ellos se tuvieron menos de dos accidentes diarios.14 - Profesor: MARIO MARÍN .1 43 7 6 4 24 0. Para determinar el valor que ocupa la posición n/2 (en este caso 50/2 =25. µ = ∑ (xi. quiere decir que. Analicemos la tabla 1. teniendo en cuenta la definición de frecuencia acumulada tendremos: Tabla 1.04 2 2 1 5 5 0. pero con valores menores o iguales a 2 se tuvieron 14. por lo tanto la Me = 4 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . c) También nos permite determinar rápidamente el valor de la mediana. en 14 de ellos se tuvieron 2 o menos de 2 accidentes diarios. hasta la x38 le corresponden 4.32 38 6 5 5 25 0. se tendrá la frecuencia acumulada del 1.14 14 4 3 8 24 0. a la suma de su frecuencia y la suma de las frecuencias de los valores que le anteceden.3 de la página anterior. 7 de ellos tuvieron exactamente 2 accidentes diarios. fri) 2.06 50 50 177 1 Cuáles son las bondades que nos brinda la frecuencia acumulada: a) Nos indica con su lectura el número de valores pertenecientes a la distribución que se ubican a la izquierda de cada uno de ellos.

aplicando su definición Tabla 1. También podríamos valernos de este parámetro para la determinación de la mediana. siguiéndole en Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .04 2 48 2 1 5 5 0.06 50 0 50 177 1 De la definición se desprende que: fai + fdsi = n Bien podemos decir que la frecuencia desacumulada es el complemento a n de la acumulada. Es decir que para un valor cualquiera se verifica que: fdsi = n . dejamos para que Ud.16 22 28 5 4 16 64 0. luego tiene sentido decir que la más vendidas son las bebidas de limón. Colas 55 Naranja 63 Limón 72 Tónicas 44 Agua c/gas 15 Agua s/gas 18 Jugos 33 En este caso no tiene sentido determinar el valor de la media de la distribución.32 38 12 6 5 5 25 0.14 14 36 4 3 8 24 0. téngase en cuenta que las clases están dadas por los distintos tipos de bebidas. es decir que para cada uno de los valores nos indica cuantos tenemos a la derecha de él. fds de una distribución.9 FRECUENCIA DESACUMULADA Se define como frecuencia desacumulada de un valor.5 a la cual se le creo una nueva columna conteniendo la frecuencia desacumulada. La frecuencia desacumulada del valor de x=2.08 47 3 8 7 3 21 0. nos indica que la distribución posee 36 observaciones mayores que ese valor.1 7 43 3 2 7 14 0.15 - Profesor: MARIO MARÍN .fai Analicemos la Tabla 1.2.5 Clase xi fi xi * fi fri fai fds 1 0 2 0 0.1 43 7 7 6 4 24 0. efectúe el análisis correspondiente a esa situación Analizaremos más adelante el diagrama representativo de ambas frecuencias correspondientes a una distribución DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NOMINALES Consideremos las ventas de los distintos tipos de sabor de gaseosas realizadas en el Bar de una Universidad durante un día de concurrencia normal del alumnado. a la diferencia entre el número total de observaciones y su frecuencia acumulada.

05 1 19 4 2 0.11 11 Tónicas 44 0.25 12 8 7 4 0.67 Colas 55 0.1 3 17 5 4 0. de Bastones etc.05 19 1 10 1 0.importancia las de naranja. Ejercicio Supongamos tener para analizar las notas obtenidas por 20 alumnos de una división en la asignatura de Estadística: 9 7 6 6 6 5 3 4 5 5 8 7 8 7 7 6 5 6 4 10 Generaremos una distribución de frecuencias complementándola con: Frecuencias relativas.21 21 Limón 72 0.33 Naranjas 63 0.1. Sería suficiente abrir una hoja de cálculo para observar la cantidad variada de gráficos con que puede ser representada una distribución: Diagramas de: Líneas. Barras y x-y Dispersión. Barras.06 6 Jugos 33 0. es decir el valor de tendencia central que utilizaremos en casos como estos le corresponde a la Moda. la primera pregunta que surge es. Sí sería conveniente generar una tabla de frecuencias y determinar los porcentajes de cada uno de los sabores.1 18 2 9 1 0.2 7 13 6 5 0. Tabla 1. de Bastones e Histogramas y a una combinación de los gráficos de Bastones. Tabla 1.2 16 4 8 2 0. Barras acumuladas. “que se debe graficar” debe de tenerse siempre en cuenta que cada vez que se Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .05 5 Agua s/gas 18 0. Diagramas x-y. En este texto haremos referencia a los diagramas: Circular.05 20 0 20 1 Toda vez que se presenta una tabla tal como la 3.7 Xi fi fr i fa fds 3 1 0.1833 18.6 xi fi fri fi% Agua c/gas 15 0.24 24 ∑ fi = 300 ∑ fi% = 100 3-0 DIAGRAMAS El poder graficar los valores estadísticos nos permite realizar una lectura rápida de la distribución y sacar conclusiones inmediatas de la misma.1467 14. de Sectores o circular.16 - Profesor: MARIO MARÍN . Frecuencia acumulada y por último Frecuencia desacumulada.

1 / 20 = 18º Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . En la presente situación. tendremos nuestro primer diagrama. por lo cual se podría graficar la relación: Calificación y frecuencia Calificación y frecuencia relativa Calificación y frecuencia acumulada Calificación y frecuencia desacumulada 3.1 Diagrama de Bastones 6 5 Frecuencia 4 3 2 1 0 3 4 5 6 7 8 9 10 Calificaciones 3.17 - Profesor: MARIO MARÍN .360º a 1 (frecuencia del 3) ----------------------. la variable en estudio es la calificación. Cada uno de los bastones corresponde a la frecuencia de cada calificación y toma el nombre de densidad de frecuencia entendiéndose como tal al cociente: fi dfi = ---.habla de graficar estamos deseando volcar en forma gráfica una cierta relación.2 DIAGRAMA DE SECTORES Para este gráfico debemos tener presente que el ángulo central del círculo es de 360º y que cada una de las clases estará dada por un sector cuyo ángulo será proporcional a su frecuencia: Supongamos la calificación de 3 cuya frecuencia es 1 tendremos que: 20 (suma de todas las frecuencias) -----------------------. es decir frecuencia por unidad de intervalo de clase Δx Gráfico 1.1 Diagrama de bastones: Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las frecuencias y representamos mediante un segmento centrado en cada una de las calificaciones su correspondiente frecuencia.α1 = 360º.

Analicemos la calificación del 4 cuya frecuencia es 2:

Si a 20 (frecuencia total) ---------------------------- 360º
A 2 (frecuencia del 4) ---------------------------- α2 = 360º. 2 /20 = 36º

Repitamos el procedimiento para el 5 el cual tiene frecuencia 4
Si a 20 le corresponde ----------------------------360º
A 4 ---------------------------- α4 = 360º. 4/20 = 72º

Debe tenerse en cuenta que en todos los casos la operación que nos permite
determinar el ángulo de cada sector está dado por el producto entre 360º y el cociente
de la frecuencia de la calificación en estudio y la suma de todas las frecuencias (N),
cociente éste que según ya vimos corresponde a la frecuencia relativa (fri = f / N), es
decir que el ángulo correspondiente a un determinado sector está dado por el producto
entre 360º y su frecuencia relativa:

αi = 360º. fri

Gráfico 1.2

Diagrama de Sectores
10 3
9
4
8

5

7

6

En realidad es más interesante plantear este mismo diagrama pero expresado en
porcentajes, para lo cual el análisis es muy similar al anterior. Al total de
observaciones, 20 en este caso, le corresponderá el 100% y por lo tanto para
cualquiera de las observaciones con frecuencia fi le corresponde será:
Si a 20 --------------------------- 100%
fi --------------------------- %i = 100. fi / 20
Nuevamente nos encontramos con que el porcentaje correspondiente a cada una de
las calificaciones estará dado por el producto entre 100 y la frecuencia relativa
correspondiente a cada una de ellas. El gráfico tiene la misma estructura anterior.

Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) - 18 -
Profesor: MARIO MARÍN

Gráfico 1.3

Diagrama de Sectores Calificaciones
en porcentajes
10 3
9 5% 5% 4
5%
10%
8
10%

5
20%
7
20%

6
25%

3.2-HISTOGRAMA DE FRECUENCIAS:

Éste es otro de los diagramas de gran utilización para el cual es necesario considerar
un sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las
abscisas las calificaciones y en el de las ordenadas la frecuencia, las clases están
dadas por las calificaciones. El intervalo entre dos clases sucesivas se denomina
“amplitud de intervalo”, en este caso es la unidad y se la expresa como Δx = 1. Si
consideramos el diagrama de bastones y a partir del extremo inferior de cada uno de
ellos llevamos tanto a izquierda como a derecha la mitad del intervalo, en nuestro
caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos encontramos con
un diagrama de barras sin discontinuidades al que denominaremos Histograma, en
este caso de Histograma de Frecuencias.

Gráfico 1.4

Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) - 19 -
Profesor: MARIO MARÍN

Histograma de Frecuencias

6
5
Frecuencia
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11
Calificaciones

La superficie encerrada por cada una de las barras está dada por el producto entre la
base Δx por la altura que según ya vimos estaba dada por la densidad de frecuencia.

dfi = fi /Δx por lo tanto:

Si = Δx. dfi = Δx. fi / Δx = fi

Cada una de ellas tendrá un valor igual a su frecuencia y el área total del diagrama
será entonces la suma de todas las frecuencias e igual a N.

∑Si = ∑ fi = N

3.4 - POLÍGONO DE FRECUENCIAS

Si se unen los puntos medios superiores de cada una de las barras del histograma y
se considera cero las frecuencias de las clases adyacentes a los extremos de la
distribución, se formará con el eje de las abscisas un polígono denominado, en este
caso, como Polígono de Frecuencias:

Gráfico 1.5. Polígono de frecuencias

Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) - 20 -
Profesor: MARIO MARÍN

lo son también las superficies del polígono y del histograma de frecuencias. Observamos que mientras que la superficie del triángulo superior de la barra que pertenece al histograma no pertenece al polígono.21 - Profesor: MARIO MARÍN . Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . En este caso la altura de cada barra esta dada por la densidad de frecuencia relativa dfri = fri / Δx Y por lo tanto al igual que en el diagrama anterior. 3. es decir que se divide a los valores de la ordenada por un valor constante N y por lo tanto gráficamente representa un cambio de escalas. fri / Δx = fri De tal manera que el área encerrada por el Histograma de frecuencias relativas será ahora igual a la suma de todas las frecuencias relativas y por tal razón igual a 1: ∑ Si = ∑ fri = 1 Gráfico 1. se obtiene el Histograma de Frecuencias Relativas que tendrá las mismas características que el diagrama de frecuencias ya que fr i = fi / N.HISTOGRAMA DE FRECUENCIAS RELATIVAS Si en el eje de ordenadas se representan a las frecuencia relativas en lugar de las frecuencias. 6 5 4 3 fi 2 1 0 2 3 4 5 6 7 8 9 10 11 xi El área encerrada por el polígono de frecuencias es igual al área encerrada por el histograma de frecuencias. como las superficies de ambos triángulos son iguales3. Consideremos la barra del histograma correspondiente al valor de la variable x = 6. la superficie del triángulo inferior no perteneciente al histograma si pertenece ahora al polígono. β y β’ alternos internos entre paralelas y el lado 11’ = 22’= Δx / 2 por lo tanto son iguales.6 3 Dos triángulos rectángulos en A y A’ con los ángulos α y α’ iguales por opuestos por el vértice.5 . la superficie encerrada por cada una de las barras del Histograma será igual a su frecuencia relativa: Si = Δx.

1 0.2 fr 0.25 0.3 0. Tanto la superficie encerrada por el polígono de frecuencias relativas como el del Histograma de esas mismas frecuencias son iguales a 1.15 0. se define también al polígono de frecuencias relativas.7 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .22 - Profesor: MARIO MARÍN .05 0 2 3 4 5 6 7 8 9 10 11 x 3. Gráfico 1.6 – POLÍGONO DE FRECUENCIAS RELATIVAS De la misma manera en que definimos al polígono de frecuencias. Histograma de Frecuencia Relativas 0.

1 0. la frecuencia acumulada vale 1. Histograma y Polígono de Frecuencias Relativas 0.3 0.8 xi fi fai 0 1 1 1 2 3 2 3 6 3 4 10 4 4 14 5 3 17 6 2 19 7 1 20 ∑fi = 20 Para confeccionar el gráfico de frecuencias acumuladas llevaremos sobre el eje de las abscisas los valores observados y en el eje de las ordenadas las frecuencias acumuladas. se mantiene constante hasta el valor observado de 2 en donde la fa adopta el valor de Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .2 0. Para el primer valor de la distribución cero.15 0. 5 4 6 3 4 5 3 7 3 4 2 0 2 1 3 4 2 5 6 1 Confeccionaremos una tabla de frecuencias: Tabla 1.05 0 2 3 4 5 6 7 8 9 10 11 3.23 - Profesor: MARIO MARÍN .25 0. para lo cual se han considerado los detectados durante los últimos veinte días.7 FRECUENCIA ACUMULADA Supongamos analizar el número de accidentes de trabajo que se producen diariamente en una empresa metalúrgica local. este valor se mantendrá constante hasta 1 en donde la frecuencia acumulada toma el valor de 3.

8 denominado comúnmente como gráfico de escalones. Siga esto en el gráfico 1.8. el punto inferior de la barra indica que menores a 4 accidentes diarios se han producido en 10 oportunidades mientras que el punto superior indica que en 14 oportunidades se han producido 4 o menos accidentes diarios. Gráfico 1. fa + fds = n Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . De igual manera en 17 oportunidades se produjeron menos de 6 accidentes en un día y que en solo 2 oportunidades se produjeron 6 accidentes.24 - Profesor: MARIO MARÍN . Debe tenerse en cuenta que para cualquier valor observado la suma de la frecuencia acumulada y la desacumulada es igual al número total de observaciones.8 FRECUENCIA ACUMULADA Frecuencia acumulada 22 20 18 16 14 12 10 8 6 4 2 0 0 1 2 3 4 5 6 7 8 9 OBSERVACIONES Observe el lector con que claridad este diagrama le entrega información. De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la acumulada tal como lo muestra el Gráfico 1.6 y así sucesivamente hasta el valor de 7 en donde fa toma el valor de 20 y se mantiene constante con este valor. Por ejemplo analizando la observación 4.

9 22 20 18 16 Frecuencia 14 Frecuencia acumulada 12 10 Frecuencia 8 desacumulada 6 4 2 0 0 1 2 3 4 5 6 7 8 9 Observaciones La intersección de ambas gráficas debe de verificarse para fa = fds = n/2. Si este concepto lo extendemos a toda la distribución podemos asegurar que considerando un determinado intervalo de las observaciones el área encerrada por el histograma en dicho intervalo será igual a su frecuencia relativa. Simplificando. valor que según ya vimos multiplicada por 100 nos entrega el porcentaje de observaciones comprendidas en ese intervalo. B y C en la asignatura de Estadística: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .25 - Profesor: MARIO MARÍN . Además demostramos que la superficie encerrada por el histograma de frecuencias relativas era igual a la superficie del polígono de fr.. el área encerrada por el polígono de frecuencias relativa es igual a 1 y esto implica también que encierra el 100% de las observaciones. Analicemos las distribuciones correspondientes a las calificaciones obtenidas por tres divisiones que denominaremos como A. En el punto de intersección ambas frecuencias son iguales por lo que podemos decir que: fa + fds = fa + fa = n por lo que 2 fa = n y fa = n / 2 RELACIÓN ENTRE MEDIA.. MEDIANA Y MODA Cuando nos referimos al histograma de frecuencias relativas decíamos que el área encerrada por cada una de las barras nos entregaba el valor de la frecuencia relativa del valor correspondiente a dicha barra. Gráfico 1.

Tabla 1.∑ (xi. nos encontraremos con los siguientes gráficos: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .296 Me = x14 = 8 Mo = 8 Si graficamos los histogramas y polígonos de las frecuencias relativas de cada una de las distribuciones relativas suavizando convenientemente los lados del polígono.fi) / N = 6 Me = x16 = 6 Mo = 6 C) µ = ∑ (xi.fi) / N = 3.26 - Profesor: MARIO MARÍN .∑ (xi.1667 Me = (x15 + x16) / 2 = 3 Mo = 2 B) µ =.fi) / N = 7.9 A B C xi fi fi fi 1 6 0 0 2 8 1 0 3 5 2 1 4 4 4 1 5 3 5 2 6 2 6 4 7 1 5 5 8 1 4 7 9 0 2 5 10 0 1 2 30 30 27 Las tres distribuciones tienen características distintas. veamos: A) µ =.

11 (División B) Histograma y polígono de frecuencias relativas 0.10 (División A) Histograma y polígono de frecuencias relativas 0.1 0.2 0.15 0.12 (División C) Histograma y polígono de frecuencias relativas 0.25 0.3 0.15 relativa 0.1 0.05 0 1 2 3 4 5 6 7 8 9 10 11 Observaciones Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .05 0 1 2 3 4 5 6 7 8 9 10 11 Observaciones Grafico 1.15 0.05 0 1 2 3 4 5 6 7 8 9 10 Observaciones Grafico 1. Gráfico 1.2 Frecuencia 0.3 0.27 - Profesor: MARIO MARÍN .25 0.1 0.2 0.25 0.

9 3.6 El jefe de pelotón necesita realizar un estudio estadístico sobre estos tiempos a los efectos de determinar: a. 4. se hace necesario definir como clases a intervalos y determinar como frecuencia de cada uno de ellos al número de observaciones que contienen.9 4 4 4.Qué proporción de hombres tardan menos de 3. a los que llamaremos como k está relacionada con el número de observaciones n. Nuevamente la moda queda definida por correspóndele a la abscisa de mayor ordenada. La mediana se ubica en general entre la media y la moda aunque en este caso por tratar con variable discreta.7 3. Al analizar la última distribución C observamos que la misma es asimétrica.8 3. donde el número de observaciones es mayor a 20 y la variable en estudio es del tipo continua.1 4.28 - Profesor: MARIO MARÍN . En toda distribución sesgada ya sea a la derecha o a la izquierda.3 4. la media se ubica a la izquierda de la moda.2 4. Estos valores expresados en minutos son los siguientes: 3. A su vez.En el caso de la división B se observa una cierta simetría respecto a un eje vertical coincidente con la mediana la moda y la media. Me y Mo. En este caso la distribución toma el nombre de distribución de intervalos de clase.2 4. decimos entonces que la distribución es del tipo Normal. Mientras que algunos operadores definen: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .2 DISTRIBUCIÓN DE INTERVALOS DE CLASE En una unidad militar de entrenamiento para futuros oficiales.4 3. Una distribución puede ser: Simétrica µ = Me = Mo Distribución Derecha µ < Me < = Mo Asimétrica Izquierda µ > Me > = Mo 3. la mediana Me si bien en este caso coincidiría con el valor de la moda.6 3. y que en ese caso coinciden los tres valores µ.6 3.8 3. no olvidemos que la distribución pivotea en ese punto. el segmento comprendido por la media y la mediana es aproximadamente un tercio del segmento comprendida entre la media y la moda. tiene sesgo izquierdo y se le asigna signo negativo.5’ en cruzar la pista de combate b.Qué proporción de los hombres del pelotón tardan menos de 4’ en cruzar la pista En casos como el presentado. se han determinado los tiempos que tardan los integrantes de un pelotón en cruzar la pista de combate. Para generar una distribución de intervalos de clase debe tener en cuenta: a) La cantidad de intervalos: La determinación del número de intervalos.3 4. de acuerdo a su gráfica y a sus valores se observa que la media tiene un valor mayor a la mediana y que a su vez ésta se ubica entre la media y la moda. En el A la distribución se presenta en forma asimétrica y en este caso decimos que corresponde a una asimétrica derecha asignándosele un signo positivo.6 3.1 3. la Me coincide con la Mo.5 4. la observación de mayor ordenada le corresponderá a la moda y la media tendrá que dividir al área total en dos áreas iguales.7 3.

de esta manera nos aseguramos que la primera observación quede contenida en el primer intervalo.6 −3.6 [`---------------)[--------------)[-----------------)[-----------------)[--------------------] Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . Por otro lado una cantidad mayor a 15 intervalos genera una distribución que resulta engorroso operar. los intervalos de diferente amplitud deben ubicarse en los extremos f) No es conveniente que las observaciones coincidan con los límites de los intervalos.29 4. será necesario modificar la cantidad de intervalos o la amplitud de intervalo. Para el caso que tenemos en estudio y teniendo en cuenta que n = 21. adoptaremos como inicio de la distribución el valor de 3.69 3. k= n Otros deciden optar por la expresión: k = 1+ log2(n) Pero en general se puede definir el valor de k teniendo en cuenta que: 5 <= k <= 15 Es decir que el número de intervalos debe estar comprendido entre 5 y 15. si esa situación se presentare. d) Al definir los límites de los intervalos debe tenerse en cuenta la posibilidad que uno de ellos puede ser cerrado y el otro abierto: e) Es conveniente que todos los intervalos tengan el mismo tamaño y cuando esto no sea posible. adoptaremos para k el valor de 5. y que el menor es 3.99 4. Una cantidad menor de intervalos da lugar a una distribución con información insuficiente. en ningún caso una observación coincidirá con los límites. b) La amplitud de intervalo Δ x para la cual adoptaremos la expresión: xN −x1 Δx = k Para nuestro caso: 4. k = 5.1 Δx = = 0.3.09.09 3.1. la raíz cuadrada de 21 es de 4. En este caso particular. teniendo en cuenta que todas las observaciones tienen un solo decimal.39 3. de esta manera desaparece la duda en cuanto a la pertenencia de una observación a un intervalo o a su adyacente.29 - Profesor: MARIO MARÍN . y además como la amplitud de intervalo es de 0.58 y considerando la última condición.3 5 c) No puede haber un intervalo con frecuencia cero. 3.

3.9697’ 21 Esto nos indica que el tiempo promedio empleado por los integrantes del pelotón para cruzar la pista de combate es de 3.39 1 3.69 3.225 21 83.84 23.29 4. toma el nombre de marca de clase y se lo denota como x mi. definiremos al punto medio de cada uno de ellos como el valor representativo e igual a la semisuma de sus límites.54 3.29 4. además se representa en el eje horizontal las marcas de clase.09 3.6 5 4.04 3.14 20.99 4. de esta manera la suma de todos ellos estará dada por el producto entre la marca de clase por la frecuencia de ese intervalo.24 3.16 3.10 Li ls fi xmi xmi * fi 3.24 3. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .54 14.99 4.7 4.365 83.14 3.30 - Profesor: MARIO MARÍN .39 3.84 3.445 22.2 DETERMINACIÓN DE LA MEDIA Para determinar la media de la distribución consideramos que todos los valores pertenecientes a cada intervalo están uniformemente distribuidos en dicho intervalo.39 3.69 4 3.29 5 4. teniendo en cuenta que.365 µ= = 3. a los efectos de referenciar a cada intervalo.9697’ HISTOGRAMA DE FRECUENCIA Para confeccionar el Histograma y Polígono de frecuencias debemos tener presente que las frecuencias de los intervalos adyacentes a los extremos de nuestra distribución son nulas. µ= ∑ (x mi * fi ) N Para su determinación creamos una nueva columna conteniendo los productos de xmi*fi: Tabla 1.6 [`---------------)[--------------)[-----------------)[-----------------)[-------------------] 3.69 3.09 3.Podemos ahora confeccionar la tabla de distribución de intervalos de clase.99 6 3.24 3.44 3.

Tabla 1.09 0 2. es por lo tanto conveniente determinar las columnas que contengan a las frecuencias acumuladas y desacumuladas. la mediana se ubica en el intervalo [3.13 7 6 5 4 f 3 2 1 0 2.6 5 4. Para la determinación de la mediana en una distribución de intervalos de clase tendremos dos métodos: a) Método gráfico Tracemos los diagramas correspondientes a la frecuencia acumulada: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .69 3.6 4.24 3.14 4.225 21 0 4.74 x 3.54 14. 11 Li ls fi xmi Xmi * fi fai fdsi 2.29 4.94 0 0 21 3.54 3.39 0 4. y para el cuál la frecuencia acumulada es de 11 y por lo tanto contiene a los valores correspondientes a x 10 y x11.14 20.29 5 4.16 5 16 3.445 22.3 DETERMINACIÓN DE LA MEDIANA La mediana tendrá que estar ubicada en el intervalo cuya menor frecuencia acumulada contiene a la observación X (n/2).445 4.24 3.39 1 3.24 1 20 3.94 3.99 6 3.84 4.84 23. Gráfico 1.69 .39 3.99 4.74 0 21 0 De acuerdo a la tabla.31 - Profesor: MARIO MARÍN . 3.99) al que denominaremos intervalo medial.04 11 10 3.09 3.7 16 5 4.69 4 3. pero faltaría determinar el valor que más se aproxime al real.79 3.

es decir que.5 3 3.14 25 20 15 fa 10 5 0 2.54 3. las representaciones de frecuencia acumulada y desacumulada. en el punto intersección ambas son iguales y como su suma Fa + frds = N Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .445 4.32 - Profesor: MARIO MARÍN .fds 10 5 0 2 2. Este gráfico toma el nombre de Ojiva.15 25 20 15 fa .5 5 -5 x Como ambas frecuencias se representan en el eje vertical.84 4.74 x Combinemos en un mismo diagrama. Gráfico 1. Gráfico 1. mediante análisis del diagrama podemos reconstruir la tabla.54’.14 4.24 3.5 4 4.Analizando dicho diagrama podemos observar que de los 21 integrantes del pelotón solo 5 de ellos cruzan la pista en menos de 3.94 3.

De la misma manera al finalizar ese intervalo (x = 3. Además como el total de observaciones es de 21.69 3.Debe verificarse que el valor de esas frecuencias. n/2). Esa variación de frecuencia acumulada de 5 a 11 es justamente la frecuencia correspondiente al intervalo medial (fm = 6). b) Método Analítico Analizaremos el intervalo medial: Gráfico 1.69 su frecuencia acumulada tiene el valor de 5 (que denominaremos frecuencia acumulada inferior y la denotaremos como fai). Como la mediana es el valor que ocupa el punto medio. Por lo tanto las coordenadas del punto intersección serán (Me.69 Me 3.69) su frecuencia acumulada es de 11 (a la denominaremos frecuencia acumulada superior y la denotaremos como fas).= ------------- 2’ – 3’ 1 – 2’ Si reemplazamos tendremos: fm Δx Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .33 - Profesor: MARIO MARÍN . la abscisa correspondiente al punto intersección tendrá su valor. Consideremos los triángulos 123 y 12’3’ ambos rectángulos en 2 y 2’ respectivamente.5. 99 3. N/2 = 10.16 12 12 10 10 8 6 4 2 0 3. Esos triángulos son semejantes y por lo tanto sus lados homólogos son proporcionales.99 Li Δx Ls Al iniciar el intervalo 3. en ese punto es igual a N/2. 2–3 1-2 ---------.

34 - Profesor: MARIO MARÍN . 3. -----.3 *((10.54 3.17 7 6 5 4 f 3 2 1 0 3.84 4. = --------- (N/2 – fai) Me –Li Despejando Me tendremos: Δx (N/2 – fai) Me = Li + ----------------- fm En este caso particular. la Me = 3.------.4. el intervalo modal y los intervalos adyacentes.14 x Li Ls Si definimos a d1 = (frecuencia del intervalo modal) – (frecuencia del intervalo que le antecede): di = 6-4 = 2 Y como d2 = (frecuencia del intervalo modal) – (menos la frecuencia del intervalo que le sucede): d2 = 6-5 = 1 Como li se define al inicio del intervalo modal (3.5) / 6 Me = 3.69).5 .DETERMINACIÓN DE LA MODA Se define como intervalo modal al intervalo de mayor frecuencia. para la determinación de la moda.99) con frecuencia 6. consideremos en el histograma de frecuencia. pero bien podría no coincidir. coincide con el medial.965’ 3.69 + 0.69. en este caso corresponderá a [3. el valor de la moda de una distribución de intervalos de clase esta dada por la expresión: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . Gráfico 1.

VALORES DE DISPERSIÓN ¿Son suficientes los valores de posición central para determinar las características de una distribución? Para responder a esta pregunta observemos la siguiente situación: Tenemos tres distribuciones que presenten la misma media. pero desplazada hacia el intervalo adyacente de mayor frecuencia. ( d1/(d1+d2) ) En este caso tendremos: Mo = 3.965’ Moda Mo = 3. la moda se encuentra siempre ubicada en el intervalo modal. Pueden tenerse dos distribuciones mismo número de elementos o también conformadas por los mismos elementos y no obstante ello ambas son distintas.35 - Profesor: MARIO MARÍN . indican que la distribución tiene un leve sesgo derecho: Media µ = 3.89’ µ > Me > Mo 4. 12 X1 F1 X2 F2 0 0 0 0 1 3 1 6 2 4 2 8 3 7 3 4 4 5 4 3 5 4 5 2 6 2 6 2 7 1 7 1 8 0 8 0 26 26 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . la misma moda y la misma mediana pero no obstante ello las tres son distintas. Tabla 1.9697’ Mediana Me = 3. mediana y moda. Mo = Li + Δx.89’ Conclusiones: En una distribución de intervalos de clase.3 (2 / (2+1)) = 3. Los valores determinados para la media.69 + 0.

36 - Profesor: MARIO MARÍN .20 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 Es necesario entonces considerar valores que nos determinen cuan dispersos están. Estos valores se denominan valores de dispersión: 4.1 RANGO O AMPLITUD Definición La diferencia entre los valores extremos de una distribución se denomina Alcance o Rango y se lo denota como R Si definimos a xn como el mayor valor observado y a x1 como el más pequeño. entonces: R = xn – x1 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .19 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10 Gráfico 1. Gráfico 1.

no obstante ello son distintas.84 3. en este caso son 4 y habiendo considerado que los mismos se encuentran uniformemente distribuidos en dicho intervalo. la distribución de intervalos la representábamos como: 3.Si bien. 4.2 50. es decir que el Rango o Amplitud de una distribución nos entrega una información limitada.54 3.3 50.29 4. no nos brinda ninguna información sobre las características de los valores intermedios. el mismo alcance. el punto de referencia más utilizado es la media de la de la distribución Considerando el ejercicio de página 39 (Los tiempos que los integrantes de un pelotón tardan en cruzar la pista de combate).99 4.6 50. luego su distancia respecto a la media será: d1 = xm1 .7 50. la cual consideramos es coincidente con la marca de clase.µ La dispersión de los valores ubicados en el segundo intervalo.9697 d2 En el primer intervalo se encuentra una sola observación.09 3.6 [`---------------)[--------------)[-----------------)[-----------------)[-------------------] 3.69 3.44 d1 µ = 3.24 3.37 - Profesor: MARIO MARÍN . Veamos las siguientes distribuciones: A) 0 1 1 2 4 6 8 10 12 14 B) 50 50.39 3. el cálculo de la amplitud o recorrido es simple e inmediata.2 DESVÍO MEDIO Para determinar el grado de dispersión de los valores de la distribución. la dispersión respecto a la media estará dada por el producto de la distancia de la marca de clase por el número de observaciones d2 = xm2 . una vez ordenados todos los valores.1 50.µ Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .8 60 64 En la distribución A R = 14 – 0 = 14 En la distribución B R = 64 – 50 = 14 Ambas tienen el mismo número de elementos.14 3.5 50. debemos definir con respecto a qué punto de referencia se toman las distancias.

779 3.39 1 3. Todas las distancias de las marcas de clase que se ubiquen a la izquierda de la media serán negativas.99 4.7 16 5 0.79 0 0 2. para ello podemos: a) considerar los desvíos absolutos medios. fi N Esta expresión se define como Desvío medio (Promedio de los desvíos absolutos medios). salvo el caso en que todas las observaciones sean iguales.445 22.29 4.fi 2.16 5 16 1.730 3.69 4 3.24 3.99 6 3. mientras que las distancias de los que se ubiquen a la derecha serán positivas. Tabla 1.24 1 20 0.6 5 4. al promedio de los desvíos medios: pdm = ∑ (x mi − µ ).000 3.54 14.94 0 0 21 0.719 3.376 4. La expresión matemática quedaría como: DM = ∑x mi − µ .455 Aplicando la fórmula correspondiente.3074’ Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .225 21 0 2.74 0 21 0 0.851 4.38 - Profesor: MARIO MARÍN . de esta manera no se tendría ningún desvío negativo y la suma de los desvíos absolutos medios sería distinta de cero. El problema radica en anular los signos negativos.6 4. el desvío medio será: 6.Podríamos intentar considerar como un valor representativo de la dispersión de los valores respecto a la media.365 6.000 21 83.84 23.455 DM = ------------------ 21 DM = 0.99 0 4.04 11 10 0.39 3.media!.69 3.09 3. 13 Li ls fi xmi Xmi * fi fai fdsi !xi .29 5 4. fi N Pero nos encontramos con que la suma de todos los desvíos es nula y siempre lo serán por considerar como punto de referencia a la media.14 20. En nuestro caso en estudio conformaremos la tabla correspondiente a la distribución de intervalos pero incluiremos una nueva columna conteniendo los desvíos absolutos medias.

99 0 4. nos encontramos con que no tenemos el promedio de los desvíos medios.24 3.04 11 10 0.fi (xi-media) .29 5 4.69 3.94 0 0 21 0.73878118 3.99 6 3.12925624 4.455 2.126 = 0.10102891 3.39 1 3.000 0 3.365 6. si no que contamos con el promedio de los desvíos cuadráticos medios.14 20.126 min utoscuadrados 4. sería elevándolos al cuadrado es decir: pdmc = ∑ (xmi − µ )2 .851 0.54 14.3549’ Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .647 / 21 = 0.4.16 5 16 1.09 3.126 minutos al cuadrado También se la denota como: σ 2 = 0.24 1 20 0. Es conveniente entonces considerar una nueva columna conteniendo la suma de los desvíos cuadráticos medios tal como la tabla: Tabla 1.79 0 0 2.99 4.4 DESVIACIÓN ESTANDAR La Varianza es un valor que determina un cierto grado de dispersión.fi 2.3 VARIANZA Otra forma de obtener todos los desvíos positivos.14490505 4. Una aproximación estaría obteniendo la raíz cuadrada de la varianza: σ = ∑ ( xi −µ ) 2 fi N O abreviando σ = Var ( x) = σ = 0.29 4.84 23.53255244 3.376 1.719 0.7 16 5 0.39 3. 14 2 Li ls fi xmi Xmi * fi fai fdsi !xi -media!.74 0 21 0 0.000 0 21 83.if N Esta expresión que definimos como: el promedio de los desvíos cuadráticos medios y se denomina Varianza.647 Var(x) =2. pero en relación a lo que nosotros buscábamos.445 22.225 21 0 2.6 4.69 4 3.39 - Profesor: MARIO MARÍN .779 0.730 0.6 5 4.

100% µ Como tanto la desviación estándar y la media tienen las mismas unidades.100 = 8.21 Frecuencia Desvío estándar = 2 Desvío estándar =0. expresada de manera porcentual: σ CV = .94% Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso.4 COEFICIENTE DE VARIACIÓN En muchas oportunidades es conveniente comparar distribuciones de distinta media o de distinto tipo. En el caso que nos ocupa el: 0.9697' CV = 8. luego en principio sería incorrecto pretender comparar las dispersiones de esas distribuciones. los valores de posición central y de dispersión de una de ellas estarán dados en metros o centímetros. tendrá más dispersión aquella que tiene una mayor desviación estándar. Para dos distribuciones con la misma media. que está dado por el cociente entre el desviación estándar de la distribución y su media.40 - Profesor: MARIO MARÍN . por ejemplo si analizamos alturas y peso de los alumnos de un curso de una Universidad. pero los de la otra serán en Kg. a fin de poder comparar se opera con el Coeficiente de Variación. tal como lo indica la gráfica Gráfico 1.5 Desvío estándar =1 x 4.3549 CV = .94 3.Definimos a la desviación estándar como la raíz cuadrada de la varianza y prácticamente entrega el grado de dispersión de los valores de una distribución con respecto a la media. . es adimensional. al dividirlas se simplifican y nos queda un coeficiente. Por otra parte el CV entrega la proporción de la desviación estándar respecto de la media. y que los resultados arrojados son: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .

El alcance interfractil. se la denomina a cada una de ella como centil. En este caso cada una de esas partes toman el nombre de decil b) en cuatro partes: En ese caso cada una de ellas toma el nombre de cuartil c) en cambio si la subdivisión es en 100 partes. 14.57% Estos últimos valores del CV indican que. En general los fractiles más utilizados lo constituyen los cuartiles y percentiles. De esta manera una fracción o proporción de datos caen en un fractil o por debajo de éste. De acuerdo al número de subdivisiones los fractiles toman un nombre determinado. dada por la diferencia entre dos fractiles constituye una medida de dispersión entre ellos. la distribución correspondiente a la altura tiene menos dispersión que la correspondiente a los pesos. representados gráficamente implica: X1 Q1 Q2 Q3 Xn Una cuarta parte de las observaciones se encuentran por debajo de Q1. Es necesario aclarar que Q1 como Q2 y Q3 son los puntos fractiles. llamados en de manera general como fractiles. así estas pueden ser: a) en 10 partes. 4. por debajo de cada uno de ellos se encuentran los porcentajes los correspondientes porcentajes de datos. Cuando el número de valores no es lo suficientemente grande la determinación exacta de los cuartiles puede ser complicada. de cualquier manera en general podemos decir que la determinación de cada cuartil quede satisfecha con las expresiones: La determinación de los cuartiles para datos no agrupados está dada por las expresiones: Q1 = X (1 / 4 N +1 / 4) Q2 = X (1 / 2 N +1 / 2) Q3 = X (3 / 4 N +1 / 4) Observe que el valor del segundo cuartil corresponde al valor de la mediana. Subdividir a los datos en cuatro fractiles implica que el 50% de los datos están por debajo del segundo cuartil y el 75% de las observaciones están por debajo del tercer cuartil. ya que es factible que el valor del cuartil quede entre observaciones. como que también ½ están por debajo de Q2. Si recordamos que.5 CUARTILES Y PERCENTILES En muchas ocasiones es necesario contar con una subdivisión de los datos en determinadas fracciones.o.08% Altura σ = 6cm 168 cm 3. Entre Q3 y Q1 se concentra el 50% de las observaciones. Desviación estándar Media CV Del Peso σ = 10Kg 71 k. el área encerrada por el polígono de frecuencias era igual al número Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .41 - Profesor: MARIO MARÍN .

en el caso de hacerlo en 100 cada una de ellos tomará el nombre de percentil. es decir todos aquellos menores a él.22.de observaciones. las superficies encerradas por dicho diagrama serán proporcionales al número de observaciones correspondientes a la misma. Gráfico 1. sería lógico suponer entonces que en un diagrama correspondiente al polígono de frecuencias suavizado. un percentil z cualquiera es un valor tal que z por ciento de las observaciones quedan a su izquierda mientras que (100 .42 - Profesor: MARIO MARÍN . y por lo tanto el 20% de la distribución lo superan. es decir quedan a su derecha.22 Q1 Q2 Q3 Se define como Rango Intercuartil o propagación media a la diferencia: R I = Q3 – Q1 Percentiles: De la misma manera en que la distribución en estudio la podemos dividir en cuatro partes. El percentil 80 está dejando a su izquierda el 80% de los valores de la distribución.23 fdp xi µ 80 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . Gráfico 1. Con este concepto definimos los cuartiles gráficamente según gráfico 1.z) porcientos de los valores quedan a su derecha.

72% N Resumen Regla Empírica (µ ± 1σ) se tiene el 68% de N (µ ± 2σ) se tiene el 95% de N (µ ± 3σ) se concentra el 100% de N Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .7% de N (suele considerarse en muchas oportunidades en este intervalo el 100% de N).2σ µ -1σ µ µ+1σ µ+2σ µ+3σ xi 68% N 95%N 99. el valor de su desviación estándar nos indica el grado de dispersión de sus valores con respecto a la media. quien relaciona a los dos parámetros : µ y σ con el siguiente enunciado: En el intervalo centrado en la media y tal que su origen izquierdo esté dado por la media menos un desviación estándar y el derecho por la media más un desviación estándar. En el intervalo comprendido por la media menos dos desviaciones estándar y más dos desviaciones se ubica el 95% de los valores de la distribución. se encuentran ubicados todos los valores de la distribución N.6 REGLA EMPÍRICA Según vimos en el punto anterior. por último en el intervalo comprendido por la media menos tres desviaciones estándar y la media más tres desvíos estándar se tendrá el 99. Gráfico 1.4.24 fdp µ . entre el inicio de la gráfica y su fin. pero es en realidad la Regla Empírica. se agrupa el 68 % de los valores de la distribución.3σ µ . dada una distribución. Debe de tener en cuenta que.43 - Profesor: MARIO MARÍN .

pero es posible anticipar cuál es el resultado que se espera de dicha acción. Resumiendo. 2. en sus orígenes. Indique Ud. Independientemente de esas aplicaciones particulares. Cada una de las distintas maneras en que puede presentarse el fenómeno se denomina evento. así tendremos E1: que presente un As E2: que presente un dos Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -1- Profesor: MARIO MARÍN . estacionados tienen las llaves puestas. por lo que no debe extrañar que para el estudio de ella. con los juegos de azar. A continuación presentamos un problema en el que se requerirán los temas que desarrollaremos en este módulo: La gerencia de una compañía de Seguros está preocupada por el número de unidades automotrices que son robadas en la vía pública en una determinada ciudad.1 PROBABILIDADES Cuando un fenómeno puede presentarse de distintas maneras. refiriéndonos al número que presenta su cara superior. la factibilidad de ocurrencia de cada una de ellas se la define como probabilidad. efectúa la consulta correspondiente a la sección de robos y hurtos de la policía quién le reporta la siguiente información: La cuarta parte de los propietarios de automotores de esa comunidad deja las llaves puestas en los automóviles al estacionarlos.MÓDULO 2: PROBABILIDADES Siempre que se encare un problema estadístico debe tenerse en cuenta el grado de posibilidad de que ciertos sucesos hayan ocurrido o vayan a ocurrir. En muchas oportunidades puede ser virtualmente imposible predecir cuál será el resultado de una determinada acción. Además y de acuerdo a estadísticas el 5% de los automóviles que. cada una de ellas recibe el nombre de evento y la designaremos con la letra E. A partir de ello. el estudio de probabilidades indica que existe incertidumbre con respecto a la ocurrencia o no de un determinado evento. el estudio de este Módulo nos lleva a cuantificar cuan probable es la ocurrencia de un determinado evento. en los posibles resultados de una jugada de ruleta. etc. resultados posibles en lanzamientos de dados o monedas. Por ejemplo. Las matemáticas de las probabilidades se relacionan. Cuando lanzamos un dado éste puede presentarse de seis maneras distintas. se utilicen como ejemplos. la probabilidad de que un automóvil que ha sido robado en esa ciudad haya tenido las llaves puestas. son robados de la vía pública mientras que solo el 1% de los automóviles que no tienen las llaves puestas son robados. a un político le interesará conocer el grado de seguridad de las encuestas que determinan un porcentaje dado de votantes para las próximas elecciones o a un inversionista le interesará saber qué grado de riesgo corre su capital en la compra de determinadas acciones.

tres de los posibles eventos en el lanzamiento del dado. el cuatro o el seis y lo representaremos con la letra A. por el contrario una probabilidad igual a 1 significa la certeza. también serían eventos compuestos: B: que se presente con un número mayor o igual a 4 C: que sea par y mayor o igual a 4 D: que sea un número par o mayor o igual a 4 Claro que también podríamos expresar al evento C como aquel para el cuál debe cumplirse conjuntamente A y B Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -2- Profesor: MARIO MARÍN .2 EVENTOS: DEFINICIÓN Y CLASIFICACIÓN Pero regresemos al lanzamiento de un dado perfectamente balanceado. así mismo en el lanzamiento de un dado. es imposible. La probabilidad de que al lanzar una moneda se obtenga una cara o una cruz P (cara o cruz) = 1. la probabilidad de obtener un siete P(x=7) = 0. de esta manera.E3: que presente un tres E4: que presente un cuatro E5: que presente un cinco o E6: que se presente con un seis La probabilidad de un evento es un número real comprendido entre 0 y 1 0  P (E)  1 Y puede representarse como un número decimal o como fracción. lo que se daría en el caso de presentarse el dos. vemos entonces que es necesario clasificar los eventos: Simples Eventos Compuestos Un evento se dice que es compuesto cuando está conformado por más de un evento simple. podríamos considerar también como evento. la condición de obtener un número impar se satisface con la aparición del 1. para diferenciarlo de los anteriores. la aparición de un número par en la cara superior del dado. 2. un dado no puede tener siete caras. A: que salga un número par O podríamos considerar también la aparición de un impar claro que en este caso. Una probabilidad de valor cero indica la imposibilidad de ocurrencia. del 3 o del 5.

1 PLANTEAMIENTO CLÁSICO Cuando un fenómeno puede presentarse de n formas distintas. y de esas n formas en c de ellas lo hace con una determinada característica. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -3- Profesor: MARIO MARÍN .3. Con este concepto la probabilidad de que al lanzar un dado presente la cara con un número par será de: 3 P(A) = 6 3 son los casos favorables (2. estas son: a) Planteamiento clásico b) Planteamiento basado en la frecuencia relativa c) Planteamiento subjetivo Cada una de ellas es aplicada según las circunstancias y es el Estadístico quien decide su aplicabilidad. Analizaremos cada una de ellas 2. entonces. la probabilidad de que al presentarse el fenómeno lo haga con la característica en estudio está dado por el cociente de c sobre n c P n Si a c se lo denomina como número de casos favorables y a n como número de casos posibles podríamos expresar la probabilidad clásica como: Núm ero de casos favorables P núm ero de casos posibles Es necesario tener en cuenta que para que esta expresión sea correcta todas las formas en que puede presentarse el fenómeno deben ser igualmente posibles. 4 y 6) y el número de casos posibles es 6. 2. todas ellas igualmente posibles.2 DETERMINACIÓN DE PROBABILIDADES Se tiene tres planteos básicos para definir una probabilidad. C = (A y B) De la misma manera: D = (A o B) es decir D se cumple cuando al menos uno de los dos A o B se cumple.

3.. Analicemos el lanzamiento de una moneda y descartemos la posibilidad de que. debía cumplirse simultáneamente los eventos A y B P (C) = P (A y B) En este caso los eventos favorables son E4 y E6. en un lanzamiento la misma caiga de canto (en ese hipotético caso se dejaría rodar a la moneda hasta su caída). cumplen con la condición de ser pares y mayores o iguales a 4 por lo tanto aplicando el concepto de probabilidad clásica empírica tendremos: 2 La probabilidad P(C) = 6 2. tendremos un punto tal como lo entrega el diagrama Gráfico 2.* 10 N Si seguimos lanzando la moneda y cada 10 nuevos lanzamientos obtenemos la frecuencia relativa de obtención de caras para el total de lanzamientos y lo vamos graficando obtendremos el siguiente diagrama: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -4- Profesor: MARIO MARÍN .2 PLANTEAMIENTO EN BASE A LA FRECUENCIA RELATIVA.5 0..4. que se obtenga una cara o una cruz.4 . es decir.1 fr 0.Recordemos el evento C = debía cumplir con la condición de ser (par) y mayor o igual que 4. Dos son los eventos simples en que puede presentarse el fenómeno. 10 Si este valor lo representamos gráficamente en un sistema de ejes coordenados ortogonales donde. en el eje de las abscisas llevamos el número de lanzamientos y en las ordenadas las frecuencias relativas.5 2 Por otra parte si en 10 lanzamientos se obtuvieron cuatro caras y seis cruces entonces la frecuencia relativa de obtención de caras es: 4 fr(cara) = = 0. Luego la probabilidad de obtener una cara de acuerdo al planteamiento clásico será: 1 P(cara) =  0.

valor de la probabilidad entregada por la expresión clásica. depende del número de veces en que fuera evaluado el proceso y por tal motivo. de seguros. determinada la frecuencia relativa.000 mueren durante el período de un año. Es decir que en este caso se define como probabilidad a la frecuencia relativa observada de un evento durante un gran número de intentos. aproximadamente 65 de cada 100. La definición expresa que para que la probabilidad de ocurrencia de un proceso coincida con su frecuencia relativa de ocurrencia. ésta debe estar calculada sobre la presentación de un número suficientemente grande del fenómeno.5 * * * * * * * * * 10 20 30 40 50 60 70 80 90 100 110 N El diagrama indica que a medida que aumenta el número de lanzamientos la frecuencia relativa de la obtención de cara se aproxima a 0.5. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -5- Profesor: MARIO MARÍN .000 Es necesario tener presente que el grado de bondad de la probabilidad calculada mediante este método. De acuerdo al método de frecuencia relativa. muera en el término de un año es de 65 P=  0. Veamos las características de éste método mediante el siguiente ejemplo: De acuerdo a las estadísticas llevadas a cabo por una Cía.2 fr * * * * * * 0. esto nos permite enunciar la Ley de los Grandes Números que dice: Cuando un fenómeno se pone en evidencia de distintas maneras. ésta informa que de las personas del sexo masculinas de 50 años. Gráfico 2. la frecuencia relativa de ocurrencia de cada una de ellas tiende a coincidir con su probabilidad de ocurrencia cuando el número de veces que se presenta el fenómeno es lo suficientemente grande.00065 100. la probabilidad de que una persona asegurada del sexo masculino con una edad de 50 años.

con iguales apariencias y niveles de relación. El que Ud. En este caso el hecho de no existir una frecuencia relativa del fenómeno no lo libera de la toma de decisión. Es importante tener presente que. para ello nos valdremos del Diagrama de Venn. Este tipo de probabilidad se da cuando los eventos se presentan un número reducido de veces. personas distintas frente a la misma situación pueden asignar probabilidades subjetivas distintas. Supóngase cumplir las funciones gerente de Recursos Humanos en una Empresa y debe elegir un candidato de entre cuatro que presentan vitae similares. En muchas ocasiones es conveniente operar probabilidades en forma gráfica.3 PROBABILIDAD SUBJETIVA La probabilidad subjetiva queda librada al criterio de quién la determina en función de la evidencia con que se cuente para la misma.2. 2. Para la confección de este diagrama representamos mediante puntos cada uno de los eventos simples en que puede presentarse el fenómeno.3 REPRESENTACIÓN GRÁFICA Retomemos el fenómeno correspondiente al lanzamiento de un dado. esta puede ser en base a la frecuencia relativa de ocurrencia en eventos pasados o simplemente de acuerdo a sus supuestos.3 S E1 E5 E2 E3 E4 E6 Cada uno de los puntos considerados corresponde a cada uno de los posibles eventos en que puede presentarse el lanzamiento del dado.3. elija a uno de ellos es haberle asignado una determinada probabilidad a la potencialidad futura de ese hombre y considera ser superior a la asignada a los otros. Es necesario además asignarle a cada uno de los puntos muestrales un valor de probabilidad pero teniendo en cuenta que el valor de probabilidad asignado debe cumplir con la condición de ser mayor o igual a cero pero menor o igual a 1: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -6- Profesor: MARIO MARÍN . cada uno de ellos se denomina punto muestral y el espacio conformado por todos los puntos muestrales se denominará espacio muestral y se lo denota como (S) Para el caso que nos ocupa tendremos: Grafico 2.

B se cumple si se verifica E4 o E5 o E6. E4 y E6. por lo tanto la probabilidad que le asignaremos a cada punto muestral será de P (Ei) = 1/6 La probabilidad de que al lanzar el dado se obtenga un número par A: obtener un par Este evento compuesto se cumple en el caso de obtener un dos.4 S E1 E5 E2 A E3 E6 E4 A se cumple si se cumple E2 o E4 o E6. también en este caso gráficamente (gráfico 5- 3) verificamos que: P (B) = P (E4) + P (E5) + P (E6) Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -7- Profesor: MARIO MARÍN . para este caso Además debe cumplirse que. 0  P(Ei)  1 donde i varía entre 1 y 6. todas las caras tienen la misma probabilidad de ocurrencia. y por lo tanto queda verificado gráficamente P(A) = P (E2) + P (E4) + P (E6) El evento compuesto A es la unión de los eventos simples E2. teniendo en cuenta el valor de la probabilidad de ocurrencia asignada a cada una de ellos. la suma de las probabilidades de todos los puntos muestrales sea igual a 1 i 6  P(E )  1 i i 1 En el caso que nos ocupa. o un cuatro o un seis Gráficamente tendremos: Grafico 2. tendremos P(A) = 1/6 + 1/6 + 1/6 = 3/6 Veamos la probabilidad de obtener un número mayor o igual a 4 (recordemos que B es un número mayor o igual que 4.

Analicemos el evento D: obtener un número par o un número mayor o igual a 4.7. en este caso deben cumplirse ambas condiciones simultáneamente P(C) = P(A y B) Representado en el gráfico 5-4 observamos que la condición de ser par y mayor o igual 4 solo lo cumplen los eventos E4 y E6 Grafico 2. Gráfico 2.6 E1 A E2 E3 E4 E6 E5 B Que corresponde justamente a la intersección de los eventos A y B P(C) = P(A  B) = 2/6.5 E1 E2 E5 E3 E4 E6 B P (B) = 1/6 + 1/6 + 1/6 = 3/6 Analicemos ahora el evento C: que sea par y mayor o igual a 4. Gráfico 2. P (D) = P(A o B) Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -8- Profesor: MARIO MARÍN .

La probabilidad de obtener un número par P(A) esta dada por la unión de los eventos simples E2. Expresión que toma el nombre de Regla Aditiva P(A o B) = P(A) + P (B) – P(A y B) Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) -9- Profesor: MARIO MARÍN .7 E1 AAA A E2 E3 E6 E5 E4 B Gráficamente observamos que esta condición lo cumplen solo los eventos E2.4 REGLA ADITIVA Tenemos ahora una expresión que nos entrega la probabilidad de la unión de eventos. gráficamente los eventos compuestos surgen de la unión o intersección de eventos. a fin de obtener correctamente la probabilidad de D tendríamos que restársela: P(A o B) = P(A) + P (B) – P(A y B) P(A o B) = 3/6 + 3/6 – 2/6 = 4/6 conclusión a la que ya habíamos arribado gráficamente. por lo que. E4. sean estos simples o compuestos. E4 y E6. E5 y E6. mientras que la probabilidad de obtener un par o un número >= 4 está dada por la unión de los eventos compuestos A y B 2. Gráfico 2. por lo tanto la probabilidad del evento compuesto D será: P (D) = P (E2) + P (E4) + P (E5) + P (E6) P (D) = 4 / 6 En este caso no podemos aplicar la suma de las probabilidades de A y B porque tienen una zona en común (recordemos que esa zona en común correspondía a (A y B)) que la estaríamos sumando dos veces. Podemos deducir según lo visto que.

si pasamos el denominador del segundo miembro multiplicando al primero. está dada por el cociente entre la probabilidad de ocurrencia conjunta de A y B sobre la probabilidad de B. 2.10 - Profesor: MARIO MARÍN .6 REGLA MULTIPLICATIVA La expresión anterior no solo nos entrega la probabilidad condicionada de ocurrencia de A según B sino que. por lo tanto si nos ajustamos a la definición clásica de probabilidades: casos favorables 2 P(A / B) = = casos posibles 3 Por otra parte. nos permite obtener la expresión multiplicativa.Sería conveniente determinar cuál es la expresión que nos determina la intersección de eventos. deben satisfacer simultáneamente A y B. mayores o iguales a 4. Pudiendo expresarla como: P( A B) P( A / B)  P(B) La expresión indica que: La probabilidad de ocurrencia de A según B. la condición que deben cumplir los casos favorables es la de ser mayor o igual a 4 y además. deben cumplir con la condición de ser par. e intercambiando los miembros: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . es decir. solo tres casos posibles y de los cuales solo dos de ellos cumplen con la condición de ser par. 2 3 Si recordamos que la P(A B)  y la P (B)  6 6 Reemplazando tendremos 2 P(AB) 2 P(A/ B)  = 6  P (B) 3 3 6 Resultado al que habíamos arribado por razonamiento y aplicación de la definición clásica. Si la cara obtenida contiene un número mayor o igual a 4 tendrá que ser el 4 o el 5 o el 6. para ello analicemos el siguiente caso: ¿Cuál es la probabilidad que habiendo obtenido en el lanzamiento del dado un número > o = a 4 este sea par? A este tipo de probabilidad se denomina condicional y se la expresa como P(A / B) Expresión que se lee como probabilidad de ocurrencia de A según B. mientras que los casos posibles estarán dados por los eventos simples que constituyen a B.

7 RELACIÓN ENTRE EVENTOS De acuerdo a lo estudiado. Regla aditiva: P(A o B) = P(A) + P (B) .11 - Profesor: MARIO MARÍN . el evento compuesto generado por la relación entre los eventos A y B se la puede clasificar como: COMPLEMENTARIOS RELACION ENTRE EVENTOS MUTUAMENTE EXCLUYENTES INDEPENDIENTES Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . esta probabilidad estaba determinada por la regla aditiva. las expresiones determinadas por la regla aditiva y multiplicativa nos permitirán resolver las probabilidades de eventos compuestos. Matemáticamente. es una conjunción e indica la ocurrencia simultanea de ambos eventos y su probabilidad denominada probabilidad conjunta. mientras que a la intersección le corresponde el conectivo lógico y. la unión esta dada por una disyunción o. P(A B)  P (B) * P(A/ B) De la misma manera arribaríamos a la expresión: P (B  A)  P(A) * P (B / A) Debe tener en cuenta el alumno que: P(A B)  P (B  A) Si tenemos en cuenta que gráficamente los eventos compuestos están conformados por la unión (suma) o intersección (producto) de eventos. P (B / A) = P (B). P(A / B) 2. esta probabilidad es satisfecha por la regla multiplicativa. Independientemente del concepto precedente. probabilidad de ocurrencia de por lo menos uno de ellos. hemos visto que dos o más eventos pueden combinarse para dar eventos compuestos y esos tipos de combinación estaban representados gráficamente por una unión de eventos o por una intersección de ellos.P(A y B) Regla multiplicativa: P(A y B) = P(A).

su complemento estará constituido por todos los puntos muestrales de dicho espacio que no pertenezcan a A y se lo denomina como A (todo lo que no es A constituye su complemento) Gráfico 2. Representado gráficamente en un diagrama de Venn. Gráfico 2.2.2 EVENTOS MUTUAMENTE EXCLUYENTES Se dice que dos eventos son mutuamente excluyentes cuando la ocurrencia de uno de ellos implica la no ocurrencia del otro. la obtención de un cuatro es mutuamente excluyente con cualquiera de las otras cinco opciones. En el lanzamiento de un dado.9 S Gráficamente no presentarán ningún punto en común. nos indica que dada el evento A.7.7. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .1 EVENTOS COMPLEMENTARIOS Dos eventos A y B se denominan COMPLEMENTARIOS cuando la suma de sus probabilidades es igual a 1: P(A) + P (B) = 1 Si tenemos presente el espacio muestral en donde cada una de los eventos posee una probabilidad y la suma de todas ellas es igual a 1.12 - Profesor: MARIO MARÍN .8 S A A BA 2.

Ninguno de ellos tiene puntos en común Grafico 2.Podemos decir que todos los eventos simples en que puede presentarse un fenómeno son mutuamente excluyentes.10. si dos eventos son complementarios indefectiblemente son mutuamente excluyentes. la probabilidad de ocurrencia de por lo menos uno de ellos será igual a la suma de sus probabilidades: P(A  B) = P(A) + P (B) Acotación: Como conclusión podemos decir que dados dos eventos A y B.10 S E1 E5 E2 E3 E4 E6 El no poder ocurrir simultáneamente implica que la probabilidad de ocurrencia simultánea de ellos sea igual a cero. este último = A será exhaustivamente excluyentes ya que no es posible obtener otro resultado para el fenómeno que no sea uno de ellos. Resumiendo. si son complementarios ambos eventos A y B. Gráfico 2. y todos ellos son mutuamente excluyentes. cuando los eventos son mutuamente excluyentes.13 - Profesor: MARIO MARÍN . la ocurrencia de uno de ellos implica automáticamente la no ocurrencia de los otros. seis son los eventos simples posibles. Consideremos nuevamente el lanzamiento de un dado perfectamente balanceado. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . P (E1  E2) = 0 Al igual que P (E2  E5) = 0 Y en general dados dos eventos A y B si son mutuamente excluyentes debe cumplirse que P(A  B) = 0 Por lo tanto en este caso.

habiéndose obtenido cara en la primera moneda es igual a la probabilidad de obtener cara en la segunda moneda. la probabilidad de obtener una cara es de ½. La probabilidad que Juan apruebe Estadística es independiente de que Boca gane en el próximo partido. P (B) Lo que se expresa como: Cuando dos eventos son independientes. Si lanzamos otra moneda. Decimos que los eventos son independientes.3 EVENTOS INDEPENDIENTES Supongamos que lanzamos una moneda.2.7. cuando la ocurrencia de uno de ellos no modifica la probabilidad de ocurrencia del otro. la probabilidad de obtener una cara será también de ½. la probabilidad de que la segunda moneda se obtenga cara. ¿Cuál es la probabilidad de que se obtenga una cara en la segunda moneda habiéndose obtenido una cara en la primera? Consideramos que será también de ½. la ocurrencia simultánea de ambos es igual al producto de sus probabilidades. P(A/B) Cuando los eventos son independientes la P(A/B) = P(A) Por la tanto la expresión matemática de la probabilidad conjunta toma la forma de: P(A  B) = P(A). tendríamos que afirmar: P (cara 2º / cara 1º) = P (cara 2º) Que se lee. Y se expresa como: P(A / B)= P(A). Si recordamos la regla multiplicativa: P(A  B) = P (B). no existe relación alguna entre el resultado de la primera y la probabilidad de ocurrencia de la segunda moneda. Definición Dos eventos se dicen que son independientes. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .14 - Profesor: MARIO MARÍN .

Cada nuevo lanzamiento es único e independiente de los resultados que se hubieren obtenido en lanzamientos anteriores. la carta se coloca nuevamente en el mazo y se mezcla.15 - Profesor: MARIO MARÍN . Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . la probabilidad de obtener una cara es de 0. la probabilidad de extraer una espada en segundo término depende de la carta extraída en la primera oportunidad (que sea o no una espada). esto es cierto para cualquier lanzamiento. luego de efectuar la primera extracción. no importa cuántas veces se lance la moneda ni cuales fueron los resultados anteriores. Si se realiza con reposición. Pero si el proceso se realiza sin reposición. Supongamos que extraemos una carta de un mazo de cartas españolas de un total de cuarenta y definimos: C1 = sacar una carta de espadas en una primera extracción y C2 = extraer una carta de espadas en la segunda extracción La probabilidad de extraer una carta de espadas en la primera extracción será de 10 casos favorables P (C1) = 40 casos posibles Pero la probabilidad de extraer una espada en la segunda extracción queda supeditada a la forma en que se realice el proceso. Si lanzamos una moneda que esté perfectamente balanceada. Se define como probabilidad marginal a la probabilidad simple correspondiente a un evento. es decir.5. La probabilidad de extraer una espada en la segunda oportunidad no habiendo obtenido una espada en la primera será de: 10 P (espada en 2º / no espada en 1º) = 39 Mientras que la probabilidad de obtener una espada en la segunda oportunidad habiendo obtenido una espada en la primera será: 9 P (espada en 2º / espada en 1º) = 39 Aclaraciones 1.En muchas oportunidades se le hace difícil al alumno definir cuando existe dependencia o independencia de dos eventos. la probabilidad de extraer una carta de espadas será nuevamente de 10 P (C2) = 40 Los eventos son independientes. con reposición o sin reposición.

8 PROBABILIDADES MARGINALES BAJO DEPENDENCIA ESTADÍSTICA La probabilidad marginal en condiciones de dependencia estadística se determina mediante la suma de las probabilidades de todos los eventos conjuntos en los que se presenta el evento sencillo.6 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . P (B/A) que se lee La probabilidad de A y B es igual a la probabilidad de A por la probabilidad de A según B En nuestro caso: La P (gris y puntos) = P (gris) * P (puntos / según gris) = 6/10 * 2/6 = 2/10 Además la P (gris y franjas) = P (gris) * P (franjas / según gris) = 6/10 * 4/6 = 4/10 Por lo tanto la probabilidad de obtener una bolilla gris será: P (gris) = P (gris y puntos) + P (gris y franjas) P (gris) = 0. estará dada por la suma de las probabilidades de obtener una bola gris con puntos y una bola gris con franjas: P (gris) = P (gris  puntos) + P (gris  franjas) Recordar que de manera general la P(A  B) = P(A). Supongamos tener una caja con 10 bolillas que presentan las siguientes características: Tres son rojas con puntos Una es roja con franjas Dos son grises con puntos Cuatro son grises con franjas La probabilidad de extraer una bola gris. pero los sucesos dependientes no tienen necesariamente que ser mutuamente excluyentes. 2.2 + 0. En el inicio del estudio de probabilidades se hace complejo definir claramente sucesos mutuamente excluyentes y eventos independientes a estos efectos se tendrá muy en cuenta la siguiente premisa Los sucesos mutuamente excluyentes deben ser dependientes.4 = 0.2.16 - Profesor: MARIO MARÍN .

Además en cada categoría los clasifica de acuerdo a su sexo en Varones y Mujeres según consta en la siguiente tabla: SEXO INFANTILES CADETES MAYORES Varones 150 100 30 Mujeres 70 30 20 Si se elige azarosamente la ficha de un socio indique Ud.Analicemos la siguiente situación: Un Club local con 400 socios los clasifica de acuerdo a su edad. Aplicando la expresión general de probabilidades dependientes tendremos: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . la probabilidad que: a) Corresponda a una mujer De acuerdo a la definición la probabilidad de mujer estará dada por la suma de las probabilidades de los eventos conjuntos donde se presenta la mujer. a varón como V. en tres categorías. Cadetes y Mayores.17 - Profesor: MARIO MARÍN . Infantiles. le corresponda a un varón siendo que pertenecía a un infantil. infantiles como I. es decir Si designamos a mujer como F. cadetes como C y mayores como M podemos expresar: P( F ) = P( F  I) + P(F  C ) + P( F  M ) = 70 / 400 + 30 / 400 + 20 / 400 = 120 / 400 Resultado al cual podríamos haber llegado rápidamente si completamos la tabla anterior con una nueva fila y una columna más que contengan los totales: SEXO INFANTILES CADETES MAYORES TOTALES Varones 150 100 30 280 Mujeres 70 30 20 120 TOTALES 220 130 50 400 De esta manera la Probabilidad: P (F) = 120 / 400 Suponga que quiere determinar la probabilidad de que elegida la ficha de un socio azarosamente.

En síntesis permite estudiar nueva información y revisar nuestras anteriores estimaciones. por otro lado los casos favorables se dará por la cantidad de varones infantiles que se tengan. luego aplicando la expresión clásica de probabilidades 150 P (V / I) = 220 Analicemos el siguiente problema “Una empresa metalúrgica produce pernos de pistón para un determinado tipo de motor. sabiendo que la ficha pertenece a un infantil. La producción se efectúa con tres máquinas a las que designaremos como M1. P (V  I) P (V / I) = P (I) Desarrollando las expresiones del numerador y del denominador tendremos: P (V) * P (I /V) P (V / I) = P (I  F)  P (I  V) Desarrollando las probabilidades conjuntas del denominador tendríamos: P (V) * P (I /V) P (V / I) = P (F)* P (I / F)  P (V) * P (I /V) Expresión que se la conoce como Teorema de Bayes El teorema o Regla de Bayes en si trata la revisión de las estimaciones iniciales de la probabilidad dada la evidencia de la muestra. aplicar Bayes nos entregaría: 220 150 * P (V / I)  400 220 120 70 280 150 *  * 400 120 400 280 Simplificando tendremos 150 P (V/ I) = 220 Claro que la tabla facilita la determinación de estas probabilidades condicionadas analizando el problema de la siguiente manera: La probabilidad de que corresponda a un varón.18 - Profesor: MARIO MARÍN . Para el caso que estamos tratando. en este caso 150. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . circunscribe el espacio muestral solo al número de infantiles 220 que corresponderá al número de casos factibles.

3 P (M3) = 0. De acuerdo a lo solicitado por el enunciado nuestra incógnita es la Probabilidad de que un perno lo hubiera producido M1 sabiendo que el mismo está defectuoso.5 P (M2) = 0.2 Por otra parte conociendo los porcentajes de pernos defectuosos producidos por cada una de las máquinas tendremos: La probabilidad de que habiéndola producido M1 esté defectuoso P (D / M1) = 0.04 De idéntica manera tendremos: P (D / M2) = 0. cuál es la probabilidad de que lo haya producido la maquina M1.19 - Profesor: MARIO MARÍN .” Si tomamos azarosamente un perno listo para embalar y el mismo está defectuoso. La máquina M1 Produce el 50% de los pernos mientras que la M2 el 30%.1 Desarrollando la expresión (1) de acuerdo al teorema de Bayes tendremos: P (M1) * P (D / P(M1 / D) = M1) P (D  M1)  P (D  M 2)  P (D  M 3) desarrollando el denominador P (M1) * P (D / P(M1/D) = M1) P (M1) * P (D / M1)  P (M 2) * P (D / M 2)  P (M 3) * P (D / M 3) Reemplazando valores tendremos: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . P (D M P (M1/ D)  (1) 1) P (D) De acuerdo a los datos tenemos que la probabilidad de que un perno cualquiera lo produjera cada una de las máquinas será: P (M1) = 0. se sabe además que la máquina M1 produce un 4% de piezas defectuosas mientras que la M2 produce el 8% y de los pernos producidos por la M3 el 10% presenta fallas.08 y P (D / M3) = 0.M2 y M3. indique Ud.

5 * 0.04  0.08  0.02  0.5 * 0.2 * 0.20 - Profesor: MARIO MARÍN .02 =  0.024  0.02 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .P (M1 / D) 0.1 0.3 * 0.04 0.

el dejar las llaves en el estacionamiento. entonces tendremos: P(A) = 0. Expresando esta probabilidad condicionada: P(A R) P(A/R) = P(R) Desarrollando esta expresión tendremos la Regla de Bayes: P (A) * P(R / A) P (A/R) = P (A R)  (P (B  R) Que desarrollando el denominador.02 P (M1 / D) = 0.21 - Profesor: MARIO MARÍN . que se sabe está defectuoso. la probabilidad de que un automóvil que ha sido robado en esa ciudad haya tenido las llaves puestas”. Además y de acuerdo a estadísticas el 5% de los automóviles que estacionados tienen las llaves puestas son robados de la vía pública mientras que solo el 1% de los automóviles que no tienen las llaves puestas son robados. pero ahora estamos ya en condiciones de resolver. B el evento de no dejarlas y R que el automóvil fuera robado.75 Además la probabilidad de que un auto estacionado con las llaves puestas sea robado es de: P(R/A) = 0.05 y la probabilidad de que sea robado en caso de no tener las llaves puestas es : P(R/B) = 0.064 RESOLUCIÓN DEL PROBLEMA Al inicio de este módulo se nos planteó el siguiente problema. también podemos expresar como: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . Si definimos como evento A.La probabilidad que un perno. “La cuarta parte de los propietarios de automotores de esa comunidad deja las llaves puestas en los automóviles al estacionarlos.01 Lo solicitado en el problema es la probabilidad de que habiendo sido robado un automóvil. éste tuviera las llaves puestas. Indique Ud. lo produjera M1 es igual a: 0.25 Por lo tanto la P (B)  0. el cual no podíamos resolver por falta de herramientas.

estos serían los siguientes: (a b c) (a b d) (a b e) (a c d) (a c e) (a d e) (b c d) (b d e) (b c e) (c d e) Cada uno de estos subconjuntos de tres elementos cada uno de ellos. P(A) * P(R / A) P(A/R) = P(A) * P(R / A)  (PB) * P(R / B) Reemplazando por valores: 0. Ahora bien. b. matemáticamente igual a: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . formados con los n elementos del conjunto dado se denominan combinaciones y se las expresa como: n C r (Expresión que se presenta en general en las calculadoras). en este caso n = 5.25 * 0.01 0.05 P(A/R) =  0. en este caso r = 3. c.22 - Profesor: MARIO MARÍN . d. e) Denominaremos como n al número de elementos que conforman el conjunto.02 P(A/R) = 0. Supongamos tener un conjunto de cinco elementos a los que denominaremos como: (a.75 * 0.05  0. No obstante es común encontrar en distintos textos combinaciones expresadas de diferentes maneras según el criterio del autor y a saber: Crn  Cnr En todas ellas se lee como Combinaciones de n elementos tomados de r en r. si.0125 0.6255 COMBINACIONES Y PERMUTACIONES El estudio de combinaciones y permutaciones se asocia al estudio de análisis combinatorio y constituye en realidad una herramienta de gran aplicación en la resolución de probabilidades y en la distribución de variable aleatoria que veremos más adelante. con los elementos del conjunto quisiéramos formar subconjuntos de r elementos cada uno.25 * 0.

2 . .3.* ( n-n+1) Además. . permutando los términos que lo componen: (A b c) (A c b) (B a c) (b c a) (c a b) (c b a) (a b d) (a d b) (b d a) (b a d) (d a b) (d b a) (a b e) (a e b) (b a e) (b e a) (e a b) (e b a) (a c d) (a d c) (d a c) (d c a) (c d a) (c a d) (a c e) (a e c) (c a e) (c e a) (e a c) (e c a) (a d e) (a e d) (d e a) (d a e) (e a d) (e d a) (b c d) (b d c) (c d b) (c b d) (d b c) (d c b) (b d e) (b d e) (d b e) (d e b) (e d b) (e b d) (b c e) (b e c) (c b e) (c e b) (e c b) (e b c) (c d e) (c e d) (e d c) (e c d) (d e c) (d c e) Cada una de las distintas formas en que puede expresarse un conjunto se denomina permutaciones y se las expresa como: Pr = r! P (3) = 3 .1  10 (3. .2. . el factorial de cero 0! = 1. 1 = 6 1 Debemos recordar que n! ( factorial de n) = n* (n-1) * (n-2) * .1) (2. n! nCr = (11) r!*(n  r)! n! 5! = = r!*(n  r)! 3!*(5  3)! 5.4. A su vez. .1) Definición Dos combinaciones son distintas cuando varían en por lo menos un elemento.2. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . cada subconjunto de tres elementos pueden expresarse de seis maneras distintas. .23 - Profesor: MARIO MARÍN . .

que no serían más que las combinaciones de dos elementos tomados del conjunto original de cuatro.24 - Profesor: MARIO MARÍN . y se lo denota como: nPr = nCr * Pr n! nPr = * r! simplificando r!. B Que las dos sean solteras C Que una sea casada y la otra soltera.1 nPr =  60 2. Al conjunto de combinaciones y permutaciones se las denomina Variaciones o también Permutaciones de n elementos tomados de r en r.1 Analicemos el siguiente ejercicio: Supongamos que en un jardín de infantes hay cuatro maestras de las cuales dos de ellas son casadas y las denominaremos como C1 y C2.(n  r)! n! nPr = (n  r)! Para nuestro caso n = 5 y r = 3 tendremos: 5. por cada una de las combinaciones de tres elementos. Si es necesario elegir a dos de las maestras para acompañar a los niños a un paseo.3. por otra parte las otras dos se denominaran S1 y S2. en el cuál volcaríamos todas las duplas posibles a elegir. y a saber: (C1 C2 S1 S2) Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .4. se pueden obtener seis permutaciones.Definición Dos permutaciones son distintas cuando varían en la ubicación de por lo menos un elemento. Resumiendo diremos que. y la elección se efectúa de manera totalmente aleatorio.2. En casos como el planteado puede ser conveniente operar con el diagrama de VENN. tomadas entre los cinco del conjunto dado. indique la probabilidad: A que las dos maestras elegidas sean casadas.

todas igualmente posibles y por lo tanto la probabilidad de cada una de ellas será de: P (Ei) = 1 / 6 A) La probabilidad de que ambas sean casadas será entonces de: P (C1C2) = 1/ 6 B) La probabilidad de que las dos sean casadas también será igual a: P (S1S2) = 1/ 6 Solo una combinación cumple con esa condición. Al elegir una dupla.25 - Profesor: MARIO MARÍN . C) De las seis combinaciones posibles. por lo que la probabilidad de: P (SC) = 4 / 6 A C1C2 C2S1 C1S1 S1S2 B C2S2 C1S2 C P(A) + P (B) + P(C) = 1 / 6 + 1 / 6 + 4 / 6 = 1 Mientras el número de eventos simples sea pequeño. en cuatro de ellas se tiene una casada y la otra soltera. podemos resolver estas probabilidades directas apoyándonos en el diagrama de VENN. pero si su número aumentare ya no sería posible este tipo de planteo. S C1C2 C2S1 C1S1 S1S2 C2S2 C1S2 Cada punto muestral es una combinación. Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . esta tendrá que ser necesariamente una de las seis combinaciones.

Varón Varón (V V) 2.Supongamos tener un curso de 32 alumnos conformado por 14 mujeres y 18 varones. Si se tomará una dupla esta será una de todas las posibles duplas que se pueden formar con 32 alumnos.26 - Profesor: MARIO MARÍN .Mujer Mujer (M M) VV VM MM ¿Cuántas duplas de (V V) se tienen. 32C2 = 496 Estas 496 duplas estarán conformadas por: 1. indique la probabilidad de que los dos alumnos elegidos: A sean varones B ambos sean mujeres C que uno de ellos fuere mejer y el otro varón. podemos obtener el número de ellas que están conformadas por mujer – varón como la diferencia entre el total y la suma de las duplas (V V) y (M M) (M V) = 496 – (153 + 91) = 252 Ahora estamos en condiciones de responder a las preguntas aplicando la expresión clásica de probabilidades: Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) . si es necesario conformar una comisión de dos alumnos para realizar una investigación y ésta se efectuare azarosamente.Varón Mujer (V M) 3. tantas como las combinaciones que se pueden formar con 18 varones tomados de 2 en 2?: (V V) = 18C2 = 153 La cantidad de duplas de mujer será el número de combinaciones de 2 elementos cada una de ellas tomadas de entre las 14 mujeres que tiene el conjunto: (M M) = 14C2 = 91 Si el total de duplas es de 496. En este caso generaríamos un diagrama de VENN pero con otro concepto. Es decir: Duplas posibles = 32C2 Su valor lo obtenemos en cualquier calculadora utilizando la tecla nCr.

27 - Profesor: MARIO MARÍN .5081 Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) .3084 496 91 P (M M) =  0.1834 496 P (M V) = 0. casos favorables P (E) = casos posibles 153  P (V V) =  0.