You are on page 1of 276

Fernando Alberto González Cáceres

La elaboración de esta pequeña guía de apuntes se ha caracterizado por la compañía que


me ha dado a lo largo de seis años que di comienzo a escribirla, son muchos los aportes de mis
alumnos a lo largo del tiempo, es un recopilación de temas que con el transcurrir de los días se
fueron mejorando en las aulas de clase, con la lectura de muchos autores y con la tesonera
resolución de ejercicios en cada uno de los términos y semestres que he compartido con todos
ustedes.
Es por ello que la dedico a los que han hecho posible su elaboración y a los que permitirán
su corrección.

A mi Dios Todo Poderoso


A mi Familia, Especialmente al Dr. Virgilio Cáceres (Q.e.p.d)
A mis Alumnos

Esta primera aproximación será el inicio de muchos intentos por seguir dando material
escrito para todas aquellas personas que a bien tengan su uso, por muchas revisiones, siempre se
pasan algunos, espero me lo hagan saber, pues ellos son los que en definitiva nos mueven cada
día a hacer mejor las cosas, me refiero a los errores.

Agradezco a Dios por permitirme estar con todos ustedes, a mis padres por esa formación
que me han dado, a mi esposa Liz por la paciencia, a mis dos hijos Luís y Sebastián Fernando,
motivo de permanente superación, a mi familia, a mis amigos, a mis compañeros de Trabajo, a la
Universidad Nacional Experimental de la Fuerza Armada, a todos Mis Alumnos son ustedes el
motivo inspirador de esta publicación.

Mil Gracias a Todos.

Fernando
2
PRESENTACION

La matemática ha sido considerada, durante mucho tiempo, como una ciencia exacta. Esto
se refleja en la enseñanza de la misma en todos los niveles educativos, en donde se pone fuerte
énfasis en la exactitud de los resultados.

De esta manera, los problemas en los que no es posible obtener resultados exactos van
quedando fuera. El pensamiento determinista ha sido y es el eje de acción de toda la matemática,
por lo cual ha quedado siempre asociado, en nuestro medio social, a la certidumbre y exactitud de
los resultados.

De esto se desprende la necesidad de dar cabida al pensamiento no determinista


(probabilista) ya que toda actividad humana está asociada a cierto grado de incertidumbre frente a
la cual hay que tomar decisiones.

Se hace necesario, entonces, mostrar que los modelos teóricos de la Matemática actuando
en la realidad dan aproximaciones de ella. De esta manera, debemos reconocer que en la práctica
cotidiana se hacen aproximaciones y que el error en los resultados finales puede ser acotado pero
no evitado. Por ejemplo, cuando se realiza una medición, el valor que se obtiene es una
aproximación de la medida: basta con realizar una experiencia y observar que si se mide varias
veces el mismo objeto, los resultados que se obtiene tienen variaciones.

La estadística y la probabilidad comienzan a desarrollarse en distintos momentos y


separadamente. En un comienzo la estadística se inicia vinculada a la recolección de datos del
estado: por ejemplo, interesaba conocer la población, la cantidad de habitantes, los recursos
disponibles, las cosechas, etcétera. Los gobernantes necesitaban saber con cuántos hombres
contaban para la guerra, cuánto impuesto podían exigir a sus contribuyentes. Así, ejemplos de
censos aparecen desde miles de años atrás; tal vez el ejemplo más conocido es el que aparece en
la Biblia, cuando el nacimiento de Cristo hace 2000 años, pero se encuentran datos de censos o
recuentos anteriores.

Los primeros estudios de probabilidad surgen vinculados con los juegos de azar; es
posible que esta sea una de las razones por la cual su desarrollo matemático se haya demorado.
Existen vestigios de juegos de azar en muchas comunidades ya que es una actividad que atrajo
siempre el interés del hombre tanto como actividad lúdica como para predecir el futuro.

La incorporación de la estadística y la probabilidad dentro de los pensum de estudios en el


nivel universitario es de vieja data, pero su trabajo en el aula, como un aspecto importante de la
3
educación matemática del alumno, aun no se ha logrado suficientemente, a pesar de la
importancia de la misma para decodificar la información que se nos presenta del mundo actual.
Estamos en permanente contacto con datos estadísticos: basta con abrir un diario y observar la
información que allí se brinda; se realizan encuestas previas a las elecciones y encuestas a
consumidores, se proporcionan datos del tiempo, así como comentarios estadísticos en los
deportes, entre otros. Es por esto la importancia de la asignatura, ya que un profesional de la
Ingeniería debe estar en capacidad, no solo de conocer sino de poder leer correctamente esta
información e interpretarla adecuadamente.

La enseñanza de la estadística y la probabilidad debe estar estrechamente vinculada con el


accionar diario de nuestros alumnos: por ello, los ejemplos y las actividades deben estar de
acuerdo a sus intereses y al momento que se vive. Es necesario que quienes egresen como
ingenieros estén en condiciones de comprender y apreciar datos estadísticos que aparecen no solo
en los distintos medios de comunicación, sino de que manera se debe organizar, presentar y
analizar información útil para la toma de decisiones.

El texto que se presenta para la enseñanza de la probabilidad y la estadística, más que


cumplir con el objetivo de los contenidos programáticos de la asignatura que se dicta en el tercer
semestre del Ciclo Básico de Ingeniería de la Universidad Nacional Experimental de la Fuerza
Armada, se fija otros no mas importantes, pero de seguro fortalecerán el proceso de aprendizaje
de nuestros alumnos, en el se hace énfasis del papel que juega la estadística en nuestra sociedad.

Se resalta la utilidad de la estadística en otras ciencias, la importancia de ella para la toma


de decisiones, como interpretar correctamente datos estadísticos que aparecen diariamente en
nuestro entorno, así como los que aparecen en medios de comunicación, la relación que existe
entre la estadística y la probabilidad.

Cuando se hace referencia al estudio de la probabilidad se da a conocer el significado de


lo que es un Fenómeno, un experimento aleatorio, cuándo se está en presencia de una situación
cuyo resultado es incierto y la interpretación de ella muchas veces no es clara y lleva a una
interpretación errónea.

La existencia de vocablos de uso corriente, vinculados al tema, de los cuales no siempre


los alumnos conocen correctamente su significado e incluso, en algunos casos, pueden utilizar
unos por otros, por ejemplo: seguro, posible, imposible, probable. La fuerte vinculación de la
probabilidad a los juegos, se resalta en el mismo, es por ello que este texto además puede ser
utilizado como libro no solo de los Alumnos Cursantes de la Asignatura; sino también de
cualquier otra persona interesada en la materia, como material de consulta.
4
ÍNDICE GENERAL

Estadística Descriptiva

Mapa Conceptual de la Probabilidad y Estadística


Clasificación de la estadística…………………………………………………………….
Definición de términos básicos…………………………………………………………..
Usos de la estadística……………………………………………………………………..
El símbolo de la sumatoria……………………………………………………………….
Ordenación u Organización de los datos………………………………………………….
Redondeo de datos…………………………………………………………………………

Distribución de Datos
Datos directos……………………………………………………………………………….
Datos agrupados en intervalos de clase……………………………………………………..
Representación grafica………………………………………………………………………
Escala de medida …………………………………………………………………………….
Problemas propuestos de agrupación de datos……………………………………………….

Medidas de Tendencia Central


La media o valor esperado……………………………………………………………………
La moda………………………………………………………………………………………
La mediana……………………………………………………………………………………
Aplicaciones de las medidas de tendencia central…………………………………………….
Relaciones entre las medidas de tendencia central. …………………………………………..
Medidas de tendencia central secundarias……………………………………………………

Medidas de Posición
Percentiles………………………………………………………………………………………
Deciles………………………………………………………………………………………….
Quartiles………………………………………………………………………………………..
Rangos percentiles………………………………………………………………………………
Desviación cuartil………………………………………………………………………………
5
Medidas de la Dispersión de la Distribución
Rango………………………………………………………………………………………
Desviación estándar……………………………………………………………………….
Varianza……………………………………………………………………………………
Desviación media…………………………………………………………………………..
Coeficiente de variación de Pearson………………………………………………………

Medidas de Forma
Asimetría……………………………………………………………………………………
Curtosis……………………………………………………………………………………..
Problemas propuestos de medidas Estadísticas……………………………………………….

Introducción a las Probabilidades

Conceptos Básicos de Probabilidad


Probabilidad………………………………………………………………………………….
Fenómeno y tipos de fenómenos……………………………………………………………..
Espacio muestral……………………………………………………………………………..
Eventos……………………………………………………………………………………….
Relación de eventos…………………………………………………………………………..
Operación con eventos……………………………………………………………………….
Combinación de eventos……………………………………………………………………..

Probabilidades

Definición de Probabilidad como Frecuencia


Idea Intuitiva de probabilidad………………………………………………………………..
Regla de LAPLACE………………………………………………………………………….
Definición axiomática de probabilidad……………………………………………………….
Propiedades básicas de la probabilidad……………………………………………………….
Eventos y sus probabilidades………………………………………………………………….
Métodos de enumeración……………………………………………………………………...
Ejercicios propuestos de cálculo de probabilidades…………………………………………..
6
Probabilidad Condicional

Introducción a la Probabilidad Condicional……………………………………………


Tablas de contingencia y diagramas de árbol………………………………………………
Partición de un espacio muestral ………………………………………………………….
Teorema de la probabilidad total………………………………………………………….
Teorema de Bayes………………………………………………………………………….
Ejercicios propuestos de probabilidad condicional y probabilidad total…………………..

Variable Aleatoria

Discreta
Función de probabilidad…………………………………………………………………
Función de distribución………………………………………………………………….
Parámetros de la variable………………………………………………………………..
Continua
Función de densidad……………………………………………………………………..
Función de distribución…………………………………………………………………..
Parámetros de la variable………………………………………………………………...
Ejercicios propuestos de variable aleatoria………………………………………………

Distribución de Probabilidad
Discreta
La Distribución Binomial…………………………………………………………………
La Distribución de Poisson………………………………………………………………..
La Distribución Geométrica……………………………………………………………….
La Distribución Hipergeométrica………………………………………………………….
Ejercicios propuestos de distribución de probabilidades discretas……………………….
Continua
La Distribución Normal……………………………………………………………………
La Distribución Gamma……………………………………………………………………
La Distribución Exponencial ………………………………………………………………
La Distribución Chi-cuadrada……………………………………………………………..
La Distribución T de Student………………………………………………………………
7
La Distribución Beta …………………………………………………………………….
La Distribución Weibull…………………………………………………………………
La Distribución F de Snedecor…………………………………………………………..
Ejercicios propuestos de distribución de probabilidades continuas……………………..

Estadística Inferencial

Introducción a la Estadística Inferencial


Objetivo de la estadística…………………………………………………………………..
Estadística inferencial………………………………………………………………………
Parámetros y estadísticos…………………………………………………………………..
Función de parámetros y estadísticos……………………………………………………..
Uso de estadísticos para estimar parámetros………………………………………………
Símbolos estándar………………………………………………………………………….
Muestreo aleatorio simple………………………………………………………………….
Distribuciones muéstrales y el teorema central del limite. ………………………………..
Concepto de distribución de muestreo…………………………………………………….
Media………………………………………………………………………………………
Varianza……………………………………………………………………………………
Desviación típica o estándar……………………………………………………………….
Distribución Muestral de Medias
Muestreo con reemplazamiento……………………………………………………………
Muestreo sin reemplazamiento…………………………………………………………….
El teorema del límite central……………………………………………………………….
Propiedades de los estimadores y estimación puntual……………………………………..
Definición de estimador……………………………………………………………………
Definición de estimación…………………………………………………………………..
Criterios para seleccionar un buen estimador……………………………………………...
Cualidades de un buen estimador…………………………………………………………..
Búsqueda del mejor estimador…………………………………………………………….
Tipos de estimación………………………………………………………………………..
Definición de estimación puntual………………………………………………………….
Desventajas de las estimaciones puntuales………………………………………………....
Definición de estimación de intervalo…………………………………………………….
8
Estimador sesgado e insesgado……………………………………………………………
Estimación por Intervalos
Intervalos de confianza para la media con σ conocida…………………………………...
Intervalos de confianza para la media con σ desconocida………………………………..
Intervalos de confianza para la diferencia entre dos medias con σ conocida…………….
Intervalos de confianza para la diferencia entre dos medias con σ desconocida…………
Intervalos de confianza para la proporción de la población………………………………
Intervalos de confianza para la diferencia entre dos proporciones…………………………
Intervalos de confianza para la desviación Standard............................................................
Ejercicios Propuestos……………………………………………………………………….
Pruebas de Hipótesis Paramétricas
Introducción ………………………………………………………………………………..
Pasos básicos de la prueba de hipótesis con el método de valor crítico……………………..
Errores Tipo I y Tipo II en pruebas de hipótesis……………………………………………..
Para la media con varianza poblacional conocida……………………………………………
Para la media con varianza poblacional desconocida………………………………………..
Para la diferencia entre medidas con varianzas poblacionales conocidas…………………..
Para la diferencia entre medias con varianzas poblacionales desconocidas…………………
Para la proporción de la población…………………………………………..………………
Para la diferencia entre dos proporciones poblacionales…...........………………………….
Para Varianzas poblacionales…...........…………………………............................................
Ejercicios propuestos………………………………………………………………………….

Variable Aleatoria Bidimensional

Variables Estadísticas Bidimensionales


Distribuciones de frecuencias………………………………………………………………..
Representaciones gráficas……………………………………………………………………
Parámetros estadísticos de la v. a. bidimensional……………………………………………
Regresión lineal......................................................................................................................
Correlación lineal. ……………………………………………………………………………
Ejercicios resueltos……………………………………………………………………………
Ejercicios propuestos………………………………………………………………………….
9

ESTADÍSTICA
Conceptos
Población Básicos Muestra
Estadística
Parámetro Descriptiva
Distribución de Estimador
Frecuencia
Tendencia Dispersión
Central
PROBABILIDAD
Forma
Conceptos Básicos
Posición

Distribuciones de
Probabilidad Continuas, Normal,
Discretas Binomial,
Exponencial, Chi-
Poisson, otras.
cuadrado, T de
Student, otras.
Distribuciones en
Student
el Muestreo

Desigualdad de Tchebysheff,
Ley de los grandes Números,
Teorema Central del Límite.

INFERENCIAL

Estimación
Prueba de Hipótesis
para una y dos
poblaciones
Puntual Por intervalos
10
ESTADISTICA

Estudia eventos reales Obtiene datos numéricos

Recopilar
Clasificar CONCLUSIONES
ESTADISTICA Presentar → =============
(Método científico). Analizar LOGICAS
Interpretar

Descriptiva (describe características)


ESTADISTICA
(Clasificación) Inferencial (infiere dentro de límites probables)

Infinitas Probabilísticas
POBLACION MUESTRA
(El todo) Finitas (La parte) No Probabilísticas

PARAMETROS ESTADISTICOS
(Medidas de la población) (Medidas de la muestra)

 = Media Aritmética X = Media Aritmética


 = Desviación Standard S = Desviación Standard

DATO =========  Característica Medible

Cualitativas. Indican alguna propiedad


(Atributos) de los hechos observados
MEDIDAS
Cuantitativas. Las cualidades toman
(Variables) distintos valores

Continúas (sin interrupciones)


VARIABLES
(Valores que puede tomar) Discretas (con interrupciones)
11
La Estadística es la disciplina de las matemáticas que se refiere a los métodos de
recolección, clasificación, presentación, de Información para el análisis e interpretación de un
conjunto de datos para la toma de decisiones. Se divide en:

 Estadística Descriptiva
 Estadística Infencial o Inferencia Estadística

Estadística Descriptiva – Aquellos métodos que incluyen la recolección, presentación y


caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas
características de ese conjunto.

Estadística Inferencial – Aquellos métodos que hacen posible la estimación de una


característica de una población o la toma de una decisión con respecto a una Población,
basándose sólo en los resultados de una Muestra.

Definición de Términos Básicos

Dato:
Números o medidas que han sido recopiladas como resultado de observaciones
Ejemplo: Numero de personas que son fanáticos de determinado equipo de Béisbol.

Caso:
Individuos sobre los cuales se va a tomar observaciones o variables.

Medición:
Consiste en asignar números a los objetos de acuerdo a determinadas reglas.

Población:
Conjunto completo de individuos, objetos o medidas que poseen una característica común
observable.
Ejemplo: los estudiantes de la UNEFA Núcleo Puerto Cabello.

Muestra:
Es una parte o un subconjunto de una población.
Ejemplo: los estudiantes de Ingeniería Naval de un semestre cualquiera.

Parámetro:
Es una medida obtenida a partir de las observaciones de una población.
Ejemplo: la Media de la Población.
12
Estadístico:
Es una medida obtenida a partir de las observaciones de una muestra.
Ejemplo: la Media de la Muestra.

Atributo:
Es una característica discontinua, es decir, solo puede manifestarse bajo una sola modalidad en
una variable cualitativa.
Ejemplo: El estado civil, el sexo, la nacionalidad y la profesión.

Variable:
Es una característica que puede manifestarse según dos o más modalidades.
Ejemplo: El peso, la estatura y la edad.

Variable cualitativa:
Cuando se describen cualidades o categorías de las mediciones realizadas.
Ejemplo: el color de los carros vendidos.

Variable cuantitativa:.
Cuando se suelen asignar cantidades a la representación de la variable.
Ejemplo: El numero de carros vendidos.

Tipos de variables Cuantitativas

Variables cuantitativas Discretas:


Son aquellas que representan mediciones dentro del conjunto de números enteros, es decir, son
valores puntuales y que entre ellos no pueden existir otros valores en la escala.
Ejemplo: el número de automóviles vendidos en un año.

Variables cuantitativas Continuas:


Son aquellas que expresan continuidad en dos valores puntuales.
Ejemplo: La longitud, la fuerza y la edad.

Tipos de Muestras

Muestras aleatorias simples:


Son aquellas que se obtienen de tal manera que cada individuo, objeto o medida de una población
tenga igual oportunidad de ser seleccionada.

Muestra estratificada:
Son aquella que se obtienen estratificando los elementos de la población en función de los
13
objetivos mismos del muestreo, para luego de cada estrato tomar muestras al azar simple, cuya
magnitud será proporcional a la parte que el estrato representa en toda la población. La
integración de todas estas muestras genera la muestra estratificada.

Mediciones cuantitativas:
Son aquellas que expresan dimensión o capacidad.

Mediciones cualitativas:
Son aquellas que expresan características, atributos, actitudes, etc. y no están representadas
numéricamente.

Unidad de observación:
Es un solo miembro de la población que se estudia.

El diseño de experimentos es útil para la toma de “buenas decisiones”, la utilización de un


modelo. Ayuda a:
- Obtener conclusiones de la Investigación Empírica usando Modelos Matemáticos
- Evaluar y juzgar discrepancia entre la observación y la teoría
- Tomar decisiones en condiciones de incertidumbre.

En un Estudio Estadístico hay que tener en cuenta:


- Objetivo: ¿Qué queremos hacer?
- Diseño: ¿Cuál es la forma apropiada?
- Recogida de datos: Conseguir información
- Análisis: ¿Qué dice la información?
- Descriptivo: Sobre la muestra
- Inferencial: Sobre la población
- Presentación de resultados: ¿Cómo se transmiten?

Utilidad de la Estadística, la estadística enseña a:


- Evitar sesgos
- Aprovechar mejor la información
- Ahorrar material y dinero
- Proporciona Métodos:
 De recogida de datos
 De codificación
 De control de errores
 De Análisis:
14

o Descriptivo: Resumen de datos mediante tablas y gráficos.


o Probabilístico: Estimación, contrastes y modelos para la toma de decisiones

¿Quienes usan la Estadística?


• Organismos oficiales.
• Diarios y revistas.
• Políticos.
• Deportes.
• Marketing.
• Control de calidad.
• Administradores.
• Investigadores científicos.
• Médicos
• etc.

Estadística en Administración y Economía

• En una Industria, se hace inspección de los artículos comprados como materia prima. Se debe
entonces contar los artículos defectuosos en el lote comprado.
• En una Industria, se deben llevar registros de la producción, tanto en volumen como en calidad.
• En un estudio de mercado, se toma una muestra de clientes y se pide la opinión de las personas
acerca de las calidades de cierto producto.
• El comerciante detallista debe decidir cada día la cantidad de unidades de artículos perecederos
que debe encargar para el día siguiente. Para ello, debe observar las ventas de artículos, los costos
en que se incurre por quedar con un remanente almacenado, los costos por no satisfacer
completamente la demanda.

Estadística en el Gobierno

• Se recopilan datos sobre población, educación, comercio exterior, impuestos, etc.


• Se usa para la planificación adecuada de las políticas orientadas a la satisfacción de las
necesidades de los ciudadanos.
Los datos también los pueden utilizar:
– Inversionistas Nacionales (negocios)
– Inversionistas Extranjeros
– Instituciones Internacionales
15
Estadística en las Ciencias Sociales

• Encuestas de opinión pública: temas de actualidad, “pulso político”, intenciones de voto.


• Generalmente, los resultados que presenta la prensa están basados en estadísticas simples
(cálculos de frecuencias, medias, gráficos de barras o circulares), como las que veremos en este
curso.

Estadística en la Educación

• Un Educador puede dar seguimiento al rendimiento de sus estudiantes mediante los registros de
notas a través del tiempo junto con información familiar, social, etc.
• Si se quiere estudiar los factores que pueden haber influido en las pruebas de sexto grado
realizadas por el Ministerio de Educación, se podría aplicar un cuestionario con preguntas de
selección única tratando de discernir cuales elementos pueden ser tomados en cuenta.

Estadística en las Ingenierías

• Los análisis de Control de Calidad necesitan de la obtención de información acerca de los


productos que son fabricados o de los servicios que se brindan.
• Muchas veces, en el caso de fabricación de productos, se toman muestras y éstas deben pasar
una serie de exámenes de resistencia, durabilidad, etc.
16
El Símbolo de la Sumatoria (  )

n
Sea un conjunto de n valores para una variable x. Entonces, el símbolo  x i , significa que los n
i 1

valores se tienen que sumar juntos. O sea,

x
i 1
i
 x1  x 2  x 3  ....  x n

Ejemplo 1. Supóngase que se tienen las seis observaciones siguientes para la variable x:

x 1 = 2 , x 2 = 5 , x 3 = 0 , x 4 = - 1 , x 5 = 6 , x 6 = 4 , entonces;

x
i 1
i
 x1  x 2  x 3  x 4  x 5  x 6 = 2 + 5 + 0 + (-1) + 6 + 4 = 16

Nota: no es lo mismo la suma de los valores cuadrados de x, que la suma de los valores de x al
cuadrado. O sea,

x i    x i 
n n


2

i 1  i 1 

En el caso del ejemplo 1, la suma de los valores cuadrados de x sería,

x  x1  x 2  ...... x 6
2 2 2 2
i
i 1

x  (2) 2  (5) 2  (0) 2 (1) 2  (6) 2  (4) 2  4  25  0  1  36  16  82


2
i
i 1

Por otro lado, el cuadrado de la suma de x sería,

2
 6 
  x i   (16) 2  256 ; Por lo tan to 256  82
 i1 

En muchas ocasiones estamos interesados en la suma del producto de dos variables.

Sean x , y dos variables que poseen n observaciones respectivamente. Entonces,

x y
i 1
i 1
 x1 y1  x 2 y 2  ...... x n y n
17
Ejemplo 2. Sea y una variable con los valores siguientes: y1 = 1, y2 = 3, y3 = 2

y4 = -2 , y5 = 5 , y6 = 10. Entonces, utilizando los valores del ejemplo 1 para la variable x


obtendremos,

x y
i 1
i 1
 x1 y1  x 2 y 2  ...... x 6 y 6

x y
i 1
i i  2(1)  5(3)  0(2)  (1)(2)  6(5)  4(10) = 2 + 15 + 0 + 2 + 30 + 40 = 89

n
 n x  n y 
Nota: 
i 1
x y
i i    i   i 
 i 1  i 1 

Del Ejemplo 1, x = 16 mientras que y = 19, por lo tanto: (x) (y) = (16)(19) = 304, Donde
89  304.

Reglas Básicas para las Operaciones con Sumatoria

Regla 1: la sumatoria de la suma de los valores de las variables x & y es igual a la suma de las
sumatorias de los valores de las variables individuales.

n N N

 (X
i 1
I
 YI )   X I   YI
I 1 I 1

Ejemplo 3:

Sean x 1 =2, x 2 = 5 , x 3 = 1, x 4 = 2 ; y1 = 0, y 2 = 3, y 3 = 1, y 4 = 5

 (x
i 1
I  y I )  (2  0)  (5  3)  (1  1)  (2  5)  2  8  2  7  19

4 4

x  y
I 1
I
I 1
i  10  9  19

Regla 2: La sumatoria de la diferencia de los valores de las variables x & y es igual a la


diferencia de las sumatorias de los valores de las variables individuales.

n n n

 ( x i  y i )   x i   y1
i 1 i 1 i 1
18
Utilizando los datos del ejemplo 3, tendremos:

 (x
i 1
i  y i )  (2  0)  (5  3)  (1  1)  (2  5)  1

4 4

 x I   yi  10  9  1
I 1 I 1

Regla 3: La suma del producto de una constante k multiplicada por una variable x, es igual a la
constante multiplicada por la sumatoria de la variable.

n n

 k ( x I )  k ( x i )
I 1 I 1

Ejemplo 4: Sea k = 2 y sean x 1 = 3, x 2 = 6, x 3 = 10

3 3 3

 k(x I )   2(x i )  2( x i )  23  6  10  219  38


I 1 i 1 I 1

Regla 4: la suma de una constante tomada la constante n veces, será igual al producto de n veces
el valor de la constante.

k  n  k
i 1

Ejemplo 5: sea k = 5 sumado 6 veces, entonces:

 k  5  5  5  5  5  5  30
i 1
; n  k  6  5  30
19
Ordenación u Organización de los Datos

En estadística es de suma importancia que los datos recogidos de la fuente de información


estén ordenados, ya que la posición que cada uno de ellos ocupa en la serie de datos, nos
permiten analizar ciertas medidas cuantitativas de la muestra.

Los métodos que se conocen para la ordenación de los datos que mas se utilizan son
ordenación de forma creciente o decreciente.
Ejemplo.

Orden creciente:
1.37 - 1.38 – 1.40 – 1.42 – 1.49 – 150 - 1.51 – 1.54 – 1.58 – 1.62

Orden decreciente:
1.62 – 1.58 - 1.54 - 1.51 – 1.50 – 1.49 – 1.42 – 1.4 – 1.38 – 1.37.

Redondeo de los datos

Los Datos en ocasiones, cuando el estudio lo permite deben ser redondeados, es más
sencillo trabajar con números enteros.

Redondeo de cantidades.

a. Cuando el dígito que se desea redondear es < 5.


Ejemplo: 125,211 = 125
12,42 = 12
460,33 = 1460

b. Cuando el dígito que se desea redondear esta seguido


De otro > 5.
Ejemplo: 68,65 = 69
155,70 = 156
1460,85 = 1461

c. Cuando el dígito que se desea redondear esta seguido del


Dígito 5.
Ejemplo: 0,5 = 0 (defecto) ; 2,5 = 2 (defecto)
0,5 = 1 (exceso) ; 2,5 = 3 (exceso)
Estos criterios son validos para redondear decenas y centenas.
20
Distribución de Datos

Distribución de frecuencias por datos directos

Este método se debe aplicar para un número de datos que no exceda los 30

X: Es la letra que identifica a la variable (puntuaciones, edades, tallas, salarios, etc.), y representa
a cada uno de los valores que esta toma.

fo : Son las frecuencias ordinarias absolutas y representa él numero de veces que un dato se
repite.

FA: Son las frecuencias acumuladas absolutas y representa él número de datos comprendidos
entre dos valores dados, uno de los cuales es el inferior real (Li) de toda la distribución.

fro : Son las frecuencias ordinarias relativas e indican el porcentaje que representan los datos de
una casilla determinada con relación al total de datos (n). La suma de las fro debe ser igual al
100%.

FrA: son las frecuencias acumuladas relativas y representan el porcentaje de casos ubicados entre
el extremo inferior (Li mínimo) de la distribución y un valor superior.

Distribución de Frecuencias por datos agrupados en intervalos de clase

Este método se emplea cuando él numero de datos por lo general exceden de 30 y los
valores de una serie se encuentran muy distanciados entre sí. Entonces es conveniente agruparlos
en intervalos de clase. Permitiendo esto simplificar el manejo de los datos.

Los datos se ordenan en clases o categorías, estas clases o categorías están formadas por
dos límites, uno inferior y uno superior, en cada una de las clases se ubican los valores o datos de
la serie comprendidos entre sus respectivos límites. Finalmente, se determinan todos los
elementos de una distribución, iniciándolos en una tabla de frecuencias, la cual debe comprender:
las clases, las frecuencias ordinarias, las frecuencias acumuladas, las frecuencias relativas
ordinarias, las frecuencias relativas acumuladas y los puntos medios o marcas de clase.

Para organizar los datos en una distribución, se puede utilizar indistintamente: los límites
aparentes, los límites reales, los límites completos o abiertos.
En este curso elaboraremos las tablas haciendo uso de los límites completos o abiertos.
21
Intervalo de Clase, se define como el conjunto de datos que se encuentran ubicados entre
dos límites establecidos.

Elementos de un intervalo de clase:

Xi, Xs, son los límites aparentes del intervalo (inferior y superior), respectivamente.
Li, Ls, son los límites reales del intervalo (inferior y superior), respectivamente.
Ic, es la Amplitud del intervalo (cantidad de valores cubiertos por el intervalo).

Xm o X , Marca de Clase o Punto Medio, es el Punto Medio del intervalo (valor que esta situado
a igual distancia de los extremos del intervalo). Para calcular el punto medio de un intervalo de
clase, se utiliza la formula siguiente:

 Xs  Xi Li  Ls
X , Xm  
2 2

At o R, Amplitud Total o Recorrido, es la Amplitud de la distribución (cantidad de valores


cubiertos por la distribución), y se obtiene, si se conocen los Valores tanto inicial como final o
Superior de la distribución, mediante la ecuación:

At o R = Vs - Vi

Vi = Valor Inferior de la muestra , Vs = Valor Superior de la muestra

Valor real de un número

VR =VA + P VA = Valor Aparente; P = Porción

La media unidad por debajo es el Límite Inferior (Li).


La media unidad por encima es el Límite Superior (Ls).
La porción es igual a 0,5 para cantidades exactas.
La porción es igual a 0,05 para cantidades de un decimal.
La porción es igual a 0,005 para cantidades de dos decimales.
22
Ejemplo

Si tenemos una serie de datos que corresponden a las notas finales de 50 alumnos de una
asignatura en cuestión:

58-37-51-21-48-29-51-39-60-59-48-70-59-32-43-31-57-40-51-40-18-31-92-15-69-46-60-65-10-
43-41-44-56-67-49-19-43-30-63-18-59-64-52-61-10-51-73-16-74-71.

Ordenando en forma creciente tenemos:

10-10-15-16-18-18-19-21-29-30-31-31-32-37-39-40-40-41-43-43-43-44-46-48-48-49-51-51-51-
51-51-52-56-57-58-59-59-60-60-61-63-64-65-67-69-70-71-73-74-92

Si tomamos un intervalo de clase (Ic) de 10 y hacemos uso de los límites Reales de clase,
calcularemos los Ls como el Li + Ic tenemos:

Ni Li Ls Xm fo FA fro FrA
1 10 20 15 7 7 14 14
2 20 30 25 2 9 4 18
3 30 40 35 6 15 12 30
4 40 50 45 11 26 22 52
5 50 60 55 11 37 22 74
6 60 70 65 8 45 16 90
7 70 80 75 4 49 8 98
8 80 90 85 0 49 0 98
9 90 100 95 1 50 2 100
50

Cuando trabajamos con esta clase de límites, debemos ser muy cuidadosos al incorporar
cada dato dentro de su clase respectiva, por ejemplo al incorporar los valores 40-60-70 de la
serie, surge una pregunta debemos hacerlo para el 40 en la 3 o en la 4, bueno como estamos
trabajando con límites abiertos los valores de los Ls no pertenecen al intervalo y por consiguiente
el respectivo valor será tomado en cuenta en el intervalo siguiente.

Lo mismo sucede con los restantes valores. De existir un valor con el numero 100, este
deberá ser tomado en cuenta en un intervalo superior, y al no existir otro intervalo lo debemos
crear, para que dicho numero sea contenido en el.
23
Métodos a Ser Empleados Para Elaborar la Tabla de Distribución de Frecuencias

Método Empírico
At o R
Ni = Cualquier valor comprendido entre 6 y 15 Ni 
Ic
Método Científico o Formula de Sturges

At At
Ic  ; Ni  Donde:
1  3,322 Logn Ic

Ni = Numero de intervalos de clase


At = Amplitud total o Recorrido = X mayor – X menor
n = Numero de datos de la serie
Ic = Amplitud del intervalo o Intervalo de Clase

REPRESENTACION GRAFICA

Diagrama de Barras o Polígono de Frecuencias


Se construye en un plano cartesiano, colocando en el eje de las ordenadas (Y) las
frecuencias ordinarias absolutas (fo), y en las abscisas (X) los datos X, si la distribución es por
datos directos, si es por datos agrupados se toman los puntos medios (Xm).
Se recomienda usarlo para datos que provengan de una variable discreta.

Histograma de Frecuencias
Señala la frecuencia ordinaria absoluta correspondiente a cada intervalo de clase por
medio de rectángulos cuya altura es la frecuencia del intervalo (fo) en el eje de las ordenadas (Y),
y la base, esta representada por el intervalo completo (Li – Ls), en el eje de las abscisas (X). Se
debe usar para datos que provengan de una variable continua.
24

Ojiva de Galton o Curva Acumulativa


Esta curva señala la frecuencia acumulada correspondiente a cada uno de los intervalos
de clase, en el eje de las ordenadas se coloca las FA o las FrA, en las abscisas los limites reales
superiores (Ls).

Diagrama Circular o en Pastel


Se emplea normalmente para representar distribuciones de razones. La circunferencia
representa la suma del conjunto de la distribución de razones (100%). Para construirla se
multiplica cada porción por 360° (grados de una circunferencia), obteniéndose él número de
grados correspondiente a cada componente. Los grados para cada porción se cuentan en el
sentido de las agujas del reloj en forma sucesiva.

[150,160) [150,160)
[160-170)

[160-170) [170-180)
[180,190)

[180,190)

[170-180)
25
Escala de Medida.
Los datos estadísticos por lo general provienen de la medida de una o más variables,
dependiendo de la medición y de la esencia de la variable, se obtienen diversas clases de datos
que originan diferentes escalas de medidas. Resulta sumamente importante conocer el tipo de
escala que representan los datos, debido a que, de su esencia depende la técnica estadística que
más se adapta para su análisis.

Escala Nominal.(altos, bajos – normales anormales)


Representa el nivel más bajo de medida. Se utiliza cuando un objeto o evento se
diferencia de otro solamente por la nominación que se conoce. Los procedimientos estadísticos
que más se adaptan, son: Chi-cuadrado, Coeficiente phi, Coeficiente de contingencia, Prueba del
signo, Prueba binomial.

Escala Ordinal. (Estudiantes  rendimiento)


Estas escalas distinguen los diferentes valores de la variable, ubicando a los eventos en
orden desde lo mas alto a lo mas bajo. Los procedimientos estadísticos que más se adaptan son:
coeficiente de correlación de Spearman, coeficiente tau de Kendall, prueba de la mediana.

Escala de Intervalos. (a-b,b-c, Comparaciones)


En esta escala se puede indicar la cantidad en la que un evento se diferencia de otro. Esta
escala posee todas las características de una escala nominal y una ordinal y además esta basada
en intervalos iguales.

Escala de Razón. (Contiene todas las escalas)


Es la más potente o sofisticada de las cuatro escalas de medida. Su empleo permite señalar
en cuantas veces es más grande un objeto que otro y además indica la cantidad en que se
diferencian. Esta contiene las características de las otras escalas y dispone de un cero absoluto, lo
cual posibilita las operaciones aritméticas. Para la escala de intervalos y razón
Se recomienda los procedimientos estadísticos: Correlación de pearson, t de student, análisis de
regresión, análisis factorial, análisis discriminante.
26
EJERCICIO RESUELTO

En un estudio realizado en varias empresas del sector aduanero se determinaron los


salarios promedio diarios que devengan los trabajadores en diferentes departamentos para tal fin
se estudiaron 30 empresas y se obtuvieron los siguientes datos:
5000 5050 5100 5125 5150 5200 5223 5270 5300 5315 5325 5390 5400
5415 5425 5450 5475 5480 5500 5515 5520 5525 5550 5575 5580 5595
5892 5910 6050 6065 6100 6125 6130 6150 6175 6200 6225 6250 6265
6270 6275 6300 6320 6345 6350 6375 6390 6400 6430 6435 6450 6465
6475 6500 6520 6525 6540 6550 6575 6600 6620 6635 6640 6645 6650
6690 6700 6750 6784 6820 6825 6850 6875 6900 6925 6950 6975 6980
6985 7000
Elabore la tabla de distribución de frecuencias en función al número de intervalos
establecidos por los criterios vistos anteriormente.
Vamos a elaborar la tabla de distribución en 10 intervalos de clase (método empírico),
para ello tenemos como Valor Mayor = 7000, y Valor Menor = 5000
La Amplitud total o recorrido (At) = 7000 – 5000 = 2000
La Amplitud del intervalo (Ic) = 2000/10 = 200, Procedemos a llenar la tabla.

Ni Li Ls Xm fo FA fro FrA
1 5000 5200 5100 5 5 6.25 6.25
2 5200 5400 5300 7 12 8.75 15
3 5400 5600 5500 14 26 17.5 32.5
4 5600 5800 5700 0 26 0 32.5
5 5800 6000 5900 2 28 2.5 35
6 6000 6200 6100 7 35 8.75 43.75
7 6200 6400 6300 12 47 15 58.75
8 6400 6600 6500 12 59 15 73.75
9 6600 6800 6700 10 69 12.5 86.25
10 6800 7000 6900 10 79 12.5 98.75
11 7000 7200 7100 1 80 1.25 100
80
Recuerde que los datos deben estar ordenados y de ser posible redondeados.
Es de hacer notar que se agrego un intervalo, ya que el ultimo valor coincidía con el límite
superior de la tabla de distribución, también es importante resaltar que los valores que coinciden
con los límites superiores son tomados en el intervalo siguiente, las graficas se harán tomando en
cuenta la recomendación dada en clase.
27
Ejercicio Práctico
Dada la siguiente serie de datos, representativa de un proceso estadístico cualquiera.
5094-5326-5382-5456-5491-5112-5192-5219-5248-5277-5292-5527-5546-5585-5739-5692-
5719-5824-5865-5897-5924-4950-4987-5024-5094-5935-5962-5989-6012-6045-5135-5165-
6086-6114-5406-5426-6120-6250-5785-5819-5616-5645 5692-5049-5086
Datos Ordenados
4950-4987-5024-5049-5086-5094-5094- 5112- 5135 -5165- 5192-5219-5248-5277-5292-5326-
5382-5406-5426-5456-5491-5527-5546-5585-5616-5645-5692-5692-5719-5739-5785-5819-
5824-5865-5897-5924-5935-5962-5989-6012-6045-6086-6114-6120-6250

n = 45 datos
R o At = Vmayor-Vmenor = 6250 – 4950 = 1300
Método empírico: método que depende del estado de animo de la persona que esta realizando el
proceso estadístico, en este método nos dan como dato él numero de filas, para luego calcular el
intervalo de clase (Este se redondea siempre al inmediato entero superior).
Ni = Numero de filas = 9
Ic = R / # de filas = 1300 / 9 =

Elaboración de la tabla

Li Ls Xm fo FA fro FrA

Método Científico o de Sturges: Método matemático por excelencia, en el que mediante la


aplicación de una formula podemos calcular el Ic (Este se redondea en condiciones normales),
para luego calcular él numero de filas (Se lleva siempre al inmediato entero superior)
Formula de Sturges ---- Ic = R / (1 + 3,322xlogn)
28
Li Ls Xm fo FA fro FrA

Representación grafica
Esta se realiza de dos maneras:
1.- Polígono de Frecuencias: También denominado diagrama de líneas, para realizar este
colocamos en el denominado eje de las X a las marcas de clase y en el eje de las Y a las
frecuencias ordinarias.

Frecuencias
Ordinarias

Marcas de clase
29
2.- Histograma de Frecuencias: También denominada diagrama de barras, para realizar esta
colocamos en el denominado eje de las X a los límites de clases y en el denominado eje de las Y
a las frecuencias ordinarias.

Frecuencias
Ordinarias

Límites de clase

Graficas comparativas de muestra

Asimetría Asimetría
Simétrica
Positiva Negativa
30
Problemas Propuestos

1.-Las edades de los estudiantes de un curso de informática son:


17-20—21-19-21-17-17-20-21-20-18-18-21-20-20-19-18-19-18-19-18-19-18-17-20-20-19-18-
17-18
Elaborar una tabla de frecuencias y represente los datos con un diagrama adecuado.

2.-A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo
cardiaco) obteniéndose los siguientes resultados:
87-85-61-51-64-75-80-70-69-82-80-79-82-74-90-76-72-73-63-65-67-71-88-76-68-73-70-76-71-
86

3.-En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:

2.8-3.2-3.8-2.5-2.7-3.0-2.6-1.8-3.3-2.9-2.9-3.5-3.0-3.1-2.2-2.4-3.4-2.0-2.6-3.12.9-2.8-2.7-3.1-
3.0-3.7-1.9-2.6-3.5-2.3-2.1-3.4-2.8-3.1-3.9-3.4-2.5-1.9-3.0-2.9-2.3-3.5-2.9-3.0-2.7-3.1-2.8-2.6-
2.9-3.3
Construya una tabla para datos agrupados con 6 intervalos y una amplitud de 0,.4 kg.

4.- Los datos siguientes corresponden a la medida en cms. De una muestra de productos tomados
en la compañía “X”. Realice una distribución de frecuencias sabiendo que Ni =10

1.50–1.51–1.12–2.14–2.50–3.42–3.00–9.16–5.50–10.50–13.20- 26.76–20.65-20.27–20.62–23.42
18.62–28.45–29.15–29.36

5.- Los siguientes datos corresponden a los pesos de los estudiantes de una Universidad, los pesos
están dados en libras. Construya una tabla de distribución de frecuencias, con I = 5.

110.12–114.78–118.16–119.23–120.05–124.35–126.77–128.36–130.50–134.32–137.16–143.18
135.50–140.50–145.17–149.77–150.50–153.62–154.61–156.38–158.15–159.45–160.50–159.66
115.25–128.30–135.50–148.65–160.25–155.70–118.60-123.10

6.-Dada la siguiente serie de datos, representativa de un proceso estadístico cualquiera. Elabore la


tabla de frecuencia haciendo uso del método científico, así como un polígono de frecuencias.

4950-4987-5024-5049-5086-5094-5094-5112-5135-5165-5192-5219-5248-5277-5292-5326-
5382-5406-5426-5456-5491-5527-5546-5585-5616-5645-5692-5692-5719-5739-5785-5819-
5824-5865-5897-5924-5935-5962-5989-6012-6045-6086-6114-6120-6250

7.- Los siguientes son salarios de los empleados de ciertas compañías del estado Carabobo,
elabore una tabla de frecuencias, y un histograma, tomando en cuenta los criterios vistos en clase.

8200-7500-7800-6900–7350-9260–9500–8700–8150-9620-10150–9400-9700–8625–7950–
8125–11000-10360–9650–9000-7800-8100-7350–9780-10750–11100–8525–9900-10780-
10150–11100–10365-8325-10200-10000.
31
Medidas de Tendencia Central

El hecho de tener los datos de una muestra, clasificados y presentados en una tabla de
distribución de frecuencias, haciendo uso de los métodos anteriormente vistos como son el
método Empírico o el de Sturges, no me da garantía alguna que me permita asegurar, que un
valor cualquiera de esa muestra sea él más representativo. Para ello es recomendado calcular unos
indicadores que nos expresen las características particulares de la muestra, uno de esos
indicadores son las llamadas medidas de tendencia central, también conocidas como valores
medios o medidas representativas, estas nos permiten apreciar de que manera los datos de una
muestra se agrupan o tienden a estar ubicados en el centro de la distribución ordenada.

Las medidas de tendencia central están relacionadas con el VALOR de la tendencia


central de una serie de datos ORDENADOS, denominadas también como promedios, y se define
como un valor representativo y predominante dentro de un conjunto de datos. Un promedio es
generalmente un valor ubicado en el centro de la distribución y no en el extremo.
Las medidas de tendencia central se clasifican en dos tipos:

Promedios Matemáticos: son aquellos que necesitan de una formulación matemática


inmediata para poder calcularlos, dentro de estos tenemos:

La Media o Promedio Aritmético Simple ( X ).


La Media o Promedio Aritmético Ponderado ( X p ).
La Media o Promedio Geométrico (G)
La Media o Promedio Armónico (H).
La Tasa de Crecimiento Geométrico o Formula de Interés Compuesto relación, (i).

Promedios no Matemáticos: son aquellos que necesitan de una formulación inicial para
después aplicar la formulación matemática, dentro de estos tenemos:

La Mediana (Xd o Md)


La Moda (Xo o Mo).

Con cada una de ellas se estudian característicos particulares de la muestra, las medidas de
tendencia central se calculan para datos directos (datos ordenados) y para datos agrupados
(colocados en tabla de distribución de frecuencias).
32
Calculo de las Medidas de Tendencia Central Para Datos Directos

La Media o Promedio Aritmético (X ).

De las medidas de tendencia central la media aritmética es la que con mayor frecuencia se
usa, y sirve para calcular otros estadísticos. Su definición es clara no se necesita hacer demasiado
esfuerzo para entender su finalidad, no es afectada por las fluctuaciones de los datos de la
muestra, depende de los valores de los datos, se utilizan cálculos algebraicos con facilidad y
permite realizar comparaciones.
No debe ser utilizada cuando los datos extremos difieren notoriamente del resto, es decir
cuando los datos no son homogéneos, o cuando se presenten como una progresión aritmética.
La media aritmética se calcula sumando todos los datos de una serie o distribución y
dividiéndolos entre él numero de ellos.

X 
 foxXi ; X 
f1 xX 1  f 2 xX 2  f3 xX 3  ....... f n xX n
n n

Mediana (Xd).

Se define como el dato, o punto que divide a una distribución o serie de datos en dos
partes exactamente iguales. Es decir que a ambos lados de la serie existe el mismo número de
elementos o datos.
- Se ordena
n 1
- Se calcula el lugar que ocupa, Lugar 
2

Moda, Modo o Promedio Típico (Xo).

Se define como el valor más común, es decir el valor alrededor del cual se concentran la
mayor cantidad de datos (punto de concentración máxima).
La moda no es más que el valor que más se repite.

Calculo de las Medidas de Tendencia Central para Datos Agrupados en Intervalos de Clase

La Media Aritmética o Promedio Aritmético (X )

f oi  X mi
X i 1

n
33
Una vez construida la tabla de distribución de frecuencias hasta las (FA). Frecuencias
absolutas acumuladas.
a. Calcule los puntos medios Xm.
b. Efectúe el producto de fo por Xm y súmelos.
c. Use la formula inicialmente mostrada.

La Mediana (Xd)

n
 FAi
Xd  Li  2 * Ic
fo

a. Ubique el cociente n , en la columna FA, si no coincide ninguno, use el inmediato


2
superior al buscado.
b. Después de ubicado n , extraemos de la tabla los demás términos:
2
Li = Es él límite inferior del intervalo donde se ubica la mediana.
FAi = Es la frecuencia acumulada absoluta inferior a la ubicación de la mediana.
Fo = Es la frecuencia ordinaria absoluta del intervalo donde se halla la ubicación de la mediana.

La Moda (Xo)

di
Xo  Li  * Ic
di  ds

a. Se ubica la frecuencia ordinaria modal (fom), si existen dos se selecciona lo que concentre
mayor numero de datos a su alrededor.
b. Se calculan las diferencias entre la frecuencia ordinaria modal (fom) y las que están
alrededor (inferior foi y superior fos).
c. Se toma él límite inferior real del intervalo donde se tomo la frecuencia ordinaria modal, y
se usa la formula antes mostrada.

Fom = Es la mayor frecuencia ordinaria absoluta.


Li = Es él límite real inferior del intervalo que posea la frecuencia ordinaria absoluta mayor.
ds = fom –fos = Diferencia entre frecuencia ordinaria modal (fmo) y la frecuencia ordinaria absoluta
(fos ) que esta por encima de la frecuencia modal.
di = fom –foi = Diferencia entre frecuencia ordinaria modal (fmo) y la frecuencia ordinaria absoluta
(foi ) que esta por debajo de la frecuencia modal.
Ic = Es la amplitud del intervalo de clase.
34
Aplicaciones de las Medidas de Tendencia Central.

Cuando hacemos uso de métodos estadísticos, surge la duda sobre la utilización de


cualquiera de ellas es decir, cual de las tres medidas de tendencia utilizar, cuando y porque.
Existen reglas generales para ello que a continuación conoceremos:

La Media (X )
a. Cuando los datos se distribuyen simétricamente.
b. Cuando la serie es de crecimiento aritmético.
c. Cuando se desee obtener otras medidas (estadísticos), como la desviación típica, la
varianza, desviación media.

La Mediana (Xd)
a. Cuando se necesite el valor central exacto de la serie.
b. Cuando existen datos extremos que afecten severamente a la media aritmética

La Moda o Modo (Xo)


a. Cuando se desee una medida de tendencia central rápida y aproximada.
b. Cuando sea interesante conocer el valor que más se repite en una serie

Relaciones Entre las Medidas de Tendencia Central.

En toda distribución o serie simétrica, la media aritmética, la mediana y la moda,


coinciden sin embargo, cuando el grado de asimetría es moderado, la mediana se encuentra
ubicada entre la media aritmética y la moda a una distancia igual a 1/3 de la que separa a estas
dos, partiendo de la media. Si la asimetría es acentuada esta relación no tiene validez.
Matemáticamente, la relación se puede expresar de la siguiente manera:

1
X d  X  ( X o  X )  X o  X  3( X d  X ) por tan to : X o  3 X d  2 X
3
Lo que significa que: MODA = 3 veces la MEDIANA – 2 veces la MEDIA

Para una distribución unimodal se cumplen lo siguiente:


1. Cuando X , X d , X o , son iguales, la distribución de datos es simétrica, es decir la
concentración de valores es igual a ambos valores de la media aritmética.
35
2. Cuando X > Xd >Xo, la distribución de los datos es asimétrica o sesgada hacia la derecha
(asimetría positiva), lo que nos indica que más del 50% de los datos están situados por
debajo de la media aritmética.

2. Cuando X < Xd <Xo, la distribución de los datos es asimétrica o sesgada hacia la


izquierda (asimetría negativa), Lo que nos indica que más del 50% de los datos son
superiores al valor de la media aritmética.

Medidas De Tendencia Central Secundarias


.
Media O Promedio Geométrico (G).
Se define como la raíz enésima (raíz del número de datos), del producto de la serie de valores.

Para Datos Directos o no Agrupados

G  n ( X1 ) x( X 2 ) x( X 3 )..........( X n )
Tomando lóg. a ambos miembros de la ecuación.

LogX1  LogX 2  LogX 3  .........  LogX n


LogG 
n
Anti-log G = G

Para Datos Agrupados en Intervalos de Clases

f o xLogXm1  f o xLogXm2  f o xLogXm3  .........  f o xLogXmn


LogG 
fi
Anti-log G = G
36
Usos de la Media Geométrica

La media geométrica se usa en datos que tiendan a una progresión geométrica,


entendiéndose por ello, aquella donde las razones o cocientes entre un término y el anterior sean
constantes o aproximadamente constantes; Existen variables típicamente con esa tendencia
geométrica o exponencial, como son: la población, intereses, índices, etc.

El Promedio Armónico o Media Armónica (H)

Se describe como él reciproco de la media aritmética del reciproco o inverso de los datos
de una serie.

PARA DATOS DIRECTOS ; PARA DATOS AGRUPADOS

N fi
H  H 
 1   fi 
   
 Xi   Xi 

Usos de la Media Armónica

Se usa generalmente en aquellos problemas cuando se traten de promediar razones o


cocientes, tales como: Km/Hr, Bs/Doc, Bs/Hr, etc.

Relación que Existe Entre los Promedios Secundarios.

La media aritmética es siempre mayor que la media geométrica y esta a su vez es mayor
que la media armónica, con excepción del caso en que los datos sean iguales, ya que tales
promedios coincidirán.

H < G < X (Datos diferentes)

H = G = X (Datos iguales)

De acuerdo a la siguiente formula, conociendo dos de los tres promedios, podemos


calcular el tercero.

G = H*X ; H = G/X ; X = G/H


37
PASOS A SEGUIR PARA CALCULAR MEDIDAS DE TENDENCIA CENTRAL PRINCIPALES
PARA DATOS AGRUPADOS

Media o promedio aritmético.

a. Construya la Tabla de Distribución de Frecuencias Hasta la Columna de las Frecuencias Absolutas


Acumuladas.

b. Calcule los Puntos Medios Xm.

c. Construya la Columna fo * Xm (Columna fo Multiplicada Por La Columna Xm).

d. Use la Formula de la Media Aritmética.

X
 foxXm
n
La mediana. ,

a. Ubique el cociente n / 2, en la columna de la frecuencia acumulada, si no coincide con ninguno, use el


inmediato superior al buscado.

b. Recuerde la formula de la mediana.


n
 FAi
Xd  Li  2 * Ic
fo

c. Después de ubicar n / 2, extraemos de la tabla los relación términos.

Li = Es el límite inferior del intervalo donde se ubica la mediana.


FAi = Es la frecuencia acumulada absoluta inferior a la ubicación de la mediana.
fo = Es la frecuencia ordinaria absoluta del intervalo donde se halla la ubicación de la mediana.

La moda.

a. Se ubica la frecuencia modal (fom), si existen dos se selecciona la que concentre mayor numero de
datos a su alrededor.

b. Se calculan las diferencias entre la frecuencia modal (fom) y las que están alrededor (inferior y
superior).

c. Se toma el límite inferior real del intervalo donde se ubico la frecuencia modal, y se usa la formula
siguiente:
di
Xo  Li  * Ic
di  ds

Li = Es el límite real inferior del intervalo que posee la frecuencia ordinaria absoluta mayor.
di = fom – foi ; Diferencia entre frecuencia modal (fom) y la frecuencia ordinaria absoluta que esta por
debajo de la frecuencia modal.
ds = fom – fos ; Diferencia entre frecuencia modal (fom) y la frecuencia ordinaria absoluta que esta por
encima de ella.
38
Ejemplo

Dada la Siguiente Serie de Datos Calcule Todas las Medidas de Tendencia Central Para Datos
Directos y Agrupados

1265 1272 1360 1385 1420 1525 1530 1600 1650 1800 1820 1860 1910 1950 2000
2100 2150 2200 2265 3500 3720 3850 3920 4000 4500 5250 5320 6210 6280 6500
6660 6720 7960 8100 8100 8565 8860 9220 9520 9520 9863 10275 10350 11200 11485
11520 11792 12350 12380 12500 13670 13865 13900 13952

n = 54
Datos Directos

Media: X 
 foxXi 
334090
 6186.85
n 54

Mediana: Se ubica el lugar que ocupa la mediana, Lugar = (54+1)/2 = 27.5, la mediana se
encuentra entre el valor que ocupa el lugar 27 y el 28. Por lo tanto la misma es:
(5320+6210)/2 = 5765 = Xd.

Moda: Es el o los valores que más se repiten: 8100 y 9520.

Datos Agrupados

Elaboración de la Tabla de Distribución de Frecuencias (Ni = 9)

Calculo del Recorrido: 13952-1265 = 12687

Calculo de la Amplitud del Intervalo: Use Ni = 9, 12687/9 = 1409.66 ≈ 1410

LI LS Xm fo FA fo.Xm
1265 2675 1970 19 19 37430
2675 4085 3380 5 24 16900
4085 5495 4790 3 27 14370
5495 6905 6200 5 32 31000
6905 8315 7610 3 35 22830
8315 9725 9020 5 40 45100
9725 11135 10430 3 43 31290
11135 12545 11840 7 50 82880
12545 13955 13250 4 54 53000
54 334800
39

Media: X 
 foxXi 
334800
 6200  X
n 54

n
 FAi
2 27  24
Mediana: Xd  Li  * Ic  4085   1410  5495  Xd
fo 3

Moda:
di 19
Xo  Li  * Ic  1265  1410  2076,81
di  ds 19  14
fom  19 ; foi  0 ; fos  5 ; di  19  0  19 ; ds  19  5  14
40
Medidas de Posición

Se llaman así a todas aquellas que al igual a la Mediana localizan la posición de algún
dato con relación a otros, y estas son:

Percentiles
Deciles
Cuartiles
Rangos Percentiles

Percentiles (Xp). Cuando una serie o distribución de datos es dividida en 100 partes
iguales y obtenemos percentiles del 1 al 99, y es un punto por debajo del cual se encuentra un
determinado porcentaje de casos, por ejemplo 85, es el punto o puntos, por debajo del cual se
encuentra el 85% de los casos de la distribución.

Deciles (Dx). Cuando una serie o distribución es dividida en 10 partes iguales y


obtenemos deciles del 1 al 9.

Cuartiles (Qx). Cuando una serie o distribución es dividida en 4 partes iguales y


obtenemos cuartiles del 1 al 3.

Relación Entre Estas Medidas

Xd
Percentiles
X10 X20 X30 X40 X50 X60 X70 X80 X90
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9
Cuartiles
Q1 Q2 Q3

Observando el gráfico nos damos cuenta la relación que existe entre los deciles y los
cuartiles con los percentiles.
D1 = P10, D2 = P20, Q1 = P25, Q2 = P50, Q2 = D5.

Es de notar la coincidencia que existe entre ellos.


Q2 = D5 = P50 = Xd; Es decir el segundo cuartil (Q2), el quinto decil (D5), el percentil 50 (P50) y la
mediana son iguales entre sí en cualquier distribución.
41
Percentiles Para Datos Directos.
Xp = Xi + (Xs - Xi) * R

Xp = Percentil buscado.
Xi = Es el dato inferior al percentil buscado.
Xs = Es el dato superior al percentil buscado.
R = Diferencia entre el lugar del percentil buscado y el lugar del dato inferior.

Procedimiento
1. Se ordenan los datos de menor a mayor
2. Se calcula el lugar del percentil buscado (Xp).
3. Se determina el valor de R.
4. Se aplica la formula antes descrita.
5. Se interpreta.

Percentiles Para Datos Agrupados en Intervalos de Clase.

pxn
 FAi
Xp  Li  100 * Ic
fo
Procedimiento
1. Se calcula el lugar de ubicación del percentil pedido.
2. Se procede igual que el cálculo de la mediana respecto a los valores de Li, FAi, fo.
3. Se interpreta.

Rango Percentil (Px).

Es un estadístico que nos indica el porcentaje de casos que esta ubicado por debajo de un
valor conocido.

Observación:
1. En los percentiles, deciles y cuartiles se da un porcentaje para luego determinar el
dato por debajo del cual se halla el porcentaje dado.
2. En el caso del rango percentil, se da el dato para conseguir el porcentaje de datos que
se halla por debajo del dato conocido.

Rango Percentil Para Datos Directos

Conociendo la formula para él cálculo de percentiles por datos directos y sustituyendo en


ella el valor de R, por la diferencia entre el lugar del percentil buscado y el lugar del dato inferior
42
al percentil buscado, obtenemos:
 pxn 
Xp  Xi  (Xs  Xi)xR  Xi  (Xs  Xi)    Ixi 
 100 
Despejando P tenemos:
100  X p  X i 
Donde: P   I Xi 
n  Xs  Xi 
P = Es el rango percentil buscado.
Xp = Es el dato conocido.
Xi = Es el dato inferior inmediato a Xp.
Xs = Es el dato superior inmediato a Xp.
Ixi = Es el lugar que ocupa Xi.
n = Es el numero de casos o datos de la serie.

Rango Percentil Para Datos Agrupados.

Cuando queremos calcular el rango percentil de un dato en una distribución de datos


agrupados, se despeja de la formula de percentiles para datos agrupados el valor de P (rango
percentil) y obtenemos la siguiente ecuación:

100  (Xp  Li) xfo 


Donde: Px    FAi
n  Ic 

Px = Es el rango percentil buscado.


n = Es el numero de datos de la distribución.
Xp = Representa el dato conocido.
Li = Es el límite inferior real del intervalo de clase que contiene al dato conocido (Xp).
fo = Frecuencia ordinaria absoluta del intervalo que contiene al dato conocido (Xp).
FAi = Frecuencia acumulada absoluta inferior al intervalo donde esta ubicado Xp.
Ic = Amplitud de los intervalos de clase.

Desviación Cuartil.

La desviación cuartil de un grupo de datos esta basada en dos valores de la distribución y


no tienen nada que ver con los valores extremos de la serie, sino que se refieren a la tercera y la
primera cuartilla del grupo. Para encontrar las cuartillas, dividimos él número de elementos del
grupo en cuatro partes de acuerdo a sus valores. La primera cuartilla (Q1), es el punto sobre la
escala de valores por debajo del cual, hay un cuarto de los elementos. La segunda cuartilla (Q 2),
es el punto por debajo del cual hay la mitad de los datos, por lo que Q2 se corresponde con la
43
mediana. La tercera cuartilla (Q3), es el punto por debajo del cual hay las tres cuartas partes de
los elementos, la diferencia entre la tercera y la primera cuartilla, es el llamado recorrido
intercuartilitico.
Cuando esa diferencia es dividida por 2, el cociente es la desviación cuartilitica o
semirecorrido intercuartilitico.

Q3  Q1
Dq 
2

Uno de los elementos de mayor importancia en él calculo de las cuartillas es conocer


primero que lugar ocupa cada cuartilla, para ello debemos tener en cuenta la siguiente relación:

Q1 = n/4 ; Q2 = n/2 ; Q3 = 3n/4.

Cuartillas Para Datos Directos

Para calcular cuartiles para datos directos, nos basamos en la relación que existe entre las
medidas de posición, para ello calculamos el percentil setenta y cinco y el veinticinco para datos
directos, los restamos y los dividimos entre dos.

Cuartillas Para Datos Agrupados

Las cuartillas para datos agrupados, se pueden obtener de la misma forma como se obtiene
la mediana, primero se ubica el lugar que ocupa la cuartilla, y luego aplicando la formula
respectiva, se interpreta de la misma forma que la mediana.
Recordando que el lugar que ocupa cada uno de los cuartiles corresponde a:

Q1 = 25% ; Q2 = 50% ; Q3 = 75%

n n 3n
 FAi  FAi  FAi
Q1  Li  4 * Ic Q2  Li  2 * Ic Q2  Li  4 * Ic
fo fo fo

Principales Características de la Desviación Cuartilitica.

La desviación cuartilitica, esta basada en dos valores Q1 y Q3, no es afectada por los
valores extremos, los cuales son menores que Q1 y mayores que Q3, existen un 50% de los
elementos entre Q1 y Q3, una desviación baja, indica una pequeña variación entre el 50% de los
elementos centrales, por otra parte una desviación alta significa que la variación entre los
elementos centrales es alta.
44
METODOLOGIA PARA CALCULAR MEDIDAS DE POSICION

EN 100 PARTES PERCENTILES


X10 X20 X30 X40 X50 X60 X70 X80 X90
EN 10 PARTES DECILES
D1 D2 D3 D4 D5 D6 D7 D8 D9
EN 4 PARTES CUARTILES
Q1 Q2 Q3

P = RANGOS PERCENTILES (% de Valores)


Xp = PERCENTIL

PERCENTILES PARA DATOS DIRECTOS

Xp = Xi + (Xs – Xi) * R
Xp = Percentil buscado ; Xi = Dato inferior al percentil buscado
Xs = Dato superior al percentil buscado ; R = Diferencia entre el lugar del percentil
Buscado y el lugar del dato inferior.

Procedimiento
a. Se ordenan los datos de menor a mayor. b. Se calcula el lugar del percentil buscado.
c. Se determina el valor de R. d. Se aplica la formula de percentiles. E. Se interpreta.

PERCENTILES PARA DATOS AGRUPADOS

pxn
 FAi
Xp  Li  100 * Ic
fo
Procedimiento

a. Se elabora la tabla de distribución de frecuencias. b. Se calcula el lugar del percentil buscado.


c. Se procede de la misma forma como se hizo para el calculo de la mediana. D. Se interpreta.

RANGO PERCENTIL (Px). PARA DATOS DIRECTOS.

100  X p  X i 
P   IX i 
n  Xs  Xi 

P = Es el rango percentil buscado ; Xp = Es el dato conocido


Xi = Es el dato inferior inmediato a Xp ; Xs = Es el dato superior inmediato a Xp
45
Ixi = Es el lugar que ocupa Xi ; n = Es el numero de casos o datos de la serie.

RANGO PERCENTIL PARA DATOS AGRUPADOS.

100  ( Xp  Li) xfo 


Px    FAi 
n  Ic 

Li = Es el límite inferior real del intervalo que contiene el dato conocido Xp


FAi = Es la frecuencia acumulada absoluta inferior al intervalo donde esta Xp.
fo = Es la frecuencia ordinaria absoluta del intervalo que contiene el dato Xp.

DESVIACIÓN CUARTILITICA.

Q3  Q1
Dq 
2

EJEMPLO

En el estudio realizado en las empresas del sector aduanero del ejercicio de elaboración de tablas
de distribución de frecuencias se obtuvieron los siguientes datos:

5000 5050 5100 5125 5150 5200 5223 5270 5300 5315 5325 5390 5400 5415 5425 5450
5475 5480 5500 5515 5520 5525 5550 5575 5580 5595 5892 5910 6050 6065 6100 6125
6130 6150 6175 6200 6225 6250 6265 6270 6275 6300 6320 6345 6350 6375 6390 6400
6430 6435 6450 6465 6475 6500 6520 6525 6540 6550 6575 6600 6620 6635 6640 6645
6650 6690 6700 6750 6784 6820 6825 6850 6875 6900 6925 6950 6975 6980 6985 7000
n = 80

Determine: para datos Directos y Agrupados lo siguiente:

a. Cual es el salario más alto que ganan el 40% de los trabajadores que ganan los salarios
más altos que la media.
b. Cual es el salario más alto que ganan el 30% de los trabajadores que ganan los salarios
más bajos.
c. Calcular el % y número de trabajadores se encuentra por debajo del Salario 5347.5.
d. Calcular el % y número de trabajadores se encuentra por encima del salario 6545.25.
e. Calcular el % y número de trabajadores se encuentra entre el salario 6315 y el salario
6825.
f. Calcular la Desviación Cuartilitica.
46
Datos Directos

a. Para calcular ese salario debemos primero calcular la madia de la muestra, una vez calculado,
procedemos a calcular el rango percentil para ese valor, conocido este porcentaje, le sumamos el
40% que se encuentra por encima y haciendo uso de la formula para el calculo de percentiles, lo
realizamos para el porcentaje en cuestión.

Media = X 
 foxXm = 490279/80 = 6128.48 = Media
n
Calculo del rango percentil para Xp = 6128.48; Haciendo uso de la Formula:

100  X p  X i  100  6128.48  6125 


P   IX i  ; P=   32  40.87%
n  Xs  Xi  80  6130  6125 

A este porcentaje le sumamos 40% y llegamos a 80.87%, Calculamos el percentil para el 80.87%
p  n 80.87  80
Calculamos el lugar que ocupa el percentil buscado   61.696 y usamos
100 100
Xp = Xi + (Xs – Xi) * R → 6620 + (6635-6620) x 0.696 = 6630.44

b. El 30% de los que ganan los salarios mas bajos, son aquellos que se encuentran 30% encima
del salario 5000 o lo que es lo mismo vamos a calcular el percentil 30, usamos la formula:
Xp = Xi + (Xs – Xi) * R; Lugar que ocupa el percentil = 24, entonces el salario será: 5575.

c. Cálculo del rango percentil para Xp = 5347.5; Haciendo uso de la Formula:

100  X p  X i  100  5347.5  5325 


P   IX i  ; P=   11  14.183 % .
n  Xs  Xi  80  5390  5325 

p  n 14.183  80
Calculo del número de trabajadores   11.35 ≈ 11 trabajadores.
100 100

d. No se puede calcular porcentajes que están por encima de valores de forma directa, ya que se
contradice la definición de rango percentil, para ello nos situamos en un valor que se encuentre
un diferencial por encima del valor conocido y para ese valor, si calculamos el rango percentil.
Nos situaremos en el valor 6545.5, calculamos el rango percentil y el porcentaje obtenido se lo
restamos del 100% y de esta manera damos repuesta al interrogante.

Cálculo del rango percentil para Xp = 6545.5; Haciendo uso de la Formula:


47
100  X p  X i  100  6545.5  6540 
P   IX i  ; P=   57  71.93 % ,
n  Xs  Xi  80  6550  6540 

100 % - 71.93 % = 28.07 % → porcentaje por encima


p  n 28.07  80
Calculo del número de trabajadores   22.456 ≈ 22 trabajadores.
100 100

e. Para realizar este calculo, primero lo haremos para el valor superior, luego para el valor
inferior y los porcentajes los restamos y obtenemos el porcentaje que esta entre esos dos valores
Cálculo del rango percentil para Xp = 6825; Haciendo uso de la Formula:

100  X p  X i  100  6825  6820 


P   IX i  ; P=   71  88.96 % ,
n  Xs  Xi  80  6850  6820 
Cálculo del rango percentil para Xp = 6315; Haciendo uso de la formula anterior:

100  6315  6300 


P=   43  54.69 % ,
80  6320  6300 
88.96 % - 54.69 % = 34.27 %

p  n 34.27  80
Calculo del número de trabajadores   27.42 ≈ 27 trabajadores.
100 100

f. Procedemos a calcular el percentil 75, luego calculamos el percentil 25, estos valores los
restamos y los dividimos entre 2, o lo que es lo mismo el Cuartil 3 y el Cuartil 1, estos valores los
restamos y los dividimos entre 2.
p  n 75  80
Calculamos el lugar que ocupa el percentil Setenta y cinco   60 y usamos
100 100
Xp = Xi + (Xs – Xi) * R → al contar los valores nos damos cuenta que el lugar 60 lo ocupa el
valor = 6600.
p  n 25  80
Calculamos el lugar que ocupa el percentil Veinticinco   20 y usamos
100 100
Xp = Xi + (Xs – Xi) * R → al contar los valores nos damos cuenta que el lugar 20 lo ocupa el
valor = 5515.
Q  Q1 6600  5515
La desviación cuartilitica es Dq  3   542.5
2 2

Datos agrupados

Se elabora la tabla de distribución de frecuencias en función al numero de intervalos que se


indica, Ni = 10
48
Calculo del rango = Vmayor – Vmenor = 5000 – 7000 = 2000

Ni Li Ls Xm fo FA fo x Xm
1 5000 5200 5100 5 5 25500
2 5200 5400 5300 7 12 37100
3 5400 5600 5500 14 26 77000
4 5600 5800 5700 0 26 0
5 5800 6000 5900 2 28 11800
6 6000 6200 6100 7 35 12200
7 6200 6400 6300 12 47 75600
8 6400 6600 6500 12 59 78000
9 6600 6800 6700 10 69 67000
10 6800 7000 6900 10 79 69000
11 7000 7200 7100 1 80 71000
490800

a. La media de la distribución es: 4908000/80 = 6135. Realizamos el mismo procedimiento


desarrollado para datos directos. Calculando el rango percentil con la formula siguiente:

100  ( Xp  Li) xfo 


Px    FAi 
n  Ic 

Buscamos en la tabla, dentro de que límites se encuentra el valor y procedemos a tomar los
100  (6135  6000) 
demás valores    28  35.84%
80  200 
El porcentaje conseguido lo sumamos a 40% y calculamos el percentil para ese valor con la
formula siguiente:
pxn
 FAi
Xp  Li  100 * Ic
fo

75.38  80
Hallamos el lugar que ocupa el percentil  60.3
100
Este valor lo ubicamos en la tabla de distribución, tal como lo hacíamos con el cálculo de la
mediana para la extracción de los valores.

60.3  59
Xp  6600  * 200  6626 → Salario más alto
10
49
b. Calculamos el percentil 30

30  80
Hallamos el lugar que ocupa el percentil  24
100
60.3  59
Xp  6600  * 200  6626
10

c. Procedemos como lo hicimos para datos directos.

Calculando el rango percentil para el salario 5347.5 con la formula de rangos percentiles.

Buscamos en la tabla, dentro de que limites se encuentra el valor y seleccionamos los demás
100  (5347.5  5200) x7 
valores    12  21.45%
80  200 
p  n 21.45  80
Calculo del número de trabajadores   17.16 ≈ 17 trabajadores.
100 100

d. Al igual que en datos directos nos situamos en un valor superior al pedido, el cual será 6545.5
y procedemos teóricamente de la misma manera.

Calculando el rango percentil para el salario 6545.5 con la formula de rangos percentiles.
Buscamos en la tabla, dentro de que limites se encuentra el valor y seleccionamos los demás
valores
100  (6545.5  6400) x12 
   59  84.66% → 100% - 84.66% = 15.34 %
80  200 

p  n 15.34  80
Calculo del número de trabajadores   12.27 ≈ 12 trabajadores.
100 100

e. Calculando el rango percentil para el salario 6825 con la formula de rangos percentiles.

Buscamos en la tabla, donde dentro de que limites se encuentra el valor y seleccionamos los
demás términos
100  (6825  6800) x10 
   79  80.25%
80  200 

Calculando el rango percentil para el salario 6315 con la formula de rangos percentiles.

Buscamos en la tabla, dentro de que limites se encuentra el valor y seleccionamos los demás
términos
50
100  (6315  6200) x12 
   47  67.375%
80  200 

80.25 % - 67.375% = 12.875%

p  n 12.875  80
Calculo del número de trabajadores   10.3 ≈ 10 trabajadores
100 100

f. Calculando el percentil 75 y el percentil 25 damos repuesta a la interrogante

pxn
 FAi
100 75  80
Xp  Li  * Ic Lugar que ocupa el percentil 75 =  60
fo 100
60  59 25  80
Xp  6600  * 200  6620 ; Lugar que ocupa el percentil 25 =  20
10 100
20  12
Xp  5400  * 200  5514.28
14

Q3  Q1 6620  5514.28
La desviación cuartilitica es Dq    552.86
2 2

Recuerde que el cuartil 3 es igual al Percentil 75 y por consiguiente el cuartil 1 es igual al


percentil 25.
51
Medidas de Dispersión

Las medidas de dispersión o de variabilidad nos dan a conocer el grado de


homogeneidad o heterogeneidad de los datos de una distribución. En la generalidad indican
de qué manera se agrupan o concentran los datos alrededor de alguna de las medidas de tendencia
central.
Estas medidas explican algunas características de la serie de la cual proceden. La
variabilidad nos permite conocer la variación o dispersión promedio que presentan los datos con
relación a la media elegida.
Cuanto menor sea esta variabilidad, mucho mas concentrados estarán los datos alrededor
de la media o promedio seleccionado y más representativo será este. Cuan mayor sea la variación
o dispersión menor representatividad tendrá dentro de conjunto de datos. Si todos los datos de
una distribución son iguales no existirá dispersión o lo que es lo mismo decir que la variabilidad
seria igual a cero y de hecho no habrá variabilidad de los mismos con respecto a su media.
Existen diversas Medidas de Dispersión, entre las más utilizadas podemos destacar las
siguientes:

1.- Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor
más elevado y el valor más bajo. R = Xmayor – Xmenor

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número
de veces que se ha repetido cada valor. El sumatoria obtenido se divide por el tamaño de la
muestra.

 f
(X  X ) 2
 ( X m  X )2
S2 
2 o
S DatosDirec tos DatosAgrupados
n n

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor
sea la varianza, más dispersos están.

3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.

S
 (X i X )2
DatosDirec tos S
f o  ( Xm  X ) 2
DatosAgrupados
n n
52
4.- Desviación Media: Se define como la sumatoria de las desviaciones de los datos respecto a la
media aritmética de una distribución.
X X f  Xm  X
MD 
i
MD 
o
DatosDirec tos DatosAgrupados
n n

5.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la
S
media. Cv =
X

Ejemplo:

Los datos siguientes corresponden a la estatura de un grupo de alumnos de la sección “E” del
segundo término de Ingeniería. De la Universidad Nacional Politécnica Experimental de la
Fuerza Armada Nacional.

1.66-1.67-1.67-1.67-1.67-1.72-1.72-1.72-1.72-1.73-1.73-1.74-1.75-1.75-1.76-1.76-1.76-1.87-
1.87-1.87-1.88-1.88-1.88-1.88-1.89-1.89-1.89-1.90-1.90-1.90.
Los datos están previamente Ordenados

Calcular para datos Directos y Agrupados las medidas de Dispersión.

Datos Directos

Variable(X) fo Xi  X fo( X i  X ) ( X i  X ) 2 Fo ( X i  X ) 2
1,66 1 -0.13 -0.13 0.0169 0.0169
1,67 4 -0.12 -0.48 0.0144 0.0576
1,72 4 -0.07 -0.28 0.0049 0.0196
1,73 2 -0.06 -0.12 0.0036 0.0072
1,74 1 -0.05 -0.05 0.0025 0.0025
1,75 2 -0.04 -0.08 0.0016 0.0032
1,76 3 -0.03 -0.09 0.0009 0.0027
1,87 3 0.08 0.24 0.0064 0.0192
1,88 4 0.09 0.36 0.0081 0.0324
1,89 3 0.1 0.3 0.01 0.03
1,90 3 0.11 0.33 0.0121 0.0363
0.2276
Previamente calculamos la media para datos directos ( X ) = 1.79
53
Rango:
Es la diferencia entre el mayor y el menor valor: 1.90 - 1.66 = 0.24 mts.

Varianza:
Para calcular la varianza es necesario conocer la Media de la muestra, siendo la misma = 1.79.

0.2276
S2 =  0.007586
30
Desviación Estándar o Típica: es la raíz cuadrada de la varianza. S  0.007586  0.08709

0.88
Desviación Media respecto a la Media: M D   0.02933
30

Datos Agrupados

Vamos a elaborar la Tabla de distribución de frecuencia usando un numero de intervalos (Ni) de


10.
Calculo del recorrido de la distribución: V mayor – V menor = 1.9 – 1.66 = 0.24

Calculo de la Amplitud del Intervalo (Ic): 0.24/10 = 0.024, no redondeamos por ser un valor muy
pequeño.

Ni Li Ls Xm fo FA foxXm (Xm  X ) ( X m  X )2 fo ( X m  X )2

1 1.66 1.684 1.672 5 5 8.36 -0.12 0.014 0.072


2 1.684 1.708 1.696 0 5 0 -0.96 0.009216 0
3 1.708 1.732 1.72 6 11 10.32 -0.072 0.005184 0.031104
4 1.732 1.756 1.744 3 14 5.232 -0.048 0.002304 0.006912
5 1.756 1.780 1.768 3 17 5.304 -0.024 0.0000576 0.001728
6 1.780 1.804 1.792 0 17 0 0 0 0
7 1.804 1.828 1.816 0 17 0 0.024 0.000576 0
8 1.828 1.852 1.84 0 17 0 0.048 0.002304 0
9 1.852 1.876 1.864 3 20 5.592 0.072 0.005184 0.015552
10 1.876 1.900 1.888 7 27 13.216 0.096 0.009216 0.064512
11 1.900 1.924 1.9125 3 30 5.736 0.12 0.0144 0.0432
30 53.76 0.235008
La media de la distribución es: 1.792
0.235008
Desviación Estándar o Típica: S   0.08850
30
54
Desviación Media respecto a la Media:

0.235008
Varianza: S 2   0.0078336
30
Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la
media de la muestra. .
S 0.08850
Cv =   0.04938
X 1.792

El interés del coeficiente de variación es que al ser un porcentaje permite comparar el


nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene
expresada en las mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los
alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las
desviaciones típicas (una viene expresada en cm. y la otra en Kg.). En cambio, sus coeficientes de
variación son ambos porcentajes, por lo que sí se pueden comparar.
55
Medidas de Forma

Las Medidas de Forma permiten conocer que forma tiene la curva que representa la serie
de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva:

a) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la
misma (Centro de Simetría) los segmentos de curva que quedan a derecha e izquierda son
similares.

b) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de
los valores medios de la muestra.

a) Asimetría

Hemos comentado que el concepto de asimetría se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media
aritmética)

Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher,


que viene definido por la relación entre momentos:

m3 m3
As   3
3 2
(m2 ) (m2 ) 2

Recordando la formula de los momentos tenemos:

Datos directos Datos agrupados

mi 
(X  X ) i

mi 
f o  ( X m  X )i
n n
56
Los resultados pueden ser los siguientes:

As= 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la


izquierda de la media)

As > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la


media que a su izquierda)

As < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de


la media que a su derecha)

Ejemplo: Vamos a calcular el Coeficiente de Asimetría de Fisher de la serie de datos referidos a


la estatura de un grupo de alumnos Recordemos que la media de esta muestra es 1,253

b) Curtosis

El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor
de la zona central de la distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores


centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores


centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores


centrales de la variable.

m4 m4
El Coeficiente de Curtosis viene definido por la siguiente fórmula: Cu  4

S (m2 ) 2
57
Los resultados pueden ser los siguientes:

Cu = 0 (distribución mesocúrtica).

Cu > 0 (distribución leptocúrtica).

Cu < 0 (distribución platicúrtica).

Ejemplo: Vamos a calcular el Coeficiente de Asimetría de Fisher y el Coeficiente de Curtosis


de la serie de datos referidos a la estatura del grupo de alumnos del problema de dispersión:

fo Xi  Xm ( X i  X )2 fo( X i  X ) 2 ( X i  X m )3 fo ( X i  X m )
3 ( X i  X m )4 fo ( X i  X m )
4

(X)
1,66 1 -0.12 0.0144 0.072 -0.001728 -0.00864 0.0002073 0.0010368
1,67 4 -0.096 0.009216 0 -0.0008847 0 0.00008493 0
1,72 4 -0.072 0.005184 0.031104 -0.0003732 -0.00223949 0.00002687 0.00016124
1,73 2 -0.048 0.002304 0.006912 -0.0001106 -0.00033178 0.0000053 0.000015925
1,74 1 -0.024 0.000576 0.001728 -0.00001382 -0.00004147 0.00000033 0.000000995
1,75 2 0 0 0 0 0 0 0
1,76 3 0.024 0.000576 0 0.00001382 0 0.00000033 0
1,87 3 0.048 0.002304 0 0.00011059 0 0.0000053 0
1,88 4 0.072 0.005184 0.015552 0.0003732 0.0011197 0.00002687 0.00008062
1,89 3 0.096 0.009216 0.064512 0.0008847 0.0061931 0.00008493 0.0005945
1,90 3 0.12 0.0144 0.0432 0.001728 0.005184 0.0002073 0.00062208
0.235008 0,00124416 0.0000837

Por lo tanto el Coeficiente de Fisher de Simetría de esta muestra es 0.00105143, lo que quiere
decir que presenta una distribución asimétrica positiva (se concentran más valores a la derecha de
la media que a su izquierda).

m3 m3 0.000041472 0.000041472
As   3
   0.00105143
3
(m2 ) 2
(m2 ) 2 3
(0.0078336) 2 0.0394433

Por lo tanto, el Coeficiente de Curtosis de esta muestra es 0.04546544, lo que quiere decir que
se trata de una distribución leptocúrtica, es decir, con una elevada concentración alrededor de los
valores centrales de la distribución.

m4 m4 0.00000279
Cu  4
 2
  0.04546544
S (m2 ) 0.0000613652
58
Ejercicios Propuestos de Medidas Estadísticas

1. Las edades de los estudiantes de un curso de informática son:


17 - 17 - 18 - 19 - 18 – 20 - 20 - 17 - 18 - 18 - 19 – 19 - 21 - 20 - 21 - 19 - 18 - 18
19 - 21 - 20 - 18 - 17 – 17 - 21 - 20 - 20 - 19 - 20 - 18
a) Elabora una tabla de frecuencias y representa los datos con un diagrama adecuado.
b) Calcula la media y la desviación típica.

2. A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo


cardíaco) obteniéndose los siguientes resultados:
87 - 85 - 61 - 51 - 64 - 75 - 80 - 70 - 69 – 82 - 80 - 79 - 82 - 74 - 90 - 76 - 72 - 73 – 63 65 - 67 -
71 - 88 - 76 - 68 - 73 - 70 - 76 - 71 - 86
a) Representa gráficamente esta distribución agrupando los datos en 6 intervalos.
b) Calcula la media y la desviación típica.

3. En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:
2,8 - 3,2 - 3,8 - 2,5 - 2,7 - 3,7 - 1,9 - 2,6 - 3,5 - 2,3 - 3,0 - 2,6 - 1,8 - 3,3 - 2,9 - 2,1 - 3,4 2,8 - 3,1 -
3,9 - 2,9 - 3,5 - 3,0 - 3,1 - 2,2 - 3,4 - 2,5 - 1,9 - 3,0 - 2,9 - 2,4 - 3,4 - 2,0 - 2,6 3,1 - 2,3 - 3,5 - 2,9 -
3,0 - 2,7 - 2,9 - 2,8 - 2,7 - 3,1 - 3,0 - 3,1 - 2,8 - 2,6 - 2,9 - 3,3

a) Construya una tabla con los datos agrupados en 6 intervalos de amplitud 0,4 kg.
b) Representa gráficamente esta distribución.
c) Calcula la media y la desviación típica.

4. La altura, en centímetros, de un grupo de alumnos y alumnas de una misma clase es:


150, 169, 171, 172, 172, 175, 181, 182, 183, 177, 179, 176, 184, 158
Calcula razonadamente la mediana y los cuartiles.

5. Hallar la mediana, los cuartiles y el percentil 60 en cada una de las siguientes distribuciones,
correspondientes a las notas obtenidas en un test que han hecho dos grupos de estudiantes:

A: 25 – 22 – 27 – 30 – 23 – 22 – 31 – 18 - 24 – 25 – 32 – 35 – 20 – 28 – 30

B: 27 – 32 – 19 – 22 – 25 – 30 – 21 - 29 – 23 – 31 – 21 – 20 – 18 – 27

6. Los gastos mensuales de una empresa A tienen una media de 100 000 Bs. y una desviación
típica de 12500 Bs. En otra empresa B la media es 15000 Bs. y la desviación típica 2500 Bs.
Calcula el coeficiente de variación y di cuál de las dos tiene mayor variación relativa.
59
7. Calcular la media, la varianza, la desviación típica y el coeficiente de variación de Pearson tras
encuestar a 25 familias sobre el número de hijos que tenían, se obtuvieron los siguientes datos:

Nº de hijos (Xi) 0 1 2 3 4
Nº de familias (ni) 5 6 8 4 2

8. Un fabricante de neumáticos ha recabado, de los diferentes concesionarios, información sobre


la cantidad de miles de kilómetros recorridos por un modelo concreto de esos neumáticos hasta
que se ha producido un pinchazo o un reventón del neumático. Los concesionarios la han
proporcionado los siguientes datos:

61.979 - 4.3068 - 41.539 - 62.215 - 51.269 - 82.919 - 34.182 - 37.654 - 51.179 - 74.582 58.708 -
48.035 - 67.124 - 41.830 - 61.030 - 58.267 - 74.239 - 60.727 - 56.155 - 86.070 90.565 - 53.751 -
76.580 - 68.629 - 48.240 - 57.884 - 55.257 - 84.656 - 48.662 - 10.504 60.951 - 38.420 - 79.426 -
67.662 - 53.324 - 49.011 - 29.480 - 41.128 - 30.252 - 33.412 - 47.012 - 71.360 - 78.635 - 41.715 -
72.635 - 41.463 - 48.996 - 48.172 - 55.643 - 55.912 46.681 - 66.519 - 59.168 - 66.313 - 35.884 -
28.625 - 84.588 - 40.709 - 50.238 - 61.390 85.720 - 45.313 - 46.724 - 61.752 - 63.692 - 70.003 -
65.996 - 55.989 - 49.677 - 46.502 67.467 - 64.398 - 44.411 - 41.886 - 34.754 - 59.888 - 59.449 -
67.632 - 89.116 - 69.483 - 48.698 - 65.854 - 75.850 - 36.949 - 75.548 - 69.010 - 61.477 - 65.585 -
52.452 - 50.432 37.748 - 51.831 - 73.808 - 61.065 - 35.807 - 57.277 - 80.502 - 35.342 - 44.719 -
37.402

Se pide:
a- Construir una taba de frecuencias para esos datos tomando como número de intervalos el que
proporciona la fórmula de Sturges. Interpretas la tabla.
b- Construir las tablas de frecuencias por el método Empírico.
c- Dibujar el histograma y el polígono de frecuencias.
d- Calcular las principales medidas de tendencia central e interpretarlas.
e- Obtener las medidas de dispersión más importantes e interpretarlas.
f- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.
g- Si el fabricante quiere proponer un kilometraje para realizar el cambio de neumáticos, ¿qué
valor propondría para que solo 3 de cada 10 coches hayan tenido un pinchazo o reventón antes de
ese kilometraje?
60
Introducción a la Probabilidad

Estadística: Ciencia del estado. Descripción y recogida de grandes conjuntos de datos y su


presentación en tablas y gráficos.
Actualmente es el resultado de la unión de:
- Cálculo de Probabilidades (siglo XVII)
- Estadística
Que evolucionan conjuntamente desde el siglo XIX.

Probabilidad: da una medida de la incertidumbre que puede ser debida a la aleatoriedad o al


desconocimiento del estado del sistema.

 Estadística Teórica: Desarrolla modelos Matemáticos.


 Estadística Metodológica o Práctica.
 Estadística Descriptiva: Resumen y descripción de datos.
 Estadística Inferencial: Toma decisiones a partir de los datos tomados en el contexto
general del que provienen.

Fenómeno Natural: Es cualquier cosa que ocurre en la naturaleza.

Existen 2 tipos de fenómenos: Deterministico y Probabilistico

- Fenómeno Deterministico o no Aleatorio: Bajo las mismas condiciones iniciales, el resultado


es el mismo. Leyes físicas y químicas clásicas.

- Fenómeno Aleatorio: Dadas unas condiciones iniciales el resultado no es el mismo.


Nº de partículas emitidas por una fuente radioactiva, Tiempo de vida de una lámpara, Resultado
del lanzamiento de una moneda.

Un experimento es un proceso mediante el cual se obtiene un resultado.

 Determinis tico
Experiment o 
 Aleatorio

En la Estadística se estudian los experimentos aleatorios, en los cuales, no se puede


anticipar el resultado.

Experimento Deterministico o no Aleatorio: Observación de un fenómeno No aleatorio.

Experimento Aleatorio (E): Observación de un fenómeno aleatorio. Son rasgos esenciales:


61
Los posibles resultados son conocidos antes de su realización (Espacio Muestral), No se
puede predecir con exactitud el resultado del experimento, Se puede repetir indefinidamente en
las mismas condiciones. Ejemplo el lanzar una moneda al aire.

Características de un Experimento Aleatorio


- Que pueda repetirse n veces.
- Conduce a diferentes resultados, pero se pueden conocer estos.
- Posee regularidad Estadística(de tanto que se repite tiende a un mismo resultado)

Espacio Muestral de un Experimento Aleatorio (S): El conjunto de todos los posibles


resultados de un experimento aleatorio.
E = Lanzar una moneda 2 veces
S = {(c, s) (s, c) (s, s) (c, c)}

Tipos de Espacios Muéstrales, de acuerdo al número de elementos, el espacio muestral se


clasifica en:

Espacio Muestral finito: El número de resultados posibles es un número entero determinado

Espacio Muestral infinito: El número de resultados posibles es un número entero no


determinado, y el mismo puede ser contable (numerable), o no contable (no numerable).
 Infinito Contable o Numerable: el número de resultados posibles no puede ser
determinado pero puede ser numerado.
 Infinito no Contable o Numerable: el número de resultados posibles no puede ser
determinado ni numerado.
Ejemplos:

1. E: Lanzar un dado 2 veces


S: {(1,1)…….. (6,6)}; S es Finito.

2. E: Observar los Alumnos del Núcleo


S: {1, 2, 3, 4………n} ; S es Finito.

3. E: Observar los Vehículos que pasan frente a la Universidad


S: {1, 2, 3, 4,………….n……..} ; S es Infinito Contable.

4. E: Observar la duración de un bombillo.


S: {t / t≥0} t es la duración del bombillo ; S es Infinito no contable.
62
Suceso o Evento: Es una colección de posibles resultados.
Los sucesos aleatorios son subconjuntos del espacio muestral y se pueden utilizar entre ellos las
operaciones habituales entre conjuntos. Se denota con una letra mayúscula a partir de la A; A S.

Ejemplos:
1.- El espacio muestral asociado al experimento: lanzar una moneda es:
S = {c, x}
A = {Que aparezca cara.}
A = {c}

2.- El espacio muestral asociado al lanzamiento de dos monedas es:


S = {cc, cx, xc, xx}
A = {Que aparezca cara}
A = {(c,c) (c,x) (x,c)}
C CC

X CX
C XC

X XX

3.-Espacio muestral asociado al experimento: Lanzar un dado.

S = {1, 2, 3, 4, 5, 6}
A = {Que aparezca Par}
A = {2, 4, 6}
4.- Espacio muestral asociado a al experimento. : Lanzar dos dados:

S = { (1,1,),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6)
(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),(4,6)
(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}

A = {Que aparezca Uno}


A = {1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1 (3,1) (4,1) (5,1) (6,1)}
63
Tipos de Eventos.
 Simple
EVENTO 
Compuesto

-Eventos simples:
Es un subconjunto que contiene un solo espacio muestral.

-Eventos compuestos:
Es una combinación de eventos simples.

Relación Entre Eventos.

Eventos Solapados
AB, son Eventos solapados, si tienen elementos comunes, estos elementos comunes a AB,
forman un subconjunto llamado intersección (A  B) de AB.

Eventos Mutuamente Excluyentes


AB, son Eventos excluyentes  A  B =  (la ocurrencia de uno impide la ocurrencia del
otro, no pueden darse o no pueden ocurrir simultáneamente) P(A B) = P (A) + P (B).

Eventos Dependientes: Dos o mas eventos son dependientes cuando el conocimiento de la


verificación de uno de ellos altera la probabilidad de verificación del o de los otros. Si los eventos
AB, son dependientes A, si la Probabilidad de que “B” suceda, esta influenciada por A 
P (B) = P (B/A)  P (AB) = P (A) x P (B/A).

Eventos Independientes: un evento B es independiente de un evento A, si la Probabilidad de que


“B” suceda, no esta influenciada por A  P (B/A) = P (B)  P(AB) = P (A) x P (B)

Eventos Complementarios: AB, son Eventos complementarios, si el segundo es un


subconjunto que contiene todos los elementos que no están en el primero. Los eventos
complementarios son a su vez mutuamente excluyentes: AB = S y A B = .

Operaciones con Eventos.

1. Unión de sucesos: AB: Sean A y B eventos, AB es otro evento, el cual ocurre cuando A
ocurre, ocurre B o cuando ocurren ambos.
Dados dos sucesos A y B de un mismo experimento aleatorio, llamaremos suceso unión de
A y B al suceso que se realiza cuando se realiza A o B.
Por tanto A  A  E
64
Ejemplo
Sea el Experimento "Lanzar un dado" S = {1, 2, 3, 4, 5,6}

A ="Salir un número par" = {2, 4,6,}; B ="Salir un número primo = {1, 2, 3,5}
A  B= {1, 2, 3, 4, 5,6}

2. Intersección de sucesos. AB: Sean A y B eventos, AB es otro evento, cuando ocurre A y
B simultáneamente.

Llamaremos suceso intersección de A y B al suceso que se realiza si se realizan A y B


(En el ejemplo anterior. A  B = {2})

Si A  B =  , entonces se dice que A y B son incompatibles.


Si A  B   , entonces se dice que A y B son compatibles.

3.- A: Se lee complemento de A y es el evento que ocurre cuando no ocurre A.


n
4. - A1 A2 A3……….A =  Ai
i=1

n
5. - A1A2A3……….A =  Ai
i=1
6.-   un evento que no ocurre.

7.- S  Espacio Muestral.

8.- A  S = S.

9.- A  S = A.

10.- A   = 

11.- A   = A

Ejemplos

1. Escribimos cada una de las palabras JUEGO en una ficha y las ponemos en una bolsa.
Extraemos una letra al azar.
65
a) escriba los sucesos elementales de este experimento aleatorio.¿ tienen todos la misma
probabilidad?
b) Escriba el suceso obtener una vocal.
Solución

a) Los sucesos elementales son: (J), (U), (E), (G), (O)


Todos tienen la misma probabilidad ya que las letras aparecen cada una, “una sola vez”.
b) A = Obtener vocal.
A = {U, E, O}

2. En un sorteo de lotería observamos la cifra en que termina el premio

a) ¿Cual es el espacio Muestral?


b) Escriba los sucesos A = Menor que 5 ; B = Par
c) Hallar los sucesos A B ; A B ; A’ ; B’ ; A’ B’
Solución

a) E espacio muestral es S: 0,1,2,3,4,5,6,7,8,9


b) A: 0,1,2,3,4 B: 0,2,4,6,8
c) A B = 0,1,2,3,4,6,8 A B = 0,2,4 A’ = 5,6,7,8,9
B’= 1,3,5,7,9 A’ B’ = 5,7,9

3. Lanzamos tres veces una moneda y anotamos si sale cara o sello.

a) Escribir el espacio muestral.


b) Escribir el suceso A = Salió cara la primera vez.
c) Cual es el suceso contrario de A, Escriba los puntos muéstrales.
d) Escriba el suceso B = obtener el mismo valor tres veces.
e) Escribir los sucesos B’, A  B y A  B.

Solución

a) S ccc, ccs, csc, css, scc, scs, ssc, sss

b) A ccc, ccs, csc, css

c) A'  la primera vez salio sello  scc, scs, ssc, sss

d) B  ccc, sss 

e) B ccs, csc, csc, css, scc, scs, ssc


66
A  B  ccc, ccs, csc, css, sss

A  B  ccc.

4. En una caja hay una bola blanca y una bola negra, en otra caja hay una bola negra, una bola
blanca y una bola roja: se extrae una bola de cada una de las cajas y se anota su color:

a) Cual es el espacio muestral.


b) Escriba los sucesos: A = la segunda bola es roja, B = alguna de las bolas es blanca.
c) Escriba los sucesos: A’, B’, A  B y A  B.
d) Cual es el suceso contrario de C  bn, br, nr

Solución:

a) S = {(b, n) (b, b) (b, r) (n, n) (n, b) (n, r)}.


b) A = {(b, r) (n, r)}. b = {(b,n)(b,b)(b,r)(n,b)}
c) A’ = {(b, b) (bn) (n, b) (n, n)}; b’ = {(n, n) (n, r)}.

A  B . = {(b, r) (n, r) (b, b) (b, n) (n, b)}

A∩B = {(b, r)}.

d) C’ = {(b, b) (n, b) (n, n)}

Problemas Propuestos de Experimentos y Espacios Muéstrales

1. Determine el espacio muestral del siguiente Experimento, lanzar un dado dos veces, estudiar el
Evento: que aparezca el número uno.

2. Determine el espacio muestral del siguiente experimento, lanzar una moneda tres veces,
estudiar los eventos: que aparezca un sello, que aparezca al menos una cara, que aparezca cara.

3. Determine el espacio muestral del siguiente experimento, se lanzan juntos una moneda y un
dado una sola vez.

4. Considérese el experimento lanzar dos dados una sola vez y observar la suma de sus caras.
Se pide:

a.-El espacio muestral.


67
b.-Los eventos:
i: se observa 2
ii: se observa 7
iii: se observa una suma menor a 7
iv: se observan ambos A y C

c.-Que relación existe entre los eventos.

4. Los artículos provenientes de una línea de producción se clasifican como defectuosos (D), o no
defectuosos(N). Se observan los artículos y se anota su condición. Este proceso se continúa hasta
que se produzca dos (2) artículos defectuosos consecutivos o se verifiquen cuatro (04) artículos,
cualesquiera que ocurran primero. Describir un espacio muestral para este experimento.
Determinar el experimento.

5. Considérese cuatro (4) objetos, con a, b, c, d, supóngase que el orden que se anotan esos
objetos representa el resultado de un experimento, sea A el evento “a” esta en el primer lugar y B
el evento “b” esta en el segundo lugar. Determinar todos los elementos del espacio muestral y
sus tipos.

6. Un lote formado por 15 unidades de las cuales se sabe que contiene tres unidades defectuosas,
es inspeccionado por el consumidor tomando una a una hasta tres unidades. El lote se acepta al
aparecer una unidad buena.

7. Sea el siguiente experimento: Lanzamos un dado y una Moneda.

a) Describir el espacio muestral

b) Describir los sucesos A y B


A = “Sacar uno o dos en el dado”
B = “sacar + en la moneda”

c) Hallar AUB, A∩B, AUD'

8. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son
partidarias o no de consumir un determinado producto.

a) Escribe el espacio muestral asociado a dicho experimento utilizando la letra “s” para las
respuestas afirmativas y la “n” para las negativas.

b) ¿Qué elementos del espacio muestral anterior constituyen el suceso “al menos dos de las
68
personas son partidarias de consumir el producto”?

c) Describe el suceso contrario de “más de una persona es partidaria de consumir el producto”.

9. En familias de tres hijos, se estudia la distribución de sus sexos.

a) ¿Cuántos elementos tiene el espacio muestral E?

b) Describe los siguientes sucesos: A = “La menor es mujer”, B = “El mayor es varón”.

c) ¿En qué consiste A UB?

10. Describir el espacio muestral correspondiente a las siguientes experiencias aleatorias. Si es


finito y tiene pocos elementos, enumérelos todos, y si tiene muchos, descríbelo y diga cual es el
número total.
a) Extraemos una carta de una baraja española y anotamos el número.
b) Extraemos una carta de una baraja española y anotamos la figura.
c) Extraemos dos cartas de una baraja española y anotamos la figura de cada una.
d) Lanzamos seis monedas distintas y anotamos el resultado.
e) Lanzamos seis monedas distintas y anotamos el número de caras.

11. Si A y B son dos sucesos de un experimento aleatorio y P [A] = 0:


a) ¿Qué podemos decir de P [A ∩ B]?
b) ¿Y de P [A U B]?
c) Responde a las mismas preguntas si P [A] = 1.
69
Probabilidad

El Cálculo de probabilidades tiene por objeto la construcción y estudio de modelos


estadísticos.
La probabilidad es una medida de la posibilidad o certidumbre de la ocurrencia de un suceso

Definición de Probabilidad como Frecuencia

Supongamos una población homogénea y finita con N elementos, de los que k presentan
la característica A.
P(A)=k/N o Si la población no es finita, repetimos el experimento una “cantidad grande” de
veces.
Frecuencia Relativa: fA = mA/m
mA = nº de veces que apareció la característica A
m = nº de veces que se realizó el experimento.
La fA tiende a estabilizarse según crece m. Esta definición presenta problemas:

- ¿Cuántas veces ha de repetirse el experimento?


- La información es limitada
- El sistema observado puede cambiar en el tiempo de observación.
Por estas razones la probabilidad se introdujo axiomáticamente utilizando las propiedades de la
frecuencia relativa. Este enfoque ayuda a simplificar los modelos teóricos, pero no ofrece una
guía para calcular la probabilidad.

Idea Intuitiva de Probabilidad.

Supongamos que lanzamos una moneda y anotamos las veces que sale cara. Después de
10, 20,30,......,200 lanzamientos obtenemos los resultados:

N de lanzamientos 10 20 30 40 50 60 70 80.................200
N de caras Obtenidas 6 11 16 20 27 31 37 43.................101
frecuencia. relativa 0,6 0,55 0,53 0,5 0,54 0,51 0,52 0,53..............0,50
70
Si repitiéramos el experimento obtendríamos resultados muy parecidos.

Podemos sacar en conclusión que las frecuencias relativas del suceso cara tienden a
estabilizarse hacia el valor 0,5.

Este número al que la frecuencia relativa se acerca más cuanto mayor es el número de
pruebas realizadas, lo llamaremos probabilidad del suceso. La probabilidad de un suceso A, se
representará p (A).

Por tanto se puede interpretar la probabilidad de un suceso como límite de frecuencias


relativas.

Regla de LAPLACE.

"La probabilidad de un suceso A es el cociente entre el número de casos favorables y el


número de casos posibles."
nº de caso s favorables
p(A) 
nº de caso s posibles
Hay que tener en cuenta que los sucesos elementales tienen que ser igualmente probables
(equiprobables).

Ejemplos:

1. Si realizamos el siguiente experimento “Lanzar un Dado”


Calcular la probabilidad de los eventos:

a) A = {número par} = {2, 4, 6} p (A) = 3/6 = 1/2


b) B = {Obtener primo} = {2, 3, 5} p (B) = 3/6 = 1/2
c) C = {Obtener múltiplos de 3} = {3, 6} p (C) = 2/6 = 1/3
d) D = {Obtener múltiplo de 5} = {5} p (D) = 1/6

2) Realizar el experimento siguiente y Calcular la probabilidad de los eventos:

“Lanzar dos monedas” S = {cc, cs, ss, sc}


a) A = {Obtener dos caras} p(A) =1/4
b) B = {Obtener dos Sellos} p (B) = 1/4
c) C = {Obtener una cara y un sello} p(C) = 2/4
d) D = {Obtener al menos un sello} p (D) = 3/4
71
3) Sea el siguiente Experimento

E = {"Extracción de una carta de una baraja española"}


Calcular la probabilidad de los eventos:

a) A = {Obtener un oro} p(A) = 10/40 = 1/4

b) B = {Obtener un as} p (B) = 4/40 = 1/10

c) C = {Obtener una sota de espadas} p(C) = 1/40

d) D = {Obtener un as o una sota} p (D) = 8/40 = 1/5

e) E = {Obtener bastos o espadas} p(E) = 20/40 = 1/2

f) F = {Obtener una figura} p (F) = 12/40 = 3/10

Definición axiomática de probabilidad

Se llama probabilidad a una ley que asocia a cada suceso A un número real entre 0 y 1,
que llamaremos probabilidad de A y representaremos p(A). La probabilidad debe cumplir los
siguientes axiomas:

1. - pA   0 A
2. - pE  = 1
3. - Si A  B =   pA  B = pA  + pB 

Propiedades:

 
i) p A  1  pA  A
ii) p   0
iii) Si A  B  pA   pB 
iv) pA   1 A
v) pA  B   pA   pB   pA  B 

Ejemplos:

1. Sea el siguiente experimento:


E = "Extraer una carta de una baraja"
Y los sucesos siguientes:
72
A = "Obtener un oro" , B = "Obtener un rey"
C = "Obtener un as de espadas" , D = "Obtener figuras"

i) A y B son compatibles, pues A  B = "Obtener rey de oros"


10 4 1 13
p( A  B)  p( A)  p( B)  p( A  B)    
40 40 40 40

ii) A y C son incompatibles, pues no se puede obtener un oro y el as de espadas a la vez.


pA  C  pA   pC 
10 1 11
 
40 40 40

iii) B  A  P (B) = 4/40 = 1/10 < p (A) = 12/40 = 3/10

iv) A  D ="obtener figura de oros"


10 12 3 19
p( A  D)  p( A)  p( D)  p( A  D)    
40 40 40 40

2. Sea el experimento siguiente:

Lanzamos dos monedas y anotamos el número de caras que obtenemos. El espacio


muestral es S 0,1,2 .

a) Tienen los tres sucesos elementales la misma probabilidad.


b) Calcular la probabilidad de: 0 caras, 1 cara, 2 caras, compruebe que su suma es igual a
uno.
c) Cual es el suceso contrario de 0 caras.
d) Cual es la probabilidad del suceso alguna cara.

Solución

a) No el suceso una cara tiene mas probabilidad que los sucesos o caras y dos caras.

b) P0 Caras   P(0)  ; P1Caras  P(1)   ; P2 Caras   P(2) 


1 2 1 1
4 4 2 4

1 1 1
P(0)  P(1)  P(2)    1
4 2 4

c) S = 0 Caras; S’ = Al menos una Cara.

PAl menos una Cara   1  P( Ninguna Cara )  1 


1 3

4 4
73
METODOS DE ENUMERACION

Combinatoria

Se llama factorial de un número natural x y se representa por x! Al producto de x factores


consecutivos y decrecientes a partir de x hasta el 1:

Ejemplos: 0!  1 1!  1  2!  2.1  2  3!  3.2.1  6  4!  4.3.2.1  24 etc.

 VARIACIONES:

Se llaman Variaciones ordinarias de n elementos tomados de m en m (m < n) a los grupos


de m elementos que se pueden formar con los n elementos dados considerándose como distintos
dos de ellos cuando difieran en algún elemento o en el orden de colocación de los mismos.

El número de variaciones ordinarias se calcula así:

n!
Vnm 
(n  m)!

Ejemplo: ?Cuántas palabras de 3 letras se pueden formar con las cinco letras vocales (tengan o
no sentido)? Como influye el orden y n = 5; m = 3, se tiene:

5! 5! 5.4.3.2.1
V53     60
(5  3)! 2! 2.1

Se Usa cando se quiere calcular cuantos grupos de m elementos se poden formar con m
elementos (m <n), teniendo en cuenta que cada grupo se diferencia de otro por tener un elemento
distinto o bien por el orden de colocación de los mismos.

Ejemplo: De una bolsa que contienen 12 bolas numeradas de 1 al 12 se extraen 4. Si tenemos en


cuenta que las bolas no se devuelven a la bolsa, Cuantos números podríamos llegar a formar?

4  12 121 ...........................  12-4+1121110911.880


V12
Solución:

Se llaman variaciones con repetición de n elementos tomados de m en m al número de


grupos que se pueden formar con los n elementos (pudiendo repetirse), contando cada grupo con
m elementos y considerándose como distintos dos grupos cuando difieran en algún elemento o en
el orden de colocación de los mismos. Su número se calcula así:
74
RV  n
n
m m

Ejemplo: Si en anterior ejemplo de las palabras formadas por las cinco vocales pudieran repetirse
letras ¿Cuántas habría?

RV53  53  125

 PERMUTACIONES:

A las variaciones ordinarias de n elementos tomados n a n (n = m) se las llama


permutaciones de n elementos y su número es:

Pn  n!

Las permutaciones permiten calcular de cuantas formas distintas se pueden ordenar m elementos.

Ejemplo:¿ De cuantas formas distintas pueden sentarse 7 personas en un banco?.

Solución: P7  7! 7.6.5.4.3.2.1  5040

Ejemplo: ¿Cuántas palabras de 5 letras pueden formarse con las 5 letras vocales?

P7  5! 5.4.3.2.1  120

 COMBINACIONES:

Combinaciones de n elementos tomados de m en m:

n  n!
Cnm    
 m  m!(n  m)!

Como en el caso de las variaciones también calcula el número de grupos de m elementos


que se pueden formar con los n elementos dados considerándose como distintos dos de ellos
cuando difieran en algún elemento pero no en el orden de colocación de los mismos. Su número
es:

Ejemplo: ¿Cual es el número de apuestas diferentes que se pueden hacer en una lotería que tiene
49 números, si el numero ganador tiene 6 cifras?

n  n!  49  49! 48.48.47.46.45.44.43
Cnm      C49
6
      13.983.816
 m  m!(n  m)!  6  6!. (49  6)! 6.5.4.3.2.1.43!
75
Ejemplo: Si en una clase de 40 alumnos queremos formar grupos de 5 sin que importe el orden en
que se elige a los componentes ¿Cuántos grupos saldrían?

n  n!  40  40! 40.3938.37.36.35!
Cnm      C40
5
      658008
 m  m!(n  m)!  5  5!. (40  5)! .5.4.3.2.1.35!

En la mayoría de problemas de combinatoria, la dificultad estriba es saber si hay que


aplicar las fórmulas de variaciones, permutaciones o combinaciones. La siguiente tabla nos
ayudará a decidir:

Determinamos n y m

¿Es n = m?

Sí No
Pn  n! ¿Influye el
orden?

No Sí

¿Pueden
repetirse?

n  n!
Cnm    
 m  m!(n  m)!

Sí No

RVnm  nm Vnm 
n!
(n  m)!

Principio de Multiplicación: Si se tiene un evento A y ese evento puede ocurrir de m maneras


diferentes y un elemento B que puede ocurrir de n maneras diferentes, la Intercepción de esos
eventos ocurrirá de m x n maneras diferentes.

Ejercicios resueltos de combinatoria

1) ¿De cuantas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?
Solución
76

Nótese que importa el orden en que se sienten las personas, ya que los cuatro sitios son
diferentes, y que una persona no puede ocupar más de un sitio a la vez. Por lo tanto, hay V10; 4 =
10!/6! = 10 . 9 . 8 . 7 = 5040 maneras.

2) En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuantos modos puede
hacerse si:
a. los premios son diferentes;
b. los premios son iguales.
Solución

Hay dos supuestos posibles:


Si una misma persona no puede recibir más de un premio:

a. hay V10;3 = 10 . 9 . 8 = 720 maneras de distribuir los premios si estos son diferentes;

b. en el caso de que los premios sean iguales, pueden distribuirse de C10;3 = (10 . 9 . 8)/6 = 120
maneras.
Si una misma persona puede recibir más de un premio:

a. Se pueden distribuir los premios, si estos son diferentes, de V R10;3 =103 = 1000 maneras;

b. hay CR10;3 = 220 maneras de distribuir los premios si estos son iguales.

3) Hay que colocar a 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen los
lugares pares. ¿De cuantas maneras puede hacerse?
Solución

Ya que la fila es de 9 individuos en total, hay 4 posiciones pares (que deben ser ocupadas
por las 4 mujeres) y 5 posiciones impares (para los 5 hombres). Por lo tanto, pueden colocarse de
P4 . P5 = 4! . 5! = 2880 maneras.

4) ¿Cuantos números de 4 dígitos se pueden formar con las cifras 0,1,. . . ,9


a. Permitiendo repeticiones;
b. Sin repeticiones;
c. Si el ultimo dıgito ha de ser 0 y no se permiten repeticiones?
Solución

Asumamos que para que un número sea de 4 dígitos su primer dıgito debe ser distinto de
77
cero.

a. Puesto que debe formarse un número de 4 dígitos, el primero de estos no puede ser cero. Por lo
tanto, hay nueve posibilidades para el primer dıgito y diez para cada uno de los tres dígitos
restantes, obteniéndose un total de 9 . 103 = 9000 números posibles.

b. Al igual que en el apartado anterior, el primer dıgito no puede ser cero. Como además no se
permiten repeticiones, hay nueve posibilidades para el segundo dıgito: el cero y las ocho no
escogidas para el primer dıgito. Por tanto, se pueden formar 92 . 8 . 7 = 4536 números.

c. Fijamos el último dıgito y, como no puede haber repeticiones, se obtiene un total de 9 . 8 . 7 . 1


= 504 números.

5) En un grupo de 10 amigos, ¿cuantas distribuciones de sus fechas de cumpleaños pueden darse


al año?
Solución

Considerando que el año tiene 365 días y que puede darse el caso de que varias personas cumplan
en la misma fecha, el numero de maneras distintas es V R365;10 = 36510

6) Cuatro libros de matemáticas, seis de física y dos de química han de ser colocados en una
estantería ¿Cuantas colocaciones distintas admiten si:
a. Los libros de cada materia han de estar juntos;
b. Solo los de matemáticas tienen que estar juntos?

Solución
Supongamos que los libros de cada materia también son diferentes (de distintos autores).

a. Consideramos cada conjunto de libros de una misma materia como una unidad. Entonces, hay
3! = 6 ordenaciones posibles de las materias. Además hay que considerar también las 4! = 24
permutaciones de los libros de matemáticas, así como las 6! = 720 y las 2! = 2 de los de física y
química, respectivamente. Se concluye así que hay 3!.4!.6!.2! = 207360 colocaciones distintas.

b. Consideremos los cuatro libros de matemáticas como una unidad.


Se tendría entonces una unidad correspondiente a matemáticas, 6 unidades diferentes de física y
dos unidades diferentes de química. Por lo tanto, existen 9! = 362880 maneras de ordenar estas 9
unidades, y por cada una de ellas hay 4! Ordenaciones posibles de los 4 libros de matemáticas,
por lo que en total hay 9! . 4! = 8709120 formas de colocar los libros.
78
Supongamos que los libros de cada materia son idénticos.

a. Consideremos cada conjunto de libros de una misma materia como una unidad. Nótese que
entonces se tendría un total de 3 unidades, que pueden ordenarse de 3! = 6 formas distintas.

b. En este caso tendremos una única unidad de matemáticas, además de 6 de física y 2 de


química, que consideraremos diferentes para este cálculo inicial. Se tiene entonces un total de 9!
= 362880 ordenaciones posibles y, puesto que los libros de cada materia son indistinguibles,
nótese que deben tenerse en cuenta las 6! . 2! = 1440 formas de colocar los libros de física y
matemáticas. Por lo tanto, hay un total de 9!/ (6! . 2!) = 252 ordenaciones.

7) Un alumno tiene que elegir 7 de las 10 preguntas de un examen. ¿De cuantas maneras puede
elegirlas? ¿Y si las 4 primeras son obligatorias?
Solución

El orden en que elija las preguntas, que además no podrán repetirse, es irrelevante. Así, puede
elegir las preguntas de C10;7 = (10.9.8) / (3 . 2) = 120 maneras.
Por otra parte, si las 4 primeras son obligatorias, debe escoger 3 preguntas entre las 6 restantes
para completar las 7 necesarias, resultando un total de C6;3 = (6 . 5 . 4) / (3 . 2) = 20 maneras.

Problemas Propuestos de Cálculo de Probabilidades

1. Hallar la probabilidad de sacar una suma de 8 puntos al lanzar dos dados.

2. Hallar la probabilidad de sacar por suma o bien 4, o bien 11 al lanzar dos dados.

3. Se escriben a azar las cinco vocales. ¿Cuál es la probabilidad de que la “e” aparezca
la primera y la “o” la última.

4. ¿Cuál es la probabilidad de sacar dos bolas negras de una urna que contiene 15 bolas
blancas y 12 negras, sin reintegrar la bola extraída?

5. Una caja contiene 12 bolas blancas y 8 negras. Si se sacan dos bolas al azar. ¿Cuál es
la probabilidad de que sean del mismo color?

6. Una caja contiene 12 bolas blancas y 8 negras. ¿Cuál es la probabilidad de sacar dos
bolas negras reintegrando la bola extraída?

7. De una baraja española de 40 cartas ¿Cuál es la probabilidad de sacar un caballo


seguido de un tres, reintegrando la primera carta? ¿Y sin reintegrarla?

8. Si la probabilidad de que ocurra un suceso es 1/3. ¿Cuál es la probabilidad de que se


realice efectuando 4 pruebas.
79
9. Se sacan dos cartas de una baraja de 40 ¿Cuál es la probabilidad de que sean un
caballo y un tres, reintegrando? ¿Y sin reintegrar?

10. Una caja contiene 8 bolas blancas, 5 negras y 2 rojas. Se extraen tres bolas al azar y se
desea saber:

a) La probabilidad de que las tres bolas sean blancas.


b) La probabilidad de que dos sean blancas y una negra.

11. Se extraen 3 cartas de una baraja de 40:

a) ¿Cuál es la probabilidad de que sean tres sotas.


b) ¿Y de que sean un as, un dos y un tres?
c) ¿Y de que salga un rey, seguido de un cinco y éste de un siete?

12. Una caja contiene dos bolas blancas y tres negras. Otra contiene seis blancas y cuatro
negras. si extraemos una bola de cada caja. ¿Cuál es la probabilidad de que sean las
dos negras?

13. Al lanzar dos veces un dado ¿Cuál es la probabilidad de que la suma de puntos sea
divisible por tres?
14. Con las cifras 1, 2, 3, 4 y 5 se escriben todos los números posibles de tres cifras, sin
repetir cifras en cada número. si se señala un número al azar:

a) ¿Cuál es la probabilidad de que sea múltiplo de 4?


b) ¿Y de que sea múltiplo de 3?

15. Una caja contiene 8 bolas rojas, 4 azules y 6 verdes. Se extraen 3 bolas al azar y se
desea saber:

a) La probabilidad de que las tres sean rojas.


b) La probabilidad de que dos sean rojas y una verde.
c) La probabilidad de que dos sean azules y la otra de otro color.
d) La probabilidad de que todas sean de distinto color.
e) La probabilidad de que todas sean del mismo color.

16. Se lanza un dado 6 veces. ¿Cuál es la probabilidad de que salga algún 1 en los 6
lanzamientos?

17. Una caja contiene 2 bolas blancas, 3 negras y 4 rojas. Otra contiene 3 blancas, 5
negras y 4 rojas. Se toma una bola al azar de cada caja. ¿Qué probabilidad hay de que
sean del mismo color?
80

18. En una bolsa hay 50 bolas, aparentemente iguales, numeradas del 1 al 50. ¿Qué
probabilidad hay de sacar, una a una, las 50 bolas en el orden natural?

19. La probabilidad de acertar en un blanco de un disparo se estima en 0,2. La


probabilidad de acertar en dos disparos será P1= 0,04; P2= 0,36; P3= 0,12. Determinar
qué respuesta el la correcta.

20. ¿Cuál es la probabilidad de torpedear un barco, si sólo se pueden lanzar tres torpedos
y la probabilidad de impacto de cada uno se estima en un 30 %?.

21. Se considera el experimento aleatorio “lanzar dos veces un dado”. ¿Cuál es la


probabilidad de obtener número par en el segundo lanzamiento condicionado a
obtener impar en el primero? ¿Son dependientes o independientes estos sucesos? ¿Por
qué?
81
PROBABILIDAD CONDICIONAL

Cada suceso aleatorio está asociado con un espacio muestral, su probabilidad depende de
la información de que dispongamos.
Si sabemos que ha ocurrido un suceso B, esta información modifica la probabilidad de los demás
sucesos
Vamos a estudiar como queda modificada la probabilidad de un suceso cuando
disponemos de información adicional de que ha ocurrido otro.

Ejemplo.

"Lanzar dos monedas", cuyo espacio muestral es:

S = {cc, ss, cs, sc} ; La probabilidad de {cc} es 1/4.

Supongamos que salió una cara, entonces la p (cc)=1/2 puesto que el nuevo espacio
muestral queda reducido a S = {cc, cs}.

Cuando el experimento se considera resultado de varios experimentos (como en el caso


anterior), se habla de experimentos compuestos.

Se llama probabilidad condicionada del suceso B respecto del suceso A, y lo denotaremos


por p (B/A), a la probabilidad de que ocurra B, habiendo ocurrido A. Se calcula según la fórmula:

pB A  p(pA(A)B) si p( A)  0

Se llama probabilidad condicionada del suceso A respecto del suceso B, y lo denotaremos


por p (A/B), a la probabilidad de que ocurra A, habiendo ocurrido B. Se calcula según la fórmula:

 B  p(pA(B)B)
pA si p( B)  0

Usando la formula de la probabilidad condicionada, obtenemos:

pA  B  pA   p(B/A) 


  p(A  B) = p(B)  p(A/B) = p(A)  p(B/A)  Regla del Producto
pA  B  pB  p(A/B) 

Si A y B son Eventos Independientes → P(A/B) = P(A) y P (B/A) = P (B) entonces:

P (A∩B) = P(A) x P (B)


82
Ejemplo.

"Lanzar un dado al aire". Calcula la probabilidad de obtener un múltiplo de 3, sabiendo


que ha salido puntuación par.
Sea A = "Salir n° par" = {2, 4,6} P (A) = 3/6 = 1/2
B = "Salir múltiplo de 3" = {3,6} P (B) = 2/6 = 1/3

 
1
p(A  B) 2 1
pB   6 
A p( A ) 1 6 3
2
Pues A  B = "Salir un N° par múltiplo de 3" = {6}

Sucesos Independientes

Diremos que dos sucesos son independientes si la realización de uno no modifica la


probabilidad de realización del otro. Por tanto A y B son independientes si:
P (A/B) = P (A)
P (B/A) = P (B)

Y entonces, por la regla del producto: P ( A  B ) = P(A) P (B)

En caso contrario se dirá que los Sucesos son Dependientes.

Tablas de contingencia y diagramas de árbol

En los problemas de probabilidad y en especial en los de probabilidad condicionada,


resulta interesante y práctico organizar la información en una tabla de contingencia o en un
diagrama de árbol.

Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados, dado
uno de ellos podemos construir el otro. Unas veces, los datos del problema permiten construir
fácilmente uno de ellos y a partir de él podemos construir el otro, que nos ayudará en la
resolución del problema.

Conversión de una tabla en diagrama de árbol

Las tablas de contingencia están referidas a dos características que presentan cada una dos
o más sucesos.
A A TOTAL
B P( A B ) P( A B ) P( B )
B P( A B ) P( A  B ) P( B )
TOTAL P( A ) P( A ) 1
83
En el caso de los sucesos A, A - B y B , expresados en frecuencias absolutas, relativas o
probabilidades la tabla, adopta la forma adjunta.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los
sucesos A y A se les ha asociado los sucesos B y B .

Sobre las ramas del diagrama de árbol se han anotado las probabilidades condicionadas
correspondientes, deducidas de las relaciones análogas a:

PB A  P (PB(A)A)
 Conversión de un diagrama en tabla de contingencia

De manera recíproca, dado el diagrama de árbol podemos construir la tabla de


contingencia equivalente si más que utilizar la expresión.

 A   P ( A)
P( B  A)  P B

Para calcular las probabilidades de las intersecciones de sucesos que forman la tabla.

Ejemplo:

Un taller sabe que por término medio acuden: por la mañana 3 automóviles con problemas
eléctricos, 8 con problemas mecánicos y 3 con problemas de latonería, y por la tarde 2 con
problemas eléctricos, 3 con problemas mecánicos y 1 con problemas de latonería.

a. Calcula el porcentaje de los que acuden por la tarde.


b. Calcula el porcentaje de los que acuden por problemas mecánicos.
c. Calcula la probabilidad de que un automóvil con problemas eléctricos acuda por la
mañana
84
Solución:

En las tablas de contingencia, con las frecuencias absolutas y los porcentajes,


respectivamente, pueden verse recogidos los datos del enunciado.

ELÉCTRICOS MECÁNICOS LATONERÍA TOTAL


MAÑANA 3 8 3 14
TARDE 2 3 1 6
TOTAL 5 11 4 20

ELÉCTRICOS MECÁNICOS LATONERÍA TOTAL


MAÑANA 0.15 0.40 0.15 0.70
TARDE 0.10 0.15 0.05 0.30
TOTAL 0.25 0.55 0.20 1.00

Las respuestas a las interrogantes planteadas basta leerlas en las tabla. Así:

a. El 30% de los automóviles acude al taller por la tarde.


b. El porcentaje de vehículos ingresados con problemas mecánicos es el 55%.
c. La probabilidad buscada es: P (acuda por la mañana/tiene problemas eléctricos) = 3/5 =
0.6

Ejemplos.

1. Consideremos el experimento de "lanzar un dado al aire". Calculemos, por ejemplo, la


probabilidad de obtener un 3 sabiendo que ha salido un número impar:

Definimos los sucesos A = "sacar 3" y B = {1, 3, 5}; entonces, P(A/B) = 1/3 puesto que si
sabemos que ha salido un número impar, los casos posibles ahora son 3 y los casos favorables al
suceso A sólo 1.

2. Se lanzan dos dados:

a. ¿Cuál es la probabilidad de obtener una suma de puntos igual a 7?


b. Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados
haya salido un tres?

Solución:

Sean los sucesos A ="la suma de los puntos es 7" y B ="en alguno de los dados ha salido un tres".

a. Los casos posibles al lanzar dos dados son 36 y los casos favorables al suceso A son los seis
siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1). Por tanto, P( A ) = 6/36 = 1/6
85
b. En este caso, el suceso B/A es salir en algún dado 3, si la suma ha sido 7.

Observamos que esta situación ocurre en las parejas (3,4) y (4,3). Por tanto, P(B/A) = 2/6 = 1/3

3. Se lanza al aire dos dados normales, si la suma de los números que aparecen es de por lo
menos siete, a. determine la probabilidad de que en el segundo dado aparezca el número cuatro,
b. Determine la probabilidad de que ambos números sean pares, c. Determine la probabilidad de
que en el primer dado aparezca el numero dos.
Solución.

El espacio muestral es el mismo que cuando se lanza un dado dos veces y se muestra a
continuación;
S = (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) (1,3) (2,3) (3,3) (4,3) (5,3)
(6,3) (1,4) (2,4) (3,4) (4,4) (5,4) (6,4) (1,5) (2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6)
(6,6)

a. Para calcular una probabilidad condicional es necesario definir los eventos A y B, siendo
estos:
A = Evento de que en el segundo dado aparezca el número cuatro,
B = Evento de que la suma de los números que aparecen sea de por lo menos siete, (que es que es
el evento que está condicionando)
B = 21 elementos, los que suman siete o más
B = (6,1) (5,2) (6,2) (4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = 6 elementos, los que en el segundo dado aparece el cuatro
A = (1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
Luego, AB = (3,4) (4,4) (5,4) (6,4), AB= 4 elementos
Por tanto; P(A/B) = PAB/ PB= 4/21 = 0.19048

b. B = Evento de que la suma de los números que aparecen sea de por lo menos siete
B = Conocemos de la parte a que el Evento consta de 21 elementos
A = Evento de que ambos números sean pares
A = (2,2) (4,2) (6,2) (2,4) (4,4) (6,4) (2,6) (4,6) (6,6)
AB = (6,2) (4,4) (6,4) (2,6) (4,6) (6,6)
AB= 6 elementos
p(A/B) = PAB/ PB = 6/ 21 = 0.28571
86
c. B = Evento de que la suma de los números que aparecen sea de por lo menos siete
B = (6,1) (5,2) (6,2) (4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4) (2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6)
(3,6) (4,6) (5,6) (6,6)
A = Evento de que en el primer dado aparezca el número dos
A = (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
AB = (2,5),(2,6, AB= 2 elementos
P(A/B) = PAB/PB = 2/21 = 0.04762 OJO

4. Se seleccionan al azar dos números de entre los números del 1 al 9, si la suma de los números
que aparecen es par, a. Determine la probabilidad de que ambos números sean pares, b.
Determine la probabilidad de que ambos números sean impares.
Solución:

S = (1,2) (1,3) (2,3) (1,4) (2,4) (3,4) (1,5) (2,5) (3,5) (4,5) (1,6) (2,6) (3,6) (4,6) (5,6) (1,7) (2,7)
(3,7) (4,7) (5,7) (6,7)(1,8) (2,8) (3,8) (4,8) (5,8) (6,8) (7,8)(1,9) (2,9) (3,9) (4,9) (5,9) (6,9)
(7,9) (8,9)

a. E = Evento de que la suma de los números que se seleccionan sea par


E = (1,3) (2,4) (1,5) (3,5) (2,6) (4,6)(1,3) (3,7) (5,7)(2,8) (4,8) (6,8)
(1,9) (3,9) (5,9) (7,9)
E = 16 elementos 
A = Evento de que ambos números sean pares
A = (2,4) (2,6) (4,6) (2,8) (4,8) (6,8)
A = 6 elementos
AE = (2,4) (2,6) (4,6) (2,8) (4,8) (6,8)
AE = 6 elementos, p(A/E) = PAE/ PE= 6/16 = 0.375

b. E = Evento de que la suma de los números seleccionados es par


E = (1,3) (2,4) (1,5) (3,5)(2,6) (4,6)(1,3) (3,7) (5,7)(2,8) (4,8) (6,8)(1,9) (3,9) (5,9) (7,9)
A = Evento de que ambos números sean impares
A = (1,3) (1,5) (3,5)(1,7) (3,7) (5,7)(1,9) (3,9) (5,9) (7,9)
A = 10 elementos
AE = (1,3) (1,5) (3,5) (1,7) (3,7) (5,7)(1,9) (3,9) (5,9) (7,9)
AE= 10 elementos; p(A/E)= PAE/ PE= 10/16 = 0.625
87
5. Una pareja de recién casados ha decidido formar una familia de solo tres hijos, a. ¿Cual es la
probabilidad de que tenga puros hijos varones?, b. ¿cuál es la probabilidad de que tenga como
máximo un hijo varón, c. ¿cuál es la probabilidad de que su segundo hijo sea varón, d. Si esta
familia tiene por lo menos una hija, ¿cuál es la probabilidad de que el segundo hijo sea varón?, e.
Si esta familia tiene como máximo un hijo varón, ¿cuál es la probabilidad de que tenga puras
hijas?
Solución:

Lo primero que hay que obtener para resolver este problema es el espacio muestral, para
lo cual nos podemos ayudar con un diagrama de árbol en donde representemos uno tras otro el
nacimiento de cada uno de sus hijos, en donde solo consideraremos partos de un solo bebé, no
múltiples y se considera que existe la misma probabilidad de que nazca un varón o una niña.
El espacio muestral obtenido es:
H = Niño
M = Niña
S = HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM

a. A = Evento de que la familia tenga puros hijos varones


A = HHH
P(A) = 1/8 = 0.125

b. B = Evento de que la familia tenga como máximo un hijo varón


B = ningún hijo varón o un hijo varón= MMM, HMM, MHM, MMH
P(B) = 4/8 = 1/2 =0.5

c. C = Evento de que el segundo hijo de la familia sea varón


C = HHH, HHM, MHH, MHM 
P(C) = 4/8 =1/2 = 0.5

d. Como en este caso se trata de calcular una probabilidad de tipo condicional, se requiere definir
dos eventos, el evento E que es el que condiciona y el evento A;
E = Evento de que la familia tenga por lo menos una hija
E = tenga una o más hijas
E = HHM, HMH, MHH, HMM, MHM, MMH, MMM= 7 elementos
A = Evento de que el segundo hijo sea varón
A =  HHH, HHM, MHH, MHM 
AE =  HHM, MHH, MHM = 3 elementos
Luego:
88
P(A/E) = PAE/PE= 3/7 = 0.42857

e. E = Evento de que la familia tenga como máximo un hijo varón


A = Evento de que la familia tenga puras hijas
E = MMM, MHM, MMH, HMM= 4 elementos
A = MMM
AE = MMM = 1 elemento
P(A/E) = AE/E= 1/4 = 0.25

6. Según las estadísticas, la probabilidad de que un auto que llega a cierta gasolinera cargue
gasolina es de 0.79, mientras que la probabilidad de que ponga aceite al motor es de 0.11 y la
probabilidad de que ponga gasolina y aceite al motor es de 0.06, a. Sí un auto carga gasolina,
¿cuál es la probabilidad de que ponga aceite?, b. Sí un auto pone aceite al motor, ¿cuál es la
probabilidad de que ponga gasolina?
Solución:

a. E = Evento de que un auto cargue gasolina


P(E) = 0.79
A = Evento de que un auto ponga aceite al motor
P(A) = 0.11
AE = Evento de que un auto ponga gasolina y aceite
P(AE) = 0.06

P(A/E) = P(AE)/P(E) = 0.06/ 0.79 = 0.07594

b. E = Evento de que un auto ponga aceite al motor


P(E) = 0.11
A = Evento de que un auto ponga gasolina
P(A) = 0.79
AE = Evento de que un auto ponga aceite al motor y ponga gasolina
P(AE) = 0.06

P(A/E) = P(AE)/ P(E) = 0.06/0.11 = 0.5454


89
Partición de un Espacio Muestral S

Para que los eventos A1, A2, A3,….An, Sean una partición deben cumplir con:
a) A1, A2, A3,……An...Ai ≠ 0.
b) A1∩ A2∩ A3∩……∩An = Ф.
c) A1 A2 A3……An  S.

-Formula o Teorema de las probabilidades Totales:

B  (A 1  B)  (A 2  B)  (A 3  B)  .............  (A n  B)
P(B)  P (A 1  B)  P(A 2  B)  P(A 3  B)  .............  P(A n  B) .
n
P(B)   P(A i  B)
i 1

p(B)  p(A1 )  p(B / A1 )  p(A 2 )  p(B / A 2 )  ..................  p(A n )  p(B / A n )

Ejemplos
1. En un curso de Matemáticas el 30% son Varones, el 45% de los varones y el 20% de las
hembras son de Carabobo.
a) ¿Cual es la probabilidad de que un estudiante seleccionado al azar sea de Carabobo?
Solución:

Sea: los eventos siguientes:


A1 = {El estudiante seleccionado es Varón}
A2 = {El estudiante seleccionado es hembra}
B = {El estudiante seleccionado es de Carabobo}
P (A1) = 0, 3 P (A2) = 0.7 P (B/A1) = 0, 45 P (B/A2) = 0, 2

P (B) = P (B/A1) P (A1) + P (B/A2) P (A2) = 0, 45.0, 3 + 0, 2.0, 7 = 0,275


90
2 Dos candidatos a la presidencia de de un club social, compiten por el control del club, la
probabilidad de ganar estos candidatos es 0,7 y 0,3 respectivamente, si el primer candidato gana,
la probabilidad de introducir cambios en los estatutos es de0, 8, si gana el segundo candidato esta
probabilidad es de 0,4¿determine la probabilidad de que se introduzca cambios en los estatutos?
Solución:

Sea: los eventos siguientes:


A1 = {El Primer candidato gana las elecciones}
A2 = {El segundo candidato gana las elecciones}
B = {Se introducen cambios en los estatutos}
P (A1) = 0, 7 P (A2) = 0.3 P (B/A1) = 0, 8 P (B/A2) = 0, 4

P (B) = P (B/A1) P (A1) + P (B/A2) P (A2) = 0, 8 x 0, 7 + 0, 4 x 0, 3 = 0, 68

3. En cierta fabrica un articulo es producido por tres maquinas, una semiautomática y dos
manuales, se sabe que la automática produce el doble de artículos que las otras dos, y que estas
producen la misma cantidad de artículos (en un periodo de producción dado). Además se sabe
que el 3% de los artículos producidos por la maquina semiautomática es defectuoso y el 4% de lo
producido por las otras 2 maquinas también lo son.
Si se selecciona al azar un artículo producido en la fábrica calcular:
a) la probabilidad de que el artículo seleccionado sea defectuoso.
Solución.

A1= {El articulo seleccionado es producido en la maquina semiautomática}


A2= {El articulo seleccionado es producido en la 1ra maquina manual}
A3= {El articulo seleccionado es producido en la 2da maquina manual}
B = {El articulo es defectuoso}

P(A1) = 2[P(A2) + P(A3)] ; P(A2) = P(A3) → P(A1) + P(A2) + P(A3) = 1


2[P(A2) + P(A3)] + P(A2) + P(A3) = 1 → 6P(A3) = 1 → P(A3) = 1/6
P(A2) = 1/6 ; P(A1) = 4/6 ; P(B/A1) = 0,03 ; P(B/A2) = 0,04 ; P(B/A3) = 0,04
P(B) = 0,03 x 0,66 + 0,04 x 0,16 + 0,04 x 0,16 = 0,0326

- Fórmula o Teorema de Bayes

P (Aj/B) = P (Aj) P (B/Aj) / P (B)


P (Aj/B) = P (Aj) P (B/Aj) / Σ P (Ai) P (B/Ai)
P (Ai) probabilidades a priori
P (Aj/B) probabilidades a posteriori
91
Las dos últimas fórmulas son especialmente útiles cuando se dan las circunstancias
- El experimento aleatorio se produce en dos etapas.
- Es sencillo encontrar una partición en el espacio muestral correspondiente a los resultados del
primer experimento.
- Son conocidas o se calculan fácilmente P (Ai)
- Son conocidas o se calculan fácilmente P (B/Ai)

Ejemplos:
1. En el ejemplo anterior # 1 de probabilidad Total
Si el estudiante seleccionado es de Carabobo ¿Cuál es la Probabilidad de que sea hembra?

P(B / A 2 )  P(A 2 ) 0,27  0,7


P (A2/B) =    0,509
P(B) 0,0326

2. En el ejemplo # 3 de probabilidad total


Si el articulo seleccionado es defectuoso, cual es la probabilidad de que haya sido producido por
la maquina semiautomática

P(B / A 3 )  P(A 3 ) 0,04  0,16


P (A3/B) =    0,02327
P(B) 0,275

Problemas Propuestos de Probabilidad Condicional y Probabilidad Total

1.La probabilidad de que un auto de carreras cargue gasolina en cierto circuito en la primera
media hora de recorrido es de 0.58, la probabilidad de que cambie de neumáticos en esa primera
media hora de recorrido es de 0.16, la probabilidad de que cargue gasolina y cambie de
neumáticos en la primera media hora de recorrido es de 0.05, a. ¿Cuál es la probabilidad de que
cargue gasolina o cambie de neumáticos en la primera media hora de recorrido?, b. ¿cuál es la
probabilidad de que no cargue combustible y de neumáticos en la primera media hora de
recorrido, c. Si el auto cambia de neumáticos en la primera media hora de recorrido, ¿cuál es la
probabilidad de que cargue combustible también?, d. Si el auto carga combustible en la primera
media hora de recorrido, ¿cuál es la probabilidad de que cambie de neumáticos también?

2. Se tiene tres cajas de igual aspecto. En la primera hay 3 bolas blancas y 4 negras; en la segunda
hay 5 negras y en la tercera hay 2 blancas y 3 negras. Se desea saber:
92
a) Si se extrae una bola de una caja, elegida al azar, cuál es la probabilidad de que la bola
extraída sea negra.
b) Se ha extraído una bola negra de una de las cajas. ¿Cuál es la probabilidad de que haya sido
extraída de la 2ª caja?

3. En una población animal hay epidemia. El 10 % de los machos y el 18 % de las hembras están
enfermos. Se sabe además que hay doble número de hembras que de machos y se pide:

a) Elegido al azar un individuo de esa población ¿Cuál es la probabilidad de que esté


enfermo?
b) Un individuo de esa población se sabe que está enfermo ¿Qué probabilidad hay de que el
citado individuo sea macho?

4. Se consideran dos cajas con bolas. La caja 1 contiene 3 bolas rojas y 2 azules, la caja 2
contiene 2 bolas rojas y 8 azules. Se lanza una moneda, si se obtiene cara se saca una bola de la
caja 1, y si se obtiene cruz se saca una bola de la caja 2.
(a) Hallar la probabilidad que la bola extraída sea roja.
(b) Si se sabe que la bola extraída es roja, ¿Cuál es la probabilidad que provenga de la caja 1?

5. De una caja que contiene 3 bolas rojas y 2 azules se extrae una bola al azar y se la coloca en
una segunda caja que contiene 4 bolas azules y 2 rojas. A continuación se extrae una bola al azar
de la segunda caja.
(a) ¿Cuál es la probabilidad de que se extraiga la misma bola que se extrajo de la primera caja?
(b) ¿Cuál es la probabilidad de que la bola extraída de la segunda caja sea roja?
(c) Si la bola extraída de la segunda caja es roja, ¿cuál es la probabilidad de que sea la misma
bola que se extrajo de la primera caja?

6. Tenemos una caja con 10 tornillos, de estos 8 son buenos y 2 son defectuosos. Se extraen dos
tornillos de la caja. Se pide:
(a) Calcular la probabilidad de que la segunda extracción sea un tornillo bueno, sabiendo que la
primera extracción ha sido un tornillo bueno.(sin reemplazo).
(b) Calcular la probabilidad de que la segunda extracción sea un tornillo bueno, sabiendo que la
primera extracción ha sido un tornillo bueno (con reemplazo).

7. Tres máquinas denominadas A, B y C, producen un 43%, 26% y 31% de la producción total de


93
una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6% del producto
manufacturado por estas máquinas es defectuoso, a. Se selecciona un producto al azar y se
encuentra que es defectuoso, ¿cuál es la probabilidad de que el producto haya sido fabricado en
la máquina B?, b. Si el producto seleccionado resulta que no es defectuoso, ¿cuál es la
probabilidad de que haya sido fabricado en la máquina C?

8. Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera de tres hoteles
de la ciudad; Palacio del Puerto, El Palito o Fiesta Mar, en una proporción de 18.5%, 32% y
49.5% respectivamente, de los cuales se ha tenido información de que se les ha dado un mal
servicio en un 2.8%, 1% y 4% respectivamente, a. Si se selecciona a un visitante al azar ¿cuál es
la probabilidad de que no se le haya dado un mal servicio?,b. Si se selecciona a un visitante al
azar y se encuentra que el no se quejó del servicio prestado, ¿cuál es la probabilidad de que se
haya hospedado en el Palacio del Puerto?, c. Si el visitante seleccionado se quejó del servicio
prestado, ¿cuál es la probabilidad de que se haya hospedado en e hotel Fiesta Mar?

9. La probabilidad de que un artículo provenga de una fábrica A1 es 0,7, y la probabilidad de que


provenga de otra A2 es 0,3. Se sabe que la fábrica A1 produce un 4 por mil de artículos
defectuosos y la A2 un 8 por mil.
a) Se observa un artículo y se ve que está defectuoso. ¿Cuál es la probabilidad de que provenga
de la fábrica A2?
b) Se pide un artículo a una de las dos fábricas, elegida al azar. ¿Cuál es la probabilidad de que
esté defectuoso?
c) Se piden 5 artículos a la fábrica A1 ¿Cuál es la probabilidad de que haya alguno defectuoso?

10. En una fábrica de televisores las máquinas I, II y III producen respectivamente el 28%, el
32% y el 40% del total. En la producción de cada máquina el 3%, 4% y el 5% son televisores
defectuosos. Se toma al azar un televisor de la producción total y se le encuentra defectuoso
¿Cuales son las probabilidades que haya sido producido por:
(a) La máquina I, (b) la máquina II, (c) la máquina III

11. En un país hay cuatro partidos políticos que se dividen la opinión pública. Se sabe que:
El 35% de la población adhiere al partido I
El 31% adhiere al partido II
El 28% adhiere al partido III
94
El 6% adhiere al partido IV.
Entre los adherentes al partido I, un 36% corresponde a personas con ingresos inferiores a dos
salarios mínimos Entre los adherentes al partido II, esa proporción es del 52% Para el partido III,
es un 42% Para el partido IV, 11%. Si se elige una persona al azar y resulta tener ingresos
inferiores a dos salarios mínimos. Calcular la probabilidad de que sea un adherente al partido I; al
partido II; al partido III y al partido IV.

12. Supongamos que en un país un 40% de los ciudadanos habilitados para votar es adherente al
partido A, un 35% al partido B y un 25% al partido C. Se realiza de manera simultánea una
elección interna en los tres partidos, pero como no se requiere acreditar la adhesión a cada
partido, el voto "extrapartidario" es posible: un votante de un partido puede, si quiere, participar
en la interna de otro partido. Supongamos que Ud. sabe que:
Entre los adherentes de A, un 10% votó en la elección interna de otro partido
Entre los adherentes de B, un 15% votó en la interna de A
Entre los adherentes de C, un 5% votó en la interna de A

(a) ¿Cuál fue el porcentaje de votos obtenidos por el partido A en las internas?

(b) Si se elige al azar una persona dentro de todas las que en las votaron a A
i. ¿cuál es la probabilidad que sea un adherente de B?
ii. ¿cuál es la probabilidad que sea un adherente de C?

13. Un libro tiene 3 capítulos. El 85% de las páginas del 1er capítulo no tiene ningún error. El
90% del segundo y el 95% del tercero tampoco tienen ningún error. El primer capítulo tiene 125
páginas, el 2º 150 y el 3º 175.
(a) ¿Cuál es la probabilidad de que al elegir una página al azar no tenga ningún error?
(b) ¿Supongamos que elegimos una página al azar y observamos que no tiene ningún error ¿cuál
es la probabilidad de que sea del capítulo 2º?
95
Variable Aleatoria

Definición de Variable Aleatoria (V.A.): Se dice que hemos definido una variable
aleatoria para un experimento aleatorio cuando hemos asociado un valor numérico a cada
resultado del experimento.
Sea E el espacio muestral asociado a un experimento. Se llama variable aleatoria a toda
aplicación del espacio muestral E en el conjunto de los números reales (es decir, asocia a cada
elemento de E un número real).
Se utilizan letras mayúsculas X, Y,... para designar variables aleatorias, y las respectivas
minúsculas (x, y,...) para designar valores concretos de las mismas.
Si un experimento con espacio muestral E, tiene asociada la variable aleatoria X, es
natural que se planteen preguntas como: ¿Cuál es la probabilidad de que X tome un determinado
valor?, esto nos lleva a establecer, por convenio, la siguiente notación:
(X = x); representa el suceso "la variable aleatoria X toma el valor x"
P (X = x); representa "la probabilidad de dicho suceso".
(X < x); representa el suceso "la variable aleatoria X toma un valor menor a x"
P (X < x); representa "la probabilidad de que la v.a. X tome un valor menor a x".
(X x); representa el suceso "la variable aleatoria X toma un valor menor o igual a x"
P (X x); representa "la probabilidad de que la v.a. X tome un valor menor o igual a x".

Ejemplos

1. Sea X, la variable aleatoria que representa el numero de puntos obtenidos al lanzar un dado dos
veces.
E = Lanzar un dado dos veces ; X = El numero de puntos obtenidos al lanzar un dado dos
veces.
S = {(1,1)(2,1)(3,1)(4,1).......(1,2)(2,1)......(1,3)(2,3).....(1,4)(2,4)....(1,5).......(6,6)}
(1,1)  2 ; (1,2)  3 ; (6,6)  12  Número de puntos obtenidos

2. Sea el experimento lanzar una moneda 3 veces, sea X: la variable que representa el número de
caras obtenidas en el experimento.
E = lanzar una moneda 3 veces. ; X = Numero de caras obtenidas al lanzar una moneda 3 veces.
(c,c,c)  3 ; (c,c,s)  2 ; (c,s,s)  1 ; (s,s,s)  0  Número de caras obtenidas

Rango de una Variable Aleatoria (Rx).

Es el conjunto de números reales que puede tomar la Variable, en el caso de los ejemplos
anteriores, Tenemos:
Rx de 1 = {2, 3, 4,5,..........12} Rx de 2 = {0, 1, 2,3}
96
Clasificación de las variables aleatorias

Según la amplitud del campo de variación de la función podemos distinguir: variables


aleatorias discretas y variables aleatorias continuas. De la misma forma que en estadística
descriptiva, una variable aleatoria es discreta si toma valores en un conjunto finito o infinito
numerable. Y una variable aleatoria es continua si puede tomar valores en un conjunto infinito no
numerable. Como ejemplo típico de variable aleatoria discreta tenemos la distribución binomial,
y como ejemplo típico de variable aleatoria continua vamos a ver ahora la distribución normal.

Ejemplos

1. Consideremos el experimento aleatorio que consiste en lanzar tres monedas, supongamos que a
cada elemento de su Espacio Muestral S = {ccc, ccs, csc, scc, css, scs, ssc, sss} le asignamos un
número real, el correspondiente al número de caras (discreta).
Esta correspondencia que acabamos de construir es una función del espacio muestral S en el
conjunto de los números reales R. A esta función la llamaremos Variable Aleatoria y la
denotaremos por X.

Supongamos el experimento aleatorio que consiste en lanzar dos dados, podemos asignar
a cada resultado la suma de los puntos aparecidos en cada dado (discreta).
Consideremos el experimento que consiste en elegir al azar 500 personas y medir su
estatura. La ley que asocia a cada persona con su talla es una variable aleatoria (continua).
Consideremos el experimento que consiste en elegir al azar 100 Tomates de una
plantación y pesarlas. La ley que asocia a cada tomate su peso es una variable aleatoria
(continua).

VARIABLES ALEATORIAS DISCRETAS

Si una variable aleatoria sólo toma valores enteros, es decir, un número finito de valores o
infinito numerable diremos que es discreta.
97
Función de Probabilidad f(x)
Consideremos una V.A. discreta X, que toma los valores x1, x2,..., xn. Supongamos que
conocemos la probabilidad de que la variable X tome dichos valores, es decir, se conoce que:
P(X = x1) = P1, P(X = x2) = P2, P(X = x3) = P3,..., P(X = x1) = Pn, en general P(X = xi) = Pi
La función de probabilidad f(x) de la v.a. X es la función que asigna a cada valor xi de la
variable (rango de la variable) su correspondiente probabilidad Pi.

f :R  R I . Pi  0, i  1,2,....,n
n
x  f ( x)  P( X  x) II . P
i 1
i 1

La representación gráfica más usual de la función de probabilidad es un diagrama de


barras no acumulativo.

Función de Distribución F(x)


En muchas ocasiones no nos interesa tanto conocer la probabilidad de que la v.a. X tome
exactamente un determinado valor xi, cuanto la probabilidad de que tome valores menores o
iguales que un cierto valor xi. En tales casos es necesario acumular los distintos valores de la
función de probabilidad hasta el valor deseado. Se trata de una nueva aplicación llamada función
de distribución.
Sea X una variable aleatoria discreta, cuyos valores se suponen ordenados de menor a
mayor. Se llama función de distribución de la variable X, y se simboliza por F(x), a la función
F :R  R
x  F ( x)  P( X  x)
Es decir, asocia a cada valor de la v.a. discreta la probabilidad acumulada hasta ese valor
(la Probabilidad de que la v.a. tome valores menores o iguales a xi).
98
Propiedades:
F(x) es una probabilidad: 0 ≤ F(x) ≤1
F(x) = 0 para todo X < xi
F(x) =1 para todo X ≥ xn
Es constante en cada intervalo [xi,xi+1)
Es continua por la derecha de cada punto
Es creciente
P(a < X ≤ b) = F (b) – F (a)
Podemos expresar la función de distribución de la siguiente forma:

Si una va. X tiene como funcion de probabilidad


X X 1 X 2 .................. X n
____________________________________
f ( x )  P( X  x ) P1 P2 .................. Pn
su funcion de distribucion es :
0 si x  x i
P si x 1  xx 2
 1

P1  P si x 2  xx 3
F( X )  

P  P  .........P si x n 1  xx n
n 1
 1 2


1 si x  x n

Su representación gráfica tiene forma escalonada, siendo los saltos coincidentes con las
probabilidades Pi, correspondientes a los valores xi de la variable X.
99
Ejercicios.

1. Sea X la Variable Aleatoria que representa el número de caras obtenidas al lanzar una moneda
tres veces. Determinar:
a) Función de Probabilidad y su grafica.
b) Probabilidad de obtener a lo máximo 2 caras.
c) Probabilidad de obtener entre 1 y 3 caras.
d) Si se obtiene como mínimo 1 cara, ¿cuál es la probabilidad de obtener como máximo 3
caras?
Solución

E = lanzar una moneda 3 veces. ; x = nº de caras obtenidas

Rx = {0,1,2,3} ; S = {(c,c,c) (c,c,s) (c,s,c) (c,s,s) (s,c,c) (s,c,s) (s,s,c)(s,s,s)}

a) P(x)
X 0 1 2 3
P(x) 1/8 3/8 3/8 1/8

Grafica:
Y

3/8

1/8

0 1 2 3 x
X 2
1 3 3 7
b) P(X 2) =  P( x)  P(0)  P(1)  P(2)  8  8  8  8
X 0
X 3
3 3 1 7
c) P(1 X 3) =  P( x)  P(1)  P(2)  P(3)  8  8  8  8
X 1

 
7
P( X  3  X  1)
d) P X  3   8 1
X 1 P( X  1) 7
8

2. La venta de cierto articulo (en miles de unidades) es una variable aleatoria con la siguiente
función de probabilidad, P(X) = ax + a ; x = 0,1, 2,3. Determinar:
100
a) La probabilidad de que se vendan más de mil artículos y no más de tres mil.
b) Probabilidad de que se vendan a lo sumo mil artículos.
c) Grafique P(x).
Solución.

P (0) = a ; P (1) = 2a ; P (2) = 3a ; P (3) = 4a


3
1
 P(x)  1  a  2a  3a  4a  1  10a  1  a  10
X 0

x 0 1 2 3
P(x) 1/10 1/5 3/10 2/5

X 3
3 2 7
a) P(1 x 3) = P(2 x 3) =  P( x)  P(2)  P(3)  10  5  10
X 2
X 1
1 1 3
b) P(x  1) =  P( x)  P(0)  P(1)  10  5  10
X 0

c) Grafica
y
2/5
3/10
1/5
1/10
0 1 2 3 x

3. Se lanza un dado 2 veces, Determinar:


a) Función de probabilidad del número de puntos obtenidos.
b) La probabilidad de obtener no más de 5 puntos.
c) Probabilidad de obtener mas de 7 puntos pero no mas de 11

Solución. a)

X 2 3 4 5 6 7 8 9 10 11 12
P(X) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

X 5
1 2 3 4 10
b) P(x  5) =  P( x)  P(2)  P(3)  P(4)  P(5)  36  36  36  36  36
X 2

X 11
5 4 3 2 14
c) P (7 x  11) =  P( x)  P(8)  P(9)  P(10)  P(11)  36  36  36  36  36
X 8
101
Parámetros de una Variable Aleatoria Discreta.

n
a) Esperanza Matemática o Valor Esperado E( x )   x i  p i (Media)
i 1

n
b) Varianza V( x )   x i p i  E( x )  E( x 2 )  E( x ) ; Desviación Típica:   V( x )
2 2 2

i 1

Tanto la varianza como la desviación típica son medidas de dispersión, de tal manera que
cuanto menores son estos dos parámetros más agrupados se encuentran los valores de la
distribución entorno a los valores centrales. Por el contrario, para valores grandes de la varianza o
la desviación típica los datos de la distribución se encuentran muy dispersos.
Ejemplos:

1º Un juego consiste en lanzar dos dados. Si la suma de sus caras es mayor o igual a 10 se gana
300 Bolívares, si está comprendida entre 7 y 9 se ganan 100 Bolívares. Para cualquier otro
resultado no se gana nada. ¿Cuál debería ser el precio de la apuesta para que la ganancia esperada
de la banca sea de 50 Bolívares?
Solución

El espacio muestral para el problema es E = {(1,1), (1,2), (1,3),..., (6,6)} con 36 puntos
muestrales. Todos los sucesos elementales tiene la misma probabilidad 1/36.
Se define la v.a. X: suma de las dos caras.
Esta variable puede tomar los valores 2, 3, 4,....,12. El espacio Muestral y la tabla con la P(x) es:

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)


(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
S = (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Definiendo H(x) como la función premio tenemos:

X 2 3 4 5 6 7 8 9 10 11 12
P(x) 1/36 2/36 3/36 3/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
H(x) 0 0 0 0 0 100 100 100 300 300 300
102
Por lo tanto el valor esperado del premio es:

12
6 5 4 3 2 1
E ( h )   h ( x )f ( x )  100  100  100  300  300  300  91,7
x 2 36 36 36 36 36 36

En consecuencia, la apuesta debería costar 91,7 + 50 = 141,7 para que la ganancia esperada de la
banca sea 50 Bolívares.

2º La siguiente tabla muestra la f(x) para la variable X: número de personas por día que solicitan
un tratamiento innecesario en el servicio de urgencias de un pequeño hospital.

x 0 1 2 3 4 5
f(x) 0,01 0,1 0,3 0,4 0,1 ?

a. Encontrar f (5)
b. Construir F(x)
c. Encontrar P(x  2)
d. Encontrar P(x < 2)
e. Encontrar P(x > 3)
f. Calcular la media y la varianza

Solución
a). Por la construcción de las f(x) es obvio que

 f (x )  1.
x
Para que se cumpla esta condición es necesario que f (5)=0,09

b).
X 0 1 2 3 4 5
f(x) 0,01 0,1 0,3 0,4 0,1 0,09
F(x) 0,01 0,11 0,41 0,81 0,91 1

c). P(x  2) = F(2) = 0,41

d). P(x < 2) = P(x  1) = F(1)=0,11

e). P(x > 3) = 1 - P(x  3) = 1- F(3) = 1 - 0,81 = 0,19


103
5
f). E ( x )   xf ( x )  0x 0.01  1x 0.1  2x 0.3  3x 0.4  4x 0.1  5x 0.09  2,75
x 0

V(x)  E(x 2 )  E(x)


2

5
E( x 2 )   X 2 f ( x )  0 2  0.01 12  0.1  2 2  0.3  32  0.4  4 2  0.1  5 2  0.09  8.75
x 0

V(x)  8.75  (2.75) 2  1.1875

3º Se desarrolla un compuesto para aliviar cierta enfermedad. El fabricante afirma que es efectivo
en un 90% de los casos. Se prueba en 4 pacientes. Sea x el número de pacientes que tienen alivio.

a. Encontrar la f(x) para x, suponiendo que la afirmación del fabricante sea correcta.
b. Encontrar P(x  1)
c. Si el compuesto no alivia a ninguno de los pacientes ¿es esa una razón para poner en duda la
eficacia afirmada por el fabricante? Razonar sobre la base de la probabilidad implicada.
d. Calcular la media. ¿Qué significa en este ejemplo?

Solución
a. Si a representa que un paciente tenga alivio y n que no lo tenga, el espacio muestral para el
problema es E = {aaaa, naaa, anaa, aana, aaan,..., nnnn}(ver en diagrama de árbol), Si es cierta
la afirmación del fabricante P(a) = 0,9 y p(n) = 0,1
La V.A. x: número de pacientes que tienen alivio puede tomar los valores 0, 1, 2, 3, 4. La tabla
con la f(x) inducida es

x 0 1 2 3 4
f(x) 0.0001 0.0036 0.0486 0.2916 0.6561

P(x  1) = f (0) + f (1) = 0,14 + 4 x 0, 9 x 0, 13 = 0,0037


La probabilidad de que no alivie a ningún paciente es f (0) = 0,0001. Es una probabilidad tan baja
que, efectivamente, si ese fuera el resultado hay suficientes razones para poner en duda la
afirmación de que alivia al 90% de los pacientes.

E(x)   xf (x)  0x(0.1) 4  1x 4x(0.1) 3 x0.9  2x6x(0.1) 2 x(0.9) 2  3x 4x0.1x(0.9) 3  4x(0.9) 4  3.6
x

Si se repitiera un número suficientemente grande de veces la experiencia de administrar el


fármaco a 4 pacientes, el número promedio de pacientes que experimentarían alivio sería 3,6.

4º. El beneficio obtenido en un negocio es una variable aleatoria x (en millones de bolívares) con
la siguiente función de probabilidad.
104
x -1 0 1 2
P(x) 0.2 0.15 0.5 0.15
Determine:
a) El Beneficio Promedio.
b) El Valor más Probable.
c) La Mediana del Beneficio.
d) Si la inversión en el negocio es la mitad del beneficio, ¿cuál es la inversión promedio del
negocio?
e) Fractil punto 85.

Solución.

X = beneficio obtenido en el negocio.

2
a) E(x) =  X  P( x)  (1)(0.20)  (0)(0.15)  (1)(0.50)  (2)(0.15)  0.6 Millones de Bs .
X  1

b) Moda: como P(1) es máxima, la moda es x = 1Millon de Bs. El beneficio mas probable
es de x = 1 millón.

c) Mediana: P(x  me) = 0.50  P(-1) = 0.20  0.50; P(-1) + P(0) = 0.20 + 0.15 = 0.35  0.50
P(-1) + P(0) + P(1) = 0.35 + 0.5 = 0.85  0.50, por tanto la mediana se encuentra ubicada
entre x = 0 Millones y x = 1 millón de Bs.

d) y = Inversión Promedio  E (y) = Desconocida; y = x/2  E(x/2) = E(x)/2 0.6/2 = 0.3


millones de Bs. la cual es la inversión promedio del negocio.

x (0.85)  P (Xx (0.85)) = 0.85)  P (-1)+P (0)+P (1) = 0.85, El fractil (0.85) es x = 1 millón
de Bs.

VARIABLES ALEATORIAS CONTINUAS

Una variable aleatoria es continua si puede tomar valores en un conjunto infinito no


numerable. Como hemos visto hay variables aleatorias que pueden tomar cualquier valor de un
intervalo real de la forma (a, b), (a, +∞), (-∞, b), (-∞, +∞) o uniones de ellos. A las variables de
este tipo se las denomina variables aleatorias continuas.
Ejemplos

1. Pretendemos observar la altura de un grupo de personas y vamos a seleccionar a una persona


105
de forma totalmente aleatoria. La probabilidad de que la altura de esa persona sea exactamente
1,62894635 Mt. es cero. Pero la probabilidad de que la altura de esa persona esté entre 1,62 Mt. y
1,63 Mt. tendrá un valor concreto y casi con certeza que será mayor que la probabilidad de que
esté entre 2,10 Mts. y 2,11 Mts. Por tanto, la densidad de probabilidad en el entorno de 1,625 Mt.
es mayor que la densidad de probabilidad en el entorno de 2,105 Mt. Sin embargo, que el valor
exacto 1,62894635 tenga probabilidad cero de ocurrir no implica que sea imposible que ocurra.
De hecho, cualquier persona que seleccionemos tendrá una altura concreta y exacta que tenía
probabilidad cero de suceder.

2. Sea X la v.a. que describe la duración de los neumáticos de una determinada marca y modelo.
Los valores de una variable estadística continua siempre se consideran agrupados en intervalos de
clase, luego no tiene sentido plantearse la probabilidad de resultados "aislados" (como, por
ejemplo, la probabilidad de que un neumático dure, exactamente, 56.000 Km., 235 Mt., 47 Cm. y
6 Mm.). En todo caso, esas probabilidades deben valer cero. Pero sí podemos preguntarnos, por
ejemplo, ¿cuál es la probabilidad de que un neumático dure menos de 50.000 Km? o ¿cuál es la
probabilidad de que un neumático dure entre 60.000 y 70.000 Km?

Tanto en el ejemplo 1 como en el 2 si queremos hallar esas probabilidades tendremos que


recurrir a métodos empíricos y usar técnicas estadísticas: tomar una muestra, examinar y anotar
las frecuencias observadas. Entonces tomaremos como valor de la probabilidad de un suceso s 1 la
frecuencia observada de éste: p (s1) = fr (s1).

Y así podemos construir un histograma de frecuencias relativas y un histograma de


frecuencias relativas acumuladas. En el primero, la fr (X ≤ x) será la suma de las frecuencias de
todas las clases anteriores a x; lo que, geométricamente, es el área bajo la curva de frecuencias
entre el inicio de la gráfica y el valor x. La obtención de fr(X ≤ x) en la segunda gráfica es más
rápido pues, fr (X ≤ x) es la frecuencia acumulada del valor x y se lee directamente de la
gráfica.
A partir de una situación real con densidades de frecuencias se crea un modelo teórico con
asignación de probabilidades.

Sea X una variable aleatoria continua que toma valores en un intervalo [a, b]. Si
procedemos a dividir el intervalo cada vez en más partes el polígono de frecuencias relativas
(densidades de frecuencias) se va aproximando a una curva con un determinado aspecto.
Una vez realizado este proceso de dividir sucesivamente el intervalo, las densidades de
frecuencias pasan a ser, en el límite, densidades de probabilidad.
La probabilidad de que la variable X tome los valores entre x0 y x0+h es P(x0
0+h) y corresponde al área bajo la curva en el intervalo [x0 , x0+h]. La función
106
correspondiente a esta curva, y = f(x), la denominamos Función de densidad.
.
FUNCIÓN DE DENSIDAD

Una función y = f(x) es una función de densidad de una variable aleatoria continua si
cumple las siguientes condiciones:
Es positiva en todo su dominio: 0  f(x)  1
Permite obtener p(a  X  b) como área bajo la grafica entre X = a y X = b. Verifica la formula
b
P(a  X  b) =  f ( x )dx .
a

El área total entre la grafica de f(x) y el eje x vale 1 

f ( x )dx  1.

Permite obtener F(x) como área bajo la grafica hasta el valor de x

FUNCIÓN DE DISTRIBUCIÓN

En general, la función de distribución de una variable aleatoria continua X es el modelo


teórico de la curva de frecuencias acumuladas que se espera obtener para X, y debe cumplir,
evidentemente, estas propiedades:
Ser creciente
Tomar valores de 0 a 1

Si X es una variable aleatoria continua con valores en un intervalo [a, b], entonces F(x)
será la probabilidad de que la variable X tome valores entre a y x. F(x) = P(a ≤

0 si x  a
x

x
F( x )   f ( x )dx si a  x  b F( x )  p(X  x )   f ( x )dx
a 
1 si x  b

 F´(x) la probabilid ad P( X  x0 )  0, siendo x0 un valor cualquira de a, b
dF ( x)
f (t ) 
dx
Es decir, la función de distribución F(x) es una primitiva de la función de densidad f(x), o
dicho de otra forma, la función de densidad es la derivada de la función de distribución.
Indica la probabilidad de que la variable aleatoria continua X sea menor o igual que un
valor dado, es decir, proporciona la probabilidad acumulada hasta un determinado valor de la
variable.

Ejercicios

1. La longitud de una pieza (en metros) es una variable aleatoria X con la siguiente función de
107
Densidad f(x) = 2(1-X), 0  X  1 y 0; para otro valor. Determinar:
a) La probabilidad de que la pieza mida entre ½ metro y un metro.
b) Probabilidad de que la pieza mida más de ¾ de metro.
c) Grafica de la función densidad.

Solución

X = longitud de una pieza


1 1
1
a) P(1/2 X  1) =  2(1  X )dx  (2 x  x ) 
2

1 4
2 1
2
 1  1
1
b) P(X  3/4) =  f ( x)dx   2(1  X )dx   f ( x)dx  (2 x  x ) 
2

3 3 1
16
4 4 3
4

c) Grafica

2
1

-ω 1 ω x

2. El peso de una caja (Kg.) es una variable aleatoria con la siguiente función de densidad:

1
2 ; 3 X  4

f ( x)   x  4 ; 4  x  5 Determinar:
0 ; O.V .


a) Grafica de la Función de Densidad.
b) Probabilidad de que el peso de la caja este entre 3,5 y 4,5 Kg.
c) Probabilidad de que el peso supere los 4 Kg.

Solución.

a) Grafica
y
1

1/2

3 4 5/8 x
108
4,5
 x2 
4,5 4
1 
4
1 3
b) P(3,5  X 4,5) = 3,52 dx  4 ( x  4) dx   x     4 x  
 2  3, 5  2 4 8
  5
5
 x2  1
c) c) P(X  4) =  f ( x)dx   ( x  4)dx   f ( x)dx    4 x  
4, 5 4 5 2 4 2

3. La temperatura promedio (ºC) de cierta región es una variable aleatoria con la siguiente
función de densidad:

3
 ( X  2) ; 2  x  4
2
f ( x)   8

0 ; O.C.
Calcular:

a) Probabilidad de que la temperatura promedio sea menor de 3 ºC.


b) Probabilidad de que la temperatura promedio este entre 2,5 y 3,5 ºC.
c) Grafica de la función densidad.

Solución.
X = Temperatura promedio de cierta región.
3 2 3
3 1
a) P(x < 3) =  f ( x)dx   f ( x)dx   ( x  2) 2 dx 
  28 8
3, 5 3, 5
3
b) P(2,5 X  3,5) = 2,5 f ( x)dx 2,58 ( x  2) dx  0.41
2

c) Grafica
f(x)
3/2

3/8

 2 4 
PARÁMETROS DE UNA VARIABLE ALEATORIA CONTINUA

Por analogía con las definiciones de estos conceptos para variables aleatorias discretas, se
definen la esperanza matemática E(x) o media μ, la varianza V(x) o σ2 y la desviación típica σ de
una variable aleatoria continúa de la siguiente forma:

Si toma valores en toda la recta real


109

Valor Esperado o Media   E( x )   x f (x)dx


Varianza V( x )  E( x )  E( x ) ; E( x )  x
2 2 2 2
f ( x )dx


Si toma valores en (a, b)


b
Valor Esperado o Media   E( x )   x f ( x )dx
a
b
Varianza V( x )  E( x 2 )  E( x ) ; E( x 2 )   x 2 f ( x )dx
2

Ejemplo

El peso de una caja (Kg.) es una variable aleatoria X con la siguiente función de Densidad,
2 x 0  x  1
f ( x)   Calcular:
0 o.c.
a) Peso promedio de la caja.
b) Peso más Probable.
c) Mediana del peso de la caja.
d) Varianza o Dispersión del peso.
Solución.

X = Peso de la caja.

Grafica de f(x) y
2

 1 

 1
x3 1 2
a) E(x) = 

x  f ( x)dx   x.2 xdx  2
0 3
)0  Kg , peso Pr omedio de la caja
3
b) Moda.
Como F (2) es máximo  Moda es X = 1 Kg., entonces el peso de la caja mas probable es
X = 1 Kg.
c) Mediana  P(X  me) = 0.5 
110
me

 2 xdx  0.5  x )  0.5  me2  0.5   0.7  X  0.7 es la Mediana


2 me
0
0
1
2x4 x4 1 1
d) V(x) = E ( x 2 )  E ( x) E ( x 2 )   x 2 2 xdx   )0 
2
;
0 4 2 2
2
1 2 1 4 1
V( x )       corresponde al grado de dispersion del peso
2 3 2 9 18
Ejemplo.
Sea X el tiempo de supervivencia en años después de un diagnóstico de leucemia aguda. La
x
función de densidad es f ( x )    1, para 0  x  2 .
2
a. Comprobar que es una fdp.
b. Hallar P(X > 1)
c. Hallar P(X = 1)
d. Hallar P(X  1)
e. Calcular la media y la varianza.
Solución.

a) La gráfica de la f(x) es
La condición equivalente a:  f ( x)  1
x

para variables continuas es que el área bajo la f(x) sea 1. De modo general ese área se calcula
mediante cálculo integral, pero en este caso se puede calcular por la conocida fórmula del área de
(b  h) (2  1)
un triángulo A  , es decir A  1
2 2

Gráficamente, la probabilidad pedida es el área coloreada de negro, por lo tanto se puede calcular
también con la fórmula del área del triángulo. Ahora b = 1 y para calcular h hay que ver que valor
toma la f(x) cuando x = 1, y = -1/2 + 1 = 1/2. Por lo tanto, la probabilidad es (1x1/2)/2 = ¼
111
d) Como en toda variable continua la probabilidad de que tome un valor concreto es 0, por lo
tanto p(X = 1) = 0
d) Obviamente p(X  1) =1- p(X > 1) = 1 - 1/4 = 3/4
e) Media
 2
 x 
2
 x2  x3 x 2 8 4 2
 x  E ( x)   x f ( x)dx   x   1 dx     x dx    )02    
 0  2  0 2  6 2 5 2 3
Varianza
V(x) = E ( x 2 )  E ( x)  2  E( x2 )   x2
2
o
 2
2 x 
2
 x3 2 x 4 x3 2 16 8 2
E( x2 )  x f ( x ) dx  0  2  0  2 
x   1 dx    x dx 
8
 )0    
3 8 3 3
2
2 2 2
    
2

3 3 9

Problemas Propuestos de Variable Aleatoria


Discretas

1. Según estadísticas la probabilidad de que el motor de un auto nuevo, de cierto modelo, y


marca sufra de algún desperfecto en los primeros 12 meses de uso es de 0.02, si se prueban
tres automóviles de esta marca y modelo, encuentre el número esperado de autos que no
sufren de algún desperfecto en los primeros doce meses de uso y su desviación estándar.

2. Se ha detectado en una línea de producción que 1 de cada 10 artículos fabricados es


defectuoso; se toman de esa línea tres artículos uno tras otro, a) obtenga la distribución de
probabilidad del experimento, b) encuentre el número esperado de artículos defectuosos en
esa muestra y su desviación estándar.

3. Según estadísticas, la probabilidad de que un pozo petrolero que se perfore en cierta región
pueda ser beneficiado es de 0.30. Se perforan tres pozos en esa región, encuentre el número
esperado de pozos que pueden ser beneficiados y su desviación estándar.

4. La distribución de probabilidad de x , el número de defectos por cada 10 metros de una tela


sintética en rollos continuos de ancho uniforme , es:

x 0 1 2 3 4
p(x) 0.41 0.37 0.16 0.05 0.01

a) Determine la distribución de probabilidad acumulada de x; P(x).


b) Determine el número esperado de defectos por cada 10 metros de tela sintética en
rollos continuos de ancho uniforme y la desviación estándar del número de defectos por
cada 10 metros de tela.
112
c) Determine la probabilidad de que en 10 metros de tela sintética se encuentren como
máximo 2 defectos.
d) Determine la probabilidad de que en 10 metros de tela sintética se encuentren por lo
menos 2 defectos.

5. Sea X una Variable Aleatoria que representa la demanda de horas extras en una empresa. La
experiencia muestra que esta demanda se comporta de acuerdo a la siguiente función de
probabilidad,

(2x  1) / 24  x  1,2,3,4
f (x)  
0 en otra parte

Encuentre la distribución de probabilidad y la distribución acumulada.


6. Un lote de 7 lámparas contiene dos defectuosas. Un restaurante adquiere tres de estas
lámparas. Sea x el número de lámparas defectuosas. Encuentre la distribución de x. Grafique.

7. A continuación se presenta una función de probabilidad, de la variable aleatoria x, el número


de errores de escritura en una página.

0 1 2 3
P(x) 0.40 0.35 0.16 0.09

Encuentre la distribución acumulada para x,


El valor esperado
La varianza
La desviación estándar

8. La función de probabilidad de una variable aleatoria discreta x esta dada por


(2x  1) / 16 si x  0,1,2,3
f (x)  
0 en otra parte
Determine la función de distribución acumulada, la media, la varianza y la desviación estándar.

9. Una empresa de alimentos con la entrada de TLC, necesita modernizar su maquinaria para ser
más competitiva pero no tienen el suficiente capital, por lo que decide ofrecer bonos, los cuales
vencen al cabo de varios años. La distribución acumulada de x el número de año al vencimiento
para un bono elegido al azar, es:
113
0 si x  1
1 / 6 si x  1

F ( x)  
3 / 6 si x  3
1 si x  7
Encuentre:
P(x = 6), b) P(x > 4), c) P(2.1 < x < 6)

10. El número de semanas, X, en las que una inversión es de alto riesgo, durante cierto período de
c(5) x
8 semanas, tiene como modelo probabilístico a la función dada por: f ( x )  , x  R x.
x!
También se sabe que por lo menos en una semana (de este periodo) la inversión es de alto riesgo
pero no en todas será así.
a) Determine el rango de la variable aleatoria y el valor de la constante
b) Determine la probabilidad de que en más de la mitad de las semanas (de este periodo) la
inversión sea de alto riesgo.
c) ¿Cuál es el valor esperado del número de semanas en las que la inversión será de alto
riesgo?

Continuas:

1. Para la siguiente función:

1
f ( x )  x 2 Cuando 0  x  3 , f(x) = 0 para cualquier otro valor
9
a) Diga si esta función nos define una distribución de probabilidad.
b) Si la función define una distribución de probabilidad, entonces, determine su
media y desviación estándar.
c) Determine la probabilidad de que 1  x  2.

2. Suponga que el error en la temperatura de reacción, en oC, para un experimento


controlado de laboratorio es una variable aleatoria continua x, que tiene la función de
densidad de probabilidad:

x2
f (x)  , para -1 x  2 y f(x) = 0 en cualquier otro caso
3

a) Verifique la tercera condición de la definición de una distribución de


probabilidad continua.
b) Determine la media o valor esperado de la distribución de probabilidad.
c) Encuentre la probabilidad de que 0  x  1.
114

3. La variable aleatoria continua X está distribuida según:


1
 si 1 x  4
f (x)   3
0 otro valor
Indique la probabilidad de que X:
a) sea 3.
b) sea menor o igual a 3.
c) sea a lo sumo 3.
d) sea menor a 3.
e) sea mayor o igual a 3.
f) sea como mínimo 3.
g) sea mayor a 4.
h) esté entre 3 y 6.
i) sea menor que 2, sabiendo que es menor que 3.
j) sea menor que 3.5, sabiendo que es mayor que 1.5.
k) Sean los sucesos A y B:
A: X < 2
B: X > 3
Determine si A y B son independientes

4. Determinar para qué valor de k las siguientes funciones son funciones de densidad de
probabilidad:

kx 2 si 0  x  3 x 2 si 0  x  k
a ) f (x)   b) f ( x )  
0 otro valor 0 otro valor

5. El tiempo (en años) hasta la ocurrencia de cierto evento catastrófico puede considerarse como
2x
una variable aleatoria continua, X, con función de densidad dada por: f ( x )  , 0  x  5.
25
a) ¿Cuál es la probabilidad de que dicho evento ocurra después de 2 años?
b) Una persona adquiere una póliza contra este tipo de evento. El contrato estipula que si el
evento ocurre antes del primer año la compañía aseguradora debe pagarle una suma
indemnizatoria de seis mil Bs., por única vez. La póliza cuesta dos mil Bs. Determine la
utilidad esperada de la aseguradora.

6. El ingreso familiar mensual en miles de Bs. fuertes en una ciudad, es una variable aleatoria X
con función de densidad:
115
4kx, 0  x 1
f (x)  
k (5  x ), 1 x  5

a) Determinar la constante k y calcule el porcentaje de familias con ingresos mensuales de a


los más 2 mil Bs. Fuertes

b) ¿Cuál es el ingreso familiar esperado y la varianza esperada?

7. La proporción diaria de veces que ciertos comerciantes evaden la entrega de una factura de pago es una
variable aleatoria con función de densidad f (x)  6x(1  x), 0  x  1.
Una muestra aleatoria de 100 comerciantes fue supervisada durante un día y se registró, para cada uno de
estos, la proporción diaria de evasiones:

Proporción de evasiones 0 - 0,2 0,2 – 0,4 0,4 - 0,6 0,6 - 0,8 0,8 - 1
Número de comerciantes 9 26 30 25 10

a) Determine el valor esperado de la proporción diaria de evasión por comerciante.

b) ¿Cuán frecuentemente la proporción de evasión diaria es menor que 0,2?

c) ¿Cuán cercanos resultaron los valores observados respecto a lo esperado según la densidad dada?
116
Distribuciones de Probabilidad Discretas

La Distribución Binomial o de Bernoulli

En estadística la distribución binomial o de Bernoulli es una distribución probabilidad


discreta describiendo el numero de éxitos de n experimentos independientes con probabilidad P
de un éxito.
Una variable aleatoria se dice que es una distribución binomial o de Bernoulli si se
cumple:
En cada realización del experimento sólo son posibles dos resultados A y B (experimento
dicotómico).
El resultado obtenido en cada realización es independiente de los obtenidos en las
anteriores.
La probabilidad del resultado A, y por tanto la de B, no varía a lo largo del experimento.
Si llamamos p a la probabilidad de que se verifique A y q a la de que se verifique B, entonces:
p + q = 1 (A y B son sucesos contrarios).

Ejemplos:

a. Si analizamos productos que vayan saliendo de una línea de producción, usualmente


seleccionamos algunos cuantos, por ejemplo 20, para ver si tienen algún defecto. Si, por ejemplo,
el porcentaje de defectuosos en la producción es de 20%, podemos preguntarnos ¿cuál es la
probabilidad de que al revisar los 20, nos encontremos 4 defectuosos?

b. Si tenemos una gran cantidad de facturas expedidas, podemos seleccionar algunas, por ejemplo
14, y analizarlas para ver si los clientes quedaron satisfechos con la venta que les hicimos. Si, por
ejemplo, el 3% de nuestros clientes no quedan satisfechos, podemos preguntar ¿cuál es la
probabilidad de que tengamos más de 3 clientes insatisfechos entre los 14?

c. Si la probabilidad de que un movimiento financiero nos dé ganancia es de 78%, por ejemplo,


podemos preguntarnos por la probabilidad de que de 12 movimientos 8 resulten buenos.

d. Si la probabilidad de que un empleado llegue tarde un día es de 0.02, qué probabilidad hay de
que llegue tarde más de 3 veces en 28 días seleccionados.

Condiciones del modelo Binomial

En los ejemplos anteriores se usa el modelo binomial. Lo que tienen de común es lo


siguiente:
117

En a, revisamos un artículo. Esto lo repetimos 20 veces.


En b, analizamos la venta asentada en una factura. Repetimos 14 veces.
En c, un movimiento puede resultar malo. Repetimos 12 veces.
En d, la llegada tarde de un empleado. Repetimos 28 veces.

En cada ocasión, el resultado sólo puede ser uno de dos: éxito o fracaso.
En a, éxito es un artículo defectuoso.
En b, éxito es un cliente insatisfecho.
En c, éxito es que un movimiento resulte favorable.
En d, éxito es la llegada tarde.

Cada nueva repetición se hace de manera independiente de las otras. La probabilidad de


un éxito en una repetición siempre es la misma, sin verse influida por los resultados de las otras.
Esta condición es más o menos falsa en algunos de nuestros ejemplos, pero es parte esencial del
modelo binomial. Si creemos que esta condición no se satisface, debemos usar algún otro
modelo, no el binomial.

En a, puede pasar que los artículos defectuosos vengan en lotes. Es posible que los
artículos del mismo lote hayan sido elaborados en condiciones semejantes y entonces los defectos
de fabricación harían que no haya independencia entre artículos sucesivos. Sin embargo, si se
selecciona al azar productos de varios lotes, la independencia se mantiene.

En b, puede ser que el malestar sea a causa de un empleado y los clientes atendidos por
ese empleado tenderán a estar insatisfechos. Si escogemos al azar a las personas a las que les
vamos a pedir su opinión, se recupera la independencia.

En c, podría pasar que el estado general de la economía influya en que los movimientos
buenos se presenten por rachas. Si es así, no se ocurre como mantener la independencia.

En d, el que un empleado llegue tarde no implica que el siguiente lo llegue.

Vamos a obtener la función de probabilidad de una variable aleatoria de tipo binomial, es


decir, vamos a calcular la probabilidad de obtener r resultados A si se realizan n pruebas:

Uno de los posibles resultados es:


A, A,A,A,...A,B,B,...B (A repetida r veces y B repetida n-r veces).
La probabilidad de este suceso es:
P(A).P(A)....P(A).P(B).P(B)...P(B) = prqn-r
118
Siendo p la probabilidad de que aparezca A y q = 1-p la de que aparezca B.
Pero la aparición de r valores de A pude producirse de Cnr maneras. Por tanto, la
probabilidad de que la variable aleatoria que asigna el número de apariciones de A tome el valor r
es:
n
P( x  r )   p r q n r
r 

En todos los casos hay un número de repeticiones que denotamos por n.


También hay una probabilidad de éxito en cada intento a la que denotamos por p.
n y p son los parámetros del modelo.
En a, n = 20, p = 0.20
En b, n = 14, p = 0.03
En c, n = 12, p = 0.78
En d, n = 28, p = 0.02

Los valores de n y p en cada situación específica cambian. A estas cantidades les


llamamos parámetros.

Parámetros del Modelo Binomial.

En cuanto a los parámetros de la distribución tenemos a la media y la desviación típica: de


la distribución binomial se tiene:

a) Valor Esperado.
El valor esperado o media estadística de una variable aleatoria de probabilidad binominal es:

E(x)  np (El producto de n y p)

b) Desviación Estándar.
La calculamos así: varianza V(x)  np(1  p). o   npq
La desviación estándar es la raíz cuadrada de la varianza.

PROBABILIDAD.
La variable aleatoria en el modelo binomial es el número de éxitos en las n repeticiones.
La denotamos con X. El símbolo
n
P( x  r )   p r q n r
r 
Se usa para denotar la probabilidad de que el número de éxitos sea igual a r.
Como un ejemplo, vamos a calcular la probabilidad que se pide en el ejemplo a.
119
En ese ejemplo n = 20, p = 0.20. Se nos pide calcular P (X = 4).
Resolviendo se obtiene: 0.2182.
En ese mismo ejemplo:
El valor esperado es 4.0
La desviación estándar es 1.79.

Otro ejemplo de más cuidado es el B.


En este ejemplo n = 14, p = 0.03 y se nos pide P(X > 3). Para calcularla es mejor hacer: P (X≤ 3)
y restarla de 1.
P(X ≤ 3) = P(X =0) + P(X =1) + P(X =2) + P(X = 3)
Verifique que el planteamiento indica P(X ≤ 3) = 0.9628. Y la respuesta a la pregunta es P(X > 3)
= 0.0372
En nuestro ejemplo:
3
15
  5.   2,14
77
3 4 60
  5. .   1.22  1
7 7 49
Ejercicios:

1. Se extraen cinco bolas con devolución de una caja que contiene 6 blancas y 8 negras. Hallar la
probabilidad de obtener 3 bolas blancas.
Solución.

La probabilidad de extraer una blanca es p = 6/14=3/7 y la de obtener una negra es q = 8/14 = 4/7
(se cumple p+q=1), entonces:

 5  3 
3 2
4 5! 27 16 5  4 27 16
p( x  3)              0,257
 3  7  7 3!(5  3)! 343 49 2 343 49

La función de distribución de la distribución binomial será:


 n  n  n
F ( xi )  P( X  xi )    P 0 q n    P1q n 1  ....  p r q n  r
0 1  r 
Su función de densidad es
 n
P( X  x)    p x q n  x
 x
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial) posibilidades
para un numero de x éxitos (probabilidad p ) y n-x no éxitos ( (1  p) n x ).
k

En nuestro ejemplo, la probabilidad de obtener 2 bolas blancas o menos en la caja es:


120
 5  4   5  3  4   5  3   4 
5 4 2 3

F (2)  P( x  2)                


 0  7  1  7  7   2  7   7 
1024 3 256 9 64
5  10  0,061  0,228  0,343  0,632
16807 7 2401 49 343

2. Una familia tiene seis hijos, hallar la probabilidad que sean:

a) Tres varones y tres hembras.


b) Menos varones que hembras.
Solución.

X = Numero de hijos varones de la familia


X  B (n, p) ; X  B (6,1/2)

a) P (tres varones) = P(X = 3) = 0,3125.


b) P(menos varones que hembras) = P(X 2) = 0,34375

3. El 70% de los trabajadores de una empresa tienen más de 25 años de edad, si se seleccionan
una muestra de 5 trabajadores, ¿Cuál es la probabilidad de que existan?:
a) Tres trabajadores con más de 25 años.
b) A lo sumo dos trabajadores con mas de 25 años.
Solución.

X = Numero de trabajadores con mas de 25 años.


X  B (n, p) ; X  B (5, 0.7)

a) P(X = 3) = 0, 3087.
b) P(X ≤ 2) = 0,163

4. Un equipo A tiene 1/3 de probabilidad de ganar cuando juega. Si A juega 4 partidos,


Determine:
a) Probabilidad de que gane 2 partidos.
b) Probabilidad de que gane por lo menos 1 partido.
c) Numero mas probable de partidos que puede ganar A.
Solución.

X = numero de partidos ganados


X  B (n, p) ; X  B (4, 1/3).

a) P(X = 2) = 0, 2963.
121
b) P(X  1) = 1 – P(X < 1)  1 – P (0) = 1 – 0, 1975.
c) Moda  P(x) es Máximo ; como P (1) es Mediana  Moda es 1 juego, que es el numero
mas probable de juegos ganados.
d) E(x) = n. p = 4 x 1/3 = 4/3.
e) V(x) = n.p.q = 4 x 1/3 x 2/3 = 8/9.

5. Supongamos que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es
de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes:
a. ¿cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas?
b. ¿y de que a lo sumo dos se encuentren defectuosas?
c. ¿cual es la probabilidad de que por lo menos una se encuentre defectuosa?
Solución

X = numero de unidades defectuosas

X  B (n, p) ; X  B (10, 0.05).

a) P(X = 2) = 0,988 ojo

b) P(X 2) =

c) P(X  1) = 1 – P(X < 1)  1 – P (0) =

6. El gerente de un restaurante que sólo da servicio mediante reservas sabe, por experiencia, que
el 20% de las personas que reservan una mesa no asistirán. Si el restaurante acepta 25 reservas
pero sólo dispone de 20 mesas, ¿cuál es la probabilidad de que a todas las personas que asistan al
restaurante se les asigne una mesa?
Solución

En el caso particular de este problema, n = 25. Entonces, para que aquellas personas que
asistan al restaurante de las 25 que han hecho la reserva puedan disponer de una mesa, debe
ocurrir que acudan 20 o menos. Así se tiene que:

P(X 20) = 0,5799

Distribución de Poisson.

La distribución de Poisson es otra función de distribución de probabilidad que tiene


muchas aplicaciones prácticas importantes. Un proceso Poisson no sólo representa numerosos
fenómenos discretos, sino que el modelo Poisson también se usa para proporcionar
aproximaciones a la distribución binomial.
122
Se dice que un proceso de Poisson existe si podemos observar eventos discretos en un
área de oportunidad, un intervalo continuo, de tal manera que si acotamos el área de oportunidad
o intervalo de manera suficiente:
La probabilidad de observar exactamente un éxito en el intervalo es estable.
La probabilidad de observar exactamente más de un éxito en el intervalo es cero.
La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de aquella en
cualquier otro intervalo.

Características
En este tipo de experimentos los éxitos buscados son expresados por unidad de área,
tiempo, pieza, etc.
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefónicas a un conmutador por hora, minuto, etc.
- # de llegadas de embarcaciones a un puerto por día, mes, etc.

Cada vez que se especifica el parámetro λ, puede generarse una distribución de


probabilidad de Poisson específica. Una distribución de Poisson estará sesgada a la derecha
cuando λ es pequeña, y se aproximará a la simetría al crecer.

Una variable aleatoria que describe el número de sucesos ocurridos en una región, de tal
modo que dichos sucesos ocurren independientemente y con una tasa constante decimos que
sigue distribución de Poisson de parámetro λ.
X ~ Р (λ)

Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o
producto, la fórmula a utilizar sería:

x e  
P( X  x )  ; con x  1,2,3....  Función de Probabilidad ; donde
x!

P(X = x) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de


ellos es 
 = media o promedio de éxitos por unidad de tiempo, área o producto
e = 2.718
X = variable que nos denota el número de éxitos que se desea que ocurra

Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad
123
de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente
de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es
independiente de otro producto dado.

Parámetros de la distribución de Poisson

a) Valor Esperado.
El valor esperado o media estadística de una variable aleatoria de probabilidad Poisson es:

E( x )  

b) Varianza.
La calculamos así: varianza V(x)  

La distribución de Poisson Como una Aproximación de la Binomial

El otro uso que se le da a la distribución de Poisson es la aproximación de la distribución


binomial. En los casos en las que n es grande (mayor o igual a 20) y p es muy pequeña (menor a
0.05, la distribución de Poisson puede usarse para aproximar la distribución binomial.

La variable aleatoria de Poisson puede variar teóricamente de 0 a ∞. Sin embargo, cuando


se usa como una aproximación a la distribución binomial, la variable aleatoria de Poisson, el
número de éxitos de n observaciones, claramente no puede exceder el tamaño de la muestra n.
Características
μ=λ=n*p

Ejercicios:

1. Una empresa electrónica observa que el número de componentes que fallan antes de cumplir
100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de
estos fallos es ocho,
a. ¿Cuál es la probabilidad de que falle un componente en 25 horas?
b. ¿De que fallen no más de dos componentes en 50 horas?
c. ¿Cuál es la probabilidad de que fallen por lo menos diez en 125 horas?
Solución.

a) Sea la variable aleatoria X, con distribución de Poisson con parámetro λ = 8, que determina el
número de componentes que fallan antes de cumplir 100 horas de funcionamiento.

Considerando que se cumplen ciertas condiciones de regularidad, podemos asumir que


124
una variable Y que mide el número de componentes que fallan antes de cumplir 25 horas de
funcionamiento sigue una distribución de Poisson con parámetro: λ = 8/4 = 2.
Recordemos que 25 horas es una cuarta parte de 100 horas. Por lo tanto, la probabilidad deseada es
la siguiente:

P (Y = 1) = 0,27067

b) Análogamente, definimos una variable aleatoria Z con distribución de Poisson de parámetro: λ


= 8/2 = 4, que mide el número de componentes que fallan antes de cumplir las 50 horas de
funcionamiento. Se tiene entonces que:

P(Z  2) = P(0) + P(1) +P(2) = 0,2381

c) De la misma forma, definiendo una variable aleatoria W con distribución de Poisson de


parámetro λ = 10., se obtiene:

P(X  10) = 1 – P(X < 10) = 1- P(Z 9) = 1 - [P(0)+P(1)+…….+P(9)] = 0,41696

2. Supóngase que 220 errores están distribuidos al azar a lo largo de 200 páginas, hallar la
probabilidad de que una pagina dada contenga:
a) Ningún error.
b) Más de 2 errores.
c) Cual es la probabilidad de hallar un error en dos paginas
Solución

X = Numero de errores por pagina

220 errores
X.  Poisson con  =  1,1 err
200 paginas pag
a) P(X = 0) = 0.3329.

b) P(X > 2) =  p( x)  P(3)  P(4)  P(5)  P(6)  ........  0,0995
x 3

c) Y = Numero de errores en 2 paginas ; Y.  Poisson con  = 2 x 1,1 = 2,2

P(Y = 1) = 0,2438.

3. Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una


distribución Poisson con una media de 2.3 imperfecciones por milímetro.

(a) Determine la probabilidad de 2 imperfecciones en un milímetro de alambre.


125
(b) Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre.
(c) Determine la probabilidad de al menos una imperfección en 2mm de alambre
Solución.

a) Entonces λ = 2.3 imperfecciones

P(X = 2) = 0.265
b) Sea que X denote el número de imperfecciones en 5 milímetro de alambre. Entonces, X tiene
una distribución Poisson con λ = 5mmx2.3 imperfecciones/Mm. = 11,5 imperfecciones.

Por lo tanto: P(X = 10) = 0.113

c) Sea que x denote el número de imperfecciones en 2 milímetros de alambre. Entonces, X tiene


una distribución de Poisson con λ = 2mm x 2.3imperdecciones/Mm. = 4.6imperfecciones

Por lo tanto: P(X  1) = 1 – P(X < 1) = 1- P(Z  0) = 1-P(0) = 0.9899

4. La contaminación constituye un problema en la fabricación de discos de almacenamiento


óptico. El número de partículas de contaminación que ocurre en un disco óptico tiene una
distribución de Poisson y el número promedio de partículas por centímetro cuadrado de superficie
del disco es 0.1. El área de un disco bajo estudio es 100 centímetros cuadrados.

(a) Encuentre la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio.
(b) La probabilidad de que ocurran cero partículas en el área del disco bajo estudio
(c) Determine la probabilidad de que 12 o menos partículas ocurran en el área del disco bajo
estudio.
Solución.

a. Sea que X denote el número de partículas en el área de un disco bajo estudio. Puesto que el
número promedio de partículas es 0.1 partículas por cm2.

La variable X tiene parámetro λ =100 cm2 x 0.1 partículas/ cm2 = 10 partículas

Por lo tanto: P(X = 12) = 0.095

b. P(X = 0) = 4.54x10 −5

c. P(Z  12) = P(0) + P(1) +P(2)+……….+P(12) = OJO

5. Supongamos que en una región se producen terremotos de acuerdo con una distribución de
Poisson con media λ = 2 terremotos/semana.
126
a. Calcular la probabilidad de al menos tres terremotos ocurran en un período de dos semanas.
Solución.

a. Si en una semana hay, en promedio, 2 terremotos, en dos semanas habrá, también un promedio
de 4 terremotos. Entonces, debemos estudiar variable aleatoria, Y, de Poisson con media λ = 4:
P [Y ≥ 3] = 1 − P [Y < 3] = 1 − [P(Y = 0) + P(Y = 1) + P(Y = 2)] =
= 1 − e−4 − 4e−4 −8e−4 = 0.7618.

6. El número de pinchazos en los neumáticos de cierto vehiculo industrial tiene una distribución
de Poisson con media 0.3 por cada 50000 kilómetros .Si el vehiculo recorre
100000 Km., se pide:

a) Probabilidad de que no tenga pinchazos.


b) Probabilidad de que tenga menos de tres pinchazos.
c) Número de Km. recorridos para que la probabilidad de que no tenga ningún pinchazo sea
0.4066.
Solución.

Si λ = 0.3 para 50000 Km., entonces para 10000km tendremos una X con λ = 0.6.

a) P(X= 0) = 0.5488

b) P(X<3) = P(X= 0) + P(X=1) + P(X=2) = 0.5488 + 0.3292 + 0.09878 = 0.9767

c) P(X= 0) = e- λ Por tanto, ln e- λ = ln 0.4066 y λ = 0.9

Si 0.3 → 50000 Km. , 0.9 → x Km., y por tanto x = 150000 Km.

DISTRIBUCION GEOMETRICA

En estadística la distribución geométrica es una distribución de probabilidad cuya


función de densidad para valores discretos x = 1,2,…. es
P( X  x)  p(1  p) X 1
Su función de distribución es
P( X  x)  p X
El parámetro p (la probabilidad de éxito de un experimento) fija la media estadística
E ( X )  1 y la varianza V ( X )  (1  p) 2 .
p p
Ejemplo
El número de tirar una cifra determinada con un dado X veces seguidas es una distribución
127
geométrica con el parámetro. p  1
6

Problemas Propuestos de Distribución de Probabilidades Discretas

Binomial

1. Se tiene una familia con tres hijos. Determine la probabilidad de que:


a) dos sean hombres.
b) los tres hijos sean mujeres.
c) uno de los hijos sea mujer.
d) al menos dos de los hijos sean hombres.
e) al menos uno de los hijos sea mujer.

2. Si el 20% de lentes para microscopio producidos por una máquina son defectuosos.
a) Determinar la probabilidad de que de 4 lentes elegidos al azar :
i) uno sea defectuoso.
ii) ninguno sea defectuoso
iii) a lo más 2 sean defectuosos.
b) Si se envía un pedido de 400 lentes para microscopios ¿Cuál es el número
esperado de lentes defectuosos en el pedido?

3. Al inocular ratas con una sustancia presumiblemente tóxica generalmente el 10 %


muere. Si se inoculan 20 ratas con esta sustancia,
a) ¿Cuál es la probabilidad de que:
i) 5 ratas mueran?
ii) a lo más 3 ratas mueran ?
b) ¿Cuál es el número esperado de mortalidad?

4. Una máquina produce un tipo de artículo que generalmente resulta defectuoso en un


10% de la producción total.
Hallar la probabilidad que de un total de 4 artículos producidos por esa máquina sean
defectuosos:
i) como mucho 3 iii) entre 1 y 3
ii) entre 2 y 4 inclusive iv) 2 o más.

5. Si el 20 % de la población tiene por lo menos un defecto físico. Determine la


probabilidad de que 4 individuos elegidos al azar :
i) uno tenga defectos físicos
ii) ninguno tenga defectos
iii) a lo más dos tengan defectos

6. Un cirujano tiene 25% de posibilidades de fracasar en una operación


a) Si opera 4 veces. Halle la probabilidad que el cirujano fracase:
128
i) en 2 operaciones
ii) por lo menos en 1 operación
iii) en más de la mitad de las operaciones.
b) Si al mes opera 20 veces. ¿En cuántas operaciones se espera que tenga éxito?

7. Si el 10% de las conservas en tarro producidas por una máquina son defectuosas. El
departamento de control de calidad escoge 4 conservas al azar
a) ¿ Cuál es la probabilidad de :
i) Una sea defectuosa
ii) Ninguna sea defectuosa
iii) A lo más dos sean defectuosas.
b) Si se envía un cargamento de 4000 conservas ¿Cuál es el número esperado de
conservas en mal estado en el cargamento? ¿Cuál es su desviación estándar?

8. Se dice que el 75% de los accidentes de una planta se atribuyen a errores humanos. Si
en un período de tiempo dado, se suscitan 5 accidentes, determine la probabilidad de
que:
a) dos de los accidentes se atribuyan a errores humanos,
b) como máximo 1 de los accidentes se atribuya a errores de tipo humano,
c) tres de los accidentes no se atribuyan a errores humanos.

9. Si la probabilidad de que el vapor se condense en un tubo de aluminio de cubierta


delgada a 10 atm de presión es de 0.40, si se prueban 12 tubos de ese tipo y bajo esas
condiciones, determine la probabilidad de que:

a) el vapor se condense en 4 de los tubos,


b) en más de 2 tubos se condense el vapor,
c) el vapor se condense en exactamente 5 tubos.

10. La probabilidad de que el nivel de ruido de un amplificador de banda ancha exceda de 2


dB (decibeles) es de 0.15, si se prueban 10 amplificadores de banda ancha, determine la
probabilidad de que:

a) en solo 5 de los amplificadores el nivel de ruido exceda los 2 dB.


b) por lo menos en 2 de los amplificadores, el ruido exceda de 2 dB.
c) que entre 4 y 6 amplificadores no se excedan de los 2 dB.
d) encuentre el número esperado de amplificadores que se exceden de un nivel de
ruido de 2dB y su desviación estándar.

11. Una máquina produce un tipo de artículo que generalmente resulta defectuoso en un
10% de la producción total .Hallar la probabilidad que de un total de 400 artículos
producidos por esa máquina sean defectuosas:
i) Como mucho 30 iii) Entre 35 y 45
ii) Entre 30 y 50 inclusive iv) 55 o más.
129
Poisson

1. Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades
de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos en
cualquiera de dos días consecutivos?

2. En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican


0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a)
una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando
más una imperfección en 15 minutos

3. La probabilidad de que haya un accidente en una compañía de manufactura es de 0.02 por


cada día de trabajo. Si se trabajan 300 días al año, ¿cuál es la probabilidad de tener 3
accidentes?

4. La probabilidad de que un producto salga defectuoso es de 0.012. ¿Cuál es la probabilidad


de que entre 800 productos ya fabricados hayan 5 defectuosos?

5. El número de buques tanque que llegan en un día a una refinería tiene una distribución de
Poisson con λ= 2. Si más de tres buques llegan en un día, los que están en exceso deben
enviarse a otro puerto, pues las actuales instalaciones portuarias pueden despachar a lo
sumo tres buques al día. a) ¿Cuál es la probabilidad de tener que hacer salir buques en un
día determinado? b) ¿Cuál es el número esperado de buques que llegan en un día? c) ¿Cuál
es el número más probable de buques que llegan en un día? d) ¿Cuál es el número esperado
de buques atendidos diariamente? e) ¿Cuál es el número esperado de buques rechazados
diariamente? f) ¿En cuánto deben aumentarse las instalaciones actuales para permitir la
atención a todos los buques el 90% de los días?

6. Los errores de imprenta de una cierta editorial son en promedio de 2,5 por página, según
una distribución de Poisson. Si un cierto libro tiene 50 páginas, ¿cuál es la probabilidad de
que en alguna de ellas haya 5 ó más errores?

7. El porcentaje de rollos de tela de 150 metros de longitud que presenta fallas de teñido es del
2%. Por otra parte tienen una cantidad de fallas de tejido según una distribución Poisson
con λ= 0,01 fallas/m. a) ¿Cuál es la probabilidad de encontrar un rollo sin fallas? ¿Qué
condición entre sucesos debe presentarse? b) Si un cliente controla el 10% de los rollo de
una partida de 100 y la rechaza si encuentra uno o más rollos con falla de teñido o más de
dos rollos con alguna falla de tejido, ¿cuál es la probabilidad de aceptar la partida?

8. Cierto tipo de cable presenta en promedio 1 falla cada 250 metros. ¿Cuál es la probabilidad
de que un rollo de 1000 metros tenga: a) ninguna falla?; b) menos de 4 fallas? c) 6 ó más
fallas?

9. El proceso de fabricación de una tela genera en promedio 1 falla cada 100 metros. La
longitud de cada rollo queda determinada por la aparición de la segunda falla, de modo que
todos los rollos tienen una falla. Calcular: a) el porcentaje de los rollos con longitudes
inferiores a 150 m; b) la longitud superada por el 90% de los rollos; c) la longitud superada
por el 10% de los rollos; d) la longitud mediana; e) la longitud modal.
130
10. Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo
con una distribución de Poisson con una tasa promedio de 0.1 mensajes por minuto. a)
¿Cuál es la probabilidad de que lleguen como mucho 2 mensajes en una hora? b)
Determinar el intervalo de tiempo necesario para que la probabilidad de que no llegue
ningún mensaje durante ese lapso de tiempo sea 0.8.
131
Distribuciones de Probabilidades Continuas

DISTRIBUCIÓN NORMAL

Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio


nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que
ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n, p), para un mismo
valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se
aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribución normal se debe principalmente a que hay
muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal
Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm.
Tallas, pesos, envergaduras, diámetros, perímetros,...
Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono.
Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.
Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un
medio,...
Errores cometidos al medir ciertas magnitudes.
Valores estadísticos muéstrales, por ejemplo: la media.
Otras distribuciones como la binomial o la de Poisson son aproximaciones normales,...
Y en general cualquier característica que se obtenga como suma de muchos factores.

FUNCIÓN DE DENSIDAD

Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función


de densidad que corresponde a tales distribuciones viene dado por la fórmula:

2
1  x  
1  
2   
f (x)  e
2

  Media ,   Desviacion S tan dard , 2  Varianza


132

Representación gráfica de esta función de densidad

La distribución normal queda definida por dos parámetros, su media y su desviación típica
y la representamos así:

N(μ( σ), Para cada valor de μ y σ tendremos una funcion de densidad distinta, por
tanto la expresion N(μ( σ) representa una familia de distribuciones normales

FUNCIÓN DE DISTRIBUCIÓN

Puede tomar cualquier valor (- , + )


Son más probables los valores cercanos a uno central que llamamos media Conforme
nos separamos de ese valor , la probabilidad va decreciendo de igual forma a derecha e
izquierda (es simétrica).
Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma más o
menos rápida dependiendo de un parámetro , que es la desviación típica.

2
1  x  
1  
2   
x
F(X)  P(X  x )   e    x  

2

F(x) es el área sombreada de esta gráfica


133
TIPIFICACIÓN DE LA VARIABLE NORMAL

Para simplificar los cálculos se sigue un proceso que consiste en obtener a partir de una N
(,) una N (0,1) (Normal Estándar o Tipificada) de media 0 y desviación típica 1. De ese modo
la probabilidad desde - hasta 0 es de 0,5.

La forma de hacerlo es la siguiente:

X
Si tenemos una V.A. X, N (,), la variable Z  será una N (0,1). Y así:

X  K  K 
P( X  k )  P(  )  P( Z  ) , siendo Z una N (0,1).
  

Por tanto el proceso que se sigue en un problema con una N (,), es primero tipificar la
X
variable Z  será una N (0,1), es decir μ = 0 y σ =1, para luego calcular el valor con la

ayuda de la tabla:

Por tanto su función de densidad es:

z2
1 
(z)  e 2
;    z  
2
y su función de distribución es:

z2
1 z 
F(z)  P( Z  z)  (z) 
2
e

2
dz

Siendo la representación gráfica de esta función:

A la variable Z se la denomina variable tipificada de X, y a la curva de su función de


densidad curva normal tipificada.
134
Ejemplo:
X3 73 73
X → N (3,5)  P(X  7)  P(  )  P( Z  )  P( Z  0,8)  0,7881
5 5 5
Característica de la distribución normal tipificada (reducida, estándar)
No depende de ningún parámetro
Su media es 0, su varianza es 1 y su desviación típica es 1.
La curva f(x) es simétrica respecto del eje 0y
Tiene un máximo en este eje
Tiene dos puntos de inflexión en z =1 y z = -1
Uso de las tablas de una N (0,1).
Existen varios tipos de tablas, pero en todas, como la normal es simétrica respecto al 0:

P( Z  k )  1  P( Z  k )

P( Z  k )  P( Z  k )  1  P( Z  k )
P(k  Z  q)  P( Z  q)  P( Z  k )

Las dos tablas fundamentales de una N (0,1) se diferencian en que mientras que una nos
da la P (Z  k), la otra nos da sólo la P (0 Z k) (por tanto habrá que añadir a la probabilidad
observada en la tabla 0,5: P (Z  k) = 0,5resultado de la tabla).
En ambos casos, la tabla representa las unidades y décimas del valor en la columna
vertical, y las centésimas en la fila horizontal.

Aproximación de la Binomial por la Normal (Teorema de De Moivre):


Demostró que bajo determinadas condiciones (para n grande y tanto p como q no estén
próximos a cero) la distribución Binomial B(n, p) se puede aproximar mediante una distribución
normal

X  np
N(np, npq por tan to Z  es N(01)
npq

Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto más próximo sea
p a 0.5, tanto mejor será la aproximación realizada. Es decir, basta con que se verifique: nр ≥5
y nq ≥5
Gracias a esta aproximación es fácil hallar probabilidades binomiales, que para valores
grandes de n resulten muy laboriosos de calcular.
Hay que tener en cuenta que para realizar correctamente esta transformación de una
variable discreta (binomial) en una variable continua (normal) es necesario hacer una corrección
de continuidad.
135

MANEJO DE TABLAS. CASOS MÁS FRECUENTES.


La distribución de la variable Z se encuentra tabulada
136
137
DISTRIBUCION PROBABILIDAD GAMA.
Los tiempos que tardan en revisar un motor de un automóvil ó avión tienen una
distribución de frecuencias sesgadas. Las poblaciones asociadas a estas variables aleatorias
frecuentemente tienen distribuciones que se pueden modelar adecuadamente por la función de
densidad tipo gamma.
Función de densidad de probabilidad para una variable aleatoria tipo gamma:

y  1e  y / 
f ( y)    ,   0;0  y  
  ( )
0
En donde:

 ( )  0 y 1e
y
dy
La cantidad de la función alfa se conoce como la función gamma. La integración directa
nos da que la función uno igual a uno. La integración por partes nos da que la función de alfa
menos uno alfa menos uno por la función alfa menos uno para cualquier intervalo de alfa mayor o
igual a uno y que la función de n sea igual a n menos uno factorial, para un número entero n.
En el caso especial cuando alfa es un número entero, se puede expresar la función de
distribución de una variable aleatoria tipo gamma como una suma de ciertas variables aleatorias
de Poisson.
Si alfa no es un número entero, es imposible encontrar la antiderivada del integrando de la
expresión:

y  1 e  y / 
 dy Donde: 0  c  d  
d

c
   ( )

Y por lo tanto es importante obtener las áreas bajo la función de densidad tipo gamma
mediante integración directa.
Hay dos casos especiales de las variables aleatorias tipo gamma que merece consideración
particular:
Una variable aleatoria tipo gamma que tiene una función de densidad con parámetros alfa
igual a v entre dos y beta igual a dos se denomina variable aleatoria Chi – cuadrada o Ji -
cuadrada.
Chi - cuadrada se presenta con frecuencia en la teoría de la estadística. El parámetro v se
denomina número de grados de libertad asociado a la variable aleatoria Chi - cuadrada.
La función de densidad gamma para el caso especial v = 1 se denomina función de
densidad exponencial.
138

  0;0  y  
 y/
1
f ( y)  e

0
En cualquier punto.

DISTRIBUCIÓN EXPONENCIAL

Los modelos matemáticos de situaciones de la vida real requieren de supuestos


simplificadores que mantengan el análisis matemático en un nivel razonable. Sin embargo estas
simplificaciones no deben llegar al nivel de romper el vınculo entre la teoría y la realidad.

Un supuesto simplificador muy frecuente consiste en asumir que ciertas variables


aleatorias se distribuyen exponencialmente, esta distribución es relativamente fácil de manejar y
al mismo tiempo es una buena aproximación de la distribución real de la variable.
Una de sus propiedades fundamentales es que no se deteriora con el tiempo (de hecho es la única
distribución que presenta esta propiedad).

Se encuentra, también, íntimamente relacionada con los procesos de conteo (o de


Poisson), juega un papel importante tanto en teoría de colas como en problemas de confiabilidad.
El tiempo entre las llegadas en las instalaciones de servicio (tiempo entre dos sucesos) y el
tiempo de falla de los componentes y sistemas eléctricos.

Los casos típicos donde se usa esta distribución son: el tiempo que tardara una maquina de
cajero automático en entregar efectivo. Esta función puede usarse para determinar la
probabilidad de que el proceso tarde como máximo un minuto.

Sea X una variable aleatoria contınua. Se dice que X tiene una distribución exponencial
con parámetro λ si su función de Densidad esta dada por:

e  x , x  0
f (x)  
0 , x0
Y la función de Distribución:
x
1  e  x , x  0
. F( x )   f (u )du 
 0 , x0

Siendo  el valor del parámetro y x el valor de la función.


139
Relación de la distribución exponencial con el proceso de poisson.

Las aplicaciones más importantes de la distribución exponencial son aquellas situaciones


en donde se aplica el proceso de Poisson, es necesario recordar que un proceso de Poisson
permite el uso de la distribución de Poisson. Recuérdese también que la distribución de Poisson
se utiliza para calcular la probabilidad de números específicos de “eventos” durante un período o
espacio particular. En muchas aplicaciones, el período o la cantidad de espacio es la variable
aleatoria. Por ejemplo un ingeniero industrial puede interesarse en el tiempo T entre llegadas en
una intersección congestionada durante la hora de salida de trabajo en una gran ciudad. Una
llegada representa el evento de Poisson.

La relación entre la distribución exponencial y el proceso llamado de Poisson es bastante


simple. La distribución de Poisson se desarrolló como una distribución de un solo parámetro ,
donde  puede interpretarse como el número promedio de eventos por unidad de “tiempo”.
Considérese ahora la variable aleatoria descrita por el tiempo que se requiere para que ocurra el
primer evento. Mediante la distribución de Poisson, se encuentra que la probabilidad de que no
ocurran en el espacio hasta el tiempo t está dada por:

e   t (t ) 0
P(0, t )   e  t ; e  2.718
0!

Ahora puede utilizarse lo anterior y hacer que X sea el tiempo para el primer evento de
Poisson. La probabilidad de que el período hasta que ocurre el primer evento de Poisson exceda x
es la misma que la probabilidad de que no ocurra un evento de Poisson en x. Esto último por
 x
supuesto está dado por  . Como resultado,
P(X  x)  e x

Entonces, la función de distribución acumulada para x es:

P(X  x)  1  e  x

Ahora, con objeto de que se reconozca la presencia de la distribución exponencial, puede


derivarse la distribución acumulada anterior para obtener la función de densidad:

f ( x)  ex

1
La cual es la función de densidad de la distribución exponencial con  P  .
E
140
Nótese que la media de la distribución exponencial es el parámetro  E , el recíproco del
parámetro en la distribución de Poisson. El lector debe recordar que con frecuencia se dice que la
distribución de Poisson no tiene memoria, lo cuál implica que las ocurrencias en períodos de
tiempo sucesivos son independientes. Aquí el parámetro importante  E es el tiempo promedio
entre eventos. En teoría de la confiabilidad, donde la falla de un equipo concuerda con el proceso
de Poisson,  E recibe el nombre de tiempo promedio entre fallas. Muchas descomposturas de
equipo siguen el proceso de Poisson, y entonces la distribución exponencial es aplicable.

Propiedad de no memoria de la distribución exponencial

Una variable aleatoria X no tiene memoria si:


P X  st
Xt
  P  X  s  ; s, t  0
Para analizar el caso de la exponencial, vemos que la expresión de la izquierda se pude
escribir como:


P X  st
Xt
  P( X P( Xs t ,t X)  t  P(PX( X s t )t )
e   ( s  t ) e  s e   t
Que en el caso de la exponencial será:   t   t
 e  s
e e

Es decir, la exponencial no tiene memoria. De hecho, se puede comprobar que la


exponencial es la única distribución que tiene esta propiedad.

Si lo pensamos en términos de la vida de un componente, esta propiedad nos dice que la


esperanza de que el componente sobreviva 15 periodos cuando ya ha sobrevivido 10, es igual a la
probabilidad inicial de sobrevivir 5 periodos. Es decir, la distribución de la duración en cualquier
periodo t es la misma que la distribución original de la vida útil.

Otras propiedades de la distribución exponencial

1. Sean X1 y X2 variables aleatorias exponenciales con tasas λ1 y λ2 respectivamente, entonces:

1
P ( X 1  X 2) 
1   2

2. Si X1, . . . ,Xn son variables aleatorias independientes, distribuidas exponencialmente con


parámetro μi Entonces la mas pequeña de estas variables se distribuye como una exponencial con
141
tasa igual a la suma de las μi. Es decir, si Z = min. {X1, . . . ,Xn}, entonces:

Z ~ Exp (μ1+..…+μn)

Parámetros de la distribución exponencial

1. Media E(X) = l / λ

2. Varianza V(X) = 1 / λ2

Ejemplos:

1. Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en años está
dado por la variable aleatoria T, distribuida exponencialmente con promedio de falla de 5
componentes por año, sí 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la
probabilidad de que al menos 2 continúen funcionando después de 8 años?
Solución:

La probabilidad de que un determinado componente esté funcionando aún después de 8 años es:

 t 8
1
P (T  8)   e 5 dt  e 5  0.2
58

Sea x el número de componentes funcionando después de 8 años. Entonces mediante la


distribución Binomial,
n=5
p = 0.20 = probabilidad de que un componente esté funcionando después de 8 años
q = 1-p = 0.80 = probabilidad de que un componente no funcione después de 8 años
P(X  2) = P(X= 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1 – [P(X = 0) + P(X = 1)]

=1-0.7373 = 0.2627

2. El tiempo que transcurre antes de que una persona sea atendida en un establecimiento
comercial es una variable aleatoria que tiene una distribución exponencial con una media de 4
minutos. ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3
minutos en al menos 5 de los 6 días siguientes?
Solución:

3 t 1 3 3
1   
P (T  3)   e 4 dt  e 4  1 e 4
 0.5276
40 0
142
X = número de días en que un cliente es atendido antes de que transcurran 3 minutos
X = 0, 1, 2,...,6 días
p = probabilidad de que un cliente sea atendido antes de que transcurran 3 minutos en un día
cualquiera = 0.5276
q = probabilidad de que un cliente no sea atendido antes de que transcurran 3 minutos en un día
cualquiera = 1- p = 0.4724

P(X  5) = P(X= 5) + P(X = 6) = 0.11587 + 0.02157 = 0.13744

3. Supóngase que los tiempos transcurridos entre llegadas a cierta estación de peaje se distribuye
de manera exponencial con una media de ½ minuto.
a. Cual es la varianza de los tiempos entre llegadas
b. Cual es la probabilidad de que el tiempo transcurrido entre dos llegadas
consecutivas este comprendido entre 0 y 1 minuto.
c. Cual es el valor de P(X ≥ 2)
Solución:
1 1
a. Como la media es ½ minuto entre llegadas →    V( x )  2
4
2 1
 
2
 x
b. P(X  1)  1  e

4. Una maquina textilera produce con 10 defectos en cada 50 m de tela.


a. Cual es la probabilidad de que la longitud entre 2 defectos consecutivos sea menor a 4 m.
b. Cual es la probabilidad de que la longitud entre 2 defectos consecutivos este entre 6 y 8 m

5. A una peluquería acude un promedio de 16 clientes entre las 8 y la 12 de la mañana. Los


clientes llegan de acuerdo a una distribución de Poisson.
a. Cual es la probabilidad de que el tiempo entre 2 llegadas consecutivas de clientes sea
superior a 3 minutos.
b. Cual es la probabilidad de que el tiempo entre 2 llegadas consecutivas de clientes este
comprendido entre 4 y 7 minutos.

6. Supóngase que en una entidad bancaria, se atiende en promedio a cuatro clientes cada seis
minutos, supóngase también que el número de clientes atendidos sigue una distribución de
Poisson.
a. Cual es la probabilidad de que se empleen más de tres minutos en atender a un cliente.
b. Cual es la probabilidad de que el tiempo de atención a un cliente este comprendido entre
dos y cuatro minutos.
143
DISTRIBUCIÓN DE PROBABILIDAD I  CUADRADA

Considerando nuevamente las muestras aleatorias independientes de distribuciones


normales, sabemos que : 1  n1  1S1 /  1 y 2  n2  1S2 /  2
2 2 2 2 2 2

Tienen distribuciones  2 independientes con:


v1  n1  1 y v 2  n2  1
Grados de libertad, respectivamente. Esto implica que:

 12 / v1 n1  1S12 /  12 n1  1 S12 /  12


F 2  
 2 / v 2 n 2  1S 22 /  22 n 2  1 S 22 /  22

Tiene una distribución F con n 1  1 grados de libertad del numerador y n2  1


grados de libertad del denominador.
En al figura Siguiente se muestra la gráfica de una típica función de densidad F . Los
valores de F tales que PF  F    se dan en las tablas de la distribución F, para los
valores de   0,100, 0,050, 0,025, 0,010 y 0,005. En esas tablas, los encabezados de las
columnas corresponden a los grados de libertad del numerador, en tanto que los grados de
libertad del denominador se encuentran como los encabezados principales de los renglones.
Frente a los grados de libertad del denominador (los encabezados de los renglones), se
encuentran los valores de   0,100, 0,050, 0,025, 0,010 y 0,005. Por ejemplo, si la variable F
estudiada tiene 5 grados de libertad del numerador y 7 grados de libertad del denominador, F 0.100
= 2.88, F 0.050 = 3.97, F 0.025 = 5.29, F 0.010 = 7,46 y F 0.005 = 9.52. Luego la probabilidad de que
una variable aleatoria con una distribución F con 5 grados de libertad del numerador y 7 grados
de libertad del denominador exceda de 7.46 es 0,01. Lo correspondiente se afirma para los demás
casos.

f u 
Una típica función de densidad 
De probabilidad F
F
u
DISTRIBUCION "T DE STUDENT"

Supóngase que se toma una muestra de una población normal con media µ y varianza
 2
x es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la
144
x
distribución z  es una distribución normal estándar. Supóngase que la varianza de la

n
desconocida. ¿Qué sucede con la distribución de este estadístico si se reemplaza
σ por s? La distribución t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son  = 0 para  >2,
respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de
la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y
unimodales, y el valor máximo de la ordenada se alcanza en la media  = 0
la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribución normal. A medida que el número de grados de libertad tiende a
infinito, la forma límite de la distribución t es la distribución normal estándar.

Propiedades de las distribuciones t


Cada curva t tiene forma de campana con centro en 0.
Cada curva t, está más dispersa que la curva normal estándar z.
A medida que  aumenta, la dispersión de la curva t correspondiente disminuye.
A medida que   ∞, la secuencia de curvas t se aproxima a la curva normal estándar, por lo que
la curva z recibe a veces el nombre de curva t con gl = ∞
La distribución de la variable aleatoria t está dada por:

v  1 / 2  t 2 
 ( v 1) / 2

h(t)  1     t  
( v / 2) v  v

Esta se conoce como la distribución t con  grados de libertad.


Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con
x
media µ y desviación estándar σ. Entonces la variable aleatoria t  tiene una distribución t
s
n
145
con  = n- 1 grados de libertad.

La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de


W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la
publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo
en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente se llama
distribución t de Student, o simplemente distribución t. Para derivar la ecuación de esta
distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque
esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales
que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se
aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la
muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito
las dos distribuciones serán las mismas.
Se acostumbra representar con t el valor t por arriba del cual se encuentra un área igual a
α. Como la distribución t es simétrica alrededor de una media de cero, tenemos t1  t ; es
decir, el valor t que deja un área de 1-α a la derecha y por tanto un área de α a la izquierda, es
igual al valor t negativo que deja un área de α en la cola derecha de la distribución. Esto es, t 0.95 =
-t0.05, t0.99=-t0.01, etc.

Ejemplo:
El valor t con  = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un
área de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene
que hacer la resta de 1-α. La manera de encontrar el valor de t es buscar el valor de α en el primer
renglón de la tabla y luego buscar los grados de libertad en la primer columna y donde se
intercepten α y  se obtendrá el valor de t.

Ejemplo:
Encuentre la probabilidad de –t0.025 < t < t0.05.
Solución:
146

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda,
encontramos un área total de 1-0.05-0.025 = 0.925.
P (–t0.025 < t < t0.05) = 0.925

Ejemplo:
Encuentre k tal que P (k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se
selecciona de una distribución normal.
Solución:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este
valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta
0.05 y 0.045 se tiene un valor de 0.005, que eq
el primer renglón con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor
de α está en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:
P (-2.977 < t < -1.761) = 0.045

Ejemplo:

Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes
es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra
de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su
afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por
milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos
es aproximadamente normal.
Solución:

De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. El fabricante queda
satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.
147
Se procede a calcular el valor de t:
x   518  500
t   2,25
s 40
n 25
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor
de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de
0.02. De aquí que es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.

DISTRIBUCION DE PROBABILIDAD BETA.

La distribución de probabilidad beta es una función de densidad con dos parámetros


definida en el intervalo cerrado 0 <= y <= 1. Se utiliza frecuentemente como modelo para
fracciones, tal como la proporción de impurezas en un producto químico o la fracción de tiempo
que una maquina está en reparación.
Función de densidad probabilidad:
 ,   0;0  y  1
y 1 (1  y )  1
f ( y)  {
B( ,  )
En cualquier otro punto donde
 ( ) (  )
B( ,  )   y 1 (1  y )  1 dy 
 (   )
Nótese que la definición de (y) sobre el intervalo 0≤ y ≤ 1 restringe su aplicación. Si c≤ y
≤ d, y = (y- c) / (d- c) definirá una nueva variable en el intervalo 0≤ y ≤ 1. Así la función de
densidad beta se puede aplicar a una variable aleatoria definida en el intervalo c≤ y ≤ d mediante
una traslación y una medición en la escala.
La función de distribución acumulativa para la variable aleatoria beta se llama
comúnmente función beta y esta dada por:
t  1 (1  t )  1
F ( y)  0 dt  I y ( ,  )
y

B( ,  )
Para valores enteros de alfa y beta, Iy (alfa, beta) está relacionada con la función de
probabilidad binomial. Cuando y = p, se puede demostrar que:

y  1 (1  y )  1 n
F ( p)   dy   p y (1  p) n  y
B( ,  ) y 

En donde 0 < p < 1 y n igual a alfa más beta menos uno.


148
DISTRIBUCIÓN WEIBULL

Devuelve la probabilidad de una variable aleatoria siguiendo una distribución de Weibull.


Esta distribución se aplica en los análisis de fiabilidad, para establecer, por ejemplo, el periodo de
vida de un componente hasta que presenta una falla.
La ecuación para la función de distribución acumulada de Weibull es:

F x, ,    1  e  x  

La función de densidad de probabilidad es:


  1   x  
f x,  ,   

x e .

Cuando  = 1 la distribución de Weibull devuelve la distribución exponencial con:
1
 .

DISTRIBUCION DE PROBABILIDAD F

Supóngase que deseamos comparar las varianzas de dos poblaciones normales basados en
la información contenida en muestras aleatorias independiente de las dos poblaciones. Supóngase
que una muestra aleatoria contiene n1 variables aleatorias distribuidas normalmente con una
varianza común  12 y que la otra muestra aleatoria contiene n 2 variables aleatorias distribuidas
normalmente con una varianza común  12 y que la otra muestra aleatoria contiene n 2 variables
aleatorias distribuidas normalmente con una varianza común  12 . Si calculamos S12 de las
observaciones en la muestra 1, entonces S12 es una estimación de  12 . De manera similar, S 22
calculada a partir de las observaciones de la segunda muestra es una estimación para  22 . Así
2 2
intuitivamente podríamos pensar en utilizar S 1 / S 2 para hacer inferencias con respecto a las
magnitudes relativas de  12 y  22 . Si dividimos cada S i2 por  i2 , entonces la razón siguiente

S 12 /  12   22  S 12 
  
S 22 /  22   12  S 22 

Tiene una distribución F con n1  1n2  1 grados de libertad. La definición general de
una distribución F es como sigue:

Definición Sean  12 y  22 variables aleatorias ji - cuadrada con v1 y v 2 grados de libertad.


Respectivamente. Entonces si  12 y  22 son independientes,
149
 / v1
2

F 1

 / v2
2
2

Se dice que tiene una distribución F con v1 grados de libertad del numerador y v 2
grados de libertad del denominador.
La función de densidad para variables aleatorias con la distribución F es un miembro de
la familia de las distribuciones beta. Omitimos la formula para la densidad de una variable
aleatoria con la distribución F , pero el método para obtenerla se indica en los ejercicios al final
del capitulo.

Problemas Propuestos de Distribución de Probabilidades Continuas

Normal

1. Si X se distribuye N (0,1) Hallar:


a) P(1.2  X  2.4) d) P( X  1.64)
b) P(1.23  X  1.87) e) P(1.96  X  1.96)
c) P(2.35  X  0.5)

2. La longitud de los peces de un río sigue un modelo normal con media 6,8 pulgadas y
varianza 0.09 pulgadas cuadradas. Si se extrae una muestra de 300 peces ¿Cuántos peces
de la muestra tendrán una longitud :
i) Mayor que 7,2 pulgadas?
ii) Menor o igual a 6,4 pulgadas?
iii) Entre 6,5 y 7,1 pulgadas?

3. El acero que se utiliza para tuberías de agua a menudo se recubre internamente con un
mortero de cemento para evitar la corrosión. En un estudio de los recubrimientos de
mortero de una tubería empleada en un proyecto de transmisión de agua en California se
especificó un espesor de 7/16 pulgadas para el mortero. Un gran número de mediciones de
espesor dieron una media de 0.635 pulgadas y una desviación estándar de 0.082 pulgadas.
Sí las mediciones de espesor, tenían una distribución Normal, ¿qué porcentaje aproximado
fue inferior a 7/16 de pulgada?

4. Un tubo fluorescente estándar tiene una duración distribuida Normalmente, con una media
de 7,000 horas y una desviación estándar de 1,000 horas. Un competidor ha inventado un
sistema de iluminación fluorescente compacto que se puede insertar en los receptáculos de
lámparas incandescentes. El competidor asegura que el nuevo tubo compacto tiene una
duración distribuida Normalmente con una media de 7,500 horas y una desviación estándar
de 1,200 horas.
150
a. ¿Cuál tubo fluorescente tiene mayor probabilidad de tener una duración mayor de
9,000 horas?
b. ¿Cuál tubo tiene mayor probabilidad de tener una duración de menos de 5,000 horas?

5. Supongamos que el peso de los habitantes de una población sigue un modelo normal con
media 71.3 kilos y una desviación estándar de 20,2 kilos. Hallar porcentaje de habitantes con
un peso:
i) Inferior o igual a 46 kilos.
ii) Entre 55,2 y 59,8 kilos
iii) Entre 69 y 80,5 kilos.
iv) Mayor o igual a 92 kilos.

6. La distribución de la demanda (en número de unidades por unidad de tiempo) de un


producto a menudo puede aproximarse con una distribución de probabilidad Normal. Por
ejemplo, una compañía de comunicación por cable ha determinado que el número de
interruptores terminales de botón solicitados diariamente tiene una distribución Normal, con
una media de 200 y una desviación estándar de 50.
a) ¿En qué porcentaje de los días la demanda será de menos de 90 interruptores?
b) ¿En qué porcentaje de los días la demanda estará entre 225 y 275 interruptores?
c) Con base en consideraciones de costos, la compañía ha determinado que su mejor
estrategia consiste en producir una cantidad de interruptores suficiente para atender
plenamente la demanda en 94% de todos los días. ¿Cuantos interruptores terminales
deberá producir la compañía cada día?

7. Supongamos que una máquina fabrica tapas para tarros cuyo diámetro sigue un modelo
normal con una media de 2,5 pulgadas y una desviación estándar de 0,25 pulgadas. El
departamento de control de calidad considera defectuosa una tapa si su diámetro es menor o igual
2 pulgadas o mayor o igual a 2,8 pulgadas. ¿Hallar el porcentaje de tapas defectuosas
producidas por esa máquina?

8. Para aplicar un tratamiento se toma una muestra de 200 ratas cuya longitud promedio fue de
2,1 pulgadas con una varianza de 0,01 pulgadas cuadradas. Si el tamaño de las ratas sigue un
modelo normal.
a.¿Cuántas ratas de la muestra tienen un tamaño:
i) Que exceda las 2 pulgadas?
ii) Menor o igual a 1.98 pulgadas?
iii) Entre 1.98 y 2.23 pulgadas?
b. ¿Cuál es el tamaño mínimo del 5% de las ratas más grandes?

9. El peso verdadero de prematuros nacidos en una clínica, sigue un modelo normal con media
2.8 kilos y desviación estándar 0.46 kilos. ¿Cuál es la probabilidad de que un prematuro que
nazca en la clínica pese por lo menos 2.5 kilos?
151

10. Si las alturas de 300 estudiantes sigue un modelo normal con media 68 pulgadas y
varianza 9 pulgadas 2 ¿Cuántos estudiantes de la muestra tienen alturas :
a) Mayor de 72 pulgadas ?
b) Menor o igual a 64 pulgadas?
c) Entre 65 y 71 pulgadas?
d) Menor o igual a 68 pulgadas?

11. En un quiosco de periódicos se supone que el número de ventas diarias se distribuye


normalmente con media 30 y varianza 2. Determinar:
a) Probabilidad de que en un día se vendan entre 13 y 31 periódicos.
b) Determinar el máximo número de periódicos que se venden en el 90% de las ocasiones.
c) Supongamos que en una ciudad hay 10 quioscos independientes del mismo tipo y con las
mismas características. Determinar la probabilidad de que más de dos quioscos vendan
entre 13 y 31 periódicos.

Exponencial

1. El tiempo de reparación de unas máquinas de escribir tiene una distribución


aproximadamente exponencial, con media 22 minutos.
a. Hallar la probabilidad de que el tiempo de reparación sea menor que diez minutos.
b. Para efectuar una programación, ¿cuanto tiempo se debe asignar a cada reparación para que
la probabilidad de que cualquier tiempo de reparación mayor que el tiempo asignado sea solo
de 0.1?

2. El personal de la compañía Onda S.L. usa una Terminal para realizar sus pedidos
internacionales. Si el tiempo que cada comercial gasta en una sesión en la Terminal tiene
una distribución exponencial con media 36 minutos, encontrar:
a) Probabilidad de que un comercial utilice la Terminal 30 minutos o menos.
b) Si un comercial a estado 30 minutos en la Terminal, ¿Cuál es la probabilidad de que pase
al menos una hora más en la Terminal?.
c) El 90% de las sesiones terminan en menos de R minutos. ¿Cuánto vale R?

3. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una


distribución exponencial con media de 16 años.
a) ¿Cuál es la probabilidad de que a una persona a la que se le ha implantado este marcapasos
se le deba reimplantar otro antes de 20 años? Si el marcapasos lleva funcionando
correctamente 5 años en un paciente.
b) ¿Cuál es la probabilidad de que haya que cambiarlo antes de 25% años?
152

4. El tiempo que una persona espera la llegada del autobús se distribuye exponencialmente
con media de 10 minutos, es decir, λ = 1/10.
a. Cual es la probabilidad de que el pasajero espere más de 5 minutos al autobús?
b. La probabilidad de que el tiempo de espera sea de mas de quince minutos? Cual es esta
probabilidad si ya ha esperado 10 minutos?

5. Supongamos que la vida de un bombillo se distribuye exponencialmente con media de 10


horas. Una persona entra en la habitación cuando el bombillo esta encendido y desea
trabajar por cinco horas.
i. Cual es la probabilidad de que la persona concluya su trabajo antes de que el bombillo
se dañe?
ii. Que se puede decir de esta probabilidad si la distribución no fuera exponencial?

6. Supongamos que se tiene una cadena de música que consiste en un reproductor de CD’s y
un altavoz. Si la vida del reproductor de CDs es exponencial con media de 1000 horas y la
del altavoz exponencial con media 500 horas e independiente de la del reproductor. Cual
es la probabilidad de que un fallo del sistema sea causada por el reproductor?
153
Teoría del Muestreo

La estadística Inferencial, es el proceso por el cual se deducen (infieren) propiedades o


características de una población a partir de una muestra significativa. Uno de los aspectos
principales de la inferencia es la estimación de parámetros estadísticos. Por ejemplo, para
averiguar la media, µ, de las estaturas de todos los soldados de un reemplazo, se extrae una
muestra y se obtiene su media, x . La media de la muestra (media muestral), x , es un estimador
de la media poblacional, µ. El punto de interés es la muestra, la cual debe ser representativa de la
población objeto de estudio.

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras reflejen
observaciones a la población de la que proceden, ya que solo se pueden hacer observaciones
probabilísticas sobre una población cuando se usan muestras representativas de la misma.
Si el proceso de muestreo está bien realizado (es decir, la muestra tiene el tamaño adecuado y ha
sido seleccionada aleatoriamente), entonces el valor de µ, desconocido, puede ser inferido a partir
de x .

Población y Muestra

Población
La población es un agregado de unidades individuales, compuesto de personas o cosas
que se hallan en una situación determinada. Las unidades individuales se llaman unidades
elementales. Definir una población es determinar sus unidades elementales de acuerdo con el
interés que se tiene respecto a alguna característica de aquélla.
Tanto la definición de una población como la característica por observar de sus unidades
elementales dependen de la naturaleza del problema. Por ejemplo, si el problema es "Camisas
para personas adultas de un país", se trata de determinar la cantidad adecuada de producción de
camisas de acuerdo con las diversas medidas. La población son todas las personas adultas de ese
país. La característica de interés son las medidas del cuello de las personas adultas en dicho país.

Las poblaciones pueden ser infinitas o finitas.

Una población infinita es la que contiene un número infinito de unidades elementales; por
ejemplo, el conjunto de piezas que se obtienen en un proceso productivo; en el sentido de que se
siguen produciendo indefinidamente. Otro ejemplo son todos los posibles resultados al lanzar una
moneda sin cesar.

Una población es finita cuando tiene un número finito de unidades elementales. Por
ejemplo, los estudiantes de una determinada universidad; el número de escuelas que existen en
154
una determinada ciudad, el número de árboles de coco sembrados en una determinada parcela,
etcétera. (El número de unidades elementales de una población se denota con la letra N).

Muestra
Una muestra es una parte de la población; por ejemplo, cuando se desea hacer un estudio
relativo al rendimiento académico de los alumnos de cierta universidad, y para esto se toma sólo
un grupo de estudiantes de la misma. Todos los estudiantes de ella son la población y el grupo
escogido constituye la muestra. Es importante hacer notar que para hacer una investigación
mediante el análisis de una muestra, ésta tiene que ser, necesariamente, representativa. La
representatividad de la muestra implica que cada unidad de la población debe tener igual
probabilidad de ser seleccionada. En estas condiciones, se dice que la muestra es aleatoria. La
obtención de una muestra representativa es uno de los aspectos más importantes de la teoría
estadística, estas se utilizan por muchas razones; una enumeración completa de la población,
llamada censo, puede ser económicamente imposible, o no se cuenta con el tiempo suficiente. (El
número de unidades elementales de una muestra se denota con la letra n).

A continuación se verá algunos usos del muestreo en diversos campos:


Política. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinión pública y el apoyo en las elecciones.
Educación. Las muestras de las calificaciones de los exámenes de estudiantes se usan para
determinar la eficiencia de una técnica o programa de enseñanza.
Industria. Muestras de los productos de una línea de ensamble sirve para controlar la
calidad.
Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos prueban la
eficacia de una técnica o de un fármaco nuevo.
Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la producción
los efectos de un fertilizante nuevo.
Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los criterios
del público sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

Parámetros y Estadísticos

Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones


como la media, la mediana, la moda y la desviación estándar. Cuando estos términos describen
las características de una muestra, se denominan estadísticos. Cuando describen las características
de una población, se llaman parámetros. Un estadístico es una característica de una muestra y un
parámetro es una característica de una población.
155
Diferencias entre poblaciones y muestras

Población Muestra

Definición Colección de elementos Parte o porción de la


considerados población seleccionada para
su estudio
Características “Parámetros” “Estadísticos”
Símbolos Tamaño de la población = N Tamaño de la muestra = n
Media de la población = μ Media de la muestra = x
Desviación estándar de la Desviación estándar de la
población = σ muestra = s

Símbolos estándar: N, μ, σ, y n , x , s
Para ser consecuentes, los estadísticos emplean letras latinas minúsculas para denotar
estadísticos de muestra y letras griegas o latinas mayúsculas para representar parámetros de
población. En la tabla 1 se enumeran estos símbolos y se resumen sus definiciones.

Errores en el Muestreo
Cuando se utilizan valores muéstrales, o estadísticos para estimar valores poblacionales, o
parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma
población.
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamaño sean representativas de una cierta
población, no esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral es
un concepto importante que ayudará a entender mejor la naturaleza de la estadística inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores muéstrales y se
denominan errores no muéstrales.

El Sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a


una tendencia sistemática inherente a un método de muestreo que da estimaciones de un
parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el
parámetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización. La
aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el
que la selección es imparcial o no está sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.
156
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la
misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Ejemplos
1. Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no ordenada y
este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en trozos
separados de papel, una tarea tremenda, luego los colocamos en un recipiente y después los
revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de
papel con cinco nombres. Un procedimiento más simple para elegir una muestra aleatoria sería
escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y después extraer cinco papeles al mismo tiempo.

Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20


utiliza una tabla de números aleatorios. Se puede construir la tabla usando una calculadora o una
computadora. También se puede prescindir de estas y hacer la tabla escribiendo diez dígitos del 0
al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ahí, la primera tira
seleccionada determina el primer número de la tabla, se regresa al recipiente y después de
revolver otra vez se selecciona otra tira, esta determina el segundo número de la tabla; el proceso
continúa hasta obtener una tabla de dígitos aleatorios con tantos números como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,
imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas
nacionales de opinión sobre productos o sobre elecciones presidenciales, sería muy costoso o
tardado.

El muestreo estratificado requiere de separar a la población según grupos que no se


traslapen llamados estratos, y de elegir después una muestra aleatoria simple en cada estrato. La
información de las muestras aleatorias simples de cada estrato constituiría entonces una muestra
global.
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una
gran universidad. Puede ser difícil obtener una muestra con todos los profesores, así que
supongamos que elegimos una muestra aleatoria de cada colegio, o departamento académico; los
estratos vendrían a ser los colegios, o departamentos académicos.

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de


unidades heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de la
157
población pertenece exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogéneos o disímiles.
Suponga que una compañía de servicio de televisión por cable está pensando en abrir una
sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el
porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa,
la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea
posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados para
estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se
realizan, generalmente, con base en el muestreo por conglomerados.

El muestreo sistemático es una técnica de muestreo que requiere de una selección


aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida usando
algún sistema o regla.
Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los números de las páginas del directorio telefónico;
al elegir el vigésimo nombre de cada página obtendríamos un muestreo sistemático, también
podemos escoger un nombre de la primera página del directorio y después seleccionar cada
nombre del lugar número cien a partir del ya seleccionado. Por ejemplo, podríamos seleccionar
un número al azar entre los primeros 100; supongamos que el elegido es el 40, entonces
seleccionamos los nombres del directorio que corresponden a los números 40, 140, 240, 340 y así
sucesivamente.

Error Muestral

Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media
poblacional μ, entonces la media muestral, como medida, conlleva algún error. Por ejemplo,
supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una población con media
μ = 15: si la media de la muestra es x =12, entonces a la diferencia observada x - μ = -3 se le
denomina el error muestral. Una media muestral x puede pensarse como la suma de dos
cantidades, la media poblacional μ y el error muestral; si e denota el error muestral, entonces:

X  e

Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6, para


simular una población "grande" de manera que el muestreo pueda realizarse un gran número de
veces, supondremos que éste se hace con reemplazo, es decir, el número elegido se reemplaza
antes de seleccionar el siguiente, además, se seleccionan muestras ordenadas. En una muestra
ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra
158
ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero
4 y después 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2
que es posible seleccionar con reemplazo y también contiene las medias muéstrales y los
correspondientes errores muéstrales. La media poblacional es igual a: μ = (2+4+6)/3 = 4.
Nótese las interesantes relaciones siguientes contenidas en la tabla:
La media de la colección de medias muéstrales es 4, la media de la población de la que se
extraen las muestras. Si  X denota la media de todas las medias muéstrales entonces tenemos:
 X = (3+4+3+4+5+5+2+4+6)/9 = 4
La suma de los errores muéstrales es cero.
e1 + e2 + e3 +. . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0

Muestra x Error muestral, e = x -μ


(2,2) 2 2 – 4 = -2
(2,4) 3 3 – 4 = -1
(2,6) 4 4–4=0
(4,2) 3 3 – 4 = -1
(4,4) 4 4–4=0
(4,6) 5 5-4=1
(6,2) 4 4–4=0
(6,4) 5 5-4=1
(6,6) 6 6–4=2

En consecuencia, si x se usa para medir, estimar, la media poblacional μ, el promedio de


todos los errores muéstrales es cero.

Distribuciones Muéstrales

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la
misma población tenga la misma media muestral o que sean completamente parecidas; puede
esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en
una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la
distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy
importantes en el estudio de la estadística inferencial, porque las inferencias sobre las
poblaciones se harán usando estadísticas muéstrales. Como el análisis de las distribuciones
asociadas con los estadísticos muéstrales, podremos juzgar la confiabilidad de un estadístico
muestral como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
159
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se
le puede considerar como una variable aleatoria con su correspondiente distribución de
frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribución
muestral. En general, la distribución muestral de un estadístico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población
grande. Se calcula la media muestral x para cada muestra; la colección de todas estas medias
muéstrales recibe el nombre de distribución muestral de medias.
Ahora bien si se calcula la desviación estándar de cada una. La colección de todas estas
desviaciones estándar muéstrales se llama distribución muestral de la desviación estándar.

Ejemplo
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6.
Encuentre:
La media poblacional. (μ)
La desviación estándar poblacional. (σ)
La media de la distribución muestral de medias. (  X )
La desviación estándar de la distribución muestral de medias. (  X , )
Solución: REVISAR
Muestra x
(0,0) 0
(0,2) 1
(0,4) 2
(0,6) 3
(2,0) 1
(2,2) 2
(2,4) 3
(2,6) 4
(4,0) 2
(4,2) 3
(4,4) 4
(4,6) 5
(6,0) 3
(6,2) 4
(6,4) 5
(6,6) 6
160
La media poblacional es:

0246
 3
4
La desviación estándar de la población es:

(0  3) 2  (2  3) 2  (4  3) 2  (6  3) 2
  2.236
4

La media de la distribución muestral de medias es:

X 
 (fx)  0  1  1 2  2  3  3  4  4  3  5  2  6  1  48  3
n 16 3
c) La desviación estándar de la distribución muestral de medias es:

X 
 (x   X )2 f
n

(0  3) 2  1  (1  3) 2  2  (2  3) 2  3  (3  3) 2  4  (4  3) 2  3  (5  3) 2  2  (6  3) 2  1
X   1.58
16

 2.236
De aquí que podamos deducir que:  X    1.58
n 2

Como para cualquier variable aleatoria, la distribución Muestral de medias tiene una
media o valor esperado, una varianza y una desviación estándar, se puede demostrar que la
distribución muestral de medias tiene una media igual a la media poblacional. Esto
es:  X  E ( x )    3

Distribuciones muéstrales

Después de haber realizado el ejercicio anterior se puede ver que una distribución
muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y
calculándoles a éstas su estadístico.

Si la población de la que se extraen las muestras es normal, la distribución muestral de


medias será normal sin importar el tamaño de la muestra.

Por consiguiente si la población de donde se extraen las muestras no es normal, entonces


el tamaño de la muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una
161
forma acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución
muestral de ser normal.

Para muchos propósitos, la aproximación normal se considera buena si se cumple n = 30.


La forma de la distribución muestral de medias sea aproximadamente normal, aún en casos donde
la población original es bimodal, es realmente notable.

Teorema del límite central

Si se seleccionan muestras aleatorias de n observaciones de una población con media μ y


desviación estándar σ, entonces, cuando n es grande, la distribución muestral de medias tendrá
aproximadamente una distribución normal con una media igual a μ y una desviación estándar de
 . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.
n

El teorema del límite central es de importancia fundamental para la estadística porque


justifica el uso de métodos de curva normal en una gran variedad de problemas; se aplica a
poblaciones infinitas y también a poblaciones finitas cuando n, a pesar de ser grande, no
constituye más que una pequeña porción de la población. Es difícil señalar con precisión qué tan
grande debe ser n de modo que se pueda aplicar el teorema del límite central, pero a menos de
que la distribución de la población tenga una forma muy inusual, por lo regular se considera que
n = 30 es lo suficientemente alto. Nótese que cuando en realidad estamos tomando una muestra
de una población, la distribución del muestreo de la media es una distribución normal, no
obstante el tamaño de n.

Ejemplo
En el ejercicio de elegir muestras ordenadas de tamaño 2, con reemplazo, de la población de
valores 0, 2, 4 y 6, podemos calcular lo siguiente:
El error muestral de cada media
162
La media de los errores muéstrales
La desviación estándar de los errores muéstrales.
Solución:
Muestra x Error muestral, e = x -μ
(0,0) 0 0-3 = -3
(0,2) 1 1 – 3 = -2
(0,4) 2 2 – 3 = -1
(0,6) 3 3–3=0
(2,0) 1 1 – 3 = -2
(2,2) 2 2 – 3 = -1
(2,4) 3 3–3=0
(2,6) 4 4–3=1
(4,0) 2 2 – 3 = -1
(4,2) 3 3–3=0
(4,4) 4 4–3=1
(4,6) 5 5-3=2
(6,0) 3 3–3=0
(6,2) 4 4–3=1
(6,4) 5 5-3=2
(6,6) 6 6–3=3

La media de los errores muéstrales es μe, es:

(3)  (2)  (1)  0  .....  2  3


e  0
16

La desviación estándar de la distribución de los errores muéstrales σe, es entonces:

e   (e   ) f 
e
2

N
(3  0) 21  (2  0) 2 2  (1  0) 2 3  (0  0) 2 4  (1  0) 2 3  (2  0) 2 2  (3  0) 21
  1.58
16
La desviación estándar de la distribución muestral de un estadístico se conoce como error
estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por σx, es
1.58. Con esto se puede demostrar que si de una población se eligen muestras de tamaño n con
reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la
distribución de los errores muéstrales.
En general se tiene:  x   e
163
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la
formula siguiente para encontrar σx.

 Nn
x 
n N 1

Donde σ es la desviación estándar de la población de donde se toman las muestras, n es el


tamaño de la muestra y N el de la población.
Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población
es al menos 20 veces el tamaño de la muestra (N 20), entonces se puede usar la fórmula.
Nn
El factor se denomina factor de corrección para una población finita.
N 1
Ejemplo:
Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres Docentes
Universitarios de Matemáticas:

Docente de Matemáticas Antigüedad


A 6
B 4
C 2

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la
antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la
desviación estándar de la distribución muestral.
Solución:
Se pueden tener 3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2, con
sus respectivas medias muéstrales.

Muestras Antigüedad Media muestral


A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3

246
La media poblacional es:  4
3
543
La media de la distribución muestral es:  x  4
3
La desviación estándar de la población es:
164
(6  4) 2  (4  4) 2  (2  4) 2
  1.63
3
El error estándar o la desviación estándar de la distribución muestral es:
(5  4) 2  (4  4) 2  (3  4) 2
  0.816
3
Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:
 1.63
x    1.152
n 2
Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección
obtendremos el valor correcto:
 N  n 1.63 3  2
x    0.816
n N 1 2 3 1

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error
estándar:

Distribución Muestral de Medias

Si recordamos a la distribución normal, esta es una distribución continua, en forma de


campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica.
Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la
variable aleatoria, mediante la siguiente fórmula:

x 
z

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.
Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio,
utilizando la tabla de la distribución z.
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier
tamaño de una población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal con
   x y    x , entonces la fórmula para calcular la probabilidad del comportamiento del
estadístico, en este caso la media de la muestra, quedaría de la siguiente manera:

x 
z

n
Para poblaciones finitas y muestro con reemplazo:
165
x 
z
 Nn
n N 1
Ejemplo:
Una empresa eléctrica fabrica Bombillos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 Bombillos tenga una vida promedio
de menos de 775 horas.
Solución

775  800
z  2.5
40
16
Este valor se busca en la tabla de z P(x  775)  P(z  2.5)  0.0062
La interpretación sería que la probabilidad de que la media de la muestra de 16 Bombillos sea
menor a 775 horas es de 0.0062.

Ejemplo:
Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una
media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200
muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:
El número de las medias muéstrales que caen entre 172.5 y 175.8 centímetros.
El número de medias muéstrales que caen por debajo de 172 centímetros.
Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin
reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el
denominador de Z para sólo sustituirlo en cada inciso.

 N  n 6.9 1000  25
  1.36
n N 1 25 1000  1

x 172.5  174.5


z   1.47
 N  n 1.36
n N 1
166

175.8  174.5
z  0.96
1.36
P (172.5≤ x ≤ 175.8) = 0.7607

(0.7607)(200) = 152 medias muéstrales


1752  174.5
z  1.83
1.36
P(x ≤ 172) = 0.00336

(0.0336)(200) = 7 medias muéstrales

Distribución Muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporción de artículos defectuosos o la proporción de alumnos
reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución
muestral de medias, a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción (p = x/n en donde "x" es el número de éxitos u observaciones de interés y
"n" el tamaño de la muestra) en lugar del estadístico media.

Una población binomial está estrechamente relacionada con la distribución muestral de


proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una
distribución muestral de proporciones contiene las posibilidades o proporciones de todos los
números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación,
las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la
aproximación normal a la binomial, siempre que np ≥5 y n(1-p) ≥ 5. Cualquier evento se puede
convertir en una proporción si se divide el número obtenido entre el número de intentos.
167
Veamos con un ejemplo la Generación de la Distribución Muestral de Proporciones

Ejemplo
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a
seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de
proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta
población es 4/12 = 1/3. Por lo que podemos decir que el 33% de las piezas de este lote están
defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es
12C5=792, las cuales se pueden desglosar de la siguiente manera:

Proporción Número de maneras


Artículos Artículos
de artículos en las que se puede
Buenos Defectuosos
defectuoso obtener la muestra

1 4 4/5=0.8 8C1*4C4=8

2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que hacer la


sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total
de muestras. Esto es:
(0.8  8)  (0.6  112)  (0.4  336)  (0.2  280)  (0  56) 1
p    0.3333
792 3
Como podemos observar la media de la distribución muestral de proporciones es igual a la
Proporción de la población.
μp = P
También se puede calcular la desviación estándar de la distribución muestral de proporciones:
168
(0.8  1 ) 2  8  (0.6  1 ) 2  112  (0.4  1 ) 2  336  (0.2  1 ) 2  280  (0  1 ) 2  56
p  3 3 3 3 3  0.1681
792
La varianza de la distribución binomial es σ 2= npq, por lo que la varianza de la
distribución muestral de proporciones es σ 2p = (pq)/n. Si se sustituyen los valores en esta fórmula
tenemos que:
( 1 )( 2 )
p  3 3  0.2108 , este valor no coincide con el de 0.1681, ya que nos falta agregar el
5
factor de corrección para una población finita y un muestreo sin reemplazo:

( 1 )( 2 ) 12  5 Pq N n
p  3 3  0.1681 p 
5 12  1 n N 1

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de


proporciones está basada en la aproximación de la distribución normal a la binomial. Esta
fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la
muestra.
pP
z
Pq
n
Nn
A esta fórmula se le puede agregar el factor de corrección de si se cumple con las
N 1
condiciones necesarias.

Ejercicios:

1. Se ha determinado que 60% de los estudiantes de una Universidad fuman cigarrillos. Se toma
una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la
muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solución:
169
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de
la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral
de proporciones.

Aproximación de la distribución normal a la binomial:


Datos:
n = 800 estudiantes P = 0.60 x = (.55) (800) = 440 estudiantes P (x ≤ 440) = ?
Media = n p = (800)(0.60) = 480
x  np 439.5  480
z   2.92
npq 800(0.6)(0.4)

p (x ≤ 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer
una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribución Muestral de Proporciones


Datos:
n =800 estudiantes P = 0.60 p = 0.55 p (p≤ 0.55) = ?

p  P 0.549375  0.60
z   2.92
Pq (0.6)(0.4)
n 800

Observe que este valor es igual al obtenido en el método de la aproximación de la


distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma
probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se
170
esta dividiendo entre el tamaño de la muestra, ya que estamos hablando de una proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo


que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa
universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.
2. Un medicamento para el dolor de cabeza tiene la advertencia de que algunos usuarios pueden
presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios
tienen tal reacción. Si una muestra aleatoria de 150 personas con dolor de cabeza usa el
medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que
realmente presentan una reacción adversa, exceda el 4%.
a. Resolverlo mediante la aproximación de la normal a la binomial
b. Resolverlo con la distribución muestral de proporciones
Solución:
Aproximación de la distribución normal a la binomial:
n =150 personas p = 0.03 x = (0.04) (150) = 6 personas p(x>6) = ?
Media = np = (150) (0.03)= 4.5

x  np 6.5  4.5
z   0.96
npq 150(0.03)(0.97)

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una
muestra de 150 personas, más de 6 presentarán una reacción adversa.

Distribución Muestral de Proporciones


n =150 personas P =0.03 P = 0.04 P (p>0.04) = ?
171
p  P 0.0433  0.03
z   0.96
Pq (0.03)(0.97)
n 150

Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad
del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04
presentando una reacción adversa.

3. Se sabe que la verdadera proporción de los componentes defectuosos fabricados por una
Empresa es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
Menos del 3% de los componentes defectuosos.
Más del 1% pero menos del 5% de partes defectuosas.
Solución:
n = 60 artículos P = 0.04 p = 0.03 p (p<0.03) = ?

p  P 0.0216  0.04
z   073
Pq (0.04)(0.96)
n 60

4. La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03
artículos defectuosos es de 0.2327.
Solución:
n = 60 artículos P = 0.04 P = 0.01 y 0.05 P (0.01<p<0.05) = ?
172
p  P 0.0183  0.04 p  P 0.0416  0.04
z   0.86 z   0.06
Pq (0.04)(0.96) Pq (0.04)(0.96)
n 60 n 60

Distribución Muestral de Diferencias y Sumas de Medias

Supóngase que se tiene dos poblaciones, para cada muestra de tamaño N 1 extraída de la
primera población se calcula el estadístico S1, esto proporciona una distribución muestral cuya
media y desviación Standard vienen dadas por  S1 y  S1 , respectivamente. Análogamente para
cada muestra de tamaño N2 extraída de la segunda población se calcula el parámetro estadístico
S2 cuya media y desviación Standard son  S 2 y  S 2 , respectivamente.
De todas las posibles combinaciones de estas muestras de las dos poblaciones se pueden
obtener una distribución de las diferencias S1-S2 que se conoce como distribución muestral de
diferencias de los estadísticos.

La media y la varianza de esta distribución se indican por respectivamente y su expresión


es:

s 1  s 2  s 1  s 2 s 1  s 2   S21   S2 2 , Siempre que las muestras sean independientes.

Si S1 y S2 son las medias muéstrales de las dos poblaciones que se expresan, entonces la
distribución muestral de las diferencias de medias para poblaciones infinitas con medias y
desviaciones Standard respectivamente se expresan como sigue:

(5)

que esta basado en el conjunto de ecuaciones (2).

Estas ecuaciones son válidas para poblaciones finitas sin el muestreo es con
reemplazamiento.
Para el caso de poblaciones finitas en las que el muestreo se realiza sin reemplazamiento,
se obtienen resultados similares partiendo de las ecuaciones (1).
Si el caso se trata de diferencias de distribuciones muéstrales de proporciones de dos
poblaciones con distribución binomial y parámetros p1, q1 y p2, q2 respectivamente. Entonces S1 y
S2 corresponden a las proporciones de éxito p1 y p2 y las ecuaciones (4) dan los resultados
siguientes:
173
A veces es útil considerar la distribución muestral de la suma de estadísticas.
La media y la desviación Standard de esta distribución vienen dadas por:
Todo lo anterior supone que las muestras son independientes.

Problemas propuestos

1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente con
media de 2000 libras y una varianza de 25,000 lbs2. Si se selecciona una muestra aleatoria de 100
cuerdas; determine la probabilidad de que en esa muestra:
La resistencia media encontrada sea de por lo menos 1958 libras.
La resistencia media se mayor de 2080 libras.

2. Como parte de un proyecto general de mejoramiento de la calidad, un fabricante textil decide


controlar el número de defectos encontradas en cada pieza de tela. Se estima que el número
promedio de defectos por cada pieza de tela es de 12, determine la probabilidad de que en la
próxima pieza de tela fabricada se encuentren:
Entre 10 y 12 defectos.
Menos de 9 y más de 15 defectos.

3. En una Prueba de aptitud la puntuación media de los estudiantes es de 72 puntos y la


desviación estándar es de 8 puntos. ¿Cuál es la probabilidad de que dos grupos de estudiantes,
formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuación media en:
3 ó más puntos.
6 o más puntos.
Entre 2 y 5 puntos.

4. Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las mujeres de
cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de 150 hombres y
150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen
ese leve desorden sanguíneo sea de:
Menos de 0.035 a favor de los hombres.
Entre 0.01 y 0.04 a favor de los hombres.

5. Una Caja contiene 80 bolas de las que 60% son rojas y 40% blancas. De un total de 50
muestras de 20 bolas cada una, sacadas de la caja con remplazamiento, ¿en cuántas cabe esperar
¿Igual número de bolas rojas y blancas?
¿12 bolas rojas y 8 blancas?
8 bolas rojas y 12 blancas?
174
10 ó mas bolas blancas?

6. Los pesos de 1500 Rodamientos se distribuyen normalmente con media de 2.40 onzas y
desviación estándar de 0.048 onzas. Si se extraen 300 muestras de tamaño 36 de esta población,
determinar la media esperada y la desviación estándar de la distribución muestral de medias, si el
muestreo se hace:
Con remplazamiento
Sin remplazamiento

7. La vida media de una máquina para hacer pasta es de siete años, con una desviación estándar
de un año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución
normal, encuentre:
La probabilidad de que la vida media de una muestra aleatoria de 9 de estas máquinas caiga entre
6.4 y 7.2 años.
El valor de la x a la derecha del cual caería el 15% de las medias calculadas de muestras
aleatorias de tamaño nueve.

8. Se llevan a cabo dos experimentos independientes en lo que se comparan dos tipos diferentes
de pintura. Se pintan 18 Piezas con el tipo A y en cada uno se registra el tiempo de secado en
horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estándar de la población son
ambas 1.0. Suponga que el tiempo medio de secado es igual para los dos tipos de pintura.
Encuentre la probabilidad de que la diferencia de medias en el tiempo de secado sea mayor a uno
a favor de la pintura A.
175
Estimación

Como ya hemos visto, el objetivo principal de la estadística inferencial es la estimación,


esto es que mediante el estudio de una muestra de una población se quiere generalizar las
conclusiones al total de la misma., los estadísticos varían mucho dentro de sus distribuciones
muéstrales, y mientras menor sea el error estándar de un estadístico, más cercanos serán unos de
otros sus valores.

Definición de estimador
Cualquier estadístico de muestra que se utilice para estimar un parámetro de población se
conoce como estimador, es decir, un estimador es un estadístico de muestra utilizada para estimar
un parámetro de población. La media de la muestra X puede ser un estimado de la media de la
población , y la porción de la muestra se puede utilizar como estimador de la porción de la
población. También podemos utilizar el alcance de la muestra como un estimador del alcance de
la población.

Propiedades de un Buen Estimador


Algunos estadísticos son mejores estimadores que otros. Afortunadamente, podemos
evaluar la calidad de un estadístico como estimador mediante el uso de cuatro criterios:

Insesgado.- Se dice que un estimador puntual  es un estimador insesgado de  si

E ( )   , para todo valor posible de θ. En otras palabras, un estimador insesgado es aquel para
el cual la media de la distribución muestral es el parámetro estimado. Si se usa la media muestral
x para estimar la media poblacional μ, se sabe que la  x   , por lo tanto la media es un
estimador insesgado.
 
Eficiente o con varianza mínima.- Suponga que  1 y  2 son dos estimadores
insesgados de θ. Entonces, aun cuando la distribución de cada estimador esté centrada en el valor
verdadero de θ, las dispersiones de las distribuciones alrededor del valor verdadero pueden ser
diferentes.
Entre todos los estimadores de θ que son insesgados, seleccione al que tenga varianza mínima. El

 resultante recibe el nombre de estimador insesgado con varianza mínima (MVUE, minimum
variance unbiased estimator) de θ.
En otras palabras, la eficiencia se refiere al tamaño de error estándar de la estadística. Si
comparamos dos estadísticas de una muestra del mismo tamaño y tratamos de decidir cual de
ellas es un estimador mas eficiente, escogeríamos la estadística que tuviera el menor error
estándar, o la menor desviación estándar de la distribución de muestreo.
Tiene sentido pensar que un estimador con un error estándar menor tendrá una mayor
176
oportunidad de producir una estimación mas cercana al parámetro de población que se esta
considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro
sólo que la distribución muestral de medias tiene una menor varianza, por lo que la media se
convierte en un estimador eficiente e insesgado.

Coherencia.- Una estadística es un estimador coherente de un parámetro de población, si


al aumentar el tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se
aproxima bastante al valor del parámetro de la población. Si un estimador es coherente se vuelve
más confiable si tenemos tamaños de muestras más grandes.

Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información


contenida de la muestra que ningún otro estimador podría extraer información adicional de la
muestra sobre el parámetro de la población que se esta estimando.
Es decir se pretende que al extraer la muestra el estadístico calculado contenga toda la
información de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan
todos los datos. Cuando se calcula la mediana de una muestra sólo se utiliza a un dato o a dos.
Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con
esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la
varianza, desviación estándar, etc.; se tendrá un estimador suficiente.

Definición de estimación
Cuando hemos observado un valor numérico específico de nuestro estimador, nos
referimos a ese valor como una estimación. En otras palabras, una estimación es un valor
específico observado de un estadístico. Hacemos una estimación si tomamos una muestra y
calculamos el valor que toma nuestro estimador en esa muestra. Suponga que calculamos la
lectura media de un odómetro (kilometraje) a partir de una muestra de taxis en servicio y
encontramos que ésta es de 160,000 kilómetros. Si utilizamos este valor específico para estimar
el kilometraje de la flotilla de taxis completa, el valor obtenido de 160,000 kilómetros sería una
177
estimación.

Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo.

Una estimación puntual es un único valor estadístico y se usa para estimar un parámetro.
El estadístico usado se denomina estimador.
Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que
contenga el parámetro.

Estimación Puntual
La inferencia estadística está casi siempre concentrada en obtener algún tipo de
conclusión acerca de uno o más parámetros (características poblacionales). Para hacerlo, se
requiere que un investigador obtenga datos muéstrales de cada una de las poblaciones en estudio.
Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades
muéstrales. Por ejemplo, representamos con μ (parámetro) el verdadero promedio de resistencia a
la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podría
tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de
cada una, y la media muestral de la resistencia a la ruptura x se podía emplear para sacar una
conclusión acerca del valor de μ. De forma similar, si  2 es la varianza de la distribución de
resistencia a la ruptura, el valor de la varianza muestral s2 se podría utilizar para inferir algo
acerca de  2 .
Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un
símbolo genérico para el parámetro de interés. Se utilizará la letra griega θ para este propósito. El
objetivo de la estimación puntual es seleccionar sólo un número, basados en datos de la muestra,
que represente el valor más razonable de θ.
Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones
observadas en horas de x1 = 5.0, x2 = 6.4 y x3 = 5.9. El valor calculado de la duración media
muestral es x = 5.77, y es razonable considerar 5.77 como el valor más adecuado de μ.
Una estimación puntual de un parámetro θ es un sólo número que se puede considerar como el
valor más razonable de θ. La estimación puntual se obtiene al seleccionar una estadística
apropiada y calcular su valor a partir de datos de la muestra dada. La estadística seleccionada se
llama estimador puntual de θ.

El símbolo  (theta sombrero) suele utilizarse para representar el estimador de θ y la

estimación puntual resultante de una muestra dada. Entonces   x se lee como "el estimador
puntual de μ es la media muestral x ". El enunciado "la estimación puntual de μ es 5.77" se puede

escribir en forma abreviada   5.77 .

Ejemplo:
178
En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg de bajo costo, para varios
procesos de fundición. En consecuencia, es importante contar con métodos prácticos para
determinar varias propiedades mecánicas de esas aleaciones. Examine la siguiente muestra de
mediciones del módulo de elasticidad obtenidos de un proceso de fundición a presión:
44.2 - 43.9 - 44.7 - 44.2 - 44.0 - 43.8 - 44.6 - 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la
varianza poblacional  2 . Un estimador natural es la varianza muestral:
2
 S  2  ( xi  x ) 2
n 1
(44.2  44.0625)  (43.9  44.0625)  .....  (43.1  44.0625) 2
2 2
  0.251
8 1
 
En el mejor de los casos, se encontrará un estimador  para el cual  =  siempre. Sin embargo,

 es una función de las Xi muéstrales, por lo que en sí misma una variable aleatoria.

 =  + error de estimación
Entonces el estimador preciso sería uno que produzca sólo pequeñas diferencias de estimación,
de modo que los valores estimados se acerquen al valor verdadero.

Estimación por Intervalos

Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información
alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa el
estadístico x para calcular un estimado puntual de la resistencia real a la ruptura de toallas de
papel de cierta marca, y suponga que x = 9322.7. Debido a la variabilidad de la muestra, nunca
se tendrá el caso de que x   .El estimado puntual nada dice sobre lo cercano que esta de μ. Una
alternativa para reportar un solo valor del parámetro que se esté estimando es calcular e informar
todo un intervalo de valores factibles, un estimado de intervalo o intervalo de confianza (IC).

Un intervalo de confianza se calcula siempre seleccionando primero un nivel de


confianza, que es una medida del grado de fiabilidad en el intervalo. Un intervalo de confianza
con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podría tener un
límite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza de 95%, es
posible tener cualquier valor de μ entre 9162.5 y 9482.9. Un nivel de confianza de 95% implica
que 95% de todas las muestras daría lugar a un intervalo que incluye μo cualquier otro parámetro
que se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo.
Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima
está dentro del intervalo.

Una interpretación correcta de la "confianza de 95%" radica en la interpretación frecuente


de probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que
179
si el experimento donde A está definido re realiza una y otra vez, a largo plazo A ocurrirá 95% de
las veces. Para este caso
El 95% de los intervalos de confianza calculados contendrán a μ.

Esta es una construcción repetida de intervalos de confianza de 95% y se puede observar


que de los 11 intervalos calculados sólo el tercero y el último no contienen el valor de μ.
De acuerdo con esta interpretación, el nivel de confianza de 95% no es tanto un enunciado sobre
cualquier intervalo en particular, más bien se refiere a lo que sucedería si se tuvieran que
construir un gran número de intervalos semejantes.

Encontrar z a partir de un nivel de confianza


Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área
proporcionada por la misma. En esta sección se realizará un ejemplo para encontrar el valor de z
utilizando tres tablas diferentes.

Ejemplo:
Encuentre el valor de z para un nivel de confianza del 95%.

Solución 1:
Se utilizará la tabla que tiene el área bajo la curva de -  hasta z. Si lo vemos gráficamente sería:

El nivel de confianza bilateral está dividido en partes iguales bajo la curva:


180

En base a la tabla que se esta utilizando, se tendrá que buscar el área de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.

Por lo que el valor de z es de 1.96.


Solución 2:
Si se utiliza una tabla en donde el área bajo la curva es de 0 a z:

En este caso sólo se tendrá que buscar adentro de la tabla el área de 0.475 y el resultado del valor
de z será el mismo, para este ejemplo 1.96.
Solución 3:
Para la tabla en donde el área bajo la curva va desde z hasta: ∞

Se busca el valor de 0.025 para encontrar z de 1.96.


Independientemente del valor del Nivel de Confianza este será el procedimiento a seguir para
localizar a z. En el caso de que no se encuentre el valor exacto se tendrá que interpolar.
181
Intervalo de Confianza para la Media (µ) ; con σ Conocida

Construcción de intervalos de confianza

Un fabricante de fibras Sintéticas desea estimar la tensión de ruptura media de una fibra.
Las tensiones de ruptura de 16 fibras son: 20.8, 20.6, 21, 20.9, 19.9, 20.2, 19.8, 19.6, 20.9, 21.1,
20.4, 20.6, 19.7, 19.6, 20.3 y 20.7. Supóngase que la tensión de ruptura de una fibra se Puede
modelizar por una normal con desviación estándar de 0.45 libras.
Vamos a construir un intervalo con confianza del 98% para el valor real de la tensión media de
ruptura.
Dado que estimamos una media poblacional utilizaremos el estadístico media muestral
pero no sólo su valor esperado (como se hace en la estimación puntual); la distribución completa
del estadístico va a ser clave para determinar un intervalo con una probabilidad fijada de contener
al parámetro la probabidad (que denominamos confianza) en este caso es el 98%.
La distribución del estadístico
 0.45 
X es N   , 
 4 

Por ello los valores Z0,99 Z 0,01 y , delimitan un 98% de los valores del estadístico estandarizado:

 X  
p Z 0.99   Z 0.01   0.98
 0.1125 

De lo cual podemos “despejar” los extremos de un intervalo de forma que contengan al


parámetro:
pZ 0.99 (0.1125)  X    (0.1125)Z 0.01  0.98
pZ 0.99 (0.1125)  X    (0.1125)Z 0.01  X   0.98
p Z 0.99 (0.1125)  X    (0.1125)Z 0.01  X   0.98

Ordenando y teniendo en cuenta que Z 0,99 = - Z 0,01

p X  Z 0.01 (0.1125)    X  (0.1125)Z 0.01  0.98


IC0.98 ( )  ( X  Z 0.01  (0.1125), X  (0.1125)  Z 0.01 )
n

X
i 1
i
X  20.38125 ; Z 0.99   Z 0.01  2.3263
n
IC0.98 ( )  (20.1195 ; 20.6429)
182
Nivel de Confianza: Los extremos de un Intervalo de Confianza son aleatorios (dependen de la
muestra) por lo que podrán, o no, contener al verdadero parámetro. A la probabilidad de que un
Intervalo de Confianza Contenga al parámetro poblacional objeto de análisis se le denomina
Nivel de Confianza y se denota: 1-α

NOTA: Usualmente se adopta 1-α = 0.99, 0.95, 0.90

Relación entre Amplitud, Confianza y Precisión

Lógicamente, cuanto mayor es la amplitud del intervalo, la precisión para el parámetro es


menor. La precisión esta relacionada con la Capacidad Informativa. Cuando se precisa una
elevada confianza, se originan intervalos de mayor amplitud.

Por otro lado ya por todos es conocido, que en base a la distribución muestral de medias
que se generó en el tema anterior, la formula para el cálculo de probabilidad es la siguiente:

x
z

n

Como en este caso no conocemos el parámetro y lo queremos estimar por medio de la


media de la muestra, sólo se despejará μ de la formula anterior, quedando lo siguiente:

z
 x
n

De esta formula se puede observar que tanto el tamaño de la muestra como el valor de z se
conocerán. Z se puede obtener de la tabla de la distribución normal a partir del nivel de confianza
establecido. Pero en ocasiones se desconoce σ por lo que en esos casos lo correcto es utilizar otra
distribución llamada "t" de student si la población de donde provienen los datos es normal.
Para el caso de tamaños de muestra grande se puede utilizar una estimación puntual de la
desviación estándar, es decir igualar la desviación estándar de la muestra a la de la población (s =
σ).

Ejemplos:
1. para medir la concentración promedio de zinc que tiene el agua de un río, se procedió a realizar
una muestra de mediciones en 36 sitios diferentes, encontrándose que la misma es de 2.6 gramos
por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de
zinc en el río. Suponga que la desviación estándar de la población es 0.3.
183
Solución:
La estimación puntual de  es x = 2.6. El valor de z para un nivel de confianza del 95% es 1.96,
por lo tanto:

z (1.96)(0.3)
x  2.6   2.50 y 2.70
n 36

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más
amplio:
z (2.575)(0.3)
x  2.6   2.47 y 2.73
n 36

El intervalo de confianza proporciona una estimación de la precisión de nuestra


estimación puntual. Si μ es realmente el valor central de intervalo, entonces x estima μ sin error.
La mayor parte de las veces, sin embargo, x no será exactamente igual a μ y la estimación
puntual es errónea. La magnitud de este error será el valor absoluto de la diferencia entre μ y x ,
z
y podemos tener el nivel de confianza de que esta diferencia no excederá.
n
Como se puede observar en los resultados del ejercicio se tiene un error de estimación
mayor cuando el nivel de confianza es del 99% y más pequeño cuando se reduce a un nivel de
confianza del 95%.

2. Una empresa eléctrica fabrica Bombillos que tienen una duración aproximadamente distribuida
de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 Bombillos tiene
una duración promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media
de la población de todos los Bombillos que produce esta empresa.

Solución:
184
z z (2.054)(40) (2.054)(40)
x  x   780     780   765    795
n n 30 30

Con un nivel de confianza del 96% se sabe que la duración media de los Bombillos que
produce la empresa está entre 765 y 765 horas.

3. La prueba de corte sesgado es el procedimiento más aceptado para evaluar la calidad de una
unión entre un material de reparación y su sustrato de concreto. El artículo "Testing the Bond
Between Repair Materials and Concrete Substrate" informa que, en cierta investigación, se
obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48 observaciones
de resistencia al corte, y la desviación estándar muestral fue 3.28 N/mm2. Utilice un nivel de
confianza inferior del 95% para estimar la media real de la resistencia al corte.

Solución:
En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios anteriores. La
primera que desconoce la desviación estándar de la población y la segunda que nos piden un
intervalo de confianza unilateral.
El primer caso ya se había comentado y se solucionará utilizando la desviación estándar
de la muestra como estimación puntual de sigma.
Para el intervalo de confianza unilateral, se cargará el área bajo la curva hacia un solo lado
como sigue:

z (1.654)(3.38)
x  17.17   16.39
n 48

Esto quiere decir que con un nivel de confianza de 95%, el valor de la media está en el
intervalo (16.39,  ).

4. Se consideran lo siguientes tiempos de reacción de un producto químico, en segundos: 1,4 1,2


1,2 1,3 1,5 1,3 2,2 1,4 1,1 Obtener un intervalo de confianza del 90% para el tiempo de reacción.
Suponer la variable normal con desviación típica poblacional conocida σ = 0,4.

Solución:
Para calcular un intervalo de confianza para media de una población normal de la que conocemos
185
la varianza poblacional, tenemos que usar el estadístico
x  x
n Por tanto, necesitamos calcular la media de la muestra. Que en nuestro caso es: X 
x
1,4. Como queremos obtener un intervalo con nivel de confianza del 90%, tenemos que α = 0,1.
Así un intervalo de confianza del 90% para la media obtendrá:
x
xZ  En nuestro caso, si miramos en la tabla de la función de distribución de la N (0,1),
1
2 n
tenemos que Z1-α/2 = Z0,95 = 1,64 es el valor normal estándar que corresponde al percentil 95. Un
intervalo de confianza del 90% para la media μ será:
(1,4 - 1,64 . 0,4/3 ; 1,4 + 1,64 . 0,4/3) = (1,1813; 1,6186)

Intervalo de Confianza para la Media (µ) ; con σ desconocida

Si X y S son la media y la desviación estándar de una muestra aleatoria de una población


normal con varianza  2 , desconocida, un intervalo de confianza de (1 - α) 100% para µ es:

S S
X  t    X  t
2 n 2 n

Donde t /2 es el valor t con  = n-1 grados de libertad, que deja un área de α /2 a la


derecha.
Se hace una distinción entre los casos de σ conocida y σ desconocida al calcular las
estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el
teorema del límite central, mientras que para σ desconocida se hace uso de la distribución
muestral de la variable aleatoria t. Sin embargo, el uso de la distribución t se basa en la premisa
de que el muestreo se realiza de una distribución normal. En tanto que la distribución tenga forma
aproximada de campana, los intervalos de confianza se pueden calcular cuando la varianza se
desconoce mediante el uso de la distribución t y se puede esperar buenos resultados.

Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se
pueda suponer, con σ desconocida y n  30, Se pueda reemplazar a σ y se puede utilizar el
186
intervalo de confianza:

X  Z S
2 n

Por lo general éste se denomina como un intervalo de confianza de muestra grande. La


justificación yace sólo en la presunción de que con una muestra grande como 30, s estará muy
cerca de la σ real y de esta manera el teorema del límite central sigue valiendo. Se debe hacer
énfasis en que esto es solo una aproximación y que la calidad de este enfoque mejora a medida
que el tamaño de la muestra crece más.

Ejemplos:
1. El contenido de siete recipientes similares de un compuesto químico son 9.8, 10.2, 10.4, 9.8,
10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los
recipientes si se supone una distribución aproximadamente normal.

Solución:
La media muestral y la desviación estándar para los datos dados son:
X  10 y s = 0.283
En la tabla se encuentra que t0.025 = 2.447 con 6 grados de libertad, de aquí, el intervalo de
confianza de 95% para µ es:
 0.283   0.283 
10.0  (2.477)     10.0  (2.477) 
 7   7 

Con un nivel de confianza del 95% se sabe que el promedio del contenido de los
recipientes está entre 9.47 y 10.26 litros.

2. Un artículo publicado en una revista especializada, presenta las siguientes 20 mediciones del
tiempo de combustión residual en segundos de especimenes tratados de ropa de dormir para
niños:
9.85 - 9.93 - 9.75 - 9.77 - 9.67 - 9.87 - 9.67 - 9.94 - 9.85 - 9.75
9.83 - 9.92 - 9.74 - 9.99 - 9.88 - 9.95 - 9.95 - 9.93 - 9.92 - 9.89
Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual
187
promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.

Solución:
La media muestral y la desviación estándar para los datos dados son: X  9.8525 y s = 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el intervalo de
confianza de 95% para µ es:

 0.0965   0.0965 
9.8525  (2.093)     9.8525  (2.093) 
 20   20 

Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual
promedio se encuentra entre 9.8073 y 9.8977 segundos.

3. Calcular un intervalo de confianza al nivel α = 0.001 para el peso exacto mediante los
resultados obtenidos con 10 básculas: 7.20, 7.01, 7.36, 6.91, 7.22, 7.03, 7.11, 7.12, 7.03, 7.05

Solución:
Suponiendo que las medidas del peso de las básculas sigue una distribución normal N (μ ,σ 2 )
con media el peso exacto, estamos interesados en encontrar un intervalo de confianza que
contenga a la media de esta distribución, que a un nivel α = 0.001 y desviación típica
s
desconocida, esta determinado por: x  t n 1 x donde n = 10, S = 0.1286 ; X  7.1040, y
1 n
2

utilizando la tabla de la distribución t de Student (T 9;0.9995) = 4.78091 Por tanto, el intervalo de


confianza al nivel 0.001 es: (6.9096,7.2984)
188
Intervalos de confianza para diferencias de medias 1-2 si 12 y  2
2
conocidas

Esto se utiliza cuando conocemos las medias muéstrales y las varianzas poblacionales entonces
se puede estimar el intervalo de confianza de la siguiente manera:

 2x  y  2x  y
2 2

( x  y)  Z     x   y  ( x  y)  Z  
1 nx ny 1 nx ny
2 2

Ejemplos:

1. Se realizaron pruebas a muestras de dos productos, para encontrar su contenido calórico


determinando que para muestras iguales de 50 productos, las medias son de 750 y 800 para las
muestras A y B respectivamente, se sabe que sus desviaciones poblacionales son de 30 y 40
respectivamente, halle los intervalos de confianza para la media al 95%

Solución:

30 40 30 40
(800  750)  1,96    x   y  (800  750)  1,96   47.68   x   y  52.31
50 50 50 50

Intervalo de confianza para diferencia de medias 1-2 si 12 =  22 desconocidas

Esto se utiliza cuando conocemos las medias muéstrales y las varianzas poblacionales
sabemos que son iguales, aún cuando no las conozcamos, entonces se puede estimar el intervalo
de confianza de la siguiente manera:

n  n y 2 1 1 n  n 2 1 1
( x  y)  t x Sp    x   y  ( x  y)  t x y S p 
2
nx ny 2
nx ny

(n x  1) S x2  (n y  1) S y2
Sp 
nx  n y  2

Ejemplo:

1. Se desea encontrar la diferencia de las medias de dos marcas de tornillos, se han tomado dos
muestras iguales de 11 tornillos, y se han realizado ensayos a corte, la media de la muestra A fue
de 50,000lb de presión, la media de la muestra B fue de 45,000 sus desviaciones fueron 500 y
250 lb respectivamente, encuentre a los intervalos de confianza a un 95%.

Solución:
189
(n x  1)S 2x  (n y  1)S 2y 10(500) 2  10(250) 2
Sp    395.28, con v = 20, se tiene t = 1,725,
nx  ny  2 20
por lo tanto: 4709.25<  x   y  5290.74

Intervalo de confianza para diferencias de medias 1-2; 12  22 y desconocidas:

Si x1 y s12, y x2 y s22 son las medias y varianzas de muestras de tamaños n1 y n2 respectivamente,


de distribuciones aproximadamente normales con varianzas diferentes y desconocidas, un
intervalo de confianza con (1-) 100% para 1-2 esta dado por:

2 2
S 2x S y S 2x S y
( x  y)  t v
    x   y  ( x  y)  t 
v
 , donde t/2 es el valor de t con
2
nx ny 2
nx ny

2
 S 2x S2 
  y 
nx ny
V    2, grados de libertad con un área de /2 a la derecha.
2
S2

2
 S 2y 
 n   
ny 
x
 x 
 
nx 1 ny 1

Ejemplos:

1. Se registraron los siguientes datos en días, que representan los tiempos de recuperación de
pacientes tratados aleatoriamente con uno de dos medicamentos para aliviarlos de graves
infecciones en la vesícula:

Medicamento 1 Medicamento 2
n1 = 14 N2 = 116
x1 = 17 x2 = 19
2
s1 = 1.5 S22 = 1.8

Encuentre un intervalo de confianza del 99% para la diferencia 2 - 1 en el tiempo de


recuperación para los medicamentos, suponiendo poblaciones normales con varianzas diferentes.

Solución:

1- = 0.99   = 0.01 /2 = 0.005


190

V
1.514  1.8116 2

 2  16,99  17, t/2 = 2.898  2.90


1.514  1.8116
2 2

14  1 116  1

1.5 1.8 1.5 1.8


(19  17)  2.9    x   y  (19  17)  2.9   0.98   x   y  3.01
14 116 14 116

Conclusión:

Para un nivel de confianza del 99% se espera que la diferencia entre medias poblacionales esté
entre 0.98 y 3.01.

Intervalos de Confianza para la varianza:

Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo


de confianza del (1-)100% para 2 es:

(n  1)S 2 (n  1)S 2
  2

 2 2 
1
2 2

donde /22 1-/22 son valores de chi cuadrado con v = n-1 grados de libertad, con áreas de /2 y
1- /2, respectivamente a la derecha

Ejemplo:

1. Se obtiene una muestra aleatoria de 20 estudiantes con una media de 72 y una varianza de 16
en un examen de ubicación de matemáticas. Suponga que las calificaciones tienen una
distribución normal y determine un intervalo de confianza de 98% para la varianza poblacional.

Solución:

Datos:

x = 72 1 -  = 0.98   = 0.02 y /2 = 0.01 1- /2 = 0.99

s2= 16  = 19

n = 20 /22 = 36.19 1-/22 = 7.63

(20  1)16 (20  1)16


Entonces:  2   8,40   2  39,84
36,19 7,63

Conclusión:
191
Para un nivel de confianza del 98% se espera que la varianza poblacional esté entre 8.40 y 39.84

2. Dada la siguiente muestra 1.02 - 0.87 -1.08 -1.09 -1.04. Determinar la estimación de la
desviación poblacional.

Un intervalo de confianza para la varianza  2 al nivel α = 0.05 es el siguiente:


(n  1)S 2 (n  1)S 2
 
2

 2 2 
1
2 2

S = 0.089, utilizando la tabla de 2 se obtiene  2    92,0,976  2.7004 es decir


n 1,1
2

 02,05, 20  31,4

2. Calcular un intervalo de confianza al nivel α = 0.05 para  2 mediante las desviaciones que se
producen en un proceso de fabricación cuya distribución es N(0,σ ) a partir de la muestra 1.2, -
2.2, -3.1, -0.2, 0.5, 0.6, -2.1, 2.2, 1.3
Solución:
Sabiendo que el proceso de fabricación sigue una distribución normal de media conocida μ = 0 ,
un intervalo de confianza para la varianza  2 al nivel α = 0.05 es el siguiente:
(n  1)S 2 (n  1)S 2
 
2

 2 2 
1
2 2

S  3,5333 , utilizando la tabla de 2 se obtiene  2    92,0,976  2.7004 es decir


n 1,1
2

es decir, (1.44458,10.1763)
Es el intervalo que contendrá con un 95% de acierto las desviaciones que se producen en el
proceso de fabricación.
192

3. Los responsables municipales de la salud miden la radiactividad en el agua de una fuente


natural en una zona abundante en granito. Realizadas 12 mediciones en diferentes fechas del año
se observó una media de 3,6 picocurios con una desviación típica de 0,82.determinar, al 95% y al
99%, intervalos de confianza para la radiación media y para la varianza.
Solución:
Tenemos los siguientes datos muéstrales
n = 12, x  3,6 x = 3,6 y s = 0,82.
(n  1)S 2
Para determinar el intervalo de confianza para σ2 tenemos en cuenta el estadístico:
2
Es un variable  2 con 11 grados de libertad. Los percentiles necesarios para la determinación de
los intervalos al 95% y 99% de confianza son:
 2 11;0,005 = 2,603 2;  2 11;0,025 =3,816 2;  2 11;0,975 =21,92 y 2;  2 11;0,995 =26,8.
Así el intervalo de confianza al 95% es:

(11)(0,82) 2 (11)(0,82) 2
;
21,92 3,816
Y al 99%
(11)(0,82) 2 (11)(0,82) 2
;
26,8 2,603
Efectuando los cálculos se obtiene, respectivamente,
(0,3681;2,1145) y (0,3011;3,0998).
En lo relativo a la media, el intervalo se determina teniendo en cuenta que
x 

n
Es una variable t de Student con 11 grados de libertad. El intervalo, para un nivel de confianza
p=1-α, viene dado por:
s
xt 
n 1,1 n
2

Siendo t11; 1-α/2 el valor del percentil 100 ·(1-α/2) para 11 grados de libertad.
Concretamente
t11; 0,975 = 2,201 y t11; 0,995 = 3,1058, y los intervalos de confianza son, respectivamente,
3,6 ± 2,201
11
0,82
y 3,6 ± 3,1058
11
193
0,82
,
Obteniéndose 3,6 ± 0,544 y 3,6 ± 0,768.REVISAR
4. Se sabe que la longitud de los diámetros de los tornillos fabricados por una máquina siguen
una distribución normal y se busca un intervalo en el cual se encuentre la variabilidad de las
longitudes de los tornillos fabricados por la máquina con una probabilidad del 80%. Construir
dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada
en 30.
Solución:
Estamos ante el caso del cálculo de intervalos de confianza para la varianza de una distribución
normal con una media desconocida. En este caso el intervalo de confianza para la varianza se
(n  1)S 2
basa en el siguiente estadístico: lo que nos lleva al intervalo de confianza definido por:
2
(n  1)S 2 (n  1)S 2
;
 2 2 
1
2 2

para un 90%, tenemos: 1-α = 0,90 → α = 0,02→ α/2 = 0,01;  02,05, 20  31,4 ,  02,95, 20  10,9

El intervalo de confianza será entonces:


[21,43 56,14]
Luego el intervalos en el cual se encuentre la variabilidad de las longitudes de los tornillos
fabricados por la máquina con una probabilidad del 80% es [21,43 56,14]. Revisar

Intervalo de Confianza para la desviación estándar:

Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un


intervalo de confianza del (1-)100% para  es:

(n  1)S 2 (n  1)S 2
  
 2 2 
1
2 2

Donde /22 1-/22 son valores de chi cuadrado con v = n-1 grados de libertad, con áreas de /2 y
1- /2, respectivamente a la derecha

Ejemplos:

1. Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido promedio de
nicotina de 2.6 miligramos y una desviación estándar de 0.9 miligramos determine un intervalo
194
de confianza de 99% para . Suponga que la población se distribuye aproximadamente en forma
normal.

Solución:

Datos:

x = 2.6 1 -  = 0.99   = 0.01 y /2 = 0.005 1- /2 = 0.995

s = 0.9 =7

n=8 /22 = 20.27 1-/22 = 0.99

(8  1)(0,9) 2 (8  1)(0,9) 2
Entonces:   0,53    2,39
20,27 0,99

Conclusión:

Para un nivel de confianza del 99% se espera que la desviación estándar poblacional esté entre
0.53 y 2.39

2. En un proceso de fabricación de pilas alcalinas se sabe que su duración media es de 1100 horas
y que dicha duración sigue una distribución normal. El nuevo proceso busca reducir la dispersión
de la duración de las pilas por lo que se hace necesario construir intervalos de confianza para la
citada dispersión con coeficientes de confianza 90% y 98%. Construir dichos intervalos a partir
de una muestra de tamaño 20 cuya dispersión es 2240 horas.

Solución:
Estamos ante el caso del cálculo de intervalos de confianza para la desviación típica de una
distribución normal con media conocida. En este casi el intervalo de confianza para la desviación
típica se basa en el siguiente estadístico:

(n  1)S 2 (n  1)S 2
  
 2 2 
1
2 2

Lo que nos lleva al intervalo de confianza para la desviación típica definido por:
195
(n  1)S 2
(n  1)S 2

2
2 
1
2 2

En nuestro caso, para el nivel del 90% tenemos: 1-α = 0,9 → α = 0,1→ α/2 = 0,05
 02,05, 20  31,4 ,  02,95, 20  10,9 El intervalo de confianza será entonces:
(n  1)S 2 (n  1)S 2
;
 2 2 
1 ojo verificar formula
2 2

Para el nivel del 95% tenemos: 1-α = 0,98 → α = 0,02→ α/2 = 0,01;  02,05, 20  31,4 ,
 02,95, 20  10,9

El intervalo de confianza será entonces:

[109,2 232,88]
Podemos concluir entonces que hay una probabilidad del 90% de que la dispersión de la duración
de las pilas en el nuevo proceso de fabricación esté entre 119,42 y 203,2 horas, y hay una
probabilidad del 98% de que la dispersión de la duración de las pilas en el nuevo proceso de
fabricación esté entre 109,2 y 232,88 horas.

Ejercicios Propuestos de Intervalos de Confianza

1. En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se


obtiene X = 132 mg/dl y S2

2. Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se
eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe.
Construir un IC al 95% para la probabilidad de pasar la gripe si se está vacunado. En los otros
100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la vacuna es eficaz?

3. La cantidad de horas que duermen los estadounidenses cada noche varía mucho. Consideremos
la siguiente muestra de las horas que duermen cada noche 16 personas.
6.9 - 7.6 - 6.5 - 6.2 - 7.8 - 7.0 - 5.5 - 7.6 - 7.3 - 6.6 - 7.1 - 6.9 -6.8 - 6.5 - 7.2 - 5.8
(a) Calcula una estimación puntual para la media de horas que se duerme cada noche y para la
desviación típica. ¿Que estimadores utilizas? ¿Por qué?
Suponer que la población sigue una distribución normal.
(b) Determinar un intervalo de confianza del 80% para la media de horas que se duerme cada
noche.
196
4. Se hicieron determinaciones, del nivel de contaminantes en el suero de 16 personas expuestas a
un químico nocivo y se registraron los siguientes valores en mg/Kg:

15.6 14.0 16.2 13.9

14.8 17.3 14.7 14.8

14.4 17.4 15.7 17.5

16.6 18.6 16.9 13.8

Suponga que la población mostrada es normal, calcule el intervalo de confianza del 95% para la
media de los niveles de contaminación.

5. El gerente de una estación de televisión quiere determinar que porcentaje de casas tienen más
de 1 televisión. Una muestra de 500 casas revela que 275 tienen 2 o más. ¿Cuál es el intervalo de
confianza para el 90% para estimar la proporción de todas las casas que tienen 2 o más
televisiones?

6. Un laboratorio industrial, desea determinar la dureza del agua que entra a su caldera, por lo
tanto realiza análisis a 60 muestras de agua de caldera, determinando que la concentración de
calcio y magnesio es en promedio 30ppm. Se estima que la desviación poblacional es de 5ppm,
determine con un nivel de confianza del 95% el intervalo de confianza para la media poblacional.

7. Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el


rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y
75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen
constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el
promedio para el motor B es 24 millas por galón. Encuentre un intervalo de confianza de 96%
sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estándar
poblacionales son 6 y 8 para los motores A y B respectivamente.

8. Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su


flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como
resultado promedio para la marca A 36,300 kilómetros y para la marca B 38,100 kilómetros.
Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se
sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviación
estándar de 5000 kilómetros para la marca A y 6100 kilómetros para la marca B.
197
9. Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de
aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada
con el proceso de fabricación se supone que las desviaciones estándar de las resistencias a la
tensión son conocidas. La desviación estándar del larguero 1 es de 1.0 Kg/mm2 y la del larguero 2
es de 1.5 Kg/mm2. Se sabe que el comportamiento de las resistencias a la tensión de las dos
clases de largueros son aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1
obteniéndose una media de 87.6 Kg/mm2, y otra de tamaño 12 para el larguero 2 obteniéndose
una media de 74.5 Kg/mm2. Estime un intervalo de confianza del 90% para la diferencia en la
resistencia a la tensión promedio.

10. El salario medio semanal de una muestra de n = 30 empleados de una gran empresa
manufacturera es, x = 280.Bs, con una desviación estándar muestral de s = 14 Bs. En otra gran
empresa, una muestra aleatoria de n = 40 empleados tiene un salario medio semanal de 270.Bs,
con una desviación estándar muestral de s = 10.Bs. Calcule un intervalo de confianza de 99%
para la estimación de la diferencia entre los niveles salariales medios semanales de las dos
empresas.

11. En relación con una muestra aleatoria de n1,= 10 Bombillos, el ciclo medio de vida de los
Bombillos es X 1 = 4 600 horas, con s1, = 250 hr. El ciclo medio de vida y la desviación estándar
de una muestra de n2 = 8 bombillos de otra marca son X 2 = 4 000 hr Y S2 = 200 Hr. Se supone
que el ciclo de vida de ambas marcas tiene una distribución normal. Hallar un intervalo de
confianza de 90% para estimar la diferencia entre el ciclo medio de vida útil de las dos marcas de
bombillos.

12. Se desea estimar la precisión de un instrumento de medición. Al realizar tres mediciones con
el instrumento encontró una varianza muestral de 10.57 unidades.
Usando un nivel de confianza del 95%, Calcule un intervalo de confianza para la variación real
del instrumento.
198
Prueba de Hipótesis

Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador puntual) o
un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de
ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar
una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Este es
uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos de problemas
de toma de decisiones, pruebas o experimentos en el mundo de la ingeniería, pueden formularse
como problemas de prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
Es importante no olvidar lo anteriormente dicho las hipótesis siempre son proposiciones
sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula se determina en
una de tres maneras diferentes:

Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del
parámetro.
Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.
Cuando el valor del parámetro proviene de consideraciones externas, tales como las
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el
objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el
nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del empleo
de la información contenida en la muestra aleatoria de la población de interés. Si esta
información es consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo si
esta información es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse
hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la población. Usualmente esto es imposible
en muchas situaciones prácticas. Por tanto, es necesario desarrollar un procedimiento de prueba
de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada.

La Hipótesis nula, representada por Ho, es la afirmación sobre una o más características
de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
199
La Hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta
es la hipótesis del investigador.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia


muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa
creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis
por prueba de hipótesis son rechazar Ho o no rechazar Ho.

Prueba de una Hipótesis Estadística

Para ilustrar los conceptos generales, consideremos lo siguiente. Suponga que se tiene
interés en la rapidez de combustión de un agente propulsor sólido utilizado en los sistemas de
salida de emergencia para la tripulación de aeronaves. El interés se centra sobre la rapidez de
combustión promedio. De manera específica, el interés recae en decir si la rapidez de combustión
promedio es o no 50 cm./s. Esto puede expresarse de manera formal como

Ho; μ = 50 cm/s
H1; μ ≠ 50 cm/s

La proposición Ho; μ = 50 cm./s, que no es mas que la rapidez promedio de combustión es


50 cm./s, se conoce como hipótesis nula, mientras que la proposición H1; μ ≠ 50 cm./s o que la
rapidez promedio de combustion no es igual a 50 cm/s recibe el nombre de hipótesis alternativa.
Puesto que la hipótesis alternativa especifica valores de μ que pueden ser mayores o menores que
50 cm./s, también se conoce como hipótesis alternativa bilateral. En algunas situaciones, lo que
se desea es formular una hipótesis alternativa unilateral, como en

Ho; μ = 50 cm/s Ho; μ = 50 cm/s o H1; μ < 50 cm/s H1; μ > 50 cm/s

Pero en el caso anterior, tenemos que:

Ho; μ = 50 cm/s
H1; μ≠ 50 cm/s

Supóngase que se realiza una prueba sobre una muestra de 10 especimenes, y que se
observa cual es la rapidez de combustión promedio muestral. La media muestral es un estimador
de la media verdadera de la población. Un valor de la media muestral que este próximo al valor
hipotético μ = 50 cm./s es una evidencia de que el verdadero valor de la media μ es realmente 50
cm./s; esto es, tal evidencia apoya la hipótesis nula Ho. Por otra parte, una media muestral muy
diferente de 50 cm./s constituye una evidencia que apoya la hipótesis alternativa H1. Por tanto, en
200
este caso, la media muestral es el estadístico de prueba.

La media muestral puede tomar muchos valores diferentes. Supóngase que si


48.5  x  51.5, entonces no se rechaza la hipótesis nula Ho; μ = 50 cm./s, y que si x < 48.5 ó
x >51.5, entonces se acepta la hipótesis alternativa H1; μ≠ 50 cm./s.

Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la región
crítica de la prueba, mientras que todos los valores que están en el intervalo 48.5  x  51.5
forman la región de aceptación. Las fronteras entre las regiones críticas y de aceptación reciben el
nombre de valores críticos. La costumbre es establecer conclusiones con respecto a la hipótesis
nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región
crítica, de lo contrario, no se rechaza Ho.

Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustión del agente
propulsor sea igual a 50 cm./s. Sin embargo, para todos los especimenes bajo prueba, bien puede
observarse un valor del estadístico de prueba x que cae en la región crítica. En este caso, la
hipótesis nula Ho será rechazada en favor de la alternativa H1cuando, de hecho, Ho en realidad es
verdadera. Este tipo de conclusión equivocada se conoce como error tipo I.

El error tipo I o error α se define como el rechazo de la hipótesis nula Ho cuando ésta es
verdadera. También es conocido como α ó nivel de significancia. Si tuviéramos un nivel de
confianza del 95% entonces el nivel de significancia sería del 5%. Análogamente si se tiene un
nivel de confianza del 90% entonces el nivel de significancia sería del 10%.
Ahora supóngase que la verdadera rapidez promedio de combustión es diferente de 50
cm./s, aunque la media muestral x caiga dentro de la región de aceptación. En este caso se acepta
Ho cuando ésta es falsa. Este tipo de conclusión recibe el nombre de error tipo II.

El error tipo II ó error β se define como la aceptación de la hipótesis nula cuando ésta es falsa.
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes
que determinan si la decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsa


Aceptar Ho No hay error Error tipo II ó β
Rechazar Ho Error tipo I ó α No hay error

Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por
lo general tiene como resultado un aumento en la probabilidad del otro.
201
El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores críticos.

Un aumento en el tamaño muestral n reducirá α y β de forma simultánea. Si la hipótesis


nula es falsa, β es un máximo cuando el valor real del parámetro se aproxima al hipotético. Entre
más grande sea la distancia entre el valor real y el valor hipotético, será menor β

Pasos Para Establecer un Ensayo de Hipótesis Independientemente de la Distribución Que


se Este Tratando

Interpretar correctamente hacia que distribución muestral se ajustan los datos del
enunciado.
Interpretar correctamente los datos del enunciado diferenciando los parámetros de los
estadísticos. Así mismo se debe determinar en este punto información implícita como el tipo de
muestreo y si la población es finita o infinita.
Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico del
problema. El ensayo de hipótesis está en función de parámetros ya que se quiere evaluar el
universo de donde proviene la muestra. En este punto se determina el tipo de ensayo (unilateral o
bilateral).
Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el
cual se obtiene dependiendo del valor de α (Error tipo I o nivel de significancia) o en función del
estadístico límite de la distribución muestral. Cada una de las hipótesis deberá ser argumentada
correctamente para tomar la decisión, la cual estará en función de la hipótesis nula o Ho.
Calcular el estadístico real, y situarlo para tomar la decisión.
Justificar la toma de decisión y concluir.

Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipótesis que son:


Unilateral Derecho
Unilateral Izquierdo
Bilateral

Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de ensayo.

Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el


parámetro, en este caso el nivel de significancia se carga todo hacia el lado derecho, para definir
las regiones de aceptación y de rechazo.
Ensayo de hipótesis:
202
Ho; Parámetro ≤ x
H1; Parámetro > x

Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución


en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado izquierdo, para
definir las regiones de aceptación y de rechazo.
Ensayo de hipótesis:
Ho; Parámetro ≥ x
H1; Parámetro < x

Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El


nivel de significancia se divide en dos y existen dos regiones de rechazo.
Ensayo de hipótesis:
Ho; Parámetro = x
H1; Parámetro ≠ x

Para realizar los ejemplos y ejercicios de ensayo de hipótesis se recomienda seguir los
pasos mencionados anteriormente. Los ejemplos siguientes se solucionarán por los pasos
recomendados, teniéndose una variedad de problemas en donde se incluirán a todas las
distribuciones muéstrales que se han visto hasta aquí.
203
Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Con Varianza Conocida

Ejemplos:

1. Una muestra aleatoria de 100 muertes por causas naturales, registradas en Carabobo el año
pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de
8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un
nivel de significancia de 0.05.

Solución:
Se trata de una distribución muestral de medias con desviación estándar conocida.
Datos:
μ =70 años ; σ = 8.9 años ; x = 71.8 años ; n = 100 ; α = 0.05
Ensayo de hipótesis
Ho; μ = 70 años.
H1; μ > 70 años.

Regla de decisión:
Si zR ≤ 1.645 no se rechaza Ho.
Si zR > 1.645 se rechaza Ho.
xR   71.8  70
ZR    2.02
 8.9
n 100
Justificación y decisión.
Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la vida
media hoy en día es mayor que 70 años.
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en
este caso la media de la muestra. De la formula de la distribución muestral de medias se despeja
la media de la muestra:
x 
ZL  L

n

ZL (1.645)(8.9)
xL     70   71.46
n 100
204

Regla de decisión:
Si x R  71.46 No se rechaza Ho
Si x R > 71.46 Se rechaza Ho
Como la media de la muestral es de 71.8 años y es mayor al valor de la media muestral límite de
71.46 por lo tanto se rechaza Ho y se llega a la misma conclusión.

2. Una empresa eléctrica dedicada a la fabricación de Bombillos, afirma que su producto tiene
una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y
una desviación estándar de 40 horas. Si una muestra aleatoria de 30 Bombillos tiene una duración
promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media
ha cambiado? Utilice un nivel de significancia del 0.04.

Solución:
Se trata de una distribución muestral de medias con desviación estándar conocida.
Datos:
μ =800 horas ; σ = 40 horas ; x = 788 horas ; n = 30 ; α = 0.04
Ensayo de hipótesis
Ho; μ = 800 horas
H1; μ ≠ 800 horas

Regla de Decisión:
Si –2.052 ≤ ZR ≤ 2.052 No se rechaza Ho
Si ZR < -2.052 ó si ZR > 2.052 Se rechaza Ho
205
xR   788  800
ZR    1.643
 40
n 30
Justificación y decisión:
Como –2.052 ≤ -1.643 ≤ 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.04 que la duración media de los bombillos no ha cambiado.
Solución por el otro método:
Z  (2.052)(40)
x    L  800   785.02 y 814.98
n 30

Regla de decisión:
Si 785.02  x R  814.98 No se rechaza Ho
Si x R < 785.02 ó x R > 814.98 se rechaza Ho
Como la x R = 788 horas, entonces no se rechaza Ho y se concluye que la duración media de los
bombillos no ha cambiado.

3. Una empresa esta estudiando la posibilidad de implementar un nuevo sistema de publicidad,


con la finalidad de incrementar las ventas promedio por cliente, con el sistema actual, las ventas
promedio se sitúan en 200 Bs. El nuevo sistema supone unos costos adicionales que se justifican
si las ventas aumentan, para ello toma una muestra aleatoria de 100 clientes, una vez concluido el
periodo de prueba del nuevo sistema. Se sabe que la desviación típica de las ventas por cliente es
de 40 Bs. Y la media de la muestra fue 210 Bs. ¿Adoptaría usted el nuevo sistema, use un nivel
de significación de 5%?

Solución:
Se trata de una distribución muestral de medias con desviación estándar conocida.
Datos:
μ =200 Bs. ; σ = 40 Bs. ; x =210 Bs. ; n = 100. ; α = 0.05
Ensayo de hipótesis
Ho; μ = 200 Bs.
H1; μ > 200 Bs.
206

Regla de decisión:
Si zR ≤ 1.645 no se rechaza Ho.
Si zR > 1.645 se rechaza Ho.
x R   210  200
ZR    2.5
 40
n 100
Justificación y decisión.
Como 2.5 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la ventas
promedio por cliente en la actualidad es mayor que 200 Bs.
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en
este caso la media de la muestra. De la formula de la distribución muestral de medias se despeja
la media de la muestra:
x 
ZL  L

n

ZL (1.645)(40)
xL     200   206,58
n 100

Regla de decisión:
Si x R  206,58 No se rechaza Ho
Si x R > 206,58 Se rechaza Ho
Como la media de la muestral es de 210 Bs y es mayor al valor de la media muestral límite de
206,58 por lo tanto se rechaza Ho y se llega a la misma conclusión.
207
4. Una empresa productora de neumáticos, afirma que su producto dura en promedio 20.000 Km.
o más. Un potencial distribuidor del producto quiere verificar tal afirmación, para lo cual somete
a prueba 100 neumáticos. La duración promedio de la muestra fue de 19.320 Km. Se conoce por
experiencia pasada que la desviación típica de la duración de los neumáticos producidos por la
empresa es de 2.000 Km. Contraste la hipótesis de que la duración promedio es de 20.000 Km. O
más, use un nivel de significación del 2,5%

Solución:
Se trata de una distribución muestral de medias con desviación estándar conocida.
Datos:
μ =20.000 Km. ; σ = 2.000 Km. ; x = 19.320 Km. ; n = 100 ; α = 0.025
Ensayo de hipótesis
Ho; μ ≥ 20.000 Km.
H1; μ < 20.000 Km.

Regla de decisión:
Si ZR  -1. 96 No se rechaza Ho
Si ZR < -1. 96 Se rechaza Ho

x R   19.320  20.000
ZR    3,4
 2.000
n 100

Justificación y decisión:
Como –1,96 > -3,4, por lo tanto se rechaza Ho y se concluye con un nivel de significancia del
0.025 que el número promedio de Kilómetros que duran los neumáticos es significativamente
menor que 20.000.

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Varianza Desconocida


Con Muestras Grandes

Ciertamente sospechamos que las pruebas sobre una media poblacional µ con  2
desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es
idéntica a la del caso de σ conocida, con la excepción de que el valor σ en la estadística de
prueba se reemplaza por la estimación de S calculada y la distribución normal estándar se utiliza
ya que el tamaño de la muestra es grande, recordando el teorema central del limite n > 30.
208

1. Un fabricante de productos de limpieza desea conocer el verdadero peso de uno de sus


productos, para ello selecciona una muestra aleatoria de 64 bolsas de detergente industrial que
pesan, en promedio 5.23 kilos con una desviación estándar de 0.24 kilos. Por especificaciones del
producto las bolsas de detergente industrial que fabrican en ese tamaño deben pesar 5.5 kilos,
puede afirmar el fabricante que el peso de su producto es correcto, use un nivel de significancia
de 0.05.

Solución:
Se trata de una distribución muestral de medias con desviación estándar desconocida, pero como
el tamaño de muestra es mayor a 30 se puede tomar la desviación muestral como un estimador
puntual para la poblacional.
Datos:
μ = 5.5 kilos ; s = 0.24 kilos ; x = 5.23 kilos ; n = 64 ; α = 0.05
Ensayo de hipótesis
Ho; μ = 5.5 kilos
H1; μ < 5.5 kilos

Regla de decisión:
Si ZR ≥-1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho

xR   5.23  5.5
ZR    9
 0.24
n 64
Justificación y decisión:
Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del 0.05
que las bolsas de detergente industrial pesan en promedio menos de 5.5 kilos.
Solución por el otro método
Z L (1.645)(0.24)
xL     5.5   5.45 :
n 64
209

Regla de decisión:
Si x R 5.45 No se Rechaza Ho
Si x R < 5.45 Se rechaza Ho
Como la x R = 5.23 y este valor es menor que 5.45 por lo tanto se rechaza Ho.

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Varianza Desconocida


Muestras Pequeñas

Las pruebas sobre una media poblacional µ con  2 desconocida con muestras pequeñas,
debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del
caso de σ conocida, con la excepción de que el valor σ en la estadística de prueba se reemplaza
por la estimación de S calculada y la distribución normal estándar se reemplaza con una
distribución t.

Ejemplos:

1. Una empresa fabricante de equipos eléctricos, conoce la cantidad de Kilowatt-hora que


consumen sus productos anualmente. Ellos afirman que una licuadora industrial consume un
promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 establecimientos comerciales
que se incluye en un estudio planeado indica que las licuadoras industriales consumen un
promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto
sugiere con un nivel de significancia de 0.05 que las licuadoras industriales consumen, en
promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es
normal.

Solución:
Datos:
μ = 46 kilowatt-hora ; s = 11.9 kilowatt-hora ; = 42 kilowatt-hora
n = 12 ; α = 0.05

Ensayo de hipótesis
210
Ho; μ = 46 kilowatt-hora
H1; μ < 46 kilowatt-hora

Regla de decisión:
Si tR  -1.796 No se rechaza Ho
Si tR < -1.796 Se rechaza Ho
Cálculos:
XR   42  46
tR    1.16
s 11.9
n 12
Justificación y decisión:
Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia
del 0.05 que el número promedio de kilowatt-hora que consumen al año las licuadoras no es
significativamente menor que 46.

Solución por el otro método:

tL s (1.796)(11.9)
XL     46   39.83
n 12

Regla de decisión:
Si xR  39.83 No se Rechaza Ho
Si xR  39.83 Se rechaza Ho
Como la xR  42 y este valor no es menor que 39.83 por lo tanto no se rechaza Ho.
Se puede aprovechar este ejemplo para calcular el valor de P, como el valor de t calculada es de –
1.16, se busca en la tabla y se ve que el área a la izquierda de este valor es de 0.135 con 11 grados
211
de libertad, por lo tanto no se rechaza Ho., ya que sería un valor alto para un nivel de
significancia.

3. Un artículo publicado en una revista especializada en materiales, describe los resultados


de pruebas de resistencia a la adhesión de 22 especimenes de aleación U-700. La carga
para la que cada espécimen falla es la siguiente en MPa:

19.8 18.5 17.6 16.7 15.8


15.4 14.1 13.6 11.9 11.4
11.4 8.8 7.5 15.4 15.4
19.5 14.9 12.7 11.9 11.4
10.1 7.9

¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga
donde se presenta la falla tiene una distribución normal, y utilícese α = 0.05. Calcule el valor de
P.

Solución:
Datos:
µ = 10 ; s = 3.55 ; x  13.71 ; n = 22 , α = 0.05
Ensayo de hipótesis
Ho; µ = 10
H1; µ > 10

Regla de decisión:
Si tR 1.721 no se rechaza Ho.
Si tR> 1.721 se rechaza Ho.
212
Cálculos:

X R   13.71  10
tR    4.90
s 3.55
n 22
Justificación y decisión.
Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la carga
de falla promedio es mayor que 10Mpa.
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en
este caso la media de la muestra. De la fórmula de la distribución muestral de medias se despeja
la media de la muestra:

xL   tL s (1.721)(3.55)
tL  ; xL     10   11.30
s n 22
n

Regla de decisión:
Si xR  11.30 No se rechaza Ho
Si xR  11.30 Se rechaza Ho

Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral límite de
11.30 por lo tanto se rechaza Ho y se llega a la misma conclusión.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90.
Se observa que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de
3.819 el cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el
valor de P es prácticamente cero, y esto apoya la decisión de rechazar Ho.

3. Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1,
14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el
peso promedio de todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se
distribuyen normalmente y calcule el valor de P.

Solución:
Datos:
213
µ = 14 libras ; s = 1.21 libras ; x  14.3 libras ; n=8 ; α = 0.05
Ensayo de hipótesis
Ho; µ = 14 libras
H1; µ ≠ 14 libras

Regla de Decisión:
Si –2.365  tR  2.365 No se rechaza Ho
Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho

X R   14.3  14
tR    0.7012
s 1.21
n 8

Justificación y decisión:
Como –2.365  0.7012  2.365 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.05 que el peso promedio de todos los bebés de seis meses es de 14 libras.

tL s (2.365)(1.21)
Solución por el otro método: xL     10   12.98 y 15.01
n 8

Regla de decisión:
Si 12.98  xR  15.01 No se rechaza Ho
Si xR  12.98 ó xR  15.01 se rechaza Ho
Como la x  14.3 libras, entonces no se rechaza Ho.
Para calcular el valor de P se busca en la tabla el valor de 0.7012 con 7 grados de libertad. Se
observa que este valor no se encuentra pero se puede interpolar entre los valores de 0.549 y 0.896
con áreas de 0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el valor de 0.2561.
214

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Varianza Desconocida


(Proporciones)

Ciertamente sospechamos que las pruebas sobre una media poblacional µ con  2
desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es
idéntica a la del caso de σ conocida, con la excepción de que el valor σ en la estadística de
prueba se reemplaza por la estimación de s calculada y la distribución normal estándar se
reemplaza con una distribución t.

1. Una empresa comercializadora de equipos de refrigeración en el oriente del país afirma que en
la actualidad se instalan Sistemas de Aire Acondicionado en 70% de todas las casas que se
construyen en la ciudad de Barcelona. ¿Estaría de acuerdo con esta afirmación si en una
investigación realizada en cuanto a casas nuevas fabricadas en esta ciudad muestra que 8 de 15
tienen instalado Aire Acondicionado? Utilice un nivel de significancia de 0.10.
Solución:
Se trata de una distribución muestral de proporciones.
Datos:
P = 0.70 ; p = 8/15 = 0.5333 ; n = 15 ; α = 0.10
Ensayo de hipótesis
Ho; P = 0.70
H1; P ≠ 0.70
215
Regla de Decisión:
Si –1.645 ≤ ZR ≤ 1.645 No se rechaza Ho
Si ZR < -1.645 ó si ZR > 1.645 Se rechaza Ho

pP 0.533  0.70


ZR    1.41
Pq (0.70)(0.30)
n 15
Justificación y decisión:
Como –1.645 ≤ -1.41 ≤ 1.645 No se rechaza Ho y se concluye con un nivel de significancia de
0.10 que la afirmación del constructor es cierta.
Solución por el otro método:
Pq (0.70)(0.30)
pL  p  z L  0.70  1.645  0.505 y 0.894
n 15

Regla de decisión:
Si 0.505 ≤ pR ≤ 0.894 No se rechaza Ho
Si pR < 0.505 ó si ZR > 0.894 Se rechaza Ho
Como el valor del estadístico real es de 0.533 por lo tanto no se rechaza Ho y se llega a la misma
conclusión.

2. En una fábrica de semiconductores se producen controladores que se emplean en aplicaciones


de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en
uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre
esta característica del proceso de fabricación con este nivel de calidad, utilizando α = 0.05. El
fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que
cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del proceso?
Solución:
Se trata de una distribución muestral de proporciones.
Datos:
P = 0.05 ; p = 4/200 = 0.02 ; n = 200 ; α = 0.05
Ensayo de hipótesis
Ho; P = 0.05
H1; P < 0.05
216

Regla de decisión:
Si ZR ≥-1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho

pP 0.02  0.05


ZR    1.946
Pq (0.05)(0.95)
n 200
Justificación y decisión:
Puesto que –1.946 < -1.645, se rechaza Ho y se concluye con un nivel de significancia del 0.05
que la fracción de artículos defectuosos es menor que 0.05.

Prueba de Hipótesis Sobre Diferencia de Medias de Una Distribución Normal, Varianza


Conocida

1. En una fabrica de pinturas acrílicas el departamento de investigación y desarrollo de productos


está interesado en reducir el tiempo de secado de una pintura de acabado superficial. Se prueban
dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar, y la fórmula 2 tiene un
nuevo ingrediente secante que debe reducir el tiempo de secado. De la experiencia se sabe que la
desviación estándar del tiempo de secado es ocho minutos, y esta variabilidad inherente no debe
verse afectada por la adición del nuevo ingrediente. Se pintan diez Piezas con la fórmula 1, y
otros diez con la fórmula 2. Los dos tiempos promedio de secado muéstrales son 121 min. y 112
min. Respectivamente. ¿A qué conclusiones puede llegar el desarrollador del producto sobre la
eficacia del nuevo ingrediente, utilizando α = 0.05?

Solución:
Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.
Datos:
σ1 = σ2 = 8;
x1  121mm ; x 2  112mm
n1 = n2 = 10
α = 0.05
217
Ensayo de hipótesis
Ho; μ1 - μ2 = 0
H1; μ1 - μ2 > 0
Se desea rechazar Ho si el nuevo ingrediente disminuye el tiempo promedio de secado, por eso se
pone la diferencia mayor a cero o sea positiva para poder probar que μ2 es menor que μ1.

Regla de decisión:
Si zR ≤ 1.645 no se rechaza Ho.
Si zR > 1.645 se rechaza Ho.

( x1  x2 )  ( 1   2 ) (121  112)  0
ZR    2.52
1 2
2 2
82 82
 
n1 n2 10 10
Justificación y decisión:
Puesto que 2.52 >1.645, se rechaza Ho, y se concluye con un nivel de significancia de 0.05 que la
adición del nuevo ingrediente a la pintura si disminuye de manera significativa el tiempo
promedio de secado.

Solución por el otro método


 12  12 64 64
( x1  x2 ) L  ( 1   2 )  z   0  1.645   5.88 :
n1 n2 10 10

Regla de decisión:
Si ( x1  x 2 ) R  5.88 No se rechaza Ho
Si ( x1  x 2 ) R > 5.88 Se rechaza Ho
Puesto que ( x1  x 2 ) R = 121-112 = 9 y este número es mayor a 5.88 por lo tanto se rechaza Ho.
218
2. En una empresa que se dedica a la fabricación de refrescos, utilizan dos máquinas para llenar
botellas de plástico con un volumen neto de 16.0 onzas. Las distribuciones de los volúmenes de
llenado pueden suponerse normales, con desviaciones estándar σ1= 0.020 y σ2 = 0.025 onzas. Un
miembro del grupo de control de calidad sospecha que el volumen neto de llenado de ambas
máquinas es el mismo, sin importar si éste es o no de 16 onzas. De cada máquina se toma una
muestra aleatoria de 10 botellas. ¿Se encuentra la persona en lo correcto? Utilice α = 0.05

MAQUINA 1 MAQUINA 2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00

Solución:
Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.
Datos:
σ1 = 0.020 σ2 = 0.025
x1  16.015 Este dato se obtuvo calculando la media de los datos en la máquina 1.
x2  16.005 Este dato se obtuvo calculando la media de los datos en la máquina 2.
n1 = n2 = 10
α = 0.05
Ensayo de hipótesis
Ho; μ1 - μ2 = 0
H1; μ1 - μ2 ≠ 0 Si se cae en Ho se podrá probar que el volumen de llenado es el mismo en las dos
máquinas.

Regla de Decisión:
Si –1.96 ≤ ZR ≤ 1.96 No se rechaza Ho
Si ZR < -1.96 ó si ZR > 1.96 Se rechaza Ho
219
( x1  x2 )  ( 1   2 ) (16.015  16.005)  0
ZR    0.987
1 2
2 2
0.020 2 0.0252
 
n1 n2 10 10

Justificación y decisión:
Como –1.96  0.987  1.96 entonces no se rechaza Ho y se concluye con un nivel de
significancia de 0.05 que las dos máquinas tienen en promedio la misma cantidad de llenado.

Solución por el otro método:


 12  12 0.020 2 0.0252
( x1  x2 ) L  ( 1   2 )  z   0  1.96   0.019 y 0.019
n1 n2 10 10

Regla de decisión:
Si –0-019 ( x1  x 2 ) R  0.019 No se rechaza Ho
Si ( x1  x 2 ) R < -0.019 ó ( x1  x 2 ) R > 0.019 Se rechaza Ho
Como ( x1  x 2 ) R = 16.015 – 16.005 = 0.01, entonces cae en la región de aceptación y no se
rechaza Ho.

3. Existen dos tipos de material apropiados para ser usado por un fabricante de componentes
electrónicos. La tensión de ruptura de ese material es un parámetro importante. Se sabe que σ1 =
σ2 = 1.0 psi. De una muestra aleatoria de tamaño 10 y 12 para cada material respectivamente, se
tiene una media de 162.5 para el material 1 y de 155 para el material 2. La compañía no adoptará
el material 1 a menos que la tensión de ruptura de éste exceda a la del material 2 al menos por 10
psi. Con base a la información contenida en la muestra, ¿la compañía deberá utilizar el material
1? Utilice α = 0.05 para llegar a una decisión.

Solución:
Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.
Datos:
σ1 = σ2 = 1.0 psi
x1  162.5 x2  155 n1= 10 n2= 12 α= 0.05
220
Ensayo de hipótesis
Ho; μ1 - μ2 = 10
H1; μ1 - μ2 > 10 Se desea rechazar Ho si la media del material 1 supera a la media del material 2
en por lo menos 10 psi.

Regla de decisión:
Si zR ≤ 1.645 no se rechaza Ho.
Si zR > 1.645 se rechaza Ho.

( x1  x2 )  ( 1   2 ) (162.5  155)  10
ZR    5.83
1 2
2 2
12 12
 
n1 n2 10 12

Justificación y decisión:
No existe evidencia suficiente para apoyar el uso del material 1 ya que
–5.83 1.645, por lo tanto no se rechaza Ho.

Solución por el otro método:


 12  12 12 12
( x1  x2 ) L  ( 1   2 )  z   10  1.645   10.70
n1 n2 10 12

Regla de decisión:
Si ( x1  x 2 ) R ≤10.70 No se rechaza Ho
Si ( x1  x 2 ) R > 10.70 Se rechaza Ho
Puesto que ( x1  x 2 ) R = 162.5-155 = 7.5 y este número es no es mayor a 10.7 por lo tanto no se
rechaza Ho.
221
Prueba de Hipótesis Sobre Diferencia de Proporciones

1. En la fabricación de lentes intraoculares, los cuales se utilizan después de una cirugía de


cataratas, el proceso de pulido es extremadamente importante, por ello se evalúan dos tipos
diferentes de soluciones para pulir. Se pulen 300 lentes con la primera solución y, de éstos, 253
no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes con la
segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que
las dos soluciones para pulir son diferentes? Utilice α = 0.01

Solución:
Se trata de una distribución muestral de diferencia de proporciones.
Datos:
p1= 253/300 = 0.8433 ; p2 = 196/300 = 0.6533 ; n1 = n2 = 300
Ensayo de hipótesis:
Ho; P1-P2 = 0
H1; P1-P2 ≠0

Regla de Decisión:
Si –2.575  ZR  2.575 No se rechaza Ho
Si ZR < -2.575 ó si ZR > 2.575 Se rechaza Ho

( p1  p2 )  ( P1  P2 )
ZR 
P1q1 P2 q2

n1 n2

En esta fórmula se puede observar que en el denominador se tienen a las proporciones


poblacionales o sea los parámetros, los cuales no se conocen, por lo que en el ensayo de hipótesis
la fórmula para poder calcular la ZR cambia, estimando el parámetro común P de la siguiente
forma:
x  x2 n p  n2 p2
p 1 o bien P  1 1
n1  n2 n1  n2
Entonces la fórmula de ZR quedaría de la siguiente manera:
222
( p1  p2 )  ( P1  P2 )
ZR 
1 1
Pq   
 n1 n2 
Se calculará el valor de P:

x1  x2 253  196
p   0.7483
n1  n2 300  300

( p1  p2 )  ( P1  P2 ) (0.8433  0.6533)  0
ZR    5.36
1 1   1 1 
Pq    (0.7483)(0.2517)  
 n1 n2   300 300 

Justificación y decisión:
Puesto que 5.36 > 2.575, se rechaza la hipótesis nula y se concluye con un nivel de significancia
de 0.01 que los dos fluidos para pulir son diferentes.

2. Se Realizara una consulta entre los residentes de una ciudad y los poblados aledaños con la
finalidad de poder determinar si se debe construir una planta química. La construcción estará
dentro de los límites de la ciudad y por esta razón muchos votantes del distrito consideran que la
propuesta ganara debido a la gran proporción de votantes que favorecen la construcción. Para
determinar si hay una diferencia significativa en la proporción de votantes de la ciudad y votantes
de los pueblos aledaños que apoyan la propuesta, se realiza una encuesta. Si 120 de 200 votantes
de la ciudad favorecen la propuesta y 240 de 500 residentes del distrito también lo hacen, ¿estaría
de acuerdo en que la proporción de votantes de la ciudad que favorecen la propuesta es más alta
que la proporción de votantes del distrito? Utilice un nivel de significancia de 0.025.

Solución:
Se trata de una distribución muestral de diferencia de proporciones.
Datos:
p1 = 120/200 = 0.60 ; p2 = 240/500 = 0.48 ; n1 = 200 ; n2 = 500
Ensayo de hipótesis:
Ho; P1-P2 = 0
H1; P1-P2 > 0
223
Regla de decisión:
Si zR 1.96 no se rechaza Ho.
Si zR> 1.96 se rechaza Ho.
Cálculos:
Se calculará el valor de P:
x1  x 2 120  240
p   0.51
n1  n 2 200  500

( p1  p 2 )  ( P1  P2 ) (0.60  0.48)  0
ZR    2.9
1 1  1 1 
Pq    (0.51)(0.49)  
 n1 n2   200 500 

Justificación y decisión:
Puesto que 2.9 >1.96, se rechaza la hipótesis nula y se concluye con un nivel de significancia de
0.025 que la proporción de votantes de la ciudad a favor de la propuesta es más alta que la
proporción de votantes del distrito.

Prueba de Hipótesis sobre Varianzas

1. Las puntuaciones en un test de razonamiento abstracto siguen una distribución Normal de


media 35 y varianza 60. Para evaluar un programa de mejora de las capacidades intelectuales, a
101 individuos que están realizando este programa se les pasa el test, obteniéndose una media de
50 puntos y una varianza de 80 ¿Puede asegurarse, a un nivel de confianza del 90%, que el
programa incrementa las diferencias individuales en esta variable?
Solución:

H0 σ2 = 60
H1 σ2 > 60
(n  1)S 2
El estadístico de contraste es:
2
(100  1)80
Sustituyendo en el estadístico obtenemos: 
60
Como el contraste es unilateral buscamos en las tablas de la Ji-cuadrado, con 100 grados
de libertad, el valor de la variable que deja por debajo de sí una probabilidad de 0,9, este valor es
118,5.
El valor del estadístico es mayor que el valor crítico, por consiguiente se rechaza la
hipótesis nula. En efecto, la varianza es significativamente mayor lo que indica que ha aumentado
la dispersión de las puntuaciones lo cual significa que se han incrementado las diferencias entre
224
los individuos.

2. Los rodamientos esféricos que fabrica una maquina deben de tener un diámetro Uniforme para
ser aptos para su uso. El responsable de la maquina asegura que la varianza es  2 =
0,025.Medidos 50 rodamientos se obtuvo una varianza muestral S 2 = 0,0272.¿Es compatible este
resultado con la afirmación previa?
Solución:

Planteamos un contraste de hipótesis:


H0 σ2 = 0,025
H1 σ2 > 0,025
Pues una varianza σ2 inferior a 0,025 no debe ser objeto de nuestra preocupación, ya que supone
menor dispersión y, por tanto mayor uniformidad de la variable diámetro de rodamientos.
2 (n  1)S 2
Apoyándonos en la distribución χ con 49 grados de libertad dada por:
2
(49)0,0272
Obtenemos para nuestros datos: 
0,025
Teniendo en cuenta que, para 49 grados de libertad,  249,0,95  66,33
La desigualdad 54,4 menor que 66,33. Conduce a aceptar la hipótesis nula.

3. El ciclo medio de vida útil de una muestra aleatoria de 10 Bombillos es de 4 000 horas, con
una desviación estándar de 200 hr. Se supone que, en general, el ciclo de vida útil de los
bombillos tiene una distribución normal. Supongamos que antes de que se recolectara la muestra
se estableció la hipótesis de que la desviación estándar de la población no es mayor de σ = 150.
Con base en los resultados muéstrales, esta hipótesis se prueba al nivel de significancia de 1 % de
la siguiente manera:
Solución:

H0 σ2 = 22500
H1 σ2 > 22500
(n  1)S 2
El estadístico de contraste es:
2
(10  1)40000
Sustituyendo en el estadístico obtenemos:  16,0
22500
Como el contraste es unilateral buscamos en las tablas de la Ji-cuadrado, con 9 grados de
libertad, el valor de la variable que deja por debajo de sí una probabilidad de 0,99, este valor es
21,67. Dado que el estadístico de prueba calculado de 16.0 no excede el valor crítico de 21.67 en
esta prueba de cola superior, la hipótesis nula de que σ≤ azarse al nivel de
significancia de 1%.
225
Prueba de Hipótesis para el cociente de Varianzas

Si de dos poblaciones con distribución normal se seleccionan dos muestras aleatorias


independientes de tamaños n1 y n2, se puede comparar la homogeneidad o variabilidad de dichas
poblaciones a través de una prueba de hipótesis para el cociente de varianzas.

Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra
tenga mayor varianza. Es decir que la población 1 será la que tenga mayor varianza muestral.

Se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis bilateral

H0 : 12   22 ó H0 : 12  22  1

H1 : 12   22 ó H1 : 12  22  1

- Prueba de hipótesis unilateral derecha

H0 : 12   22 ó H0 : 12  22  1

H1 : 12   22 ó H1 : 12  22  1

- Prueba de hipótesis unilateral izquierda

H0 : 12   22 ó H0 : 12  22  1

H1 : 12   22 ó H1 : 12  22  1

El estadístico de trabajo esta representado por la expresión:

n 1 (n 2  1)S12  22
T  F(n 1  1, n 2  1)
n 2 (n 1  1)S 22 12

Regla de Decisión

Si se ha planteado la hipótesis alternativa como:

H1 : 12   22 ó H1 : 12  22  1 se tiene una prueba de hipótesis bilateral, por lo tanto, el nivel de
significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la
distribución. Z  y Z  pertenecen a una distribución F con (n1 -1) grado de libertad en
1
2 2
el numerador y (n2-1) grado de libertad en el denominador. Si el valor del estadístico de trabajo
226
(T) está entre Z  y Z  no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual
1
2 2

implica aceptar H1. Es decir, si Z  < T < Z  no se rechaza H0.


1
2 2

- Si se ha planteado la hipótesis alternativa como:

H1 : 12   22 ó H1 : 12  22  1 , se tiene una prueba de hipótesis unilateral derecha, quedando el


nivel de significancia ( ) en la parte superior de la distribución. Z1- a pertenece a una distribución
F con (n 1 -1) grado de libertad en el numerador y (n 2 -1) grado de libertad en el denominador.
Si el valor de la estadística de trabajo (T) es menor que Z1- a no se rechaza la hipótesis nula, en
caso contrario se rechaza Ho lo cual implica aceptar H1. Es decir, si T < Z1- a no se rechaza Ho.

- Si se ha planteado la hipótesis alternativa como:

H1 : 12   22 ó H1 : 12  22  1, se tiene una prueba de hipótesis unilateral izquierda, quedando el


nivel de significancia ( ) en la parte inferior de la distribución. Za pertenece a una distribución F
con (n1 -1) grado de libertad en el numerador y (n2 -1) grado de libertad en el denominador. Si el
valor de la estadística de trabajo (T) es mayor que Za no se rechaza la hipótesis nula, en caso
contrario se rechaza Ho lo cual implica aceptar H1. Es decir, si T > Za no se rechaza H0.

Ejemplo

1. Dos fuentes de materias primas están siendo consideradas. Ambas fuentes parecen tener
características similares, pero no se está seguro de su homogeneidad. Una muestra de 10 grupos
de la fuente 1 produce una varianza de 250 y una muestra de 11 grupos de la fuente 2 produce
una varianza de 195. Con base en ésta información se puede concluir que ¿la varianza de la
fuente A es significativamente mayor que la de la fuente B?. Asuma un nivel de confianza del 99
por ciento.

Solución

H 0 : 12   22

H1 : 12   22

n1  10 S12  250 n 2  11 S22  195 1    0,99

n 1 (n 2  1)S12  22 10(10)250
T   1,295
n 2 (n 1  1)S 22 12 11(9)195

Con un nivel de confianza del 99 por ciento, en la tabla de la distribución F con 9 grados
de libertad en el numerador y 10 grados de libertad en el denominador, se obtiene un valor para Z
de 4,94. Como puede observarse, el valor del estadístico de trabajo está en la zona de no rechazo
de la hipótesis nula, por lo tanto, con una confiabilidad del 99 por ciento, no se puede rechazar
227
que la variabilidad de las dos fuentes de materia prima es igual.

2. Se supone que el ciclo de vida de los bombillos tiene una distribución normal. Probemos la
hipótesis nula de que las muestras se obtuvieron de poblaciones con varianzas iguales, con un
nivel de significancia de 10%, mediante el uso de la distribución F.

Solución

H 0 : 12   22

H1 : 12   22

n1  10 S12  40000 n 2  8 S22  62500 1    0,90

n 1 (n 2  1)S12  22 10(10)250
T   1,295
n 2 (n 1  1)S 22 12 11(9)195

Para la prueba al nivel de significancia de 10%, el punto de 5% superior para F y el punto de 5%


inferior para F son los valores críticos.

Dado que la razón F calculada no es ni menor de 0.304 ni mayor de 3.68, se halla en la región de
aceptación de la hipótesis nula. Así, el supuesto de que las varianzas de las dos poblaciones son
iguales no puede rechazarse al nivel de significancia de 10%.
228
Ejercicios Propuestos de Prueba de Hipótesis

1. Suponga una variable aleatoria X para designar el peso de un pasajero de avión, que se interesa
en conocer el peso promedio de todos los pasajeros. Como hay limitaciones de tiempo y dinero
para pesarlos a todos, se toma una muestra de 36 pasajeros de la cual se obtiene una media
muestral x  160 lbs. Suponga además que la distribución de los pasajeros tenga una distribución
normal con desviación estándar de 30, con un nivel de significancia de 0,05. Se puede concluir
que el peso promedio de todos los pasajeros es menor que 170 lbs?

2. El vicepresidente a cargo de las ventas de una corporación afirma que los vendedores tienen un
promedio no mayor de 15 prospectos de ventas por semana y el desearía aumentar esta cifra. Se
seleccionan 36 vendedores al azar para verificar su afirmación y registrar el número de contacto
en una semana, seleccionado la forma aleatoria. De los resultados de la muestra se obtuvo una
media de 17 prospectos y una varianza de 9. ¿Contradicen los hechos la afirmación del
vicepresidente? Use α = 0.005

3. Se desea comprobar si la cantidad de dinero que un estudiante gasta en promedio semanal es mayor
que 87 Bs., seleccionando una muestra al azar de 49 estudiantes y se encuentra que la media es de 85
Bs., teniendo una desviación típica de 7,25 Bs. Con un coeficiente de confianza de 95%

4. Una operación de montaje en una fábrica requiere de un período de entrenamiento de un mes


para que un nuevo empleado alcance la máxima eficiencia. Se sugirió un nuevo método de
entrenamiento, se tomaron dos grupos de 9 empleados cada uno; uno se entrenó con el método
estándar y el otro con el nuevo y se midió el tiempo en minutos que necesito cada empleado para
mostrar el diagnóstico final. Los resultados fueron:
X  35,22 ; Y  31,56 ; S 2X  195,26 ; S 2Y  160,22 . Hay suficiente evidencia para indicar una
diferencia en los promedios para los tiempos de los métodos. Utilice un nivel de confianza de
95%

5. Antonio Pacheco es propietario de un Kiosco de periódicos en el centro de Puerto Cabello. El


negocio ha mejorado hace poco y Antonio piensa que los ingresos diarios son superiores a los
500 Bs. del año pasado. Una muestra de 256 días revela una media de 520 Bs. y una desviación
típica de 80,70 Bs. Al nivel de significación del 1%. ¿Tiene razón Antonio?

6. En un estudio realizado en el año 2009 en la Universidad decía que la gente tardaba 34 horas
de promedio en aprender un nuevo programa informático. ¿Está respaldada esta información al
nivel de 10% si 35 personas emplearan una media de 40,58 horas; con una desviación típica de
19,7 horas?
229
7. Cuando un proceso de producción funciona correctamente produce frascos de champú con un
peso promedio de 200 gr. Una muestra aleatoria de una remesa presentó los siguientes pesos:
214; 197; 197; 206; 208; 201; 197; 203; 209. Asumiendo que la distribución de los datos es
normal, pruebe con un nivel de confianza del 95% si el proceso está funcionando correctamente.

8. Un concesionario afirma que los propietarios de sus vehículos usados pueden recorrer una
media de 10000 millas como mínimo sin necesidad de ninguna reparación importante. Con objeto
de determinar el grado de honestidad del concesionario, se eligen 100 clientes y se halla que
recorrieron una media de 9112 millas sin reparaciones, con una desviación típica de 207. Si
resulta que los coches usados de este den una media de 10000 millas como mínimo sin averías,
usted está dispuesto a comprarle su próximo coche. Si quiere estar seguro al 99% de que el
concesionario no miente, ¿cómo podría contrastar su afirmación?

9. Un laboratorio farmacéutico afirma que el antiinflamatorio fabricado por ellos elimina la


inflamación en 14 minutos en los casos corrientes. Con el objeto de comprobar estadísticamente
esta afirmación, elegimos al azar 18 pacientes con inflamaciones varias y tomamos como variable
de respuesta el tiempo transcurrido entre la administración del antiinflamatorio y el momento en
que desaparece la inflamación. Además, nos dicen que la variable tiempo transcurrido entre la
administración del antiinflamatorio y el momento en que desaparece la inflamación sigue una
distribución normal de media 14 y desviación 7. El tiempo medio de respuesta de la muestra fue
de 19 minutos. Se pide comprobar la afirmación del laboratorio a un nivel de significación de
0.05.

10. El gerente de producción de una empresa de cereales está preocupado por el proceso de
sellado de las cajas llenas. Cuando el paquete de cereal que se coloca en la caja está lleno, se
supone que éste se sella de modo que quede hermético. Basándose en la experiencia anterior, se
sabe que uno de cada diez cajas no cumplen con las normas de sellado y deben ser revisados.
Para modificar esta situación, suponga que el gerente instrumenta un sistema de sellado que se
acaba de desarrollar. Después de un período de prueba, el gerente toma una muestra de 200 cajas
que representan la producción diaria en la planta, y encuentra, mediante una inspección, que 11
de ellas deben ser vueltas a sellar. El gerente desea determinar si existe alguna evidencia de que
con el nuevo sistema de sellado, la proporción de paquetes defectuosos ha mejorado. Decida si
puede afirmarse que ha mejorado.

11. Una empresa del ramo alimenticio desea determinar si el lote de una materia prima tiene o no
una varianza poblacional mayor a 15 en su grado de endulzamiento. Se realiza un muestreo de 20
elementos y se obtiene una varianza muestral de 20.98; realizar la prueba de hipótesis con alfa =
0.05.
230
12. Un negocio debe pagar horas extra dada la demanda incierta de su producto, por lo cual en
promedio se pagan 50 horas extra a la semana el gerente de recursos humanos considera que
siempre se ha tenido una varianza de 25 en las horas extras demandadas. Si se toma una muestra
de 16 semanas se obtiene una varianza muestral de 28.1. Determine con alfa = 0.10 si la varianza
poblacional de las horas extras demandadas a la semana puede considerarse igual a 25.

13. Se desea estimar la precisión de un instrumento de medición. Al realizar tres mediciones con
el instrumento encontró una varianza muestral de 10.57 unidades. Suponga que lo estándar es que
la desviación de este tipo de instrumento sea de dos unidades, y se ha decidido probar si con los
resultados obtenidos de esta muestra puede refutarse la hipótesis planteada. Usando un nivel de
confianza del 95%.

14. Una empresa consultora desea determinar la variabilidad existente en la opinión pública sobre
el desempeño del Gobierno del Estado; históricamente la varianza ha sido de 2 en los puntos de
calificación que le otorga la ciudadanía al gobierno; en el último muestreo se detecto una
varianza de 3 tomando como referencia rápida 20 personas; ¿hay elementos estadísticos
suficientes para asegurar que la varianza ha AUMENTADO? Realice la prueba de hipótesis para
contestar la pregunta anterior con un alfa = 0.1. Realice:
a) Redacción de la prueba de hipótesis, indicando si debe ser prueba de una o dos colas.
b) Determine mediante el estadístico de prueba ji cuadrada si se acepta o rechaza la hipótesis nula
y cuál sería la consecuencia del resultado obtenido para la pregunta.

15. Una empresa desea concursar para ganar un contrato con el gobierno como proveedor de
concreto; uno de los requisitos es la resistencia a la compresión del concreto a los 28 días de
haberse preparado la mezcla. La empresa ganadora dice que mantiene excelentes controles de
calidad en su concreto y como tal hay una varianza muy baja en resistencias a la compresión, del
orden de 16 kgf2/cm4; pero al hacerle en un laboratorio unas pruebas de resistencia se detecta una
4
varianza mas elevada de 25 kgf2/cm ¿hay evidencia estadística suficiente para considerar que el
proveedor está mintiendo y en realidad la desviación estándar es DIFERENTE a 16 kgf2/cm4?
a) Redacción de la prueba de hipótesis, indicando si debe ser prueba de una o dos colas para
responder la pregunta.
b) Determine mediante el estadístico de prueba ji cuadrada si se acepta o rechaza la hipótesis nula
y cuál sería la consecuencia del resultado obtenido para la pregunta.
231
DISTRIBUCIONES BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una


población. En el caso de dos (o más) variables estudiadas conjuntamente se habla de variable
bidimensional (multidimensional); si se trata de dos caracteres cualitativos, de par de atributos.
Si de una cierta población se estudian dos caracteres simultáneamente se obtienen dos series de
datos.
Individuos A B C ……….
Carácter X x1 x2 x3 ……….
Carácter Y y1 y2 y3 ……….

El problema a estudiar consiste en averiguar si existe relación entre dos fenómenos,


representados por las variables X e Y.

La lista de pares de datos correspondientes a cada individuo de la población (repetidos o


no), es lo que llamamos variable estadística bidimensional.

Ejemplos

1. A cada uno de los reclutas de un reemplazo se les talla y pesa. Se trata de dos variables
cuantitativas.
Xi (talla en m) 1,70 1,70 1,69 1,68 ……
Yi (peso en Kg.) 67 75 70 66 ……
En este ejemplo se quiere ver o estudiar como varía el peso con la altura.

2. Entre los empleados de una empresa se ha realizado una encuesta sobre el consumo de tabaco,
que ha arrojado los siguientes resultados:

Habito Fumadores No Fumadores Total filas


Sexo
Varones 49 64 113
Mujeres 43 37 80
Total Columnas 92 101 193
En este ejemplo se quiere ver o estudiar como varía el consumo de tabaco con el sexo.

Nota. En este tema nos limitaremos al estudio de caracteres cuantitativos discretos, puesto que si
el carácter es continúo o discreto agrupado en intervalos, se trabajará con las marcas de clase.
232
DISTRIBUCIONES DE FRECUENCIAS

Se disponen las frecuencias en una tabla de doble entrada donde las xi y la yj están
ordenadas en forma creciente. Recibe el nombre de tabla de frecuencias o tabla de correlación.

Si hay pares que se repiten se agrupan siendo nij la frecuencia absoluta del par (xi, yj).
Las sumas

nij = ni , frecuencia absoluta de xi.


j

nij = n’j , frecuencia absoluta de yj


i

Se llaman frecuencias absolutas marginales de las variables X e Y respectivamente.


nij = N=número total de pares.
j y

Quedando la siguiente tabla de doble entrada:

X x1 x2 ....... xk Frecuencias absolutas


Y marginales de Y
y1 n11 n21 ..... nk1 n’1

y2 n12 n22 ...... nk2 n’2

...... ..... .... .... ... ....


.
yr n1r n2r ... nkr n’r

Frecuencias absolutas n1 n2 .. nk nij = N


marginales de X i j

En la práctica algunas de las nij pueden ser cero. En tal caso la casilla correspondiente se
dejará en blanco.

Ejemplo 3. Dada la distribución bidimensional:

X 1 2 1 2 3 2 2 2 3 1
Y 3 5 2 3 5 4 3 5 5 3
233
La tabla correspondiente es:

X 1 2 3 Frecuencias absolutas marginales de y


Y
2 1 1
3 2 2 4
4 1 1
5 2 2 4
Frecuencias absolutas marginales de X 3 5 2 N=10

Al estudiar una variable bidimensional se obtienen varias distribuciones


unidimensionales, según se consideren las filas o las columnas de la tabla en estudio.

Las distribuciones unidimensionales del total de los individuos de la población, respecto a


cada una de las características reciben el nombre de distribuciones marginales.

Distribución marginal de la Y:

Y Frecuencias absolutas marginal de Y

y1 n’1
y2 n’2
. .
. .
yr n’r

Análogamente la distribución marginal de la X

Ejemplo 4. Obtener la distribución marginal de la variable X.

X Frecuencias absolutas marginal de X


1 3
2 5
3 2

Si en la tabla de correlación consideramos la primera columna y una columna intermedia,


la correspondiente a yj, se obtiene una distribución unidimensional que llamaremos distribución
234
condicionada de la variable X por la modalidad yj de la variable Y.

Frecuencias absolutas condicionadas por yj


X

x1 n1j
x2 n2j
. .

. .

xk nkj

Análogamente se define la distribución condicionada de la variable Y por la modalidad x i de la


variable X.

Ejemplo 5.

Obtener la tabla de la distribución condicionada de la variable Y por la modalidad x2.

Frecuencias absolutas condicionadas por x2


Y
2 0
3 2
4 1
5 2

REPRESENTACIONES GRÁFICAS

Consideremos la distribución:

x1 x2 ..... xN
y1 y2 ....... yN

Los pares de valores observados (xi , yj) pueden estar repetidos y pueden ser representados
en unos ejes coordenados, tal como son mostrados a continuación.
235
y  
 
( xi , yj )
 
 

x

El conjunto de puntos que resulta se llama diagrama de dispersión o nube de puntos de la


distribución bidimensional.

Cuando el número de datos es grande (se usa una tabla de doble entrada) los datos se
representan con un diagrama de dispersión reticulado de tal manera que la visión de la nube de
puntos indique realmente cómo es la distribución.

En estos casos también se suele usar un diagrama de barras sobre un sistema cartesiano de
tres dimensiones (estereogramas).

Ejemplo 6.

Hacer el diagrama de dispersión de la distribución del ejemplo 3.

. .
. .

.
. .
. .

.
0 1 2 3

PARÁMETROS ESTADISTICOS DE LA V. A. BIDIMENSIONAL

Considerando las distribuciones marginales, como son unidimensionales es posible


calcular los siguientes parámetros:
236
a) Medias o Medias Marginales ( X, Y )

x
x n i i

y
 yi n i
N

Donde N = ni = n’j es el numero total de pares

Nota. En una distribución bidimensional al punto (x, y) se le llama centro de gravedad de la


distribución.

b) Varianzas (S2 x   x y S2 y   y )
2 2

Se define: Varianza marginal de la variable X


 (x i  x) 2 x
2

S x  x    (x) 2
2 2 i

N N

Análogamente la varianza marginal de la variable Y.


 (y  y) 2 y
2

    ( y) 2
2 2 i i
S y y
N N

De ellas (extrayendo la raíz cuadrada) se obtienen las correspondientes desviaciones típicas.

c) Desviaciones típicas ( x ( s x ), y ( s y ) )

Serán las desviaciones típicas de X e Y

 x  Sx 
 xi  x  2


 fixi  x  2


 xi 2

 x2
N N N

 y  Sy 
 yi  y 2


 fiyi  y 2


 yi 2

 y2
N N N

Ejercicio 1. Calcula las medias marginales y las varianzas de la v.e. del ejemplo 3.

Solución x = 19/10 =1,9 ; y =38/10 = 3,8 ; Sx2 = 4,1-(1,9)2 = 0,49 ; Sy2 = 15,6 - 14,44 = 1.16.

d) Covarianza
( xy  (Sxy )
237

Para las variables estadísticas bidimensionales se define la “covarianza ’’ como la media


aritmética de los productos de las desviaciones respecto de la media de cada una de las variables
componentes. Es decir:

S xy   xy 
 (xi  x)  yi  y   xi  yi  x  y
N N

Se demuestra que:

S xy 
x i  yi
 M xy  x  y
N

Propiedad que facilita el cálculo de la covarianza

Ejercicio 2. Calcular la covarianza de la distribución del ejemplo 3.

Solución: Sxy = 2  6  12  8  20  30 - [(1,9) · (3,89)] = 0,58.


10

REGRESIÓN LINEAL

Al considerar los dos caracteres de una variable bidimensional puede ocurrir.

- Que haya una dependencia funcional entre ellos, de tal manera que a cada valor le corresponda
un único valor del otro. Ejemplo: la temperatura a la que calentamos una barra de hierro y la
longitud alcanzada.

-Que haya una dependencia estadística o correlativa, de tal manera que los valores sigan unas
pautas similares. Por ejemplo el número de horas de estudio y las notas obtenidas.

- Que se de una independencia entre los caracteres. Por ejemplo la estatura y las calificaciones en
Matemáticas.

El estudio de la relación entre dos caracteres de una variable estadística bidimensional es


el objeto de la regresión lineal.
La nube de puntos de una distribución bidimensional nos da una primera idea de la
relación existente entre los datos de la misma. Cuando la nube de puntos del diagrama de
238
dispersión permita deducir algún tipo de dependencia entre las dos variables X, Y,
concentrándose los puntos alrededor de una cierta línea (línea de regresión) se plantean dos
cuestiones:

a) Definir la línea.
b) Medir el nivel de aproximación de dicha línea.

Sí la línea es una recta, el problema es un caso típico de regresión lineal.

Rectas de regresión.

Se llama recta de regresión a aquella que mejor se ajusta a la nube de puntos.


El procedimiento más usado, para hallar dicha recta, es el los mínimos cuadrados.
Se calcula la recta:
y = ax + b, de tal manera que: S =  [yi - (a xi + b )2 sea mínima

. ..
. .
.
. . . .
. .

El cálculo de a y b incluye conocimientos que no se dan en este nivel (derivación


parcial...), por lo que sólo daremos el resultado:
Se verifica:
S xy S
a  2 ; b  y  2xy x Luego se puede escribir:
S x S x

S xy S xy S xy
y 2
xy 2
x ; o lo que es lo mismo: y  y  (x  x)
S x S x S2 x

Esta es la ecuación de la recta de regresión de Y sobre X. Sirve para hacer estimaciones


o predicciones de los valores de Y conocidos los de X.
S xy
Análogamente la recta de regresión de X sobre Y tiene por ecuación: x  x  2 ( y  y) en
S y
definitiva se puede escribir lo siguiente:
239
 xy
Y Y
x 2
X  X ( Variable Y en función de X)
 xy
XX 
y 2
Y  Y ( Variable X en función de Y)
S xy S xy
A los factores m yx  2
y m xy  se les llama los coeficientes de regresión.
S x S2 y

Ejercicio 3. Hallar las rectas de regresión para la distribución del ejemplo 3.

Solución: recta de regresión de Y sobre X y – 3,8 = 1,18 (x- 1,9)


recta de regresión de X sobre Y x – 1,9 = 0,5 ( y – 3,8 ).

Nota. Veamos algunas propiedades del coeficiente de regresión que facilitan los cálculos de
estos, pues permiten hacer un cambio de variable.

Propiedades del coeficiente de regresión:

1) Si se suma o resta una constante a todos los valores de X o de Y el coeficiente de regresión no


varia.
2) Si se multiplican todos los valores de X por una constante, el coeficiente de regresión queda
multiplicado por esa constante.
Si se multiplican todos los valores de y por una constante, el coeficiente de regresión queda
multiplicado por esa constante.

Ejemplo 7. Si se consideramos la tabla

1980 430000
1983 450000
1986 475000
1989 500000

Si hacemos X’ = X  1980 Y’ = Y  450000


3 1000

Se obtiene:
240
0 -20
1 0
2 25
3 50

Par la variable X’ ,Y’ es más fácil el cálculo del coeficiente de regresión y la relación entre éste y
el de XY es:
m’yx = 3mxy
1000

b) Correlación lineal.

Se entiende por correlación la dependencia que existe entre las variables de una
distribución., cuando ésta es, en cierta forma, lineal se habla de correlación lineal. Cuando no
existe tal dependencia se dice que las variables están incorreladas.

Si bien la covarianza permite obtener conclusiones sobre la existencia y tipo de


correlación, para medirla de una forma cuantitativa, se utiliza un parámetro que permite más
seguridad en las conclusiones. Se trata del coeficiente de correlación lineal, o de Pearson, el cual
se define así:

El signo es + si la covarianza es positiva y - si es negativa.

R = Sxy   myx.mxy
Sx.Sy
Propiedades de r

a) -1≤ r ≤1

b) Si r es positivo la correlación es directa, es decir, al aumentar una variable también aumenta la


otra (coeficiente de regresión positivo). En este caso las pendientes de las rectas de regresión son
positivas.

. .
.. . .
. . .
. .
241
Si r es negativo la correlación es inversa, es decir, al aumentar una variable disminuye la otra. En
este caso las pendientes de la rectas de regresión son negativas.

. .
. . .
. .

c) Si r2 = 1, es decir, r igual a 1 o a -1, las dos rectas de regresión coinciden y la nube de puntos
está contenida en la recta (correlación perfecta). Hay dependencia funcional entre las variables.

d) Si r = 0 las rectas de regresión son perpendiculares entre sí y paralelas a los ejes. Las variables
son incorreladas.

Para los demás valores de r la dependencia es tanto más fuerte cuanto más próximo esté a 1 o a -
1. Será más débil cuando se aproxime a 0:

Para la correlación directa:


Si 0,75  r  1 correlación muy alta.
Si 0,40  r  0,75 correlación baja
Si r < 0,40 la correlación es casi despreciable.
Ejercicio 4. Hallar el coeficiente de correlación lineal para la distribución del ejemplo 3.

Solución: r = + (118
, ).(0,5) = 0,76. Se trata de una correlación directa alta.

Problemas resueltos:

Al estudiar dos variables, las tablas de frecuencias serán del tipo:

x y xy xx y  y (x  x )2 (y  y )2
5 15 75 0,2 0,8 0,04 0,64
7 18 126 2,2 3,8 4,84 14,44
2 10 20 -2,8 -4,2 7,84 17,64
1 8 8 -3,8 -6,2 14,44 38,44
9 20 180 4,2 5,8 17,64 33,64
=24 =71 =409 =44,8 =104,8

Medias o medias marginales ( X, Y )


242

X
 xi   xi  fi X 
5  7  2 1 9
 4,8
N N 5

Y  yi   yi  fi Y 
15  18  10  8  20
 14,2
N N 5

Desviaciones típicas ( x ( s x ), y ( s y ) )

x  s x 
xi  x2 
fi xi  x2 
xi 2  x 2
N N N
yi  y   fi yi  y   yi 2  y 2
2 2
y  s y   
N N N

 x  sx 
 xi 2

 x2 
25  49  4  1  81
 4'8 2  8,96  2,993
N 5

 x  sx 
 yi 2

 y2 
225  324  100  64  400
 14'2 2  20,96  4,578
N 5

Covarianza ( xy  (Sxy )

 xy 
(xi  x )  yi  y   xi  yi  x  y
N N
75  126  20  8  180
 xy   4,8  14,2  13,64
5

Coeficiente de correlación lineal de Pearson.

 xy  xy 13,64
r  r   0,995
x  y  x   y 2,993  4,578

Existe correlación directa. (r = +0,995)

Rectas de regresión

Si el coeficiente de correlación es próximo a +1 o -1, se puede intentar calcular la recta


que se ajusta a la nube de puntos. Dicha recta recibe el nombre de recta de regresión y permite
estimar el valor (desconocido) de una de las variables, conociendo el valor de la otra variable.
La ecuación de la recta de regresión será:
243
 xy
Y Y
x 2
X  X ( Variable Y en función de X)
 xy
XX 
y 2
Y  Y ( Variable X en función de Y)

13,64
Y - 14,2 = ( X  4,8)  Y  1,52 X  6,89
8,96
13,64
X  4,8  (Y  14,2)  X  0,650Y  4,43
20,96

2. Una asociación dedicada a la protección de la infancia decide estudiar la relación entre la


mortalidad infantil en cada país y el número de camas de hospitales por cada mil habitantes.
Datos

x 50 100 70 60 120 180 200 250 30 90


y 5 2 2,5 3,75 4 1 1,25 0,75 7 3

Donde x es el nº de camas por mil habitantes e y el tanto por ciento de mortalidad.


Se pide calcular las rectas de regresión y el coeficiente de correlación lineal.
¿Si se dispusiese de 175 camas por mil habitantes que tanto por ciento de mortalidad se debería
esperar? ¿La estimación es confiable? Razona la respuesta.

Solución:

Para facilitar los cálculos de los parámetros se utiliza la siguiente tabla:

xi yi xi2 yi2 x i yi
50 5 2500 25 250
100 2 10000 4 200
70 2,5 4900 6,25 170
60 3,75 3600 14,0625 225
120 4 14400 16 480
180 1 32400 1 180
200 1,25 40000 1,5625 250
250 0,75 62500 0,5625 187,5
30 7 900 49 210
90 3 8100 9 270
 = 1150 30,25 179300 126,4375 2422,5
244
x = 115 ; y = 3,025% ; Sx = 17930  13225  68,59
Sy = 12,64375  9,150625 = 1 , Sxy= 242,25  (115)(3,025) = -105,625

Las rectas de regresión serán por tanto:

y - 3,025 = -0,022449 (x - 115)


x - 115 = -30,2053 (y - 3,025)

El coeficiente de correlación lineal:

105,625
r= = - 0,8235 Es una correlación inversa alta.
(68,59)(1,87)
Para la estimación que nos piden utilizaremos la recta de regresión de Y sobre X.
y = 3,025 - 0,022449(175- 115) = 1,6783 que sería fiable por ser alto el coeficiente de
correlación.

3. Dada la distribución bidimensional:

X 1 2 1 2 3 2 2 2 3 1
Y 3 5 2 3 5 4 3 5 5 3

Encuentre el valor del coeficiente de correlación lineal usando una tabla de correlación.

Solución.

Se usa la siguiente tabla de doble entrada que facilita los cálculos:

X 1 2 3 n’j nj’yj n’jyj2 nijxiyj


Y
2 1 1 2 4 2
3 2 2 4 12 36 18
4 1 1 4 16 8
5 2 2 4 20 100 50
ni 3 5 2 10 =38 =15 =78
6
nixi 3 10 6 =19
nixi2 3 20 18 =41

nijxiyj 7 40 30 =78
245
De aquí se tiene:

x = 19/10 = 1,9 ; y = 38/10 = 3,8 ; Sx2 = 4,1 - (1,9)2 = 0,49, Sx = 0,7

Sy2 =15,6 - (3,8)2 = 1,16, Sy = 1,077; Sxy = 7,8 - (1,9)(3,8) = 0,58.

0,58
Luego r= = 0,769
(0,7)(1,077)

Problemas propuestos

1. Las tallas y los pesos de 10 personas vienen recogidos en la siguiente tabla:

talla (Cm.) 160 165 170 180 185 190 192 175 182 172
pesos (Kg.) 58 61 65 73 80 85 83 68 74 67

Estimar el peso promedio de una persona que mida 168 cm.

2. El número de licencias de caza, en miles, y el número de votantes a un determinado partido en


6 comunidades autónomas, en decenas de miles, está expresado en la siguiente tabla:

Nº de licencias (X) 103 26 3 7 26 5


Nº de votantes (Y) 206 26 27 14 24 12

Determinar:
a) Media y varianza de las variables X e Y.
b) Coeficiente de correlación, interpretando su valor.
c) En el caso de que exista correlación: si en una determinada comunidad existen 50 decenas de
millar de votantes, ¿cuántas licencias de caza, en miles, se puede estimar que existen.

3. Las distancias medias de los 19 planetas al Sol son:

1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Merc Ven. Tie. Ma. Ast. Jup. Sat. Ur. Nep. Plu
0,39 0,72 1 1,52 2,65 5,2 9,54 19,19 30,07 39,52

(Se ha tomado como unidad la distancia entre la Tierra y el Sol, a lo que se llama unidad
astronómica (u.a.). El quinto lugar está ocupado por los asteroides que, para estos efectos, son
considerados como un planeta más).
246
Representar la nube de puntos correspondiente, trazar la recta de regresión y calcular el
coeficiente de correlación.
Si hubiera un nuevo planeta más allá de Plutón, ¿a qué distancia en u.a. estaría del Sol?. ¿Sería
“confiable” esta medida?

4. Observaciones realizadas con estudiantes de Matemáticas, sobre el efecto del paso del tiempo
en los conocimientos adquiridos, arrojan los siguientes resultados:
1 día ..................... 90 % de permanencia de conocimientos.
2 días .................... 75 % “ “
3 días .................... 42 % “ “
4 días .................... 30 % “ “
5 días .................... 21 % “ “

Tomando los días transcurridos (X) y el tanto por ciento (Y) como variables de una
distribución dimensional, halla la recta de regresión de Y sobre X y estima, si existe una
correlación fuerte, el tanto por ciento de conocimientos que permanecerán a los ocho días.
Organiza los cálculos y explica el resultado.
247
Bibliografía

Meyer. P.L. Probabilidades y Aplicaciones Estadísticas. Addison-Wesley


Iberoamericana. México 1986.

Santalo, L.A. Probabilidades e Inferencia Estadística. Monografía Nro. 11, Serie De


Matemematica. (Editado Por La OEA 1970).

Arley, A y Buch, R. Introducción a La Teoría de la Probabilidad y La Estadística. Alhambra,


Madrid 1968.

Cramer,H. Elementos de la Teoría de Probabilidad y Aplicaciones.Aguilar, Madrid


1963.

Dixon W Y Massey F.J. Introducción al Análisis Estadístico. Mc Graw Hill


1970.

Krief, A., Levy, S. Cálculo de Probabilidades. Problemas. Pirámide. 1978.

Jose H. Chourio. Estatística I, Estatística II, Editorial. Biosfera Caracas 1987

David Salama. Estadística Metodología y Aplicaciones, Tipografía Principios, Caracas 1992.

Casas Sánchez, J.M., García Pérez, C. y Otros. Problemas De Estadística. Descriptiva,


Probabilidad E Inferencia. Editorial Pirámide 1998.

M.R. Spiegel. Probabilidad Y Estadística. Schaum. Mc Graw-Hill.

Navegadores de La Internet.

López. Rafael, Cálculo de Probabilidades e Inferencia Estadística con Tópicos de Econometria.


Universidad Católica Andrés Bello. Editorial Texto Caracas 1996.
248

ANEXOS
PARAMETRO CONDICION ESTADISTICO INTERV. de CONFIANZA COMENTARIO
249
x  x2= x  x x
n xZ 
Conocidas
x 1
2 n Estadístico N (0,1)
x x 2
= x  x sx
n x  t n 1 Estadístico con distribución
sx 1 n
Desconocidas 2 t (n-1)
(n  1) s 2
x (n  1) s 2
x (n  1) s 2
x Estadístico con distribución
;
x 2
---------------------  2
x  2
( n 1)(1 )
 2
( n 1)
 χ2(n-1)
2 2

Dos poblaciones x  y  ( x   y )  2
 y2
x - y xyZ x

normales  x2  y2 1

nx ny
 2
independiente nx ny Estadístico N(0,1)
 x ; y
2 2

conocidas
 x 2 ; y 2 x  y  ( x   y )
n x n y 2 1 1 (n x  1)S 2x  (n y  1)S 2y
xyt s  Sp 
x - y sp
1 1
 1
 p
nx ny nx  ny  2
desconocidas nx n y 2

pero iguales Estadístico con distribución t con


x = y = n x  n y  2 g.l.
2 2 2

 x 2 ; y 2 x  y  ( x   y ) 2
s x2 s y (n x  n y )  50
x - y 2 xyZ  
desconocidas s x2 s y 1 nx n y Estadístico aproximadamente N(0,1)
 2

Muestras nx n y
grandes
2
 S 2x S2 
  y 
x - y  x 2 ; y 2 x  y  ( x   y ) 2 nx ny
s 2x s y
V   2
2 x  y  tv   2
Desconocidas s x2 s y

1 nx ny S 2

2
 S 2y 
2
 n   
ny 
x
Muestras nx n y  x   

Pequeñas nx 1 ny 1
V = g.l. de una t-student
2 2 2
s x s x s x

 2  x2  2x  2x
x X,Y Poblaciones ; Estadístico con distribución
 2 s y2 F n x 1  F n x 1  ( n x 1)
y Normales
 y2
( n y 1),1
2
( n y 1),
2
F ( n y 1)
 x 2 ; y 2
Desconocidas
P Proporción de X Binomial (n;p) p p p(1  p)
pZ
una Binomial Muestras p(1  p) 1

2
n
grandes
n

DISTRIBUCIONES
250

Distribución Chi-cuadrado
Si X 1 , X 2 ,........,X n son v.a. que siguen una distribución normal tipificada N (0,1),
entonces X= X 12  X 22 + ........ X n2 sigue una distribución  2n .
E ( X )  n ; Var ( X )  2 n

Distribución t de Student
Si X y Z son v.a. independientes, donde Z sigue una dist. Normal N(0, 1), y X una  2n ,
X n
entonces, la v.a. T  sigue una distribución t n E (T )  0 ; Var (T ) 
Y/n n2

Distribución F de Snedecor
Si X1 y X2 son v.a. independientes, con distribución Ji-cuadrado con n y m grados de
X /n
libertad respectivamente, entonces F  1 sigue una distribución F con n y m grados de
X2 / m
libertad.

DISTRIBUCIONES MUESTRALES

Se supondrá muestreo aleatorio simple y población normal. Si X1 , X2 ,........, Xn es una muestra


aleatoria de una población con media  y varianza 2

Media muestral con varianza conocida


2 2
X ~ N ( , ) E( X )   Var ( X ) 
n n
Varianza muestral
nS 2 n -1 2 2(n  1) 4
~ 2n 1 . E (S 2 )   Var ( S 2 ) 
 2
n n2

Media muestral con varianza desconocida

X 
n  1( ) ~ tn-1
S

Si X 1 ,..., X n es una m.a de una población con media x y varianza x2 y Y1 ,..., Ym es otra
m.a. de otra población con media y y varianza y2

Diferencia de medias muéstrales con varianza conocidas y muestras independientes


251
 x2  y2
X  Y ~ N ( x   y ,  )
n m
Diferencia de medias muéstrales con varianzas desconocidas pero iguales y muestras
independientes

X  Y  ( x   y )
~ t n + m-2
nS x2  mS y2 1 1

nm2 n m

Diferencia de medias muéstrales, muestras relacionadas


n=m, Di=Xi-Yi y Sd su desviación típica

X  Y  ( x   y )
n  1( ) ~ tn-1
Sd
Cociente de varianzas muéstrales

n S x2 /  x2 ( n  1)
~ F( n1),( m1)
m S y2 /  2y ( m  1)

ESTIMACION

Intervalos de Confianza a nivel 1-:

 Para la media de una población normal (  2 conocida)

   
X  z  ,X z  
 1
2
n 1
2
n 

 Para la media de una población normal (  2 desconocida)

 S S 
 X   t n1 , X   t n1 
 1
2
n 1 1
2
n  1 

 Para la proporción en una población Bernoulli

 P(1  P) P(1  P) 
P  z  ,P  z  
 1
2
n 1
2
n 

 Para la varianza de una población normal ( y  2 desconocidas)


252
 nS 2
nS 2
 , 
 1 / 2  n21  / 2  n 1 
2

 Para la diferencia de medias de poblaciones independientes (varianzas conocidas)

 2 
 x2  y  x2  y 
2
X  Y  z  , X  Y  z 
 
 1 n m 1 n m 
 2 2 

 Para la diferencia de medias de poblaciones independientes (varianzas desconocidas pero


iguales)

 nS x2  mS y2 nS x2  mS y2 
X  Y  1 1 1 1
t
 n m2  , X  Y   t n m2 
 1 nm2 n m 1 nm2 n m
 2 2 

 Para la diferencia de medias con muestras relacionadas.


n = m, Di = Xi-Yi y Sd su desviación típica

 S d2 S d2 
 X  Y   t n1 , X  Y   t n1 
 1 n 1 1 n 1
 2 2 

 Para la diferencia de proporciones.

 Px (1 - Px ) Py (1 - Py ) Px (1 - Px ) Py (1 - Py ) 
P  P  z  ,P  P  z  
 x y 1  /2 n m x y 1  /2 n m 
 

 Para el cociente entre varianzas de dos poblaciones normales

 2 
 nS x /( n  1) 1 nS 2 /( n  1) 1 
x
 2 ,
 mS y /( m  1)  f ( n1),(m1) mS 2 /( m  1)  f ( n1),(m1) 
 1-
2 y 2 

CONTRASTES DE HIPOTESIS
253
Estadísticos de contraste y regiones de rechazo a nivel :

 Para la media (  2 conocida)

X  0
a) Bilateral T R1  T : T  z1 / 2 
2
n
X  0
b) Unilateral derecho T  R1  T : T  z1 
2
n
X  0
c) Unilateral izquierdo T R1  T : T   z1 
2
n

 Para la media de una población normal (  2 desconocida)

X  0
a) Bilateral T R1  T : T 1 / 2 t n 1 
S2
n 1
X  0
b) Unilateral derecho T  R1  T : T 1 t n 1 
S2
n 1
X  0
c) Unilateral izquierdo T R1  T : T  1 t n 1 
S2
n

 Para la proporción en una población Bernoulli

P  p0
a) Bilateral T R1  T : T  z1 / 2 
p 0 (1  p 0 )
n
P  p0
b) Unilateral derecho T  R1  T : T  z1 
p 0 (1  p 0 )
n
P  p0
c) Unilateral izquierdo T R1  T : T   z1 
p 0 (1  p 0 )
n

 Para la varianza de una población normal


254
 
2
nS
a) Bilateral T R1  T : T 1 / 2  n21 ó T  / 2  n21
 02

b) Unilateral derecho T 
nS 2

R1  T : T 1  n21 
 2
0

c) Unilateral izquierdo T
nS 2

R1  T : T   n21 
 2
0

 Sobre la diferencia de medias con muestras independientes y varianzas conocidas

X Y  d0
a) Bilateral T R1  T : T  z1 / 2 
 2  y2
x

n m

X Y  d0
b) Unilateral derecho T R1  T : T  z1 
 x2  y2

n m

X Y  d0
c) Unilateral izquierdo T R1  T : T   z1 
 x2  y2

n m

H0 :  x   y  d0
 Sobre la diferencia de medias con muestras independientes y varianzas desconocidas pero
iguales

X  Y  d0
a) Bilateral T R1  T : T 1 / 2 t n  m  2 
nS x2 2
 mS y 1 1

nm2 n m

X  Y  d0
b) Unilateral derecho T R1  T : T 1 t n  m  2 
nS x2 2
 mS y 1 1

nm2 n m

X  Y  d0
c) Unilateral izquierdo T R1  T : T  1 t n  m2 
nS x2 2
 mS y 1 1

nm2 n m
 Sobre la diferencia de medias con muestras relacionadas (datos apareados)
255

X Y  d0
a) Bilateral T R1  T : T 1 / 2 t n 1 
Sd
n 1

X Y  d0
b) Unilateral derecho T R1  T : T 1 t n 1 
Sd
n 1

X Y  d0
c) Unilateral izquierdo T R1  T : T  1 t n 1 
Sd
n 1

 Sobre el cociente de varianzas

a) Bilateral T
nS x2 /(n  1) 1
mS y2 /(m  1) r0

R1  T : T 1 / 2 f n 1,m1 ó T  / 2 f n1,m1 

b) Unilateral derecho T 
nS x2 /(n  1) 1
mS y2 /(m  1) r0

R1  T : T 1 f n1,m1 

c) Unilateral izquierdo T
nS x2 /(n  1) 1
mS y2 /(m  1) r0

R1  T : T  f n1,m1 

 Sobre la diferencia de proporciones en poblaciones Bernoulli

Px  Py  d 0
a) Bilateral T R1  T : T  z1 / 2 
Px (1  Px ) Py (1  Py )

n m
Px  Py  d 0
b) Unilateral derecho T  R1  T : T  z1 
Px (1  Px ) Py (1  Py )

n m

Px  Py  d 0
c) Unilateral izquierdo T R1  T : T   z1 
Px (1  Px ) Py (1  Py )

n m

Regresión lineal
256
Distribuciones muéstrales de los estadísticos

 2
ˆ  
b  ˆ ~ N (  , 2 ) ~ t n2
ns x
s r2
 2 ( x 2  s x2 )
a  ˆ ~ N ( , ) ns x2
ns x2
ˆ  
(n - 2)s 2 ~ t n2
r
~ 2
n2
s r2 ( x 2  s x2 )
2
ns x2

Intervalos de confianza para  a nivel 1-


 s r2 ˆ s r2 
ˆ 1 / 2 t n  2 ,   t
1 / 2 n  2 
 ns x2 ns x2 

Intervalos de confianza para  a nivel 1-

 s r2 ( x 2  s x2 ) s r2 ( x 2  s x2 ) 

 1 / 2 n  2
 t ,   t
1 / 2 n  2 
 ns x2 ns x2 

ˆ   0 ˆ   0
Contrastes sobre  y  T T
s r2 s r2 ( x 2  s x2 )
ns x2 ns x2
a) Bilateral R1  T : T 1 / 2 t n2 
b) Unilateral derecho R1  T : T 1 t n2 
c) Unilateral izquierdo R1  T : T  1 t n2 
rxy n  2
Contrastes sobre el coeficiente de correlación. T ~ t n2
(1  rxy )
2

a) Bilateral R1  T : T 1 / 2 t n2 


b) Unilateral derecho R1  T : T 1 t n2 
c) Unilateral izquierdo R1  T : T  1 t n2 

Intervalo de confianza para la media de Y cuando X=x0

 2 1 (x  x)2 2 1 (x  x)2 
 yˆ 0 1 / 2 t n2 sr (  0 2 ) , yˆ 0 1 / 2 t n2 sr (  0 2 ) 
 n ns x n ns x 
257

Intervalo de confianza para la predicción cuando X=x0

 1 ( x0  x ) 2 1 ( x0  x ) 
2
ˆ
y 
 0 1 / 2 n2 r
t s 2
(1   ) , ˆ
y  t
0 1 / 2 n 2 s 2
r (1   )
 n ns x2 n ns x2 
PARAMETRO CONDICION ESTADISTICO INTERV. de CONFIANZA COMENTARIO
258
x  x2= x  x x
n xZ 
Conocidas
x 1
2 n Estadístico N (0,1)
x x 2
= x  x sx
n x  t n 1 Estadístico con distribución
sx 1 n
Desconocidas 2 t (n-1)
(n  1) s 2
x (n  1) s 2
x (n  1) s 2
x Estadístico con distribución
;
x 2
---------------------  2
x  2
( n 1)(1 )
 2
( n 1)
 χ2(n-1)
2 2

Dos poblaciones x  y  ( x   y )  2
 y2
x - y xyZ x

normales  x2  y2 1

nx ny
 2
independiente nx ny Estadístico N(0,1)
 x ; y
2 2

conocidas
 x 2 ; y 2 x  y  ( x   y )
n x n y 2 1 1 (n x  1)S 2x  (n y  1)S 2y
xyt s  Sp 
x - y sp
1 1
 1
 p
nx ny nx  ny  2
desconocidas nx n y 2

pero iguales Estadístico con distribución t con


x = y = n x  n y  2 g.l.
2 2 2

 x 2 ; y 2 x  y  ( x   y ) 2
s x2 s y (n x  n y )  50
x - y 2 xyZ  
desconocidas s x2 s y 1 nx n y Estadístico aproximadamente N(0,1)
 2

Muestras nx n y
grandes
2
 S 2x S2 
  y 
x - y  x 2 ; y 2 x  y  ( x   y ) 2 nx ny
s 2x s y
V   2
2 x  y  tv   2
Desconocidas s x2 s y

1 nx ny S 2

2
 S 2y 
2
 n   
ny 
x
Muestras nx n y  x   

Pequeñas nx 1 ny 1
V = g.l. de una t-student
2 2 2
s x s x s x

 2  x2  2x  2x
x X,Y Poblaciones ; Estadístico con distribución
 2 s y2 F n x 1  F n x 1  ( n x 1)
y Normales
 y2
( n y 1),1
2
( n y 1),
2
F ( n y 1)
 x 2 ; y 2
Desconocidas
P Proporción de X Binomial (n;p) p p p(1  p)
pZ
una Binomial Muestras p(1  p) 1

2
n
grandes
n

TABLAS ESTADISTICAS
259

Probabilidades BINOMIALES.

n= 5
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99
0 0,951 0,774 0,590 0,328 0,237 0,168 0,078 0,031 0,010 0,002 0,001 0,000 0,000 0,000 0,000
1 0,999 0,977 0,919 0,737 0,633 0,528 0,337 0,188 0,087 0,031 0,016 0,007 0,000 0,000 0,000
2 1,000 0,999 0,991 0,942 0,896 0,837 0,683 0,500 0,317 0,163 0,104 0,058 0,009 0,001 0,000
3 1,000 1,000 1,000 0,993 0,984 0,969 0,913 0,813 0,663 0,472 0,367 0,263 0,081 0,023 0,001
4 1,000 1,000 1,000 1,000 0,999 0,998 0,990 0,969 0,922 0,832 0,763 0,672 0,410 0,226 0,049

n= 10
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99
0 0,904 0,599 0,349 0,107 0,056 0,028 0,006 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,996 0,914 0,736 0,376 0,244 0,149 0,046 0,011 0,002 0,000 0,000 0,000 0,000 0,000 0,000
2 1,000 0,988 0,930 0,678 0,526 0,383 0,167 0,055 0,012 0,002 0,000 0,000 0,000 0,000 0,000
3 1,000 0,999 0,987 0,879 0,776 0,650 0,382 0,172 0,055 0,011 0,004 0,001 0,000 0,000 0,000
4 1,000 1,000 0,998 0,967 0,922 0,850 0,633 0,377 0,166 0,047 0,020 0,006 0,000 0,000 0,000
5 1,000 1,000 1,000 0,994 0,980 0,953 0,834 0,623 0,367 0,150 0,078 0,033 0,002 0,000 0,000
6 1,000 1,000 1,000 0,999 0,996 0,989 0,945 0,828 0,618 0,350 0,224 0,121 0,013 0,001 0,000
7 1,000 1,000 1,000 1,000 1,000 0,998 0,988 0,945 0,833 0,617 0,474 0,322 0,070 0,012 0,000
8 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,989 0,954 0,851 0,756 0,624 0,264 0,086 0,004
9 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,994 0,972 0,944 0,893 0,651 0,401 0,096

n= 15
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99
0 0,860 0,463 0,206 0,035 0,013 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,990 0,829 0,549 0,167 0,080 0,035 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 1,000 0,964 0,816 0,398 0,236 0,127 0,027 0,004 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3 1,000 0,995 0,944 0,648 0,461 0,297 0,091 0,018 0,002 0,000 0,000 0,000 0,000 0,000 0,000
4 1,000 0,999 0,987 0,836 0,686 0,515 0,217 0,059 0,009 0,001 0,000 0,000 0,000 0,000 0,000
5 1,000 1,000 0,998 0,939 0,852 0,722 0,403 0,151 0,034 0,004 0,001 0,000 0,000 0,000 0,000
6 1,000 1,000 1,000 0,982 0,943 0,869 0,610 0,304 0,095 0,015 0,004 0,001 0,000 0,000 0,000
7 1,000 1,000 1,000 0,996 0,983 0,950 0,787 0,500 0,213 0,050 0,017 0,004 0,000 0,000 0,000
8 1,000 1,000 1,000 0,999 0,996 0,985 0,905 0,696 0,390 0,131 0,057 0,018 0,000 0,000 0,000
9 1,000 1,000 1,000 1,000 0,999 0,996 0,966 0,849 0,597 0,278 0,148 0,061 0,002 0,000 0,000
10 1,000 1,000 1,000 1,000 1,000 0,999 0,991 0,941 0,783 0,485 0,314 0,164 0,013 0,001 0,000
11 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,982 0,909 0,703 0,539 0,352 0,056 0,005 0,000
12 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,973 0,873 0,764 0,602 0,184 0,036 0,000
13 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,965 0,920 0,833 0,451 0,171 0,010
14 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,987 0,965 0,794 0,537 0,140

n= 20
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99
0 0,818 0,358 0,122 0,012 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,983 0,736 0,392 0,069 0,024 0,008 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,999 0,925 0,677 0,206 0,091 0,035 0,004 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3 1,000 0,984 0,867 0,411 0,225 0,107 0,016 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000
4 1,000 0,997 0,957 0,630 0,415 0,238 0,051 0,006 0,000 0,000 0,000 0,000 0,000 0,000 0,000
5 1,000 1,000 0,989 0,804 0,617 0,416 0,126 0,021 0,002 0,000 0,000 0,000 0,000 0,000 0,000
6 1,000 1,000 0,998 0,913 0,786 0,608 0,250 0,058 0,006 0,000 0,000 0,000 0,000 0,000 0,000
7 1,000 1,000 1,000 0,968 0,898 0,772 0,416 0,132 0,021 0,001 0,000 0,000 0,000 0,000 0,000
8 1,000 1,000 1,000 0,990 0,959 0,887 0,596 0,252 0,057 0,005 0,001 0,000 0,000 0,000 0,000
9 1,000 1,000 1,000 0,997 0,986 0,952 0,755 0,412 0,128 0,017 0,004 0,001 0,000 0,000 0,000
260
10 1,000 1,000 1,000 0,999 0,996 0,983 0,872 0,588 0,245 0,048 0,014 0,003 0,000 0,000 0,000
11 1,000 1,000 1,000 1,000 0,999 0,995 0,943 0,748 0,404 0,113 0,041 0,010 0,000 0,000 0,000
12 1,000 1,000 1,000 1,000 1,000 0,999 0,979 0,868 0,584 0,228 0,102 0,032 0,000 0,000 0,000
13 1,000 1,000 1,000 1,000 1,000 1,000 0,994 0,942 0,750 0,392 0,214 0,087 0,002 0,000 0,000
14 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,979 0,874 0,584 0,383 0,196 0,011 0,000 0,000
15 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,994 0,949 0,762 0,585 0,370 0,043 0,003 0,000
16 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,984 0,893 0,775 0,589 0,133 0,016 0,000
17 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,965 0,909 0,794 0,323 0,075 0,001
18 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,992 0,976 0,931 0,608 0,264 0,017
19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,997 0,988 0,878 0,642 0,182

Probabilidades BINOMIALES.

n= 25
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99
0 0,778 0,277 0,072 0,004 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,974 0,642 0,271 0,027 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,998 0,873 0,537 0,098 0,032 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3 1,000 0,966 0,764 0,234 0,096 0,033 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
4 1,000 0,993 0,902 0,421 0,214 0,090 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
5 1,000 0,999 0,967 0,617 0,378 0,193 0,029 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000
6 1,000 1,000 0,991 0,780 0,561 0,341 0,074 0,007 0,000 0,000 0,000 0,000 0,000 0,000 0,000
7 1,000 1,000 0,998 0,891 0,727 0,512 0,154 0,022 0,001 0,000 0,000 0,000 0,000 0,000 0,000
8 1,000 1,000 1,000 0,953 0,851 0,677 0,274 0,054 0,004 0,000 0,000 0,000 0,000 0,000 0,000
9 1,000 1,000 1,000 0,983 0,929 0,811 0,425 0,115 0,013 0,000 0,000 0,000 0,000 0,000 0,000
10 1,000 1,000 1,000 0,994 0,970 0,902 0,586 0,212 0,034 0,002 0,000 0,000 0,000 0,000 0,000
11 1,000 1,000 1,000 0,998 0,989 0,956 0,732 0,345 0,078 0,006 0,001 0,000 0,000 0,000 0,000
12 1,000 1,000 1,000 1,000 0,997 0,983 0,846 0,500 0,154 0,017 0,003 0,000 0,000 0,000 0,000
13 1,000 1,000 1,000 1,000 0,999 0,994 0,922 0,655 0,268 0,044 0,011 0,002 0,000 0,000 0,000
14 1,000 1,000 1,000 1,000 1,000 0,998 0,966 0,788 0,414 0,098 0,030 0,006 0,000 0,000 0,000
15 1,000 1,000 1,000 1,000 1,000 1,000 0,987 0,885 0,575 0,189 0,071 0,017 0,000 0,000 0,000
16 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,946 0,726 0,323 0,149 0,047 0,000 0,000 0,000
17 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,978 0,846 0,488 0,273 0,109 0,002 0,000 0,000
18 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,993 0,926 0,659 0,439 0,220 0,009 0,000 0,000
19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,971 0,807 0,622 0,383 0,033 0,001 0,000
20 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,910 0,786 0,579 0,098 0,007 0,000
21 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,967 0,904 0,766 0,236 0,034 0,000
22 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,968 0,902 0,463 0,127 0,002
23 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,993 0,973 0,729 0,358 0,026
24 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,996 0,928 0,723 0,222
261

Probabilidades de POISSON (acumuladas)

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
0 0,905 0,819 0,741 0,670 0,607 0,549 0,497 0,449 0,407 0,368
1 0,995 0,982 0,963 0,938 0,910 0,878 0,844 0,809 0,772 0,736
2 1,000 0,999 0,996 0,992 0,986 0,977 0,966 0,953 0,937 0,920
3 1,000 1,000 1,000 0,999 0,998 0,997 0,994 0,991 0,987 0,981
4 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,999 0,998 0,996
5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999
6 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 15,0 20,0
0 0,135 0,05 0,018 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000
1 0,406 0,199 0,092 0,04 0,017 0,007 0,003 0,001 0,000 0,000 0,000
2 0,677 0,423 0,238 0,125 0,062 0,030 0,014 0,006 0,003 0,000 0,000
3 0,857 0,647 0,433 0,265 0,151 0,082 0,042 0,021 0,010 0,000 0,000
4 0,947 0,815 0,629 0,44 0,285 0,173 0,100 0,055 0,029 0,000 0,000
5 0,983 0,916 0,785 0,616 0,446 0,301 0,191 0,116 0,067 0,003 0,000
6 0,995 0,966 0,889 0,762 0,606 0,450 0,313 0,207 0,130 0,008 0,000
7 0,999 0,988 0,949 0,867 0,744 0,599 0,453 0,324 0,220 0,018 0,000
8 1 0,996 0,979 0,932 0,847 0,729 0,593 0,456 0,333 0,037 0,002
9 1 0,999 0,992 0,968 0,916 0,83 0,717 0,587 0,458 0,070 0,005
10 1 1 0,997 0,986 0,957 0,901 0,816 0,706 0,583 0,118 0,011
11 1 1 0,999 0,995 0,98 0,947 0,888 0,803 0,697 0,185 0,021
12 1 1 1 0,998 0,991 0,973 0,936 0,876 0,792 0,268 0,039
13 1 1 1 0,999 0,996 0,987 0,966 0,926 0,864 0,363 0,066
14 1 1 1 1 0,999 0,994 0,983 0,959 0,917 0,466 0,105
15 1 1 1 1 0,999 0,998 0,992 0,978 0,951 0,568 0,157
16 1 1 1 1 1 0,999 0,996 0,989 0,973 0,664 0,221
17 1 1 1 1 1 1 0,998 0,995 0,986 0,749 0,297
18 1 1 1 1 1 1 0,999 0,998 0,993 0,819 0,381
19 1 1 1 1 1 1 1 0,999 0,997 0,875 0,470
20 1 1 1 1 1 1 1 1 0,998 0,917 0,559
21 1 1 1 1 1 1 1 1 0,999 0,947 0,644
22 1 1 1 1 1 1 1 1 1 0,967 0,721
23 1 1 1 1 1 1 1 1 1 0,981 0,787
24 1 1 1 1 1 1 1 1 1 0,989 0,843
25 1 1 1 1 1 1 1 1 1 0,994 0,888
26 1 1 1 1 1 1 1 1 1 0,997 0,922
27 1 1 1 1 1 1 1 1 1 0,998 0,948
28 1 1 1 1 1 1 1 1 1 0,999 0,966
29 1 1 1 1 1 1 1 1 1 1 0,978
30 1 1 1 1 1 1 1 1 1 1 0,987
31 1 1 1 1 1 1 1 1 1 1 0,992
32 1 1 1 1 1 1 1 1 1 1 0,995
33 1 1 1 1 1 1 1 1 1 1 0,997
34 1 1 1 1 1 1 1 1 1 1 0,999
35 1 1 1 1 1 1 1 1 1 1 0,999
36 1 1 1 1 1 1 1 1 1 1 1
262

DISTRIBUCION
NORMAL

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
263

DISTRIBUCION
NORMAL

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
264

  1 2 3 4 5 6 7 8 9 10
10 0,100 6,314 2,92 2,3534 2,1318 2,015 1,9432 1,8946 1,8595 1,8331 1,8125
20 0,050 12,706 4,3027 3,1824 2,7765 2,5706 2,4469 2,3646 2,306 2,2622 2,2281
40 0,025 25,452 6,2054 4,1765 3,4954 3,1634 2,9687 2,8412 2,7515 2,685 2,6338
50 0,020 31,821 6,9645 4,5407 3,7469 3,3649 3,1427 2,9979 2,8965 2,8214 2,7638
100 0,010 63,656 9,925 5,8408 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693
200 0,005 127,321 14,089 7,4532 5,5975 4,7733 4,3168 4,0294 3,8325 3,6896 3,5814
1000 0,001 636,578 31,6 12,924 8,6101 6,8685 5,9587 5,4081 5,0414 4,7809 4,5868
2000 0,001 1273,155 44,703 16,326 10,305 7,9756 6,7882 6,0815 5,617 5,2911 5,0489
10000 0,000 6370,544 100,14 28,014 15,534 11,176 9,0804 7,8883 7,12 6,5938 6,2119
20000 0,000 12664,795 141,26 35,316 18,515 12,89 10,263 8,7824 7,851 7,2177 6,7614
100000 0,000 63476,563 314,71 60,797 27,716 17,881 13,56 11,176 9,7603 8,8289 8,1584
200000 0,000 126953,125 457,76 76,294 33,379 20,564 15,199 12,517 10,729 9,6112 8,7917
1000000 0,000 625000,000 915,53 133,51 47,684 28,61 20,266 15,497 13,113 11,921 10,729
2000000 0,000 2500000,000 1220,7 152,59 57,22 38,147 23,842 19,073 14,305 13,113 11,921
gl -->
  11 12 13 14 15 16 17 18 19 20
10 0,100 1,796 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247
20 0,050 2,201 2,1788 2,1604 2,1448 2,1315 2,1199 2,1098 2,1009 2,093 2,086
40 0,025 2,593 2,56 2,5326 2,5096 2,4899 2,4729 2,4581 2,445 2,4334 2,4231
50 0,020 2,718 2,681 2,6503 2,6245 2,6025 2,5835 2,5669 2,5524 2,5395 2,528
100 0,010 3,106 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 2,8784 2,8609 2,8453
200 0,005 3,497 3,4284 3,3725 3,3257 3,286 3,252 3,2224 3,1966 3,1737 3,1534
1000 0,001 4,437 4,3178 4,2209 4,1403 4,0728 4,0149 3,9651 3,9217 3,8833 3,8496
2000 0,001 4,863 4,7166 4,5972 4,4995 4,4168 4,3464 4,2858 4,2332 4,1869 4,1461
10000 0,000 5,923 5,695 5,5134 5,3644 5,2387 5,1339 5,0431 4,9663 4,8988 4,8382
20000 0,000 6,407 6,1467 5,9279 5,7556 5,6066 5,4855 5,3784 5,2899 5,2061 5,1409
100000 0,000 7,637 7,2643 6,9663 6,7055 6,5193 6,333 6,184 6,0722 5,9605 5,8487
200000 0,000 8,196 7,7486 7,4506 7,1526 6,929 6,7055 6,5565 6,4075 6,2585 6,184
1000000 0,000 9,537 8,9407 8,6427 8,3447 7,7486 7,7486 7,4506 7,1526 7,1526 6,8545
2000000 0,000 10,729 9,5367 9,5367 8,9407 8,3447 8,3447 8,3447 7,7486 7,7486 7,1526
gl -->
  21 22 23 24 25 26 27 28 29 30
10 0,100 1,721 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973
20 0,050 2,080 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423
40 0,025 2,414 2,4055 2,3979 2,391 2,3846 2,3788 2,3734 2,3685 2,3638 2,3596
50 0,020 2,518 2,5083 2,4999 2,4922 2,4851 2,4786 2,4727 2,4671 2,462 2,4573
100 0,010 2,831 2,8188 2,8073 2,797 2,7874 2,7787 2,7707 2,7633 2,7564 2,75
200 0,005 3,135 3,1188 3,104 3,0905 3,0782 3,0669 3,0565 3,047 3,038 3,0298
1000 0,001 3,819 3,7922 3,7676 3,7454 3,7251 3,7067 3,6895 3,6739 3,6595 3,646
2000 0,001 4,109 4,0769 4,0475 4,0207 3,9965 3,9744 3,954 3,9348 3,9177 3,9017
10000 0,000 4,785 4,7358 4,6939 4,6543 4,6194 4,5868 4,5565 4,5309 4,5053 4,482
20000 0,000 5,076 5,0198 4,9733 4,9267 4,8848 4,8475 4,8149 4,7823 4,7544 4,7311
265
100000 0,000 5,774 5,6997 5,6252 5,5693 5,5134 5,4576 5,4203 5,3644 5,3272 5,2899
200000 0,000 6,072 5,9977 5,9232 5,8487 5,7742 5,7369 5,6624 5,6252 5,5879 5,5507
1000000 0,000 6,855 6,7055 6,5565 6,5565 6,5565 6,2585 6,2585 6,2585 6,2585 6,1095
2000000 0,000 7,153 7,1526 7,1526 7,1526 6,5565 6,5565 6,5565 6,5565 6,5565 6,5565

gl -->
  40 50 60 70 80 90 100 125 150 175
10 0,100 1,684 1,6759 1,6706 1,6669 1,6641 1,662 1,6602 1,6571 1,6551 1,6536
20 0,050 2,021 2,0086 2,0003 1,9944 1,9901 1,9867 1,984 1,9791 1,9759 1,9736
40 0,025 2,329 2,3109 2,299 2,2906 2,2844 2,2795 2,2757 2,2687 2,2641 2,2608
50 0,020 2,423 2,4033 2,3901 2,3808 2,3739 2,3685 2,3642 2,3566 2,3515 2,3478
100 0,010 2,704 2,6778 2,6603 2,6479 2,6387 2,6316 2,6259 2,6157 2,609 2,6042
200 0,005 2,971 2,937 2,9146 2,8987 2,887 2,8779 2,8707 2,8577 2,8492 2,8431
1000 0,001 3,551 3,496 3,4602 3,435 3,4164 3,4019 3,3905 3,3701 3,3565 3,3469
2000 0,001 3,788 3,723 3,6808 3,6508 3,6287 3,6118 3,5984 3,5742 3,5582 3,5472
10000 0,000 4,321 4,2282 4,1688 4,1269 4,0955 4,0722 4,0536 4,0198 3,9977 3,9814
20000 0,000 4,545 4,4378 4,3702 4,3213 4,2887 4,2608 4,2398 4,2003 4,177 4,1584
100000 0,000 5,048 4,9174 4,8243 4,7684 4,7125 4,6752 4,6566 4,6007 4,5728 4,5449
200000 0,000 5,253 5,1036 5,0291 4,9546 4,8988 4,8429 4,8243 4,7684 4,7311 4,7125
1000000 0,000 5,811 5,6624 5,5134 5,3644 5,3644 5,2154 5,2154 5,2154 5,0664 5,0664
2000000 0,000 5,960 5,9605 5,6624 5,6624 5,3644 5,3644 5,3644 5,3644 5,3644 5,3644
gl -->
  200 225 250 275 300 325 350 375 400 450
10 0,100 1,653 1,6517 1,651 1,6504 1,6499 1,6496 1,6492 1,6489 1,6487 1,6482
20 0,050 1,972 1,9706 1,9695 1,9686 1,9679 1,9673 1,9668 1,9663 1,9659 1,9652
40 0,025 2,258 2,2565 2,255 2,2537 2,2527 2,2518 2,2511 2,2504 2,2499 2,2489
50 0,020 2,345 2,343 2,3414 2,34 2,3388 2,3379 2,337 2,3363 2,3357 2,3347
100 0,010 2,601 2,5979 2,5956 2,5938 2,5923 2,591 2,5899 2,589 2,5882 2,5868
200 0,005 2,838 2,835 2,8322 2,8299 2,8279 2,8263 2,8249 2,8237 2,8227 2,821
1000 0,001 3,340 3,3343 3,3299 3,3263 3,3232 3,3207 3,3186 3,3167 3,3151 3,3123
2000 0,001 3,539 3,532 3,5268 3,5227 3,5192 3,5163 3,5137 3,5114 3,5093 3,5064
10000 0,000 3,970 3,9616 3,9546 3,9488 3,9442 3,9395 3,936 3,9325 3,9302 3,9255
20000 0,000 4,144 4,1351 4,1281 4,1211 4,1164 4,1118 4,1071 4,1025 4,1001 4,0955
100000 0,000 4,526 4,5262 4,5076 4,5076 4,489 4,489 4,489 4,4797 4,4703 4,4703
200000 0,000 4,694 4,6752 4,6566 4,6566 4,6566 4,638 4,638 4,6194 4,6194 4,6194
1000000 0,000 5,066 5,0664 5,0664 5,0664 5,0664 4,9919 4,9919 4,9919 4,9174 4,9174
2000000 0,000 5,364 5,3644 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664
gl -->
  500 550 600 650 700 750 800 1000 2000 3000
10 0,100 1,648 1,6476 1,6474 1,6472 1,647 1,6469 1,6468 1,6464 1,6456 1,6454
20 0,050 1,965 1,9643 1,9639 1,9636 1,9634 1,9631 1,9629 1,9623 1,9612 1,9608
40 0,025 2,248 2,2476 2,247 2,2466 2,2462 2,2459 2,2456 2,2448 2,2431 2,2425
50 0,020 2,334 2,3331 2,3326 2,3321 2,3317 2,3313 2,331 2,3301 2,3282 2,3276
100 0,010 2,586 2,5848 2,5841 2,5834 2,5829 2,5824 2,582 2,5807 2,5783 2,5775
200 0,005 2,820 2,8184 2,8175 2,8167 2,816 2,8154 2,8148 2,8133 2,8102 2,8091
1000 0,001 3,310 3,3082 3,3068 3,3056 3,3044 3,3036 3,3027 3,3002 3,2954 3,2938
266
2000 0,001 3,504 3,5018 3,5 3,4983 3,4971 3,496 3,4951 3,4922 3,4863 3,4846
10000 0,000 3,922 3,9197 3,9162 3,915 3,9127 3,9116 3,9104 3,9069 3,8987 3,8953
20000 0,000 4,091 4,0885 4,0862 4,0838 4,0815 4,0792 4,0792 4,0745 4,0652 4,0606
100000 0,000 4,461 4,461 4,4517 4,4517 4,4517 4,4517 4,4517 4,4424 4,4331 4,4238
200000 0,000 4,619 4,6194 4,6194 4,6007 4,6007 4,6007 4,6007 4,5821 4,5821 4,5821
1000000 0,000 4,917 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174
2000000 0,000 5,066 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664
267

Valores críticos de la distribución t (cola superior)

gl 0,10 0,05 0,025 0,01 0,005 0,001 0,0005


1 3,078 6,314 12,706 31,821 63,657 318,309 636,619
2 1,886 2,920 4,303 6,965 9,925 22,327 31,599
3 1,638 2,353 3,182 4,541 5,841 10,215 12,924
4 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 1,476 2,015 2,571 3,365 4,032 5,893 6,869
6 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 1,415 1,895 2,365 2,998 3,499 4,785 5,408
8 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 1,372 1,812 2,228 2,764 3,169 4,144 4,587
11 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 1,341 1,753 2,131 2,602 2,947 3,733 4,073
16 1,337 1,746 2,120 2,583 2,921 3,686 4,015
17 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 1,330 1,734 2,101 2,552 2,878 3,610 3,922
19 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 1,323 1,721 2,080 2,518 2,831 3,527 3,819
22 1,321 1,717 2,074 2,508 2,819 3,505 3,792
23 1,319 1,714 2,069 2,500 2,807 3,485 3,768
24 1,318 1,711 2,064 2,492 2,797 3,467 3,745
25 1,316 1,708 2,060 2,485 2,787 3,450 3,725
26 1,315 1,706 2,056 2,479 2,779 3,435 3,707
27 1,314 1,703 2,052 2,473 2,771 3,421 3,690
28 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 1,311 1,699 2,045 2,462 2,756 3,396 3,659
30 1,310 1,697 2,042 2,457 2,750 3,385 3,646
32 1,309 1,694 2,037 2,449 2,738 3,365 3,622
34 1,307 1,691 2,032 2,441 2,728 3,348 3,601
36 1,306 1,688 2,028 2,434 2,719 3,333 3,582
38 1,304 1,686 2,024 2,429 2,712 3,319 3,566
40 1,303 1,684 2,021 2,423 2,704 3,307 3,551
50 1,299 1,676 2,009 2,403 2,678 3,261 3,496
60 1,296 1,671 2,000 2,390 2,660 3,232 3,460
120 1,289 1,658 1,980 2,358 2,617 3,160 3,373
inf 1,282 1,645 1,960 2,326 2,576 3,090 3,291
268

alfa = 0,0500 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 248,02 252,20 253,04 254,30

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,45 19,48 19,49 19,50

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,66 8,57 8,55 8,53

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,80 5,69 5,66 5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,56 4,43 4,41 4,37

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,87 3,74 3,71 3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,44 3,30 3,27 3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,15 3,01 2,97 2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 2,94 2,79 2,76 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,77 2,62 2,59 2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,65 2,49 2,46 2,41

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,54 2,38 2,35 2,30

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,46 2,30 2,26 2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,39 2,22 2,19 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,33 2,16 2,12 2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,28 2,11 2,07 2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,23 2,06 2,02 1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,19 2,02 1,98 1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,16 1,98 1,94 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,12 1,95 1,91 1,84

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,10 1,92 1,88 1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,07 1,89 1,85 1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,05 1,86 1,82 1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,03 1,84 1,80 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,01 1,82 1,78 1,71

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 1,99 1,80 1,76 1,69

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 1,97 1,79 1,74 1,67

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 1,96 1,77 1,73 1,65

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 1,94 1,75 1,71 1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 1,93 1,74 1,70 1,62

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 1,84 1,64 1,59 1,51

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,78 1,58 1,52 1,44

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,75 1,53 1,48 1,39

70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,72 1,50 1,45 1,35

80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,70 1,48 1,43 1,33

90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,69 1,46 1,41 1,30

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,68 1,45 1,39 1,28

200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,62 1,39 1,32 1,19

300 3,87 3,03 2,63 2,40 2,24 2,13 2,04 1,97 1,91 1,86 1,61 1,36 1,30 1,15

400 3,86 3,02 2,63 2,39 2,24 2,12 2,03 1,96 1,90 1,85 1,60 1,35 1,28 1,13

500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,59 1,35 1,28 1,12

600 3,86 3,01 2,62 2,39 2,23 2,11 2,02 1,95 1,90 1,85 1,59 1,34 1,27 1,11

700 3,85 3,01 2,62 2,38 2,23 2,11 2,02 1,95 1,89 1,84 1,59 1,34 1,27 1,10

800 3,85 3,01 2,62 2,38 2,23 2,11 2,02 1,95 1,89 1,84 1,58 1,34 1,26 1,09

900 3,85 3,01 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,58 1,33 1,26 1,09

1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,58 1,33 1,26 1,08

1500 3,85 3,00 2,61 2,38 2,22 2,10 2,02 1,94 1,89 1,84 1,58 1,33 1,25 1,07
269
2000 3,85 3,00 2,61 2,38 2,22 2,10 2,01 1,94 1,88 1,84 1,58 1,32 1,25 1,06

10000 3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,57 1,32 1,25 1,03

alfa = 0,0250 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 647,79 799,48 864,15 899,60 921,83 937,11 948,20 956,64 963,28 968,63 993,08 1009,79 1013,16 1018,23

2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,45 39,48 39,49 39,50

3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,17 13,99 13,96 13,90

4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,56 8,36 8,32 8,26

5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,33 6,12 6,08 6,02

6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,17 4,96 4,92 4,85

7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,47 4,25 4,21 4,14

8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,00 3,78 3,74 3,67

9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,67 3,45 3,40 3,33

10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,42 3,20 3,15 3,08

11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,23 3,00 2,96 2,88

12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,07 2,85 2,80 2,73

13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 2,95 2,72 2,67 2,60

14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 2,84 2,61 2,56 2,49

15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,76 2,52 2,47 2,40

16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,68 2,45 2,40 2,32

17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,62 2,38 2,33 2,25

18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,56 2,32 2,27 2,19

19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,51 2,27 2,22 2,13

20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,46 2,22 2,17 2,09

21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,42 2,18 2,13 2,04

22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,39 2,14 2,09 2,00

23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,36 2,11 2,06 1,97

24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,33 2,08 2,02 1,94

25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,30 2,05 2,00 1,91

26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,28 2,03 1,97 1,88

27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,25 2,00 1,94 1,85

28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,23 1,98 1,92 1,83

29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,21 1,96 1,90 1,81

30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,20 1,94 1,88 1,79

40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,07 1,80 1,74 1,64

50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 1,99 1,72 1,66 1,55

60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 1,94 1,67 1,60 1,48

70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 1,91 1,63 1,56 1,44

80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 1,88 1,60 1,53 1,40

90 5,20 3,84 3,26 2,93 2,71 2,55 2,43 2,34 2,26 2,19 1,86 1,58 1,50 1,37

100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 1,85 1,56 1,48 1,35

200 5,10 3,76 3,18 2,85 2,63 2,47 2,35 2,26 2,18 2,11 1,78 1,47 1,39 1,23

300 5,07 3,73 3,16 2,83 2,61 2,45 2,33 2,23 2,16 2,09 1,75 1,45 1,36 1,18

400 5,06 3,72 3,15 2,82 2,60 2,44 2,32 2,22 2,15 2,08 1,74 1,43 1,35 1,16

500 5,05 3,72 3,14 2,81 2,59 2,43 2,31 2,22 2,14 2,07 1,74 1,42 1,34 1,14

600 5,05 3,71 3,14 2,81 2,59 2,43 2,31 2,21 2,13 2,07 1,73 1,42 1,33 1,13

700 5,05 3,71 3,13 2,80 2,58 2,43 2,31 2,21 2,13 2,07 1,73 1,41 1,32 1,12
270
800 5,04 3,71 3,13 2,80 2,58 2,42 2,30 2,21 2,13 2,06 1,73 1,41 1,32 1,11

900 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,21 2,13 2,06 1,72 1,41 1,32 1,10

1000 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,20 2,13 2,06 1,72 1,41 1,32 1,10

1500 5,03 3,70 3,12 2,79 2,57 2,42 2,30 2,20 2,12 2,06 1,72 1,40 1,31 1,08

2000 5,03 3,70 3,12 2,79 2,57 2,41 2,29 2,20 2,12 2,05 1,72 1,40 1,31 1,07

10000 5,03 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,71 1,39 1,30 1,04

alfa = 0,0100 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 4052,18 4999,34 5403,53 5624,26 5763,96 5858,95 5928,33 5980,95 6022,40 6055,925 6208,662 6312,970 6333,925 6365,590

2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,397 99,448 99,484 99,491 99,499

3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,228 26,690 26,316 26,241 26,126

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,546 14,019 13,652 13,577 13,464

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,051 9,553 9,202 9,130 9,022

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,874 7,396 7,057 6,987 6,881

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,620 6,155 5,824 5,755 5,651

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,814 5,359 5,032 4,963 4,860

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,257 4,808 4,483 4,415 4,312

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,849 4,405 4,082 4,014 3,910

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,539 4,099 3,776 3,708 3,604

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,296 3,858 3,535 3,467 3,362

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,100 3,665 3,341 3,272 3,166

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,939 3,505 3,181 3,112 3,005

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,805 3,372 3,047 2,977 2,870

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,691 3,259 2,933 2,863 2,754

17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,593 3,162 2,835 2,764 2,654

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,508 3,077 2,749 2,678 2,567

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,434 3,003 2,674 2,602 2,490

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,368 2,938 2,608 2,535 2,422

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,310 2,880 2,548 2,476 2,361

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,258 2,827 2,495 2,422 2,307

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,211 2,780 2,447 2,373 2,257

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,168 2,738 2,403 2,329 2,212

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,129 2,699 2,364 2,289 2,171

26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,094 2,664 2,327 2,252 2,133

27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,062 2,632 2,294 2,218 2,098

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,032 2,602 2,263 2,187 2,065

29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,005 2,574 2,234 2,158 2,035

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,979 2,549 2,208 2,131 2,008

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,801 2,369 2,019 1,938 1,806

50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,698 2,265 1,909 1,825 1,685

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,632 2,198 1,836 1,749 1,602

70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,585 2,150 1,785 1,695 1,542

80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,551 2,115 1,746 1,655 1,496

90 6,93 4,85 4,01 3,53 3,23 3,01 2,84 2,72 2,61 2,524 2,088 1,716 1,623 1,459

100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,503 2,067 1,692 1,598 1,429

200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,411 1,971 1,583 1,481 1,281

300 6,72 4,68 3,85 3,38 3,08 2,86 2,70 2,57 2,47 2,380 1,940 1,547 1,441 1,223
271
400 6,70 4,66 3,83 3,37 3,06 2,85 2,68 2,56 2,45 2,365 1,925 1,528 1,421 1,190

500 6,69 4,65 3,82 3,36 3,05 2,84 2,68 2,55 2,44 2,356 1,915 1,517 1,408 1,168

600 6,68 4,64 3,81 3,35 3,05 2,83 2,67 2,54 2,44 2,351 1,909 1,510 1,400 1,153

700 6,67 4,64 3,81 3,35 3,04 2,83 2,66 2,54 2,43 2,346 1,905 1,505 1,394 1,141

800 6,67 4,63 3,81 3,34 3,04 2,82 2,66 2,53 2,43 2,343 1,901 1,501 1,390 1,132

900 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,341 1,899 1,498 1,386 1,124

1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,339 1,897 1,495 1,383 1,118

1500 6,65 4,62 3,79 3,33 3,03 2,81 2,65 2,52 2,42 2,333 1,891 1,488 1,375 1,097

2000 6,65 4,62 3,79 3,33 3,03 2,81 2,65 2,52 2,42 2,330 1,888 1,484 1,371 1,085

10000 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,323 1,880 1,475 1,361 1,048

alfa = 0,0050 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 16212,46 19997,36 21614,13 22500,75 23055,82 23439,53 23715,20 23923,81 24091,45 24221,84 24836,51 25253,74 25339,42 25466,08

2 198,50 199,01 199,16 199,24 199,30 199,33 199,36 199,38 199,39 199,39 199,45 199,48 199,48 199,51

3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 42,78 42,15 42,02 41,83

4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,17 19,61 19,50 19,33

5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 12,90 12,40 12,30 12,15

6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 9,59 9,12 9,03 8,88

7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 7,75 7,31 7,22 7,08

8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 6,61 6,18 6,09 5,95

9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 5,83 5,41 5,32 5,19

10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,27 4,86 4,77 4,64

11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 4,86 4,45 4,36 4,23

12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,53 4,12 4,04 3,91

13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,27 3,87 3,78 3,65

14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,06 3,66 3,57 3,44

15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 3,88 3,48 3,39 3,26

16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 3,73 3,33 3,25 3,11

17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 3,61 3,21 3,12 2,99

18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,50 3,10 3,01 2,87

19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,40 3,00 2,91 2,78

20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,32 2,92 2,83 2,69

21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,24 2,84 2,75 2,62

22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,18 2,77 2,69 2,55

23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,12 2,71 2,62 2,49

24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,06 2,66 2,57 2,43

25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,01 2,61 2,52 2,38

26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 2,97 2,56 2,47 2,33

27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 2,93 2,52 2,43 2,29

28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 2,89 2,48 2,39 2,25

29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 2,86 2,45 2,36 2,21

30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 2,82 2,42 2,32 2,18

40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 2,60 2,18 2,09 1,93

50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,47 2,05 1,95 1,79

60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,39 1,96 1,86 1,69

70 8,40 5,72 4,66 4,08 3,70 3,43 3,23 3,08 2,95 2,85 2,33 1,90 1,80 1,62

80 8,33 5,67 4,61 4,03 3,65 3,39 3,19 3,03 2,91 2,80 2,29 1,85 1,75 1,57
272
90 8,28 5,62 4,57 3,99 3,62 3,35 3,15 3,00 2,87 2,77 2,25 1,82 1,71 1,52

100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,23 1,79 1,68 1,49

200 8,06 5,44 4,41 3,84 3,47 3,21 3,01 2,86 2,73 2,63 2,11 1,66 1,54 1,32

300 8,00 5,39 4,36 3,80 3,43 3,17 2,97 2,82 2,69 2,59 2,07 1,62 1,50 1,25

400 7,97 5,37 4,34 3,78 3,41 3,15 2,95 2,80 2,68 2,57 2,06 1,60 1,47 1,21

500 7,95 5,35 4,33 3,76 3,40 3,14 2,94 2,79 2,66 2,56 2,04 1,58 1,46 1,19

600 7,94 5,35 4,32 3,76 3,39 3,13 2,93 2,78 2,66 2,56 2,04 1,58 1,45 1,17

700 7,93 5,34 4,32 3,75 3,38 3,12 2,93 2,78 2,65 2,55 2,03 1,57 1,44 1,16

800 7,92 5,33 4,31 3,75 3,38 3,12 2,92 2,77 2,65 2,55 2,03 1,56 1,44 1,15

900 7,92 5,33 4,31 3,74 3,38 3,12 2,92 2,77 2,65 2,54 2,02 1,56 1,43 1,14

1000 7,91 5,33 4,30 3,74 3,37 3,11 2,92 2,77 2,64 2,54 2,02 1,56 1,43 1,13

1500 7,90 5,32 4,30 3,73 3,37 3,11 2,91 2,76 2,64 2,53 2,01 1,55 1,42 1,11

2000 7,90 5,31 4,29 3,73 3,36 3,10 2,91 2,76 2,63 2,53 2,01 1,55 1,42 1,09

10000 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,75 2,62 2,52 2,00 1,54 1,40 1,05

alfa = 0,0010 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 405311,58 499725,34 540256,50 562667,85 576496,12 586032,87 593185,42 597953,80 602245,33 605583,19 620841,98 631332,40 633239,75 636577,61

2 998,38 998,84 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31

3 167,06 148,49 141,10 137,08 134,58 132,83 131,61 130,62 129,86 129,22 126,43 124,45 124,07 123,46

4 74,13 61,25 56,17 53,43 51,72 50,52 49,65 49,00 48,47 48,05 46,10 44,75 44,47 44,05

5 47,18 37,12 33,20 31,08 29,75 28,83 28,17 27,65 27,24 26,91 25,39 24,33 24,11 23,79

6 35,51 27,00 23,71 21,92 20,80 20,03 19,46 19,03 18,69 18,41 17,12 16,21 16,03 15,75

7 29,25 21,69 18,77 17,20 16,21 15,52 15,02 14,63 14,33 14,08 12,93 12,12 11,95 11,70

8 25,41 18,49 15,83 14,39 13,48 12,86 12,40 12,05 11,77 11,54 10,48 9,73 9,57 9,34

9 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 10,11 9,89 8,90 8,19 8,04 7,82

10 21,04 14,90 12,55 11,28 10,48 9,93 9,52 9,20 8,96 8,75 7,80 7,12 6,98 6,76

11 19,69 13,81 11,56 10,35 9,58 9,05 8,65 8,35 8,12 7,92 7,01 6,35 6,21 6,00

12 18,64 12,97 10,80 9,63 8,89 8,38 8,00 7,71 7,48 7,29 6,40 5,76 5,63 5,42

13 17,82 12,31 10,21 9,07 8,35 7,86 7,49 7,21 6,98 6,80 5,93 5,30 5,17 4,97

14 17,14 11,78 9,73 8,62 7,92 7,44 7,08 6,80 6,58 6,40 5,56 4,94 4,81 4,61

15 16,59 11,34 9,34 8,25 7,57 7,09 6,74 6,47 6,26 6,08 5,25 4,64 4,51 4,31

16 16,12 10,97 9,01 7,94 7,27 6,80 6,46 6,20 5,98 5,81 4,99 4,39 4,26 4,06

17 15,72 10,66 8,73 7,68 7,02 6,56 6,22 5,96 5,75 5,58 4,78 4,18 4,05 3,85

18 15,38 10,39 8,49 7,46 6,81 6,35 6,02 5,76 5,56 5,39 4,59 4,00 3,87 3,67

19 15,08 10,16 8,28 7,27 6,62 6,18 5,85 5,59 5,39 5,22 4,43 3,84 3,71 3,52

20 14,82 9,95 8,10 7,10 6,46 6,02 5,69 5,44 5,24 5,08 4,29 3,70 3,58 3,38

21 14,59 9,77 7,94 6,95 6,32 5,88 5,56 5,31 5,11 4,95 4,17 3,58 3,46 3,26

22 14,38 9,61 7,80 6,81 6,19 5,76 5,44 5,19 4,99 4,83 4,06 3,48 3,35 3,15

23 14,20 9,47 7,67 6,70 6,08 5,65 5,33 5,09 4,89 4,73 3,96 3,38 3,25 3,06

24 14,03 9,34 7,55 6,59 5,98 5,55 5,24 4,99 4,80 4,64 3,87 3,29 3,17 2,97

25 13,88 9,22 7,45 6,49 5,89 5,46 5,15 4,91 4,71 4,56 3,79 3,22 3,09 2,89

26 13,74 9,12 7,36 6,41 5,80 5,38 5,07 4,83 4,64 4,48 3,72 3,15 3,02 2,82

27 13,61 9,02 7,27 6,33 5,73 5,31 5,00 4,76 4,57 4,41 3,66 3,08 2,96 2,76

28 13,50 8,93 7,19 6,25 5,66 5,24 4,93 4,69 4,50 4,35 3,60 3,02 2,90 2,70

29 13,39 8,85 7,12 6,19 5,59 5,18 4,87 4,64 4,45 4,29 3,54 2,97 2,84 2,64

30 13,29 8,77 7,05 6,12 5,53 5,12 4,82 4,58 4,39 4,24 3,49 2,92 2,79 2,59

40 12,61 8,25 6,59 5,70 5,13 4,73 4,44 4,21 4,02 3,87 3,15 2,57 2,44 2,23
273
50 12,22 7,96 6,34 5,46 4,90 4,51 4,22 4,00 3,82 3,67 2,95 2,38 2,25 2,03

60 11,97 7,77 6,17 5,31 4,76 4,37 4,09 3,86 3,69 3,54 2,83 2,25 2,12 1,89

70 11,80 7,64 6,06 5,20 4,66 4,28 3,99 3,77 3,60 3,45 2,74 2,16 2,03 1,80

80 11,67 7,54 5,97 5,12 4,58 4,20 3,92 3,70 3,53 3,39 2,68 2,10 1,96 1,72

90 11,57 7,47 5,91 5,06 4,53 4,15 3,87 3,65 3,48 3,34 2,63 2,05 1,91 1,66

100 11,50 7,41 5,86 5,02 4,48 4,11 3,83 3,61 3,44 3,30 2,59 2,01 1,87 1,62

200 11,15 7,15 5,63 4,81 4,29 3,92 3,65 3,43 3,26 3,12 2,42 1,83 1,68 1,39

300 11,04 7,07 5,56 4,75 4,22 3,86 3,59 3,38 3,21 3,07 2,37 1,78 1,62 1,31

400 10,99 7,03 5,53 4,71 4,19 3,83 3,56 3,35 3,18 3,04 2,34 1,75 1,59 1,26

500 10,96 7,00 5,51 4,69 4,18 3,81 3,54 3,33 3,16 3,02 2,33 1,73 1,57 1,23

600 10,93 6,99 5,49 4,68 4,16 3,80 3,53 3,32 3,15 3,01 2,32 1,72 1,56 1,21

700 10,92 6,98 5,48 4,67 4,15 3,79 3,52 3,31 3,14 3,00 2,31 1,71 1,55 1,19

800 10,91 6,97 5,47 4,66 4,15 3,79 3,52 3,31 3,14 3,00 2,30 1,70 1,54 1,18

900 10,90 6,96 5,47 4,66 4,14 3,78 3,51 3,30 3,13 2,99 2,30 1,70 1,54 1,17

1000 10,89 6,96 5,46 4,65 4,14 3,78 3,51 3,30 3,13 2,99 2,30 1,69 1,53 1,16

1500 10,87 6,94 5,45 4,64 4,13 3,77 3,50 3,29 3,12 2,98 2,29 1,68 1,52 1,13

2000 10,86 6,93 5,44 4,64 4,12 3,76 3,49 3,28 3,11 2,97 2,28 1,68 1,51 1,11

10000 10,83 6,91 5,43 4,62 4,11 3,75 3,48 3,27 3,10 2,96 2,27 1,66 1,50 1,06

alfa = 0,0005 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 1621246,34 1998901,37 2159118,65 2250671,39 2304077,15 2342224,12 2372741,70 2391815,19 2410888,67 2422332,76 2483367,92 2525329,59 2532958,98 2548217,77

2 1998,62 1998,62 1998,62 1998,62 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48

3 266,59 236,56 224,68 218,28 214,20 211,41 209,31 207,80 206,64 205,59 201,05 197,91 197,32 196,39

4 106,23 87,43 80,09 76,14 73,63 71,92 70,66 69,70 68,95 68,34 65,54 63,56 63,18 62,57

5 63,62 49,78 44,41 41,53 39,73 38,48 37,56 36,86 36,31 35,86 33,80 32,36 32,06 31,62

6 46,07 34,79 30,46 28,11 26,64 25,63 24,89 24,32 23,88 23,52 21,83 20,65 20,41 20,05

7 36,99 27,20 23,46 21,44 20,17 19,30 18,66 18,17 17,78 17,47 16,00 14,97 14,76 14,44

8 31,56 22,75 19,39 17,58 16,44 15,66 15,08 14,64 14,29 14,01 12,69 11,75 11,56 11,26

9 27,99 19,86 16,77 15,10 14,06 13,34 12,81 12,40 12,07 11,82 10,59 9,72 9,54 9,27

10 25,49 17,87 14,97 13,41 12,42 11,75 11,25 10,87 10,56 10,32 9,16 8,34 8,17 7,91

11 23,65 16,41 13,65 12,18 11,24 10,60 10,13 9,76 9,48 9,24 8,14 7,35 7,19 6,93

12 22,24 15,30 12,66 11,25 10,35 9,74 9,28 8,93 8,66 8,43 7,37 6,61 6,45 6,21

13 21,14 14,43 11,89 10,52 9,66 9,07 8,63 8,29 8,03 7,81 6,78 6,04 5,88 5,64

14 20,24 13,73 11,27 9,95 9,11 8,53 8,11 7,78 7,52 7,31 6,31 5,58 5,43 5,19

15 19,51 13,16 10,76 9,48 8,66 8,10 7,68 7,37 7,11 6,90 5,93 5,21 5,06 4,83

16 18,89 12,69 10,34 9,08 8,29 7,74 7,33 7,02 6,77 6,57 5,61 4,91 4,76 4,53

17 18,37 12,29 9,99 8,75 7,97 7,43 7,04 6,73 6,49 6,29 5,34 4,65 4,50 4,27

18 17,92 11,94 9,69 8,47 7,71 7,18 6,78 6,48 6,24 6,05 5,12 4,43 4,28 4,06

19 17,53 11,65 9,42 8,23 7,48 6,95 6,57 6,27 6,03 5,84 4,92 4,24 4,10 3,87

20 17,19 11,39 9,19 8,02 7,27 6,76 6,38 6,09 5,85 5,66 4,75 4,08 3,93 3,71

21 16,89 11,16 8,99 7,83 7,10 6,59 6,21 5,92 5,69 5,50 4,60 3,93 3,79 3,56

22 16,62 10,95 8,82 7,67 6,94 6,44 6,07 5,78 5,55 5,36 4,47 3,81 3,66 3,44

23 16,38 10,77 8,66 7,52 6,80 6,30 5,94 5,65 5,43 5,24 4,36 3,69 3,55 3,32

24 16,17 10,61 8,51 7,39 6,68 6,18 5,82 5,54 5,31 5,13 4,25 3,59 3,45 3,22

25 15,97 10,46 8,39 7,27 6,56 6,07 5,71 5,43 5,21 5,03 4,16 3,50 3,36 3,13

26 15,80 10,33 8,27 7,16 6,46 5,98 5,62 5,34 5,12 4,94 4,07 3,42 3,27 3,05

27 15,63 10,21 8,16 7,06 6,37 5,89 5,53 5,26 5,03 4,86 3,99 3,34 3,20 2,97
274
28 15,48 10,10 8,07 6,97 6,28 5,81 5,45 5,18 4,96 4,78 3,92 3,27 3,13 2,90

29 15,35 9,99 7,98 6,89 6,21 5,73 5,38 5,11 4,89 4,71 3,86 3,21 3,06 2,84

30 15,22 9,90 7,89 6,82 6,14 5,66 5,31 5,04 4,82 4,65 3,80 3,15 3,01 2,78

40 14,35 9,25 7,33 6,30 5,64 5,19 4,85 4,59 4,38 4,21 3,39 2,75 2,60 2,37

50 13,86 8,88 7,01 6,01 5,37 4,93 4,60 4,34 4,14 3,97 3,16 2,52 2,37 2,13

60 13,55 8,65 6,81 5,82 5,20 4,76 4,44 4,19 3,98 3,82 3,02 2,38 2,23 1,98

70 13,33 8,49 6,67 5,70 5,08 4,64 4,32 4,08 3,88 3,71 2,92 2,28 2,13 1,87

80 13,17 8,37 6,57 5,60 4,99 4,56 4,24 4,00 3,80 3,64 2,85 2,20 2,05 1,79

90 13,05 8,28 6,49 5,53 4,92 4,50 4,18 3,94 3,74 3,58 2,79 2,15 1,99 1,72

100 12,95 8,21 6,43 5,48 4,87 4,45 4,13 3,89 3,69 3,53 2,75 2,10 1,95 1,67

200 12,52 7,90 6,16 5,23 4,64 4,23 3,92 3,68 3,49 3,33 2,55 1,90 1,74 1,43

300 12,38 7,80 6,08 5,15 4,56 4,15 3,85 3,61 3,42 3,27 2,49 1,84 1,67 1,33

400 12,32 7,75 6,04 5,11 4,53 4,12 3,82 3,58 3,39 3,24 2,46 1,81 1,64 1,28

500 12,28 7,72 6,01 5,09 4,51 4,10 3,80 3,56 3,37 3,22 2,45 1,79 1,62 1,25

600 12,25 7,70 5,99 5,07 4,49 4,08 3,78 3,55 3,36 3,20 2,43 1,78 1,60 1,22

700 12,23 7,68 5,98 5,06 4,48 4,08 3,77 3,54 3,35 3,20 2,43 1,77 1,59 1,21

800 12,22 7,67 5,97 5,06 4,47 4,07 3,77 3,53 3,34 3,19 2,42 1,76 1,58 1,19

900 12,21 7,67 5,97 5,05 4,47 4,06 3,76 3,53 3,34 3,18 2,41 1,75 1,58 1,18

1000 12,19 7,66 5,96 5,04 4,46 4,06 3,76 3,52 3,33 3,18 2,41 1,75 1,57 1,17

1500 12,17 7,64 5,94 5,03 4,45 4,04 3,74 3,51 3,32 3,17 2,40 1,74 1,56 1,14

2000 12,15 7,63 5,93 5,02 4,44 4,04 3,74 3,50 3,31 3,16 2,39 1,73 1,55 1,12

10000 12,12 7,61 5,92 5,00 4,43 4,02 3,72 3,49 3,30 3,15 2,38 1,72 1,54 1,07

alfa = 0,0001 grados de libertad del


numerador
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 40527343,75 49804687,50 54199218,75 56152343,75 57617187,50 58593750,00 59570312,50 59570312,50 60546875,00 60546875,00 62011718,75 63476562,50 63476562,50 63476562,50

2 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58

3 784,17 694,77 659,38 640,75 627,71 620,26 614,67 609,08 605,36 603,50 588,60 581,15 577,42 575,56

4 241,68 197,91 181,14 171,83 166,24 162,05 159,26 156,93 155,53 154,13 147,61 142,96 142,03 140,63

5 124,80 97,09 86,38 80,56 76,83 74,51 72,64 71,25 70,08 69,27 65,19 62,28 61,70 60,89

6 82,42 61,58 53,67 49,42 46,74 44,94 43,54 42,55 41,73 41,09 38,07 35,91 35,51 34,81

7 62,17 45,17 38,65 35,22 33,06 31,55 30,50 29,63 28,99 28,46 25,96 24,24 23,87 23,34

8 50,70 35,97 30,44 27,47 25,64 24,36 23,43 22,70 22,15 21,68 19,56 18,04 17,72 17,26

9 43,48 30,33 25,41 22,76 21,10 19,97 19,15 18,51 17,99 17,58 15,69 14,32 14,04 13,62

10 38,59 26,54 22,03 19,63 18,13 17,08 16,33 15,75 15,28 14,90 13,15 11,90 11,64 11,25

11 35,04 23,87 19,66 17,42 16,02 15,05 14,35 13,80 13,37 13,02 11,39 10,22 9,98 9,60

12 32,42 21,86 17,90 15,79 14,46 13,56 12,89 12,38 11,98 11,64 10,10 8,99 8,76 8,41

13 30,38 20,31 16,56 14,55 13,29 12,43 11,79 11,31 10,91 10,60 9,12 8,06 7,84 7,50

14 28,75 19,09 15,48 13,58 12,37 11,54 10,93 10,46 10,08 9,79 8,37 7,34 7,12 6,80

15 27,44 18,10 14,64 12,78 11,63 10,82 10,23 9,78 9,42 9,13 7,76 6,76 6,56 6,23

16 26,37 17,30 13,93 12,14 11,02 10,23 9,66 9,23 8,88 8,60 7,26 6,29 6,09 5,77

17 25,44 16,62 13,34 11,60 10,51 9,75 9,19 8,77 8,43 8,15 6,85 5,90 5,70 5,39

18 24,65 16,04 12,85 11,15 10,07 9,34 8,79 8,37 8,05 7,78 6,50 5,57 5,37 5,07

19 23,98 15,54 12,42 10,75 9,71 8,99 8,45 8,05 7,72 7,46 6,21 5,29 5,09 4,79

20 23,40 15,12 12,05 10,42 9,39 8,68 8,16 7,76 7,44 7,18 5,95 5,05 4,85 4,55

21 22,88 14,74 11,73 10,12 9,11 8,41 7,90 7,51 7,20 6,94 5,73 4,83 4,64 4,35

22 22,44 14,41 11,44 9,86 8,87 8,18 7,68 7,29 6,98 6,73 5,53 4,65 4,46 4,17

23 22,03 14,12 11,19 9,63 8,65 7,97 7,48 7,09 6,79 6,54 5,36 4,49 4,30 4,00
275
24 21,65 13,85 10,96 9,42 8,45 7,79 7,30 6,92 6,62 6,37 5,21 4,34 4,15 3,86

25 21,33 13,62 10,76 9,24 8,29 7,63 7,14 6,77 6,47 6,22 5,07 4,21 4,02 3,73

26 21,04 13,40 10,58 9,07 8,13 7,47 6,99 6,62 6,33 6,09 4,95 4,09 3,90 3,61

27 20,78 13,21 10,41 8,92 7,99 7,34 6,86 6,50 6,21 5,97 4,83 3,98 3,80 3,51

28 20,52 13,03 10,26 8,78 7,86 7,22 6,74 6,38 6,09 5,86 4,73 3,89 3,70 3,41

29 20,30 12,86 10,12 8,66 7,74 7,10 6,64 6,28 5,99 5,76 4,64 3,80 3,61 3,33

30 20,10 12,72 10,00 8,54 7,63 7,00 6,54 6,18 5,90 5,66 4,55 3,72 3,53 3,24

40 18,67 11,70 9,13 7,76 6,90 6,30 5,86 5,53 5,26 5,03 3,98 3,16 2,98 2,69

50 17,88 11,13 8,65 7,33 6,50 5,92 5,50 5,17 4,91 4,69 3,66 2,86 2,68 2,38

60 17,37 10,78 8,35 7,06 6,25 5,68 5,27 4,95 4,69 4,48 3,47 2,67 2,49 2,19

70 17,03 10,54 8,15 6,88 6,08 5,52 5,11 4,79 4,54 4,33 3,33 2,54 2,36 2,05

80 16,78 10,35 8,00 6,74 5,95 5,40 4,99 4,68 4,43 4,23 3,24 2,45 2,26 1,94

90 16,59 10,22 7,88 6,64 5,85 5,31 4,91 4,60 4,35 4,15 3,16 2,37 2,18 1,86

100 16,43 10,11 7,79 6,56 5,78 5,24 4,84 4,53 4,29 4,08 3,10 2,32 2,13 1,80

200 15,76 9,65 7,40 6,21 5,45 4,93 4,54 4,25 4,01 3,81 2,85 2,06 1,87 1,50

300 15,56 9,50 7,28 6,09 5,35 4,83 4,45 4,15 3,92 3,72 2,77 1,98 1,78 1,39

400 15,45 9,43 7,22 6,04 5,30 4,78 4,40 4,11 3,87 3,68 2,73 1,94 1,74 1,33

500 15,38 9,38 7,18 6,01 5,27 4,75 4,38 4,08 3,85 3,66 2,71 1,92 1,71 1,29

600 15,34 9,35 7,16 5,98 5,25 4,74 4,36 4,07 3,83 3,64 2,69 1,90 1,70 1,26

700 15,31 9,34 7,14 5,97 5,23 4,72 4,35 4,05 3,82 3,63 2,68 1,89 1,69 1,24

800 15,29 9,32 7,12 5,96 5,22 4,71 4,33 4,04 3,81 3,62 2,68 1,88 1,68 1,22

900 15,27 9,31 7,12 5,95 5,21 4,70 4,33 4,04 3,80 3,61 2,67 1,88 1,67 1,21

1000 15,26 9,30 7,11 5,94 5,21 4,70 4,32 4,03 3,80 3,61 2,66 1,87 1,66 1,20

1500 15,22 9,27 7,08 5,92 5,19 4,68 4,30 4,01 3,78 3,59 2,65 1,86 1,65 1,16

2000 15,20 9,26 7,07 5,91 5,18 4,67 4,29 4,00 3,77 3,58 2,64 1,85 1,64 1,14

10000 15,15 9,22 7,04 5,88 5,16 4,65 4,27 3,98 3,75 3,56 2,62 1,83 1,62 1,08