You are on page 1of 37

lOMoARcPSD|168 475 26

Probabilidad y Estadística (Universidad Tecnológica Nacional)


lOMoARcPSD|168 475 26

Tecnológico Nacional de México

Instituto Tecnológico de

huimanguillo

Carrera:

Ingeniería Petrolera.

Asignatura:

Probabilidad y Estadística Aplicada al Campo Petrolero.

Docente:

Lic. MIGUEL ENRIQUE NARVAEZ JIMENEZ

Trabajo:

Investigación:

Unidad 3. Distribuciones Muestrales.

Alumno No. De control

RODOLFO PEREZ 211240068


PAREDES
lOMoARcPSD|168 475 26

Índice:
▪ Introducción............................................................................................................... 2

▪ Intención didáctica .................................................................................................... 2

▪ Competencia a desarrollar….................................................................................... 2

▪ Competencias previas…........................................................................................... 2

▪ 3. Distribuciones Muestrales… ............................................................................... 3

▪ Errores en el Muestreo ............................................................................................. 3

▪ 3.1 Distribución de medidas… ................................................................................. 5

▪ 3.2 Distribución de varianzas… ............................................................................... 9

▪ 3.3 Distribución de proporciones…........................................................................ 20

▪ 3.4 Distribución de diferencias… .......................................................................... 25

▪ 3.5 Aplicación en la explotación de hidrocarburos… .......................................... 33

▪ Conclusión................................................................................................................ 35

▪ Bibliografía .............................................................................................................. 35

1
lOMoARcPSD|168 475 26

Introducción:

La Probabilidad y la Estadística se encargan del estudio del azar desde un punto


de vista matemático, la primera propone modelos para los fenómenos aleatorios, es
decir, los que se pueden predecir con certeza, y estudia sus consecuencias lógicas,
mientras que la segunda ofrece métodos y técnicas que permiten entender los
datos a partir de modelos.

Dichas disciplinas son de suma importancia en el ámbito petrolero, pues sus


aplicaciones nos dan pauta en la búsqueda y explotación de hidrocarburos, este
proyecto se realizó con el propósito de abordar y comprender la tercera unidad de
la asignatura correspondiente anexando algunos ejemplos e imágenes para facilitar
su entendimiento.

Intención didáctica.
En el tema tres el estudiante conoce, comprende y aplica la distribución muestra
adecuada, de acuerdo a la situación que se le presente. El docente será un guía
para la realización de los ejercicios aplicados en clase ya que es de suma
importancia para el entendimiento de esta asignatura.

Competencia a desarrollar.
Conoce y aplica las herramientas de estadística para la toma de decisiones en los
procesos de explotación de los hidrocarburos.

Competencias previas.
Conoce conceptos de matemática básicas para solucionar ejercicios de aplicación.
Aplica despejes de fórmulas matemáticas para resolución de ejercicios.

2
lOMoARcPSD|168 475 26

Unidad 3. Distribuciones Muestrales.

▪ Parámetro: es una medida de resumen numérica que se calcularía usando


todas las unidades de la población. Es un número fijo, generalmente no lo
conocemos.

▪ Estadística: es una medida de resumen numérica que se calcula de las


unidades de la muestra. El valor de la estadística se conoce cuando tomamos
una muestra, pero varía de muestra en muestra.

▪ Población: es el grupo de objetos o individuos bajo estudio, acerca de los cuales


queremos obtener información.
▪ Muestra: es una parte de la población de la cual se obtiene información.
▪ Inferencia estadística: es el proceso de sacar conclusiones de la población
basados en la información de una muestra de esa población. Objetivos de la
inferencia: estimación de parámetros, intervalos de confianza y docimasia, test
de hipótesis o pruebas de significación estadística.

Una estadística muestral proveniente de una muestra aleatoria simple tiene un


patrón de comportamiento (predecible) en repetidas muestras. Este patrón es
llamado la distribución muestral de la estadística. Si conocemos la distribución
muestral podemos hacer inferencia.

Las distribuciones muestrales adoptan diferentes formas según las estadísticas


investigadas y las características de la población estudiada.

Errores en el Muestreo
Cuando se utilizan valores muestrales (parámetros), o estadísticos para estimar
valores poblacionales, pueden ocurrir dos tipos generales de errores:

3
lOMoARcPSD|168 475 26

➢ Error muestral

Se refiere a la variación natural existente entre muestras tomadas de la misma


población. Aún si se ha tenido gran cuidado para asegurar que dos muestras del
mismo tamaño sean representativas de una cierta población, no esperaríamos que
las dos sean idénticas en todos sus detalles.

➢ Error no muestral.

Son los errores que surgen al tomar las muestras y que no pueden clasificarse como
errores muestrales. El sesgo muestral se refiere a una tendencia sistemática
inherente a un método de muestreo que da estimaciones de un parámetro que son,
en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el
parámetro real.

Precisión se refiere a la dispersión del conjunto de valores obtenidos de mediciones


repetidas de una magnitud. Cuanto menor es la dispersión mayor la precisión. Una
medida común de la variabilidad es la desviación estándar de las mediciones y la
precisión se puede estimar como una función de ella.

El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.

La aleatorización se refiere a cualquier proceso de selección de una muestra de la


población en el que la selección es imparcial o no está sesgada; una muestra
elegida con procedimientos aleatorios se llama muestra aleatoria.

4
lOMoARcPSD|168 475 26

Los tipos más comunes de técnicas de muestreo


aleatorios son:
❖ Muestreo aleatorio simple
❖ Muestreo estratificado
❖ Muestreo por conglomerados
❖ Muestreo sistemático.

3.1 Distribución de medidas.

En estadística la distribución muestral es lo que resulta de considerar todas las


muestras posibles que pueden ser tomadas de una población. Su estudio permite
calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al
parámetro de la población. Mediante la distribución muestral se puede estimar el
error para un tamaño de muestra dado.

La distribución muestral de la media es la distribución de los valores de las medias


de todas las posibles muestras del mismo tamaño n tomadas de la misma población.
Considere una población cuya variable aleatoria x es discreta con la siguiente
distribución:

Suponga que no conocemos la población o el valor de µ. Podemos tomar una


m.a.s. de tamaño n=2 de esta población. Si sacamos muestras aleatorias de tamaño
n de una población con media µ y desviación estándar σ, entonces la distribución
muestral de la media tiene las siguientes propiedades:

1. El promedio de todos los valores posibles de medias muestrales es igual al


parámetro µ. En otras palabras, la media muestral X es un estimador insesgado
de µ.

2. Error estándar de la media muestral, es la desviación estándar de las posibles


medias muestrales, disminuye si el tamaño de la muestra aumenta.

5
lOMoARcPSD|168 475 26

3. Si la población original tiene distribución Normal, entonces para cualquier


tamaño muestral n la distribución de la media muestral es también Normal:

4. Si la población de origen no es Normal, pero n es “suficientemente” grande la


distribución de la media muestral es aproximadamente Normal:

Muestreo de la Media.

La media muestral x́ es la distribución de probabilidad de todos los valores de


la media muestral x́ . La distribución muestral de x́ es la distribución de
probabilidad de todos los valores de la media muestral x́ .

Distribución muestral de la diferencia entre dos medias.

Una distribución muestral de las medias es de tipo probabilístico e indica cuán


probables son diversas medias de la muestra. La distribución es una función de la
media, de la desviación estándar de la población y del tamaño de la muestra.

Ejemplo 1: Suponga que se han seleccionado muestras aleatorias de tamaño 20


en una población grande. Se calcula la madia muestral x para cada muestra; la
colección de todas estas medias muestrales recibe el nombre de distribución
muestral de medias, lo que se puede ilustrar en la siguiente figura:

Suponga que se eligen muestras aleatorias de tamaño 20, de una población


grande, y se calcula la deviación estándar de cada una. La colección de todas

6
lOMoARcPSD|168 475 26

estas desviaciones estándar muestrales se llama distribución muestral de la


desviación estándar, y lo podemos ver en la siguiente figura:

Ejemplo 2:

Se considera una población de cinco cerdos y un granjero que quería estimar la


proporción de los que estaban bajos de peso. Se enfocó el problema en el peso
promedio de los cerdos, en cuyo caso resulto apropiada la distribución de los
valores medios de la muestra.

Cerdo Peso Parámetros


A 200
1030
B 203 media= =206
C 206 5
D 209
E 212 desviacion estandar=4.24
1030

Si el granjero desea estimar el peso promedio de los cerdos, deberá tomarmuestras


de dos, tres, o posiblemente cuatro. Y una vez más, será factible listar cada posible
valor medio de la muestra y elaborar una distribución de frecuencia.

Además se puede calcular la media y la desviación estándar de cada distribución


de muestreo. Los resultados empíricos revelan ciertas propiedades interesantes
de las distribuciones de muestreo.

Media Desviación Estándar


Población 206 4.24
Distribuciones de

7
lOMoARcPSD|168 475 26

Muestreo
n=2 206 2.60
n=3 206 1.73
n=4 206 1.06

En esta tabla se muestra que la media de la distribución de muestreo parece ser


siempre igual a la media de la población. Y no es coincidencia el hecho de que la
media de una distribución de muestreo sea exactamente igual a la media de la
población en cada caso.

En esencia, calcular la media de una distribución de muestreo es simplemente un


método indirecto de calcular la media de la población.

Ejemplo 3:

Supóngase que una población está formada por tres elementos; x 1 , x 2 , x 3. La


media de la población es (x 1 ,+ x 2+ x 3)/3. Si se tomaran todas las muestras de dos
elementos, las combinaciones serian x 1 yx 2 , x 1 yx 3 yx 2 yx 3. Los valores medios
de la muestra serian:

La media de los valores medios de la muestra (y la media de la distribución de


muestreo) sería:
x3 x3
x 1+ x 2 + x 1+ + x 2+
[ 2 ][ 2 ][ 2 ]
=¿
3
1
(x 1+ x 2+ x 1+ x 3+ x 2+ x 3)
2
3

1
(2 x 1+2 x 2+2 x 3)
2 x 1+ x 2+ x 3
¿ = Que es la media de la población
3 3

3.2 Distribución de varianzas.

8
lOMoARcPSD|168 475 26

En muchos casos es importante conocer el valor de la varianza de la población, al


estimar riesgos en inversiones, calcular desigualdades en ingresos, etc. En realidad
la distribución ji-cuadrada es la distribución muestral de s 2, o sea que si seextraen
todas las muestras posibles de una población normal y a cada muestra se le calcula
su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer


el estadístico X2. Si se elige una muestra de tamaño n de una población normal con

varianza , el estadístico:

Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-
1 grados de libertad y se denota X2 (X es la minúscula de la letra griega ji). El
estadístico ji-cuadrada está dado por:

Donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza de la


población de donde se extrajo la muestra. El estadístico ji-cuadrada también se
puede dar con la siguiente expresión:

Propiedades de las distribuciones ji-cuadrada:

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un
número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).

9
lOMoARcPSD|168 475 26

La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en
el valor (n-3) = (gl-2).

La función de densidad de la distribución X2 esta dada por:

para x>0

Para denotar el valor crítico de una distribución X2 con gl grados de libertad se usa
el símbolo (gl); este valor crítico determina a su derecha un área de bajo la
2 2
curva X y sobre el eje horizontal. Por ejemplo para encontrar X 0.05(6) en la tablase
localiza 6 gl en el lado izquierdo y a lo largo del lado superior de la
misma tabla.

Cálculo de Probabilidad

El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para


saber cómo se va a comportar la varianza o desviación estándar en una muestra
que proviene de una distribución normal.

Ejemplos:

10
lOMoARcPSD|168 475 26

1. Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de
sus destinos en una ciudad grande forman una distribución normal con una
desviación estándar =1 minuto. Si se elige al azar una muestra de 17tiempos,
encuentre la probabilidad de que la varianza muestral sea >2.

Solución: Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2


como sigue:

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad


y se encuentra que a este valor le corresponde un área a la derecha de 0.01. En
consecuencia, el valor de la probabilidad es P(s2>2)

2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones,


de una población normal con varianza , tenga una varianza muestral:

a. Mayor que 9.1


b. Entre 3.462 y 10.745

Solución: Primero se procederá a calcular el valor de la ji-cuadrada:

Al buscar este número en el renglón de 24 grados de libertad nos da un área a la


derecha de 0.05. Por lo que la P(s2 >9.1) = 0.05. Se calcularán dos valores de ji-
cuadrada:

11
lOMoARcPSD|168 475 26

Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad.
Al buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de
42.98 da un área a la derecha de 0.01. Como se está pidiendo la probabilidad
entre dos valores se resta el área de 0.95 menos 0.01 quedando 0.94.

Por lo tanto la P(3.462 s2 10.745) = 0.94

Estimación de la Varianza

Para poder estimar la varianza de una población normal se utilizará la distribución


ji-cuadrada.

Al despejar esta fórmula la varianza poblacional nos queda:

Los valores de X2 dependerán de nivel de confianza que se quiera al cual le


llamamos . Si nos ubicamos en la gráfica se tiene:

12
lOMoARcPSD|168 475 26

Ejemplos:

1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de


pasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8,
46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de
todos los paquetes de semillas de pasto que distribuye esta compañía, suponga
una población normal.

Solución: Primero se calcula la desviación estándar de la muestra:

Al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2=


0.286. Para obtener un intervalo de confianza de 95% se elige un = 0.05.
Después con el uso de la tabla con 9 grados de libertad se obtienen los valores de
X2.

Se puede observar en la gráfica anterior que el valor de X 2 corre en forma normal,


esto es de izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para
la varianza es:

Gráficamente:

13
lOMoARcPSD|168 475 26

Se observa que la varianza corre en sentido contrario, pero esto es sólo en la


gráfica. La interpretación quedaría similar a nuestros temas anteriores referentes a
estimación.

Con un nivel de confianza del 95% se sabe que la varianza de la población de los
pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos
al cuadrado.

2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de


la variabilidad de los resultados que producen muestras estándar. En un estudio
de la cantidad de calcio en el agua potable, el cual se efectúa como parte del
control de calidad, se analizó seis veces la misma muestra en el laboratorio en
intervalos aleatorios.

Los seis resultados en partes por millón fueron 9.54, 9.61, 9.32, 9.48, 9.70 y
9.26. Estimar la varianza de los resultados de la población para este estándar,
usando un nivel de confianza del 90%.

Solución: Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.

Se busca en la tabla los valores correspondientes con 5 grados de libertad,


obteniéndose dos resultados. Para X2 (0.95,5)= 1.145 y para X2 (0.0,5)= 11.07. Entonces
el intervalo de confianza está dado por:

14
lOMoARcPSD|168 475 26

Ensayo de Hipótesis para la Varianza de una Población Normal

En la mayoría de los casos se tiene el problema de desconocer la varianza o


desviación estándar de la población, en donde las distribuciones son normales. Si
se desea probar una hipótesis acerca de la varianza se puede hacer utilizando las

medidas estadísticas con las que se construyó el intervalo de confianza , esto


es con la distribución Ji- cuadrada. Ejemplos:

1. Una compañía que produce una parte maquinada para un motor, afirma que
tiene una varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra s 2 = 0.0003. Si se
supone que las medidas del diámetro se distribuyen en forma normal, ¿hay
evidencia para refutar lo que afirma el proveedor? Use = 0.05.

Solución: Como en todos los ensayos de hipótesis que se han realizado


anteriormente el procedimiento es el mismo. Después de que se identifican los
datos, se plantea la hipótesis para determinar el tipo de ensayo.

Datos: = 0.0002, n = 10, s2 = 0.0003, = 0.05

Ensayo de hipótesis: Ho; = 0.0002, H1; > 0.0002

15
lOMoARcPSD|168 475 26

Regla de decisión: Si X2 R 16.919 no se rechaza Ho .

Si X2R>16.919 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza H o y se concluye


con un nivel de significancia de 0.05 que no se puede refutar la afirmación del
proveedor. Este ejercicio se puede aprovechar para calcular el valor de P. En la
tabla se busca el valor de 13.5 en el renglón de 9 grados de libertad. Interpolando
entre 0.10 y 0.20 se obtiene un valor de P de 0.1484.

2. El contenido de azúcar del almíbar de los duraznos enlatados tiene una

distribución normal, donde se cree que la varianza es = 18 mg2. Se toma


una muestra de 10 latas dieron una desviación estándar de 4.8 mg. ¿Muestran
estos datos suficiente evidencia para decir que la varianza ha cambiado? Use
un = 0.05 y calcule el valor de P.

Solución:

Datos: = 18, n = 10, s = 4.8, = 0.05

Ensayo de hipótesis: Ho ; = 18 H1; 18

16
lOMoARcPSD|168 475 26

Regla de decisión: Si 2.7 X 2R 19.023 no se rechaza Ho.

Si X2R <2.7 ó si X2R >19.023 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como 11.52 está entre 2.7 y 19.023, no se rechaza Ho, y se concluye con un nivel
de significancia de 0.05 que la varianza del contenido de azúcar del almíbar no ha
cambiado, esto es es de 18 mg2.

La media de este ejercicio es de 9. Como el valor real de X 2R = 11.52 este número


se encuentra a la derecha de la media, lo cual quiere decir que el valor de P/2 será
el área a la derecha del valor de X2R. Al buscar el valor de 11.52 en la tabla se
obtiene un área de 0.2423, por lo tanto P/2 = 0.2423 y P= (2)(0.2423) = 0.4846

3. Experiencia anterior indica que el tiempo que se requiere para que los
estudiantes de último año de preparatoria completen una prueba estandarizada
es una variable aleatoria normal con una desviación estándar de seis minutos.
Se toma una muestra aleatoria de 20 estudiantes de último año de preparatoria
y se obtiene una desviación estándar de 4.51.

17
lOMoARcPSD|168 475 26

¿Muestran estos datos suficiente evidencia para decir que la desviación


estándar disminuyó? Utilice el valor de P para su decisión.

Solución: Datos: = 6, n = 20, s = 4.51

Ensayo de hipótesis: Ho ; =6

H1 ; <6

Cálculos:

Para obtener el valor de P, se busca en la tabla el 10.735 con 19 grados de libertad,


y el área que se encuentra es la que está a la derecha de este valor. Como la media
de esta distribución ji-cuadrada es de 19, el valor de 10.735 queda a la izquierda de
la media. El valor de P es de 0.07, si se utiliza un valor de = 0.05, entonces no
se rechaza Ho y se concluiría que la desviación estándar no disminuyó. La decisión
depende del error tipo I que esté dispuesto a tolerar el investigador.

Error tipo II

Se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán


algunos ejercicios en los cuales se determinará la probabilidad decometer el error
tipo II, utilizando la tabla de la distribución Ji-cuadrada.

1. Se tiene un ensayo de hipótesis unilateral derecho, con n=20 y = 0.05

Ho ; = 0.10 H1 ; > 0.10

Se quiere calcular el error tipo II si las desviaciones estándar verdaderas fueran de


0.12 y 0.14.
18
lOMoARcPSD|168 475 26

Solución: Para poder calcular el error tipo II, primero se debe encontrar el valor
de la varianza muestral límite, esto es s 2L, para poder calcular los valores de X2 y
posteriormente calcular el área. Al buscar en la tabla X 2(0.05,19)=30.144, este valor se
sustituirá en la formula. Al despejar de la fórmula original de X2 se obtiene:

2. Encontrar el error tipo II para el ejercicio 2 de esta sección, en donde el ensayo


es bilateral pues se quiere ver si la varianza del contenido de azúcar en el
almíbar de los duraznos ha cambiado. Suponga una varianza real de 20 y 26.

Solución: Como este es un ensayo bilateral se tendrán dos valores de s 2L. Los
cuales se calcularán utilizando las ji-cuadradas límites que eran de de 2.7 y19.023.

19
lOMoARcPSD|168 475 26

Estos dos valores se utilizarán para calcular las nuevas ji-cuadradas para calcular
el valor de tipo II.

3.3 Distribución de proporciones.

Existen ocasiones en las cuales no estamos interesados en la media de la muestra,


sino que queremos investigar la proporción de artículos defectuosos o la proporción
de personas con teléfono, etc. en la muestra.

La distribución muestral de proporciones es la adecuada para dar respuesta a estas


situaciones. Esta distribución se genera de igual manera que la distribución muestral
de medias, a excepción de que al extraer las muestras de la población se calcula
el estadístico proporción (p=x/n en donde “x” es el número de éxitos u

20
lOMoARcPSD|168 475 26

observaciones de interés y “ n” el tamaño de la muestra) en lugar de la media de


cada muestra que era lo que calculamos antes.
El siguiente diagrama sirve para explicar el concepto de distribución muestral de
proporciones:

La distribución muestral de proporciones está estrechamente relacionada con la


distribución binomial; una distribución binomial es una distribución del total de éxitos
en las muestras, mientras que una distribución de proporciones es la distribución
de un promedio (media) de los éxitos.
Como consecuencia de esta relación, las afirmaciones probabilísticas referentes a
la proporción muestral pueden evaluarse usando la aproximación normal a la
binomial, siempre que:
np ≥ 5 y n(1- p) ≥ 5

Ejemplo de distribución binomial


Si echamos una moneda al aire y observamos el lado que
cae. Está claro que sólo hay dos posibilidades. Ahora
bien, la probabilidad de que caiga la moneda de cualquier
lado es la misma siempre que ésta no esté cargada.
Como cada caso tiene igual probabilidad de ocurrir, y
siendo la suma de probabilidades siempre igual a 1,
entonces la probabilidad de que caiga la moneda de
algún lado es 0.5.
Si realizamos el experimento n veces y queremos saber la probabilidad de que salga
águila o sol x veces, entonces usamos una distribución binomial.

Generación de la Distribución Muestral de Proporciones

21
lOMoARcPSD|168 475 26

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos


defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo.
} Vamos a generar la distribución muestral de proporciones para el número de
piezas defectuosas. Como se puede observar en este ejercicio la proporción de
artículos defectuosos de esta población es.

P = 4/12=1/3

Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12
elementos es 12 C 5=792, las cuales se pueden desglosar de la siguiente manera:

Para calcular la media de la distribución muestral de proporciones se tendría que


hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla
entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es


igual a la proporción de la población.

La desviación estándar de la distribución muestral de proporciones del ejemplo se


puede calcular directa mente con los datos:

22
lOMoARcPSD|168 475 26

Sin embargo, podemos usar la distribución binomial lo cual nos da la siguiente


fórmula para la desviación estándar de la distribución muestral de proporciones:

Notar que P es la proporción


de la población pero n es el
tamaño de la muestra

Como vimos antes, si contamos con una población finita y un muestreo sin
reemplazo, para calcular la desviación estándar usamos la corrección (Como regla
aproxima da, si el muestreo se hace sin reemplazo y el tamaño de la población es
20 veces el tamaño de la muestra o menor, entonces se puede usar la fórmula):

Para el ejemplo anterior tendríamos la siguiente distribución de probabilidades:

Usando la fórmula tendríamos entonces:

Lo cual es igual al valor de la desviación estándar obtenido antes.


La fórmula que se utilizará para el cálculo de probabilidad en una distribución
muestral de proporciones está basada en la aproximación de la distribución binomial
a la normal. Esta fórmula nos servirá para calcular la probabilidad del
comportamiento de la proporción en la muestra.

23
lOMoARcPSD|168 475 26

Esta fórmula se puede comparar a las anteriores si pensamos en que estamos


calculando una diferencia entre la proporción de la muestra y la de la población en
unidades de desviación estándar, como era el caso de la distribución de medias:

A la fórmula anterior se le puede agregar el factor de corrección (en el


denominador):

Si se cumplen con las condiciones mencionadas anteriormente de que sea una


población finita (N/n < 20) y sin reemplazo.

Ejemplo 1: Se ha determinado que 85.1% de los estudiantes de una universidad


fuman cigarrillos. Se toma una muestra aleatoria de 200 estudiantes. Calcular la
probabilidad de que no más de 80% de alumnos de la muestra fume.

Solución: La media o valor esperado de la distribución muestral es de P=0.851 (la


proporción de la población), por lo que:

Usando las tablas de valor z, para z = -2.02 encontramos que la probabilidad de


que no más de (es decir, menos de) 80% de los alumnos de la muestra fumen es
de 0.0214 o sea 2.14%.

24
lOMoARcPSD|168 475 26

Ejemplo 2: Suponer que de la gente que solicita ingresar a una compañía, 40%
pueden aprobar un examen de aritmética para obtener el trabajo. Si se tomara una
muestra de 20 solicitantes, ¿Cuál sería la probabilidad de que 50% o más de ellos
aprobaran?
Datos: P = 0.40, n = 20, p = 0.50

3.4 Distribución de diferencias.

Distribución Muestral de Diferencia de Medias


Suponga que se tienen dos poblaciones distintas, la primera con media 1 y
desviación estándar 1, y la segunda con media 2 y desviación estándar 2.
Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una
muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula
la media muestral para cada muestra y la diferencia entre dichas medias.
La colección de todas esas diferencias se llama distribución muestral de las
diferencias entre medias o la distribución muestral del estadístico

25
lOMoARcPSD|168 475 26

La distribución es aproximadamente normal para n1 30 y n2 30. Si las


poblaciones son normales, entonces la distribución muestral de medias es normal
sin importar los tamaños de las muestras. En ejercicios anteriores se había
demostrado que:

y que
Por lo que no es difícil deducir que:

y que .

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de


diferencia de medias es:

Ejemplo 1: En un estudio para comparar los pesos promedio de niños y niñas de


sexto grado en una escuela primaria se usará una muestra aleatoria de 20 niños y
otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen
una distribución normal.

El promedio de los pesos de todos los niños de sexto grado de esa escuela es de
100 libras y su desviación estándar es de 14.142, mientras que el promedio de los
pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su
desviación estándar es de 12.247 libras. Si representa el promedio de los pesos
de 20 niños y es el promedio de los pesos de una muestra de 25 niñas,encuentre
la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20
libras más grande que el de las 25 niñas.

Solución:
Datos:
1 = 100 libras
2 = 85 libras
1 = 14.142 libras
2 = 12.247 libras
n1 = 20 niños
26
lOMoARcPSD|168 475 26

n2 = 25 niñas

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños


sea al menos 20 libras más grande que el de la muestra de las niñas es 0.1056.

Ejemplo 2:
Uno de los principales fabricantes de televisores compra los tubos de rayos
catódicos a dos compañías. Los tubos de la compañía A tienen una vida media de
7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen
una vida media de 6.7 años con una desviación estándar de 0.7. Determine la
probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga
una vida promedio de al menos un año más que la de una muestra aleatoria de 40
tubos de la compañía B.

Solución:
Datos:
A = 7.2 años
B = 6.7 años

A = 0.8 años
B= 0.7 años
nA = 34 tubos
nB = 40 tubos

Ejemplo 3:
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una
desviación estándar de 1.23km/L para la primera gasolina y una desviación
estándar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en
35 autos y la segunda en 42 autos.
a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio
mayor de 0.45km/L que la segunda gasolina?
b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se
encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?

Solución: En este ejercicio no se cuenta con los parámetros de las medias en


ninguna de las dos poblaciones, por lo que se supondrán que son iguales.
1 = 1.23 Km/Lto

27
lOMoARcPSD|168 475 26

2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos

La probabilidad de que la diferencia en rendimientos promedio en las muestras se


encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.

Distribución Muestral de Diferencia de Proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben


compararse utilizando proporciones o porcentajes. Cuando el muestreo procede de
dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la
distribución muestral de diferencia de proporciones es aproximadamente normal
para tamaños de muestra grande (n1p1 5, n1q1 5,n2 p2 5 y n2q2 5). Entonces
p1 y p2 tienen distribuciones muestrales aproximadamente normales, así que su
diferencia p1-p2también tiene una distribución muestral aproximadamente normal.

28
lOMoARcPSD|168 475 26

Cuando se estudió a la distribución muestral de proporciones se comprobó que:

Y que

Por lo que: y .

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de


diferencia de proporciones es:

Ejemplo 4:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor
de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están.

Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión


sobre la promulgación de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Solución:
Datos: PH = 0.12, PM = 0.10, nH = 100, nM = 100, p(pH-pM 0.03) = ?

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.

29
lOMoARcPSD|168 475 26

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena


de muerte, al menos 3% mayor que el de mujeres es de 0.4562.

Ejemplo 5:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo
durante por lo menos dos años. Supóngase que tuviera que seleccionar otra
muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos
entre 1979 y 1984.

¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin


empleo durante por lo menos dos años, difiera del porcentaje obtenido en la
encuesta de Boston College, en 5% o más?

Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están
extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los
porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución
muestral de proporciones con P1= P2, ya que es una misma población.

Otra de las situaciones con la cual nos topamos es que desconocemos la


proporción de trabajadores despedidos entre 1979 y 1984 que estuvieron
desempleados por un período de por lo menos dos años, sólo se conoce la
p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa
proporción.
En el siguiente tema se abordará el tema de estimación estadística y se
comprenderá por qué estamos utilizando de esa manera el dato.

30
lOMoARcPSD|168 475 26

La palabra difiera quiere decir que puede existir una diferencia a favor de la
muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos
áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
P1 = P2

La probabilidad de que su
proporción muestral de
trabajadores sin empleo
durante por lo menos dos
años, difiera del
porcentaje obtenido en la
encuesta de Boston
College, en 0.05 o más es
de 0.1260.

Ejemplo 6:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y
que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman
muestras de 120 objetos de cada máquina:
a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 2 rebase a la máquina 1 en por lo menos 0.10?
b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 1 rebase a la máquina 2 en por lo menos 0.15?
Solución:

Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos

Otra manera de hacer este ejercicio es poner P1-P2:

31
lOMoARcPSD|168 475 26

La probabilidad de que exista una diferencia de proporciones de artículos


defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.

La probabilidad de
que exista una
diferencia de
proporciones de
artículos
defectuosos de por
lo menos 15% a
favor de la
máquina 1 es de
0.2357.

3.5 Aplicación en la explotación de hidrocarburos.

32
lOMoARcPSD|168 475 26

La industria petrolera aborda procesos globales de


exploración, extracción, refino, transporte y
mercadotecnia de productos base hidrocarburo. El
petróleo es la materia prima de muchos productos
químicos incluyendo productos farmacéuticos,
disolventes, fertilizantes, pesticidas, plásticos, etc.

La industria petrolera se divide normalmente en tres


fases:
❖ Upstream: Exploración, extracción y producción.
❖ Midstream: Transporte, procesos y
almacenamiento.
❖ Downstream: Refino, venta y distribución.

Un ejemplo de la aplicación de las distribuciones muestrales en la industria petrolera


es hallar las distribuciones de probabilidad de las reservas de aceite de los
yacimientos con base en información histórica de los campos petroleros ya
desarrollados, para ser utilizadas como herramientas predictivas en la estimación
de las reservas de los futuros descubrimientos del área.

Estas distribuciones de probabilidad se utilizan en la evaluación de proyectos


exploratorios, para los cuales se estiman los volúmenes de producción de crudo y
gas, así como sus ingresos e indicadores de rentabilidad correspondientes.

El objetivo de la exploración petrolera es evaluar el potencial petrolífero del


subsuelo e incorporar reservas de hidrocarburos.

Con el fin de cumplir su objetivo, la exploración petrolera se debe realizar en las


siguientes etapas:
▪ Estudio de cuencas
▪ Sistema petrolero
▪ Identificación, evaluación y selección de plays
▪ Identificación, evaluación y selección de prospectos
▪ Prueba de prospectos
▪ Delimitación y caracterización inicial

Distribución de probabilidad

33
lOMoARcPSD|168 475 26

Es una expresión matemática que representa las probabilidades de ocurrencia de


todos los posibles resultados de un experimento. La representación gráfica de esta
función se llama curva de probabilidad y el área entre dos puntos bajo la curva indica
la probabilidad de ocurrencia.

En una distribución de probabilidad discreta, la variable aleatoria puede asumir sólo


un número finito de valores, mientras que en una distribución continua puede
adquirir cualquier valor dentro de un rango. Una variable aleatoria es un evento
numérico cuyo valor se determina por medio de un proceso al azar. Las
distribuciones de probabilidad de las variables aleatorias generalmente se
desarrollan con base en probabilidades subjetivas.

Entre más alejado del presente esté el evento, más


incertidumbre habrá con respecto a su resultado.
El análisis de riesgo o probabilista toma en cuenta
la incertidumbre que generalmente existe en las
variables que conforman un proyectode inversión.

Esta incertidumbre normalmente es expresada por


medio de una distribución de probabilidad, la cual
depende de parámetros estadísticos como la
desviación estándar, el promedio y los valores mínimo, máximo y modal de los
datos.

Entre las distribuciones de probabilidad comúnmente utilizadas en la exploración se


tienen las siguientes:

➢ Distribución uniforme
➢ Distribución triangular
➢ Distribución normal
➢ Distribución lognormal
➢ Distribución
exponencial

Conclusión:

34
lOMoARcPSD|168 475 26

La ingeniería petrolera a menudo se enfrenta con problemáticas de suma dificultad,


pues existe carencia de datos e incertidumbre en los resultados, sobre todo en el
área de exploración y localización de hidrocarburos; sin embargo, gracias a la
Probabilidad y Estadística (que es de vital importancia), se realizan cálculos de
idealización y muestreo ya sea para identificar las posibles reservas,su nivel de
producción y calidad del producto, hasta los riesgos de inversión y las ganancias.

Bibliografía:
➢ ftp://ftp.utalca.cl/profesores/gicaza/Clases/7Distribuciones%20Muestrales.pdf
➢ https://www.upg.mx/wp.../LIBRO-13-Estadistica-para-administracion-y
economia.pdf
➢ http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf
➢ https://www.ugr.es/~mvargas/tema6sd.pdf
➢ https://html.rincondelvago.com/distribucion-por-muestreo.html
➢ http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03b.html
➢ file:///C:/Users/luisa/Downloads/pye.pdf

35

You might also like