You are on page 1of 18

UNIVERSIDAD POLITECNICA SALESIANA

INGENIERIA ELECTRONICA

PROYECTO DE PROBABILIDAD Y ESTADISTICA


PROFESOR:
GIANFRANCO DI MATTIA CASTRO
AUTOR:
ERICKA REYES CEREZO
CESAR VALDIVIEZO ROMERO

CURSO
4301

GUAYAQUIL ECUADOR

2017
NDICE
1. INTRODUCCIN........................................................................................ 3
2. MARCO TERICO...................................................................................... 5
2.1 Definiciones bsicas estadsticas................................................................5
2.2 Principales medidas de dispersin...............................................................5
2.3 Distribuciones de frecuencias aplicadas.......................................................5
2.4 Representaciones grficas.........................................................................6
2.5 Variables aleatorias................................................................................... 8
3. ESTADISTICA DESCRIPTIVA.......................................................................8
3.1 Descripcin del experimento.......................................................................8
3.2 Datos Obtenidos....................................................................................... 9
3.3 Representaciones graficas.......................................................................11
4. CALCULO DE PROBABILIDAD..................................................................14
4.1 Distribucin Hipergeomtrica....................................................................14
5. RESULTADOS DE ANALISIS......................................................................16
6. CONCLUSIONES..................................................................................... 16
7. RECOMENDACIONES.............................................................................. 16
8. ANEXOS................................................................................................. 18
9. BIBLIOGRAFIA........................................................................................... 2
Ejemplo 1: Histograma................................................................................... 7
Y
Ilustracin 1: Histograma.................................................................................. 12

Tabla 1: Datos obtenidos de la simulacin...........................................................10


Tabla 2: Tabla de frecuencias............................................................................ 10
Tabla 3: Datos del Histograma...........................................................................11
Tabla 4: Resultados de la variable Hipergeomtrica..............................................15

Foto 1: Desarrollo del experimento..............................................................18


Foto 2: Caso posible..................................................................................... 18
Foto 3: Tabulacin a mano de datos del experimento..................................19
Foto 4: Captura de pantalla del experimento en Excel.................................20
1. INTRODUCCIN
Para mucha gente, estadstica significa descripciones numricas. Esto puede
verificarse fcilmente al escuchar, un domingo cualquiera, a un comentarista de
televisin narrar un juego de ftbol. Sin embargo, en trminos ms precisos, la
estadstica es el estudio de los fenmenos aleatorios. En este sentido la ciencia
de la estadstica tiene, virtualmente, un alcance ilimitado de aplicaciones en un
espectro tan amplio de disciplinas que van desde las ciencias y la ingeniera
hasta leyes y la medicina. El aspecto ms importante de la estadstica es la
obtencin de conclusiones basadas en los datos experimentales. Este proceso
se conoce como inferencia estadstica. Si una conclusin dada pertenece a un
indicador econmico importante o a una posible concentracin peligrosa de
cierto contaminante, o bien, si se pretende establecer una relacin entre la
incidencia de cncer pulmonar y el fumar, es muy comn que la conclusin est
basada en la inferencia estadstica. (Canavos, 1980)
Para comprender la naturaleza de la inferencia estadstica, es necesario
entender las nociones de poblacin y muestra. La poblacin es la coleccin de
toda la posible informacin que caracteriza a un fenmeno. En estadstica,
poblacin es un concepto mucho ms general de que tiene la acepcin comn
de esta palabra. En este sentido, una poblacin es cualquier coleccin ya sea
de un nmero finito de mediciones o una coleccin grande, virtualmente infinita,
de datos acerca de algo de inters. Por otro lado, la muestra es un subconjunto
representativo seleccionado de una poblacin. La palabra representativo es la
clave de esta idea. Una buena muestra es aquella que refleja las
caractersticas esenciales de la poblacin de la cual se obtuvo. En estadstica,
el objetivo de las tcnicas de muestreo es asegurar que cada observacin en la
poblacin tiene una oportunidad igual e independiente de ser incluida en la
muestra. Tales procesos de muestreo conducen a una muestra aleatoria. Las
observaciones de la muestra aleatoria se usan para calcular ciertas
caractersticas de la muestra denominadas estadsticas. Las estadsticas se
usan como base para hacer inferencias acerca de ciertas caractersticas de la
poblacin, que reciben el nombre de parmetros. As, muchas veces se analiza
la informacin que contiene una muestra aleatoria con el propsito principal de
hacer inferencias sobre la naturaleza de la poblacin de la cual se obtuvo la
muestra. (Canavos, 1980)
En estadstica la inferencia es inductiva porque se proyecta de los especifico
(muestra) hacia lo general (poblacin). En un procedimiento de esta naturaleza
siempre existe la posibilidad de error. Nunca podr tenerse en 100% de
seguridad sobre una proposicin que se base en la inferencia estadstica. Sin
embargo, lo que hace que la estadstica sea una ciencia (separndola del arte
de adivinar la fortuna) es que, unida a cualquier proposicin, existe una medida
de la confiabilidad de esta. En estadstica la confiabilidad se mide en trminos
de probabilidad. En otras palabras, para cada inferencia estadstica se
identifica la probabilidad de que la inferencia sea correcta. (Canavos, 1980)
La estadstica matemtica proporciona, sobre la base de la Teora de
probabilidades, mtodos mediante los cuales se puede obtener informacin
sobre las distintas poblaciones a investigar, utilizando datos muestrales
aleatorios; con esto se da origen tambin a mtodos de ajuste de un modelo
matemtico, que considere efectos aleatorios, al proceso real correspondiente,
sobre la base de datos concretos. El desarrollo de dispositivos electrnicos de
alta potencia para el procesamiento de datos exige la aplicacin de mtodos de
la Estadstica matemtica, en particular de los mtodos de anlisis estadsticos
(por ejemplo, los anlisis de correlacin, regresin, varianza y anlisis factorial),
en los ms diversos dominios de prctica. (Maibaum, 1988)
En estadstica tratamos en primer lugar con datos, esto es, con una cantidad n
de mediciones no procesadas, sean estas numricas (cuantitativas) o
categricas (cualitativas), que llenan nuestro cuaderno de apuntes o reposan
en un instrumento de almacenamiento de datos, sea este un disco duro, o
dispositivo de memoria mvil. Finalmente reposarn en una base de datos para
su manejo, o en una bodega de datos (warehouse) para su almacenamiento
histrico o posterior tratamiento con minera de datos. Estas mediciones son
efectuadas a elementos de algn conjunto bien definido, al que llamaremos
poblacin objetivo. A los elementos de la poblacin objetivo, los llamaremos
Unidades de Investigacin. Para efectos de este primer anlisis vamos a
suponer que las medidas efectuadas son cuantitativas, pero no necesariamente
esto tiene que ser siempre as. (Zurita, Probabilidad y Estadistica,
Fundamentos y Aplicaciones, 2010)
2. MARCO TERICO
2.1 Definiciones bsicas estadsticas

Poblacin: se designa con este trmino a cualquier conjunto de elementos


que tienen unas caractersticas comunes. Cada uno de los elementos que
integran tal conjunto recibe el nombre de individuo. (Martel, 1997)
Muestra: la muestra es un subconjunto de individuos pertenecientes a una
poblacin, y representativos de la misma. (Martel, 1997)
2.2 Principales medidas de dispersin.
Las medidas de dispersin permiten calcular la representatividad de un
promedio (media o mediana), para lo cual ser preciso cuantificar la distancia
de los valores de la distribucin respecto al dicho promedio. (Martel, 1997) Las
medidas de dispersin ms conocidas son:
2
Varianza S . se define como:

ni ( X i X )
n 2
2
S =
i N

Donde Xison los valores de la variable X , ni las respectivas



frecuencias absolutas, X la medida aritmtica y N el nmero total de
elementos. (Martel, 1997)
Desviacin estndar:
Un inconveniente de la varianza radica en que sus unidades se
corresponden, no con las variables, sino con las de la variable elevada al
cuadro, lo cual puede dificultar considerablemente su interpretacin. Por
ello se utiliza la desviacin tpica, es la raz cuadrada con signo positivo
de la varianza; es decir. (Martel, 1997)

ni ( X i X )2
n
S= S =
2

i=1 N

Cuartiles: algunas veces se utilizan solo cuatro percentiles, aquellos


que comprenden entre casa uno al 25% del conjunto; a esos percentiles
especficos se les llama cuartiles y son los percentiles 25, 50, 75 y 100.
(Madrigal, 1986)

Media aritmtica (promedio): la media, mejor conocida como Media


Aritmtica o promedio, es quizs de las medias estadsticas de mayor
uso. (Corrales, 1984)
2.3 Distribuciones de frecuencias aplicadas.
Frecuencia absoluta: es el nmero de veces que se presentan un
determinado dato de un carcter en los diferentes elementos de una poblacin.
Se representa por n (Fernandez, 2002)
Frecuencia relativa: se obtiene dividiendo la frecuencia absoluta de un
determinado dato entre la suma de las frecuencias absolutas de todos los datos
observados, es decir, entre el tamao de la poblacin. Se representa por
n
f i = i . (Fernandez, 2002)
N

Frecuencia absoluta acumulada: la frecuencia absoluta acumulada de un


dato es igual de ese dato ms la suma de las frecuencias absolutas de los
datos anteriores. Se representa por N i esta frecuencia representa, cuando
existe una relacin de orden, el nmero de elementos de la poblacin que
quedan por encima o por debajo del elemento cuyo valor o modalidad se
observa. (Fernandez, 2002)
Frecuencia relativa acumulada: la frecuencia relativa acumulada de un dato
es igual a la suma de las frecuencias relativas de todos los datos menores o
iguales que dicho valor. Se representa por Fi . Al igual que las frecuencias

relativas simples, se suelen presentar en porcentajes (% Fi ). (Fernandez,


2002)

Tabla de frecuencias: la informacin agrupada puede presentarse en un


dispositivo llamado tabla de frecuencias. El nmero (m) de intervalos de clase,
y por tanto la amplitud de los mismos, dependen de:
1. La variable en estudio
2. La cantidad de datos o valores de la variable
3. El objetivo del estudio
4. La dispersin de la variable (Valencia, 2008)
Clculos para una tabla de frecuencias con sus respectivas formulas:
2.4 Representaciones grficas.
Histograma: Es una grfica de barras. Se conforma a partir de los intervalos
de clase versus su respectiva frecuencia. Estos valores se toman de la tabla de
datos agrupados. En el eje de las variables dependientes (eje X) se colocan los
intervalos de clase, y en el eje de las variables dependientes se ubican las
respectivas frecuencias de los intervalos de clase. (Arellano, 2006)

Ejemplo 1: Histograma

Diagrama de cajas: Es un grfico que nos suministra informacin sobre los


cuartiles Q1, Q2 (mediana) y Q3, los valores mnimo y mximo, la existencia de
valores atpicos y la simetra de la distribucin de frecuencias. (Gert, 1976)

2.5 Variables aleatorias.


Distribucin hipergeomtrica: Se trabaja con una poblacin objetiva

constituida por N entes; entre estos N entes, k tienen una caracterstica que es
de inters en la investigacin. Se toma una muestra de tamao n de la
poblacin. Bajo estas condiciones, X es una variable aleatoria hipergeomtrica
con parmetros N, a y n si X representa el nmero de elementos que aparecen
con la muestra, que poseen la caracterstica de inters que se busca. (Herrera,
2010)
Una de sus aplicaciones ms comunes es el los denominados Muestreos de
Aceptacin, el cual es un procedimiento estadstico que consiste en analizar
lites que contienen N elementos, entre los cuales existen k que no cumplen con
determinadas especificaciones de calidad. (Herrera, 2010)

Se obtiene con la siguiente frmula:

(k C x) N k
f ( x )=P ( X =x ) =
(
nx )
NC n

Su Media se calcula con la siguiente frmula:

nk
E ( x )=
N

2
Su Vari anza se obtiene con la siguiente frmula:

V (x )= ( nKN )( 1 Nk )( NN1
n
)
3. ESTADISTICA DESCRIPTIVA
3.1 Descripcin del experimento
Los estudiantes simularn una inspeccin de calidad a travs de un muestreo de
aceptacin. Para ello llenarn un nfora con 40 bolitas de las cuales, 8 estarn
marcadas. Las nforas representan lotes o contenedores de cierto artculo que se
compra de algn lugar, y las bolitas marcadas representan artculos defectuosos.
Debern extraer al azar 5 bolitas, y apuntarn cuntas de las 5 son defectuosas.
Luego vuelven a poner las bolitas en el nfora y repiten nuevamente el experimento.
En cada repeticin, se apuntar cuntas de las 5 son defectuosas. El experimento se
debe repetir 100 veces, obteniendo de esta manera 100 nmeros. Se recomienda
agitar las bolitas en el nfora antes de cada repeticin.

3.2 Datos Obtenidos


Los datos obtenidos del experimento son:

Datos
1 2 4 1
1 2 2 3
3 2 0 1
3 1 1 3
0 1 0 2
1 3 1 0
2 1 3 1
0 2 1 3
2 1 2 2
2 1 3 1
0 1 1 4
1 1 2 2
1 1 0 3
2 2 1 0
1 0 2 1
3 2 3 2
2 1 4 3
2 1 0 1
1 1 1 4
2 2 2 2
2 1 1 3
5 1 2 1
1 1 0 0
0 1 4 3
3 2 2 1
Tabla 1: Datos obtenidos de la simulacin

3.2.1 Datos de la Tabla de frecuencia


Una vez obtenido los datos procedemos a realizar la tabla de frecuencia.

Frecuencia Frecuencia
Frecuencia Frecuencia Acumulada Relativa
Ordinal Absoluta (fi) Relativa (fi/n) (Fi) Acumulada (Fi/n)
0 13 0,13 13 0,13
1 38 0,38 51 0,51
2 28 0,28 79 0,79
3 15 0,15 94 0,94
4 5 0,05 99 0,99
5 1 0,01 100 1
100 1

Tabla 2: Tabla de frecuencias

Como observamos en la tabla de frecuencia, la frecuencia absoluta es el nmero de


observaciones en la muestra que pertenecen a cada una de las k clases (Zurita,
Probabilidad y estadistica, Fundamentos y aplicaciones , 2010), en este experimento
quedara representado por el nmero de bolitas marcadas que simbolizan los artculos
defectuosos.
La frecuencia relativa se obtiene dividiendo la frecuencia absoluta de un determinado
dato entre la suma de las frecuencias absolutas de todos los datos observados, es
decir, entre el tamao de la poblacin se representa por f ri=f i /n . (Fernandez,
2002)

13 15
f i= =0.13 f i= =0.15
100 100

38 5
f i= =0.38 f i= =0.05
100 100

28 1
f i= =0.28 f i= =0.01
100 100

La frecuencia absoluta acumulada de un dato es igual a la frecuencia absoluta de ese


dato ms la suma de las frecuencias absolutas de los datos anteriores y se representa
por ( Fi ). (Fernandez, 2002)

La frecuencia relativa acumulada se obtiene dividiendo la frecuencia acumulada para


el nmero total de datos.

13 94
Fri = =0.13 Fri = =0.94
100 100

51 99
Fri = =0.51 Fri = =0.99
100 100

79 100
Fri = =0.79 Fri = =1
100 100
Una vez hallado los datos procedemos a realizar la media aritmtica.
k
Xi
x =
i n

( 0 ) (13 )+ (1 )( 38 ) + ( 2 ) ( 28 ) + ( 3 ) ( 15 ) + ( 4 )( 5 )+(5)(1)
x =
100

x =1.64

Cuando ya obtenemos el valor de la media, tenemos todos los datos que nos
hacen falta para proceder a realizar la varianza.
n
ni ( X i X )2
S 2=
i N

2 2 2 2 2 2
2 13(01.64) + 38(11.64) +28( 21.64) +15(31.64) + 5(41.64) +1(51.64)
S=
1001

S 2= 1.222626
Y como ya sabemos la desviacin estndar es la raz cuadrada de la varianza


ni ( X i X )2
n
S= S = 2

i=1 N

S 2= 1.222626263
S=1.10572

3.3 Representaciones graficas


Una vez encontrado todos los datos procederemos a representar grficamente
los resultados.
3.3.1 Histograma
Para graficar el histograma necesitaremos los siguientes datos:

frecuencia
Ordinal Relativa
0 0,13
1 0,38
2 0,28
3 0,15
4 0,05
5 0,01
Tabla 3: Datos del Histograma

Histograma
0.4

0.35 0.38

0.3

0.25 0.28

0.2

0.15
0.15
0.1 0.13

0.05
0.05
0
0 1 2 3 4 0.01
5

Ilustracin 1: Histograma.

Podemos observar en esta ilustracin (histograma) que la acumulacin de datos se da


entre los valores 1 y 2, seguido por los valores de 3 y 0, dejando a los valores 4 y 5 al
final con apenas el 0,05 y 0,01 de probabilidades de que ocurra.

4. CALCULO DE PROBABILIDAD
Utilizando la distribucin hipergeomtrica, deber calcular las verdaderas
probabilidades de cada nmero y compararlos con los obtenidos en la simulacin.
Tambin debern calcular las verdaderas media y varianza, y compararlas con las
estimaciones de la simulacin. La comparacin debe ir comentada y analizada.

4.1 Distribucin Hipergeomtrica


Podemos identificar que para este experimento debemos utilizar el caso de
distribucin hipergeometrica debido a que cumple con todas las caractersticas de
este caso:
N= 40 bolitas (Poblacin)
K= 8 bolitas con defecto (Caracterstica especial)
n= 5 bolitas al azar (Muestra)
Para identificar x debemos de escribir el enunciado que corresponde a la distribucin
hipergeometrica.
X= Numero de bolitas marcadas o con defecto seleccionadas de una muestra de 5 de
una poblacin de 40.
Por lo tanto deducimos que el nmero de unidades o bolitas marcadas puede ser
(X=0,1, 2, 3, 4, 5) esto debido a las 5 bolitas que escogimos.
(k C x) N k
Su frmula es f ( x )=P ( X =x ) =
(nx )
NC n

( 8)( 408 )
0 50 201376
P ( x=0 )= = =0,3060388324
40 C 5 658008

(8 )( 408 )
1 51 (8)(35960)
P ( x=1 )= = =0,4371983
40 C 5 658008

(8 )( 408 )
2 52 (28)( 4960)
P ( x=2 )= = =0,21106126
40 C 5 658008

(8 )( 408)
3 53 (56)( 496)
P ( x=3 )= = =0,042212252
40C 5 658008

( 8 )( 408 )
4 54 (70)(32)
P ( x=4 )= = =0,003404213
40 C 5 658008

(8 )( 408)
5 55 (56)(1)
P ( x=5 )= = =0,000085
40C 5 658008

Como resultado la sumatoria de todas las probabilidades es 1.


Como observamos pudimos encontrar la probabilidad de acuerdo a cada posibilidad
de las bolitas:

x P(x)
0 0,306038832
x P(x)
1 0,4371983
0 0,306038832
2 0,21106126
1 0,4371983
3 0,042212252
2 0,21106126
4 0,003404213
3 0,042212252
5 0,000082
4 0,003404213
5 0,000082

Tabla 4: Resultados de la variable Hipergeomtrica.

Procedemos a realizar la media y la varianza:


k
E ( x )=n
N

(5)(8) 40
E ( x )= = =1
40 40

V (x )= ( Nn nk
N1 )( N )
k
(1 )
N

( 5) ( 8)
V (x )= ( 405
401 ) ( 40 ) 8
(1 )
40 = 0.7179

5. RESULTADOS DE ANALISIS
Una vez obtenido todos los datos podemos analizar los resultados entre la simulacin
y el modelo matemtico. Los resultados fueron:
La probabilidad de 0 en la simulacin fue de 0.13 y en el modelo matemtico fue
0.30603.
La probabilidad de 1 en la simulacin fue de 0.38 y en el modelo matemtico fue
0.4371.
La probabilidad de 2 en la simulacin fue de 0.28 y en el modelo matemtico fue
0.21106.
La probabilidad de 3 en la simulacin fue de 0.15 y en el modelo matemtico fue
0.04221.
La probabilidad de 4 en la simulacin fue de 0.05 y en el modelo matemtico fue
0.003404.
La probabilidad de 5 en la simulacin fue de 0.01 y en el modelo matemtico fue
0.000085.
La media en la simulacin tuvo un valor de 1,64 y en el modelo matemtico fue 1.
La varianza en la simulacin tuvo un valor de 1,2226 y en el modelo matemtico fue de
0,7179.
Podemos observar que en la simulacin de nuestro experimento la media obtuvo un
valor de 1,64 mientras que en el modelo matemtico obtuvo un valor de 1, aqu
podemos notar que el modelo matemtico solo arroja aproximaciones y que no debe
ser tomado como la media correcta sino como una aproximacin a los experimentos
en la vida real.
Tambin observamos que la varianza obtenida en la simulacin tiene un valor distinto
al valor del modelo matemtico.

6. CONCLUSIONES
Una vez acabado el experimento y haber obtenido cada uno de sus datos
podemos llegar a la conclusin, mediante la comparacin de resultados, que
la simulacin y el modelo matemtico difieren entre s, por lo que el modelo
matemtico debera ser tomado como una referencia y no como el resultado
real de un experimento.

7. RECOMENDACIONES
Es muy importante tener muy en claro cada uno de los conceptos
bsicos.
En la prctica del experimento se recomienda agitar muy bien las
bolitas, ya que esto puede influir en el resultado del experimento.
Al realizar la prctica del experimento se recomienda anotar
claramente y en orden cada resultado obtenido.
Analizar con lgica de acuerdo a los conceptos cada grfico realizado.
Al realizar los grficos se recomienda revisar constantemente los
resultados de las tablas de datos.
8. ANEXOS

Foto 1: Desarrollo del experimento.

Foto 2: Caso posible.


Foto 3: Tabulacin a mano de datos del experimento.
Foto 4: Captura de pantalla del experimento en Excel.

9. BIBLIOGRAFIA
Arellano, V. U. (2006). Estadistica aplicada a la comunicacion. Mexico: pinted
and made in mexico.
Canavos, G. C. (1980). Probabilidad y Estadistica, Aplicaciones y Metodos.
Mexico: Virginia Commonwealth University.
Corrales, M. (1984). matematica estadistica. Costa Rica: universidad estatal
a distancia.
Fernandez, S. (2002). estadistica descriptiva. Madrid: ESIC.
Gert, M. (1976). Teora de Probabilidades y Estadstica Matemtica. berlin:
pueblo y educacion.
Herrera, G. Z. (2010). PROBABILIDAD Y ESTADSTICA: Fundamentos y
Aplicaciones; 2a ed. Guayaquil: ESPOL.
Madrigal, L. M. (1986). introduccion a la estadistica de la salud. costa rica:
universidad de costa rica.
Maibaum, G. (1988). Teoria de probabilidades y estadistica matematica.
Berlin : Editorial Pueblo y Educacion.
Martel, P. j. (1997). probabilidad y etadistica en medicina. Madrid: Diaz de
Santos.
Valencia, J. A. (2008). fundamentos de la inferencia estadistica. Bogota:
pontifica universidad javeriana.
Zurita, G. (2010). Probabilidad y Estadistica, Fundamentos y Aplicaciones
(Segunda Edicin ed.). Espol.
Zurita, G. (2010). Probabilidad y estadistica, Fundamentos y aplicaciones .
ESPOL.