You are on page 1of 13

Tarea

Estadstica N 2

Nombre:
Jaime Inzunza.
Profesor:
Enrique Muoz
Fecha:
13 de Junio de 2013

Introduccin

La prueba de bondad de ajuste se utiliza para comprobar grficamente y estadsticamente


si la distribucin de frecuencias observadas de una variable con la distribucin de frecuencia de la
misma variable medida en un grupo de referencia.
El Procedimiento de la prueba implica el clculo de una distribucin esperada en el grupo
estudiado.
El objetivo de la prueba es averiguar si existen diferencias estadsticamente significativas
entre la distribucin observada y la esperada.
La prueba consta de comprobar la hiptesis estadstica nula Ho, para ver si la distribucin
representa los datos de la muestra.
En el informe se presentan 4 formas de comprobar la hiptesis, Los mtodos grficos del
histograma de frecuencias relativas con respecto a la distribucin de densidad terica, la funcin
de distribucin acumulada con distribucin de frecuencias acumuladas, test Chi-Cuadrado y la
prueba de Kolmogorov-Smirnov.

Pruebas de bondad de ajuste


1.- Ajuste Grafico
1.1.- Histogramas de frecuencias relativas vs Funcin de densidad terica.

1.1.1.-Distribucion normal

1.1.2.-Distribucin Log-Normal

1.1.3- Distribucin Log-Normal tres parmetros

1.1.4 Distribucin Gamma

Se puede observar que la que ms se aproxima es la distribucin Log-Normal de tres parmetros y


Gamma.

1.1.5.- Distribucin Pearson

1.1.7.- Distribucin Gumbel

1.1.6.-Distribucin Log-Pearson

1.1.8.- Distribucin Log-Gumbel

Podemos ver que la distribucin Pearson, Log-Pearson y Log- Gumbel no se ajustan a los datos.

1.2.- Funcin de distribucin acumulada vs distribucin de frecuencias


acumuladas
1.2.1.- Distribucin normal

1.2.2.- Distribucin Log-Normal

1.2.3.- Distribucin Log-Normal tres parmetros

Acumulado de Lognormal 3 parametros

1,00
0,50
0,00
-100,0

100,0

300,0

500,0

700,0

Distribucin de frecuencias
Funcin de distribucion acumulada

1.2.4.- Distribucin Gamma

1.2.5.- Distribucin Pearson


Pearson

1.2.7.- Distribucin Gumbel

1.2.6.- Distribucin Log-

1.2.8.- Distribucin Log-Gumbel

Por este mtodo se puede decir que la nica distribucin que no se aproximan es la Normal.

2. Test Chi cuadrado


2.1 Distribucin normal
LCi
0,0
142,1
297,3
452,5
607,7

Int. Clase
64,6
219,7
374,9
530,1
685,3

LCs
142,1
297,3
452,5
607,7
762,8

Frec.
intervalo
Abs.
[0;142,1]
6
[142,1;297,3]
10
[297,3;452,5]
3
[452,5;607,7]
0
[607,7;762,8]
1

z Lci Z Lcs
0,00 -0,56
-0,56 0,52
0,52 1,60
1,60 2,69
2,69 3,77

p Lci
0,00
0,29
0,70
0,95
1,00

PLcs
0,2869
0,6988
0,9457
0,9964
0,9999

p
p*n
0,29
6
0,41
8
0,25
5
0,05
1
0,00
0

frec.
Esperada
X2
6
0,0
8
0,5
6
0,7
suma
1,2
De la tabla Chi cuadrado tenemos que para 2 grados de libertad y =0.05 que X 2=5.992 por lo
tanto como 5.992>1.2 decimos que no hay evidencia de que la muestra no provenga de una
distribucin Normal.
intervalo
[0;142,1]
[142,1;297,3]
[297,3;762,8]

frec.
Observada
6
10
4

2.2 Distribucin Log-Normal


LCi

Int. Clase

0
142,147
297,322
452,497
607,672

64,56
219,735
374,91
530,085
685,26

LCs

intervalo

142,147
297,322
452,497
607,672
762,847

Frec.
Abs.

[0;142,1]
[142,1;297,3]
[297,3;452,5]
[452,5;607,7]
[607,7;762,8]

z Lcs

p Lci

6
0 249,69
0
10 249,693 532,73 0,6871
3 532,728 815,76 0,9693
0 815,764 1098,8 0,9959
1 1098,8 1381,8 0,9993

p Lcs P
0,687
0,969
0,996
0,999
1

P*n

0,68714 13,7
0,28212 5,6
0,02669 0,5
0,00335 0,1
0,00056 0,0

frec.
Esperada
X2
14
4,6
6
10,7
suma
15,2
De la tabla Chi cuadrado tenemos que para 1 grados de libertad y =0.05 que X 2=3.8415 por lo
tanto como 3.8415<15.2 decimos que los datos no provienen de una distribucin Log-Normal.
intervalo
[0;142,1]
[142,1;762,8]

frec.
Observada
6
14

z lci

2.3 Distribucin Log-Normal de tres parmetros.


LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
64,56
219,735
374,91
530,085
685,26

LCs
142,1475
297,3225
452,4975
607,6725
762,8475

intervalo
[0;142,1]
[142,1;297,3]
[297,3;452,5]
[452,5;607,7]
[607,7;762,8]

intervalo
[0;142,1]
[142,1;762,8]

Frec.
Abs.

frec.
Observada
6
14

z lci

6
0
10 -0,465
3 0,76805
0 1,49348
1 2,00928

frec.
Esperada
6
14

z Lcs
-0,465
0,7681
1,4935
2,0093
2,4098

p Lci
0
0,3208
0,7788
0,9323
0,9777

p Lcs
0,321
0,779
0,932
0,978
0,992

P
P*n
0,32085
6
0,45792 10
0,15357
3
0,0454
1
0,01427
0

X2
0,0
0,0

suma
0,0
De la tabla Chi cuadrado tenemos que para 1 grados de libertad y =0.05 que X 2=3.8415 por lo
tanto como 3.8415>0 decimos que no hay evidencia de que la muestra no provenga de una
distribucin Log-Normal de tres parmetros.

2.4 Distribucin Gamma


LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
LCs
64,56
142,1475
219,735
297,3225
374,91
452,4975
530,085
607,6725
685,26
762,8475

intervalo
[0;142,1]
[142,1;297,3]
[297,3;762,8]

Frec.
intervalo
Abs.
p Lci
p Lcs P
P*n
[0;142,1]
6
0 0,3348 0,3348
7
[142,1;297,3]
10 0,33478 0,7527 0,4179
8
[297,3;452,5]
3 0,75269 0,9268 0,1741
4
[452,5;607,7]
0 0,92675 0,9807 0,0539
1
[607,7;762,8]
1 0,98068 0,9952 0,0146
0

frec.
Observada
6
10
4

frec.
Esperada
7
8
5

X2
0,1
0,5
0,2

suma
0,8
De la tabla Chi cuadrado tenemos que para 2 grados de libertad y =0.05 que X 2=5.992 por lo
tanto como 5.992>0.8 decimos que no hay evidencia de que la muestra no provenga de una
distribucin Normal.

2.5.- Distribucin Pearson


LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
LCs
64,56 142,1475
219,735 297,3225
374,91 452,4975
530,085 607,6725
685,26 762,8475

intervalo
[0;142,1]
[142,1;297,3]
[297,3;452,5]
[452,5;607,7]
[607,7;762,8]

intervalo
[0;142,1]
[142,1;762,8]

frec.
Observada
6
14

Frec.
Abs.

X2 Lci
6
10
3
0
1

0
0,85607
3,00897
5,16188
7,31478

frec.
Esperada
7
13

X2 Lcs
0,8561
3,009
5,1619
7,3148
9,4677

P Lci
0,000
0,348
0,778
0,924
0,974

P Lcs P
P*n
0,348 0,348 7
0,778 0,430 9
0,924 0,146 3
0,974 0,050 1
0,991 0,017 0

X2
0,1
0,1

suma
0,2
De la tabla Chi cuadrado tenemos que para 1 grados de libertad y =0.05 que X 2=3.8415 por lo
tanto como 3.8415>0.2 decimos que no hay evidencia de que la muestra no provenga de una
distribucin Log-Normal de tres parmetros.

2.6.- Distribucin Log-Pearson


LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
LCs
64,56 142,1475
219,735 297,3225
374,91 452,4975
530,085 607,6725
685,26 762,8475

Frec.
intervalo
Abs.
X2 Lci
X2 Lcs P Lci
P Lcs
[0;142,1]
6
0 79,752
0
1
[142,1;297,3]
10 79,7521 91,844 0,9999
1
[297,3;452,5]
3 91,8435 98,681
1
1
[452,5;607,7]
0 98,681 103,47
1
1
[607,7;762,8]
1 103,47 107,16
1
1

intervalo

frec.
Observada

[0;762,8]

20

frec.
Esperada

X2

20
0,0
suma
0
No se puede aplicar el test debido a que K=1 lo que nos da cero grado de libertad.

P
P*n
0,99987 20
0,00012
0
3,3E-06
0
3,5E-07
0
6,7E-08
0

2.7.- Distribucin Gumbel


LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
LCs
64,56
142,1475
219,735
297,3225
374,91
452,4975
530,085
607,6725
685,26
762,8475

intervalo
[0;142,1]
[142,1;297,3]
[297,3;762,8]

intervalo
[0;142,1]
[142,1;297,3]
[297,3;452,5]
[452,5;607,7]
[607,7;762,8]

frec.
Observada
6
10
4

Frec.
Abs.

P Lci
6
0
10
0,315
3 0,74992
0 0,93081
1 0,9823

frec.
Esperada
6
9
5

P Lcs
0,315
0,7499
0,9308
0,9823
0,9956

P
P*n
0,315
6
0,4349
9
0,1809
4
0,0515
1
0,0133
0

X2
0,0
0,1
0,2

suma
0,3
De la tabla Chi cuadrado tenemos que para 2 grados de libertad y =0.05 que X 2=5.992 por lo
tanto como 5.992>0.3 decimos que no hay evidencia de que la muestra no provenga de una
distribucin Normal.

2.8.- Distribucin Log-Gumbel


LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
LCs
64,56
142,1475
219,735
297,3225
374,91
452,4975
530,085
607,6725
685,26
762,8475

intervalo
[0;142,1]
[142,1;762,8]

intervalo
[0;142,1]
[142,1;297,3]
[297,3;452,5]
[452,5;607,7]
[607,7;762,8]

frec.
Observada
6
14

Frec.
Abs.

frec.
Esperada
7
13

P Lci
6
10
3
0
1

0
0,32562
0,81902
0,92798
0,96319

P Lcs
0,3256
0,819
0,928
0,9632
0,9782

P
P*n
0,3256
7
0,4934
10
0,109
2
0,0352
1
0,015
0

X2
0,1
0,1

suma
0,2
De la tabla Chi cuadrado tenemos que para 1 grados de libertad y =0.05 que X 2=3.8415 por lo
tanto como 3.8415>0.2 decimos que no hay evidencia de que la muestra no provenga de una
distribucin Log-Normal de tres parmetros.

3.- Prueba de Kolmogorov-Smirnov


3.1.- Distribucin Normal
LCi
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
64,56
219,735
374,91
530,085
685,26

LCs
142,1475
297,3225
452,4975
607,6725
762,8475

Frec.
Fre. Rel.
intervalo
obser.
Obs.
F.R.O.A F.R.E
delta
[0;142,1]
6
0,3
0,3 0,28688038 0,01311962
[142,1;297,3]
10
0,5
0,8 0,69884576 0,10115424
[297,3;452,5]
3
0,15
0,95 0,94571885 0,00428115
[452,5;607,7]
0
0
0,95 0,99640909 -0,04640909
[607,7;762,8]
1
0,05
1
0,999919 8,1005E-05

El estimador K-S =0.101 y el entregado por tabla para 20 datos y =0.05 es de 0.294 por lo tanto
los datos de la muestran siguen una distribucin normal.

3.2.- Distribucin Log-Normal


C
0
142,1475
297,3225
452,4975
607,6725

Int. Clase
64,56
219,735
374,91
530,085
685,26

LCs
142,1475
297,3225
452,4975
607,6725
762,8475

Frec.
Fre. Rel.
Intervalo
obser.
Obs.
F.R.O.A F.R.E
delta
[0;142,1]
6
0,3
0,3 0,06418769 0,23581231
[142,1;297,3]
10
0,5
0,8 0,06483727 0,73516273
[297,3;452,5]
3
0,15
0,95 0,06520922 0,88479078
[452,5;607,7]
0
0
0,95 0,06547135 0,88452865
[607,7;762,8]
1
0,05
1 0,06567408 0,93432592

El estimador estimado K-S=0.9343 y el entregado por tabla para 20 datos es de 0.294 as podemos
decir que los datos no siguen una distribucin Log- Normal.

3.3.- Distribucin Log-Normal de tres parmetros.

LCi
0
142,1475
297,3225
452,4975
607,6725

Int.
Clase
64,56
219,735
374,91
530,085
685,26

LCs
142,1475
297,3225
452,4975
607,6725
762,8475

intervalo
[0;142,1]
[142,1;297,3]
[297,3;452,5]
[452,5;607,7]
[607,7;762,8]

Frec.
obser.
6
10
3
0
1

Fre. Rel.
Obs.
F.R.O.A Z
F.R.E
delta
0,3
0,3 -0,46532618 0,32084894 -0,02084894
0,5
0,8 0,76805419 0,7787725
0,0212275
0,15
0,95 1,49347971 0,93234417 0,01765583
0
0,95 2,00928121 0,97774634 -0,02774634
0,05
1 2,40983231 0,99202007 0,00797993

El estimador estimado K-S=0.027 y el entregado por tabla para 20 datos es de 0.294 as podemos
decir que los datos siguen una distribucin Log- Normal de tres parmetros.

Las otra distribuciones no se les realiz la prueba K-S est diseado para muestras que siguen una
tendencia normal, Log-Normal, Weibull, Exponencial y Logstica.

Al realizar las cuatro pruebas de bondad de ajuste la Distribucin que mejor representa a los datos
es la Log-Normal de tres parmetros, debido a que es una de las que se ajusta mejor a los grficos,
adems la diferencia entre el valor observado y esperado en el test Chi cuadrado es cero y
tambin cumple con la prueba K-S.

4.- Clculo de caudal para 5, 10, 20, 50 y 100 aos de retorno.


4.1.-Periodo de retorno 5 aos

Se Estimara el caudal a partir de la distribucin Log-Normal de 3 parmetros debido a que era la


que mejor representa a la muestra.
(

Por tabla tenemos que Z=0.84 para la probabilidad de ocurrencia.


(

Despejando el caudal tenemos que

Resumiendo presentamos la siguiente tabla con los resultados para distinto periodo de retorno.

Periodo de retorno

Probabilidad de excedencia

Probabilidad de ocurrencia

5
10
20
50
100

0,2
0,1
0,05
0,02
0,01

0,8
0,9
0,95
0,98
0,99

0,84
1,28
1,645
2,055
2,33

Caudal medio anual


mximo para un
periodo
de retorno t (m/seg)
310,1
400,2
493,6
623,7
729,1

You might also like