You are on page 1of 84

CAPITULO I

CONCEPTOS BASICOS

1. Introduccin.
La estadstica es la ciencia dedicada a la recoleccin, presentacin y
caracterizacin de la informacin con el objeto de analizar y tomar decisiones. La
estadstica se utiliza en diferentes especialidades de la ciencia como Minera,
Geologa, Agronoma, Economa, Ambiental, etc.
1.1. Individuo.- Cualquier elemento que porte informacin sobre el fenmeno que
se estudia. Por ejemplo, si estudiamos la estatura de los alumnos de una
clase, cada alumno es un individuo; si estudiamos el precio de la vivienda,
cada vivienda es un individuo. El individuo constituye una unidad elemental.
1.2. Poblacin.- Conjunto de todos los individuos (personas, objetos, animales,
etc.) que porten informacin sobre el fenmeno que se estudia.
Ejemplos:
1. El conjunto de todos los alumnos de la UNASAM.
2. El conjunto de todas las personas que viven en el distrito de Huaraz.
3. El conjunto de la estatura de todos los alumnos de la FIMGM.
1.3. Muestra.- Es un subconjunto que seleccionamos de la poblacin. As, si se
estudia el precio de la vivienda de una ciudad, lo normal ser no recoger
informacin sobre todas las viviendas de la ciudad (porque sera una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que sea
lo suficientemente representativo.
Al proceso de obtencin de una muestra se llama muestreo. Para que una
muestra sea representativa debe cumplir con las siguientes condiciones:
a. Debe haber sido obtenido al azar o en forma aleatoria.
b. Su tamao y sus elementos deben haber sido seleccionados aplicando un
mtodo de muestreo.
1.4. Variable.
Son las caractersticas que se desean evaluar en las unidades elementales.
Ejemplos:
1. X = Talla de los alumnos de una Universidad.
2. Y = Numero de cocinas vendidas al mes.
3. Z = Nivel de ingreso mensual de los trabajadores de la UNASAM.
4. W = Sexo de los alumnos.
Se representa generalmente por las ltimas letras maysculas del alfabeto,
por ejemplo: X, Y, Z, W, P, T o tambin X1, X2, X3,.. etc.
1.5. Tipos de Variables.
1.5.1. Variables Cuantitativas.
Son aquellas cuyas observaciones pueden expresarse en forma
numrica y con las cuales se puede realizar operaciones matemticas.
Ejemplo:
1. X = Estatura de los alumnos en cm.
2. Y = Numero de inasistencias en el mes.
Adems las variables cuantitativas se pueden clasificar en:
1. Variable cuantitativa contina.
Son aquellas que pueden asumir cualquier valor numrico dentro
de un intervalo continuo dado. Generalmente son representados
por el conjunto de nmeros reales. Las observaciones cuantitativas
continuas se obtienen utilizando instrumentos de medicin como:
test, escalas, balanzas, cronmetros, winchas, termmetros, etc.
Ejemplo:
1. X = Estatura de los alumnos en cm.
2. Y = Velocidad de los vehculos en Km/hora.
2. Variable cuantitativa discreta.
Son aquellos observaciones que cumplen la condicin de que entre
un valor cualquiera y su consecutivo no es posible que existan
valores intermedios. Generalmente son representados por el
conjunto de nmeros enteros. Las observaciones cuantitativas
discretas se registran por conteo.
Ejemplo:
1. X = Nmero de clientes atendidos cada 5 minutos en una
ventanilla.
2. Y = Numero de inasistencias en el mes en das.

1.5.2. Variables Cualitativas.


Son aquellas observaciones que permiten que una unidad elemental
(individuo) puede ser clasificada como poseedora o no de cierta
cualidad, propiedad o atributo. No tiene sentido de realizar
operaciones matemticas.
Ejemplo:
1. X = Vivienda propia o alquilada.
2. Y = Calificacin de un examen con niveles A, B, C y D.
Adems las variables cualitativas se pueden clasificar en:
1. Variable cualitativa nominal.
Son aquellos cuyos valores (cualidades, propiedades o atributos)
no son factibles de ser clasificados a travs de un criterio de orden
o jerarqua.
Ejemplo:
1. X = Sexo de los estudiantes.
2. Y = Condicin de ciertas viviendas (propia o rentada)
2. Variable cualitativa jerrquica.
Son aquellos donde s se puede establecer un criterio de orden y
jerarqua entre sus atributos.
1. X = Niveles socio econmicos de los habitantes de una ciudad.
2. Y = Calificacin de un examen con niveles A, B, C y D.
1.6. Observacin.
Es el valor especfico que toma una variable. A las observaciones se les suele
representar con las letras minsculas sub indicadas, como por ejemplo Xi, Yi,
Zi, Vi, etc.
Ejemplo:
1. X4 = 170. Quiere decir que el alumno 4 mide 170 cms.
2. Y11 = 21. Quiere decir que en el mes nmero 11 se vendieron 21 cocinas.
3. T200 = Primaria. Quiere decir que la persona nmero 200 de Huaraz tiene
instruccin primaria.
1.7. Parmetro.
Es una medida usada para describir el comportamiento de una variable en la
poblacin. El parmetro es una constante, por ello, las decisiones basadas
en esta informacin carecen de incertidumbre.
Los parmetros ms conocidos son: la Media (), la mediana (Me), la moda
(Mo), la varianza (2), proporcin (), etc.
Ejemplo:
1. = 15.4. Supone que el promedio de cocinas vendidas en todos los
meses.
2. En todo Huaraz se tienen las siguientes proporciones de instruccin.
Instruccin Proporcin ()
Primaria 0.455
Secundaria 0.445
Superior 0.100
TOTAL 1.000

1.8. Estadstico o Estadgrafo.


Es una medida usada para describir el comportamiento de una variable en la
muestra.
Debido a que sus valores varan de muestra a muestra, las decisiones
basadas en este tipo de informacin contienen cierto grado de incertidumbre.
Los estadsticos sirven para estimar a los parmetros.
Estimar consiste en considerar el valor del estadstico como si fuera el valor
del parmetro. Los estadsticos ms conocidos son: la Media (), la mediana
(me), la moda (mo), la varianza (S2), proporcin (p).
Notacin de los principales parmetros y estadsticos.
En una poblacin En una muestra
(Parmetro) (Estadstico)
Media
Mediana Me me
Moda Mo mo
Proporcin p
Varianza 2 S2
Desviacin Estndar S

1.9. Clasificacin de la Estadstica.


La estadstica se divide en dos grandes ramas de estudio que son:
1. La estadstica descriptiva, la que se encarga de la recoleccin,
clasificacin y descripcin de datos mustrales o poblacionales, para su
interpretacin y anlisis.
2. La estadstica matemtica o inferencial, que desarrolla modelos
tericos que se ajusten a una determinada realidad con cierto grado de
confianza.

Estas dos ramas no son independientes; por el contrario, son


complementarias y entre ambas dan la suficiente ilustracin sobre una
posible realidad futura, con el fin de que quien tenga poder de decisin, tome
las medidas necesarias para transformar ese futuro o para mantener las
condiciones existentes.

CAPITULO II
ORGANIZACIN DE DATOS.
2. Introduccin.
Despus de recoger toda la informacin correspondiente a la investigacin,
mediante una encuesta, es decir, una vez terminado el trabajo de campo, nos
encontramos con un conjunto de datos y cifras desordenadas los cuales, al ser
tomados como observaciones individuales, dicen muy poco sobre la poblacin
estudiada; es entonces, la tarea del investigador hacer hablar las cifras,
comenzando por la clasificacin y ordenacin, consignando la informacin en
tablas inteligibles a la que denominamos tabla o distribuciones de frecuencias.
2.1. Tablas de Frecuencias.
Son cuadros estadsticos que contienen los valores observados x1, x2, x3,
x4,.xk de la variable X (distribucin) con sus respectivas frecuencias
(distribucin de frecuencias). Dependiendo de la naturaleza de la variable en
estudio las tablas reciben el nombre de distribucin numrica o cuantitativa y
distribucin categrica o cualitativa. Son tiles porque permiten organizar la
informacin (datos no procesados) de forma tal, que se puede reconocer el
comportamiento de los datos. En el caso de la variable cuantitativa continua
presentan el inconveniente de una perdida de informacin, la cual es muy
pequea en relacin a las ventajas que proporciona.
Ejemplo:
El Gerente-propietario recoge la informacin respecto a la variable salario
diario de sus 50 operarios y la relaciona en la tabla No 1.
Tabla N 01
SALARIO DIARIO DE 50 OPERARIOS EN UNA FABRICA DE CONFECCIONES
N Operario $/Dia N Operario $/Dia N Operario $/Dia N Operario $/Dia N Operario $/Dia
1 52 11 54 21 55 31 56 41 52
2 54 12 51 22 55 32 53 42 57
3 55 13 54 23 52 33 57 43 56
4 54 14 55 24 55 34 54 44 51
5 53 15 54 25 53 35 53 45 58
6 56 16 56 26 57 36 50 46 55
7 54 17 52 27 54 37 55 47 53
8 58 18 54 28 55 38 52 48 54
9 51 19 53 29 53 39 53 49 53
10 54 20 55 30 55 40 54 50 56

Tabla N 02

SALARIO DIARIO DE 50 OPERARIOS EN UNA FABRICA DE CONFECCIONES


$/Dia $/Dia $/Dia $/Dia $/Dia
52 54 55 56 52
54 51 55 53 57
55 54 52 57 56
54 55 55 54 51
53 54 53 53 58
56 56 57 50 55
54 52 54 55 53
58 54 55 52 54
51 53 53 53 53
54 55 55 54 56
Tabla N 03

DATOS CLASIFICADOS Y ORDENADOS


SALARIO DIARIO DE 50 OPERARIOS EN UNA FABRICA DE CONFECCIONES
$/Dia $/Dia $/Dia $/Dia $/Dia
50 53 54 55 56
51 53 54 55 56
51 53 54 55 56
51 53 54 55 56
52 53 54 55 56
52 53 54 55 57
52 53 54 55 57
52 53 54 55 57
52 54 54 55 58
53 54 54 55 58

Tabla N 04
DISTRIBUCION DE FRECUENCIAS DEL
SALARIO DE 50 OPERARIOS
$/Dia CONTEO FRECUENCIA
50 l 1
51 lll 3
52 lllll 5
53 lllll llll 9
54 lllll lllll ll 12
55 lllll lllll 10
56 lllll 5
57 lll 3
58 ll 2
SUMA 50

Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y
el ordenamiento y agrupamiento de la tabla No. 4.
Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbologa:
N: El tamao de la muestra, es el nmero de observaciones.
Xi : La variable; es cada uno de los diferentes valores que se han observado.
La variable xi, toma los x1, x2... xn valores.
fi: La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se
repite la variable Xi; as f1, es el nmero de veces que se repite la observacin x1, f2 el
nmero de veces que se repite la observacin x2, etc.
fa: La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.
fr: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por
el tamao de la muestra.
fra: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre
el tamao de la muestra.
Tabla N 05
Tabla de Distribucin de Frecuencias.
Frecuencia Frecuencia Frecuencia
Variable Frecuencia Acumulada Relativa Relativa Acum.
Xi fi fa fr fra
x1 f1 f1 f1/n f1/n
x2 f2 f1+f2 f2/n (f1+f2)/n
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
xi fi f1+f2+..fi fi/n (f1+f2+ +fi)/n
. . . . .
. . . . .
xn fn fi+f2+..fn fn/n (f1+f2+ +fn)/n
n 1

Tabla N 06
Tabla de Distribucin de Frecuencia del Salario Diario de 50 Operarios
Frecuencia Frecuencia Frecuencia
Variable Frecuencia Acumulada Relativa Relativa
Xi fi fa fr Acum.
50 1 1 0.02 0.02
51 3 4 0.06 0.08
52 5 9 0.10 0.18
53 9 18 0.18 0.36
54 12 30 0.24 0.60
55 10 40 0.20 0.80
56 5 45 0.10 0.90
57 3 48 0.06 0.96
58 2 50 0.04 1.00
50 1.00
Anlisis:
Analizando las columnas porcentuales fr y fra se obtienen, entre otras las
siguientes conclusiones:
Slo el 4% de las obreras gana el mximo salario/da de la fbrica, el
cual corresponde a $58.000.00.
El salario diario mnimo ($50.000.00) lo gana nicamente una obrera,
lo que constituye el 2% del personal asalariado.
El 62% de las operarias tiene un salario diario entre $53.000.00 y
$55.000.00.
El 60% de las obreras tiene un salario/da de $54.000.00 o menos.
El 64% tiene un ingreso/da de $54.000.00 o ms.
2.2.

CAPITULO III
MEDIDAS DE POSICION

ESPACIO MUESTRAL (S)

Es el conjunto de todos los posibles resultados de un experimento. Aun cuando en


un experimento, no es posible determinar con seguridad su resultado, se puede s,
definir con precisin un listado de los resultados posibles de ocurrir. Esta lista
constituye el espacio muestral, y se designa como S.

Ejemplos:

1. Si el experimento consiste en lanzar una moneda, los resultados posibles son


sello o cara, luego:
S = {sello, cara}
Ns = 2
Ns: nmero posible de resultados del espacio muestral.
2. Si el experimento consiste en lanzar un dado, el espacio muestral ser:
S = {1, 2, 3, 4, 5, 6}
Ns = 6
3. Si el experimento consiste en lanzar 2 dados, el espacio muestral, de la suma
de los resultado ser:
S = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Ns = 11

EVENTOS
Son los resultados posibles que se puedan presentar en la realizacin de un
experimento.

Es un subconjunto del espacio muestral.

Ejemplos:

1. En el experimento de lanzar una moneda: El evento A, que salga cara es:


A = {cara}
NA = 1
NA: nmero posible de resultados del experimento.
2. En el experimento lanzar un dado: El evento B; que salga un nmero mayor
o igual que 3, es:
B = {3, 4, 5, 6}
NB = 4
3. En el experimento, lanzar dos dados: El evento C, que salga la suma 7, es:
C = {(1,6), (6,1), (2,5), (5,2), (4,3), (3,4)}
Nc = 6

1.3 DEFINICIN CLSICA DE PROBABILIDAD

La probabilidad P(A), de un evento A, en un experimento aleatorio que tiene Ns


resultados iguales posibles, y de los cuales NA, son resultado favorable, est dada
por:

() = .. (1)

Ejemplos:

1. El arrojar una moneda, la probabilidad de que salga sello, es:


1
P=2
2. Al arrojar un dado, hay seis casos igualmente posibles, la probabilidad de
que salga un nmero igual o mayor que 3 es:
4 2
P=6=3
3. Al arrojar dos dados, hay 36 casos igualmente posibles, la probabilidad de
que la suma de los resultado sea 7, es:
6 1
P = 36 = 6
4. En una serie de dos bolas rojas y ocho bolas negras, hallar la probabilidad
que al extraer una bola, esta sea de color rojo.
De los 10 casos igualmente probables, en 2 casos suceder el evento que
se considera, por lo que se tendr:
2 1
P = 10 = 5
En el concepto clsico de probabilidad solo se puede aplicar en experimentos
en los que hay un nmero finito de casos igualmente posibles. Pero en la
naturaleza, los principales problemas prcticos no son de este tipo.

1.4 DEFINICION AXIOMATICA DE PROBAILIDAD

Sea S un espacio muestral asociado a un experimento, y A cualquier suceso de S


(A subconjunto de S). Se dice que P es una funcin de probabilidad en el espacio
muestral S, si se satisfacen los siguientes tres axiomas:

1. 0 P(A) 1, para todo A S


2. P(S) = 1
3. Si 1 , 2 , , es una serie de sucesos, mutuamente excluyentes,
entonces:
P (1 U 2 U 3 U.U ) = P (1 ) + P (2 ) + + P ( )

De estos axiomas se deducen los siguientes teoremas:

1. P() = 0
2. P ( ) = 1 P(A), donde es el complemento de A.

PROBABILIDAD DE LA UNION DE SUCESOS

Si A y B son eventos cualesquiera en un espacio muestral S, entonces:

( ) = () + () ( ) (2)

PROBABILIDAD CONDICIONAL

Si A y B son dos eventos en los cuales () 0, entonces, la probabilidad


condicional de que ocurra el suceso B, dado que sucedi A, se define por:

( )
(/) = . (3)
()

1.5 VARIABLES ALEATORIOS

Es una funcin X, definida sobre un espacio muestral S, que asigna un valor a esta
variable, correspondiente a cada punto (resultado) del espacio muestral de un
experimento

A una variable aleatoria, se le conoce tambin como variable estocstica, sus


valores son nmeros reales, que no pueden predecirse con certeza antes de ocurrir
el fenmeno, es decir, ocurren al azar
1.5.1 CLASES DE VARIABLES ALEATORIAS

1. Variable aleatoria discreta

Se dice que una variable aleatoria X es discreta. Cuando sus valores se restringen
a un conjunto enumerable finito o infinito.

Ejemplo: Nmero de das de lluvias ocurridas en los meses de un ao cualquiera.

Representacin Grafica
Nmero de das

E F M A D Meses

2. Variable aleatoria contina

Se dice que una variable aleatoria X es continua cuando sus valores se encuentran
en un rango continuo y puede ser representado por cualquier nmero entero o
decimal.

Ejemplo: El caudal diario registrado en una estacin de aforo


Caudal Q

1 2 3 4 5 6 . 31 das

La mayora de secuencias de variables geolgicas son series continuas, de


variables continuas. Sin embargo, para propsitos prcticos, una variable discreta
puede tratarse arbitrariamente como continua, ajustndose a una funcin continua,
o bien, una continua como discreta, dividiendo stas en intervalos y agrupndolas
en nmeros discretos.
CAPITULO III

MEDIDAS DE LAS DISTRIBUCIONES.

3. MEDIDAS DESCRIPTIVAS DE LAS DISTRIBUCIONES DE FRECUENCIAS.


Para describir ciertas caractersticas de un conjunto de datos, se pueden usar
nmeros simples, llamados estadsticos. De ellos se puede obtener un
conocimiento ms preciso de los datos que el que se obtiene a partir de las tablas
y los grficos.
Las caractersticas ms importantes de este conjunto de datos son:
3.1 Medida de tendencia central o medidas de localizacin.
Indican cual ser el punto medio o localizacin central. En la fig.1 la curva A
queda a la izquierda de los puntos medios de las curvas B y C, las cuales
tienen la misma localizacin central.

Curva B
Curva A

Curva C

Figura 1.Comparacion de la localizacin central de tres curvas

3.2 Medidas de dispersin.


Se refiere a la forma como se encuentran esparcidas las observaciones. En
la fig. 2, se observa que la curva B tiene una mayor separacin o dispersin
que la curva A.

Curva B
Curva A

Figura 2.Comparacin de la dispersin de dos curvas


3.3 Medidas de simetra y asimetra.
Las curvas que representan los datos puntuales de un conjunto pueden ser
simtricas o asimtricas. Las curvas simtricas, como la que se muestra en
la fig. 3, son las que al trazar una lnea vertical desde el pico de la curva al
eje horizontal dividen su rea en dos partes iguales, cada una idntica a la
otra.

Figura 3.Curva simtrica

Las curvas asimtricas o sesgadas, como las que se muestran en la fig. 4


son aquellas en las cuales la distribucin de frecuencia se concentra en el
extremo inferior o superior de la escala de medida sobre el eje horizontal.
Los valores no se distribuye igualmente, por lo que pueden ser sesgadas a
la derecha (curva A) y sesgadas a la izquierda (curva B).

Curva A

Curva B

Figura 4.Curvas segadas, A: sesgo a la derecha o positivo


B: sesgo a la izquierda o negativo
3.4 Medidas de achatamiento o curtosis.
Indican el grado de llanura de la curva. Por ejemplo en la fig. 5, las curvas A
y B tienen la misma localizacin central, y la misma dispersin, pero difieren
por el hecho que una es ms puntiaguda que la otra, por lo que tienen
diferente grado de curtosis.
Curva A

Curva B

Figura 5. Curvas con diferente curtosis


De acuerdo al grado de achatamiento, las curvas pueden ser segn fig. 6
Mesocrtica (curva A), Leptocrtica (curva B) y Platicrtica (curva C)

Curva A (Mesocrtica)
Curva B (Leptocrtica)

Curva C (Platicrtica)

Figura 6. Grados de achatamiento

2.2 MEDIDASD DE TENDENCIA CENTRAL.

Se define una medida de tendencia central como un ndice de localizacin central


empleado en la descripcin de las distribuciones de frecuencias.

En trminos generales se tienen tres medidas: la media, la mediana y la moda.

2.2.1 Media aritmtica

Dada la muestra compuesta de n datos, X1, X2, X3,Xn; la media, se


define como la suma algebraica de ellas, dividida entre el nmero de datos. Cuando
se calcula la media para una poblacin, esta se denota por y cuando se trata de
una muestra, por .

Media aritmtica de datos no agrupados

Matemticamente la media de los datos no agrupados se representa por:



=1
= (1)



= =1 (2)

Donde:

: media poblacional

: Media muestral

Xi: valor i-simo de la muestra

n: nmero de datos de la muestra o poblacin

Media aritmtica de datos agrupados

Para el caso de datos agrupados, la frmula es:



= =1 (3)

Donde:

fi: frecuencia absoluta (nmero de observaciones) en el intervalo i

Xi: marca de clase del intervalo i

k: nmero de intervalos de clase

n: nmero de observaciones de la muestra

2.2.2 Media ponderada

El promedio ponderado permite calcular un promedio que toma en cuenta la


ponderacin de los datos con respecto a un factor, es casi, un caso particular de la
frmula del clculo de la media para los datos agrupados, su frmula es:


= =1

..(4)
=1

Donde:

: Media ponderada

xi: valor i-simo de la muestra

fi: valor del factor de ponderacin del i-simo valor de la muestra

n: nmero de observaciones de la muestra


La media ponderada, se utiliza por ejemplo para el clculo de las notas promedio
de un alumno, donde para cada valor de notas, el factor de ponderacin es el
crdito o peso del curso, as:

.
= =1

=1

Dnde:

: Notas promedio

Pi: valor de las notas promedio del alumno i

Ai: Numero de crditos del alumno i

n: nmero de notas

2.2.3 Media geomtrica

Dada la muestra compuesta de n datos, X1, X2, X3,Xn, la media


geomtrica se define como la raz n-sima, de la productoria de los datos, es
decir:

= (=1 )1/ (5)

Donde:

: Media geomtrica

=1 : X1*X2* .* Xn (productoria de los datos)

Xi: i-simo valor de la muestra

n: nmero de elementos de la muestra

2.2.4 Mediana

Es un valor nico de un conjunto de datos que mide al elemento central en los datos.

Este nico elemento de los datos ordenados es el ms cercano a la mitad o el ms


central en el conjunto de nmeros. La mitad de los elementos quedan por encima
de ese punto y otra mitad por debajo de l.

Mediana para datos no agrupados

Sean X1, X2, X3,Xn, datos ordenados por magnitud creciente o


decreciente y nmero impar de datos, la mediana (Med) es el dato situado en el
centro, es decir:
+1
= , n impar (6)
2

Si n es par, la mediana es el promedio de los nmeros centrales, es decir:


+
+1
= 2 2
, n par (7)
2

Mediana de datos agrupados

Siendo la mediana el valor de la observacin central de un arreglo y como no se


conocen los valores de cada observacin en datos agrupados, la mediana se
suele aproximar, despus de localizar el intercalo de clase de la mediana, por la
siguiente ecuacin
+1
(+1)
= [ 2
] + (8)

Donde:

Med: mediana muestral

n: nmero total de elementos de la muestra

F: suma de todas las frecuencias hasta la clase de la mediana pero sin


incluirla

fm: frecuencia nicamente de la clase de la media

w: amplitud del intervalo de clase

Lm: lmite inferior

En general la clase donde se encuentra la mediana es aquella que tiene al


elemento situado en la porcin (n+1)/2

2.2.5 Moda

Es aquel valor que se repite ms frecuentemente en un conjunto de datos, se denota


por Mo.

Para datos agrupados en intervalos de clase, la moda, una vez determinada la clase
modal se calcula con la siguiente ecuacin:
1
= + 1+2 (9)

Donde:
di: diferencia entre la frecuencia de la clase modal y la premodal (clase
anterior)

d2: diferencia entre la frecuencia de la clase modal y la postmodal (clase


siguiente)

w: amplitud del intervalo de clase

Lm: limite inferior de la clase modal

En general la clase modal es aquella que tiene la mxima frecuencia

2.2.6 comparacin entre la media, la mediana y la moda

La media, la mediana y la moda de una distribucin de frecuencias son


consideradas cono tres promedios ms importantes. Sin embargo, no son
igualmente aplicables y representativos a todas las situaciones. Como se muestra
en la fig. 7 las posiciones relativas de estas tres medidas dependen de la simetra
de la distribucin.

Si la distribucin es simtrica (fig. a), las tres medidas de tendencia central tienen
valores idnticos.

Si la distribucin es asimtrica (fig. b y c), los tres valores divergen, aunque siempre
para una distribucin unimodal, la moda est localizada en su punto ms alto y la
mediana esta ente la media y la moda.
Media
median
moda
a moda median
a Media

(a) (c)

median
a moda
Media

(c)

Figura 7. Localizacin de la media, mediana y moda


2.3 MEDIDAS DE DISPERSION.

Las medidas de dispersin o variabilidad permiten observar cmo se reparten o


dispersan los datos a uno y otro lado del centro. Si la dispersin es poca, indica gran
uniformidad de los datos en la distribucin. Por el contrario, gran dispersin indica
poca uniformidad.

2.3.1 Rango

Es una medida de distancia y representa la diferencia entre el mayor y el menor de


los valores observados, es decir:

R = Max Min (10)

Donde:

R: rango

Max: valor mximo de los datos

Min: valor mnimo de los datos


El rango o la amplitud es una manera conveniente de describir la dispersin, sin
embargo, no da medida alguna de la dispersin ente los datos con respecto al valor
central.

2.3.2 Varianza

Datos no agrupados:

La varianza poblacional (2), se define como la suma de cuadrados de las


desviaciones, de los datos con respecto a la media, dividida entre el nmero total
de datos, es decir:

=1()
2
2 = (11)

La varianza muestral (S2), se obtiene dividiendo la suma de cuadrados de las


observaciones de los datos con respecto a la media, entre el nmero total de
datos menos uno, es decir:

=1( )
2
2 = (12)
1

Para el clculo computacional es til expresar la sumatoria de la siguiente forma:

( )2 = ( 2 2 . + 2 )

2 2 () + 2 (13)

Pero:

= = (14)

Luego, sustituyendo (14) en (13), resulta:

( )2 = 2 2 () + 2

( )2 = 2 2 (15)

Sustituyendo (15) en (11), se tiene:


1
2 = (=1 2 2 )(16)

Y en (12) resulta:
1
2 = 1 (=1 2 2 ) (17)
Donde:

S2: varianza muestral

2= varianza poblacional

xi: valor i-simo de la muestra

=: media muestral o poblacional

n: nmero total de datos

Datos agrupados

Para el caso de datos agrupados en intervalos de clase, la varianza poblacional,


se define como la suma de los cuadrados de las desviaciones de las marcas de
clase con respecto a la media, por la frecuencia absoluta, dividido entre el nmero
total de datos, es decir:

2
=1() .
2 = (18)

Y la varianza muestral por:

2
=1( ) .
2 = (19)
1

Donde:

xi: valor de la i-sima marca de clase

=: media

fi: valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el intervalo


i

k: nmero de intervalos de clase

n: nmero total de datos

Para el clculo computacional, las ecuaciones (18) y (19), se pueden expresar:


1
2 = (=1 2 . 2 ) (20)

1
2 = 1 (=1 2 . 2 ) (21)

2.2.3 Desviacin Estndar


La desviacin estndar, se define como la raz cuadrada positiva de la varianza,
es decir:

= 2 (Poblacional)

= 2 (Muestral)

As se tiene, para datos no agrupados:

1
= (=1 2 2 ) (22)

1
= 1 (=1 2 2 ) (23)

Siendo:
1
= = =1 (24)

Para datos agrupados

1
= (=1 2 . 2 ) (25)

1
= 1 (=1 2 . 2 ) (26)

Siendo:
1
= = =1 . (27)

xi: valor de la i-sima marca de clase

= : Media

fi: valor de la i-sima frecuencia absoluta, es decir nmero de datos en el intervalo


i

k: nmero de intervalos de clase

n: nmero total de datos

2.3.4 COEFICIENTE DE VARIACION

Es una medida relativa de dispersin, que relaciona la desviacin estndar y la


media, es decir:

= (28)

Generalmente en geo estadstica se suele trabajar con datos mustrales.

2.4 MEDIDAS DE SIMETRIA Y ASIMETRIA

2.4.1 sesgo

El sesgo es el estadstico que mide la simetra y asimetra

Datos no agrupados:

El sesgo () para datos no poblacionales, se obtiene con la siguiente ecuacin:



= 33 (29)

Donde:

=1()
3
3 = (30)


1
= (( )2 )

=1


1
=

=1

El sesgo para datos mustrales, se obtiene con:


2
3
= (1)(2) 3 (31)

Donde:

=1( )
3
3 = (32)


1
= ( )2
1
=1


1
=

=1
Datos agrupados:

El sesgo ( ) para datos poblacionales, se obtiene con la siguiente ecuacin:


3
= 3

Donde:

3
=1()
3 = . (33)


1
= ( )2

=1

1
= =1

= marca de clase de intervalo i

= valor de la i-ensima frecuencia

K= nmero de intervalos de clase

n= nmero total de datos

El sesgo para datos mustrales, se obtiene con :


2
3
Cs = (1)(2) 3 (34)

Donde:

3
=1( )
M3 = (35)


1
= ( )2
1
=1

1
= =1

= marca de clase de intervalo i

= valor de la i-ensima frecuencia

K= nmero de intervalos de clase

n= nmero total de datos


2.5 MEDIDAS DE ACHATAMIENTO.

El grado de achatamiento se mide con el estadstico denominado coeficiente de


curtosis.

2.5.1 Curtosis

Datos no agrupados:

K = .. (36)

4
=1()
3 = . (37)


1
= ( )2
1
=1

1
= =1

El coeficiente de curtosis para datos mustrales se define como:


3 4
Ck = ( 1)(2)(3)4 . (38)


=1( )
4
M4 = (39)


1
= ( )2
1
=1

1
= =1

Datos agrupados

El coeficiente de curtosis (k) para datos poblacionales se define mediante la


siguiente ecuacin

K = 44

Donde

4
=1()
4= ........ (40)


1
= ( )2

=1

1
= =1

= marca de clase de intervalo i

= valor de la i-ensima frecuencia

K= nmero de intervalos de clase

n= nmero total de datos

El coeficiente de curtosis para datos mustrales, se define como:


3 4
Ck = ( 1)(2)(3)4 . (41)

Donde

4
=1( )
M4 = (42)


1
= ( )2
1
=1

1
= =1

Los clculos de los estadsticos de una serie de datos es por si laboriosa. Para la
simplificacin de los clculos, donde se requieren la determinacin de la media,
varianza, desviacin estndar, el coeficiente de variacin, coeficiente de variacin,
coeficiente de sesgo y coeficiente de curtosis.

2.6 EJEMPLO DE CLCULO

Dado los datos de precipitacin anual, en mm de la estacin, Mesapata, para el


periodo 1974-1986. Calcular su media, varianza, desviacin estndar, coeficiente
de variacin, coeficiente de sesgo y el coeficiente de curtosis.

AO PRECIPITACION AO PRECIPITACION
(mm) (mm)
1974 1418.60 1981 1441.50
1975 1527.30 1982 1133.20
1976 1108.60 1983 891.00
1977 1084.20 1984 1429.80
1978 1509.10 1985 1141.50
1979 1394.90 1986 1312.60
1980 1334.40

Solucin:

Los resultados que se obtienen, son los que se muestran:

SERIE

1418.60 1527.30 1108.60 1084.20 1509.10 1394.90 1334.40 1441.50


1133.20 891.00 1429.80 1141.50 1312.60

Numero de datos = 13

RESULTADOS

DATOS DATOS MUESTRALES


PROBLACIONALES
Media 1286,67 1286.67
Varianza 35214.73 38149.29
Desviacin estndar 187.66 195.32
Coeficiente variacin 0.15 0.15
Coeficiente sesgo -0.55 0.63
Coeficiente curtosis 2.20 3.12

2.7 PROBLEMAS PROPUESTOS

1. dadas las descargas medias del mes de mayo de un rio, en m3/seg.

AO Q m3/seg AO Q m3/seg
1971 3.99 1981 5.52
1972 2.96 1982 3.09
1973 1.79 1983 5.00
1974 1.55 1984 6.03
1975 2.48 1985 2.73
1976 2.61 1986 3.13
1977 2.27 1987 4.18
1978 1.86 1988 3.26
1979 2.07 1989 4.03
1980 2.70
Calcular la media, varianza, coeficiente de variacin, coeficiente de asimetra o
sesgo y coeficiente de curtosis.

Usar el proceso a pie y el proceso computacional.

2. si los datos del problema 1, se agrupan en los intervalos de clase que se


muestran calcular la media, varianza, coeficiente de variacin, coeficiente de
asimetra o sesgo y coeficiente de curtosis.

INTERVALOS DE MARCA DE
CLASE CLASE
1- 2 1.5
2 -3 2.5
3 -4 3.5
4 -5 4.5
56 5.5
6 -7 6.5

Usar el proceso a pie y el proceso computacional.

3. Se tiene una cuenca en la que se han instalado 8 pluvimetros. Las


precipitaciones promedio anuales registradas, en mm, para el periodo de 1970
1991 y las reas de influencia, en km2, de esas estaciones, se muestran en la
siguiente tabla.

ESTACION 1 2 3 4 5 6 7 8
AREA Km2 150 300 187 600 550 145 278 110
PRECIPITACION 2915 2563 3241 4017 5321 4621 5002 4932

Determinar la precipitacin promedio.


III. DISTRIBUCION DE FRECUENCIAS DE UNA MUESTRA

3.1 REPRESENTACION TABULAR Y GRAFICA DE LAS MUESTRAS

3.1.1 DEFINICIONES

En Geologa se trabaja con informacin de datos de muestreo, estas informaciones


pueden consistir en datos de leyes de cabeza de mineral, potencia de veta, precio
de los metales, etc.

Por lo general, se encuentra solo con una muestra de los datos de esa poblacin,
es decir nunca podemos disponer de la totalidad de los datos. Pero cuando estos
datos se organizan en forma compacta y fcil de utilizar, los gelogos pueden
disponer de una herramienta de gran utilidad, para tomar decisiones.

Existen muchas formas de clasificar los datos, una manera til es dividirlo en
categoras similares o clases y luego contar el nmero de observaciones que caen
en cada categora, lo que constituye una tabla de frecuencias o una distribucin de
frecuencias.

Para una muestra dada, se escoge un rango R, que contenga a todos los valores
de la misma. Se subdivide R en subintervalos que se llaman intervalos de clase; los
puntos medios de estos intervalos se denominan marcas de clase. Se dice que los
valores de la muestra en cada uno de los intervalos forma una clase. Al nmero de
valores en una clase se llama frecuencia de clase; su divisin en el tamao N de la
muestra es la frecuencia relativa de clase. Esta frecuencia considera como funcin
de las marcas de clase; se denomina funcin de frecuencias de la muestra, y se
denota con f(x). La funcin de frecuencias acumuladas de la muestra, se denota
como F(x), y se define como:

F(x) = () . (1)

3.1.2 PROCEDIMIENTO DE CLCULO

A continuacin se indica un procedimiento prctico, para el clculo de las


frecuencias y frecuencias acumuladas, la misma que se usara ms adelante para el
clculo de la distribucin de probabilidades empricas de datos agrupados en
intervalos de clase:

Procedimiento

1. Ordenar los datos de la muestra en forma creciente o decreciente puede


hacerse mediante el programa en Excel.
Por ejemplo, ordenando en forma creciente, se tiene:
Xmin, X2, X3,... ,Xmax
Donde:
Xmin = X1 es el valor mnimo de los datos
Xmax = XN es el valor mximo de los datos

2. Calcular el rango R de la muestra.


R = Xmax Xmin ( 2)

3. Seleccionar el nmero de intervalos de clase NC, este depende del tamao


de la muestra N. En aplicaciones de geologa, hidrologa el nmero de
intervalos de clase puede estar entre 6 y 25.
Yevjevich sugiere para seleccionar NC, las siguientes relaciones empricas:

(i) NC = 1.33 Ln(N) +1 (3)

(ii) Si N < 30 NC < 5

Si 30 < N < 75 8 NC 10

Si N > 75 10 < NC 30

Donde:

N : tamao de la muestra

Ln (N) logaritmo natural o neperiano del tamao muestral.


4. Calcular la amplitud de cada intervalo de clase x, segn la ecuacin:

max
x = = 1 . ( 4)
1

Al dividir el rango entre NC 1, lo que en realidad se hace es incrementar el


rango en x, incluyendo un intervalo ms, el mismo que resulta, de agregar
medio intervalo en cada extremo de la serie ordenada, a fin de que Xmin y
Xmax sern respectivamente, las marcas de clase de la primera y ltima clase.
Esto se aprecia en la figura 8.

Fig. 8: Representacin del total de la muestra en intervalos de clase


igualmente espaciados.

5. Calcular los lmites de clase de cada uno de los intervalos. Como se


manifest en 4, con el artificio de dividir entre NC-1 se logra que Xmin y Xmax
queden centrados y representan las marcas de clase de la primera y ltima
clase, entonces los lmites de clase inferior y superior del primer intervalo son
:
LCI1 = Xmin x/2 .. (5)
LCS1 = Xmin + x/2 = LCI1+x .. (6)

Los otros lmites de clase, se obtienen sumando la amplitud x, al lmite de


clase antecedente
6. Calcular las marcas de clase de cada uno de los intervalos. Las marcas de
clase se obtienen del promedio de los lmites de clase. As la marca de clase
del primer intervalo es :
1+1
1 = (7)
2
Con el artificio realizado anteriormente la marca de clase es igual al valor
mnimo, de igual forma la marca de clase del ltimo intervalo al valor mximo
es decir:
MCI = Xmin
MCn = Xmax
Las otras marcas de clase, se obtienen sumando la amplitud x, a las marcas
de clase antecedente.

7. Calcular la frecuencia absoluta, esta es igual al nmero de observaciones,


que caen dentro de cada intervalo definido por sus lmites de clases
respectivos, la misma que se obtiene por conteo, as se obtiene.
fabi = ni .. (8)
Donde:
fabi : frecuencia absoluta del intervalo i
ni : nmero de observaciones en el intervalo i
8. Calcular la frecuencia relativa fri de cada intervalo, esta es igual a la
frecuencia absoluta del mismo, dividido entre el nmero total de
observaciones, es decir:
fabi
fri = = . ( 9 )

9. Calcular la frecuencia relativa acumulada Fri, usando la frmula:

1
Fri = =1 = =1 = =1 . ( 10 )
Donde:
Fri: frecuencia relativa acumulada hasta el intervalo i.
J: 1, 2,..,i acumulacin de los intervalos hasta i
10. Calcular la funcin densidad emprica fi para cada intervalo. Esta funcin
segn Yevjevich, se calcula usando la frmula:


lim = = .. (11)
0

11. Calcular la funcin de distribucin acumulada o emprica usando la frmula:

= =1 (12)

3.1.3 EJEMPLO DE CLCULO

Dada la serie histrica de caudales medios anuales m 3/s (Tabla 3.1) de la


estacin Salinar del rio Chicama (Per) para el periodo 1911-1980, calcule
las frecuencias absolutas, relativas, acumulativas, funcin densidad, funcin
acumulada.

Tabla 3.1 Serie histrica de caudales medios anuales en m3/s del rio
Chicama. Estacin Salinar (1911-1980).
AO CAUDAL AO CAUDAL AO CAUDAL
M3/S M3/S M3/S
1911 7.91 1935 24.58 1959 22.88
1912 8.01 1936 28.49 1960 17.57
1913 13.27 1937 10.05 1961 14.60
1914 16.39 1938 28.01 1962 31.14
1915 80.83 1939 34.92 1963 18.20
1916 60.08 1940 31.36 1964 24.69
1917 21.55 1941 42.74 1965 22.99
1918 27.71 1942 12.94 1966 11.78
1919 28.63 1943 41.16 1967 32.26
1920 30.27 1944 35.90 1968 4.76
1921 33.43 1945 33.76 1969 12.70
1922 35.16 1946 29.28 19970 16.19
1923 27.21 1947 19.17 1971 30.14
1924 15.58 1948 29.37 1972 30.57
1925 64.81 1949 30.06 1973 45.38
1926 51.26 1950 9.67 1974 18.91
1927 33.48 1951 10.42 1975 34.99
1928 25.79 1952 23.99 1976 21.49
1929 25.80 1953 42.17 1977 29.26
1930 18.93 1954 16.00 1978 4.58
1931 16.15 1955 22.78 1979 12.46
1932 38.30 1956 32.69 1980 3.14
1933 54.54 1957 34.28
1934 59.40 1958 20.24

IV. ESTIMACION DE PARAMETROS:

Una funcin densidad emprica o una funcin de distribucin acumulada, pueden


escribirse como una funcin de variable aleatoria y en general como una funcin de
sus parmetros, as por ejemplo, la funcin densidad de la distribucin normal, de
variable aleatoria X, es:

1 2
() = 12[()]
2
Donde:

= parmetro de localizacin

2 = parmetro de escala

Para que la funcin f(x), quede definida, debe calcularse los parmetros y 2 .
Como normalmente, no se conocen todos los valores de la variable aleatoria, la
estimacin de los parmetros, se realiza a partir de una muestra.

Sea las variables de una muestra:

X1, X2, X3,.., Xn

Y si estos se ajustan a una distribucin normal los parmetros y 2 se estiman


a partir de:

=1
= =

2
=1( )2
2
= =

Donde:

: Es el estimador de la

: Es el estimador de 2.

Cualquier estimado desde la muestra es dominado un estimado o estimador de los


parmetros poblacionales.

4.1 DEFINICION DE ESTIMADORES.

Dada una funcin de distribucin con parmetros , , ,, se llaman


estimadores a los valores a, b, c,, a partir de los estadsticos de la muestra que
se supone que pertenece a la poblacin que se pretende caracterizar.

La bondad de estos estimadores est dado por diferencias (-a), (-b), (-c), etc.
pero como es fcil intuir hay infinitas posibilidades para a, b, c por lo tanto se
consideran como mejores estimadores aquellos que se aproximan ms a los
valores poblacionales y se llaman , , ,

Los estimadores se clasifican como:

Sesgado si:
E(a)=

Insesgado si:

E(a)= + v ()

Dnde: v () = E(a) es el sesgo.

Eficiente si:

El estimador es insesgado y adems:

VAR(a) =E (a-)2

Consistente si:

El tamao muestral N es largo

En geologa, se requiere principalmente que los estimadores sean insesgados y


eficientes, cuando se requiere extraer la mxima informacin desde los datos
mustrales.

3.5 METODOS DE ESTIMACION DE PARAMETROS.


Para determinar los valores numricos de los parmetros en distribucin
terica, a partir de los datos mustrales, se utilizan varios mtodos de
estimacin, siendo en orden ascendente de menor a mayor eficiencia:

Grafico

Mnimo cuadrado

Momentos

Mxima verosimilitud

3.5.1 METODO GRAFICO


Consiste en plotear los valores de la distribucin emprica sobre un
papel especial, donde la distribucin terica asignada apriori, se puede
representar con una lnea recta y de all estimar los parmetros
buscados.

As:

El papel de probabilidades normal, representa la distribucin normal como


una lnea recta.
El papel de probabilidades log-normal, representa la distribucin log-normal
es como una lnea recta.

El papel de probabilidades extremas, representa la distribucin gumbel


como una lnea recta

Por ejemplo para determinar los estimadores de y por medio de una muestra
dada correspondiente a una poblacin normal, hacer lo siguiente:

1. Plotear los valores de la distribucin emprica de la muestra.

2. Dibujar una muestra k se aproxime a los puntos, tanto como sea posible.

3. Calcular el valor correspondiente para una posibilidad de 50% este valor es ,


el cual es un estimador .

4. Calcular el
valor para una posibilidad del 84.13% el mismo k corresponde a +S, es decir.

+ = 2 = 2

es un estimador de .

4.2.2 METODO DE MINIMOS CUADRADOS

Este, mtodo ms aplicable para la estimacin de los parmetros de una ecuacin


de regresin.

Por ejemplo, dada la recta de regresin lineal:

Y = a + bX

Donde a y b son parmetros

El error entre el valor observado i y el terico es:


=

Y la suma de los cuadrados de los errores de los valores observados es:


= 2 = ( )2
=1 =1

Esta suma puede minimizarse para a y b, esto se consigue derivando


parcialmente S en funcin de cada estimando a y b, e igualando a cero, es decir:

= 2 =1( ) = 0 (1)

= 2 =1 ( ) = 0 (2)

Las ecuaciones (1) y (2) se denominan ecuaciones normales, las cuales resueltas
dan para a y b.

( )( )

= 2 =
( ) ( )2
2


= =

4.2.3 MOMENTOS DE LOS MOMENTOS

El principio bsico de la estimacin por el mtodo de los momentos es establecer


para cada funcin de distribucin la relacin entre los parmetros y momentos
centrales, de tal manera que:

= 1 ( , +1 , )

= 2 ( , +1 , ) (3)

= 3 ( , +1 , )

Donde:

, , : Son parmetros de la funcin de distribucin

, , : Son momentos con respecto a la media, o momentos centrales de la


poblacin.
Como los momentos son estimados a partir de los momentos de la muestra como
estimadores sesgados o insesgados, el resultado que se obtiene ser a, b, c, o
, , , como estimadores sesgados o insesgados de los parmetros.

Cuando la distribucin de probabilidad, a la que se estiman los parmetros por


este mtodo es simtrica y particularmente si es normal, se puede demostrar que
este mtodo es un mtodo muy eficiente, pero cuando la distribuciones son
asimtricas y por lo tanto sesgadas, como sucede muy a menudo con la mayora
de las variables geolgicas e hidrolgicas, el utilizar este mtodo representa una
prdida de eficiencia en la estimacin:

Ejemplos:

1.- dada la funcin densidad de la distribucin normal:


1 2
() = 12[(1 )2 ] Para - < x <
22

Estimar los parmetros 1 , 2 , por el mtodo de momentos.

Solucin:

Sabemos que:

1) la media poblacional es igual al 1er momento respecto al origen, es decir:



= () = 1 = () (4)

2) la varianza 2 es igual al 2do momento con respecto a la media, es decir:



() = 2 = 2 = ( )2 () (5)

Sustituyendo f(x) en (4) resulta:


1 2
= 12[(1 )2 ]
2 2

1 2
= 12[(1 )2 ]
22
(6)

Haciendo:
1
= = 1 + 2 = 2 + (7)
2

Lmites: si x - y -

x + y +
Sustituyendo (7) en (6), se tiene:
1 2 2
=
22
(1 + 2 ) 2


1 2 2 2 (2 )2 2 2
= +
22 22

1 2 2 2 2 2
=
2
+
22
(8)

Calculo de:
2 2 2 2 2 2
= = + 0 (9)
2
Siendo () = 12()
2 2
() = 12() = 12 = f(y)

Dado que f(-y) =f(y), f(y) es una funcin par, por lo cual se tiene:
0
() = 0 ()

Luego (9), se escribe:


2 2
= 0 12 + 0 12
2
= 2 0 12 (10)

Haciendo

2 = = 12


2 = = = 2 12
2

Limites:

Para y = 0 t =0

y t

Luego (10) se convierte en:



= 2 0 12 2 12

= 0 12 12 dt

Aplicando la transformacin de Laplace:


1 1
( 2 + 1) (2)
= 1 =
(1/2)2+1 (1/2)1/2

1
Pero (2) = (propiedad de la funcin gamma)


= 1
2

= 2 . (11)

Calculo de B
2
= 12

0 2 2
= 12 + 0 12 . (12)

1 2
Donde () = 2
1 1 2
()2
() = () 2 = () 2 = ()

Luego: (12) se escribe



12 2 2
= + 12
0 0

B=0 (13)

Sustituyendo (11) y (13) en (8), resulta


1 2
= 2 + (0)
2 2

= 1 ( lo que indica que el primer parmetro 1 es igual a la media )


1
1 = =

Sustituyendo f(x) en (5) se tiene:

1 2
2
= 2 = ( ) 12[(1 )2 ]
22

Como = 2

1 2
2 = 2 = ( 1 )2 12[(1 )2 ]
22

Haciendo:
1
= = 1 + 2 = 2
2

Lmites: si x - y -

x + y

Luego:

1 2
2 = 2 2 2 1/2 2
22

2
2 2
2
= 2 1/2
22

2
Siendo f(Y)= 2 1/2 y f(-y)=f(y) (funcin par), por lo cual


() = 2 ()

Luego:

2
2 2
2
= 2 1/2
2 0

Haciendo:

2 = = 1/2 = 2 1/2

Limites.

Para y = 0 t =0

y t

Se tiene:

22 2

2
= 12
2 0 2 12

2 2
2
= 1/2 12
2 0

Aplicando transformacin de Laplace:


1
2
2 2 (2 + 1)
= .
2 (1/2)3/2
1
2
2 2 1/2(2)
= .
2 (1/2)3/2

Pero: r(1/2) = luego:

2
2 2
= .
2 (1/2)1/2

2 2
2 = . 2
2

2 = 2 2 ( el parmetro 2 es igual )

1
2 = 2 2 = ( )2
1

1
2 = ( )2
1
2. Dada la funcin densidad de la distribucin Poisson:

Para x= 0, 1, 2,
!

f(x)=

0 En otro caso

Calcular usando el mtodo de momentos:

El parmetro
La varianza

Solucin:

1. como X es una variable discreta:

= () = ()


=

=0



=
( 1)
=0

0
= +
=1 (1)
(1)

Pero (-1) = r(0) =

Pero:
0
= r(0) = =0
(1)

Luego:


=
( 1)
=1

1 2 3
= .( + + + )
0 1 2

2 3
= . (1 + + + )
1 2

Pero:

2 3
(1 + + + ) = (Por desarrollo de serie de Taylor)
1 2

Entonces:

Falta 88 y 89
4.2.4. METODO DE MAXIMA VEROSIMILITUD
Dada una funcin densidad de probabilidad.
(, , , , . )
Donde:
, , , . Son los parmetros que deben ser estimados.
Se define la funcin verosimilitud de la muestra, como la productoria:

L = f( , , , , )
=1

L = f( , , , , . ) (2 , , , , . ) . . ( , , , , . )

Siendo N el tamao de la muestra:

El mtodo de mxima verosimilitud, consiste en estimar , , g, a partir de la


muestra de tal manera que L sea mxima. Esto se obtiene por la diferenciacin
parcial de L con respecto a cada parmetro e igualando a cero.

Puesto que f(x) es no negativo, un valor mximo de L ser, en general positivo.


Como el logaritmo natural ln(L) es una funcin monotmicamente creciente de L,
esta tiene un mximo precisamente en los puntos en que L tiene un mximo. Por
lo tanto, se puede usar lnL en lugar de L, es decir:
N

L = f( , , , , ) = ln f( , , , , )
=1 =1

Este artificio, permite transformar una productoria a una sumatoria, donde:

a, b, c son estimadores de , , g,

Entonces el conjunto de ecuaciones de mxima verosimilitud es:


= 0; =0; = 0 ;

El mismo que tiene tantas ecuaciones como incgnitas.

Las propiedades de los estimadores calculados por el mtodo de mxima


verosimilitud, son:

Usualmente insesgado.
Si la eficiencia de estimadores existe para los parmetros , , g,, el
mtodo puede producirlos.
La solucin de la ecuacin de verosimilitud proporciona un estimador que
converge al valor poblacional cuando el tamao muestral tiende a infinito,
por lo que el estimador es consistente.

Ejemplos:

1. Dada la funcin densidad de la distribucin exponencial:



() = { > 0, > 0
0

Estimar el parmetro l, usando el mtodo de mxima verosimilitud.

Solucin:

Sea la funcin de verosimilitud:

L = f( , )
=1
Siendo: f( , ) =

Luego:

L =
=1

= ln( )
=1

= ln( + )
=1

= ln( )
=1

Derivando con respecto a l, se tiene:



= = [ ln( )] = 0

=1


1
( ) = 0

=1


1
= 0

=1 =1


1
=

=1


1 1
=

=1

1 1
= 1 =

=1
X
2. Dada la funcin densidad de la distribucin normal

1 1 [ / ]2
() = 2 1 2 < <
2 2

Estimar los parmetros 1 /2 , por el mtodo de mxima verosimilitud.


Solucin:
1. La funcin de verosimilitud es:

N
1 1 [ / ]2
L= 2 1 2

=1
2 2

2. Tomando ln:

1 1 [ / ]2
= ln( ) 2 1 2

=1
2 2


1 1 2
= ln (2 2 ) ( )
2 2
=1

1
= [ln(2 1 2 ) ()2 ]
2
=1

Derivando con respecto a 1 , 2 , resulta:

1 1 1
a) = =1 [ 2 2( )( )] = 0
2 2

1
=0
2
=1

1
( 1 ) = 0
2 2 =1

1 = 0
=1 =1

= 1
=1 =1

= 1
=1

1
1 = = X

=1

1 1
b) = =1 [ 2 ( 1 )2 (22 3)] = 0
2

1 ( 1 )2
[ + ]=0
=1
2 2 3

1 ( 1 )2
[1 + ]=0
2
=1
2 3

( 1 )2
(1) + =0
=1 =1
2 3

1
( 1 )2 =
2 2 =1

1 ( 1 )2
= 2 2

=1

1
2 2 = ( 1 )2 = 2

=1

4.3 PROBLEMAS PROPUESTOS

1. dada la funcin densidad de la distribucin uniforme:

1
() =

Estimar sus parmetros , utilizando el mtodo de momentos.


2. dada la funcin densidad de la distribucin exponencial:

() = > 0, >0

Estimar su parmetro , utilizando el mtodo de momentos.

3. Dada la funcin densidad de la distribucin de Poisson:


() = { ! = 0, 1, 2,
0

Calcular el parmetro , usando el mtodo de mxima verosimilitud.


4. dada la funcin densidad de la distribucin exponencial de dos parmetros:

() = () > , >0

Estimar sus parmetros , , utilizando el mtodo de momentos.


5. dada la funcin densidad de la distribucin exponencial de dos parmetros:

() = () > , >0

Estimar sus parmetros , , utilizando el mtodo de mxima verosimilitud.

V. PRUEBAS DE BONDAD DE AJUSTE

Las pruebas de bondad de ajuste consisten en comprobar grfica y


estadsticamente, si la frecuencia emprica de la serie analizada se ajusta a una
determinada funcin de probabilidades terica seleccionada a priori, con los
parmetros estimados en base a los valores mustrales.

Las pruebas estadsticas, tienen por objeto medir la certidumbre que se obtiene al
hacer una hiptesis estadstica sobre una poblacin, es decir calificar el hecho de
suponer que una variable aleatoria se distribuya segn una cierta funcin de
probabilidades.

Las pruebas de bondad de ajuste ms utilizadas son:

Ajuste grafico
chi cuadrado
Ajuste estadistico {
Smirnov Kolmogorov

5.1 AJUSTE GRAFICO


El ajuste grafico se puede realizar de las siguientes formas:
Comparar grficamente el histograma o funcin densidad emprica de la
serie de datos con la funcin densidad terica y decidir visualmente si hay
o no ajuste de acuerdo a la similitud o diferencia de ambos,
respectivamente.
Comparar grficamente la funcin acumulada de la serie de datos, con la
funcin acumulada terica seleccionada, dibujada en papel milimtrico, y
decidir visualmente si hay o no ajuste.

Se puede comparar tambin grficamente la funcin acumulada de la serie


de datos, con la funcin acumulada terica, ploteada en un papel
probabilstico adecuado, donde la distribucin terica seleccionada, se
puede representar como una lnea recta. As se tienen disponibles los
papeles probabilsticos normal, log-normal, gumbel, etc.
El procedimiento consiste en plotear los valores de la variable (leyes,
precipitacin, temperatura, etc.), versus la probabilidad emprica en el papel
de probabilidad correspondiente. Si los puntos ploteados se agrupan
alrededor de una lnea recta, que es la representacin de la distribucin
terica, se puede afirmar con cierta certeza que estos datos se ajustan a la
distribucin deseada.
5.2 PRUEBA CHI CUADRADO
La prueba chi-cuadrado es la ms comnmente usada para verificar la
bondad de ajuste de la distribucin emprica a una distribucin terica
conocida.
La expresin general de chi-cuadrado est dado por:
2 = =1( )2 / . ..(1)
Donde:

= =
= =
2
=Valor calculado de chi-cuadrado, a partir de los datos.
=Nmero de valores observados en el intervalo de clase i.
=Nmero de valores esperados en el intervalo de clase i.
=Nmero de intervalos de clase.
Asignado probabilidades a la ecuacin (1) es decir, asignando igual
probabilidad de ocurrencia a cada intervalo de clase, se tiene:

2 ( )2
= (2)

=1

Donde:
= Nmero de observaciones que caen dentro de los lmites de clases
ajustadas del intervalo i.
= Tamao muestral
= Probabilidad igual para todos los intervalos de clases.
i
Pi = k o ei = NPi . (3)

Simplificando la ecuacin (3), se obtiene la forma computacional desarrollada


por Markovic (1965).

2
= 2 (4)

=1

El valor 2 obtenido por la ecuacin (4) se compara con el 2 obtenido de


las tablas, cuyo valor se determina con:
Nivel de significacin: =0.05 o =0.01
Grados de libertad: g.l.= k-1-h
Dnde:
K= Nmero de intervalos de clase.
h = Es el nmero de parmetros a estimarse, as:
h = 2, para la distribucin normal
h = 3, para la distribucin log-normal de 3 parmetros
El criterio de decisin se fundamenta en la comparacin del valor calculado
de chi-cuadrado con el valor tabular encontrado, esto es:
Si el chi-cuadrado calculado es menor o igual que el valor de la tabla,
es decir:
2 2,
Entonces se acepta la hiptesis de que el ajuste es bueno al nivel de
significacin seleccionado.
Si el chi-cuadrado calculado es mayor que el valor tabular, es decir:
2 > 2,
Entonces el ajuste es malo y se rechaza la hiptesis, siendo necesaria
probar con otra distribucin terica.

VENTAJAS Y LIMITACIONES
1. Es aplicable solo para ajustes a la distribucin normal, puesto que ha sido
desarrollado en base a datos normales e independientes.
2. Es realizado en la funcin densidad de datos agrupados en intervalos de
clases.
3. Requiere un conocimiento a priori de la funcin de distribucin terica
utilizada en el ajuste.
4. En la prctica se usa para cualquier modelo de ajust, pero estrictamente es
vlido solo para la normal.
5. Es de fcil aplicacin
6. Al utilizar esta prueba, se debe tener cuidado que en cada intervalo de clase,
se tenga por lo menos 5 observaciones.

5.3 PRUEBA DE BONDAD DE AJUSTE SMIRNOV-KOLMOGOROV

La prueba de ajuste de Smirnov-Kolmogorov, consiste en comparar las


diferencias existentes entre la probabilidad emprica de los datos de la
muestra y la probabilidad terica, tomando el valor mximo del valor absoluto,
de la diferencia entre el valor observado y el valor de la recta terica del
modelo, es decir:

= |() ()|. (5)

Donde:

= Estadstico de Smirnov-Kolmogorov, cuyo valor es igual a la diferencia


mxima existente entre la probabilidad ajustada y la probabilidad
emperica.

F(x) = Probabilidad de la distribucin de ajuste o terica

P(x) = Probabilidad experimental o emperica de los datos, de denominada


tambin frecuencia acumulada.

El estadstico tiene su funcin de distribucin de probabilidades.

Si o es un valor crtico para un nivel de significacin , se tiene que:


P { max | F(x) P(x) | o } = o

P( o) = (6)

Tambin:

P( < o) = 1 (7)

5.4 PROCEDIMIENTO.

El procedimiento para efectuar el ajuste con Smirnov-Kolmogorov, es:

1. Calcular la probabilidad empica o experimental P(x) de los datos, para


esto usar la frmula de Weibull:

P(x) = +1.(8)

Dnde:

M = Nmero de orden.

N = Nmero de datos

Existen varias frmulas para calcular la probabilidad experimental, la misma


que se muestra en la tabla 1, siendo la ms utilizada la frmula de Weibull.

2. Calcular la probabilidad terica F(x).

2.1. Para el caso de utilizar el procedimiento de los modelos tericos, Usar


la ecuacin de la Funcin acumulada F(x), o tablas elaboradas por tal
fin.

2.2. Si se quiere aplicar el procedimiento grfico, se utiliza un papel


probabilstico especial donde F(x), puede representarse como una lnea
recta, por lo cual, se puede trazar con solo 2 puntos, pero si se quiere
chequear que es una recta, se puede plotear 3 puntos, por ejemplo para
el caso de una distribucin normal, los puntos:

Tabla 1. Frmulas para determinar la probabilidad experimental.

Mtodo Probabilidad
experimental
P
m
California n

m-1/2
Hazen n

m
Weibull n+1

m - 0.3
Chegadayev n + 0.4

m-3/8
Bom n+

3m 1
Tukey 3n + 4

ma
Gringorten n + 1 2a

Dnde:
P = Probabilidad experimental o frecuencia relativa emprica.
m = Numero de orden
n = Numero de datos
a = Valor comprendido en el intervalo 0 < a < 1, y depende de n, de
acuerdo a la siguiente tabla:

n 10 20 30 40 50
a 0.448 0.443 0.442 0.441 0.440
n 60 70 80 90 100
a 0.440 0.440 0.440 0.439 0.439

Probabilidad
Valor %


50
+ S
84.13
- S
15.87
Representados en un papel de probabilidad normal, forman una recta.

3. Calcular las diferencias P(x) F (x), para todos los valores de x.


4. Seleccionar la mxima diferencia
5. Calcular el valor crtico del estadstico de , es decir o para un =
0.05 y N igual al Nmero de datos. Los valores de o, se muestran en
la tabla 2.

Tabla 2 valores crticos de o del estadstico Smirnov- kolmogorov , Para varios


valores de N y niveles de significacin

TAMAO NIVELES SIGNIFICACION


MUESTRAL
N 0.20 0.10 0.05 0.01
5 0.45 0-51 0.56 0.67
10 0.32 0.37 0.41 0.49
15 0.27 0.30 0.34 0.40
20 0.23 0.26 0.29 0.36
25 0.21 0.24 0.27 0.32
30 0.19 0.22 0.24 0.29
35 0.18 0.20 0.23 0.27
40 0.17 0.19 O.21 0.25
45 0.16 0-18 0.20 0.24
50 0.15 0.17 0.19 0.23
N >50 1.07 1.22 1.36 1.63

6. Comparar el valor del estadstico , con el valor critico o de la tabla


2, con los siguientes criterios de decisiones deducidos de la ecuacin
(6).
Si < o el ajuste es bueno, a nivel de significacin
seleccionado.
Si 0 el ajuste no es bueno, al nivel de significacin
seleccionado.
VENTAJAS Y LIMITACIONES

a. No requiere un conocimiento a priori de la funcin de la distribucin


terica.
b. Es aplicable a distribuciones de datos no agrupados, es decir no se
requiere hacer intervalos de clase.
c. Es aplicable a cualquier distribucin terica.
d. Se aplica en la funcin de distribucin acumulada y no en la funcin de
densidad.
e. Comparndola con la prueba chi- cuadrado, no hay condicin de que
cada clase de frecuencia deba contener un mnimo de 5 valores
observados.
f. No es una prueba exacta, sino una prueba aproximada.
VI DISTRIBUCIONES TEORICAS

El hidrlogo generalmente tendr disponible un registro de datos hidrometerologico


(precipitacin, descarga, evapotranspiracin, etc.), a travs de su conocimiento del
problema fsico, escoger un modelo probabilstico a usar, que represente en forma
satisfactoria el comportamiento de la variable.

Para utilizar estos modelos probabilsticos, se debe calcular sus parmetros y


realizar la prueba de bondad de ajuste, un esquema de este proceso se muestra en
la figura 15.

Encontrada la ley de distribucin que rige a las variables aleatorias se podr


predecir con determinada probabilidad, la ocurrencia o no ocurrencia, de una
determinada magnitud de un fenmeno Hidrometeorolgico.

Las distribuciones tericas comnmente utilizadas en Hidrologa, son entre otras:

Distribucin normal
Distribucin log-normal de 2 o 3 parmetros
Distribucin de gamma de 2 o 3 parmetros
Distribucin Gumbel

Las cuales se ven en este capitulo

6.1. DISTRIBUCION NORMAL O GAUSSIANA

1. FUNCION DENSIDAD

La funcin densidad de la distribucin normal es:


2
1
1
[ ]
() = 2 ..(1)
2

2
1
1 [ ]
() = 2 (2)
2

Para - < x < .

Fig. 15. Proceso de seleccin de una distribucin terica.

Seleccion de una
distribucin

REGISTRO DE DATOS

ELEGIR UNA
DISTRIBUCION
TEORICA

ESTIMACION DE
PARAMETROS

PRUEBA DE
BONDAD DE
AJUSTE

F V
AJUSTE
BUENO

UTILIZAR DISTRIBUCION TEORICA


ELEGIDA

FIN
Donde:

f(x) = funcin densidad normal de la variable x.

x = variable independiente.

= parmetro de localizacin igual a la media aritmtica de x.

S = parmetro de escala, igual a la desviacin estndar de x.

Exp = funcin exponencial con base e, de los logaritmos neperianos.

Decimos que la variable aleatoria X, se distribuye normalmente con media =


y una varianza ( 2 = 2 ) y se representa:

X----- N(, 2 )

El grafico de la funcin densidad es:

F(x) es la funcin de distribucin de la distribucin para la variable original x,


segn la ecuacin (6), o tambin para la variable estandarizada Z, segn la ec.
(8), es decir F(x) = F(Z).

Esta funcin de distribucin tiene las siguientes funciones:


F() = 0
F() = 0.5
F(+) = 1

3. CALCULO DE LA FUNCION DE DISTRIBUCION ACUMULA

Existen tablas, por ejemplo las tablas 1 y 2 del apndice que permite calcular F(Z).

Para realizar clculos computacionales de F(Z), se utiliza funciones de


aproximacin, dentro de las cuales se pueden mencionar:

a) Abramowitz stegun (1965) han dado varias aproximaciones para la F.D.A.


de la Variable normal estandarizada Z . Una aproximacin polinomial con un error
menor que 10-5 es:

F(Z) 1- f(Z)(0.043618V 0.1217V2 + 0.9373V3) ..(10)

Donde:

F(Z) = es la funcin de distribucin acumulada

f(Z) = es la funcin densidad de la variable estandarizada

V = es definido para Z 0, como:


V = +.|| ..(11)

b) Masting (1955), ha dado una aproximacin polinomial que ha sido utilizado


por la IBM (1968). Esta aproximacin con un error menor que 7.5 x 10 -8 , es:

F(Z) 1- f(Z)( b1w + b2w + b3w + b4w + b5w)


..(12)

Donde:

W es definido para Z 0, como:

1
W = 1+0.2316419|| (13)
Siendo las constantes:

b1 = 0.319381530 b4 = -0.356563782

b2 = 1.781477937 b5 = - 1.821255978

b3 = 1.330274429

En ambas aproximaciones la F.D.A. es 1- F(Z), si Z<0

4. ESTIMACION DE PARAMETROS

Para estimar los parmetros de distribucin terica se puede usar el mtodo de


momentos o el mtodo de mxima verosimilitud.

Cabe mencionar que la distribucin normal, es la nica funcin de distribucin, que


produce los mismos resultados de los parmetros, estimados por el mtodo de los
momentos y mxima verosimilitud, los parmetros obtenidos son los siguientes:

1
= =
=1 X i

1
S = =[1 2 1/2
=1( - ) ] ..(14)

Donde:

= es el estimado de la media, llamado tambin parmetro de posicin.

S= es el estimado insesgado de la desviacin estndar parmetro de


escala.

5. APLICACIONES EN HIDROLOGIA

L a distribucin normal tiene gran utilidad en hidrologa, siendo alguna de sus


principales aplicaciones:

En el ajuste de distribuciones empricas de variables hidrolgicas de intervalos


de tiempos grandes, tales como variables medias anuales, estacionales, etc.,
que puede ser descargadas, precipitaciones, entre otros.
Anlisis de los errores aleatorios en las observaciones o mediciones
hidrolgicas.
Como referencia para comparar varias distribuciones tericas de ajuste en una
distribucin emprica.
Para hacer procesos de inferencia estadstica.
Para generacin de datos por el mtodo de Monte Carlos. El inconveniente en
la generacin de datos es que se obtienen valores negativos, lo cual
fsicamente no es justificado.

6. AJUSTE

El ajuste puede realizarse grficamente utilizando papel probabilstico normal o


analticamente, mediante los estadsticos chi-cuadrado o Smirnov Kolmogorov.

6.2. DISTRIBUCIONES LOGARITMICAS


Las distribuciones logartmicas ms conocidas son la Log-normal, Log-Pearson
tipo 3 y Log-Gumbel. Por ejemplo, si la variable aleatoria X, tiene una
distribucin log-normal, esto significa = , tiene una distribucin normal.
Anlogamente, si X es una variable aleatoria log-Pearson tipo 3, = , es
una variable aleatoria Pearson tipo 3.
Tambin, si la variable aleatoria X, tiene una distribucin log-Gumbel, = ,
es una variable aleatoria Gumbel. Es posible una generalizacin, en el caso que
se introduzca un lmite inferior 0, en cuyo caso , anteriores, es sustituido
por ln( 0 ).

6.2.1 DISTRUBUCIONES LOG-NORMAL

Hay una distribucin Log-normal de 2 parmetros y otra de 3 parmetros. En la de


3 parmetros, el tercer parmetro es el lmite inferior 0, denominado parmetro de
posicin.

6.2.1.1 DISTRIBUCION LOG-NORMAL DE 2 PARAMETROS

La variable aleatoria X, es positiva y el lmite inferior 0 no aparece.

La variable aleatoria: = , es normalmente distribuida con media y varianza


2 .
Se usan estos parmetros para especificar que la distribucin es logartmica, puesto
que tambin puede usarse la media y varianza de X.

1. FUNCION DENSIDAD
La funcin de distribucin de Y, es:
1 2
1 ( )
() = 2
.... (15)
2

( , 2 )

para < y <

Refiriendo la funcin de distribucin de Y como f(x), se tiene:


() = ()

Donde:
1
= ln =

Por esta razn, la funcin de distribucin de probabilidad de X es:


2
1
1 ( )
() = 2
(16)
2

( , 2 )

2. FUNCION DE LA DISTRIBUCION ACUMULADA


2
1

1 ( )
() = 2
dy . (17)
2


Si =

2
1
() = 2 dZ ... (18)
2

(0,1)

3. ESTIMACION DE PARAMETROS POR EL METODO DE MOMENTOS


Utilizando el mtodo de momentos, las relaciones entre la media y la varianza de la
variable X y los parmetros y 2 , que se obtienen son:

2
Media: = () = ( + )
2

Varianza: 2 = ( ())2 = (2 + 2 )(( 2 ) 1)

2 1
Desv. Est : = ( + )(EXP( 2 ) 1) 2
2

1
Coeficiente de variacin: = = (EXP( 2 ) 1) 2

De donde:

2 = ln(1 + 2 ) . (19)

1
= 2 + ln
2
1 2
= 2 ln( 2 ) . (20)
+1

Coeficiente de sesgo:
3 2 1 2
Cs= g = 3 = ( 1) 2 ( + 2) . (21)
2 2

Para valores prcticos de 2 : 0.1 < 2 < 0.6, la relacin es casi lineal y puede
ser aproximado por:

= = 0.52 + 4.85 2 . (22)

Que es correcto dentro del 2%, en el rango mencionado.

En la figura 16, se presenta la funcin densidad de la distribucin log-normal de 2


parmetros, para varios valores de y 2 .
Fig. 16. Distribucin log-normal de 2 parmetros, con varios valores de y .

6.2.1.2 DISTRIBUCION LOG-NORMAL DE 3 PARMETROS

Esta difiere de la distribucin log-normal de 2 parmetros por la introduccin de un


lmite inferior 0, tal que:

= ln( 0 ) ( , 2 )

La funcin de distribucin de probabilidad de x es:


1 ln(0 ) 2
1 ( )
() = ( 2
. (23)
0 ) 2

0 <

0 : Parmetro de posicin en el dominio x

: Parmetro de escala en el dominio x

2 : Parmetro de forma en el dominio x

1. ESTIMACION DE PARMETROS, MTODOS DE MONENTOS


Utilizando el mtodo de los momentos, las relaciones entre la media, la varianza y
el coeficiente de sesgo, de la variable X y los parmetros de 0 , y 2 , que se
obtiene, son:
2
Media: = () = 0 + + 2 . (24)
2 2
Varianza: 2 = ( ())2 = 2 + ( 1) . (25)

Coeficiente de sesgo:
3 2 1 2
Cs= g = 3 = ( 1) 2 ( + 2) . (26)
2 2

= = 0.52 + 4.85 2 . (27)

Para datos muestrales el coeficiente de sesgo es:


2
3
= = (1)(2) 3 . (28)

Donde:
( )3
3 = . (29)

( )2
S= . (30)
1


= . (31)

Luego:

0.52
De (27): = . (32)
4.85

1 2
De (25): = 2 (ln ( 2
) 2 ) . (33)
1

2
De (24): 0 = + 2 . (34)

6.2.2 EJEMPLO
3
Dada la serie histrica de caudales medio anuales, en . que corresponde a
un registro de 50 aos para el rio Santa (Per):

95.05 98.13 100.18 101.66 101.76


105.21 105.81 106.40 107.43 107.62
108.75 110.77 114.31 116.40 119.52
123.00 123.22 124.31 127.82 128.15
132.49 134.10 136.22 144.22 145.79
246.08 153.64 153.97 154.80 156.80
158.48 162.29 164.35 169.18 169.64
177.00 182.53 183.11 183.49 184.98
193.78 193.88 197.58 207.78 208.18
212.48 217.52 239.07 256.62 266.54

1. Averiguar si se ajustan a una distribucin log-normal de dos parmetros


2. El caudal a para un periodo de retorno de 75 aos.

SOLUCION:

1) Ajuste a la distribucin log-normal de dos parmetros:


Utilizando los programas del listado 6(para crear el archivo de datos) y el listado
7(para realizar la prueba de bondad de ajuste), se encuentra que los datos, se
ajustan a la distribucin log-normal de dos parmetros, con un nivel de
significancia del 5%, o a una probabilidad de 95%.
Un resumen de los resultados obtenidos con el programa es:
= 0.0747
0 = 0.1923, para un nivel de significancia del 5%

Como: = 0.0747 < 0 = 0.1923, se concluye que los datos se ajustan a al


distribucin log-normal de 2 parmetros, con un nivel de significancia del 5%.

2) Calculo de un caudal para un periodo de retorno de 75 aos:

1
( = ) = ( ) = 1

1
( = ) = 1
75
( = ) = 0.9866666 = ()

De la tabla 2 del apndice, para () = 0.9866666, se obtiene por interpolacin:


Z= 2.215
Pero para una distribucin log-normal de 2 parmetros, la variable estandarizada
es:
ln
= . (1)

El programa del listado 7, permite calcular tambin los parmetros y , siendo
los valores obtenidos:
= 4.9861
= 0.2808

Sustituyendo valores en la ec. (1), se tiene:


ln 4.9861
= 2.215
0.2808

De donde:

= 2.2150.2808+4.9861

3
= 272.618

6.3. DISTRIBUCIN GAMMA

Otra distribucin que juega un papel importante en Hidrologa es la distribucin


Gamma. Su aplicacin es tan comn, como el uso de la distribucin log-norma.

6.3.1. DISTRIBUCIN GAMMA DE DOS PARMETROS

1. FUNCIN DENSIDAD

Se dice que una variable aleatoria X, tiene una distribucin gamma de 2


parmetros si su funcin densidad de probabilidad es:

1 /
() =
()

para:

siendo:

= parmetro de forma (+)

= (+)

() = , :

() = 0 1 / que converge si > 0
La funcin gamma tiene las siguientes propiedades:

() = ( 1)! para = 1, 2, 3,

( + 1) = x() para > 0

(1) = (2) = 1

(1/2) =

(0) =

Si > 0 pero no entero, puede () ser calculado por expansin de series e


integracin numrica por:

2 1 1 1 1
() = [1 + + +]
12 288 2 51840 3 2488320 4

Para ms detalles sobre las propiedades de la funcin gamma completa, su forma


de clculo y la transformada de Laplace, ver anexo.

2. FUNCIN ACUMULADA

La funcin de distribucin acumulada, de la funcin gamma incompleta de 2


parmetros es:

1 /
() = 0 (44)
()

La integral de la ec. (44) puede evaluarse para valores dados de y , usando la


tabla 7 del apndice, en la cual se ha tabulado la funcin gamma incompleta. En
esta tabla se dan los valores de la probabilidad de excedencia 1 (), y se entra
con:
2
2 = y = 2 (45)

si es entero, la funcin de distribucin gamma acumulada, segn Mood et al


(1974), puede calcularse por:
1
/

() = 1 ( ) /!

La variable aleatoria reducida est dada por:



= (46)

la cual reduce la funcin de densidad de probabilidad a:

1
() = (47)
()

y la funcin de distribucin acumulada:


1
() = 0 (48)
()

las funciones reducidas contienen el parmetro , por lo cual cada valor positivo
de determina una funcin diferente. Un extracto de las tablas de Wik,
Gnanadesikan Huyett (1962), para las variables aleatorias reducidas Gamma, se
muestra en la tabla 1.

Tabla 1. Funcin de variables aleatorias reducidas Gamma, G(Y), en funcin de Y


y .

() = = = = =

0.10 0.105 0.532 2.433 6.221 14.53

0.20 0.223 0.824 3.090 7.289 16.17

0.30 0.357 1.097 3.634 8.133 17.44

0.40 0.511 1.376 4.148 8.904 18.57

0.50 0.693 1.678 4.671 9.669 19.67

0.60 0.916 2.022 5.237 10.476 20.81

0.70 1.204 2.439 5.890 11.387 22.08

0.80 1.609 2.994 6.721 12.519 23.63

0.90 2.303 3.890 7.994 14.206 25.90

0.95 2.996 4.744 9.154 15.705 27.88

0.99 4.605 6.638 11.605 18.783 31.85

En el listado 8, se presenta un programa, que tiene una subrutina que permite


calcular la funcin gamma acumulada ().
La representacin grfica de la funcin densidad y la funcin de distribucin
acumulada, para una variable aleatoria X, que sigue una distribucin gamma, con
= 5 y = 5.63, se muestra en la figura 17.

3. ESTIMACIN DE PARMETROS, MTODO DE MOMENTOS

Utilizando el mtodo de los momentos, las relaciones entre la media, la varianza y


el coeficiente de sesgo, de la variable X y los parmetros y de la distribucin
gamma, que se obtiene son:

Fig. 17. funcin densidad y funcin acumulada de la distribucin gamma de


dos parmetros.

media: = () = (49)

varianza: 2 = 2 (50)
2
coeficiente de sesgo: = = 1/2 (51)

2
De las ecs. (49) y (50), se tiene: = (52)
2

2
De las ecs. (49) y (52), resulta: = 2 (53)

4. ESTIMACIN DE PARMETROS, MTODO DE MXIMA


VEROSIMILITUD

Thom (1958), estableci que para < 10, el mtodo de momentos produce una
estimacin inaceptable de los parmetros y . Para cerca de 1 el mtodo de
momentos usa solamente el 50% de la informacin de la muestra para estimar y
solamente el 40% para estimar .

Greenwood y Durand (1960), presentan las siguientes relaciones aproximadas de


estimacin de parmetros por el mtodo de mxima verosimilitud:

para: 0 0.5772

= (0.5000876 + 0.1648852 0.0544274 2 ) (54)

y para:
8.898919+9.05995+0.97753732
= (55)
(17.79728+11.968477+ 2 )

donde:


= (56)

siendo:

= (57)

Greenwood y Durand (1960), establecieron que el mximo error de la ecuacin


(54) es de 0.0088% y en la ecuacin (55) es 0.0054%.

6.3.2. DISTRIBUCIN GAMMA INCOMPLETA DE 3 PARMETROS O


PEARSON III

1. FUNCIN DENSIDAD

Se dice que una variable aleatoria X, tiene una distribucin gamma de 3


parmetros o distribucin Pearson III, si su funcin de densidad de probabilidad
es:

( )1 ( )/
() = (58)
()

para:

<

<

0<

0<
2. FUNCIN ACUMULADA

La funcin de distribucin acumulada de la distribucin gamma de 3 parmetros


es:

( )1 ( )/
() = (59)
()

en la cual:

: variable aleatoria gamma de 3 parmetros o Pearson tipo III

: origen de la variable x, parmetro de posicin

: parmetro de escala

: parmetro de forma

(): funcin gamma completa

La representacin grfica de la funcin densidad y de la funcin de distribucin


acumulada, para = 10, = 5 y = 3, se muestra en la figura 18.

Fig. 18. Funcin densidad y funcin acumulada de la distribucin gamma de


3 parmetros.

La variable reducida Y Pearson tipo III, es:



= (60)

La funcin acumulada Pearson III reducida es:


1
() = (61)
()
la cual tiene como parmetro , y cuya variable aleatoria tienen origen en = 0
= .

3. ESTIMACIN DE PARMETROS, MTODO DE MOMENTOS

Aplicando el mtodo de momentos, se obtuvieron las siguientes relaciones:

media: = + (62)

varianza: 2 = 2 (63)
2
sesgo: = = (64)

de donde:
4
= 2 (65)

= /2 (66)

= 2/ (67)

4. APLICACIN EN HIDROLOGA

Su uso en hidrologa est casi tan difundido como el uso de la distribucin log-
normal de 3 parmetros, con la desventaja de la mayor complicacin al estimar
sus parmetros y calcular los valores de la funcin de distribucin acumulada.

La prctica ha demostrado que los resultados entre la distribucin log-normal y la


distribucin Pearson III, para el ajuste de series de precipitaciones anuales,
mdulos anuales, precipitaciones mensuales, etc. no difieren.

Las razones que convalidan la utilizacin de esta distribucin de probabilidad son


las mismas que lo hacen en la distribucin log-normal.

6.3.3. EJEMPLO

Para proteger de inundaciones a la poblacin de la ribera del rio Turrialba, se


desea construir muros de encauzamiento. Para esto, se cuenta con un registro de
25 aos de caudales mximos en m3/s de una estacin aguas arriba de la
poblacin, los mismos que se muestran en la tabla 2.

Tabla 2. Registro de caudales del ro Turrialba

53.50 64.00 169.90 162.70 102.10


165.60 155.80 199.00 22.80 76.00

250.50 120.50 250.50 231.70 207.00

234.00 189.00 196.00 96.90 91.60

65.40 123.00 119.00 200.00 380.00

Determinar el caudal de diseo para un periodo de retorno de 50 aos. Usar la


distribucin gamma de 2 parmetros.

SOLUCIN:

1. Ajuste de los datos de la serie a la distribucin gamma de dos


parmetros.

1.1. Para crear el archivo con la serie de datos, se usa el programa


del listado 6.

1.2. Para realizar la prueba de bonda de ajuste, se utiliza el


programa del listado 8. Este programa calcula adems los
parmetros de la serie y los parmetros de la distribucin, algunos
clculos parciales que se obtienen, es como se muestra:

- Clculo de los parmetros de la serie de caudales:

= 157.05

ln = 4.90

2 = 6450.21

= 80.31

- Clculo de los parmetros de la distribucin gamma:

Utilizando la ec. (56), se tiene:

=
ln = ln 157.05 4.9 = 0.15656

como: = 0.15656 < 0.5772, se utiliza la ec. (54), para el clculo de , es decir:

= (0.500087 + 0.1648852 0.0544274 2 )/

De la ec. (57), se tiene:



=
157.05
= = 45.8133
3.4280

6.4DISTRIBUCION GUNBEL

La distribucin Gumbel, una de la distribuciones de valor extremo, es llamada


tambin valor extremo Tipo I, Fisher Tippett tipo I o distribucin doble exponencial.

1. FUNCION ACUMULADA

La funcin de distribucin acumulada de la distribucin Gunbel, tienes la forma.

F(x) = EXP (-EXP (-(x-u)/)) . (68)

()
F(x) =
................................................................... (69)

Para: -< x <

Dnde:

0 < < , es el parmetro de escala.

-< < , es el parmetro de posicin, llamado tambin valor central o


moda.

2. FUNCION DENCIDAD

Derivando la funcin de distribucin acumulada, ec. (68) con respecto a x, se


obtiene la funcin densidad de probabilidad, es decir:
dF(x)
f(x)= dx

f(x) = EXP(-(x-)/) EXP(-(x-)/)


(70)

1 ()/
f(x) = ()/ .. (71)
Para:

-< x <

La variable aleatoria reducida de Gunbel, se define como:



Y=
...................................... (7)

Con lo cual, la funcin densidad reducida Gunbel es:


Y
g(x) = EXP (- Y- EXP (-Y)) = eYe ................................................................
(73)

y la funcin acumulada reducida Gunbel, es:


Y
G (Y) = EXP (-EXP(-Y)) = ee ..
(74)

Los valores correspondientes x e Y, estn relacionados por:

F(x) = G (Y)

Y la relacin es:
x
Y= x = + Y ..

(75)

3. ESTIMACION DE PARMETROS, MTODO DE MOMENTOS

Utilizando el mtodo de momentos, se obtiene las siguientes relaciones:

-Moda xmoda =

-Media E(x) = = +C

Donde C, es la constante de Euler, cuyo valor es:

lim 1 1 1
C = n [1 + + + + ln n]
2 3

C = 0.5772156649

Por lo tanto:
= +0.57721 . (76)

2 2
Varianza: E[(x E(x))2] = S2 = (77)
6

De donde se obtiene:

6
= S = 0.78 S .. (78)

= - 0.57721 = - 0.45 S. . (79)

4. APLICACIN EN HIDROLOGIA

La ley de Gunbel o ley de valores extremos, sed utiliza generalmente para ajustar,
a una expresin matemtica, las distribuciones empricas de frecuencia de
caudales mximos anuales, precipitaciones mximas, etc.

Es importante verificar antes de aplicar esta distribucin de probabilidad que los


coeficientes de asimetra y curtosis de la distribucin emprica sean del mismo
orden que los valores poblacionales.

Uno de los inconvenientes del uso de esta distribucin , es que en una


distribucin doble exponencial , la variable puede tomar cualquier valor, por lo
que se puede asignar probabilidades a valores negativos de la aleatorio,
cuestin que resta significacin fsica a la aplicacin, debido a que las variables
hidrolgicas toman solamente valores positivos o cero.

5. EJEMPLO
Se tiene el registro de caudales mximos de 29 aos, para la estacin 9- 3
Angostura, como se muestra en la tabla.

En este rio se desea construir una presa de almacenamiento, calcular el caudal


de diseo para el vertedor de demasas, con un periodo de retorno de 50 aos.
Usar la distribucin Gunbel.

1660 917 3800 1410 2280

618 683 934 779 921

876 740 1120 610 1150

563 520 360 367 658

824 824 1230 522 581

557 818 1030 418

SOLUCION:

1. Ajuste de los datos de la serie a la distribucin Gunbel.

1.1Para crear el archivo con la serie de datos, se usa el programa del listado 6.

1.2Para realizar la prueba de bondad de ajuste, se utiliza el programa del listado


9. Este programa calcula adems los parmetros de la serie y los parmetros de
la distribucin, algunos clculos parciales que se obtienen, es como se muestra:

-Clculo de los parmetros de la serie de caudales:

Media: = 957.59

Desviacin estndar: S = 682.72

-Clculo de los parmetros de la distribucin de Gunbel:

El programa calcula estos parmetros utilizando las ec. (778) y (79) obteniendo:

Parmetro de escala: = 523.3182


Parmetro de posicin =650.3237

-Prueba de bondad de ajuste

Los resultados que se obtienen del programa son:

= 0.1454

0 = 0.2552, para un nivel de significacin del 5%.

Decisin

Siendo: = 0.454 < 0 =0.2552

Se concluye que los datos se ajustan a una distribucin Gunbel, con un nivel de
significacin del 5%.

2. Clculo del caudal de diseo, para un periodo de retorno de 50 aos.


1
F(Q =q) = P(Q q) = 1- T

1
F(Q = q) = 1 - 50

F(Q = q) = 0.98 =F(y)


y
F(y) = ee = 0.98

-ey = ln0.98

ey = 0.020202707

-y = ln(0.020202707)

Y= 3.9019

Pero de la ec. (72)


Q
y= = 3.9019

Q = + 3.9019 x

Q = 650.3237 + (3.9019) (523.3182)

Q =2,727.38 m3/s.

You might also like