You are on page 1of 9

ESTADSTICA II

DISTRIBUCIN DE PARETO
1
CON DOS PARMETROS
Material exclusivo para el sector econmico

David Glejberman

Funcin de densidad y de distribucin
La densidad de Pareto se introduce para modelizar la distribucin del ingreso
cuando sta es fuertemente inequitativa. La forma funcional de la densidad se presenta a
continuacin:

'

+
caso otro en
x si
x
x f
X
0
.
) (
1



donde > 1 y > 0 (espacio paramtrico).

De la frmula anterior resulta el siguiente grfico de la funcin de densidad:


fX(x)


/





x

El parmetro puede interpretarse como el ingreso mnimo de la poblacin. Se
trata de un indicador de posicin. Si la poblacin es el conjunto de asalariados formales
en el Uruguay que trabajan 8 horas por da, entonces es el Salario Mnimo Nacional.

El parmetro tiene que ver con la dispersin. A mayores valores de , se
obtienen densidades de Pareto ms concentradas en las proximidades del mnimo, es
decir, menos dispersas.


= 2 = 5






1
Vilfredo Pareto, nacido en Italia (1848-1923), cuya fama se debe a la introduccin de los mtodos
matemticos en la economa poltica. Obras ms conocidas: Cursos de economa poltica y El peligro
socialista.


La funcin de distribucinde Pareto puede obtenerse mediante primitivacin de
la funcin de densidad.

'

>
,
_

x si
x
x
t
dt
t
x si
x F
x
X
1
.
0
) (
1


Observacin: 1 F
X
(x) = (/x)

representa la proporcin de personas en la


poblacin con ingresos mayores que x.

Medidas de posicin
Calculemos las clsicas medidas de posicin de la distribucin: media, mediana
y modo.

.
1 1
. . . . . .
.
. ). ( . ) (
1
1

+
+

+ +

+
+
+

x
dx x dx
x
x dx x f x X E
X

Observacin: Para valores grandes de , la media tiende a aproximarse a
(por derecha), lo que confirma que la distribucin tiende a concentrarse cerca de para
valores grandes de . Para que exista la media se requiere que sea mayor que la
unidad.


/ 1
5 , 0
/ 1
5 , 0 5 , 0
5 , 0 5 , 0
2 . 5 , 0 5 , 0 1 5 , 0 ) ( :

,
_

x
x x
x F x
X


Observacin: Para grande, la mediana tiende a .

Como f
X
es decreciente a partir de , y la densidad es nula hasta , entonces el
modo de la distribucin est en .

Medidas de dispersin
Para calcular la varianza se aplica la relacin entre el segundo momento
centrado y los momentos ordinarios:

V(X) = E(X
2
) E
2
(X)


+ +
+
+
>



2 .
2
..... . . . .
.
. ) (
2 1
1
2 2
si dx x dx
x
x X E

V(X) =
) 2 .( ) 1 (
.
.
1
.
2
2
2
2
2


,
_



Entonces, S(X) =
1
.
2



El coeficiente de variacin, Cv(X) =
) 2 .(
1

, no depende de . Este
resultado indica que la dispersin medida en unidades de media no depende de la
posicin del ingreso mnimo, sino slo del parmetro . Se necesita un valor de
mayor que 10, para conseguir un coeficiente de dispersin menor del 10%.

Curva de Lorenz
Nos proponemos ahora deducir la curva de Lorenz para la distribucin de Pareto,
es decir, en el caso de una distribucin terica.

Se trata de encontrar la relacin entre F
X
(x) y la funcin T(x) que acumula los
ingresos para todos los individuos con ingresos menores o iguales que x.

Si en la poblacin hay N individuos, entonces el ingreso total es:

N. = N.E(X) = N.
1
.
. ). ( .

N dx x f x
X

f
X
(x)



x x+dx

f
X
(x).dx proporcin de individuos con ingresos en el intervalo (x, x+dx).
N. f
X
(x).dx nmero de individuos con ingresos en el intervalo (x, x+dx).
x.[N. f
X
(x).dx] ingreso medio de los individuos con ingresos en (x, x+dx).
Y(x) =


x
X
dt t f N t

). ( . . Ingreso total de los individuos con ingresos x.


Y(x) =
1
1
]
1

,
_


1
]
1

+
+
1
1
1
1 .
1
. .
.....
1
. . . .
.
. .



x
N t
N dt
t
N t
x
x


Entonces, la ordenada T(x) de la curva de Lorenz en la distribucin de Pareto es:

1
1
1
1
.
.
1 .
1
. .
.
) (
) (

,
_

1
1
]
1

,
_


x
N
x
N
N
x Y
x T

Ahora vamos a encontrar la relacin entre T(x) y F
X
(x) para representar la curva
de Lorenz.
( ) [ ]
1
/ 1 / 1
)) ( 1 ( 1 ) ( ) ( 1 1 ) (


,
_


x F x T x F
x x
x F
X X X




[ ]
1
1
) ( 1 1 ) (

x F x T
X



Observaciones
1. La relacin entre T y F no depende de , slo depende de .
2. Por ser 0 F 1 y > 1 T 0 para todo F [0,1].
3. [ ] >

1 , 0 0 ) 1 ).(
1
1 ( '
/ 1
F F T
F

T es creciente.
4. [ ] >
+

1 , 0 0 ) 1 ).(
1
).(
1
1 (
1
' '
F F T
F


T tiene concavidad positiva.
5. T() = 1 [1 F
X
()]
1-1/
= 0 y T(+) = 1 [1 F
X
(+)]
1-1/
= 1
F() = 0 y F
X
(+) = 1. En consecuencia, la curva pasa por los puntos (0,0) y (1,1).


T
1

Curva de Lorenz




1 F

ndice sinttico de Gini
El ndice sinttico de Gini es el doble del rea comprendida entre la curva de
Lorenz y la recta de equidistribucin. El rea puede calcularse como la integral de la
diferencia entre ambas funciones.

Curva de Lorenz: T = 1 [1 F]
1 1/

Recta de equidistribucin: T = F

ndice de Gini = 2 . [ ]
1 . 2
1
.....
1
2
) 1 (
2
. 2 1 1
1
0
1
2
2 1
0
1
1


1
1
1
1
]
1

'

F
F
F
dF F F

Observaciones
1. El ndice sinttico de Gini no depende del nivel del ingreso mnimo (), sino
solamente del parmetro de forma ().
2. El ndice de Gini se hace pequeo slo para valores grandes de , y el ndice tiende
a 1 para valores de muy prximos a 1 por derecha. En consecuencia, valores
grandes de corresponden a una distribucin ms equitativa, mientras que valores
pequeos de (cercanos a 1
+
) corresponden a una distribucin con mayor
concentracin del ingreso.

ndice analtico de Gini
De acuerdo con la definicin, el ndice analtico
x
debe cumplir en el punto x
la condicin:

[1 T(x)]

= 1 FX(x)

es el exponente de la proporcin de ingresos que detentan las personas cuyo
ingreso es mayor que x, para que dicha expresin se iguale a la proporcin de personas
cuyo ingreso es mayor que x.

Como 1 FX(x) = (/x)

y 1 T(x) = (/x)
-1
, al sustituir en la ecuacin que
define el ndice se obtiene:

[(/x)
-1
]

= (/x)



Luego:

( - 1). =


= /( - 1)


Observaciones
1.
x
es constante para todo x del Rec(X). Esta es una propiedad caracterstica de
la distribucin de Pareto. La concentracin, medida a travs del ndice analtico,
es constante cualquiera sea el punto de la distribucin del ingreso donde estemos
ubicados.
2. Se deduce adicionalmente que = /-1. En otras palabras, el parmetro tiene
su propia interpretacin en trminos del ndice analtico: cuanto mayor la
concentracin del ingreso, mayor el y ms cercano a 1 por derecha
(situacin que refleja la mxima concentracin).

Estimacin de los parmetros y
Supongamos que se dispone de una muestra de n individuos de la poblacin con
sus respectivos ingresos.

Intervalos de
ingresos
Frecuencias
relativas
x'
0
x
1

x'
1
x
2
x'
2
x
3

h(x
1
)
h(x
2
)
h(x
3
)
----------
x'
n-2
x
n-1

x'
n-1
x
n

------
h(x
n-1
)
h(x
n
)


Si el extremo inferior del primer intervalo coincide con el mnimo de la muestra,
entonces el estimador de es X0.

Para estimar , consideremos una forma intuitiva de aproximacin. Si la
distribucin de Pareto ajusta bien a los datos, entonces h(x
n
) es una estimacin de la
proporcin de individuos con ingresos mayores que x'
n-1
.

) (
'
) ' ( 1
1
1 n
n
n X
x h
x
x F

,
_



Con el mismo razonamiento, h(xn) + h(xn-1) es una estimacin de la proporcin
de individuos con ingresos mayores que x'n-2.

) )( ) (
'
) ' ( 1
1
2
2 n n
n
n X
x h x h
x
x F +

,
_



Al plantear el sistema formado por las dos ecuaciones, tomando logaritmos
naturales, se obtiene:


[ ]

'

) ( ) ( ' . .
) ( ' . .
1 2
1
n n n
n n
x h x h L Lx L
x h L Lx L




Al resolver el sistema resulta:


[ ] [ ] [ ] ) ( ) ( ) ( ' ' .
1 2 1 n n n n n
x h L x h x h L Lx Lx +






1
]
1

1
]
1

2
1
1
'
'
) (
) (
1

n
n
n
n
x
x
L
x h
x h
L











Si se aplica el mtodo de la mxima verosimilitud para la estimacin de los
parmetros, se obtiene:


) ' (

i MV
x Mn

) ( .

1
i
k
MV
i
MV
x h
x
L

,
_



donde k es el nmero intervalos de la distribucin emprica.

Si se aplica el mtodo de los momentos para la estimacin de parmetros, se
obtiene:


2
2
2
2
'
1
'
.

m
m
m
m
x
MM
+


2
2
'
1
m
m
MM
+

donde m 2 es el momento ordinario de orden 2 de la muestra, y m2 el respectivo
momento centrado.

















Ejercicio 1
En una poblacin los ingresos se distribuyen Pareto(=1.000, =3).

1. Hallar la proporcin de personas que ganan ms de 5.000.
2. Hallar la probabilidad que una persona gane entre 2.000 y 3.000.
3. Hallar la probabilidad que una persona tenga ingresos por debajo de la media.

Ejercicio 2
Dos ciudades tienen las siguientes distribuciones del ingreso:

f
X
(x) = Pareto(=500, =2)
f
Y
(y) = Pareto(=700, =3)

1. Hallar el ingreso medio en las dos ciudades.
2. Hallar el ingreso mediano en las dos ciudades.
3. Calcular la probabilidad que un individuo gane ms de 2000 en cada ciudad.
4. En qu ciudad es ms probable que un individuo gane entre 1000 y 2000?
5. En qu ciudad hay mayor concentracin del ingreso? Calcular el ndice
sinttico y el ndice analtico de Gini.

Ejercicio 3
Sea la distribucin del ingreso dada por la densidad f
X
(x) = Pareto(=840, =2).

1. Probar que la curva de Lorenz es creciente para toda F [0,1] y su concavidad
es positiva.
2. Cul es la porcin del ingreso que acumula el 50% ms pobre de la poblacin?
3. Hallar la porcin del ingreso que detenta el 20% ms pobre de la poblacin.
4. Hallar la porcin del ingreso que detenta el 20% ms rico de la poblacin.
5. Calcular la mediana.
6. Calcular la mediala.

Ejercicio 4
Una muestra de la distribucin del ingreso de una poblacin arroj los siguientes
resultados.
x'0 x1 h(xi)
1 2
2 3
3 5
5 10
10 20
20 50
0,75
0,13
0,07
0,03
0,015
0,005

Supuesto que la poblacin tiene una distribucin del ingreso de Pareto, estimar a partir
de la muestra los dos parmetros, mediante la estimacin intuitiva, el mtodo de
mxima verosimilitud y el mtodo de los momentos.

Ejercicio 5
Deducir los estimadores mximo verosmiles y de los momentos en la
distribucin de Pareto.

You might also like