Professional Documents
Culture Documents
Delgado Jolis Utzet Mandelbrot Randomness Zipf Hurst Bscm13
Delgado Jolis Utzet Mandelbrot Randomness Zipf Hurst Bscm13
x, amb C
= logC . (2)
Zipf explica aquesta relaci en lmbit de la lingstica com a conseqncia
del principi general del mnim esfor. Aplicant-lo sobt un equilibri de vocabu-
lari al qual la llengua arriba a la llarga com a resultat de dues forces oposades:
la unicaci, que tendeix a reduir el vocabulari aplicant el principi del mnim
esfor des del punt de vista de la persona que parla, i la diversicaci, relacio-
nada amb la necessitat per part de loient de donar signicaci al discurs que
sent.
Com a primer exemple, Zipf va fer servir lUlisses de James Joyce, el text
complet en angls del qual comprn unes 260.000 paraules, que formen un
diccionari daproximadament 30.000 paraules diferents. A [33], pgina 24,
trobem la taula parcial de freqncies de la pgina segent (les paraules
corresponents a cada rang les hem extret de [28], encara que les freqncies
no es corresponen exactament amb les de [33]). En aquesta taula sha evitat
deliberadament considerar els rangs inferiors a 10 per motius que comentarem
ms endavant.
Si fem lanlisi de la regressi lineal amb les dades (fent prviament el
logaritme), trobem que laproximaci lineal entre Y = log(f(r)) i X = log(r) s
molt bona, cosa que mostra clarament el diagrama de dispersi de la gura 1,
ja que el coecient de determinaci s R = 0,9989 i el coecient de correlaci
(larrel quadrada de R amb signe negatiu, el mateix del pendent de la recta) s
r = 0,99944985, molt proper a 1 en valor absolut. Daltra banda, la recta de
regressi que es troba s y = 1,0243x + 4,4687, que ens dna comparant
124 Rosario Delgado, Maria Jolis i Frederic Utzet
amb (2) les estimacions = 1,0243 i C
, tenim
que C = 29423,88402. Per tant, les dades de lUlisses de Joyce que mostrem a
la taula segueixen el patr de la llei de Zipf
f(r) = C r
si x x
min
1 si x < x
min
,
(4)
Mandelbrot i latzar 125
Figura 1: Regressi lineal amb les dades de lUlisses de Joyce.
on x
min
> 0 s el menor valor possible de X, C > 0 s una constant i > 0 s
un parmetre. Llavors es diu que X segueix una llei (o distribuci) de Pareto.
Aquesta distribuci no es limita a descriure la riquesa, sin que apareix en
moltes altres situacions en les quals es troba un equilibri entre el que s
petit i el que s gran, com veurem ms endavant. De fet, la llei de Zipf
es pot pensar com la versi discreta de la llei (contnua) de Pareto. Com que
lim
x0
+ C x
min
= 1, don dedum que C = x
min
.
I encara un altre exemple: lany 1913 el geogrf alemany Felix Auerbach
(18561933) va mostrar al seu treball [1] que tamb les ciutats segueixen
una llei de potncia quan sordenen pel nombre dhabitants. Per la primera
observaci emprica duna llei de potncia en un sistema fsic es remunta ns a
la primera meitat del segle xix. En efecte, Wilhelm Eduard Weber (18041891),
professor de fsica de la Universitat de Gttingen per recomanaci de Johann
Carl Friedrich Gauss (17771855), emps per la seva insistncia (la de Gauss),
es va proposar destudiar la torsi dels ls de seda que es feien servir per a
aguantar les bobines mbils dels aparells elctrics i magntics. Weber va provar
que aplicant una crrega longitudinal als ls provocava una immediata extensi
i un augment de longitud, seguida duna immediata contracci quan la crrega
cessava, amb una disminuci gradual de la longitud dels ls ns a arribar a la
126 Rosario Delgado, Maria Jolis i Frederic Utzet
longitud inicial. Les seqeles de la pertorbaci dels ls van disminuint amb el
temps de manera hiperblica i no exponencial, com tots esperaven que passs,
s a dir, ho fan seguint la funci t
, (6)
on V s un nou parmetre que millora lajustament de la llei de Zipf per a les
paraules ms comunes, que tenen un valor de r petit, per no t gaire impacte
en lajustament de la freqncia de paraules poc freqents, que tenen valors de
r grans. Per a les llenges ms naturals, s ms gran que la unitat. Qu passa
quan 1? En aquest cas, la srie
r
C (r +V)
r=1
29423,88402(1 +1,15)
1,0243
= 13433,31769,
que ara s que saproxima a la freqncia observada de 14954, a diferncia del
que passava amb la llei de Zipf (1). Veiem, doncs, com la llei de Zipf-Mandelbrot
millora la predicci de la freqncia per a una paraula amb un rang baix. I,
tanmateix, si agafem una altra paraula amb un rang ms gran, per exemple
college, de rang r = 1000, la freqncia que li assigna el model (6) s
f(r = 1000) = C (r +V)
r=1000
29423,88402(1000 +1,15)
1,0243
24,84784
quan la freqncia observada era 26, segons la taula, s a dir, que no afecta
negativament el fet de tenir la constant V al model (6), respecte de la llei de
Zipf (1).
Encara que no donarem els detalls de la manera com Mandelbrot va trobar
la generalitzaci de la llei de Zipf en el context de la teoria de la informaci
de Shannon, s que veurem com es pot arribar a intuir aquesta frmula en una
situaci senzilla, a partir dun objecte autosimilar anomenat arbre lexicogrc
(vegeu el captol 38 de [18]). Un arbre lexicogrc s un objecte que, tal com el
denirem, s autosimilar ja que si el canviem descala no canvia la seva forma.
Aix vol dir que si agafem una branca allada de larbre, la branca s com tot
larbre a escala reduda.
Definici 1. Partim dun llenguatge format per paraules construdes a partir
dun nombre N > 1 de lletres diferents. Denim un arbre lexicogrc per a
representar aquest llenguatge com un objecte que consta de N +1 troncs, nu-
merats de 0 ns a N, al nivell 1. El tronc 0 correspon a la paraula constituda
Mandelbrot i latzar 129
per un espai en blanc sol, i cadascun dels altres troncs corresponen a les N
lletres. El tronc 0 queda tallat ja que t un espai en blanc. El altres troncs es
ramiquen cadascun en N + 1 branques al nivell 2, la primera de les quals
queda tallada pel fet de tenir un espai en blanc, i les altres tornen a ramicar-se,
i aix successivament, augmentant el nombre de nivells sense aturar-nos. Quan
una branca queda tallada perqu acaba en un espai en blanc, les lletres orde-
nades dels nusos daquesta branca (nivells previs) formen una paraula. El cas
ms simple darbre lexicogrc correspon al fet que les N lletres apareixen al
discurs de manera independent i amb la mateixa probabilitat, diguem s, mentre
que lespai en blanc tamb apareix de manera independent, amb probabilitat
xada P
0
(0, 1). Llavors, s =
1P
0
N
i es compleix que s (0,
1
N
).
Si anomenem P la probabilitat que aparegui al discurs una paraula concreta
de longitud k (s a dir, k lletres concretes seguides dun espai en blanc, cosa que
vol dir que la paraula acaba amb un blanc al nivell k +1 de larbre lexicogrc),
i aquesta paraula t rang r, volem demostrar el segent:
Proposici 2. Existeixen constants 0 < C
1
< C
2
que noms depenen de N i s,
tals que
C
1
(r +V)
< P C
2
(r +V)
amb =
log(1/s)
logN
(que s > 1) i V = 1/(N 1).
Prova. Per la construcci de larbre lexicogrc tenim que sigui quina sigui la
paraula concreta de longitud k,
P = s
k
P
0
.
Daltra banda, el rang daquesta paraula, r, ordenant les paraules per la fre-
qncia amb qu apareixen (o per la seva probabilitat), complir aquestes
desigualtats:
1 +N +N
2
+ +N
k1
< r 1 +N +N
2
+ +N
k1
+N
k
,
ja que ser estrictament ms gran que el de totes les paraules ms curtes (dels
nivells 1 al k) i menor o igual que el mxim rang de les paraules del seu nivell,
que s el nivell k+1. Com que per a qualsevol , 1+N+N
2
+ +N
1
=
N
1
N1
,
tenim que
N
k
1
N 1
< r
N
k+1
1
N 1
,
i si fem servir la notaci V = 1/(N 1), llavors
N
k
1 <
r
V
N
k+1
1 N
k
<
r +V
V
N
k+1
, (7)
i usant que a partir de P = P
0
s
k
podem allar
k =
log(P/P
0
)
logs
,
130 Rosario Delgado, Maria Jolis i Frederic Utzet
tenim que, prenent logaritmes,
(7)
log(P/P
0
)
logs
logN < log(
r +V
V
)
_
log(P/P
0
)
logs
+1
_
logN . (8)
Ara introdum la notaci =
log(1/s)
logN
, i tenim que > 1 ja que s < 1/N. Amb
aquesta notaci,
(8)
1
log(
P
P
0
) < log(
r +V
V
)
1
_
log(
P
P
0
) +logs
_
log
_
(
P
P
0
)
_
< log(
r +V
V
) log
_
(s
P
P
0
)
_
(
P
P
0
)
<
r +V
V
(s
P
P
0
)
P
P
0
> (
r +V
V
)
s
P
P
0
C
1
(r +V)
< P C
2
(r +V)
,
amb
C
1
=
P
0
V
=
P
0
(N 1)
i C
2
=
P
0
s V
=
P
0
s (N 1)
,
constants positives que noms depenen de N i s. 2
Nota. En el captol 38 de [18] es comenta que el valor de D = 1/ =
logN
log(1/s)
(< 1) s la dimensi fractal dun conjunt de Cantor a linterval [0, 1], cosa que
sobt traient de linterval tots els nmeros que inclouen el dgit 0 en alguna
posici diferent de la darrera xifra decimal. Notem que la prova anterior sha
fet en una situaci que ens ha portat a obtenir un valor de D < 1 (ja que > 1).
Ja hem comentat abans que aquest s el valor corresponent a les llenges ms
naturals, mentre que un valor < 1 noms es dna amb un vocabulari limitat
articialment.
Conseqncies
Com a conclusi podem dir que, dins el camp de la lingstica, les implicacions
de les lleis de potncia que hem presentat (llei de Zipf i llei de Zipf-Mandelbrot)
sn molt importants, per exemple, per als professors i estudiants de llenges
estrangeres, ja que de les lleis es dedueix que la necessitat per part dels
estudiants de conixer un gran volum de vocabulari s altament infreqent, i,
per tant, que s millor treballar amb materials docents bsics que continguin
un nombre limitat de vocabulari, i deixar que laprenentatge dun vocabulari
ms avanat es faci de manera ms gradual en el temps.
Daltra banda, aquestes lleis tamb van despertar un cert inters en altres
mbits. Com a model, sn molt diferents del model gaussi: una llei de potncia
assigna probabilitats no nul
.
les als elements molt grans, mentre que la cua de
tipus exponencial de la distribuci gaussiana assigna probabilitats extremament
petites (prcticament zero) als elements que sn molt ms grans que la mitjana.
Mandelbrot i latzar 131
Per exemple, la mida de les ciutats, que segueix una llei de potncia com hem
comentat, inclou la consideraci de les megaciutats, que sn diversos ordres
de magnitud ms grans que la mida mitjana de totes les ciutats. En canvi, la
distribuci gaussiana, que descriu, per exemple, lalada de les persones, no
preveu (li assigna probabilitat prcticament zero) el cas de persones amb una
alada de diverses vegades lalada mitjana de la poblaci.
I ja ms recentment, sha vist que la mida dels crters de la Lluna o la
magnitud dels moviments ssmics, per citar exemples del mn fsic, segueixen
lleis de potncia (vegeu [23]). Per tamb les noves tecnologies nestan plenes;
larticle [2] es dedica a explicar que les lleis de potncia (que anomena genrica-
ment lleis de Zipf, fent un abs del llenguatge), sn les que governen moltes
de les caracterstiques dInternet. Com sexplica en aquest article, encara que
inicialment no ho semblava a causa de la seva gran variabilitat, de seguida es
va veure que existeix un patr generalitzat quant a la mida dels elements que
hi ha al web: hi ha molts elements petits per pocs que siguin molt grans (com
s de familiar aquest patr!). Per exemple, pocs llocs estan formats per milions
de pgines, mentre que milions de llocs estan formats noms per un grapat
de pgines. Pocs llocs contenen milions denllaos, mentre que molts llocs en
tenen noms un o dos. Milions dusuaris acudeixen a uns pocs llocs seleccio-
nats, prestant poca atenci als milers daltres llocs, que s que sn visitats per
un grup redut dusuaris. A [4] es troben dades relatives a aquest fenomen; la
taula segent (taula 5 [4]) recull els deu llocs locals ms populars entre usuaris
de la Universitat de Boston (aqu local vol dir que els llocs visitats eren de
servidors de la mateixa universitat, s a dir, acabaven en bu.edu).
Lloc Rang Freqncia
r f(r)
cs-www.bu.edu 1 97477
www.bu.edu 2 9283
web.bu.edu 3 4566
lobster.bu.edu 4 3385
spiderman.bu.edu 5 2184
gopher.bu.edu 6 1513
conx.bu.edu 7 862
acs2.bu.edu 8 593
cng.bu.edu 9 333
miranda.bu.edu 10 330
Prenent logaritmes, fem lanlisi de la regressi lineal amb Y = log(f(r)) i
X = log(r), i veiem que la relaci lineal s bona, amb el diagrama de dispersi
que mostra la gura 2 i el coecient de determinaci, que s R = 0,9785
(el coecient de correlaci s r =
= 4,8765 (llavors,
C = 10
C
= X
t
, t I, amb
I R. Si I = [0, +), tamb escrivim X
= X
t
, t 0.
En aquesta situaci, seria massa optimista esperar observar una autosimili-
tud exacta, determinista, donada la naturalesa aleatria del fenomen. De fet,
quan observem el fenomen al llarg del temps, el que obtenim s una realitzaci
concreta del procs estocstic (o trajectria) i, a diferncia del que succeeix
amb els objectes fractals deterministes, en aquest cas no observarem en la
trajectria una similitud exacta entre les parts i el tot, sin que noms tindrem
una certa semblana en el seu grc (amb el canvi descala convenient). s
per aix que en aquest cas sintrodueix una versi ms relaxada del que s
lautosimilitud: lautosimilitud en el sentit de les distribucions.
134 Rosario Delgado, Maria Jolis i Frederic Utzet
Definici 3. Direm que el procs estocstic X
= X
t
, t 0 s autosimilar
(o fractal) dndex H (0, 1) si per a tota constant a > 0, el procs canviat
descala a
H
X
at
, t 0 t les mateixes distribucions en dimensi nita
2
que el procs original. Dit duna altra manera, lautosimilitud implica que un
canvi a lescala del temps que consisteix a multiplicar el temps t per una
constant a > 0 s equivalent al canvi a lescala de lespai destats consistent
a multiplicar lestat del procs per a
H
. Si a > 1 (el temps sestira o dilata),
saplica el factor de contracci a
H
per tal de fer que la magnitud X
at
sigui
comparable amb X
t
. Si a < 1, es compleix just el contrari. Llavors, X
at
t la
mateixa distribuci que a
H
X
t
, s a dir, tenim una llei de potncia que relaciona
X
at
amb X
t
.
El rang seqencial
Com sha dit, la motivaci original de Mandelbrot per a triar el moviment
browni fraccionari com a model per a certes mesures hidrolgiques prov
de resultats emprics analitzats per Hurst. Aquests resultats es referien a
lanomenat rang seqencial, que denim a continuaci en el context dels
processos estocstics.
Definici 4. Sigui X
= X
t
, t 0 un procs estocstic. El seu rang seqencial
es deneix com
M(t, T) = sup
tst+T
_
X
s
X
t
_
inf
tst+T
_
X
s
X
t
_
,
per a qualssevol t, T 0. Si el procs t trajectries contnues, aleshores es
poden substituir el suprem i lnm pel mxim i el mnim, respectivament.
Hurst va observar que els enregistraments de cabal del Nil i altres rius,
el preu del blat i altres sries fsiques tals com la pluja caiguda, tempera-
tures i altres, compleixen que aquest rang seqencial M(t, T) es comporta
(independentment de t) de manera proporcional a T
H
amb
1
2
< H < 1. Ms
precisament:
3
M(t, T) t la mateixa llei que T
H
M(0, 1). (9)
Aix va ser causa de gran sorpresa per als estadstics de lpoca ja que els
models ms usats ns aleshores, tals com
X
t
=
_
t
0
Y
s
ds ,
on Y
= B
t
, t R
s un moviment browni estndard si B
0
= 0 t increments independents i per
a qualssevol t
1
, t
2
R, B
t
1
B
t
2
t distribuci normal amb mitjana 0 i varincia
t
1
t
2
.
Tot i que la memria llarga es presenta quan lndex dautosimilitud H
pertany a linterval (
1
2
, 1), es pot donar una denici del moviment browni
fraccionari dndex dautosimilitud H per a tot H (0, 1).
Definici 6. Sigui H (0, 1). El moviment browni fraccionari dndex H s el
procs estocstic B
H
= B
H
t
, t 0
5
denit de la manera segent:
B
H
0
= 0
B
H
t
=
1
(H +
1
2
)
_
_
0
_
(t s)
H1/2
(s)
H1/2
_
dB
s
+
+
_
t
0
(t s)
H1/2
dB
s
_
si t > 0. (10)
4 Es diu que el procs estocstic X
= X
t
, t 0 t els increments estacionaris si X
t+h
X
h
t la mateixa distribuci que X
t
X
0
, t, h > 0.
5 Tamb es pot denir B
H
t
per a t < 0, de manera semblant.
136 Rosario Delgado, Maria Jolis i Frederic Utzet
Ara hem daclarir qu volen dir les integrals respecte del moviment browni
que apareixen a la denici que acabem de donar. Com que es pot demos-
trar que les trajectries del moviment browni, tot i ser contnues, sn no
diferenciables en tot punt i que ni tan sols sn de variaci acotada en els
intervals nits, hem de justicar que aquestes integrals es poden denir.
La integral de funcions deterministes respecte del moviment browni rep el
nom dintegral de Wiener. Donarem aqu la idea de com es construeix. Si f s
una funci simple de la forma
f =
m
_
i=1
c
i
1
(s
i
,t
i
)
on les c
i
sn constants arbitrries i 1
(s
i
,t
i
)
no s ms que la funci indicatriu de
linterval (s
i
, t
i
) (s a dir, 1
(s
i
,t
i
)
(s) = 1 si s (s
i
, t
i
) i s nul
.
la en cas contrari),
es deneix la integral de Wiener de f respecte de B de la manera natural com
I(f) =
m
_
i=1
c
i
(B
t
i
B
s
i
),
i tamb es denota per
_
+
f(s) dB
s
.
Daquesta denici sobt (a ms del fet que la integral no depn de la
representaci de f com a funci simple i que s un operador lineal) que
I(f) s una variable aleatria gaussiana amb mitjana zero, i es compleix que la
covarincia entre dues daquestes integrals s:
E
_
I(f)I(g)
_
=
_
+
_
(t
2
s)
H
1
2
(t
1
s)
H
1
2
_
dB
s
+
_
t
2
t
1
(t
2
s)
H
1
2
dB
s
_
=
=
1
(H +
1
2
)
_
+
_
(t
2
s)
H
1
2
+
(t
1
s)
H
1
2
+
_
dB
s
,
on estem usant la notaci x
+
per a la part positiva de x, s a dir x
+
= maxx, 0.
Com que E(B
H
t
2
B
H
t
1
) = 0, tenim que Var(B
H
t
2
B
H
t
1
) = E
_
(B
H
t
2
B
H
t
1
)
2
_
i aplicant
(11) sobt que
Var(B
H
t
2
B
H
t
1
) =
_
1
(H +
1
2
)
_
2
_
+
_
(t
2
s)
H
1
2
+
(t
1
s)
H
1
2
+
_
2
ds =
=
_
1
(H +
1
2
)
_
2
_
_
t
1
_
(t
2
s)
H
1
2
(t
1
s)
H
1
2
_
2
ds +
_
t
2
t
1
(t
2
s)
2H1
ds
_
.
138 Rosario Delgado, Maria Jolis i Frederic Utzet
La segona integral de lexpressi anterior s immediata i dna
1
2H
(t
2
t
1
)
2H
.
Fent a la primera integral successivament els canvis de variable u = t
1
s i
u = (t
2
t
1
) r arribem a
Var(B
H
t
2
B
H
t
1
) =
_
1
(H +
1
2
)
_
2
_
_
+
0
_
(1 +r)
H
1
2
r
H
1
2
_
2
dr +
1
2H
_
(t
2
t
1
)
2H
=
= C
H
(t
2
t
1
)
2H
,
on estem anomenant C
H
la constant multiplicativa que acompanya (t
2
t
1
)
2H
.
Un cop vist que B
H
s autosimilar
dndex H. Hem de veure que, per a tota constant a > 0, els processos B
H
t
, t
0 i a
H
B
H
at
, t 0 tenen les mateixes distribucions en dimensi nita, per
com que tots dos sn processos gaussians amb esperana nul
.
la, noms cal
comprovar que tenen la mateixa funci de covarincies, s a dir que
E
_
(a
H
B
H
as
) (a
H
B
H
at
)
_
= E
_
B
H
s
B
H
t
_
.
I aix s clar, per (12).
Com sha dit abans, en larticle [21] sestudien algunes propietats importants
del moviment browni fraccionari. Aqu ens centrarem en les propietats de
regularitat de les seves trajectries. Aquestes trajectries sn contnues (ms
precisament, existeix una versi del procs amb trajectries contnues) i no
diferenciables.
La continutat es prova usant el resultat segent, conegut com a criteri de
continutat de Kolmogorov.
Teorema 7. Sigui X
= X
t
, t 0 un procs estocstic amb valors reals. Supo-
sem que per a qualsevol T > 0 existeixen constants positives i K i una altra
constant > 1 tals que
E
_
X
t
X
s
_
Kt s
,
per a tots s, t [0, T]. Aleshores existeix una versi contnua de X
, s a dir,
existeix un altre procs estocstic
X
X
t
, t 0 tal que
t trajectries contnues;
per a qualsevol t 0 se satisf que P
X
t
= X
t
= 1.
Mandelbrot i latzar 139
En el cas del moviment browni fraccionari tenim que
E
_
B
H
t
B
H
s
2
_
= Var
_
B
H
t
B
H
s
_
= C
H
t s
2H
,
i lexponent 2H s ms gran que 1 noms si H > 1/2. Ara b, si Y s una
variable aleatria gaussiana amb esperana 0 i varincia
2
, podem expressar
lesperana de qualsevol potncia de Y en funci de . Ms concretament,
per a tot > 0 existeix una constant C
tal que
E
_
Y
_
= C
.
Aplicant aquesta propietat a Y = B
H
t
B
H
s
tindrem que, per a tot > 0,
E
_
B
H
t
B
H
s
_
= C
C
/2
H
t s
H
= Kt s
H
i si >
1
H
lexponent = H ja s ms gran que 1. Per tant B
H
t una versi
amb trajectries contnues.
Com hem comentat abans, les trajectries del moviment browni fraccionari
sn no diferenciables. En aquest sentit, Mandelbrot i Van Ness provaren el
resultat segent.
Proposici 8. (Vegeu la proposici 4.2 de [21].) Per a tot t 0 es compleix que,
amb probabilitat 1,
limsup
h0+
B
H
t+h
B
H
t
h
= +.
(Tamb es t el resultat anleg prenent el lmit superior per lesquerra.)
a) H = 0, 2. b) H=0, 5 (moviment browni). c) H = 0, 8.
Figura 3: Trajectries del moviment browni fraccionari amb diferents
valors de H.
No farem aqu la prova daquesta proposici per s que en donarem una
justicaci intutiva. Si considerem el quocient incremental
B
H
t+h
B
H
t
h
,
140 Rosario Delgado, Maria Jolis i Frederic Utzet
la seva varincia s igual a h
2H2
, que tendeix a innit quan h tendeix a zero
(ja que 0 < H < 1). Aix impedeix que el quocient incremental pugui tenir un
lmit nit en mitjana quadrtica.
La no-diferenciabilitat de les trajectries implica que sn molt irregulars, en-
cara que contnues. El grau dirregularitat disminueix a mesura que H augmenta,
com es pot veure a la gura 3.
El moviment browni fraccionari i lanlisi estocstica
El moviment browni fraccionari s el procs estocstic ms senzill que gaudeix
de les propietats dautosimilitud i memria llarga, cosa que el fa idoni com a
model en moltes aplicacions. Daltra banda, en lanlisi estocstica clssica, el
moviment browni estndard s la base per a obtenir molts altres processos,
com per exemple els processos de difusi, que poden ser construts com a so-
lucions dequacions diferencials estocstiques. A aquestes equacions sels dna
sentit com a equacions integrals en qu apareixen integrals de processos esto-
cstics respecte del moviment browni. Aix requereix la construcci daquesta
mena dintegrals i lanleg a la frmula del canvi de variables, lanomenada
frmula dIt.
Sembla natural seguir les mateixes idees per tal de construir nous processos
estocstics que puguin ser adequats com a models, usant com a integrador el
moviment browni fraccionari. Aquest inters per lanlisi estocstica respecte
del moviment browni fraccionari va comenar els darrers anys de la dcada
dels noranta i principis dels dos mil. El problema s interessant com a repte
matemtic, ja que el clcul clssic utilitza com a integradors processos que
sn semimartingales, i es va demostrar ben aviat que el moviment browni
fraccionari noms s semimartingala en el cas H = 1/2, s a dir, en el cas
que sigui un moviment browni estndard. Lanlisi estocstica respecte del
moviment browni fraccionari s actualment una rea de recerca molt activa.
3 Mandelbrot i les nances
Mandelbrot va fer una contribuci important a la modelitzaci matemtica de
les dades nanceres i econmiques, refutant el paradigma estadstic habitual
que diu que aquesta mena de dades potser desprs dalguna transformaci
sn gaussianes. Aquesta suposici t molts avantatges terics i prctics: el
mn gaussi s molt ms senzill que altres possibles alternatives: per exemple,
en un vector aleatori gaussi, la incorrelaci (absncia de relaci lineal) entre
les components equival al fet que aquestes siguin independents, o lesperana
condicionada es pot calcular senzillament mitjanant una projecci lineal sobre
un subespai. Diferents investigadors ja havien assenyalat que moltes dades
reals no encaixaven en un model gaussi, per Mandelbrot, en un celebrat article
de 1963 (vegeu [15], tamb reprodut a [19]) va aprofundir molt ms en aquest
fet, i va proposar models alternatius. En posteriors articles va anar polint
les idees inicials, i posteriorment va desenvolupar tamb una aproximaci
Mandelbrot i latzar 141
fractal a les dades nanceres. Nosaltres, per, ens centrarem en els aspectes
probabilstics i estadstics del seu treball.
Tal com veurem, una de les caracterstiques importants dels models pro-
posats per Mandelbrot s que posen de manifest que les nances sn molt
ms perilloses del que els gestors de fons dinversions o altres professionals
del tema diuen; que les grans caigudes de la borsa no sn coses atpiques i
extraordinries, sin que cal esperar-ne molt sovint. Actualment ja estem tan
acostumats als daltabaixos de les borses, i tanta gent ha perdut tants diners,
que aix no ens diu res de nou, per als anys setanta i vuitanta del segle pas-
sat les armacions de Mandelbrot sonaven com un pessimista clam al desert.
La llunyana crisi de lany 1929 estava superada, i molts anys de bonana i
creixement econmic feien mirar la borsa amb optimisme; tot semblava sota
control. Evidentment, la crisi de 1987, la fallida el 1998 de Long Term Capital
Management (lempresa assessorada pels premis Nobel Merton i Scholes) i la
brutal crisi del 2008 que encara patim, i que no sabem com acabar van,
en certa mesura, conrmar les profecies funestes de Mandelbrot.
Tot i que Mandelbrot gaireb comparava la seva contribuci a les nances
amb el pas de la cosmologia de Ptolomeu a la de Galileu i Kepler, i que les seves
propostes han estat desenvolupades i molt estudiades tericament, la praxi
nancera continua ancorada bsicament en models gaussians, que, tal com hem
comentat, sn molt ms senzills dimplementar; lalternativa de Mandelbrot no
s, de fet, un nic model, sin un ampli ventall didees i models, amb un grau
de sosticaci matemtica molt ms elevat, amb nombrosos parmetres per
estimar; aix, evidentment, no s fcil de fer arribar als professionals de les
nances. Daltra banda, aquests models encareixen els preus dels productes
nancers, ja que cal preveure un comportament de la borsa amb possibilitats
de caigudes o pujades ms fortes; llavors, tant si les coses van b com si van
malament, quin banc, intermediari o venedor de productes nancers vol vendre
ms car que els altres?
Analitzant les dades
Lorigen de les idees de Mandelbrot est en el seu estudi de dades nanceres
i econmiques, amb una gran intel
.
ligncia i la ment molt oberta. Explicava
que, durant la Segona Guerra Mundial, el seu pare, dorigen jueu, havia estat
presoner en un camp de concentraci alemany; un dia un escamot va aconseguir
alliberar un grup de presoners (el seu pare entre ells), els quals van fugir tots
en grup per un cam, excepte el seu pare que va seguir un altre cam tot sol; tot
el grup va morir, mentre que el seu pare es va salvar; aquesta independncia
de criteri, lactitud danalitzar la situaci per si mateix, i no seguir el grup, va
ser deia Mandelbrot el seu model de comportament en totes les facetes
de la seva vida. Mandelbrot comenta que va analitzar i tornar a analitzar
incomptables sries temporals; en particular, una de les que va analitzar primer
i amb ms insistncia va ser la dels preus del cot, dels quals tenia dades
diries de diferents mercats des del segle xix, i que ms endavant comentarem.
142 Rosario Delgado, Maria Jolis i Frederic Utzet
De moment, nosaltres refarem part del seu estudi utilitzant les dades de
tancament diari de lIBEX 35. Aquest ndex fou creat el 14 de gener de 1992
i s un dels grans indicadors de leconomia espanyola; es tracta dun ndex
ponderat per capital borsari de les trenta-cinc empreses amb ms liquiditat
que cotitzen a les borses espanyoles.
A la gura 4 a) hi ha les dades dels valors de tancament diari de lIBEX 35 des
del 14 de gener de 1992 al 30 de juny de 2011. En aquest grc podem notar les
grans crisis mundials, i les petites crisis, una tendncia creixent, la irregularitat
daquestes dades (que, de manera genrica, sanomena la volatilitat), etc.
Com hem comentat abans, el model estndard de dades nanceres als
anys seixanta (i encara ara) consistia en el fet que desprs de fer alguna
transformaci, les dades resultants es comportaven com una srie gaussiana.
Compararem les dades reals amb unes dades simulades que, duna banda,
corresponen a un model habitual, i de laltra, sassemblen fora a les dades
reals. Ms concretament, a la gura 4 b) hi ha unes dades simulades a partir
dun procs estocstic, anomenat moviment browni geomtric, denit per
X
t
= X
0
expt +B
t
, (13)
on B
t
, t 0 s un moviment browni estndard. Els valors de i han
estat estimats a partir de les dades de lIBEX 35; malgrat les aparences, lajust
del model a les dades no s bo i no resisteix lanlisi de residus ms senzilla;
de fet (que nosaltres sapiguem), no hi ha models terics satisfactoris del
comportament de lIBEX 35 que cobreixin els quasi vint anys de dades, per
per a il
.
lustrar les idees de Mandelbrot en tindrem prou. La semblana entre
les dades reals i les dades simulades s fora notable. Si tragussim els rtols,
alg podria distingir quines sn les dades reals? Mandelbrot s que podria.
92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11
2000
4000
6000
8000
10000
12000
14000
16000
18000
a) Valor de tancament diari de lIBEX 35
des de gener de 1992 al 30 de juny de 2011.
b) Dades simulades amb un browni
geomtric.
Figura 4: Grcs amb dades reals i dades simulades: quin s quin?
Habitualment les dades nanceres no sanalitzen directament sin que
sutilitzen els log-retorns dels preus: si X
n
, n = 1, . . . , T sn els preus dun
Mandelbrot i latzar 143
actiu nancer, sanomenen log-retorns les quantitats
Y
n
= lnX
n+1
lnX
n
, n = 1, . . . , T 1
(on ln denota el logaritme natural). Noteu que si les dades corresponen al movi-
ment browni geomtric (13) (mirat en temps discret, t = 1, 2, . . . ), aleshores
els log-retorns formen una successi de variables normals independents totes
amb mitjana i desviaci tpica .
Des del punt de vista de la modelitzaci, el motiu per a analitzar els log-
retorns en lloc dels preus s el segent: sigui a > 0 i desenvolupem per Taylor
la funci lnx en un entorn de a:
lnx = lna +
1
a
(x a) +r(x),
on r(x) s el terme complementari. Si negligim el terme complementari, tin-
drem
lnx lna
1
a
(x a).
Si ho apliquem a dos preus consecutius X
n
i X
n+1
, tindrem
lnX
n+1
lnX
n
X
n+1
X
n
X
n
.
Per tant, els log-retorns sn, aproximadament, els increments relatius dels
preus. Empricament es coneix que els increments relatius tenen propietats
estadstiques millors que el preus originals.
A la gura 5 hi ha representats els log-retorns de les dades reals i de les
simulades: ara ja no es veuen tan semblants. Aix com les dades simulades
tenen un aspecte molt ms regular, a les dades reals hi ha perodes on els
log-retorns varien poc, mentre que en daltres varien molt. Daltra banda, a les
dades reals hi ha molts valors que sn notablement ms grans que els altres.
92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
a) Log-retorns de lIBEX 35.
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
b) Log-retorns del browni geomtric.
Figura 5: Log-retorns.
144 Rosario Delgado, Maria Jolis i Frederic Utzet
Mirem els histogrames daquestes dades a la gura 6, amb una corba normal
ajustada a la seva mitjana i varincia. bviament, les dades simulades sajusten
molt b a la corba normal, per les dades reals semblen ser ms punxegudes
del que correspon a unes dades normals: es diu que tenen una distribuci
leptocrtica. A ms, si ampliem les cues de lesquerra, vegeu la gura 7 (el
mateix passa a la dreta), veiem que les dades reals tenen moltes observacions
per sota de m3s, on m s la mitjana mostral i s la desviaci tpica mostral.
-0.04 -0.02 0 0.02 0.04 0.06
a) Histograma dels log-retorns de lIBEX 35.
-0.04 -0.02 0 0.02 0.04
b) Histograma dels log-retorns del browni geo-
mtric.
Figura 6: Histogrames dels log-retorns.
-.042 -.038 -.034 -.03 -.026 -.022 -.018
m3s
a) Log-retorns de lIBEX 35.
-.042 -.038 -.034 -.03
m3s
b) Log-retorns del browni geomtric.
Figura 7: Ampliaci de les cues de lesquerra.
Si la distribuci de les dades fos normal de mitjana m i desviaci tpica s,
aleshores la probabilitat dobservar valors menors que m3s seria 0,00135.
Llavors, ats que tenim 4904 dades, i
4904 0,00135 = 6,62,
aproximadament 6 o 7 dades haurien de ser menors que m3s. Veiem a la
gura 8 que aquest s el cas amb les dades simulades amb el moviment browni
geomtric. Al contrari, a les dades reals de lIBEX 35, gura 9, hi ha 39 valors
ms petits que m 3s, s a dir, aproximadament 5 vegades ms del que s
raonable. Cadascun daquests valors extrems representa una caiguda important.
Encara ms, si mirem les dades per sota de m4s, segons el model normal
Mandelbrot i latzar 145
tenen una probabilitat de 0,00003. s a dir, caldria esperar-ne (de mitjana) una
cada 130 anys, i nhi ha hagut 13 durant els 20 anys de lIBEX 35! Vegeu a la
gura 10 on estan localitzades temporalment les caigudes ms importants de
lIBEX 35.
Figura 8: Valors extrems del browni geomtric.
Figura 9: Valors extrems en lIBEX 35.
La conclusi s que caigudes molt fortes que, dacord amb el model estn-
dard amb qu es fan tots els clculs, shaurien de produir molt poc sovint, ns
i tot, prcticament mai, es produeixen molt sovint. No cal dir que cada cop que
es produeix una daquestes caigudes molta gent perd molts diners, per altres
espavilats nhi guanyen molts.
Mandelbrot treu dues conclusions daquestes anlisis:
1) El model gaussi no s adient. Cal utilitzar un model amb una distribuci
de probabilitat que tingui les cues ms pesades
6
que la gaussiana, i que, per
tant, doni ms probabilitat als extrems de la distribuci.
2) s insostenible que el model (teric) tingui trajectries contnues, i cal un
model que incorpori salts.
La propietat dinvarincia per canvis descala
Com hem dit abans, un dels conjunts de dades que ms intensament va ana-
litzar Mandelbrot va ser el dels preus del cot. Reprodum a la gura 11 un
dels seus grcs, al qual tenia molta estimaci. Es tracta dun grc en escala
logartmica en els dos eixos, on es dibuixen les cues de lesquerra indicades
per a
, b
i c
, b
, c
Figura 11: Cues dels preus del cot i densitat de la llei estable amb
= 1, 7.
Les lleis estables
Una propietat important de les lleis gaussianes s llur estabilitat per sumes: la
suma de dues lleis normals independents dna una llei normal. Ms general-
ment, tenim la propietat segent: si X
1
i X
2
sn dues lleis normals J(,
2
)
independents i a, b R, aleshores
aX
1
+bX
2
d
= J((a +b), (a
2
+b
2
)
2
)
(la notaci
d
= vol dir igualtat en distribuci o llei). Si prenem ara una altra
variable X
d
= J(,
2
), i posem
h =
_
a
2
+b
2
i g = (a +b h),
llavors tamb
hX +g
d
= J((a +b), (a
2
+b
2
)
2
),
don resulta
aX
1
+bX
2
d
= hX +g.
Aquesta propietat dna lloc a la denici de llei estable:
148 Rosario Delgado, Maria Jolis i Frederic Utzet
Definici 9. Direm que una variable X s estable si donades dues variables
X
1
i X
2
independents, ambdues amb la mateixa llei que X, tenim que per a
qualssevol a, b R, existeixen h, g R tals que
aX
1
+bX
2
d
= hX +g.
Quan la relaci anterior es compleix amb g = 0 per a qualssevol a, b R,
aleshores es diu que X s estrictament estable.
Vegeu [27] per a una altra caracteritzaci de les lleis estables.
Ara cal citar el genial matemtic francs Paul Lvy (18861971), que s un
dels ms grans probabilistes del segle xx i que juntament amb Kolmogorov s
considerat un dels fundadors de la teoria de la probabilitat moderna. Mandel-
brot va ser alumne de Lvy a lEscola Politcnica, i, tal com comenten Jarque
i Fagella [8], hi ha una certa polmica sobre si Lvy va ser o no el director de
la tesi doctoral de Mandelbrot. Retornant a les lleis estables, Lvy va assistir a
una xerrada on el conferenciant va dir que lnica llei estable era la gaussiana
(vegeu [27]); pensant-hi detingudament va veure que no era veritat, i llavors va
trobar i caracteritzar totes les lleis estables. En general, la funci de densitat
no es pot donar de forma explcita, per s que s coneguda la seva funci
caracterstica, que depn de quatre parmetres: concretament, Lvy va provar
que una variable aleatria X s estable si i noms si la seva funci caracterstica
(u) := E(e
iuX
), u R,
s de la forma
(u) = exp
_
(1 isignu tan
2
) +iu
_
, quan }= 1,
o b
(u) = exp
_
u(1 +i
2
i c
(x) = PX < x C
,
Mandelbrot i latzar 149
s a dir, una llei estable (amb (0, 2)) t cues pesades dacord amb la
denici 12.
Basant-se en la gura 11 i els seus clculs, Mandelbrot va raonar que per a
modelitzar les dades del cot calia utilitzar una llei estable amb = 1,7. El fet
que llavors E[X
2
] = + quadrava amb els clculs de la varincia mostral, que
com que prenia ms dades semblava crixer indenidament. A la gura 12 hi
ha representades la densitat de la llei estable de parmetre = 1,7 comparada
amb la densitat duna llei normal que talla leix dordenades al mateix punt.
Noteu que semblen prcticament iguals, per les cues de la llei estable sn ms
pesades que les de la normal i, per tant, els valors grans sn ms probables, i a
ms fan que la varincia sigui innita.
0.1
0.2
0.3
-6 -4 -2 0 2 4 6
a) Lnia contnua: densitat de la llei estable.
Lnia discontnua: densitat duna llei nor-
mal.
-6 -5 -4
b) Ampliaci de les cues de lesquerra.
Figura 12: Comparaci de les densitats de la llei estable de parmetres
= 1,7; = 0; = 0; = 0, i la duna llei normal que talla leix
dordenades al mateix punt.
Processos de Lvy
Un procs estocstic X
t
, t 0 es diu que s un procs de Lvy si
1) X
0
= 0.
2) T increments independents: per a qualssevol 0 t
1
< t
2
< < t
n
, les
variables
X
t
2
X
t
1
, . . . , X
t
n
X
t
n1
sn independents.
3) Els increments sn estacionaris: per a qualssevol t, h > 0,
X
t+h
X
h
d
= X
t
X
0
.
4) El procs t trajectries que en tot punt sn contnues per la dreta i tenen
lmit per lesquerra.
150 Rosario Delgado, Maria Jolis i Frederic Utzet
Els exemples ms importants de processos de Lvy sn el moviment browni
estndard i el procs de Poisson. Cal remarcar que, excepte el moviment
browni, tots els processos de Lvy tenen trajectries amb discontinutats, que
era una de les caracterstiques dels models que Mandelbrot cercava.
Es demostra que existeix un procs de Lvy tal que la distribuci de la
variable X
1
s estable (resp. estrictament estable). En aquest cas es diu que
tenim un procs de Lvy estable (resp. procs de Lvy estrictament estable).
Un procs de Lvy estrictament estable s autosimilar amb ndex H = 1/
segons la denici 3, i s el parmetre destabilitat de X
1
. De fet, el recproc
daquesta propietat tamb s cert, i tenim que un procs de Lvy s autosimilar
si i noms s s estrictament estable (vegeu [27]).
Per tant, un procs de Lvy estrictament estable tenia alhora la propietat
dinvarincia per canvis descala (autosimilitud), les cues pesades amb varincia
innita, i els salts. Aquest va ser el model proposat per Mandelbrot per als
preus del cot: un procs de Lvy estrictament estable amb = 1,7.
Val a dir que Mandelbrot va analitzar moltes altres dades nanceres i eco-
nmiques, i que va proposar altres models dacord amb les caracterstiques
especques de les dades; en particular va utilitzar processos en qu les va-
riables tinguessin lleis de potncia. Tamb va utilitzar el moviment browni
fraccionari per a certes sries en les quals observava memria llarga. El lector
interessat pot consultar [18, 19, 20].
4 Mandelbrot i lenginyeria del teletrnsit
En larticle seminal de Leland, Taqqu, Willinger i Wilson de lany 1993 [10]
sestableixen les bases per tal de considerar lautosimilitud com la caracters-
tica ms important del teletrnsit per a lenteniment de la natura de la seva
dinmica, de cara a la modelitzaci i a lestudi del comportament de les xarxes
de telecomunicacions. A partir daquest article han sorgit un gran nombre de
treballs dinvestigaci sobre la polifactica natura daquest fenomen, fenomen
que s una nova concreci de la visi de Benot Mandelbrot dun ordre en els
sistemes fsics, socials i denginyeria caracteritzats pel fet de mantenir alguna
propietat sota canvi descala i que es formalitza amb una llei de potncia.
Encara que Mandelbrot no va treballar directament en la modelitzaci del
teletrnsit, s ben cert que ha tingut una inuncia decisiva en aquest camp.
En primer lloc, perqu alguns dels conceptes que havia introdut en relaci
amb la lingstica, la hidrologia i els models econmics tamb hi sn aplicables
i, encara ms, resulten ser fonamentals en la comprensi del fenomen que
representa el teletrnsit. Aquests conceptes sn lefecte Josep, lefecte No i
lautosimilitud. En segon lloc, perqu en larticle conjunt amb James Wallis
de lany 1969 [22], va proposar un model econmic en el qual es basa el
model estructural de fonts On/Off introdut lany 1997 a [30], que s un dels
models ms utilitzats actualment pel teletrnsit. I, nalment, perqu en larticle
conjunt amb Van Ness del 1968 [21], tal com hem comentat en la secci 2, va
comenar lestudi del procs de moviment browni fraccionari i va emfasitzar
Mandelbrot i latzar 151
la seva adequaci com a model de diferents fenmens naturals que presenten
memria llarga. Un daquests fenmens s el del teletrnsit (fenomen potser
no natural per que s que presenta memria llarga), com queda patent quan
Taqqu i els seus col
.
laboradors demostren que quan es treballa amb el model
de fonts On/Off, s precisament el moviment browni fraccionari el procs
lmit al qual tendeix la crrega de treball acumulada associada a la xarxa de
telecomunicacions, convenientment normalitzada. A continuaci explicarem
aix amb una mica de detall.
Efecte Josep i efecte No
Aquestes dues expressions, actualment molt utilitzades en lmbit de lengi-
nyeria, van ser introdudes per Mandelbrot i Wallis quan les van fer servir per
primera vegada a [22], article dedicat a Harold Edwin Hurst, on es presentava
el procs de moviment browni fraccionari com a model autosimilar adequat
en hidrologia, tal com hem comentat en la secci 2.
Mandelbrot i Wallis proposen el terme efecte No per a lobservaci de
precipitacions molt extremes a partir del fragment segent del llibre del Gnesi
que descriu el diluvi universal (Gnesi: 7, 1112):
[...] No tenia sis-cents anys quan van sobreeixir les aiges abismals del
gran oce i sobriren les rescloses del cel. Era el dia disset del mes segon. Sobre
la terra comen a caure un aiguat que dur quaranta dies i quaranta nits.
Tamb proposen el terme efecte Josep pel fet de trobar perodes molt llargs
de precipitacions inusualment grans o inusualment petites a partir de lepisodi
bblic de la interpretaci que fa Josep del somni del fara dEgipte sobre les set
vaques grasses i les set vaques magres (Gnesi: 41, 2930):
[...] Els set anys vinents seran duna gran abundncia en tot Egipte. Desprs
seguiran set anys de fam que esborraran a Egipte el record de labundncia
dels set anys precedents, perqu la fam consumir tot el pas.
Aquests efectes no noms sobserven en lmbit de la hidrologia, en el
qual van ser batejats, sin tamb en economia i enginyeria, en qu les dades
obtingudes acostumen a suggerir la presncia de fortes correlacions en el
temps. La persistncia, com tamb sanomena de vegades lefecte Josep que
acabem de descriure, sexplica intutivament per una tendncia natural de les
observacions en el temps a agrupar-se formant clsters, cosa que succeeix
en molts sistemes fsics o denginyeria. s a dir, les dades mostren uctuacions
per sobre o per sota dun nivell donat durant llargs perodes de temps, molt
ms sovint del que passaria en el cas que fossin independents.
Des dun punt de vista matemtic, la persistncia o efecte Josep (tamb
anomenat sndrome H-espectre en larticle [17] en relaci amb les observacions
econmiques que mostren cicles) es descriu pel terme dependncia a llarg ter-
mini o memria llarga de la manera segent: considerem un procs estocstic
Y
= Y
t
, t 0 que representa les observacions que tenim del nostre sistema
fsic o denginyeria, en funci del temps.
152 Rosario Delgado, Maria Jolis i Frederic Utzet
Definici 10. Si Y
L() > 0, si Y
= Y
t
, t 0 s un procs autosimilar dndex H
(1/2, 1), amb increments estacionaris i totes les variables del procs tenen
varincia nita, llavors Y
un procs autosimilar
dndex H (0, 1), amb increments estacionaris i tal que totes les variables del
procs tenen varincia nita, es compleix el segent (vegeu la proposici 9 de
[5]):
a) Y
0
= 0.
b) El procs s centrat, s a dir, E(Y
t
) = 0 per a tot t 0.
7 Una funci L es diu que s de variaci lenta a linnit si s acotada en cada interval nit, i
per a tot a > 0, lim
x+
L(ax)
L(x)
= 1. Les constants i els logaritmes en sn exemples.
Mandelbrot i latzar 153
c) E(Y
2
t
) = t
2H
2
, si
2
= E(Y
2
1
).
d) La funci de covarincies del procs Y
s:
Cov(Y
s
, Y
t
) = E(Y
t
Y
s
) =
2
2
_
t
2H
+s
2H
t s
2H
_
(14)
per a tots s, t 0.
Ara podem considerar la covarincia entre dos increments del procs Y
en
intervals (s
1
, s
2
] i (t
1
, t
2
] qualssevol, que per (14) ser
Cov(Y
t
2
Y
t
1
, Y
s
2
Y
s
1
) = E
_
_
Y
t
2
Y
t
1
__
Y
s
2
Y
s
1
_
_
=
=
2
2
_
t
2
s
2
2H
+t
2
s
1
2H
+t
1
s
2
2H
t
1
s
1
2H
_
. (15)
Com a conseqncia, la funci dautocovarincies dels increments de Y
s
() = E
_
(Y
k+1
Y
k
) (Y
k++1
Y
k+
)
_
=
2
2
_
( +1)
2H
+( 1)
2H
2
2H
_
,
fent servir (15) amb els intervals (k, k +1] i (k +, k + +1], i tenim que
()
_
_
< 0 si 0 < H < 1/2
= 0 si H = 1/2
> 0 si 1/2 < H < 1.
Ms concretament, si H }= 1/2,
() =
2
2
2(H1)
_
2
_
(1 +
1
)
2H
+(1
1
)
2H
2
_
_
. , .
tendeix a 2H(2H1) quan +
i, per tant, () es comporta com
2
H(2H 1)
2(1H)
quan +. Hem
vist que lim
+
() = 0 com una potncia, per quan 1/2 < H < 1 ho fa tan
lentament com
1
L
1
(x) i P(X
2
> x) x
2
L
2
(x) ,
amb 1 <
1
,
2
< 2, L
1
i L
2
funcions de variaci lenta a linnit.
8
Llavors, les
corresponents esperances sn nites, per no ho sn les varincies.
Considerem la suma
N
n=1
U
(n)
u
, que s el nombre de fonts que estan On a
linstant de temps u. Llavors,
A
N
t
=
_
t
0
_
N
_
n=1
U
(n)
u
_
du
s la suma del temps que les fonts han estat On a linterval [0, t]. El nombre de
paquets arribats a linterval [0, t] s proporcional a A
N
t
, i s per aix que fent
un abs de llenguatge es diu que A
N
t
s la quantitat acumulada o agregada de
paquets arribats al servidor des de linstant 0 ns a linstant t o crrega acu-
mulada. A [30] es demostra que, normalitzant convenientment, A
N
convergeix,
quan N +, a un procs de moviment browni fraccionari, en el sentit de la
convergncia de les distribucions en dimensi nita. Lndex de Hurst daquest
procs de moviment browni fraccionari s
H =
3 min(
1
,
2
)
2
.
Aquesta s la relaci entre un parmetre que descriu la intensitat de les cues
pesades amb varincia innita dels perodes On/Off, que s min(
1
,
2
),
duna part, i lndex de Hurst H que mesura el grau dautosimilitud del trnsit
agregat, de laltra. Com que
1
,
2
(1, 2), tenim que H (1/2, 1) i, per tant,
per la proposici 11, el procs lmit t memria llarga amb
= min(
1
,
2
) 1 (0, 1) .
Per a veure ms detalls sobre aquest resultat lmit sadrea el lector a larticle [5].
5 Conclusi
Tot va comenar cap a lany 1950, quan el jove Mandelbrot va descobrir casual-
ment les lleis de potncia i la seva utilitat en el camp de la lingstica. All el va
portar al terme fractal. No va ser el primer a introduir-lo, encara que ha passat
8 Aquests funcions de variaci lenta a linnit han de satisfer la restricci tcnica segent: si
1
=
2
, ha dexistir lim
x+
L
1
(x)
L
2
(x)
(0, +) .
Mandelbrot i latzar 157
a la histria com a seu. Aquest concepte es refereix a tots aquells objectes que
es caracteritzen perqu sn invariants per canvi descala, s a dir, sn tals que
hi ha una llei de potncia que relaciona la seva longitud en dues unitats de
mesura diferents.
Mandelbrot va desenvolupar la geometria fractal entorn del concepte de
fractal, i el va aplicar en camps molt diversos, entre els quals aqu hem comentat
la hidrologia i les nances a tall dexemple. Nhi ha molts ms als quals tamb
es pot aplicar, com s el cas de lenginyeria del teletrnsit, que tamb hem
comentat. De fet, s un concepte daplicaci tan mplia que quasi el podrem
qualicar duniversal. En el context dels models aleatoris per a observacions
que evolucionen en el temps (els processos estocstics), el concepte de fractal
es concreta en forma duna propietat, lautosimilitud. El ms important de tots
els processos estocstics autosimilars s el moviment browni fraccionari, que
Mandelbrot va donar a conixer al mn en larticle amb Van Ness de 1968.
La importncia del procs de moviment browni fraccionari dndex H
(0, 1) en modelitzaci es fonamenta en tres caracterstiques daquest procs:
a) s autosimilar,
b) t memria llarga (efecte Josep) quan H (1/2, 1), i
c) t trajectries contnues,
que sn fonamentals en la modelitzaci de les dades hidrolgiques analitzades
per Hurst, i tamb en la de les dades relatives al teletrnsit proporcionades per
Taqqu i els seus col
.
laboradors.
Per tamb hi ha models aleatoris, els processos de Lvy estrictament esta-
bles, que sn autosimilars per que no tenen memria llarga, sin que els seus
increments sn independents. Aquests processos han tingut un gran xit en
la modelitzaci de les dades nanceres. Les tres caracterstiques fonamentals
dun procs de Lvy estrictament estable quant a la modelitzaci sn:
a) s autosimilar,
b) t cues pesades (efecte No o sndrome de la varincia innita), i
c) t trajectries amb salts.
De fet, hem vist a la proposici 11 que tot procs autosimilar dndex
H (1/2, 1) (i amb increments estacionaris, com sn el moviment browni
fraccionari dndex H o els processos de Lvy estrictament estables amb par-
metre destabilitat = 1/H (1, 2)), si t varincia nita, necessriament ha
de tenir memria llarga (s el cas del moviment browni fraccionari). Per tant,
si tenim un procs autosimilar que no t memria llarga, necessriament ha de
tenir varincia innita (s el cas dels processos de Lvy estrictament estables).
Per s que, a ms, els tres conceptes introduts (autosimilitud, memria
llarga i cues pesades) es relacionen entre si en lmbit de lenginyeria del
teletrnsit. En efecte, el teletrnsit mostra carcter autosimilar i memria
llarga, per alguns descriptors de les xarxes de telecomunicacions, com sn
la mida o durada de les connexions, tenen cues pesades. s ms, el model de
158 Rosario Delgado, Maria Jolis i Frederic Utzet
fonts On/Off per a les dades observades del teletrnsit, basat en un model
econmic introdut per Mandelbrot, explica lautosimilitud i la memria llarga
que mostren les dades a partir de lassumpci dun nombre gran de fonts
tals que les longituds dels perodes que les fonts estan On (enviant dades de
manera constant a la xarxa) i dels perodes que estan Off (no enviant res) tenen
cues pesades. En aquest escenari, el trnsit acumulat de dades convergeix cap
a un procs de moviment browni fraccionari dndex H (1/2, 1), procs
autosimilar i amb memria llarga.
I potser no ens sorprendrem gaire, si creiem en lharmonia de lunivers, en
constatar que el concepte de cues pesades tamb sexpressa en termes duna
llei de potncia, tancant daquesta manera el cercle que va comenar el dia que
Mandelbrot va tenir limpuls de salvar de la paperera una ressenya del llibre de
Zipf per llegir-la al metro.
Agraments
Aquest treball ha estat subvencionat pel projecte de recerca del Ministeri de
Cincia i Innovaci i FEDER amb referncia MTM2009-08869.
Referncies
[1] Auerbach, F. Das Gesetz der Bevlkerungskonzentration. Petermanns
Geographische Mitteilungen, 59 (1913), 7476.
[2] Adamic, L. A.; Huberman, B. A. Zipfs law and the Internet. Glottometrics,
3 (2002), 143150.
[3] Crovella, M. E.; Bestavros, A. Self-similarity in World Wide Web trac:
evidence and possible causes. IEEE/ACM Trans. Networking, 5 (6) (1997),
835846. 160169.
[4] Cunha, C. R.; Crovella, M. E.; Bestavros, A. Characteristics of WWW
client-based traces. Technical report of the Computer Science Department,
Boston University, (2010). http://cs-www.bu.edu/faculty/crovella/
paper-archive/TR-95-010/paper.html.
[5] Delgado, R. Matemtiques i Internet: 101 anys de teoria de cues. Butllet
de la Societat Catalana de Matemtiques, 25 (2) (2010), 109144.
[6] Estoup, J.-B. Games stnographiques. Pars: Institut Stnographique de
France, 1916.
[7] Hurst, H. E. Long-term storage capacity of reservoirs. Trans. Amer. Soc.
Civil Engineers, 116 (1951), 770808.
[8] Jarque, X.; Fagella, N. B. B. Mandelbrot: cientc i matemtic. Notcies
de la Societat Catalana de Matemtiques, 30 (2010), 2023.
[9] Kolmogorov, A. N. Wienersche Spiralen und einige andere interessante
Kurven im Hilbertschen raum. C. R. (Doklady) Acad. Sci. URSS (N.S.), 26
(1940), 115118.
Mandelbrot i latzar 159
[10] Leland, W.; Taqqu, M.; Willinger, W.; Wilson, D. V. On the self-similar
nature of the Ethernet trac. A: Proceedings of SIGCOMM93, San Fran-
cisco, California, 1993, 183193.
[11] Leland, W.; Taqqu, M.; Willinger, W.; Wilson, D. V. On the self-
similar nature of the Ethernet trac (extended version). IEEE/ACM Trans.
Networking, 2 (1) (1994), 115.
[12] Mandelbrot, B. B. Adaptation dun message la ligne de transmission. I
& II. C. R. Acad. Sci. Paris, 232 (1951), 16381640, 20032005.
[13] Mandelbrot, B. B. Contribution la thorie mathmatique des jeux de
communication. Tesi doctoral. Publications de lInstitut de Statistique de
lUniversit de Paris, 2 (1953), 1124.
[14] Mandelbrot, B. B. An informational theory of the statistical structure of
language. A: Jackson, W. (ed.). Symposium on Applications of Communi-
cations Theory. Londres: Butterworth, 1953, 486500.
[15] Mandelbrot, B. B. The variation of certain speculative prices. The
Journal of Business, 36 (1963), 394319.
[16] Mandelbrot, B. B. Une classe de processus stochastiques homothtiques
a soi; application a loi climatologique de H. E. Hurst. C. R. Acad. Sci. Paris,
240 (1965), 32743277.
[17] Mandelbrot, B. B. Long-run linearity, locally Gaussian process, H-spectra
and innite variances. International Economic Review, 10 (1969), 82113.
[18] Mandelbrot, B. B. The fractal geometry of nature. Nova York: W. H.
Freeman and Co., 1982. [Traducci al castell: La geometra fractal de la
naturaleza. Barcelona: Tusquets, 1997]
[19] Mandelbrot, B. B. Fractals and scaling in nance. Nova York: Springer,
1997.
[20] Mandelbrot, B. B.; Hudson, R. L. Fractales y nanzas. Barcelona: Tus-
quets, 2004.
[21] Mandelbrot, B. B.; Van Ness, J. W. Fractional Brownian motions, frac-
tional noises and applications. SIAM Review, 10 (1968), 422437.
[22] Mandelbrot, B. B.; Wallis, J. R. Noah, Joseph, and operational hydro-
logy. Water Resources Research, 4 (5) (1968), 909918.
[23] Newman, M. E. J. Power laws, Pareto distributions and Zipfs law. Con-
temp. Phys., 46 (5) (2005), 323351.
[24] Omori, F. On the aftershocks of earthquakes. J. Coll. Sci., 7 (111) (1895).
[25] Pareto, V. Cours dconomie politique. Pars: Rouge, 1897.
[26] Shannon, C. E. A mathematical theory of communications. Bell System
Technical Journal, 27 (3) (1948), 379423, 623656.
[27] Sol, J. L. El mn de les variables sense moments nits de tots els ordres:
de la paradoxa de Sant Petersburg als processos de Lvy. Butllet de la
Societat Catalana de Matemtiques, 27 (1) (2012), 63113.
160 Rosario Delgado, Maria Jolis i Frederic Utzet
[28] Sorell, C. J. Zipfs law and vocabulary. Preprint (2011), disponible
a http://vuw.academia.edu/JosephSorell/Papers/549885/Zipfs_
Law_and_Vocabulary.
[29] Taqqu, M. S.; Levy, J. Using renewal processes to generate long-range
dependence and high variability. A: Eberlein, E.; Taqqu, M. S. (ed.).
Dependence in probability and statistics. Birkhuser, 1986.
[30] Taqqu, M. S.; Willinger, W.; Sherman, R. Proof of a fundamental result
in self-similar trac modeling. Computer Communications Review, 27 (2)
(1997), 523.
[31] Willinger, W.; Taqqu, M. S.; Erramilli, A. A bibliographical guide to
self-similar trac and performance modeling for modern high-speed
networks. A: Kelly, F. P.; Zachary, S.; Ziedins, I. (ed.). Stochastic
networks: Theory and Applications. Oxford: Oxford University Press, 1996.
(Royal Statistical Society, Lecture Note Series, 4)
[32] Willinger, W.; Taqqu, M. S.; Sherman, R.; Wilson, D. V. Self-similarity
through high-variability: statistical analysis of Ethernets LAN trac at the
source level. IEEE/ACM Trans. Networking, 5 (1) (1997), 7186.
[33] Zipf, G. K. Human behavior and the principle of least eort. Nova York:
Hafner, 1949.
Departament de Matemtiques
Universitat Autnoma de Barcelona
Edifici C, Campus de la UAB
08193 Bellaterra (Cerdanyola del Valls)
{Rosario.Delgado,Maria.Jolis,Frederic.Utzet}@uab.cat