You are on page 1of 11

Geoestadstica

El m`etode de Kriging i aplicacions a la mineria

Albert Pich Rubert


Grau en Matem`atica Computacional | Maig de 2016

Prefaci
El prop`
osit daquest document es estudiar les equacions del m`etode de Kriging
i familiaritzar-nos amb la seva aplicacio en lentorn R. Concretament representarem la distribuci
o de temperatures dEspanya al seu mapa.

Castello, 21 de Maig de 2016

Index
Prefaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 Introducci
o

2 El m`
etode de Kriging
2.1 Conceptes previs . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Definici
o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5
5
7

3 Representaci
o de la distribuci
o de temperatures a Espanya

Bibliografia

11

Captol 1

Introducci
o
El principi b`
asic de la geoestadstica es modelitzar la variacio espacial contnua
duna variable com un proces aleatori. Concretament, considera el valor de la
variable estudiada en les posicions desconegudes com el resultat dun conjunt
de variables aleat`
ories correlacionades.
Aquest plantejament de la geoestadstica parteix de la crtica dels m`etodes
convencionals dinterpolaci
o mitjancant pesos assignat-s en funcio de la dist`ancia
o de la posici
o. Entre els defectes dels m`etodes basats en la ponderacio per la
dist`
ancia o la posici
o, la geoestadstica assenyala la dificultat per establir el
criteri per a escollir els factors de ponderacio, la manca de criteri per a escollir la dist`
ancia fins a la qual considerar els efectes dels valors coneguts sobre
el valor a estimar, la manca de mesures de la fiabilitat de les estimacions obtingudes, i la dificultat que un mateix m`etode destimacio sigui v`alid en tot
tipus de situacions. Contr`
ariament a la ponderacio basada en la dist`ancia o la
posici
o, pr`
opia de lestadstica espacial, la geoestadstica proposa ponderar els
valors dels punts de mostra per mitj`a dalguna mesura de similaritat amb el
valor a estimar. Similaritat que, en aquest cas, es pot mesurar estadsticament
mitjancant la covari`
ancia o la correlacio entre els valors dels punts de mostra
(Clark, 1979).
Per estimar el valor de la variable dinter`es Z en una posicio x de valor desconegut, la geoestadstica considera que el valor de Z a la posicio x, Z(x), es un
valor aleatori, pel fet que no ha estat mesurat, per`o nomes parcialment aleatori, ja que el valor Z(x) desconegut es definit per una funcio de distribucio de
probabilitat acumulada que dep`en dinformacio coneguda respecte al valor Z(x):

F (z, x) = P rob(Z(x) < z| informacio)


On F(z, x) es la funci
o que estima un valor z per a una posicio x segons la
funci
o de probabilitat acumulada que el valor de Z a la posicio x, Z(x). [6]

Captol 2

El m`
etode de Kriging
El m`etode de Kriging, tambe conegut com Krigatgees un conjunt de m`etodes
dinterpolaci
o espacial emprats en geoestadstica per a estimar els valors duna
variable de superfcie en posicions desconegudes a partir dels valors coneguts
dobservacions en punts de mostreig propers. Els diferents m`etodes de krigatge
s
on m`etodes estoc`
astics dinterpolacio perqu`e tracten la variable de superfcie
com una variable aleat`
oria o proces estoc`astic. El krigatge es basa en la teoria
de variables regionalitzades per a incorporar informacio sobre els aspectes estoc`
astics de la variaci
o espacial en el c`alcul de les funcions de ponderacio per a
la interpolaci
o.
La interpolaci
o per krigatge es basa en un algorisme generalitzat de millor
estimaci
o lineal no esbiaixada, que utilitza semivariogrames per a establir les
funcions de ponderaci
o i que fa servir la vari`ancia mnima dels errors dinterpolaci
o com a criteri de millor estimacio lineal no esbiaixada. El krigatge te
lavantatge de ser l
unic m`etode dinterpolacio que proporciona una manera de
caracteritzar la vari`
ancia de lerror de les estimacions.[5]

2.1

Conceptes previs

Anem a recordar uns conceptes que ens seran de vital import`ancia per a entendre
les equacions del m`etode:
Vari`
ancia: V ar(X) = E(X 2 ) 2x .Six = 0 V ar(X) = E(X 2 ).
Covari`
ancia: Cov(X, Y ) = E(X Y ) (X ) (Y ).
Si X = 0 o Y = 0 Cov(X, Y ) = E(X Y )
Tambe introduirem el concepte de variograma:
Variograma: eina que permet analitzar el comportament espacial duna variable sobre un `
area definida, que reflexa la distancia m`axima i la forma en que un
5

punt te influencia sobre un altre a diferents dist`ancies. Si Z(X) es estacionaria


o intrnseca, tenim:

2(h) = V ar(X (X + h))

(2.1)

(h) = C(0) C(h)


C(h) = Cov(X, X + h), C(0) = Cov(X, X) = E(X 2 ) (x )2
Six = 0 C(0) = V ar(X)
Six = 0 Cov(Xi , Xj ) = E(Xi Xj ) = C(Xi Xj )
Existeixen diversos models de variogrames, com:
Model Esf`eric: Creixement r`apid prop de lorigen, decreix per a dist`ancies
grans, increment nul per a dist`ancies superiors al rang.

3
C0 + C1 ( 23 ha 12 ha ), h <= a,
(h) =
C0 + C1 , h > a
Model Exponencial:
(h) = C0 + C1 (1 Exp(

3h
))
a

(h) = C0 + C1 (1 Exp(

h2
))
a2

Model Gaussi`
a:

2.2

Definici
o

El krigatge es un m`etode dinterpolacio exacta que pertany a la famlia dalgorismes destimaci


o lineal per mnims quadrats. La finalitat del krigatge es
estimar el valor duna funcio f desconeguda en un punt x*, donats els valors
observats de la funci
o en altres punts, x1,....,xn. El krigatge es considera un
m`etode destimaci
o lineal perqu`e el valor estimat es una combinacio lineal (es a
dir, una suma ponderada) dels valors observats.

f(x ) =

n
X

i (x ) f (xi )

(2.2)

i=1

On i (x ) sanomenen pesos i son les solucions dun sistema dequacions lineals que sobte assumint que f es una de les possibles realitzacions dun proces
aleatori F(x) que minimitza lerror destimacio.

(x ) = F (x )

n
X

i (x) f (xi )

(2.3)

i=1

El m`etode de krigatge interpola el valor Z(x ) duna variable aleat`oria Z(x),


com per exemple la temperatura entesa com a funcio de la localitzacio, en una
posici
o x no observada a partir de les observacions zi = Z(xi) de la variable
aleat`
oria en una mostra de posicions x1,...., xn. El krigatge calcula el millor
0 ) del valor veritable Z(x ) basant-se en un
estimador lineal no esbiaixat Z(x
model estoc`
astic de depend`encia espacial de la variable dinter`es que es pot
quantificar per mitj`
a de la semivari`ancia (x, y) , obtinguda del semivariograma
experimental, o be per mitj`
a del valor esperat (x) = E[Z(x)] i de la funcio de
covari`
ancia c(x,y) de la variable aleat`oria.
Tal com sha indicat, lestimador del m`etode krigatge es defineix com una
combinaci
o lineal dels valors observats:
0) =
Z(x

n
X

wi (x0 ) Z(xi )

(2.4)

i=1

on:
Z(xi ) s
on els valors veritables de Z a les posicions x1 , ...., xn , iguals als
valors observats zi
wi (x) s
on els pesos a aplicar a cada observacio i per al c`alcul de Z en cada
posici
o x (es a dir, diferents per a cada observacio i i per a cada posicio x
objecte de c`
alcul)

El que es especfic del m`etode de krigatge es que els pesos de la combinacio


lineal de la funci
o destimacio sestableixen de manera que la vari`ancia dels errors destimaci
o, anomenada vari`ancia de krigatge:
0 ) Z(x0 )) =
k2 (x0 ) := var(Z(x
n X
n
X

wi (x0 ) wj (x0 ) c(xi , xj ) + var(Z(x0 )) 2

i=1 j=1

n
X

(2.5)

wi (x0 ) wj (x0 ) c(xi , xj )

i=1

sigui mnima sota la condicio destimacio no esbiaixada:

E[Z(x)
Z(x)] =

n
X

wi (x0 ) (xi ) = (x0 ) = 0

i=1

(2.6)

Captol 3

Representaci
o de la
distribuci
o de temperatures
a Espanya
Les dades amb les quals hem treballat han sigut arreplegades per AEMET i
descarregades de [7], a mes, cal dir que les illes Can`aries no han sigut tingudes
en conter degut a la seua llunyania respecte de la Pennsula, amb lobjectiu
dobtenir una aproximaci
o mes fidedigna.

Figura 3.1: Temperatures en las zones conegudes

Com hem vist al captol 2, amb el m`etode de Kriging, a partir duna mostra
de punts en els quals coneixem el valor de la funcio, podem aproximar el valor
a punts propers als coneguts. A causa de la gran quantitat de dades que te la
nostra mostra, les aproximacions que fem seran de molta qualitat.
Aix, aplicant el m`etode de Kriging sobre les dades anteriors, obtenim:

Figura 3.2: Heat map a partir de les dades conegudes


Podem observar clarament com al Nord-est dEspanya les temperatures son
mes baixes, mentre que a mesura que anem cap al Sud es van fent mes c`alides.
A mes, per estar tambe a la pennsula, Kriging aproxima zones de Portugal,
no obstant aquestes sols serien fiables en zones molt properes a la frontera amb
Espanya, ja que totes les dades de les quals disposem son del territori espanyol.

10

Bibliografia
[1] Krige, D.G., A statistical approach to some mine valuations and allied
problems at the Witwatersrand,, Masters thesis of the University of Witwatersrand, 1951
[2] George Matheron, Traite de geostatistique appliquee, Tome 1. Pars,
Editions Technip
[3] George Matheron, Traite de geostatistique appliquee, Tome 2. Pars,
Editions Technip
[4] Fernando Garca Bastante, Fundamentos de Geoestadstica, Universidad de Vigo.
[5] Dr. Joan Nunes, En qu`e consisteix el krigatge?, Institut Cartogr`afic de
Catalunya, 2013
[6] https://ca.wikipedia.org/wiki/Geoestadstica
[7] http://datosclima.es/

11

You might also like