You are on page 1of 73

http://www.meteo.unican.

es
Homogeneizacin e Interpolacin de
Observaciones de Alta Resolucin
Sixto Herrera Garca
Instituto Nacional de Meteorologa
Universidad de Cantabria
Santander, Espaa
Proyeccin Regional de Escenarios de Cambio
Climtico. Tcnicas y Proyectos en Curso.
2
Introduccin
3
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Test de Tendencias.
5. Bases de Datos.
6. Referencias.
4
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Test de Tendencias.
5. Bases de Datos.
6. Referencias.
5
Contraste de Hiptesis
Establecemos la hiptesis nula, H0.
La hiptesis contraria se denota por H1 y se denomina hiptesis
alternativa.
Establecemos el nivel de significacin, . ste nos define la
probabilidad de error con la que aceptamos la hiptesis nula.
Elegir un estadstico asociado al test con distribucin
conocida o tabulada.
Comparar el estadstico obtenido a partir de los datos de la
muestra con la distribucin terica del estadstico.
6
Ejemplo
Por ejemplo, a partir de la muestra de alturas de los n=30 individuos
del curso se quiere contrastar la hiptesis de que la altura media en
Suances es 1.80.
Estadstico:
Nivel de Confianza: =5%
1.80
Clculo:
7
Contraste de Hiptesis
En los contrastes tenemos varias cantidades importantes:
Error de Tipo I o de primera especie: Es aquel que cometemos
rechazando la hiptesis nula siendo cierta.
Error de Tipo II o de segunda especie: Es el error que cometemos
cuando aceptamos la hiptesis nula siendo falsa.
Nivel de significacin: Es la probabilidad mxima de cometer un error
de primera especie.
Una vez hemos definido un nivel de significacin, la hiptesis
nula ser rechazada para aquellos valores del estadstico para
los cuales se supere el valor del nivel de significacin
establecido. Los niveles de significacin tpicos son: 0.05, 0.01,
o 0.001.
8
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Test de Tendencias.
5. Bases de Datos.
6. Referencias.
9
Homogeneizacin de Datos
Una serie climtica es homognea cuando sus variaciones responden
exclusivamente a las variaciones de la atmsfera (Conrad y Pollack. 1950)
En la prctica es difcil encontrar series climticas homogneas ya que
existen multitud de factores externos que las alteran:
Cambios en la localizacin y el entorno del observatorio.
Cambios en la instrumentacin.
Cambios en al forma de tomar las mediciones (frmulas, etc).
Errores de codificacin.
Estos factores pueden provocar cambios en el nivel medio de las
observaciones, en la tendencia, discontinuidades en los datos, etc
Los mtodos de homogeneizacin tratan de detectar estas
discontinuidades en los datos y, si es posible, corregirlas para obtener
una serie de datos que refleje nicamente la seal climtica.
10
Mtodos Directos
Anlisis de Metadatas: Los archivos metadata de las
estaciones recogen los cambios ms relevantes de la
estacin. De este modo quedan registrados los cambios
de localizacin, de instrumentacin, etcEl estudio
directo de estos archivos nos dan una referencia de las
posibles discontinuidades de la serie.
Este es un metadata
indicando los obstculos
que podran afectar a las
mediciones de
precipitacin de la
estacin.
No hay metodologa
estndar para su
tratamiento
(subjetividad).
11
Mtodos Indirectos (opcin A)
Anlisis de la Serie Aislada:
Estos mtodos no son muy utilizados ya que se confunden
discontinuidades debidas a cambios bruscos en la climatologa de la
zona con aquellas provocadas por factores externos.
A pesar de sus defectos, este tipo de mtodos es til para redes con
estaciones aisladas en las cuales otro tipo de anlisis puede darnos
resultados engaosos.
12
Mtodos Indirectos (opcin B)
Comparacin con Series de Referencia:
Una series de referencia para una serie base (objeto de estudio) es
una serie definida en el mismo periodo temporal y que no presenta
inhomogeneidades. As, por comparacin se pueden descubrir
discontinuidades en la serie base.
Las series de referencia puede ser creadas de forma artificial o
pueden elegirse a partir de las series de las estaciones vecinas a la
estacin de la serie base (por ejemplo un promedio areal).
En el caso de usar series artificiales debemos tener en cuenta que el
mtodo de construccin puede ser importante y suele ser especfico
del problema que queremos estudiar.
13
Tests de Homogeneidad
En esta seccin aplicaremos el contraste de hiptesis a la deteccin
de discontinuidades. Los tests que definiremos son los siguientes:
Test SNHT (Standar Normal Homogeneity Test).
Test de Alexandersson para precipitacin y temperatura.
Test de Buishand.
Test de Pettitt.
Test de von Neumann.
14
Tests de Homogeneidad SNHT
SNHT (serie aislada): Este es un test muy difundido y del cual se
han desarrollado versiones para analizar cambios en la media, la
varianza y la tendencia de la serie. Adems es un test aplicado a una
gran variedad de variables.
La hiptesis nula ser la homogeneidad de la serie.
El mtodo trabaja con la serie normalizada:
Consideramos como estadstico el mximo ,T*, de la serie T definida
por:


=
i
i
y
y
n k z k n z k k T ,..., 1 , ) ( ) (
2
2
2
1
= + =

+ = =

= =
n
k i
i
k
i
i
y
k n
z y
k
z
1
2
1
1
) (
1
,
1
15
Tests de Homogeneidad SNHT
Localizamos el valor de T* en la siguiente tabla, dependiente del
tamao de la muestra y del nivel de significacin:
La hiptesis nula ser aceptada si para el valor T* y para el tamao
de la muestra se supera el nivel de significacin impuesto. Por ejemplo
para una muestra de 20 miembros y un valor de T* superior a 6.95 se
obtiene una confianza del 95%, es decir de cada 100 casos en estas
condiciones que consideremos homogneos, slo 5 sern realmente
inhomogneos.
16
Tests de Homogeneidad Alexandersson
Test de Alexandersson (serie de referencia): Este test est basado
en el anterior ya que aplica el SNHT para una serie auxiliar construida
a partir de la serie base y series de referencia.
Aplicaremos este test a series de precipitacin y temperatura
nicamente ya que la serie auxiliar definida en cada caso es diferente.
La hiptesis nula es la homogeneidad de la serie base.
Generamos K series de referencia.
Calculamos los coeficientes de correlacin entre las series de
referencia y la serie base:

= =
=


=
n
i
n
i
i ji
n
i
i ji
j
y y x x
y y x x
1 1
2 2
1
) ( ) (
) )( (

17
Calculamos la serie auxiliar Q, que cambia en funcin de la variable:
Precipitacin:
Temperatura:
Una vez calculada la serie auxiliar, se aplica el test SNHT.
Al igual que en el caso anterior la hiptesis nula se rechaza si el valor
del estadstico no alcanza el nivel de significacin para el tamao de
muestra considerado.
Tests de Homogeneidad Alexandersson
} ] / [ /{
1
2
1
2

= =
=
k
j
j
k
j
j ji j i i
x y x y Q
} / ] [ {
1
2
1
2

= =
+ =
k
j
j
k
j
j ji j i i
y x x y Q
18
Tests de Homogeneidad ... observaciones
La longitud mnima de las series para asegurar la siginificacin del
mtodo est entre 10 y 15 datos.
La hiptesis de homogeneidad limita nuestro estudio a variables
gaussianas o promedios mensuales o anuales de variables con peor
comportamiento. En este sentido, el dato diario no cumple esta
hiptesis en general y por ello la mayora de los estudios realizados se
refieren a medias mensuales y anuales.
Si queremos buscar ms de una discontinuidad podemos aplicar este
algoritmo iterativamente sin ms que dividir la serie inicial en las
subseries posterior y anterior al punto de discontinuidad, mientras las
longitudes de nuestras series sean suficientemente grandes.
19
Tests de Homogeneidad Homogeneizacin
Alexandersson seala un modo de corregir la serie alrededor del punto
de discontinuidad. Sea k la posicin de la inhomogeneidad, entonces
tendremos dos niveles diferentes antes y despus de la ruptura:
Por lo tanto, basta corregir con la razn (precipitacin) o la diferencia
(temperatura) entre ambos niveles.
Este proceso podemos repetirlo en cada subserie en la que hayamos
encontrado una discontinuidad.
Normalmente se corrige homogeneizando con la subserie ms reciente.
Veamos un ejemplo sobre Italia. Las estaciones pertenecen todas a las
fuerzas areas italianas (UGM/AMI):
.
,
2 2
1 1
Q z q
Q z q
Q
Q
+ =
+ =

20
Ejemplo ... Espaa
Temperatura Precipitacin
Red secundaria (11660)
1360 estaciones
865 estaciones 3491 estaciones
4139 estaciones
21
Tests de Homogeneidad Buishand
n k y y S S
k
i
i k
,..., 1 , ) ( , 0
1
0
= = =

=
s S S R
k
n k
k
n k
/ ) min max (
0 0
=
Consideramos como hiptesis nula la homogeneidad de la serie.
Definimos el estadstico S:
En caso de homogeneidad, los valores de S deben ser prximos a 0.
Si existe una discontinuidad en la posicin K, entonces S tendr un
mximo o un mnimo alrededor de esa posicin.
Los valores crticos del test vienen tabulados respecto al valor:
22
Tests de Homogeneidad Pettitt
n k n k r X
k
i
i k
,..., 1 , ) 1 ( 2
1
= + =

=
Este es un test no paramtrico (no asume ninguna distribucin)
basado en la serie de los rangos {r
i
:i=1,,n}.
El rango se define como la posicin del dato en la serie ordenada de
menor a mayor. En caso de que haya observaciones con el mismo
valor se les asigna a todas el mismo rango, correspondiente a la
media aritmtica de los rangos que corresponderan a los elementos.
Consideramos como hiptesis nula la homogeneidad de la serie.
Calculamos el siguiente estadstico:
En caso de existir una discontinuidad en la posicin K-sima, el
estadstico presentar un extremo cerca de esa posicin.
23
Tests de Homogeneidad Pettitt
( )
n i
i K
X X

=
1
max
El nivel de significacin y los valores crticos viene tabulado en funcin
del tamao de la muestra y del valor:
24
Tests de Homogeneidad von Neumann

=

=
+
=
n
i
i
n
i
i i
y y y y N
1
2
1
1
2
1
) ( ) (
El test de von Neumann se basa en el valor conocido como la razn de
von Neumann, que est definido por el valor N:
En caso de homogeneidad el valor esperado de N es 2.
En caso de existir alguna inhomogeneidad el valor es menor del
esperado.
Notar que este test no aporta informacin acerca de la localizacin de
la discontinuidad.
Los valores crticos vienen dados en la siguiente tabla:
25
Ejemplo ENSEMBLES
Variables Red de Estaciones ENSEMBLES
Nubosidad
Humedad
Precipitacin
Presin
Nieve
Insolacin
Temperatura media
Temperatura mnima
Temperatura mxima
Este proyecto quiere generar un grid de 25 km de resolucin.
26
Ejemplo ENSEMBLES
27
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos:
- Tests de Homogeneidad.
- Multiple Linear Regression.
- Otros mtodos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Test de Tendencias.
5. Bases de Datos.
6. Referencias
28
Este mtodo analiza cuatro posibles comportamientos de la serie
base:
Serie homognea.
Serie con una tendencia global.
Serie con un salto o cambio brusco de nivel en un punto.
Serie con un cambio de pendiente brusco.
Para cada uno de estos comportamientos define un modelo de
regresin lineal:
Tests de Homogeneidad MLR
n i e x f x d x c a y
i i i i i
,..., 1 ,
3 1 2 1 1 1 1
= + + + + =
n i e x f x d x c i b a y
i i i i i
,..., 1 ,
3 2 2 2 1 2 2 2
= + + + + + =
n i e x f x d x c I b a y
i i i i i
,..., 1 ,
3 3 2 3 1 3 3 3
= + + + + + =
n p i I
p i I
,..., , 1
1 ,..., 1 , 0
= =
= =
n i e x f x d x c iI b I a iI b a y
i i i i i
,..., 1 ,
3 4 2 4 1 4 2 5 2 5 1 4 4
= + + + + + + + =
n p i I I
p i I I
,..., , 1 , 0
1 ,..., 1 , 0 , 1
2 1
2 1
= = =
= = =
29
Para testear cada modelo se aplica el test de Durbin Watson a la
serie de errores obtenida. En caso de que el modelo ajuste
correctamente la serie, se detiene el proceso, se subdivide la serie
respecto al punto encontrado y se reinicia el proceso en las subseries
generadas.
Tras la aplicacin del primer modelo, en caso de que no ajuste bien la
serie, se puede observar la serie de errores:
Tests de Homogeneidad MLR
En el tercer caso la magnitud del cambio viene dada por la expresin:
)) 1 ( ( ) (
4 4 5 5 4
+ + + = p b a p b a a m
30
Durbin - Watson

=
=

=
n
i
i
n
i
i i
e
e e
D
1
2
2
2
1
) (
Como hemos usado este test de forma continua a lo largo de este ltimo
test, vamos a definir el test de Durbin Watson. Es un test para
contrastar la independencia de los errores de un modelo de regresin
lineal o mltiple.
La hiptesis nula considerada el que no existe correlacin en la serie,
mientras que la alternativa es que sta s existe.
El estadstico del test viene dado por:
En funcin del tamao de la muestra, el
nmero de regresores del modelo y el
nivel de significacin buscado, existen
una cota inferior y una superior para el
test. Por encima de la cota superior el
test acepta la hiptesis nula, por debajo de la cota inferior el test rechaza
la hiptesis nula y entre ambas cotas el test no es concluyente.
31
Otros Mtodos
Aproximacin Bayesiana: Ouarda et al.1999; Perreault et al. 1999 and
2000.
Mtodo WRS: Karl and Williams. 1987
Mtodo ST: Gullet et al. 1990
Mtodo t-Student: Panofsky and Bries. 1968.
M.A.S.H: Szentimrey. 1994, 1995, 1996.
Mtodo de Caussinus-Mestre: Caussianus and Lyazrhi, 1997.
Caussinus and Mestre, 1996.
Mtodo TPS: Andrew R. Solow, 1987.
Mtodo TPS: D.R.Easterling and T.C.Peterson, 1995.
32
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Test de Tendencias.
5. Bases de Datos.
6. Referencias.
33
Mtodos de Interpolacin
El objetivo de los mtodos de interpolacin es pasar de una red de
observaciones irregularmente distribuida a un grid regular de forma que
ste mantenga las caractersticas climticas de las observaciones:
Red de Precipitacin
Grid Regular
34
Mtodos de Interpolacin
Los mtodos que describiremos sern los siguientes:
Nearest Neighbour.
Natural Neighbour Interpolation.
Angular Distance Weighting.
Kriging.
Splines.
Conditional Interpolation.
Reduced Space Optimal Interpolation.
Inverse Distance Weighting.
Cressman o mtodo de las correcciones.
.
35
Mtodos de Interpolacin NN y NNI
Estos mtodos ests basado en una particin de Voronoi del plano.
Una vez realizada la particin, en el primer caso a cada celda de la
particin se le asigna el valor de la estacin contenida en ella mientras
que en el segundo caso el valor interpolado es combinacin lineal del
valor de las estaciones vecinas cuyas celdas intersecten con la del
nuevo punto.
Nearest Neighbour
Natural Neighbour
36
Mtodos de Interpolacin ADW
El angular distance weighting es una modificacin del IDW en la cual se
incorpora una componente angular a los pesos para tener en cuenta la
distribucin irregular de las observaciones.
Para evitar asignar ms peso a sectores con mayor densidad de
observaciones se introduce una componente angular en los pesos que
premia las observaciones bien distribuidas en el espacio.
Los pesos tienen por tanto una componente radial y otra angular:
j
k
l

dist
Punto del grid
Punto de observacin
37
Mtodos de Interpolacin ADW
dc
x
j
n
k l l
l
j
n
k l l
j l
e r r w
a
a w W
x Z W x Z
m
k
w
l k w
k
k k k
N
k
k k

=
=
= =

=
+ =
=

,
) 1 (
) ( ) (
, 1
, 1
))) , ( cos( 1 (
1
0

El mtodo se formula del siguiente modo:


Donde m y dc son el exponente del mtodo y el radio de decaimiento.
Estos sern los nicos parmetros del mtodo y definen la componente
radial.
38
Mtodos de Interpolacin Kriging
El kriging es un mtodo geoestadstico muy difundido y del cual existen
un gran nmero de modificaciones.
El mtodo de interpolacin est basado en la descripcin de la variacin
espacial de los datos que se modelan mediante el variograma.
ste se calcula ajustando una funcin al variograma experimental que
viene dado por la expresin:

=
) ( ) , (
2
) ( 2
1
) (
h N j i
j i
h N
z z h
Los modelos utilizados habitualmente en el ajuste del variograma son:
Gaussiano, Exponencial, Esfrico, Polinomial, etc
39
Gaussiano:
Exponencial:
Esfrico:
Lineal:
Como vemos todos los modelos dependen de tres parmetros (C
0
, A, r),
nugget, sill y range respectivamente.
Mtodos de Interpolacin Kriging
0 ), 1 ( ) (
2
) (
0
> + =

h e A C h
r
h

0 ), 1 ( ) (
) (
0
> + = h e A C h
r
h

r h A C h
r h A C h
r
h
r
h
> + =
+ =
, ) (
)), ) ( ( ( ) (
0
3
2
1
2
3
0

0 , ) (
0
> + = h A C h
r
h

40
El valor interpolado en el punto x del grid viene dado por la combinacin
lineal:
Los pesos de la combinacin lineal minimizan la varianza del error de la
estimacin y son solucin del siguiente sistema (Biau, G. et al. 1999):
Mtodos de Interpolacin Kriging

=
=
N
i
i i
x Z x Z
1
) ( ) (
. 1 ), ( ) (
1 1
= = +

= =
N
i
i j
N
i
i j i
x x x x
41
Mtodos de Interpolacin TPS
i i i i
y x f Z + = ) , (
Al igual que el kriging, el thin plate splines es un mtodo tipo BLUE
(best linear unbiased estimation).
Mientras el kriging minimiza la varianza del error de la estimacin, el
TPS minimiza la rugosidad de la superficie interpolada.
Este mtodo depende del parmetro de alisamiento, , (smoothing
parameter) que es hallado minimizando la GCV.
En el caso ms simple el modelo supone que los datos pueden
representarse por una funcin suave a la que se suma una variable
aleatoria:
Esta funcin se calcula minimizando el funcional:
El valor m define la clase de la funcin. Por ejemplo, si m=2 la
segunda derivada ha de ser continua en todo punto.
) ( ] / )) , ( [(
1
2
f J d y x f Z
m
n
i
i i i i
+

=
42
Mtodos de Interpolacin ... Ejemplo
Veamos un ejemplo con datos de precipitacin sobre la isla de Mallorca
Red secundaria INM Estaciones Homogneas
Para calcular la homogeneidad de las series hemos empleado el test de
Alexandersson con 5 series de referencia y un mnimo de 20 aos en el
periodo 1950-2003 con un porcentaje mximo de missing data en cada
ao del 10%.
43
Mtodos de Interpolacin ... Ejemplo
Grid 0.05 Grid 0.1 Grid 0.2
El primer problema que encontramos es la densidad de estaciones, la
cual limita la resolucin del grid:
44
Mtodos de Interpolacin ... Ejemplo
Una vez elegida una resolucin, aplicamos los diferentes mtodos y
observamos como reproducen la climatologa de la zona:
Anlisis de las medias
Observaciones ADW Kriging TPS
45
Mtodos de Interpolacin ... Ejemplo
Anlisis de las Desviaciones Tpicas
Observaciones ADW Kriging TPS
46
Mtodos de Interpolacin ... Ejemplo
Pasemos ahora a analizar la validacin de los mtodos. La validacin
est hecha con validacin cruzada leave one out.
El bias representa la diferencia media entre los datos observados y los
interpolados y el RMSE es la raz del error cuadrtico medio.
47
Mtodos de Interpolacin ... Ejemplo
En este caso, comparamos los errores obtenidos con los diferentes
mtodos:
48
Mtodos de Interpolacin ... Ejemplo
Comparamos los errores cometidos al realizar la interpolacin semanal
siguiendo dos filosofas:
Interpolar el dato diario agrupado en medias semanales.
Interpolar el dato diario y agruparlos a posteriori en medias semanales.
49
Mtodos de Interpolacin ... Ejemplo
Comparamos los errores cometidos al realizar la interpolacin mensual
siguiendo dos filosofas:
Interpolar el dato diario agrupado en medias mensuales.
Interpolar el dato diario y agruparlos a posteriori en medias mensuales.
50
Mtodos de Interpolacin RSOI
La interpolacin ptima es un mtodo estocstico que ha sido usado
principalmente para datos ocenicos (SST y SLP) a escala mensual y
anual.
En el caso del RSOI se combina el mtodo de interpolacin ptima
con una reduccin del espacio de variables a EOFs.
Al igual que el kriging y el TPS, la superficie interpolada por este
mtodo es la solucin por mnimos cuadrado con suma de pesos igual
a 1.
Si definimos x
b
, y
0
, como la raz y las observaciones en los puntos del
grid podemos formular el mtodo como:
Donde la matriz W se calcula de forma estadstica. Al igual que el
mtodo de Cressman se pueden aplicar correcciones sucesivas.
51
Mtodos de Interpolacin CI
Este mtodo slo se ha aplicado a datos de precipitacin. Lo ms
novedoso del mtodo es el uso de SOMs para clasificar el estado de la
atmsfera y modificar los pesos de la interpolacin en funcin de ese
estado. En la interpolacin podemos distinguir dos fases:
Se identifica la fase del punto del grid segn el estado de la
atmsfera.
En las zonas en las que se considere que va a llover se realiza la
interpolacin dando una magnitud de la precipitacin media en esa
zona del grid.
Entenderemos por fase de un estacin a la dualidad llueve/no llueve.
Los pesos de la interpolacin son inicialmente calculados del mismo
modo que en el caso del ADW. Posteriormente se corrigen teniendo en
cuenta las relaciones obtenidas por la SOM.
52
Mtodos de Interpolacin IDW
En el Inverse Distance Weighting mtodo los pesos son asignados
nicamente en funcin de la distancia. Los pesos decrecen con la
distancia (Ponderacin con el inverso de la distancia).
Si denotamos por Z(x
i
) a la observacin en la i-sima estacin y por d
i0
a
la distancia entre la estacin y el punto x
0
, el valor interpolado en ese
punto viene dado por la combinacin expresin:
Notar que la suma de los pesos es igual a 1.

=
=
m
i
i i
x Z x Z
1
0
) ( ) (

=
m
i
p
i
p
i
i
d
d
1
0
0

53
Mtodos de Interpolacin Cressman
Sean Z
0
(x
0
), Z
0
(x
i
) y O(x
i
) la raz considerada en el punto de grid y en la
estacin y el dato observado en la estacin.
Definimos el error cometido en la estimacin de la observacin :
) ( ) (
0 0 i i i
x O x Z E =
Aplicamos la correccin del mtodo:
El vector W est definido por:
El mtodo se aplica sucesivamente partiendo de un valor de D alto y
reducindolo posteriormente.
En cada paso se corrige el valor de la aproximacin con el error
cometido por el mtodo en los valores observados.
0 0 0 0 1 0 0
) ( ) ( , C x Z x Z E W C + = =
D d W
d D
d D
< =
+

,
2 2
2 2
D
d
Estacin i
54
Mtodos de Interpolacin ... validacin
Para validar los mtodos de interpolacin se suele utilizar la validacin
cruzada.
Estos mtodos dividen la muestra en dos conjuntos: uno de
entrenamiento y otro de test.
El mtodo se calibra en el conjunto de entrenamiento.
Se aplica el mtodo al conjunto de test y se estudian los errores.
En nuestro caso usaremos el mtodo leave one out que consiste en
escoger como conjunto de entrenamiento todas las estaciones menos
una, estudiar el error cometido en la estacin restante y repetir el proceso
con todas las estaciones de la red.
55
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Estudio de Tendencias.
5. Bases de Datos.
6. Referencias.
56
Una de las aplicaciones habituales de los grids es el clculo de
tendencias. Uno de los contrastes de hiptesis ms utilizados para el
clculo de tendencias es el test de Mann-Kendall (Kendall,M.G.1975).
ste se define por:
La hiptesis nula es la independencia de la serie.
Calculamos el estadstico T dado por:
Bajo la hiptesis nula, el estadstico sigue un distribucin normal de
parmetros:
Comparamos el valor del estadstico con la distribucin para
determinar la significacin del test.
Aplicaciones. Estudio de Tendencias

= + =
=
1
1 1
) (
n
i
n
i j
i j
y y signo T

=
+ + =
=
rep val r
r r r n n n T
T E
.
18
1
)] 1 2 )( 1 ( ) 5 2 )( 1 ( [ ) var(
0 ) (
57
Estudio de Tendencias Espaa
En Espaa hemos realizado un estudio de las tendencias en la
precipitacin y la temperatura mxima en un grid de resolucin 0.2. Si
bien el grid es de dato diaro, el anlisis de la tendencia est realizado con
medias anuales.
58
Estudio de Tendencias India
Veamos un ejemplo sobre el estudio de tendencias en la India. El IMD
(India Meteorological Department) ha creado un grid de precipitacin
sobre la India de resolucin 1x1 para el periodo 1951-2003.
Sobre este grid se ha realizado un estudio sobre las tendencias en este
periodo y en la zona enmarcada.
Media Estacional
Varianza de las anomalas
59
Estudio de Tendencias Europa
El JRC (Joint Research Centre) ha desarrollado un grid de 50 km de
resolucin sobre Europa con datos de precipitacin, temperatura
(Tx,Tn,Tg), presin, evapotranspiracin (E0,ES0,ET0), nieve y viento
desde 1975.
Grid
Missing Data
60
Estudio de Tendencias Europa
Hemos repetido el estudio de tendencias realizado sobre Espaa
en el grid del JRC. De nuevo, el test aplicado ha sido el Mann-
Kendall. Los resultados para precipitacin y temperatura mxima
han sido:
Precipitacin TempMax
61
Resumen
1. Contrastes de Hiptesis. Tests Estadsticos.
2. Mtodos de Homogeneizacin de Observaciones:
Mtodos Directos.
Mtodos Indirectos.
3. Mtodos de Interpolacin.
4. Aplicaciones. Test de Tendencias.
5. Bases de Datos.
6. Referencias
62
Bases de Datos
European Climate Assesment & Dataset (ECA&D): http://eca.knmi.nl/
Joint Research Center: http://agrifish.jrc.it/marsstat/datadistribution
Deutscher Wetterdienst (DWD): http://www.dwd.de/en/en.htm
CISL Research Data Archive: http://dss.ucar.edu
Joint Institute for the Study of Atmosphere and Ocean (JISAO):
http://www.jisao.washington.edu
Earth System Research Laboratory (ESRL): http://www.cdc.noaa.gov
Climatic Research Unit (CRU): http://www.cru.uea.ac.uk.
Global Historical Climatology Network (GHCN):
http://lwf.ncdc.noaa.gov/oa/climate/research/ghcn/ghcngrid_prcp.html.
Global Precipitation Climatology Project (GPCP):
http://cics.umd.edu/~yin/GPCP/main.html.
KNMI, Climate Explorer: http://climexp.knmi.nl.
Climate Prediction Center (CPC):
http://www.cdc.noaa.gov/cdc/data.unified.html.
International Water Management Institute: http://www.iwmi.org.
63
Bases de Datos CRU
El CRU (Climate Research Center) es un centro dedicado al estudio del
cambio climtico.
Este centro ha desarrollado una base de datos de precipitacin mensual
del periodo 1900-1998 con una resolucin de 5x5 o de 2.5x3.75
sobre todo el globo y de anomalas de temperatura de 5x5.
El mtodo de interpolacin utilizado es un Natural Neighbour
Interpolation. Si no existe dato en alguna estacin, ste se aproxima
aplicando un ADW a las vecinas siempre que existan al menos 2
vecinas en un radio de 600 km (para el periodo 1997-1998 este radio se
redujo a 400 km). En la interpolacin se usan un mximo de 50
estaciones.
Estos datos pueden conseguirse en la pgina web del CRU asi como la
documentacin de la metodologa.
64
Bases de Datos CRU
65
Bases de Datos IWMI and CRU
Ambos organismos han colaborado en la realizacin de un atlas climtico
(World Water and Climate Atlas), en el cual crean un grid de alta resolucin,
10x10, de medias mensuales. Las variables que consideran son:
Precipitacin.
Frecuencia de das con precipitaciones.
Temperatura.
Rango diario de temperatura.
Humedad relativa.
Insolacin.
Velocidad del viento.
Frecuencia de das con escarcha.
El mtodo de interpolacin que utilizaron fue el thin plate splines (ANUSPLIN)
y el periodo que abarca es 1961-1990.
66
Bases de Datos DWD
El centro Deutscher Wetterdienst (DWD) ha desarrollado una
climatologa de precipitacin mensual de 50 aos (1951-2000) en todo el
globo. El conjunto de datos mensuales ha sido interpolado en grids de
tres resoluciones diferentes (0.5 lat/lon, 1.0 lat/lon, 2.5 lat/lon). Las
estaciones utilizadas han sido y el mtodo de interpolacin el kriging:
67
Bases de Datos DWD
Este grid ha sido usado para estudiar tendencias en la media anual de
precipitacin mensual total promediada sobre todo el globo. El test
aplicado ha sido el test de Mann-Kendall.
68
Bases de Datos DWD
Esta es la significacin que han obtenido con el test.
69
Bases de Datos KNMI.Climate Explorer
70
Bases de Datos KNMI.Climate Explorer
71
Proyecto ENSEMBLES: WP5.1 Development of daily high-resolution gridded
observational datasets for Europe. Hofstra, N. et al.
Hewitson, M.F., and R.G.Crane(2005), Gridded Area-Averaged Daily
Precipitation via Conditional Interpolation, Journal of Climate, 18, 41-57.
New, M. et al (2000), Representing twentieth-century space-time climate
variability. Part II: development of 1901-96 monthly grids of terrestrial surface
climate, Journal of Climate, 13, 2217-2238.
New, M. et al (2002), A high-resolution data set of surface climate over global
land areas, Climate Research, 21, 1-25.
Cressman, G.P. (1959), An Operational Objective Analysis System, Monthly
Weather Review, 87, 367-374.
Peterson, C.T., et al (1998), Homogeneity Adjustments of In Situ Atmospheric
Climate Data: A Review. Int.J.Climatol, 18, 1493-1517.
Referencias
72
Referencias
Ducr-Robitaille, J.F., et al (2003), Comparison of Techniques for Detection of
Discontinuities in Temperature Series. Int.J.Climatol, 23, 1087-1101.
Wijngaard, J.B., et al (2003), Homogeneity of 20th Century European Daily
Temperature and Precipitation Series, Int.J.Climatol, 23, 679-692.
Zurbenko, I. et al (1996), Detecting Discontinuities in Time Series of Upper-Air
Data: Development and Demonstration of an Adaptive Filter Technique, Journal
of Climate, 9, 3548-3560.
Solow, A. (1987), Testing for Climate Change: An Application of the Two-Phase
Regression Model, Journal of Climate and Applied Meteorology, 26, 1401-1405.
Easterling and Peterson (1995), The effect of artificial discontinuities on recent
trends in minimun and maximun temperatures, Atmospheric Research, 37, 19-26.
Bartels, R, (1982), The Rank Version of von Neumanns Ratio Test for
Randomness, Journal of the American Statistical Association, 77, 40-46.
73
Referencias
Alexandersson and Moberg (1997), Homogenizatoin of Swedish Temperature
Data. Part I: Homogeneity Test for Linear Trends, Int. J. Climatol., 17, 25-34.
Vincent, L.A. (1998), A Technique for the Identification of Inhomogeneities in
Canadian Temperature Series, Journal of Climate, 11, 1094-1104.
Biau, G. (1999), Estimation of Precipitation by Kriging in the EOF Space of the
Sea Level Pressure Field. Journal of Climate, 12, 1070-1085.
Sacks, Jerome. (1989), Design and Analysis of Computer Experiments, Statistical
Science, 4, 409-423.
Toolbox:
Vebyk: Toolbox de Matlab que realiza el kriging ordinario.
MATLAB Krigeage Toolbox Introduction for Version 3.
EasyKrig3.0.
ANUSPLIN: toolbox del CRU para la interpolacin por splines.