Libro - de - Geoestadistica-R Giraldo

INTRODUCCION A LA
GEOESTADISTICA

R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
120
140
160
180
200
220
240
260
280
300

Teora y Aplicacin

UNIVERSIDAD
NACIONAL
DE COLOMBIA

Sede Bogot
Facultad de Ciencias
Departamento de Estadstica.

2

INTRODUCCION A LA
GEOESTADISTICA

R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
120
140
160
180
200
220
240
260
280
300

Teora y Aplicacin

Ramn Giraldo Henao.
Profesor Asistente
Departamento de Estadstica
Universidad Nacional de Colombia
Sede Bogot
3

Contenido

Prefacio
Introduccin

1. Datos Espaciales y Anlisis Exploratorio.

1.1 Estadstica Espacial.
1.2 Geoestadstica, Lattices y Patrones Espaciales
1.3 Datos Georreferenciados
1.4 Justificacin del AED
1.5 Grficos Exploratorios
1.6 Aplicacin

2. Definiciones Bsicas de Geoestadstica.

2.1. Variable Regionalizada. Momentos.
2.2. Estacionariedad Fuerte e Intrnseca
2.3. Isotropa y Anisotropa

3. Correlacin Espacial Muestral

3.1 . Funciones de Correlacin Espacial
3.1.1. Variograma y Semivariograma
3.1.2. Covariograma y Correlograma
3.2. Modelos Tericos de Semivarianza
3.3. Aplicacin.

4
4. Prediccin Espacial

4.1. Prediccin Espacial Optima
4.2. Definicin de Kriging
4.3. Kriging Ordinario
4.4. Otros Mtodos Kriging
4.4.1. Simple
4.4.2. Bloques
4.4.3. Universal
4.4.4. Residual
4.4.5. Indicador
4.4.6. LogNormal y Multigaussiano.
4.5. Aplicaciones.

5. Temas Especiales.

5.1. Cokriging Ordinario
5.2. Kriging sobre Ejes Factoriales
5.3. Diseo de Redes de Muestreo.
5.4. Simulacin
5.5. Aplicaciones.

6. Apndice

6.1. Indicador IGC
i
(P)
6.2. lgebra de Matrices
6.3. Conceptos de Probabilidad
6.4. Revisin de Algunos Mtodos Estadsticos.

7. Referencias.

5

Prefacio

La necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas
las reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas
metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son
especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre
otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene
actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica
encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de
informacin enmarcada dentro de este contexto. Como consecuencia de este impulso
surgi una nueva rama de la estadstica, denominada environmetrics (estadstica
ambiental). Dentro de esta ltima, los mtodos geoestadsticos juegan un papel
preponderante.
El presente documento tiene como propsito servir de consulta a gelogos,
bilogos, eclogos, agrnomos, ingenieros, meteorlogos y todos aquellos profesionales
que se encargan del estudio de informacin ambiental georreferenciada. Se toma como
base para las aplicaciones informacin de variables fisicoqumicas y biolgicas medidas en
un estuario ubicado en la costa norte de Colombia. La razn fundamental para lo anterior,
es que este escrito es uno de los resultados centrales de un proyecto de investigacin
1
, cuyo
objetivo fundamental fue el de evaluar la aplicabilidad de algunos procedimientos
estadsticos en el anlisis de datos medidos en este tipo de ecosistemas.
El documento tiene un enfoque terico-prctico. Para el seguimiento completo de la
teora descrita se requiere tener conocimientos bsicos de lgebra de matrices y de
estadstica matemtica. Sin embargo aquellas personas que estn poco familiarizadas con
estos temas, podrn obviar la lectura de algunas secciones en las que se hacen desarrollos
tericos y centrar su atencin en la filosofa de los mtodos presentados y en las
aplicaciones mostradas en cada uno de los captulos del documento. Una resumen no
exhaustivo de conceptos de lgebra lineal y de estadstica es hecho al final en el apndice.
No obstante en el escrito se cubren diversos temas geoestadsticos y se hacen
aplicaciones de mtodos recientes, es necesario acudir a la lectura de artculos cientficos y
textos avanzados para lograr un buen dominio de esta metodologa. Un libro formal desde
el punto de vista matemtico con aplicaciones en diversas disciplinas es Cressie (1993).
Otras referencias pueden ser tomadas de la bibliografa.

1
Proyecto "Anlisis y aplicacin de tcnicas geoestadsticas en la modelacin de procesos estocsticos
relacionados con variables ecolgicas en ambientes estuarinos", cofinanciado por INVEMAR y
COLCIENCIAS.
6

Introduccin

El estudio de fenmenos con correlacin espacial, por medio de mtodos
geoestadsticos, surgi a partir de los aos sesenta, especialmente con el propsito de
predecir valores de las variables en sitios no muestreados. Como antecedentes suelen
citarse trabajos de Sichel (1947; 1949) y Krige (1951). El primero observ la naturaleza
asimtrica de la distribucin del contenido de oro en las minas surafricanas, la equipar a
una distribucin de probabilidad lognormal y desarroll las frmulas bsicas para esta
distribucin. Ello permiti una primera estimacin de las reservas, pero bajo el supuesto de
que las mediciones eran independientes, en clara contradiccin con la experiencia de que
existen zonas ms ricas que otras. Una primera aproximacin a la solucin de este
problema fue dada por gelogo G. Krige que propuso una variante del mtodo de medias
mviles, el cual puede considerarse como el equivalente al krigeado simple que, como se
ver ms adelante, es uno de los mtodos de estimacin lineal en el espacio con mayores
cualidades tericas. La formulacin rigurosa y la solucin al problema de prediccin
(estimacin en muchos textos geoestadsticos) vino de la mano de Matheron (1962) en la
escuela de minas de Pars. En los aos sucesivos la teora se fue depurando, ampliando su
campo de validez y reduciendo las hiptesis necesarias (Samper y Carrera, 1990). De la
minera las tcnicas geoestadsticas, se han "exportado" a muchos otros campos como
hidrologa, fsica del suelo, ciencias de la tierra y ms recientemente al monitoreo
ambiental y al procesamiento de imgenes de satlite.
Aunque la aplicacin de la herramienta geoestadstica es bastante reciente, son
innumerables los ejemplos en los que se ha utilizado esta tcnica en estudios ambientales
con el nimo de predecir fenmenos espaciales (Robertson, 1987; Cressie y Majure, 1995;
Diggle et al., 1995). La columna vertebral del anlisis geoestadstico es la determinacin
de la estructura de autocorrelacin entre los datos y su uso en la prediccin a travs de las
tcnicas conocidas como kriging y cokriging. Otros temas importantes dentro del estudio
de informacin georreferenciada son el diseo de redes de muestreo (McBratney et al.,
1981), la geoestadstica multivariada (Wackernagel, 1995) y la simulacin (Deutsh y
Journel, 1992).
La geoestadstica es solo una las reas del anlisis de datos espaciales. Es
importante reconocer cuando la informacin georreferenciada es susceptible de ser
analizada por medio de dicha metodologa. Por ello en el documento se hace inicialmente
una definicin global de estadstica espacial y se describen las caractersticas especiales
que enmarcan cada una de sus reas.
En el estudio de informacin georreferenciada, de forma anloga a como se procede
en la aplicacin de muchos procedimientos estadsticos, la primera etapa que se debe
cumplir es la del anlisis exploratorio de datos (AED). Esta busca identificar localizacin,
variabilidad, forma y observaciones extremas. Por ello en el primer captulo del escrito se
hace una revisin de mtodos empleados en el AED y se describen algunos particularmente
tiles en el contexto del anlisis de informacin georreferenciada. Posteriormente en el
segundo captulo, entrando en materia, se hace definicin de conceptos bsicos dentro de la
teora geoestadstica.
7
En el tercer captulo se describen los procedimientos empleados para identificar de
manera experimental (con base en datos muestrales) la estructura de autocorrelacin
espacial, para algunas distancias dadas, de un conjunto de datos de una variable. Se muestra
tambin como generalizar dicha estructura para cualquier distancia entre los sitios de
observacin. Una vez detectada la autocorrelacin espacial, el siguiente paso es la
prediccin en sitios de la regin de estudio donde no se ha hecho medicin de la variable de
inters. Esto es llevado a cabo por medio de alguno de los procedimientos kriging que son
descritos en el captulo cuatro. Por ltimo, en el captulo cinco, se hace referencia a temas
especiales dentro del anlisis geoestadstico como cokriging, componentes principales
regionalizados, diseo de redes de muestreo y simulacin. En cada seccin del documento,
despus de que han sido expuestos los aspectos tericos esenciales de cada tcnica, se
muestran aplicaciones practicas.
8

Captulo Uno

Datos Espaciales y Anlisis Exploratorio

En las secciones 1.1 y 1.2 se define estadstica espacial y se mencionan sus
subdivisiones. Lo anterior se hace con el propsito nico de que el lector identifique el
alcance del tema considerado dentro del escrito. Por ello a partir de la seccin 1.3 de este
captulo y en los captulos siguientes se consideran slo temas referentes a geoestadstica

1.1. Estadstica Espacial.

Estadstica espacial es la reunin de un conjunto de metodologas apropiadas para el
anlisis de datos que corresponden a la medicin de variables aleatorias en diversos sitios
(puntos del espacio o agregaciones espaciales) de una regin. De manera ms formal se
puede decir que la estadstica espacial trata con el anlisis de realizaciones de un proceso
estocstico{ } D s s Z : ) ( , en el que s
d
R representa una ubicacin en el espacio euclidiano d-
dimensional, Z(s) es una variable aleatoria en la ubicacin s y s vara sobre un conjunto de
ndices D
d
R .
1.2. Areas de la Estadstica Espacial.
La estadstica espacial se subdivide en tres grandes reas. La pertinencia de cada una
de ellas est asociada a las caractersticas del conjunto D de ndices del proceso estocstico
de inters. A continuacin se mencionan dichas reas y se describen las propiedades de D
en cada una de stas.
Geoestadstica: Las ubicaciones s provienen de un conjunto D continuo y son
seleccionadas a juicio del investigador (D fijo). Algunos ejemplos de datos que pueden ser
tratados con esta metodologa son: Niveles de un contaminante en diferentes sitios de una
parcela, contenidos aurferos de una mina, valores de precipitacin en Colombia medida en
las diferentes estaciones meteorolgicas en un mes dado o los niveles piezomtricos de un
acufero. En los ejemplos anteriores es claro que hay continuidad espacial, puesto que en
cualquier sitio de la parcela, de la mina, de Colombia o del acufero pueden ser medias las
correspondientes variables. Es importante resaltar que en geoestadstica el propsito
esencial es la interpolacin y si no hay continuidad espacial pueden hacerse predicciones
carentes de sentido. Por ejemplo si la variable medida es produccin de caf en las fincas
cafeteras del departamento del Quindo, hacer interpolacin espacial y realizar un mapa de
distribucin de la produccin cafetera puede ser carente de sentido porque podran hacerse
predicciones sobre reas urbanas o no cultivadas con caf. Adems de lo anterior las
mediciones, no obstante sean georreferenciadas, corresponden a una agregacin espacial
(finca) ms que a un punto del espacio. En la parte de arriba, al comienzo de este prrafo,
se mencion que D deba ser fijo. A este respecto cabe aclarar que el investigador puede
hacer seleccin de puntos del espacio a conveniencia o puede seleccionar los sitios bajo
algn esquema de muestreo probabilstico.
9
Lattices (enmallados): Las ubicaciones s pertenecen a un conjunto D discreto y son
seleccionadas por el investigador (D fijo). Estas pueden estar regular o irregularmente
espaciadas. Algunos ejemplos de datos en lattices son los siguientes: Tasa de morbilidad
de hepatitis en Colombia medida por departamentos, tasa de accidentalidad en sitios de una
ciudad, produccin de caa de azcar en el departamento del Valle del Cauca segn
municipio, colores de los pixeles en interpretacin de imgenes de satlite. En los ejemplos
anteriores se observa que el conjunto de ubicaciones de inters es discreto y que estas
corresponden a agregaciones espaciales ms que a un conjunto de puntos del espacio. Es
obvio que la interpolacin espacial puede ser carente de sentido con este tipo de datos.
Patrones Espaciales: las ubicaciones pertenecen a un conjunto D que puede ser
discreto o continuo y su seleccin no depende del investigador (D aleatorio). Ejemplos de
datos dentro de esta rea son: Localizacin de nidos de pjaros en una regin dada, puntos
de imperfectos dentro de una placa metlica, ubicacin de los sitios de terremoto en
Colombia o cuadrantes de una regin con presencia de una especie particular. Debe notarse
que en los ejemplos anteriores hay aleatoriedad en la seleccin de los sitios, puesto que la
ubicacin de los nidos de los pjaros, de los imperfectos dentro de la placa metlica, de los
sitios de terremoto o de los cuadrantes con presencia de la especie, no dependen del
criterio del investigador. Una vez se ha hecho la seleccin de sitios es posible hacer
medidas de variables aleatorias en cada uno de ellos. Por ejemplo si en primera instancia se
establece la ubicacin de rboles de pino dentro de un bosque, es posible que sea de inters
medir en cada uno de los rboles el dimetro o la altura. En general el propsito de anlisis
en estos casos es el de determinar si la distribucin de los individuos dentro de la regin es
aleatoria, agregada o uniforme.
1.3. Datos Georrferenciados
Las mediciones de las caractersticas de inters en un estudio regionalizado tienen
implcitamente asociadas las coordenadas de los sitios en donde estas fueron tomadas.
Cuando el rea de estudio es considerablemente grande se usa un geoposicionador para
establecer dichas coordenadas. En otros casos, por ejemplo en diseos experimentales con
parcelas, es suficiente con hacer asignaciones segn planos cartesianos. Un esquema
general de datos georreferenciados es el siguiente:
Sitio

Latitud
Norte
Longitud
Este
X
1
X
2
. . . X
p
1

x
11
x
12
. . . x
1p

2

x
21
x
22
. . . x
2p

3

x
31
x
32
. . . x
3p

4

x
41
x
42
. . . x
4p

.

. . . . . .
.

. . . . . .
.

. . . . . .
n

x
n1
x
n2
. . . x
np

En la tabla anterior n es el nmero de sitios muestreados y p el de variables medidas en
cada uno de ellos. Cada x
ij
corresponde a la medida de la variable X
j
(j = 1, 2,..., p) en el
sitio i (i= 1, 2,..., n), que puede ser cuantitativa o categrica. Algunas de las variables
10
pueden estar ms intensamente muestreadas que las otras (x
ij
faltantes). Las coordenadas
pueden ser planas, geogrficas (grados, minutos y segundos) o cartesianas. Sin embargo la
posible utilizacin de unas u otras depende del software empleado para los anlisis.
1.4. Justificacin del Anlisis Exploratorio de Datos Espaciales .
En la aplicacin de la geoestadstica es de suma importancia, al igual que en otros
procedimientos estadsticos (por ejemplo los modelos ARIMA dentro de la teora de series
de tiempo), el anlisis grfico. La identificacin de valores extremos y su ubicacin
geogrfica, la evaluacin de la forma de la distribucin y el clculo de medidas de
localizacin, variabilidad y correlacin es muy importante para establecer si algunos
supuestos necesarios para la aplicacin de la teora geoestadstica son vlidos o para definir
que procedimiento de prediccin es el ms conveniente. Por ejemplo, como se ver en el
captulo cuatro, la decisin de usar kriging ordinario o kriging universal se fundamenta en
identificar si la media es o no constante en la regin. El uso de kriging log-normal se basa
en un criterio emprico relacionado con la forma asimtrica de la distribucin de los datos
muestrales. La decisin de emplear cokriging depende de la deteccin de asociaciones
entre las variables.
1.5. Grficos Exploratorios
Al igual que en un estudio exploratorio clsico, cuando se dispone de informacin
georreferenciada se pueden emplear histogramas, diagramas de tallos y hojas y de caja y
bigotes (Hoaglin et al., 1983) con el propsito de identificar localizacin, variabilidad,
forma y observaciones extremas. Adicionalmente los grficos de dispersin son muy tiles
tanto para la deteccin de relaciones entre las variables como para la identificacin de
tendencias en el valor promedio de la variable en la regin (relacin entre la variable
medida y las coordenadas geogrficas). Un supuesto fundamental en el anlisis
geoestadstico es que el fenmeno es estacionario, para lo cual, entre otros aspectos, el
nivel promedio de la variable debe ser constante en todos los puntos del rea de estudio.
Una deteccin de tendencia en el grfico de dispersin puede ser una muestra de que no se
satisface dicho supuesto. El grfico se construye tomando como eje de las abcisas la
variable que representa la coordenada geogrfica y en el eje de las ordenadas la variable
cuantitativa de estudio. La observacin de la nube de puntos resultante, incluso el ajuste de
una lnea de regresin, permite establecer de manera emprica si existe dicha tendencia. Un
grfico de dispersin entre valores de la variable separados por una distancia espacial dada
(dispersograma rezagado) es til en la deteccin de autocorrelacin espacial. Otro grfico
que tradicionalmente se emplea en la descripcin de datos espaciales es el de datos
clasificados segn puntos de referencia (media, mediana, cuartles). Este permite comparar
zonas del sistema de estudio respecto a las magnitudes de las variables.

11
1.6 Aplicacin: Estudio exploratorio de la distribucin de datos fisicoqumicos y
biolgicos medidos en el estuario Cinaga Grande de Santa Marta en Marzo de 1997.

Con informacin de las variables salinidad, seston (mg/l), nitritos (mol/l),
silicatos(mol/l) y clorofila a (g/l) medidas en una jornada de muestreo realizada en
marzo de 1997 en el estuario Cinaga Grande de Santa Marta (CGSM)(Fig. 1), se realiz
un estudio exploratorio de datos. Los resultados encontrados son descritos a continuacin:
En primera instancia, se evidencia en el diagrama de caja (Fig. 2) y en el grfico de tallos
y hojas (Fig. 3) que, con excepcin de la variable nitritos, existe un comportamiento
simtrico en las distribuciones de los datos. Se observa tambin en estas figuras, que en
todas las variables se presentan algunos valores atpicos o muy alejados del
comportamiento general antes mencionado. Lo anterior, antes de ser tomado como un
indicador de alta variabilidad o de errores de medicin, puede ser considerado como un
reflejo del comportamiento espacial de las variables dentro del ecosistema. La simetra de
la mayora de las variables hace pensar que existe una gran zona en donde las condiciones
del sistema respecto a la calidad del agua son bastante similares (esto podra ser lo que se
conoce como cuerpo de agua de la CGSM) y los valores alejados pueden estar
representando las condiciones de sitios especficos, particularmente especiales dentro del
sistema, como son la zona ms estuarina (sitios de muestreo cercanos al sitio Boca de la
Barra, Fig.1) y las de desembocaduras de los ros que bajan de la Sierra Nevada de Santa
Marta (costado oriental y sur del sistema, Fig. 1).

Figura 1. rea de estudio y cuadrculas en que fue subdividido el sistema Cinaga Grande de Santa Marta
para realizar la toma de muestras. Cada una de las 115 cuadrculas tiene un rea de 4 km2. Los datos fueron
tomados en el centro de cada una de ellas.

La afirmacin de que no existen problemas de alta variabilidad y que por el
contrario los datos medidos son bastante homogneos, puede confirmarse con los valores
de los coeficientes de variacin (tabla 1). En su mayora estos son menores del 30% y por
consiguiente indicadores de poca heterogeneidad en la informacin.
12

Tabla 1. Medidas de localizacin y variabilidad de algunas variables medidas en la superficie de la columna
de agua del estuario Cinaga Grande de Santa Marta en Marzo de 1997.
Medida

Salinidad

Seston (mg/l) Nitritos (umol/l) Silicatos
(umol/l)
Clorofila a
(ug/l)
Media 17.6 218.28 0.436 244.94 132.44
Mediana 16.9 215 0.350 251.83 137.37
Mnimo 13.02 103 0.01 10.98 2.91
Mximo 34.9 318 1.61 358 198.3
Cuartl Inferior. 15.97 191 0.210 226.52 124.43
Cuartl Superior. 18.04 248 0.6 278.43 149.29
Desviacin Estndar 2.79 41.1 0.309 61.43 31.30
Coeficiente de Variacin 16.1 18.8 70.8 25.07 23.7

Las medidas de localizacin (media y mediana, tabla 1) toman valores similares a
los reportados en otros estudios para la misma poca del ao. Una discusin a este respecto
se encuentra en Hernndez (1986) y Hernndez y Gocke (1990).

Variable
M
e
d
i
d
a

E
s
t
a
n
d
a
r
i
z
a
d
a
Salinidad Seston Nitritos Silicatos Clorofila
-5
-3
-1
1
3
5
7

Figura 2. Diagramas de caja de algunas variables medidas en la superficie de la columna de agua del estuario
Cinaga Grande de Santa Marta en Marzo de 1997. Las variables fueron estandarizadas antes de construir los
diagramas.

El grfico de dispersin de la variable salinidad (una de las de mayor relevancia en
el establecimiento del comportamiento espacial de las variables en el sistema) respecto a las
coordenadas latitud y longitud (Fig. 4), permite apreciar una leve tendencia en la magnitud
de la variable a lo largo de estas direcciones, lo que hace suponer que, a pesar de la
homogeneidad antes mencionada, el valor promedio de la misma no es constante en toda la
regin. Lo anterior se puede comprobar en el grfico 5, en donde se aprecia que en una
gran parte de la zona centro de la Cinaga y hacia la desembocadura de los ros Sevilla y
Aracataca la magnitud de la variable es menor a la de los restantes sitios de muestreo. Esta
figura revela claramente la influencia que tienen las entradas de agua (tal vez exceptuando
13
la entrada del ro Fundacin) en el comportamiento de esta variable. Los valores
relativamente altos, respecto a los antes descritos, en la zona occidental pueden ser
consecuencia del proceso de lavado de suelos hipersalinos que se da en poca de lluvias en
el complejo Pajarales (sistema con el que tiene frontera la Cinaga) y que llegan al sistema
a travs de los Canales Grande y Clarn (Fig. 5). Los valores "altos" en la zona sur pueden
ser de igual forma causados por la influencia del canal Grande y por circulacin de las
masas de agua dentro del sistema (contrario a las manecillas del reloj)
14

a). Salinidad

Bajo 127
2 13 5
4 14* 14
11 14 6677889
18 15* 0011224
30 15 566888899999
46 16* 0011222333333334
(13) 16 5555666777899
55 17* 011112233344
43 17 5556777788889
30 18* 0000122233344
17 18 555556777888
5 19* 01
Alto 283,332,342
b). Seston

Bajo 10
2 1* 1
3 1T 2
5 1F 55
15 1S 6667777777
36 1o 888888888899999999999
20) 2* 00000001111111111111
47 2T 2222222222222333333
27 2F 44555555
19 2S 6666777777777
6 2o 99
4 3* 0011

c). Nitritos

5 0 16888
26 1 000022555777779999999
43 2 11113333555558888
(19) 3 0000022244444666699
50 4 1133355555777777
34 5 02248
29 6 000033355599
17 7 1668
13 8 027
10 9 366
7 10 2
6 11 3
Alto 120,126,131,141,161

d). Silicatos

Bajo 1,1,1,1,2
6 1S 6
11 1o 88999
22 2* 00000111111
43 2T 222222223333333333333
(24 2F 444444444555555555555555
45 2S 666666666666677777
27 2o 888888889999
15 3* 000000111
6 3T 2223
2 3F 4
Alto 35

e). Clorofila a.

Bajo 2,11,17,43,54,58,75
8 9 7
10 10 04
21 11 01233334579
41 12 00033444666677788899
(18) 13 001124444556788889
47 14 001111123334444567899
26 15 0011333444467788
10 16 0266
6 17 00138
Alto 198

Figura 3. Diagramas de tallos y hojas de algunas variables medidas en la superficie de la columna de agua
del estuario Cinaga Grande de Santa Marta en Marzo de 1997.

15

0
5
10
15
20
25
30
35
1675000 1680000 1685000 1690000 1695000 1700000 1705000 1710000
Latitud Norte
S
a
l
i
n
i
d
a
d

(
o
/
o
o
)

0
5
10
15
20
25
30
35
950000 955000 960000 965000 970000 975000 980000
Longitud Este
S
a
l
i
n
i
d
a
d

(
o
/
o
o
)

Figura 4. Grficos de dispersin de valores de salinidad respecto a las coordenadas geogrficas de medicin.
Datos tomados en la superficie de la columna de agua del estuario Cinaga Grande de Santa Marta en Marzo
de 1997.

16
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
. A
ra
c
a
ta
c
a
13.00 to 16.40
16.40 to 17.30
17.30 to 18.40
18.40 to 35.00

Figura 5. Clasificacin de observaciones de la variable salinidad en intervalos (segn cuartles) y ubicacin
de estas dentro del rea de estudio. Datos medidos en el estuario Cinaga Grande de Santa Marta en marzo de
1997.

Tabla 2. Matriz de correlacin calculada con base en informacin de algunas variables fisicoqumicas y
biolgicas medidas en el estuario Cinaga Grande de Santa Marta en marzo de 1997. Los coeficientes que
aparecen en negrita son significativos.
Salinidad Seston Nitritos Silicatos Clorofila a
Salinidad 1 -0.09 -0.10 -0.60 -0.47
Seston 1 -0.33 0.06 0.45
Nitritos 1 -0.08 -0.23
Silicatos 1 0.46
Clorofila a 1

Por ltimo de la matriz de correlacin (tabla 2) es posible afirmar que la abundancia
fitoplanctnica, evaluda a travs de la concentracin de clorofila a, presenta correlacin
significativa con las variables fisicoqumicas medidas. Este patrn de correlacin entre
variables biticas y abiticas en otros trabajos de menor intensidad muestral no ha podido
ser detectado. En general los estudios realizados en la Cinaga Grande de Santa Marta en
los que se pretende determinar los patrones de asociacin entre las variables biolgicas y
fisicoqumicas siempre conducen a que la salinidad es la variable de mayor influencia en el
rgimen de productividad del sistema. Sin embargo estos resultados en primera instancia
pueden estar detectando otro tipo de asociaciones. En los captulos subsiguientes, cuando se
realicen los mapas de distribucin espacial, se podrn tener ms herramientas para discutir
respecto a este tema.
17

Captulo Dos

Definiciones Bsicas de Geoestadstica

2.1. Definicin de Geoestadstica
La geoestadstica es una rama de la estadstica que trata fenmenos espaciales
(Journel & Huijbregts, 1978). Su inters primordial es la estimacin, prediccin y
simulacin de dichos fenmenos (Myers, 1987). Esta herramienta ofrece una manera de
describir la continuidad espacial, que es un rasgo distintivo esencial de muchos fenmenos
naturales, y proporciona adaptaciones de las tcnicas clsicas de regresin para tomar
ventajas de esta continuidad (Isaaks & Srivastava, 1989). Petitgas (1996), la define como
una aplicacin de la teora de probabilidades a la estimacin estadstica de variables
espaciales.
La modelacin espacial es la adicin ms reciente a la literatura estadstica.
Geologa, ciencias del suelo, agronoma, ingeniera forestal, astronoma, o cualquier
disciplina que trabaja con datos colectados en diferentes locaciones espaciales necesita
desarrollar modelos que indiquen cuando hay dependencia entre las medidas de los
diferentes sitios. Usualmente dicha modelacin concierne con la prediccin espacial, pero
hay otras reas importantes como la simulacin y el diseo muestral (Cressie, 1989).
Cuando el objetivo es hacer prediccin, la geoestadstica opera bsicamente en dos
etapas. La primera es el anlisis estructural, en la cual se describe la correlacin entre
puntos en el espacio. En la segunda fase se hace prediccin en sitios de la regin no
muestreados por medio de la tcnica kriging (captulo 4). Este es un proceso que calcula un
promedio ponderado de las observaciones muestrales. Los pesos asignados a los valores
muestrales son apropiadamente determinados por la estructura espacial de correlacin
establecida en la primera etapa y por la configuracin de muestreo (Petitgas, 1996). Los
fundamentos bsicos de estas etapas son presentados a continuacin.
2.2. Variable Regionalizada.

Una variable medida en el espacio de forma que presente una estructura de
correlacin, se dice que es una variable regionalizada. De manera ms formal se puede
definir como un proceso estocstico con dominio contenido en un espacio euclidiano d-
dimensional R
d
, {Z(x) : x D R
d
}. Si d = 2, Z (x) puede asociarse a una variable medida
en un punto x del plano (Daz-Francs, 1993). En trminos prcticos Z(x) puede verse como
una medicin de una variable aleatoria (p.ej. concentracin de un contaminante) en un
punto x de una regin de estudio.
Recurdese que un proceso estocstico es una coleccin de variables aleatorias
indexadas; esto es, para cada x en el conjunto de ndices D, Z(x) es una variable aleatoria.
En el caso de que las mediciones sean hechas en una superficie, entonces Z(x) puede
interpretarse como la variable aleatoria asociada a ese punto del plano (x representa las
coordenadas, planas o geogrficas, y Z la variable en cada una de ellas). Estas variables
18
aleatorias pueden representar la magnitud de una variable ambiental medida en un conjunto
de coordenadas de la regin de estudio.
2.3. Momentos de una Variable Regionalizada
Sea {Z(x) : x D R
d
}el proceso estocstico que define la variable regionalizada.
Para cualquier n puntos x
1
, x
2
, ..., x
n
, el vector aleatorio ( ) ( ) ( ) ( ) [ ]
T
n
x Z x Z x Z x Z , , ,
2 1
L
r
=
est definido por su funcin de distribucin conjunta
[ ] ( ) ( ) ( ) [ ]
n n n
z x Z z x Z z x Z P z z z F = , , , , , ,
2 2 1 1 2 1
L L
Conocidas las densidades marginales univariadas y bivariadas se pueden establecer los
siguientes valores esperados (momentos univariados y bivariados):
( ) ( ) ( )
i i
x m x Z E =
( ) ( ) ( ) ( ) [ ]
2 2
i i i i
x m x Z E x Z V = =
( ) ( ) ( ) ( ) ( ) [ ] ( ) ( ) [ ]
j j i i j i
x m x Z x m x Z E x Z x Z C = , : Funcin de autocovarianza
( ) ( ) ( ) ( ) ( ) [ ]
2
2
1
,
j i j i
x Z x Z E x Z x Z = : Funcin de semivarianza
2.4. Estacionariedad
La variable regionalizada es estacionaria si su funcin de distribucin conjunta es
invariante respecto a cualquier translacin del vector h, o lo que es lo mismo, la funcin de
distribucin del vector aleatorio ( ) ( ) ( ) ( ) [ ]
T
n
x Z x Z x Z x Z , , ,
2 1
L
r
= es idntica a la del vector
( ) ( ) ( ) ( ) [ ]
T
n
h x Z h x Z h x Z x Z + + + = , , ,
2 1
L
r
para cualquier h. La teora geoestadstica se
basa en los momentos arriba descritos y la hiptesis de estacionariedad puede definirse en
trminos de estos:
2.4.1 Estacionariedad de Segundo Orden
Sea {Z(x): xD R
d
} una variable regionalizada definida en un dominio D contenido
en R
d
(generalmente una variable medida en la superficie de una regin) se dice que Z(x) es
estacionario de segundo orden si cumple:
a. E [ Z(x)] = m, k R, x D R
d
.
El valor esperado de la variable aleatoria es finito y constante para todo punto en el
dominio.
b. COV [ Z(x) , Z(x+h)] = C(h) <
Para toda pareja ( ) ( ) { } h x Z x Z + , la covarianza existe y es funcin nica del vector de
separacin h.

En la figura 6 se muestra el grafico de una variable regionalizada estacionaria.
Exceptuando fluctuaciones aleatorias, el valor promedio de la variable no muestra una
tendencia definida en alguna direccin.

19
La existencia de la covarianza implica que la varianza existe, es finita y no depende de
h, es decir ( ) ( )
2
) 0 ( = = C x Z V
i
. As mismo la estacionariedad de segundo orden implica
la siguiente relacin entre la funcin de semivarianza y la de autocovarianza:

( ) ( ) ( ) ( ) ( ) ( ) [ ]
2
2
1
, m x Z m h x Z E h x Z h x Z + + = = +
= ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) { } m x Z m h x Z E m x Z E m h x Z E + + + 2
2
1
2 2

= ( ) ( ) ( ) ( ) { } m x Z m h x Z E + +
2 2
2
1
2
1

= ( ) h C
2
.

Figura 6. Representacin de una superficie interpolada para una variable regionalizada estacionaria

2.4.2. Estacionariedad Dbil o Intrnseca

Existen algunos fenmenos fsicos reales en los que la varianza no es finita. En estos
casos se trabaja slo con la hiptesis que pide que los incrementos [Z(x+h) - Z(x)] sean
estacionarios, esto es (Clark, 1979):
a. Z(x) tiene esperanza finita y constante para todo punto en el dominio. Lo que implica que
la esperanza de los incrementos es cero.
( ) [ ] 0 ) ( = + x Z h x Z E
b. Para cualquier vector h, la varianza del incremento est definida y es una funcin nica
de la distancia.
V [ Z(x+h) - Z(x)] = ( ) [ ]
2
) ( x Z h x Z E + = 2 (h)
20
Es claro que si una variable regionalizada es estacionaria fuerte entonces tambin ser
estacionaria dbil. El concepto de estacionariedad es muy til en la modelacin de series
temporales (Box & Jenkins, 1976). En este contexto es fcil la identificacin, puesto que
slo hay una direccin de variacin (el tiempo). En el campo espacial existen mltiples
direcciones y por lo tanto se debe asumir que en todas el fenmeno es estacionario. Cuando
la esperanza de la variable no es la misma en todas las direcciones o cuando la covarianza o
correlacin dependan del sentido en que se determinan, no habr estacionariedad. Si la
correlacin entre los datos no depende de la direccin en la que esta se calcule se dice que
el fenmeno es isotrpico, en caso contrario se hablar de anisotropa. En Isaaks y
Srivastava (1989) se definen los posibles tipos de anisotropa y se proponen algunas
soluciones. Cressie (1993) discute cual debe ser el tratamiento en caso de que la media no
sea constante.
En casos prcticos resulta compleja la identificacin de la estacionariedad. Suelen
emplearse grficos de dispersin de la variable respecto a las coordenadas, de medias
mviles y de valores clasificados segn puntos de referencia, con el propsito de identificar
posibles tendencias de la variable en la regin de estudio. L a isotropa es estudiada a travs
del clculo de funciones de autocovarianza o de semivarianza muestrales (captulo3) en
varias direcciones. Si estas tienen formas considerablemente distintas puede no ser vlido el
supuesto de isotropa. Finalmente una variable regionalizada ser no estacionaria si su
esperanza matemtica no es constante, esto es si ( ) [ ] ( ) x m x Z E = . En la figura 7 se
representa una variable regionalizada en la que existe tendencia en el valor promedio de la
variable, lo cual es claro indicador de no estacionariedad.

Figura 7. Representacin de una superficie interpolada para una variable regionalizada no estacionaria

21

Captulo Tres

Correlacin Espacial Muestral y Ajuste de Modelos

3.1. Funciones de Correlacin Espacial
La primera etapa en el desarrollo de un anlisis geoestadstico es la determinacin
de la dependencia espacial entre los datos medidos de una variable. Esta fase es tambin
conocida como anlisis estructural. Para llevarla a cabo, con base en la informacin
muestral, se usan tres funciones: El semivariograma, el covariograma y el correlograma. A
continuacin se hace una revisin de los conceptos asociados a cada una de ellas y se
describen sus bondades y limitaciones.
3.1.1. Variograma y Semivariograma.
Cuando se defini la estacionariedad dbil en el captulo anterior se mencion que se
asuma que la varianza de los incrementos de la variable regionalizada era finita. A esta
funcin denotada por 2(h) se le denomina variograma. Utilizando la definicin terica de
la varianza en trminos del valor esperado de una variable aleatoria, tenemos:

( )
( ) ( ) ( ) ( )
( ) ( ). ) ( ) (
) ( ) ( ) ( ) (
) ( ) ( ) ( 2
2
2
0
2
x Z h x Z E
x Z h x Z E x Z h x Z E
x Z h x Z V h
+ =
+ + =
+ =
4 4 4 3 4 4 4 2 1

La mitad del variograma (h), se conoce como la funcin de semivarianza y
caracteriza las propiedades de dependencia espacial del proceso. Dada una realizacin del
fenmeno, la funcin de semivarianza es estimada, por el mtodo de momentos, a travs
del semivariograma experimental, que se calcula mediante (Wackernagel, 1995):
( )
n
x Z h x Z
h
2
) ( ) (
) (
2
+
=
donde Z(x) es el valor de la variable en un sitio x, Z(x+h) es otro valor muestral separado
del anterior por una distancia h y n es el nmero de parejas que se encuentran separadas por
dicha distancia. La funcin de semivarianza se calcula para varias distancia h. En la
prctica, debido a irregularidad en el muestreo y por ende en las distancias entre los sitios,
se toman intervalos de distancia ] ( ] ( ] [ { } L , 3 , 2 , 2 , , , 0 h h h h h y el semivariograma experimental
corresponde a una distancia promedio entre parejas de sitios dentro de cada intervalo y no a
una distancia h especfica. Obviamente el nmero de parejas de puntos n dentro de los
intervalos no es constante.
Para interpretar el semivariograma experimental se parte del criterio de que a menor
distancia entre los sitios mayor similitud o correlacin espacial entre las observaciones. Por
ello en presencia de autocorrelacin se espera que para valores de h pequeos el
22
semivariograma experimental tenga magnitudes menores a las que este toma cuando las
distancias h se incrementan.
3.1.2. Covariograma y Correlograma.
La funcin de covarianza muestral entre parejas de observaciones que se encuentran a
una distancia h se calcula, empleando la formula clsica de la covarianza muestral, por:

( ) ( )
( )
) (
) ( ) (

) ) ( )( ) ( (
) ( ), (
2 1
1
h C m
n
x Z h x Z
n
m x Z m h x Z
x Z h x Z COV h C
n
i
n
i
=
+
=
+
= + =
=
=

donde m representa el valor promedio en todo punto de la regin de estudio y n es el
nmero de parejas de puntos que se encuentran a una distancia h. En este caso es tambin
vlida la aclaracin respecto a las distancias dadas en el ltimo prrafo de la pgina
anterior.
Asumiendo que el fenmeno es estacionario y estimando la varianza de la variable
regionalizada a travs de la varianza muestral, se tiene que el correlograma muestral est
dado por:

) 0 (
) ( ) ( )) ( ), ( (
) (
2
C
h C
S
h C
S S
x Z h x Z COV
h r
x x h x
= =
+
=
+

Bajo el supuesto de estacionariedad cualquiera de las tres funciones de dependencia
espacial mencionadas, es decir semivariograma, covariograma o correlograma, puede ser
usada en la determinacin de la relacin espacial entre los datos. Sin embargo como se
puede observar en las frmulas, la nica que no requiere hacer estimacin de parmetros es
la funcin de semivarianza. Por esta razn, fundamentalmente, en la prctica se emplea el
semivariograma y no las otras dos funciones.
A continuacin se presenta un ejemplo ilustrativo del clculo de la funcin de
semivarianza experimental: Suponga que se tienen medidas sobre una variable hipottica
cuyos valores estn comprendidos entre 28 y 44 unidades y su configuracin en una regin
de estudio es como se presenta en el esquema de la siguiente pgina. Como se indica en la
representacin, la distancia entre cada par de puntos contiguos es de 100 unidades. Luego si
existe un punto faltante la distancia entre los dos valores ubicados a cada lado de ste ser
de 200 unidades. Veamos como calcular bajo esta situacin el semivariograma
experimental. Por simplicidad se calcularn slo los semivariogramas en sentido
(izquierda-derecha) e (inferior-superior), debido a que para obtener un semivariograma
experimental en el que slo se tenga en cuenta la distancia y no la orientacin
(semivariograma omnidireccional), se requerira calcular la distancia euclidiana para un
nmero considerablemente alto de parejas de puntos.

23

44

40 42 40 39 37 36
42

43 42 39 39 41 40 38
37

37 37 35 38 37 37 33 34
35

38 35 37 36 36 35 200
36

35 36 35 34 33 32 29 28
38 37 35 30 29 30 32
100

En primer lugar en sentido izquierda-derecha se encuentran todas las parejas de puntos
que estn a una distancia de 100 unidades y se calcula el semivariograma como:
(100) = (38 - 37)
2
+ (37 - 35)
2
+ (29 - 30)
2
+ ... + (37 - 36)
2
/2* 36 = 1.458
anlogamente para la distancia de 200 unidades
(200) = (40 - 44)
2
+ (40 - 40)
2
+ (42 - 39)
2
+ ... + (29 - 32)
2
/2* 36 = 3.303
Similarmente se procede para otras distancias y para el sentido inferior-superior. Los
valores calculados de el semivariograma se muestran en la siguiente tabla.

Tabla 3. Valores de la funcin de semivarianza experimental en dos direcciones para el conjunto de datos
hipotticos.
Distancia Semivarianza
Sentido Izquierda-Derecha
Semivarianza
Sentido Inferior-Superior
100 1.45 5.34
200 3.30 9.87
300 4.31 18.88
400 6.69 27.53

Al graficar los valores de la funcin de semivarianza experimental dados en la tabla
anterior (Fig. 8) se observa que en sentido inferior-superior el semivariograma es mayor
que en sentido izquierda-derecha, luego la conclusin ms relevante para este conjunto de
datos es que la estructura de correlacin espacial no slo depende de la distancia entre los
sitios, sino de su orientacin. En otras palabras el fenmeno podra ser anisotrpico.
24
0
5
10
15
20
25
30
0 100 200 300 400 500
Distancia
S
e
m
i
v
a
r
i
a
n
z
a
Izq.-Der.
Inf.-Sup.

Figura 8. Funcin de semivarianza experimental en dos direcciones para un conjunto de datos hipotticos.

3.2. Modelos Tericos de Semivarianza.

Como se ver a partir del captulo cuatro la solucin del problema de prediccin
espacial kriging requiere del conocimiento de la estructura de autocorrelacin para
cualquier posible distancia entre sitios dentro del rea de estudio. En la presentacin del
semivariograma experimental dada anteriormente se indic que este es calculado slo para
algunas distancias promedios particulares. Por ello se hace necesario el ajuste de modelos
que generalicen lo observado en el semivariograma experimental a cualquier distancia.
Existen diversos modelos tericos de semivarianza que pueden ajustarse al semivariograma
experimental. En Samper y Carrera (1990) se presenta una discusin respecto a las
caractersticas y condiciones que stos deben cumplir. En general dichos modelos pueden
dividirse en no acotados (lineal, logartmico, potencial) y acotados (esfrico, exponencial,
gaussiano) (Warrick et al., 1986). Los del segundo grupo garantizan que la covarianza de
los incrementos es finita, por lo cual son ampliamente usados cuando hay evidencia de que
presentan buen ajuste. Todos estos modelos tienen tres parmetros comunes (Fig. 9) que
son descritos a continuacin:
Efecto Pepita

Se denota por C
0
y representa una discontinuidad puntual del semivariograma en el
origen (Fig. 9). Puede ser debido a errores de medicin en la variable o a la escala de la
misma. En algunas ocasiones puede ser indicativo de que parte de la estructura espacial se
concentra a distancias inferiores a las observadas.
Meseta

Es la cota superior del semivariograma. Tambin puede definirse como el limite del
semivariograma cuando la distancia h tiende a infinito. La meseta puede ser o no finita. Los
semivariogramas que tienen meseta finita cumplen con la hiptesis de estacionariedad
fuerte; mientras que cuando ocurre lo contrario, el semivariograma define un fenmeno
natural que cumple slo con la hiptesis intrnseca. La meseta se denota por C
1
o por (C
0
+
C
1
) cuando la pepita es diferente de cero. Si se interpreta la pepita como un error en las
mediciones, esto explica porque se sugiere que en un modelo que explique bien la realidad,
la pepita no debe representar mas del 50% de la meseta. Si el ruido espacial en las
25
mediciones explica en mayor proporcin la variabilidad que la correlacin del fenmeno,
las predicciones que se obtengan pueden ser muy imprecisas. En la figura 9 se representa
este parmetro para el caso de uno de los modelos acotados.
0,0
0,4
0,8
1,2
1,6
2,0
0 10000 20000 30000
Distancia
S
e
m
i
v
a
r
i
a
n
z
a
SEMEXP
MODELO

Figura 9. Comportamiento tpico de un semivariograma acotado con una representacin de los parmetros
bsicos. SEMEXP corresponde al semivariograma experimental y MODELO al ajuste de un modelo terico.

Rango

En trminos prcticos corresponde a la distancia a partir de la cual dos observaciones
son independientes. El rango se interpreta como la zona de influencia. Existen algunos
modelos de semivariograma en los que no existe una distancia finita para la cual dos
observaciones sean independientes; por ello se llama rango efectivo a la distancia para la
cual el semivariograma alcanza el 95% de la meseta. Entre ms pequeo sea el rango, ms
cerca se esta del modelo de independencia espacial. El rango no siempre aparece de manera
explcita en la frmula del semivariograma. En el caso del modelo esfrico (3.2.1), el rango
coincide con el parmetro a, que se utilizar en las ecuaciones ms adelante. Sin embargo,
en el modelo exponencial (3.2.2), el rango efectivo es a/3 y en el modelo gaussiano (3.2.3)
es a/3.
3.2.1. Modelo Esfrico

Tiene un crecimiento rpido cerca al origen (Fig. 10), pero los incrementos marginales
van decreciendo para distancias grandes, hasta que para distancias superiores al rango los
incrementos son nulos. Su expresin matemtica es la siguiente:
> +
|
|
\
|
|
\
|
|
\
|
+
=
a h C C
a h
a
h
a
h
C C
h
1 0
3
1 0
2
1
2
3
) (

En donde C
1
representa la meseta, a el rango y h la distancia.
Meseta (C
0
+ C
1
)
Pepita (C
0
)
Rango (a)
26
3.2.2. Modelo Exponencial

Este modelo se aplica cuando la dependencia espacial tiene un crecimiento exponencial
respecto a la distancia entre las observaciones. El valor del rango es igual a la distancia para
la cual el semivariograma toma un valor igual al 95% de la meseta (Fig. 10). Este modelo
es ampliamente usado. Su expresin matemtica es la siguiente:
|
|
\
|
|
\
|
+ =
a
h
C C h
3
exp 1 ) (
1 0

3.2.3. Modelo Gaussiano

Al igual que en el modelo exponencial, la dependencia espacial se desvanece solo en
una distancia que tiende a infinito. El principal distintivo de este modelo es su forma
parablica cerca al origen (Fig.10). Su expresin matemtica es:
|
|
\
|
|
|
\
|
+ =
2
2
1 0
exp 1 ) (
a
h
C C h

0
5
10
15
20
25
30
0 50 100 150 200 250 300
Distancia(h)
S
e
m
i
v
a
r
i
o
g
r
a
m
a
Esf rico
Exponencial
Gaussiano

Figura 10. Comparacin de los modelos exponencial, esfrico y Gaussiano. La lnea punteada vertical
representa el rango en el caso del modelo esfrico y el rango efectivo en el de los modelos exponencial y
gaussiano. Este tiene un valor de 210, respecto a una escala simulada entre 0 y 300. El valor de la meseta es
30 y el de la pepita 0. El 95% de la meseta es igual a 28.5.
3.2.4. Modelo Monmicos.
Corresponden a los modelos que no alcanzan la meseta (Fig. 11). Su uso puede ser
delicado debido a que en algunos casos indican la presencia de no estacionariedad en
alguna direccin.

27
Su frmula matemtica es la siguiente:

( ) h kh = < < 0 2
Obviamente cuando el parmetro es igual a uno el modelo es lineal y k representa la
pendiente de la ecuacin de regresin con intercepto cero. Grficamente se pueden
representar as:
Figura 11. Comportamiento tpico de los modelos de semivarianza monmicos.
3.2.5. Modelo de Independencia (Pepita Puro).
Es indicativo de carencia de correlacin espacial entre las observaciones de una
variable (Fig. 12). Es comn sumar este modelo a otro modelo terico de semivarianza,
para obtener lo que se conoce como semivariograma anidado. Lo anterior se sustenta en
una propiedad de los semivariogramas que dice que cualquier combinacin lineal de
semivariogramas con coeficientes positivos es un semivariograma. Su expresin
matemtica es:
( ) h
h
C h
=
=
>
0 0
0
0
, donde C
0
>0
Su representacin grfica es la siguiente:
(h)

C
0

h
Figura 12. Modelo de semivarianza terico para variables sin correlacin espacial.

0
20
40
60
80
100
120
140
160
0 5 10 15 20 25 30 35
Distancia (h)
S
e
m
i
v
a
r
i
a
n
z
a
1<Theta <2
Theta = 1
0<Theta < 1
28

La estimacin de los parmetros de los modelos tericos descritos puede ser llevada a
cabo, entre otros mtodos, por mxima verosimilitud (Cressie, 1993) o regresin no lineal
(Gotway, 1991). Algunos paquetes de computo geoestadsticos como GS+ (Gamma Design
Software, 1999) traen incorporados procedimientos iterativos como el de Gauss-Newton
para llevar a cabo la estimacin. Otros como GeoEAS (Englund y Sparks, 1988) slo
permiten el ajuste a sentimiento por el mtodo de ensayo y error.
Como se mencion en la seccin 4.2. cuando la autocorrelacin no es igual en todas las
direcciones entonces se dice que hay anisotropa. Esa puede ser geomtrica o zonal. La
primera se presenta cuando los semivariogramas calculados en varias direcciones tienen
igual meseta pero varan en el rango. En el segundo caso todos los semivariogramas
direccionales tiene igual rango pero diferente meseta. Algunas transformaciones apropiadas
para solucionar la anistropa y hacer vlida la construccin de un semivariograma
omnidireccional se pueden encontrar en Isaaks y Srivastava (1989), Samper y Carrera
(1990) y Cressie (1993) .

3.3. Aplicacin: Estimacin de Modelos de Semivarianza para algunas variables
fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta.
En esta seccin se hace una interpretacin prctica de resultados encontrados al hacer
estimacin de modelos tericos de semivarianza para un conjunto de variables medidas en
el estuario Cinaga Grande de Santa Marta (IGAC, 1973). Se consideran para el anlisis
datos tomados en dos niveles de la columna de agua (superficie y fondo), de las variables
salinidad, oxgeno disuelto (mg/l), slidos en suspensin (mg/l), nitritos (mol/l) y clorofila
a(g/l), Adems se estudian valores de profundidad (m) y transparencia (m). Para cada
variable se obtuvieron 115 observaciones tomadas a lo largo de todo el sistema mediante
muestreo sistemtico de cuadrculas (cuadrculas de 4 km
2
)(Fig. 1). La ubicacin en cada
punto de muestreo fue realizada mediante un geoposicionador GPS 100 SRVY II (Garmin,
1993). Los semivariogramas experimentales y los correspondientes modelos estimados se
hallaron por medio del software GS+ (Gamma Design Software, 1999).
Resultados y Discusin.
Los semivariogramas experimentales encontrados (Figs. 13 y 14) indican que las
variables presentan estructuras de dependencia espacial, puesto que en ningn caso la
semivarianza es constante en funcin de la distancia. Los rangos encontrados en los
modelos tericos ajustados a los semivariogramas (tabla 4), superan los 11 km y en
algunos casos ste parmetro alcanza los 25 km, lo cual resulta relativamente alto, teniendo
en cuenta que la distancia entre los extremos sur y norte del sistema (la ms amplia) no
supera los 30 km. Lo anterior es un indicador de fuerte dependencia espacial para el caso
considerado. Esto es sin duda conveniente puesto que desde un punto de vista terico es
conocido que un alto valor en el rango permite obtener curvas de prediccin ms
suavizadas reduciendo las magnitudes en varianzas de prediccin (Daz-Francs, 1993) . Es
importante resaltar respecto a los otros dos parmetros, que en ningn caso el valor de la
pepita supera el 50% del valor de la meseta (tabla 4), lo cual, segn Daz-Francs (1993), es
recomendable para que el modelo de correlacin espacial describa bien la realidad. Si el
ruido espacial en las mediciones explica en mayor proporcin la variabilidad que la
correlacin del fenmeno, las predicciones pueden ser muy imprecisas.

29

(a)
0
5
10
15
20
25
0 5000 10000 15000 20000
Dist ancia (m)
S
e
m
i
v
a
r
i
a
n
z
a
( b)
0
2
4
6
8
10
12
14
16
0 2000 4000 6000 8000 10000 12000 14000
Distancia ( m)
S
e
m
i
v
a
r
i
a
n
z
a
(c)
0
500
1000
1500
2000
2500
0 5000 10000 15000 20000 25000
Dist ancia ( m)
S
e
m
i
v
a
r
i
a
n
z
a
( d)
0
0. 02
0. 04
0. 06
0. 08
0. 1
0. 12
0. 14
0 5000 10000 15000 20000 25000
Distancia ( m)
S
e
m
i
v
a
r
i
a
n
z
a
(e)
0
200
400
600
800
1000
1200
0 5000 10000 15000 20000
Dist ancia ( m)
S
e
m
i
v
a
r
i
a
n
z
a
( f )
0
0. 05
0. 1
0. 15
0. 2
0 5000 10000 15000 20000 25000
Distancia ( m)
S
e
m
i
v
a
r
i
a
n
z
a

Figura 13. semivariogramas experimentales (calculados con los datos muestrales) y ajustes de modelos tericos para las variables medidas en la superficie de la
columna de agua de la Cinaga Grande de Santa Marta en marzo de 1997. a) salinidad; b)oxgeno; c) slidos en suspensin; d) nitritos; e) clorofila a;
f)profundidad.
30

(a)
0
2
4
6
8
10
12
14
0 5000 10000 15000 20000
Distancia (m)
S
e
m
i
v
a
r
i
a
n
z
a
(b)
0
1
2
3
4
5
6
0 2000 4000 6000 8000 10000 12000 14000
Distancia (m)
S
e
m
i
v
a
r
i
a
n
z
a
(c)
0
500
1000
1500
2000
2500
0 5000 10000 15000 20000
Distancia (m)
S
e
m
i
v
a
r
i
a
n
z
a
(d)
0
0.05
0.1
0.15
0.2
0 5000 10000 15000 20000
Distancia (m)
S
e
m
i
v
a
r
i
a
n
z
a
(e)
0
200
400
600
800
1000
1200
1400
0 5000 10000 15000 20000
Distancia (m)
S
e
m
i
v
a
r
i
a
n
z
a
(f)
0
0.0002
0.0004
0.0006
0.0008
0.001
0.0012
0.0014
0.0016
0 5000 10000 15000 20000 25000
Distancia (m)
S
e
m
i
v
a
r
i
a
n
z
a

Figura 14. Semivariogramas experimentales (calculados con los datos muestrales) y ajustes de modelos tericos para las variables medidas en el fondo de la
columna de agua de la Cinaga Grande de Santa Marta en marzo de 1997. a) salinidad; b)oxgeno; c) slidos en suspensin; d) nitritos; e) clorofila a; f)
transparencia.
31

Tabla 4. Modelos tericos ajustados a semivariogramas experimentales de variables fisicoqumicas y
biolgicas medidas en dos niveles de la columna de agua de la Cinaga Grande de Santa Marta, durante una
jornada de muestreo realizada en marzo de 1997.
Variable

Nivel Modelo Pepita Meseta Rango (m) r
2

Salinidad Superficie Lineal 0.179 12.309 20000 0.89
Fondo Lineal 0.627 11.752 20000 0.99
Oxgeno Superficie Gaussiano 1.830 14.320 12940 0.99
Fondo Esfrico 1.080 4.211 11650 0.99
Slidos en suspensin Superficie Lineal 1087 1138 22000 0.90
Fondo Lineal 1408 557 20000 0.67
Nitritos Superficie Lineal 0.071 0.043 22000 0.87
Fondo Lineal 0.073 0.077 20000 0.70
Clorofila a Superficie Lineal 389.2 623.2 18000 0.91
Fondo Lineal 710 616.4 18000 0.91
Profundidad Gaussiano 0.073 0.121 24850 0.99
Transparencia Gaussiano 0.0069 0.0019 25000 0.85

Se puede afirmar que las variables oxgeno disuelto, profundidad y transparencia
cumplen con la hiptesis de estacionariedad fuerte, dado que sus modelos son acotados
(Biau et al., 1997; Samper y Carrera, 1990). De otro lado salinidad, slidos en suspensin,
nitritos y clorofila a, slo cumplen la hiptesis intrnseca (estacionariedad dbil) puesto
que sus modelos son lineales (Evangelos y Flatman, 1988; Samper y Carrera, 1990).
Debido a que los resultados arriba descritos respecto a los semivariogramas
experimentales y al ajuste de modelos tericos, confirman la hiptesis de autocorrelacin
espacial en las caractersticas medidas en el estuario de estudio, es posible afirmar que los
mtodos geoestadsticos pueden ser una herramienta de gran utilidad en la modelacin e
interpretacin de fenmenos observados en este tipo de ecosistemas. Cuando se utilicen
mtodos estadsticos tradicionales (regresin, anlisis de varianza, tcnicas multivariadas,
muestreo) para el anlisis de este tipo de informacin, debe involucrarse en los
correspondientes modelos la estructura de correlacin espacial implcita en los datos.

32

Capitulo Cuatro

Prediccin Espacial

4.1. Prediccin Espacial Optima.
De la teora de la decisin se conoce que si Z
0
es una cantidad aleatoria y Z
*
0
es su
predictor
2
, entonces ) Z ; Z ( L
*
0 0
representa la prdida en que se incurre cuando se predice
0
Z con
*
0
Z y el mejor predictor ser el que minimice ( ) { } Z / Z ; Z L E
*
0 0
con
{ }
=
n 2 1
Z , , Z , Z Z L , es decir el predictor ptimo es el que minimice la esperanza
condicional de la funcin de prdida.

Si ( ) [ ] ( ) Z Z E Z Z Z Z Z L / ;
0
*
0
2
*
0 0
*
0 0
= = . La expresin
anterior indica que para encontrar el predictor ptimo se requiere conocer la distribucin
conjunta de la n+1 variables aleatorias.

4.2. Definicin de Kriging.

La palabra kriging
3
(expresin anglosajona) procede del nombre del gelogo
sudafricano D. G. Krige, cuyos trabajos en la prediccin de reservas de oro, realizados en la
dcada del cincuenta, suelen considerarse como pioneros en los mtodos de interpolacin
espacial. Kriging encierra un conjunto de mtodos de prediccin espacial que se
fundamentan en la minimizacin del error cuadrtico medio de prediccin. En la tabla 5 se
mencionan los tipos de kriging y algunas de sus propiedades. En la secciones 4.3 y 4.4, se
hace una presentacin detallada de ellos.
Tabla 5. Tipos de predictores kriging y sus propiedades.
TIPO DE
PREDICTOR

NOMBRE PROPIEDADES
LINEAL Simple
Ordinario
Universal
Son ptimos si hay normalidad
multivariada.
Independiente de la distribucin son los
mejores predictores linealmente
insesgados.
NO LINEAL Indicador
Probabilstico
Log Normal, Trans-
Gaussiano
Disyuntivo
Son predictores ptimos.

2
La palabra estimacin es utilizada exclusivamente para inferir sobre parmetros fijos pero desconocidos;
prediccin es reservada para inferencia sobre cantidades aleatorias.
3
Algunos textos indican que en espaol la palabra adecuada sera krigeado.
33

Los mtodos kriging se aplican con frecuencia con el propsito de prediccin, sin
embargo estas metodologas tienen diversas aplicaciones, dentro de las cuales se destacan
la simulacin y el diseo de redes ptimas de muestreo (captulo 5).
4.3. Kriging Ordinario
Suponga que se hacen mediciones de la variable de inters Z en los puntos x
i
, i= 1,
2,..., n, de la regin de estudio, es decir se tienen realizaciones de las variables Z(x
1
), . . . ,
Z(x
n
), y se desea predecir Z(x
o
), en el punto x
0
donde no hubo medicin. En esta
circunstancia, el mtodo kriging ordinario propone que el valor de la variable puede
predecirse como una combinacin lineal de las n variables aleatorias as:
Z
*
(x
0
) =
1
Z(x
1
) +
2
Z(x
2
) +
3
Z(x
3
) +
4
Z(x
4
) +
5
Z(x
5
) + . . . +
n
Z(x
n
)
=
=
n
1 i
i i
) x ( Z

en donde los
i
representan los pesos o ponderaciones de los valores originales. Dichos
pesos se calculan en funcin de la distancia entre los puntos muestreados y el punto donde
se va a hacer la correspondiente prediccin. La suma de los pesos debe ser igual a uno para
que la esperanza del predictor sea igual a la esperanza de la variable. Esto ltimo se conoce
como el requisito de insesgamiento.
Estadsticamente la propiedad de insesgamiento se expresa a travs de:
( ) ( ) ( ) ( )
0 0
*
x Z E x Z E =

Asumiendo que el proceso es estacionario de media m (desconocida) y utilizando las
propiedades del valor esperado, se demuestra que la suma de las ponderaciones debe ser
igual a uno:
( ) m x Z E
n
i
i i
=
|
|
\
|
=1

( ) ( )
=
=
n
i
i i
m x Z E
1
=
=
n
i
i
m m
1
=
=
n
i
i
m m
1
=
=
n
i
i
1
1
Se dice que Z
*
(x
0
) es el mejor predictor, lineal en este caso, porque los pesos se obtienen
de tal manera que minimicen la varianza del error de prediccin, es decir que minimicen la
expresin:
( ) ( ) ( )
0 0
*
x Z x Z V
34

Esta ltima es la caracterstica distintiva de los mtodos kriging, ya que existen otros
mtodos de interpolacin como el de distancias inversas o el poligonal, que no garantizan
varianza mnima de prediccin (Samper y Carrera, 1990). La estimacin de los pesos se
obtiene minimizando )] Z(x ) (x [Z V
0 0
*
sujeto a
=
=
n
1 i
i
1 .
Se tiene que )] ( [ )] ( , ) ( [ 2 )] ( [ )] ( ) ( [
0 0 0
*
0
*
0 0
*
x Z V x Z x Z COV x Z V x Z x Z V + =
Desagregando las componentes de la ecuacin anterior se obtiene los siguiente:

= = =
=
(
=
n
1 i
n
1 j
j i j i i
n
1 i
i 0
*
)] x ( Z , ) x ( Z [ COV ) x ( Z V )] x ( Z [ V
En adelante se usar la siguiente notacin:
ij j i
C x Z x Z COV = )] ( , ) ( [ y
2
0
)] x ( Z [ V =
De lo anterior
(
=

=
n
1 i
0 i i 0 0
*
) x ( Z , ) x ( Z COV )] x ( Z , ) x ( Z [ COV

= =
= =
n
i
n
i
i i i i
C x Z x Z COV
1 1
0 0
)] ( ), ( [
Entonces reemplazando, se tiene que:

= = =
+ =
n
1 i
n
1 j
n
1 i
2
0 i i ij j i 0 0
*
C 2 C )] x ( Z ) x ( Z [ V (0)
Luego se debe minimizar la funcin anterior sujeta a la restriccin
=
=
n
1 i
i
1 . Este problema
de minimizacin con restricciones se resuelve mediante el mtodo de multiplicadores de
Lagrange.
{

= = = =
|
|
\
|
+ + =
n
1 i
n
1 j
n
1 i
n
1 i
i
Lagrange de
dor Multiplica
2
0 i i ij j i
2
k
0
1 2 C 2 C
43 42 1

Siguiendo el procedimiento acostumbrado para obtener valores extremos de una funcin, se
deriva e iguala a cero, en este caso con respecto a
i
y :

= =
=
= = = = =
= + = + =
+
|
|
\
|
+ =
(
(
|
|
\
|
+ + + +
=
n
j
j j
n
j
j j
n
j
j j
n
j
n
i
n
i
i i i
n
i
ij
n
j
j i j j
k
C C C C
C C C
C C C C
1
10 1 10
1
1
10
2
1 11 1
1
2 1 1
2
0
2 1
1 1 11
2
1
1
2
) 1 ( 0 2 2 2
2 2 2 2
1 2 2 ) 2 (
) (

4 4 4 4 3 4 4 4 4 2 1

35
De manera anloga se determinan las derivadas con respecto a
2
, ...,
n
:

= =
= + = + =
n
j
j j
n
j
j j
k
C C C C
1
20 2 20
1
2
2
2
) 2 ( 0 2 2 2
) (

M

= =
= + = + =
n
j
n nj j n
n
j
nj j
n
k
C C C C
1
0 0
1
2
) 3 ( 0 2 2 2
) (

por ltimo derivamos con respecto a :

= =
= = =
n
i
n
i
i
k
1 1
1
2
) 4 ( 1 0 2 2
) (

De (1), (2), (3), (4) resulta un sistema de (n + 1) ecuaciones con (n + 1) incgnitas, que
matricialmente puede ser escrito como:
|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
\
|
|
|
|
|
|
|
|
|
\
|
1
.
.
.
.
.
.
0 1 . . . 1
1 . . .
. . . .
. . . .
. . . .
1 . . .
0
10 1
1
1 11
n n nn n
n
C
C
C C
C C

C
ij
= C
i0

por lo cual los pesos que minimizan el error de prediccin se determinan mediante la
funcin de covariograma a travs de:
= C
ij

-1

C
i0
.
Encontrando los pesos se calcula la prediccin en el punto x
o
. De forma anloga se procede
para cada punto donde se quiera hacer prediccin.
Varianza de Prediccin del Kriging Ordinario
Multiplicando (1), (2) y (3) por
i
se obtiene:
0
1
i i
n
j
ij i i
C C =
|
|
\
|
+
=
. , , 2 , 1 , n i i L =
Sumando las n ecuaciones

= = = =
= +
n
i
n
j
n
i
io i
n
i
i ij i i
C C
1 1 1 1

= = = =
=
n
i
n
j
n
i
i
n
i
io i ij i i
C C
1 1 1 1

Sustituyendo la expresin anterior en (0)
36

= = =
+ =
n
i
i i
n
i
i
n
i
i i k
C C
1
0
1 1
0
2 2
2
=
=
n
i
i i k
C
1
0
2 2
(5)
Estimacin de Ponderaciones por medio de la Funcin de Semivarianza
Los pesos pueden ser estimados a travs de la funcin de semivarianza, para lo cual se
requiere conocer la relacin entre las funciones de covariograma y de semivarianza. Antes
de esto conveniente tener en cuenta la siguiente notacin:
2
= V(Z(x)),
ij
= (h), donde h es la distancia entre los puntos i y j y anlogamente
C
ij
= C(h).
La relacin entre las dos funciones en cuestin es la siguiente:
[ ]
2
)) ( ) ( (
2
1
i j ij
x Z x Z E =
] [
2 2
)) ( ( ) ( ) ( ( 2 )) ( (
2
1
i i j j
x Z x Z x Z x Z E + =
[ ] [ ] [ ]
2 2
)) ( (
2
1
) ( ) ( ) ( (
2
1
i i j j
x Z E x Z x Z E x Z E + =
[ ] [ ] ( ) [ ]
2 2 2 2 2
) ( ) ( )) ( (
2
1
)) ( (
2
1
k x Z x Z E k x Z E k x Z E
i j j j
+ =
[ ] [ ] [ ] ) ( ) ( )) ( (
2
1
)) ( (
2
1
i j
x Z x Z COV x Z V x Z V + =
[ ] [ ] ) ( ) ( ) (
i j
x Z x Z COV x Z V =

ij ij ij
C C = =
2 2
(6)
Reemplazando (6) en (1), (2) y (3) se determinan los pesos ptimos en trminos de la
funcin de semivarianza:

= =
+ = + =
n
j
j j
n
j
j j
k
C C
1
10
2
1
2
1
10 1
1
2
) ( ) (
) (

10
2
1
1 1
1
2
+ + =

= = j
n
j
j j j

10 1
1
10
2
1
1
2
= + + =

= =
j
n
j
j j
n
j
j

37
Similarmente,
=
= =
n
j
j j
k
1
20 2
2
2
) (

=
= =
n
j
n nj j
n
k
1
0
2
) (

El sistema de ecuaciones se completa con (4). De acuerdo con lo anterior los pesos se
obtienen en trminos del semivariograma a travs del sistema de ecuaciones:
|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
\
|
|
|
|
|
|
|
|
|
\
|
1
.
.
.
.
.
.
0 1 . . . 1
1 . . .
. . . .
. . . .
. . . .
1 . . .
0
10 1
1
1 11
n n nn n
n

Para establecer la expresin de la correspondiente varianza del error de prediccin en
trminos de la funcin de semivarianza se reemplaza (6) en (5), de donde:
( ) +
(
(
=
n
i
ij i k
1
2 2 2

+ + =

= =
n
i
ij i
n
i
i k
1 1
2 2 2

+ =
=
n
i
io i k
1
2

Los pesos de kriging ordinario tambin pueden ser estimados mediante el uso del
correlograma aplicando la siguiente relacin:
2

ij ij
C = , caso en el que la correspondiente
varianza de prediccin estara dada por (Isaaks y Srivastava, 1989):
|
|
\
|
+ =

io i k
1
2 2

Validacin del kriging.

Existen diferentes mtodos para evaluar la bondad de ajuste del modelo de
semivariograma elegido con respecto a los datos muestrales y por ende de las predicciones
hechas con kriging. El ms empleado es el de validacin cruzada, que consiste en excluir la
observacin de uno de los n puntos muestrales y con los n-1 valores restantes y el modelo
38
de semivariograma escogido, predecir va kriging el valor de la variable en estudio en la
ubicacin del punto que se excluy. Se piensa que si el modelo de semivarianza elegido
describe bien la estructura de autocorrelacin espacial, entonces la diferencia entre el valor
observado y el valor predicho debe ser pequea. Este procedimiento se realiza en forma
secuencial con cada uno de los puntos muestrales y as se obtiene un conjunto de n errores
de prediccin. Lo usual es calcular medidas que involucren a estos errores de prediccin
para diferentes modelos de semivarianza y seleccionar aquel que optimice algn criterio
como por ejemplo el del mnimo error cuadrtico medio (MECM). Este procedimiento es
similar a la conocida tcnica de remuestreo Jacknife (Efron, 1982) empleada en diversos
contextos estadsticos para calcular varianzas de estimacin, entre otros aspectos. Una
forma descriptiva de hacer la validacin cruzada es mediante un grfico de dispersin de
los valores observados contra los valores predichos. En la medida en que la nube de puntos
se ajuste ms a una lnea recta que pase por el origen, mejor ser el modelo de
semivariograma utilizado para realizar el kriging.
Representacin de las predicciones
Una vez se ha hecho la prediccin en un conjunto de puntos diferentes de los
muestrales va kriging, se debe elaborar un mapa que d una representacin global del
comportamiento de la variable de inters en la zona estudiada. Los ms empleados son los
mapas de contornos, los mapas de residuos y los grficos tridimensionales. En el caso de
los mapas de contornos, en primer lugar se divide el rea de estudio en un enmallado y se
hace la prediccin en cada uno de los nodos de ste mismo. Posteriormente se unen los
valores predichos con igual valor, generando as las lneas de contorno (isolneas de
distribucin). Este grfico permite identificar la magnitud de la variable en toda el rea de
estudio. Es conveniente acompaar el mapa de interpolaciones de la variable con los
correspondientes mapas de isolneas de los errores y de las varianzas de prediccin
(posiblemente estimados a travs de mtodos matemticos), con el propsito de identificar
zonas de mayor incertidumbre respecto a las predicciones.
Intervalos de Confianza.
Asumiendo que los errores de prediccin siguen una distribucin normal estndar y que
son independientes, un intervalo de confianza del 100(1-)%, 0< <1, para Z(x) es:
( ) ( )
(
+

k k
z x z z x z

2
1
*
2
1
*
, con ) (
*
x z el valor calculado de la prediccin y
2 1
z el
percentil de una normal estndar.

39
Ilustracin
Suponga que se tiene una configuracin de datos como la que se presenta en el
esquema de abajo. Con base en siete datos observados (valores al lado del signo + por fuera
de los crculos numerados de 1 a 7) se quiere predecir un valor de la variable en el punto
donde se encuentra el signo de interrogacin, por fuera del circulo con el nmero cero.

La matriz de distancia euclidianas entre los sitios es la siguiente:
Sitio 0 1 2 3 4 5 6 7
0 0.00 4.47 3.61 8.06 4.49 6.71 8.94 13.45
1 0.00 2.24 10.44 13.04 10.05 12.17 17.80
2 0.00 11.05 13.00 8.00 10.05 16.97
3 0.00 4.12 13.04 15.00 11.05
4 0.00 12.37 13.93 7.00
5 0.00 2.24 12.65
6 0.00 13.15
7 0.00

Asumiendo que la estructura de correlacin espacial entre los datos es estimada por un
modelo exponencial ( ) ( ) ( ) 10 3 exp 1 10 h h = (pepita cero, meseta 10 y rango 10) o en
trminos de la funcin de autocovarianza por ( ) ( ) ( ) 10 3 exp 10 h h C = , se encuentran las
siguientes matrices que permiten encontrar los pesos para la prediccin:

0
?
+477
+227
1
3
2
+696
+791
+606
+783
4
5
7
6
40
|
|
|
|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
|
|
|
\
|
=
0 1 1 1 1 1 1 1
1 10 19 . 0 22 . 0 22 . 1 36 . 0 06 . 0 05 . 0
1 19 . 0 10 11 . 5 15 . 0 11 . 0 49 . 0 26 . 0
1 22 . 0 11 . 5 10 24 . 0 20 . 0 91 . 0 49 . 0
1 22 . 1 15 . 0 24 . 0 10 90 . 2 20 . 0 20 . 0
1 36 . 0 11 . 0 20 . 0 90 . 2 10 36 . 0 44 . 0
1 06 . 0 49 . 0 91 . 0 20 . 0 36 . 0 10 11 . 5
1 05 . 0 26 . 0 49 . 0 20 . 0 44 . 0 11 . 5 10
0 1 1 1 1 1 1 1
1
1
1
1
1
1
77 76 75 74 73 72 71
67 66 65 64 63 62 61
1 57 56 55 54 53 52 51
47 46 45 44 43 42 41
37 36 35 34 33 32 31
27 26 25 24 23 22 21
17 16 15 14 13 12 11
C C C C C C C
C C C C C C C
C C C C C C C
C C C C C C C
C C C C C C C
C C C C C C C
C C C C C C C
C
ij

|
|
|
|
|
|
|
|
|
|
|
\
|
180 . 2 188 . 0 141 . 0 118 . 0 139 . 0 156 . 0 121 . 0 136 . 0

188 . 0 085 . 0 013 . 0 012 . 0 024 . 0 014 . 0 011 . 0 012 . 0
141 . 0 013 . 0 126 . 0 077 . 0 009 . 0 010 . 0 008 . 0 009 . 0
118 . 0 012 . 0 077 . 0 130 . 0 009 . 0 010 . 0 015 . 0 008 . 0
139 . 0 024 . 0 009 . 0 009 . 0 102 . 0 042 . 0 008 . 0 009 . 0
156 . 0 014 . 0 010 . 0 010 . 0 042 . 0 098 . 0 010 . 0 013 . 0
121 . 0 011 . 0 008 . 0 015 . 0 008 . 0 010 . 0 129 . 0 077 . 0
136 . 0 012 . 0 009 . 0 008 . 0 009 . 0 013 . 0 077 . 0 127 . 0
1
ij
C

|
|
|
|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
|
|
|
\
|
=
1
18 . 0
68 . 0
34 . 1
58 . 0
89 . 0
39 . 3
61 . 2
1
10
10
10
10
10
10
10
C
C
C
C
C
C
C
C
io
, de donde
|
|
|
|
|
|
|
|
|
|
|
\
|
= =
|
|
|
|
|
|
|
|
|
|
|
\
|
=

907 . 0
086 . 0
057 . 0
151 . 0
086 . 0
129 . 0
318 . 0
173 . 0
1
7
6
5
41
3
2
1
io ij
C C
.

con base en el vector estimado de parmetros se encuentra que

=
=
7
1
*
0
i
i i
Z Z = (0.173)(477) + (0.318)(696) + ... + (0.086)(0.18) = 592.
con
=
=
7
1
2 2
i
io i k
C = ( )( ) ( )( ) [ ] 907 . 0 18 . 0 086 . 0 61 . 2 173 . 0 10 + + L

41
4.4. Otros Mtodos Kriging
A continuacin se mencionan algunos aspectos generales de otros mtodos de
prediccin espacial. Un estudio riguroso de ellos puede hacerse en Cressie (1993), Deutsch
y Journel (1998) y Samper y Carrera (1990).

4.4.1. Kriging Simple

Suponga que hay una variable regionalizada estacionaria con media (m) y covarianza
conocidas. De manera anloga a como se define en modelos lineales (por ejemplo en
diseo de experimentos) el modelo establecido en este caso es igual a la media ms un error
aleatorio con media cero. La diferencia es que en este caso los errores no son
independientes.
Sea Z(x) la variable de inters medida en el sitio x.
( ) [ ] m x Z E =
( ) ( ) x m x Z + = , con ( ) [ ] 0 = x E .

El predictor de la variable de inters en un sitio x
0
donde no se tiene informacin se define
como:
( ) ( )
0
*
0
*
x m x Z + = ,
con ( )
0
*
x que corresponde a la prediccin del error aleatorio en el sitio x
0.
Despejando de
la ecuacin anterior ( ) ( ) m x Z x =
0
*
0
*
.
El predictor del error aleatorio se define por:
( ) ( ) ( ) ( )

= =
= =
n
i
i i i
n
i
i
m x Z x x
1 1
0
*
.
de donde el predictor de la variable de estudio es:

( ) ( ) ( ) ( )

= =
+ =
(
+ =
n
i
i i i
n
i
i
x m m x Z m x Z
1 1
0
*

El predictor es insesgado si:
( ) ( ) ( ) ( ) m x Z E x Z E = =
0 0
*
. Luego el predictor ser insesgado cuando ( ) ( ) 0
0
*
= x E .
( ) ( ) ( ) ( ) 0 0
1 1
0
*
= = =

= =
n
i
i
n
i
i i
x x E . Por consiguiente, a diferencia del kriging ordinario,
en este caso no existen restricciones para las ponderaciones tendientes al cumplimiento de
la condicin de insesgamiento.

42
La estimacin de los pesos del mtodo kriging ordinario se obtiene de tal forma que
se minimice ( ) ( ) ( )
0 0
*
x x V .

( ) ( ) ( ) ( ) ( ) ( )
2
0 0
*
0 0
*
x x E x x V =
= ( ) ( )
2
0
1
|
|
\
|
|
\
|
=
x x E
n
i
i i

= ( ) ( ) ( ) ( ) ( ) ( ) ( )
(
(
+
|
|
\
|
|
\
|
|
|
\
|
|
\
|

= = =
2
0 0
1 1 1
2 x E x x E x x E
n
i
i i
n
j
j j
n
i
i i

= ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
2
0 0
1 1 1
2 x E x x E x x E
i
n
i
i
n
i
n
j
j i j i
+

= = =

usando:
i. ( ) [ ] 0
0
= x E
ii. ( ) ( ) ( ) ( ) ( ) ( )
ij j i j i
C x x COV x x E = = ,
iii. ( ) ( )
2 2
=
o
x E
( ) ( ) ( ) =
0 0
*
x x V
2
0
1 1 1
2 +

= = =
i
n
i
i
n
i
n
j
ij j i
C C (7)

derivando respecto a
1
se tiene:

( ) ( ) ( )
|
|
\
|
+ + +

= = = =
n
j
n
i
n
j
n
i
i i ij j i j j
C C C C C
x x V
2 2 2 2
2
0 10 1 1 1 11
2
1
1 1
0 0
*
2 2 2

=
=
+
n
j
j j
C C C
2
10 1 11 1
2 2 2
= 2
10 1
1
2C C
i
n
i
i

=

igualando a cero

=
=
n
i
i
C C
1
10 1 1
.
En general para cualquier i, i= 1, 2, ..., n, se obtiene:

=
= =
n
j
i ij j
i
C C
1
0
(8)
Con las n ecuaciones resultantes se construye el siguiente sistema de ecuaciones:

43
|
|
|
|
|
\
|
=
|
|
|
|
|
\
|
|
|
|
|
|
\
|
0
20
10
2
1
2 1
2 22 21
1 12 11
n n nn n n
n
n
C
C
C
C C C
C C C
C C C
M M
L
M O M M
L
L

Varianza de Prediccin Kriging Simple.

Se tiene de (7) que:
( ) ( ) ( ) =
0 0
*
x x V
2
0
1 1 1
2 +

= = =
i
n
i
i
n
i
n
j
ij j i
C C
=
2
k

2
0
1 1 1
2 +

= = =
i
n
i
i
n
i
n
j
ij j i
C C
reemplazando (8) en (7)

=
2
k

2
0
1 1
0
2 +

= =
i
n
i
i
n
i
i i
C C
=
2
k

0
1
2
i
n
i
i
C
=

4.4.2. Kriging en Bloques.

En los dos mtodos kriging hasta ahora descritos el objetivo ha estado centrado en la
prediccin puntual. A menudo, sin embargo, se requiere estimar un bloque, o ms
precisamente, estimar el valor promedio de la variable dentro de un rea local.

El valor promedio dentro del bloque es estimado por :

( )
=
=
n
i
i i
x Z A Z
1
) (

44
Del sistema de ecuaciones para el kriging ordinario se tiene:

|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
\
|
|
|
|
|
|
|
|
|
\
|
1
.
.
.
.
.
.
0 1 . . . 1
1 . . .
. . . .
. . . .
. . . .
1 . . .
0
10 1
1
1 11
n n nn n
n
C
C
C C
C C

Consecuentemente el vector del lado derecho de la igualdad en el sistema de arriba debe
modificarse para incluir las covarianzas respecto al bloque. La covarianza de un punto al
bloque corresponde a la covarianza promedio entre el punto muestreado i y todos los puntos
dentro del bloque (en la prctica un enmallado regular de puntos dentro del bloque es usado
como se muestra en la figura de la pgina anterior). El sistema de ecuaciones del kriging en
bloques est dado por:

|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
\
|
|
|
|
|
|
|
|
|
\
|
1
.
.
.
.
.
.
0 1 . . . 1
1 . . .
. . . .
. . . .
. . . .
1 . . .
1 1
1
1 11
nA
A
n nn n
n
C
C
C C
C C

donde el vector de covarianzas al lado derecho de la igualdad en el sistema anterior es
contiene las covarianzas entre las variables ( ) ( ) ( )
n
x Z x Z x Z , , ,
2 1
L y el bloque A donde se
quiere hacer la estimacin.
=
A j j
iA iA
C
A
C
/
1
.
La varianza del error de prediccin del kriging en bloques est dada por:
|
\
|
+ =

=
n
i
iA i AA kB
C C
1
2
, con

=
A i i A j j
ij AA
C
A
C
/ /
2
1
igual a la covarianza entre
pares de puntos dentro del bloque.
Isaaks y Srivastava (1989) muestran a travs de ejemplos que el kriging en bloques
coincide con el promedio de predicciones hechas por kriging ordinario sobre cada uno de
los puntos del enmallado dentro del bloque. As mismo indican que en la prctica es
suficiente con un enmallado cuadrado (6x6) para obtener estimaciones estables en los
bloques.

45

4.4.3. Kriging Universal.

En los supuestos hechos hasta ahora respecto a los mtodos kriging se ha asumido que
la variable regionalizada es estacionaria (al menos se cumple con la hiptesis intrnseca).
En muchos casos, la variable no satisface estas condiciones y se caracteriza por exhibir una
tendencia. Por ejemplo en hidrologa los niveles piezomtricos
4
de una acufero pueden
mostrar una pendiente global en la direccin del flujo (Samper y Carrera, 1990). Para tratar
este tipo de variables es frecuente descomponer la variable Z(x) como la suma de la
tendencia, tratada como una funcin determinstica, ms una componente estocstica
estacionaria de media cero. Asuma que:
( ) ( ) ( ) x x m x Z + =
con ( ) ( ) 0 = x E , ( ) ( )
2
= x V y por consiguiente ( ) ( ) ( ) x m x Z E = .
La tendencia puede expresarse mediante:
( ) ( )
=
=
P
l
l l
x f a x m
1

donde las funciones ( ) x f
l
son conocidas y p es el nmero de trminos empleados para
ajustar m(x).

El predictor kriging universal se define como:
( ) ( )
i
n
i
i
x Z x Z
=
=
1
0
*

este ser insesgado si:

( ) ( ) ( )
0 0
*
x m x Z E =
( ) ( )
0
1
x m x Z E
n
i
i i
= |
\
|
=

( ) ( )
0
1
x m x m
n
i
i i
= |
\
|
=

( ) ( )

= = =
= |
\
|
p
l
l l
n
i
P
l
i l l i
x f a x f a
1
0
1 1

( ) ( )

= = =
= |
\
|
p
l
l l
p
l
n
i
i l i l
x f a x f a
1
0
1 1
( ) ( )

= =
=
p
l
l
n
i
i l i
x f x f
1
0
1

4
Piezmetro: Instrumento utilizado para medir coeficientes de compresibilidad de slidos, lquidos y gases
46
La obtencin de los pesos en el kriging universal, anlogo a los otros mtodos
kriging, se hace de tal forma que la varianza del error de prediccin sea mnima.

( ) ( ) ( ) ( ) ( ) ( )
2
0 0
*
0 0
*
x Z x Z E x Z x Z V =
= ( ) ( ) ( ) ( ) ( ) ( )
2
0 0
1
|
|
\
|
|
\
|

=
x x m x x m E
i i
n
i
i

= ( ) ( ) ( ) ( )
2
0
1 1
0 (
\
|
+ |
\
|

= =
x x x m x m E
i
n
i
i
n
i
i i

= ( ) ( )
(
(
\
|

=
2
1
0
n
i
i i
x x E
= ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
2
0 0
1 1 1
2 x E x x E x x E
i
n
i
i
n
i
n
j
j i j i
+

= = =

Usando
( ) ( ) ( )
j i ij
x x COV C , =
( ) ( )
2
0
2
x E =
se tiene
( ) ( ) ( )

= = =
+ =
n
i
n
i
io i ij j
n
j
i
C C x Z x Z V
1 1
2
1
0 0
*
2 .
Luego incluyendo la restriccin dada por la condicin de insesgamiento, se debe
minimizar:
( ) ( )

= = = = =
(
+ + =
n
i
n
i
p
l
l
n
i
i l i l io i ij j
n
j
i ku
x f x f C C
1 1 1
0
1
2
1
2
2
o en trminos de la funcin de semivarianza
( ) ( )

= = = = =
(
+ + =
n
i
n
i
p
l
l
n
i
i l i l io i ij j
n
j
i ku
x f x f
1 1 1
0
1 1
2
2
derivando la expresin anterior respecto a
n
, , ,
2 1
L ,
p
, , ,
2 1
L e igualando a cero
las correspondientes derivadas se obtienen las siguientes ecuaciones:

( )
0
1 1
i
n
j
i l
P
l
l ij j
x f = +

= =
i = 1, 2, ..., n
( ) ( )
=
=
n
j
l j l j
x f x f
1
0
j = 1, 2, ..., p

47

en trminos matriciales

|
|
|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
|
\
|
|
|
|
|
|
|
|
|
|
|
\
|
0
10
0
20
10
1
2
1
2 1
1 12 11
1 2 2 1
2 12 2 22 21
1 11 1 12 11
0 0
0 0
p
n
n
n
pn p p
n
pn n n n n
p n
p n
f
f
f f f
f f f
f f
f f
f f
M
M
M
M
L L
M O M M O M M
L L
L L
M O M M O M M
L L
L L

donde ( )
j l lj
x f f = es la l-sima funcin en el punto j-simo.
La varianza de prediccin del kriging universal est dada por (Samper y Carrera, 1990):
( )

= =
+ =
p
l
l l i
n
i
i ku
x f
1
0 0
1
2
.
Ntese que si p = 1 y ( ) 1 = x f
l
, el sistema de ecuaciones del kriging universal y la varianza
de prediccin coinciden con las del kriging ordinario. En este orden de ideas puede decirse
que el kriging ordinario es un caso particular del kriging universal.

4.4.4. Kriging Residual.

La tcnica kriging residuales empleada bajo las mismas circunstancias del kriging
universal, es decir en aquellos casos en que la variable regionalizada no es estacionaria
debido a la presencia de tendencia espacial en el valor promedio de la variable. La hiptesis
central del kriging residual consiste en suponer conocida la tendencia m(x). A partir de ella
se calculan los residuos con base en los cuales se aplica kriging ordinario. La estimacin de
la tendencia es generalmente llevada a cabo por medio de mnimos cuadrados. La
prediccin en un sitio no muestreado es igual a la tendencia estimada ms la prediccin del
error, es decir:

( ) ( ) ( )
0
*
0 0
*
x e x m x Z + =
( ) ( )
i
n
i
i
x e x e
=
=
1
0
*

los pesos o ponderaciones son estimados por kriging ordinario como se muestra en la
seccin 4.2. La varianza de prediccin de la variable de inters coincide con la varianza de
prediccin de los errores. En la figura 15 se muestra un esquema con el procedimiento
kriging residual en el caso de una tendencia lineal.

48

Figura 15. Representacin del procedimiento kriging residual. La superficie interpolada (arriba) es igual a la
suma de la tendencia lineal (centro) ms la prediccin de los errores (abajo).

49
4.4.5. Kriging Indicador

Suponga que se tiene una variable regionalizada ( ) { }
d
R D x x Z : estacionaria. Se
define la siguiente transformacin:

( )
( )

=
caso Otro
z x Z Si
z x I
l i
l i
0
1
,

Algunas propiedades son las siguientes:

i. ( ) ( ) ( ) ( ) ( )
l l l
z F z x Z z x I = = = Pr 1 , Pr
ii. ( ) ( ) ( ) ( ) ( ) ( ) 0 , Pr 0 1 , Pr 1 , = + = =
l l l
z x I z x I z x I E
= ( ) ( ) ( )
l l
z F z x I = =1 , Pr 1

El predictor kriging indicador es igual a:
( ) ( ) ( )
=
=
n
i
l i l i l
z x I z z x I
1
0
*
, ,
es decir que la prediccin de la funcin indicadora en el sitio x
0
es igual a una combinacin
lineal de las n funciones indicadoras evaluadas en los sitios de medicin. Samper y Carrera
(1990) muestran que el kriging indicador es un estimador de la probabilidad acumulada
hasta el lmite z definido en la funcin indicadora. El predictor kriging indicador (dado que
predice probabilidades acumuladas) tiene las siguientes restricciones:

i. ( ) 1 , 0
*

l
z x I
ii. ( ) ( )
l l
z x I z x I , ,
* *
si
l l
z z
Una condicin suficiente para que estas restricciones se cumplan es que
i l i
z = ) ( con 1 0
i
,
l
z i , .
Sin embargo en la prctica las ponderaciones se estiman de tal forma que el predictor sea
insesgado de varianza mnima.
Para la condicin de insesgamiento:
( ) ( ) ( ) ( ) ( )
l l l
z F z x I E z x I E = = , ,
0 0
*

( ) ( ) ( ) ( )
l l i
n
i
l i
z F z x I E z =
=
,
1

( ) ( ) ( )
l l
n
i
l i
z F z F z =
=1
( ) 1
1
=
=
n
i
l i
z

Despus de llevar a cabo el proceso de derivacin sobre la expresin de la varianza del
error de prediccin (obtenida de forma anloga a como se hizo en kriging ordinario), se
obtiene el siguiente sistema de ecuaciones:

50
( )
0
1
i ij l
n
i
i
z = +
=
i=1, 2, ..., n
=
=
n
i
i
1
1 .

donde ( ) h
ij
= , la funcin de semivarianza evaluad para la distancia entre los sitios i, j.
La varianza del error de prediccin se encuentra de la misma forma a como se mencion en
la seccin 4.2.

4.4.6. Kriging Log-Normal y Multi-Gaussiano

En estos dos procedimientos se hacen transformaciones de la variable regionalizada
con el propsito de normalizar en cada sitio de la regin de estudio.
El primero de estos consiste en aplicar kriging ordinario a la transformacin logartmica de
los datos. Veamos:
Sea ( ) { } D x x Z : una variable regionalizada log-normal. Es decir que
( ) ( ) ( ) x Z Log x Y = tiene distribucin normal. Algunas veces se requiere adicionar una
constante positiva de tal forma que ( ) x Y est definida.
El predictor kriging log-normal es:
( ) ( )
i
n
i
i
x Y x Y
=
=
1
0
*
.
Los pesos se obtienen de manera anloga al kriging ordinario. El semivariograma
usado es el de los valores transformados. La complicacin prctica puede darse al hacer la
retransformacin a la escala original, puesto que ( ) ( ) ( )
0
*
0
*
exp x Y x Z = es un predictor
sesgado.
Se puede demostrar que un predictor insesgado es (Cressie, 1993):
( ) ( )
|
|
\
|
+ =
2
exp
2
0
*
0
* ko
x Y x Z , donde
2
ko
es la varianza de prediccin obtenida en el
sitio x
0
por medio de kriging ordinario sobre los valores transformados y es el
multiplicador de Lagrange empleado para la condicin de insesgamiento sobre la escala de
valores transformados.
Respecto al kriging multi-gaussiano, suponga que se tiene una variable
regionalizada ( ) { } D x x Z : estacionaria. Este procedimiento consiste en hacer una
transformacin de Z(x) tal que los valores transformados sigan una distribucin normal
estndar. En ese sentido es una generalizacin del kriging log-normal.
Los pasos del mtodo kroging multi-gaussiano son los siguientes:
i. Se encuentra la funcin de probabilidad acumulada emprica ( ) ( ) x Z F
n
.
ii. Se calculan con base en ( ) ( ) x Z F
n
los scores normales estndar (Fig. 16), es decir
los valores de una distribucin de probabilidad normal estndar para los cuales la
51
probabilidad acumulada corresponde a ( ) ( ) x Z F
n
. En otras palabras se encuentra
( ) ( ) ( ) ( ) x Z F x U
n
1
= .

0.00
0.20
0.40
0.60
0.80
1.00
1.20
0 20 40 60 80
Z(x)
P
r
o
b
.

A
c
u
m
u
l
a
d
a

0.0
0.2
0.4
0.6
0.8
1.0
1.2
-3 -2 -1 0 1 2 3
U(x)

Figura 16. Representacin de la transformacin a scores normales

iii. Se realiza kriging simple sobre los valores transformados.

4.5. Aplicacin: Estudio de la distribucin espacial de variables fisicoqumicas y
biolgicas medidas en el estuario Cinaga Grande de Santa Marta
Con base en la informacin descrita en la aplicacin de la seccin 3.3. y empleando
los semivariogramas ajustados a las variables all mencionadas, se generaron mapas de
isolneas de cada una de ellas (figuras 17 a 22) y se realiz interpretacin de los mismos en
un contexto ecolgico. Como apoyo en la descripcin se emplean medidas descriptivas de
las variables (tabla 6).
Tabla 6. Medidas descriptivas de variables fisicoqumicas y biolgicas medidas durante un muestreo
realizado en marzo de 1997 en la Cinaga Grande de Santa Marta.
Variable Nivel de la
columna
Promedio Mnimo Mximo Coeficiente de
Variacin (%)
Salinidad Superficie 17.6 13.02 34.9 16.1
Fondo 18.04 13.94 33.9 15.5
Oxgeno Superficie 8.80 3.03 16.2 36.9
Fondo 5.68 2.64 13.4 36.8
Slidos en suspensin Superficie 218.2 103 318 18.8
Fondo 215.35 86 310 19.6
Nitritos Superficie 0.43 0.01 1.61 70.8
Fondo 0.42 0.01 2.39 81.7
Clorofila a Superficie 132.44 2.91 198.35 23.8
Fondo 136.19 2.91 194.75 26.4
Profundidad 1.47 0.25 2.50 24.1
Transparencia 0.27 0.20 0.35 10.8

52
4.5.1. Mapas de Distribucin
Salinidad.
Los valores medidos oscilaron entre 13.02 y 34.9 en el nivel superficial de la columna
de agua y entre 13.94 y 33.9 en el fondo de la misma, con valores promedios de 17.6 y
18.04, respectivamente (tabla 6). De los mapas de isolneas de distribucin de dicha
variable (Fig. 17), es posible concluir que existe gran homogeneidad en todo el cuerpo de
agua, con excepcin de la zona nororiental, puesto que los valores mximos y mnimos
predichos varan slo alrededor de 14 y 19 unidades.
En los dos mapas (superficie y fondo) de la figura 17, se evidencia la influencia que
tienen las entradas de agua dulce y marina sobre la magnitud de la variable dentro del
sistema. Las salinidades mximas se encuentran en la zona nororiental (zona estuarina)
donde hay entrada de agua marina a travs del sitio denominado Boca de la Barra (Fig. 1),
encontrndose all valores superiores a 30 unidades. Hacia la zona centro del cuerpo de
agua se presentan las menores magnitudes de la variable, valores entre 15 y 16 unidades, lo
que parece ser consecuencia del aporte de agua dulce que se da en la desembocadura de uno
de los tres ros (Ro Sevilla) que baja de la Sierra Nevada de Santa Marta (SNSM). As
mismo se puede observar que en el sector occidental del sistema se presentan valores
intermedios a los de las zonas antes mencionadas (alrededor de 19 unidades). Lo anterior
puede deberse al efecto de intercambio de aguas, por medio de los canales Grande y Clarn,
con el ecosistema Complejo Pajarales (Fig. 1), en donde se da un proceso de lavado de
suelos hipersalinos en poca de lluvias o cuando hay inundaciones. Dada la similitud en
magnitud y forma de distribucin que se observa en los mapas de superficie y fondo (Fig.
17), se podra pensar que para la poca seca del ao, no existe estratificacin de la columna
de agua respecto a esta variable.
Los valores de salinidad observados y predichos a travs de la tcnica kriging, resultan
bajos respecto a los registrados para esta misma poca en otros estudios (Giraldo et al.,
1995). Lo anterior podra deberse a un posible aumento en los caudales de los ros que
desembocan en la CGSM, durante los meses de lluvia precedentes al muestreo, como
consecuencia del efecto del fenmeno del nio en la regin a finales del ao 1996. No
obstante lo anterior, puede pensarse, dada la gran homogeneidad en la distribucin, que
para la fecha del muestreo no se estaban presentando aportes considerables de agua dulce,
por parte de los ros que desembocan en la CGSM, lo que significa un perodo de relativa
calma para los organismos que dependen de la salinidad para sus funciones y distribucin
(Reid y Wood, 1976).

Oxgeno Disuelto.

Los valores medidos de esta variable oscilaron entre 3.03 (mg/l) y 16.2 (mg/l) en la
superficie de la columna de agua y entre 2.09 (mg/l) y 13.4 (mg/l) en el fondo de la
misma, con valores promedios de 8.8 (mg/l) y 5.68 (mg/l), respectivamente (tabla 6).
Las correspondientes isolneas (Fig. 18), indican que en el fondo de la columna de agua se
presenta mayor homogeneidad en la distribucin, puesto que los valores predichos varan
entre 4.5 mg/l y 6.5 mg/l, con excepcin de una pequea zona en el sector nororiental frente
a la desembocadura del ro Sevilla (valores entre 6.5 y 9.5 mg/l), mientras que en superficie
53
existe considerable diferencia entre los valores ajustados en el centro del sistema (entre 9
mg/l y 13 mg/l) y los estimados para la zona sur y noroccidental del mismo (magnitudes
alrededor de 4 mg/l). Lo anterior sugiere la ocurrencia de procesos de estratificacin en el
sistema hacia la zona central del espejo de agua, donde la productividad se concentra
aportando grandes volmenes de oxgeno al agua durante el da (Reid y Wood, 1976;
Welch, 1992; Mancera y Vidal, 1994). Las isolneas, para ambos niveles de la columna de
agua, muestran que hacia las fronteras del sistema los valores del gas disminuyen. Este
comportamiento podra ser explicado al considerarse que en estas zonas existe intercambio
de flujos entre el sistema y otros cuerpos de agua, adems de aportes de hojarasca y
material orgnico, provenientes del manglar.

Slidos en suspensin.

Los valores para la variable, presentan algunas diferencias entre los dos planos de
muestreo. Los mnimos y mximos fueron de 103 mg/l y 318 mg/l en la superficie de la
columna de agua y de 86 mg/l y 310 mg/l en el fondo de la misma, con promedios de 218.2
mg/l y 215.3 mg/l, respectivamente (tabla 6).
El mapa de distribucin superficial (Fig. 19), revela la influencia que tienen los aportes de
agua sobre la magnitud de esta variable en el sistema. Se observa que las mayores
concentraciones se presentan en las zonas de las desembocaduras de los ros Fundacin y
Aracataca adems de la del cao Clarn (por medio del cual se da el aporte de agua del ro
Magdalena) y que las menores magnitudes se dan en el sector de intercambio de agua dulce
y marina (desde la zona centro y nororiental hacia el sitio denominado Boca de la Barra).
Una excepcin a este comportamiento se da en la desembocadura del ro Sevilla y del cao
Grande en donde las concentraciones de los slidos en suspensin son muy similares a las
observadas en el resto del cuerpo de agua.
El patrn de comportamiento de la variable en el fondo de la columna de agua es muy
similar al descrito en el prrafo de arriba respecto a los valores superficiales; es decir
mayores concentraciones hacia las desembocaduras de los ros y caos (zonas sur y nor-
occidental) y menores magnitudes en la zona nororiental. Sin embargo, la diferencia entre
los valores predichos en estas fronteras y los del resto del sistema (valores entre 220 mg/l y
210 mg/l), no resultan significativos como en el caso de la distribucin superficial (valores
entre 245 mg/l y 175 mg/l).
Una posible explicacin a la diferencia en magnitud de los valores de superficie y
fondo es que los flujos de agua dulce son menos densos y presentan mayores
concentraciones de slidos en suspensin, por lo cual al ingresar al sistema y encontrarse
con las aguas salobres del mismo (ms pesadas), tienden a permanecer en la superficie (lo
cual puede causar estratificacin. (Wheaton, 1977; Welch, 1992 ; Jay et al, 1997; Nixon,
1997).

Nitritos.

El in nitrito present valores entre 0.01 mol/l y 1.61 mol/l para la superficie de la
columna de agua y entre 0.01 mol/l y 2.39 mol/l en el fondo de la misma. Los valores
promedios fueron de 0.43 mol/l y 0.42 mol/l, respectivamente (tabla 6).
54
Las mediciones superiores a 1 mol/l se dieron en dos estaciones de muestreo, ubicadas en
la zona norte del sistema (cuadrculas 14 y 15, Fig. 1). Dado que lo anterior no fue el patrn
generalizado, las isolneas de distribucin en superficie y fondo (Fig. 20) presentan slo
valores alrededor de los promedios arriba mencionados. Este resultado es esperable, puesto
que los nitritos generalmente se dan en bajas concentraciones (Mancera, 1990; Hernndez y
Gocke, 1990). Day et al. (1989), indican que esto puede ser debido al consumo continuo de
las comunidades fitoplanctnicas y a la precipitacin en los sedimentos como consecuencia
de lo cambios en las condiciones del agua estuarina.
En ambos casos (superficie y fondo) los valores interpolados (entre 0.2 mol/l y 0.7
mol/l) para esta variable, revelan la presencia de un gradiente sur-norte, dndose las
mayores concentraciones en el sector ms estuarino. Lo anterior podra ser consecuencia de
aportes de materia orgnica por parte de las poblaciones cercanas a esta zona (Welch,
1992). Los mapas de distribucin espacial no revelan estratificacin de la columna de agua
para esta variable, dada la similitud en los valores predichos en superficie y fondo (Fig.
20).

Clorofila a.

Los valores medidos de clorofila a oscilaron entre 2.91 g/l y 198.35 g/l en la
superficie de la columna de agua y entre 2.91 g/l y 194.75 g/l en el fondo de la misma.
Los valores promedios fueron 132.44 g/l y 136 g/l, respectivamente. Los bajos
coeficientes de variacin (menores del 30%), en ambos casos (superficie y fondo), indican
relativa homogeneidad en las mediciones de esta variable (tabla 6). Las isolneas de
distribucin calculadas con los datos predichos (Fig. 21) presentan algunos aspectos
comunes. En ambos mapas (superficie y fondo) se observa que los valores mximos
(alrededor de 160 g/l) se dan en el sur del sistema hacia la desembocadura del ro
Fundacin y las menores concentraciones se presentan en el sector ms nororiental (valores
menores de 50 g/l). La diferencia radica en el comportamiento en la zona centro del
espejo de agua. Mientras que en la superficie se presenta alta variabilidad (valores entre 90
y 160 g/l), en el fondo de la columna de agua los valores son muy homogneos (entre 130
g/l y 150 g/l) y se ajustan claramente a una tendencia creciente en sentido sur -
nororiente. El comportamiento distribucional representado en los mapas de isolneas puede
estar de acuerdo con las condiciones climticas de la poca. Bula-Meyer (1989) y Snchez
(1996), indican que en la poca ms seca del ao (poca en la que se realiz el muestreo)
predominan los vientos Alisios y que la circulacin de las masas de agua en el sistema
obedece a la fuerza del viento y a los cambios de marea en el Mar Caribe. Esto hace pensar
que los flujos de agua son ms lentos en la zona centro del sistema y por consiguiente, al no
presentarse un recambio de agua muy fuerte, se favorece el desarrollo de las comunidades
fitoplanctnicas, puesto que estas consumen los nutrientes que se liberan desde el
sedimento por accin de los vientos (Welch, 1992).
Giraldo (1996), encontr un comportamiento similar en la distribucin de esta variable
con datos promedios de la poca, calculados con informacin de varios aos anteriores a
1995. Sin embargo en la zona de la desembocadura de los ros, especficamente en la del
Fundacin, los valores reportados por dicho autor resultaron considerablemente ms bajos a
los encontrados en el presente estudio. Lo anterior puede estar indicando, como se
mencion en la interpretacin de los resultados obtenidos con la salinidad, una disminucin
55
de la entrada de agua dulce en esta zona, causndose as el mismo efecto de baja
circulacin y alta asimilacin de nutrientes, comentado en el prrafo de arriba para la zona
centro del sistema.

Profundidad (Batimetra) y Transparencia (Secchi).

Las medidas resmenes de la variable profundidad (tabla 6) y el mapa de distribucin
calculado con los datos predichos (Fig. 22) confirman lo reportado en estudios anteriores
(Wiedemann, 1973), en los cuales se afirma que la CGSM es un sistema somero, con una
profundidad promedio alrededor de 1.5 m. El mencionado mapa revela la presencia de
gradientes positivos en sentido oriente occidente y sur nor-occidente, respectivamente. Este
comportamiento puede estar relacionado con los procesos de sedimentacin que se han
venido presentando en los ltimos aos cerca al sitio Boca de la Barra (cuadrcula 1, Fig.
1) como consecuencia de la disminucin de los flujos de agua que entran al sistema a travs
de ros que bajan de la SNSM y de los canales que comunican con el ro Magdalena.
De otro lado respecto a la variable transparencia, medida por medio de la profundidad
del disco de Secchi (Reid y Wood, 1976) se puede concluir, de acuerdo con los valores
encontrados (tabla 6) y predichos (Fig. 22), que esta es una caracterstica muy homognea
en el sistema de estudio. Las isolneas de distribucin indican que en general los valores
esperados en este ecosistema no son superiores a 30 cm. Este bajo nivel de transparencia
est de acuerdo con el resultado encontrado para la variable clorofila a (altas
concentraciones en gran parte del sistema, como consecuencia de un aumento en las
entradas de nutrientes), puesto que como lo muestra Welch (1992), la relacin entre estas
dos variables es de tipo inverso. Segn resultados reportados por este autor se espera que
para niveles de visibilidad del disco secchi, inferiores a 1 m se den concentraciones de
clorofila a superiores a 80 g/l.

56

R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a

Figura 17. Distribucin espacial de la salinidad del agua en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa de
la izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.

57
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a

Figura 18. Distribucin espacial del oxgeno disuelto (mg/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa
de la izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.

58
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a

Figura 19. Distribucin espacial de los slidos en suspensin (mg/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997.
El mapa de la izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.

59
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a

Figura 20. Distribucin espacial de nitritos (mol/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa de la
izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.

60
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a

Figura 21. Distribucin espacial de clorofila a (g/l) en la Cinaga Grande de Santa Marta durante una jornada de muestreo realizada en marzo de 1997. El mapa de la
izquierda corresponde a los valores en la superficie de la columna de agua y el de la derecha a los niveles en el fondo de la misma.

61
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
.

A
r
a
c
a
t
a
c
a

Figura 22. Distribucin espacial de la profundidad (m) (izquierda) y transparencia (m) (derecha) en la Cinaga Grande de Santa Marta durante una jornada de muestreo
realizada en marzo de 1997.

62

Capitulo Cinco

Temas Especiales
En este captulo se presentan algunos temas que no aparecen explcitamente en libros
clsicos de geoestadstica, tales como el diseo de redes muestrales o el anlisis de
componentes principales sobre variables regionalizadas. As mismo se revisa la teora del
anlisis cokriging y de simulacin de fenmenos espaciales, bajo el supuesto de normalidad
multivariada.
5.1. Cokriging Ordinario
Si se tienen dos variables regionalizadas Z
v1
(x) y Z
v2
(x) tomadas en sitios de la regin de
estudio, no necesariamente iguales, entonces el semivariograma cruzado entre ellas, se
estima por:
{ }{ } ) ( ) ( ) ( ) (
2
1
) (
2 2 1 1 2 1
x Z h x Z x Z h x Z
n
h
v v
n
v v
h
v v
h
+ + =
(9)
Donde n
h
es el nmero de parejas de datos que se encuentran a una distancia h (Bogaert et
al., 1995).
Modelo Lineal de Corregionalizacin (MLC)
El MLC asume que todos los semivariogramas simples y cruzados pueden expresarse
como una suma de modelos bsicos (exponencial, esfrico, gaussiano, etc.) idnticos. Para el
caso de dos variables:

) ( . . . ) ( ) (
) ( . . . ) ( ) (
) ( . . . ) ( ) (
0 0 2 1
0 0 2
0 0 1
h h h v v
h h h v
h h h v
m m
m m
m m

+ + =
+ + =
+ + =
(10)

donde
v1
(h) y
v2
(h)

son los semivariogramas simples,
v1v2
(h) es el semivariograma cruzado.
0
(h),
1
(h), . . .,
m
(h) son los modelos bsicos de semivariograma y , y son constantes.

Matricialmente:
) (
) (
) (
) (
0
) (
) (
2 2 1
2 1 1
h B
h
h
h
s
m
s
s
v h v v
h v v v
=
=
|
|
\
|
=
, donde

|
|
\
|
=
|
|
\
|
=
) ( 0
0 ) (
) (
h
h
h B
s
s
s
s s
s s
s

(11)

(h) se le conoce como matriz de corregionalizacin.

63
Predictor Cokriging

El mtodo de prediccin espacial cokriging consiste en hacer prediccin espacial de una
variable con base en su informacin y en la de algunas variables auxiliares que este
correlacionadas espacialmente con ella. El predictor cokriging tiene la siguiente expresin en
el caso en el que se considera una sola variable auxiliar:

) ( ) ( ) (
2
2
1
1
1
1 1
*
j v
n
j
j i v
n
i
i o v
x Z b x Z a x Z

= =
+ =
(12)

el lado izquierdo de la igualdad en la ecuacin anterior representa la prediccin de la
variable de inters en el punto x
0
no muestreado. ) x ( Z
i v
1
con i=1, 2 , ... , n
1
, representa la
variable primaria. As mismo, ) x ( Z
j v
2
con j=1, 2, . . ., n
2
, representa la variable auxiliar. a
i

y b
j
, con i=1, 2 , ... , n
1
y j=1, 2, . . ., n
2
respectivamente, representan los pesos o
ponderaciones de las observaciones de las variables primaria y auxiliar y se estiman con base
en el MLC ajustado a los semivariogramas simples y cruzados. Los pesos a
i
y b
j
se estiman
de manera anloga al proceso descrito para el mtodo kriging ordinario, es decir estos sern
los que minimizan la varianza del error de prediccin sujeta a la restriccin de que el
predictor sea insesgado. La estimacin de los parmetros se obtiene resolviendo el siguiente
sistema de ecuaciones (Isaaks y Srivastava, 1989):

|
|
|
|
|
|
|
|
|
|
|
\
|
=
|
|
|
|
|
|
|
|
|
|
|
\
|
|
|
|
|
|
|
|
|
|
|
|
\
|
0
1
) m , 0 (
) 1 , 0 (
) n , 0 (
) 1 , 0 (
b
b
a
a
0 0 1 1 0 0
0 0 0 0 1 1
1 0 ) m , m ( ) m , 1 ( ) m , n ( ) m , 1 (
1 0 ) 1 , m ( ) 1 , 1 ( ) 1 , n ( ) 1 , 1 (
0 1 ) n , m ( ) n , 1 ( ) n , n ( ) n , 1 (
0 1 ) 1 , m ( ) 1 , 1 ( ) 1 , n ( ) 1 , 1 (
2 v 1 v
2 v 1 v
1 v
1 v
2
1
m
1
n
1
2 v 2 v 2 v 1 v 2 v 1 v
2 v 2 v 2 v 1 v 2 v 1 v
2 v 1 v 2 v 1 v 1 v 1 v
2 v 1 v 2 v 1 v 1 v 1 v

M
M
M
M
L L
L L
L L
M M M M M M M M
L L
L L
M M M M M M M M
L L
(13)

La matriz del lado izquierdo contiene los valores de las funciones de semivarianza y de
semivarianza cruzada calculadas para todas las distancias entre las parejas de puntos
consideradas. Las dos ultimas filas de dicha matriz son las correspondientes a la restriccin
de insesgamiento del predictor. a
i
y b
j
con i = 1, 2, ..., n y j = 1, 2, ...., m, son los parmetros
a estimar,
1
y
2
son los multiplicadores de Lagrange empleados para la restriccin de
insesgamiento y el vector del lado derecho contiene los valores de la funciones de
semivarianza y semivarianza cruzada evaluados para las distancia entre los sitios de
muestreo (de ambas variables) y el sitio donde se desea hacer la prediccin. Las dos ltimas
filas del vector estn asociadas a la condicin de insesgamiento. La correspondiente
varianza de prediccin del mtodo cokriging se calcula como (Bogaert et al, 1995):
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

= =
+ + + =
m
1 j
0 2 v j 2 v j
n
1 i
0 1 v i 1 v i 1 0 1 v 0 1 v
2
k
x Z , x Z Cov b x Z , x Z Cov a x Z , x Z Cov (11)
64
donde
1
es el multiplicador de Lagrange empleado para la restriccin dado por la condicin
de insesgamiento
|
\
|
=
=
n
1 i
i
1 a .
( ) ( ) ( ) ( ) l , k x Z , x Z Cov
vivi
2
vi l vi k vi
= es la funcin de covarianza espacial de la variable i,
i=1,2, evaluada para la distancia entre los sitios de muestreo k, l.
La ventaja del mtodo cokriging frente al kriging radica en el hecho de que cuando la
variable auxiliar est ampliamente correlacionada con la variable de inters se puede obtener
un disminucin en la varianza de prediccin, no obstante dicha variable tenga menor
densidad de muestreo. En situaciones en las que la variable objetivo tiene costos altos de
muestreo se recomienda la aplicacin de esta metodologa (Bogaert et al., 1995).
Kriging Probabilstico

Es un predictor basado en cokriging que utiliza como variables predictoras una variable
indicadora y una variable generada a travs de la transformacin uniforme.
Sea Z(x
i
) la variable observada, i = 1,2, . . ., n, entonces se definen las siguientes
transformaciones:

=
caso Otro
z x Z Si
z x I
i
i
0
) ( 1
) , (

n
x Z R
x U
i
i
) ( (
) ( = para todo i, i = 1,2,. . . , n.

con )) ( (
i
x Z R igual al rango (posicin que ocupa dentro de los datos ordenados de menor a
mayor) la i-sima observacin muestral. La prediccin de probabilidad de xito en el sitios
de inters est dada por:

( )

= =
+ =
n
i
n
i
i i i i
x U v z x I x I
1 1
0
*
) ( ) , (

Los pesos
i
y i
v
se estiman mediante el sistema de ecuaciones del mtodo cokriging.
5.2. Anlisis de Componentes Principales Regionalizado (ACPR)
El ACPR se fundamenta en la realizacin de anlisis de componentes principales (ACP)
(apndice, seccin 6.4.2) con base en varias matrices de corregionalizacin (seccin 5.1). El
caso ms simple de ACPR es cuando se aplica ACP con base en la matriz de
corregionalizacin a distancia cero (matriz de correlacin tradicional). En este caso la
tcnica consiste en generar los ejes principales de la forma tradicional (Manly, 1994),
posteriormente realizar la correspondiente interpretacin de estos en trminos de la
variabilidad explicada por cada componente respecto a cada variable original y finalmente
llevar a cabo un anlisis geoestadstico a travs de la estimacin de la funcin de
semivarianza y de la aplicacin de algn procedimiento kriging con base en los datos de los
ejes generados. La interpretacin del mapa de predicciones obtenida sobre los componentes
permite obtener una visin integral del comportamiento conjunto de las variables
consideradas dentro del sistema de estudio.
65
El procedimiento se puede realizar con matrices de correlacin obtenidas para diferentes
distancias (fijadas de antemano) y calculadas a travs de la funcin de semivarianza,
covarianza cruzada o de correlacin cruzada (si las variables tienen diferentes escalas de
medida se recomienda emplear la funcin de correlacin cruzada). Lo anterior implica que
se deben calcular
|
|
\
|
2
n
funciones de correlacin espacial cruzada, siendo n el nmero total de
variables involucradas en el estudio. Esto puede ser una limitante computacional del
mtodo, cuando se incremente el nmero de variables. En la prctica se acostumbra a
seleccionar grupos de pocas variables (alrededor de 5, consideradas como las ms
relevantes) que estn muy relacionadas espacialmente y con base en la informacin de estas
hacer el anlisis para dos o tres matrices de corregionalizacin (incluyendo la de distancia
cero).
Correlacin Intrnseca.
Se dice que un conjunto de variables regionalizadas tiene correlacin intrnseca cuando
la estructura de correlacin de las variables es independiente de la distancia espacial (puede
haber correlacin para distancia cero), es decir cuando las funciones de semivarianza
cruzada, covarianza cruzada o correlacin cruzada, entre las variables, son constantes en
funcin de la distancia. La deteccin de correlacin intrnseca puede hacerse a travs de las
variables originales o por medio de los componentes principales generados. En la seccin
6.4.2., se menciona que los ejes principales deben ser independientes, luego se espera que
para cualquier distancia la funcin de semivarianza cruzada entre cualquier para de
componentes principales est alrededor de cero. En caso contrario habr relacin espacial
entre las variables. Existen dos formas de llevar a cabo el ACPR dependiendo de si las
variables tienen o no correlacin intrnseca.
ACPR en Presencia de Correlacin Intrnseca.
El algoritmo en este caso se inicia con el clculo de la matriz de corregionalizacin para
distancia cero (matriz de correlacin clsica) (en las otras distancias no hay correlacin entre
las variables). Posteriormente se aplica el ACP clsico se generan ejes factoriales que
explican, se espera que en un alto porcentaje, la variabilidad contenida en el conjunto total
de variables (idealmente dos o tres componentes deberan explicar ms del 90% de la
varianza total). Con base en la magnitud y le signo de los vectores propios se identifica el
peso de cada variable original en los correspondientes ejes. Finalmente se obtiene un mapa
de distribucin espacial, cumpliendo con las etapas bsicas del anlisis geoestadstico, que
permita dar una interpretacin simultnea del comportamiento de las variables involucradas
en el anlisis.
ACPR sin Correlacin Intrnseca.
En este caso se debe establecer en primer lugar un modelo lineal de corregionalizacin
entre las variables originales. Con base en este se calculan varias matrices de
corregionalizacin (una para cada distancia h fijada) y con cada una de ellas se realiza un
ACP clsico. Los resultados obtenidos en cada anlisis permiten establecer relaciones entre
las variables que no son observados en anlisis clsicos de correlacin .

66

5.3. Diseo de Redes de Muestreo
Seleccin de Variables
Cuando se va a iniciar el estudio de un ecosistema natural, deben establecerse aspectos
referentes a su ubicacin geogrfica, a las condiciones climticas, hdricas y geolgicas del
mismo. La revisin debe incluir los antecedentes histricos de las variables ecolgicas e
incluso los factores econmicos, socio-culturales y demogrficos que enmarcan a la regin
de estudio. Todos estos aspectos permiten planear, desde un punto de vista logstico la
realizacin del muestreo.
Podra decirse que existen dos tipos de variables que deben tenerse en cuenta cuando se
realiza un estudio ambiental. Aquellas que estn directamente relacionadas con el fenmenos
ecolgico de estudio (contaminacin, calidad del agua, manglar, bentos, plancton, etc.) y
aquellas que permiten decidir respecto a aspectos relacionados con las frecuencia del
muestreo (variables climticas) y la ubicacin estratgica de sitios de muestreo (por ejemplo
variables hdricas como direccin y velocidad de las masas de agua, fuentes de entrada y
salida, etc)
As mismo la seleccin de las variables es consecuencia del tipo de estudio que se quiere
llevar a cabo. Estos pueden ser de lnea base, monitoreo y evaluacin. En el primero de estos
no hay antecedentes histricos respecto al fenmeno de inters, se asume total
desconocimiento respecto a la relacin, comportamiento y distribucin de las variables en
el ecosistema y por consiguiente se debe evaluar un nmero grande de variables, con amplia
intensidad de muestreo en la que se cubra toda la regin de estudio, de forma tal que se
pueda caracterizar de manera general el sistema. Si existe conocimiento de la regin de
estudio, hay estudios preliminares que posibilitan el planteamiento de estructuras de
correlacin espacial y temporal de las variables y se quieren establecer los cambios que se
estn dando en el ecosistema, por ejemplo por actividades antrpicas, es entonces un estudio
de monitoreo. En este caso debe establecerse con base en la informacin disponible tanto la
frecuencia como la ubicacin de los puntos de muestreo. Por ltimo cuando hay
conocimiento del ecosistema respecto al fenmeno de inters y se quieren observar posibles
variaciones muy puntuales respecto al patrn temporal o espacial tradicionalmente
observado, el estudio se denomina de evaluacin. En este ltimo caso el objetivo puede ser
el de conservar o mitigar posibles daos ms que el de hacer diagnstico como en el caso del
monitoreo.
Seleccin de la Red Optima de Muestreo
Como en cualquier procedimiento estadstico en el que se hace inferencia, en
geoestadstica cuando se hace prediccin en sitios o puntos de la regin de estudio no
observados, a travs de cualquiera de las tcnicas kriging, es necesario evaluar la precisin
de tal prediccin. Lo anterior se realiza, como se estableci en el capitulo 4 y en la seccin
5.1, por medio del clculo de la varianza del error de prediccin. De la seccin 4.2, para el
caso del kriging ordinario, la varianza de prediccin se calcula por:
67

2
1
= +
=
ii io
i
n

Es evidente, de la ecuacin anterior, que la varianza de prediccin no es constante como
en el caso clsico y que adems no depende de los valores medidos de la variable sino de su
estructura de correlacin, evaluada a travs de la funcin de semivarianza.
McBratney et al (1981) muestran que, para cualquier densidad muestral, la distancia
mxima entre un punto de observacin y un punto a interpolar es mnima cuando la
configuracin de los puntos es hecha en un enmallado triangular, por lo cual bajo esta
distribucin de puntos se obtendrn las menores varianzas de prediccin. Sin embargo este
mismo autor y Warrick et al (1986) indican que por razones logsticas referentes a la
ubicacin de los sitios en el campo y minimizacin de recorridos, el enmallado cuadrado es
preferible.
De acuerdo con lo anterior el problema del diseo muestral se limita a establecer para
varias redes de muestreo, de diferentes densidades, con enmallado triangular equiltero o
cuadrado, la relacin entre las varianzas de prediccin mximas (las obtenidas en el centro
de cada tringulo o cuadrado) y los costos asociados a ellas. De esta forma se deduce el
costo necesario para alcanzar cierto grado de certidumbre o, a la inversa, la varianza de
prediccin si se prefija el costo.
5.4. Simulacin
A continuacin se describe el mtodo de simulacin de variables regionalizadas con
densidad conjunta normal multivariada (gaussiana) (Cressie, 1993) que se fundamenta en la
tcnica de descomposicin de Cholesky (Anderson, 1984).
Suponga que se desea simular el vector ( )
( )
( )
( )
|
|
|
|
|
\
|
=
n
x Z
x Z
x Z
x Z
M
r
2
1
correspondiente a n variables
aleatorias en n sitios de muestreo de inters x
1
, x
2
, ..., x
n
. Asuma que el proceso estocstico
tiene vector de medias y matriz de varianzas y covarianzas
( ) ( ) ( )
( )
( )
( )
|
|
|
|
|
\
|
= =
n
x
x
x
x x Z E
M
r
r
2
1
,
|
|
|
|
|
\
|
=
nn n n
n
n
C C C
C C
C C
L
M O M M
L
L
2 1
2
2
2 21
1 12
2
1
, con ( ) ( ) ( )
j i ij
x Z x Z COV C , = .

La matriz de varianzas y covarianzas es descompuesta por el mtodo de Cholesky.
T
LL = , con L una matriz triangular inferior. Entonces el vector simulado se define como:
( ) ( )
r r
r
L x x Z + = , donde
r
( ) I N
n
, 0
r
.
Usando teoremas referentes a la distribucin de combinaciones lineales de vectores con
distribucin normal multivariada (Anderson, 1984) se comprueba que el vector simulado
tiene vector de medias ( ) x
r
y matriz de covarianzas .
68

5.5. Aplicaciones
5.5.1. Comparacin de los mtodos Kriging y Cokriging con base en resultados de anlisis
espaciales de Variables Fisicoqumicas y Biolgicas Medidas en el Estuario Cinaga
Grande de Santa Marta.
Se emplea la informacin de las variables profundidad (m), secchi (cm), salinidad,
oxgeno (mg/l) y clorofila "a" (g/l) descrita en la aplicacin 3.3. para mostrar las ventajas
del mtodo cokriging respecto al kriging.
Se mencion en la seccin 4.1. que la tcnica cokriging es preferible al kriging cuando
hay informacin de variables auxiliares relacionadas espacialmente con la variable de inters
y sta ltima tiene altos costos de muestreo. En este caso se usan como variables auxiliares
profundidad, secchi, salinidad y oxgeno y como variable objetivo clorofila "a". Las cuatro
primeras tienen bajos costos de muestreo (son medidas in-situ) mientras que los altos costos
de los insumos de laboratorio necesarios para la obtencin de las medidas de clorofila "a"
pueden ser limitantes del uso de una red de muestreo densa para dicha variable. Aunque no
se presentan en el trabajo los semivariogramas cruzados entre las variables consideradas
como auxiliares y clorofila "a", estos muestran la presencia de fuertes estructuras de
dependencia espacial entre ellas.
Debido a que la aplicacin del mtodo cokriging resulta dispendiosa cuando se
consideran dos o ms variables auxiliares (es complejo el ajuste del modelo lineal de
corregionalizacin), se decidi tomar la informacin de las variables auxiliares de forma
"condensada" a travs del indicador IGC
i
(4) (Giraldo, 2002; apndice, seccin 6.1),
calculado con base en la informacin dicotomizada de dichas variables.. El criterio para
dicotomizar cada variable fue el de comparacin de cada valor observado con su
correspondiente mediana. Se asign el valor 1 para valores mayores o iguales que la mediana
y 0 en caso contrario. Se aplic el mtodo cokriging para realizar predicciones de la variable
clorofila "a" con base en sus observaciones e informacin auxiliar del indicador IGC
i
(4).
Para detectar la eficiencia del mtodo se redujo a aproximadamente la mitad (54 datos) la
informacin original de clorofila "a" (en adelante se denomina a sta como CLORO 2) y se
dej la informacin completa (114 datos) del IGC
i
(4).El ajuste del modelo lineal de
corregionalizacin y el clculo de las varianzas de prediccin fue realizado en el software
The Spatial Interpolation of Agroclimatic Data (Bogaert et al., 1995).
Resultados y Discusin
En primera instancia se calcularon semivariogramas simples de las variables CLORO 2
e IGC
i
(4) y los semivariogramas cruzados entre estas tres variables. Slo se muestra el
semivariograma experimental cruzado (Fig. 23). Este indica que las dos variables
consideradas presentan correlacin espacial inversa, es decir que valores altos de
productividad biolgica (alta clorofila "a") estn asociados con valores bajos del indicador
IGC
i
(4) en zonas circundantes (incluso mayores a 10 km). Los valores bajos del indicador
IGC
i
(4) estn asociados a magnitudes por debajo de la mediana en las variables profundidad,
secchi, salinidad y oxgeno disuelto (ver tabla de interpretacin del IGC
i
(4) en el apndice).
De lo anterior se concluye que zonas con alta biomasa fitoplanctnica estn asociadas a baja
profundidad, alta turbidez y a masas de agua con baja salinidad y bajo nivel de oxgeno (tal
vez como consecuencia del consumo de ste durante las horas del da).

69

-50
-40
-30
-20
-10
0
0 5000 10000 15000 20000 25000
Distancia (h)
S
e
m
i
v
a
r
i
a
n
z
a

C
r
u
z
a
d
a

Figura 23. Semivariograma experimental cruzado entre las variables clorofila "a" (54 datos) e IGC
i
(4).
Informacin tomada en marzo de 1997 en la Cinaga Grande de Santa Marta.

Una vez calculados los semivariogramas experimentales se ajust el modelo lineal de
corregionalizacin entre las variables CLORO 2 e IGC
i
(4) (tabla 7), el cual incluye efecto
pepita puro y un modelo esfrico. Con base en el modelo lineal de corregionalizacin se
realizaron las predicciones, de la variable CLORO 2, a travs del mtodo cokriging en 53
sitios de muestreo (aquellos en los que fue eliminada inicialmente la informacin de clorofila
"a") y se calcul la varianza de prediccin mxima, mnima y promedio (tabla 8). Utilizando
la informacin de los 54 datos de clorofila "a", se llev a cabo prediccin en los 53 sitios
restantes a travs del mtodo kriging y se calcularon nuevamente las varianzas de prediccin
mxima, mnima y promedio (tabla 8). Los resultados obtenidos por estos dos mtodos
fueron comparados con la varianza mxima de prediccin obtenida por Giraldo et al. (2001)
para la variable clorofila "a" utilizando la informacin completa (tabla 8).

Tabla 7. Modelo de corregionalizacin ajustado a los semivariogramas experimentales (simples y cruzado) de
las variables clorofila "a" (V1, 54 datos) e IGC(4) (V2, 114 datos). La informacin original fue medida en una
muestreo realizado en marzo de 1997 en la Cinaga Grande de Santa Marta.
Modelo Ajustado
( ) h
1 v

131.82 + 535.4 Esfrico (8000)
( ) h
2 v

3.89 + 9.59 Esfrico (8000)
( ) h
2 v 1 v

-1.18 - 18.70 Esfrico (8000)

70
Tabla 8. Varianzas de prediccin mnima, mxima y promedio ((g)
2
/l) para la variable clorofila "a", usando
los mtodos kriging y cokriging (con base en informacin auxiliar de la variable IGC(4)). Entre parntesis se
encuentran la ganancia en precisin respecto al mtodo kriging con informacin incompleta.
MTODO VARIANZA DE
PREDICCIN
MXIMA
VARIANZA DE
PREDICCIN
MNIMA
VARIANZA DE
PREDICCIN
PROMEDIO
Kriging con datos en 107 sitios de
muestreo (informacin completa)
379 (25%) 0
Kriging con datos en 54 sitios de
muestreo (informacin reducida)
506 (0%) 0 194.147(0%)
Cokriging con datos en 54 sitios de
muestreo para la variable clorofila
"a" y 114 datos para la variable
IGC
i
(4)
488 (4%) 0 190.06 (2.1%)

De los resultados de la tabla anterior se concluye, como era de esperarse, que la
reduccin en el nmero de observaciones (reduccin del nmero de sitios de muestreo) a
cerca de la mitad, ocasiona un aumento en la varianza de prediccin de la variable
considerada. No obstante dicho aumento es menor cuando se aplica el mtodo cokriging
utilizando como variable auxiliar la variable IGC
i
(4). Al hacer la prediccin de la variable
clorofila "a" con menos informacin empleando el mtodo cokriging se gana un 4% en
trminos de la varianza mxima y un 2.1 % , en trminos de la varianza promedio (promedio
de 53 varianzas estimadas), de precisin respecto al mtodo kriging con datos incompletos.
Teniendo en cuenta lo anterior y que la variable clorofila "a" presenta altos costos de
muestreo (pasar de 107 sitios a 54 disminuye en ms del 200% (cerca de 2 millones de
pesos) los costos (Giraldo et al., 2001) se recomienda en este caso la aplicacin del mtodo
de cokriging. Con la conclusin anterior no se indica que el nmero ptimo de puntos de
muestreo para la variable clorofila "a" en el ecosistema de estudio debe ser 54, slo se
muestra que en los casos en que se tiene informacin de variables auxiliares como las aqu
utilizadas es preferible el uso del predictor cokriging. Un estudio del nmero ptimo de
sitios de muestreo requiere del diseo de una red de muestreo. Para lo anterior se puede
consultar Giraldo et al (2001).
5.5.2. Estudio Multivariado del Comportamiento Espacial de Variables Fisicoqumicas y
Biolgicas Medidas en el Estuario Cinaga Grande de Santa Marta.
Se emplea la informacin de las variables salinidad, slidos en suspensin (mg/l),
nitritos (mol/l), silicatos (mol/l) y clorofila a(g/l), tomada de la base de datos descrita
en las aplicaciones anteriores, para mostrar el uso de los componentes principales en la
descripcin de la distribucin conjunta de estas.
Con base en la matriz de correlacin de Pearson clsica (en distancia cero) y aplicando
la metodologa descrita en la seccin 6.4.2. se generaron los ejes factoriales. Los dos
primeros componentes explican el 71% de la variabilidad contenida en las 5 variables
consideradas (tabla 9). Se consideran para el anlisis slo estos dos componentes. La
funcin de semivarianza cruzada entre los dos primeros componentes principales (Fig. 24
revela que para distancias diferentes de cero hay asociacin entre los ejes principales y por
consiguiente se puede concluir que no existe correlacin intrnseca entre las variables
originales. Lo anterior indica que un estudio exhaustivo de la correlacin entre las variables
71
requerira del clculo de matrices de corregionalizacin para diferentes distancias. En el
documento se presenta slo el caso en que la distancia es cero, puesto que el propsito es
identificar la distribucin espacial de las 5 variables de forma simultnea .
Las variables de mayor importancia en la construccin del primer eje principal son salinidad
(en sentido directo), silicatos y clorofila "a" (en sentido inverso). Anlogamente las variables
de ms peso en la construccin del componente dos son slidos en suspensin y clorofila "a"
en sentido directo y nitritos en sentido inverso (tabla 10).
Tabla 9. Porcentajes de varianza explicados por los componentes principales generados con informacin de
cinco variables fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta en marzo de
1997.
COMPONENTE VALOR PROPIO % DE VARIANZA % ACUMULADO
1 2.23 44.610 44.610
2 1.34 26.962 71.562
3 0.70 14.124 85.746
4 0.37 7.426 93.172
5 0.34 6.828 100.000
Con la informacin georreferenciada de los dos componentes principales se realizaron
anlisis geoestadsticos y se obtuvieron mapas de distribucin espacial (Figs. 25 y 26). El
mapa de distribucin del componente uno (Fig. 25) indica que en gran parte del sistema el
nivel de salinidad est por debajo del promedio y que sera esperable encontrar all altas
concentraciones de silicatos y clorofila "a". Hacia la zona norte del sistema se dan por el
contrario magnitudes de salinidad por encima de su promedio y bajas concentraciones de
silicatos y clorofila "a". En resumen podra pensarse, respecto a la informacin aportada por
el primer eje principal, que la productividad biolgica puede verse favorecida por altas
concentraciones de nutrientes y bajos niveles de salinidad en sitios aledaos.
La informacin aportada por el mapa de distribucin espacial del componente dos (Fig.
26) confirma en gran medida lo descrito respecto a la distribucin espacial de la clorofila "a"
dentro del sistema, es decir concentraciones altas en gran parte del cuerpo de agua y bajos
niveles hacia la zona norte. En este caso se puede concluir que las magnitudes altas de esta
variable estn asociadas a niveles altos slidos en suspensin y , contrario a lo esperado, a
bajos niveles en el ion nitrito.
Los resultados descritos de forma conjunta a travs de la interpretacin de las figuras 25
y 26 son completamente coherentes con los reportados de forma univariada para las
variables originales en la seccin 4.5.1.
Tabla 10. Pesos de las variables en la construccin de los dos primeros componentes principales. Informacin
original medida en marzo de 1997 en la Cinaga Grande de Santa Marta.
VARIABLE COMPONENTE 1 COMPONENTE 2
Salinidad 0.5060 0.4150
Slidos en Suspensin -0.3468 0.5668
Nitritos 0.2084 -0.6219
Silicatos -0.5049 -0.3334
Clorofila "a" -0.5703 0.9140
72

Figura 24. Funcin de semivarianza cruzada entre los dos primeros componentes principales generados con
informacin de algunas variables fisicoqumicas y biolgicas medidas en marzo de 1997 en el estuario Cinaga
Grande de Santa Marta.

R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
. A
ra
c
a
ta
c
a
-2.00
-1.00
0.00
1.00
2.00

Figura 25. Distribucin espacial del primer componente principal generado con informacin de variables
fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta en marzo de 1997.

73
R. Fundacion
Boca de la
Barra
MAR CARIBE
R. Sevilla
C. Grande
C. Clarn
10 45' N
7 30' W
R
. A
ra
c
a
ta
c
a
-3.50
-2.50
-1.50
-0.50
0.50
1.50

Figura 26. Distribucin espacial del segundo componente principal generado con informacin de variables
fisicoqumicas y biolgicas medidas en el estuario Cinaga Grande de Santa Marta en marzo de 1997.
5.5.3. Diseo de una Red de Muestreo para el Estuario Cinaga Grande de Santa Marta.
En esta seccin se hace una aplicacin de la metodologa propuesta por McBratney et al
(1981) con el objetivo de disear una red ptima de muestreo para la CGSM (ampliamente
descrita en secciones anteriores). En las dos ltimas dcadas la CGSM ha venido dando
muestras de deterioro y por ello se han implementado algunas obras civiles que buscan su
recuperacin. Para el monitoreo de los cambios que se estn dando en el ecosistema se hace
necesario contar con un conjunto de sitios de muestreo que haga posible lograr una visin
integrada del comportamiento de las principales variables que rigen sus procesos de
productividad.
Se analizaron datos en la superficie de la columna de agua de las variables temperatura,
salinidad, seston total, profundidad, silicatos, clorofila, oxgeno disuelto, nitritos y clorofilas
a y "c" tomados en los mismos puntos de muestreo descritos en la seccin 3.3.
Se simularon redes de muestreo con cuadrculas de 4, 9, 16, 25 y 36 km
2
,
respectivamente (Fig. 27) y se estimaron las correspondientes varianzas de prediccin de
cada variable en cada poca tomando como base los modelos de correlacin espacial
estimados en la seccin 3.3.
La comparacin del error estndar de prediccin y de los costos asociados al muestreo
de cada variable en cada red, posibilit el establecimiento de un conjunto de sitios de
muestreo ptimo bajo estos dos criterios.

74

Figura 27. Redes de muestreo bajo las cuales se hicieron las estimaciones de las varianzas de prediccin de
cada una de las variables consideradas, asumiendo los modelos de semivarianza estimados. Distancias entre
puntos de muestreo: a) 2000 m; b) 3000 m; c) 4000 m; d) 5000 m y e) 6000 m.
Si bien es posible que en la fecha del muestreo se estuviese dando un fenmeno de
intervencin debido a los cambios climatolgicos dados en el ao inmediatamente anterior a
este, para los propsitos del trabajo esto no resulta ser un inconveniente puesto que de hecho
se asume que el establecimiento del conjunto ptimo de puntos de muestreo no depende de
75
la magnitud de la variables sino de la estructura de dependencia espacial presente en la
regin de estudio para cada una de ellas.
Como era de esperarse los errores estndar de prediccin estimados son crecientes en
funcin de la distancia que existe entre los puntos de muestreo (tabla 11). La variable en la
cual se consigue mayor ganancia relativa en precisin al pasar de la red menos densa (Fig.
27 e), a la ms densa (Fig. 27.a) es la salinidad. En dicha variable se consigue aumentar en
un 35 % la precisin (tabla 12). Otras variables como temperatura, oxgeno disuelto, silicatos
y clorofila a tienen aumentos en precisin que oscilan entre 15.9 y 23.8 % (tabla 12). Por
ltimo en las variables profundidad, nitritos, seston total y clorofila "c", slo se consigue
aumentar la precisin en porcentajes que estn entre el 5,7 y el 10.1 % (tabla 12).
Obviamente si se comparan las redes intermedias, redes con distancias entre puntos de
muestreo de 3000, 4000 y 5000 m (Fig. 27.b, 27.c y 27.d), con la red de 6000 m (Fig. 27.e),
resultan mucho menores los incrementos relativos en precisin (tabla 12).
Tabla 11. Error estndar (raz cuadrada de la varianza) de prediccin mxima de cada variable considerada
para redes de muestreo con cuadrculas de 4, 9, 16, 25 y 36 km
2
.
TAMAO DE LA RED
Variables (Distancia entre los puntos de muestreo en metros)
2000 3000 4000 5000 6000
Profundidad (m) 0.2825 0.2874 0.2930 0.3002 0.307
Temperatura (C) 0.6380 0.6690 0.7046 0.7632 0.8373
Salinidad 0.9096 1.0511 1.1676 1.2965 1.4075
Oxgeno disuelto (mg/L) 1.5145 1.5917 1.6752 1.7977 1.9431
Seston total (mg/L) 35.6363 36.4021 37.0459 37.8076 38.5197
Nitritos (umol/L) 0.2832 0.2875 0.2913 0.2958 0.3003
Silicatos (umol/L) 47.6524 50.207 52.3806 54.6797 56.6932
Clorofila a (ug/L) 19.4634 21.2041 22.5233 23.5582 24.2163
Clorofila c (ug/L) 6.1071 6.2977 6.4536 6.6336 6.7967

Tabla 12. Ganancia en precisin en porcentaje (cociente entre los respectivos errores estndar de prediccin)
de cada una de las redes de muestreo (observada y simuladas) en cada variable respecto a la red de 6000 metros
(la menos densa).
TAMAO DE LA RED
Variables (Distancia entre los puntos de muestreo en metros)
2000 3000 4000 5000 6000
Profundidad (m) 8.0 6.4 4.6 2.2 0
Temperatura (C) 23.8 20.1 15.8 8.8 0
Salinidad 35.4 25.3 17.0 7.9 0
Oxgeno disuelto (mg/L) 22.1 18.1 13.8 7.5 0
Seston total (mg/L) 7.5 5.5 3.8 1.8 0
Nitritos (umol/L) 5.7 4.3 3.0 1.5 0
Silicatos (umol/L) 15.9 11.4 7.6 3.6 0
Clorofila a (ug/L) 19.6 12.4 7.0 2.7 0
Clorofila c (ug/L) 10.1 7.3 5.0 2.4 0

76
Figura 28. Costos de muestreo de variables fisicoqumicas y biolgicas en la Cinaga Grande de Santa Marta,
segn diferentes espaciamientos entre sitios de muestreo (se asumen muestreos sistemticos de cuadrculas).
De otro lado si se estudian los costos de muestreo asociados a cada variable bajo cada
una de las densidades muestrales (Fig. 28), se observa que existe considerable diferencia,
con excepcin de las variables temperatura, profundidad y salinidad, entre la red de 2000 m
y las restantes respecto a dichos costos. Para algunas de las variables (oxgeno disuelto,
silicatos y clorofilas) pasar de la red de 3000 m a la 2000 m, implica incrementar el costo de
muestreo de cada una de ellas en ms de $300000
En conclusin para las variables temperatura y salinidad sera mucho ms conveniente
hacer un muestreo intensivo (red ms densa) dado que se consigue, comparando con la red
menos densa, aumentar la eficiencia en porcentajes considerables (23 y 35%,
respectivamente, tabla 12), con costos netos que se incrementan slo alrededor de $100000
(Fig. 28). En la variable profundidad, si bien los costos de muestreo no se incrementan
significativamente (Fig. 28), es ms aconsejable muestrear en la red menos densa dado que
la eficiencia se incrementa en mximo un 7% al compararla con las restantes redes (tabla
12). En las variables nitritos, seston total y clorofilas "a" y "c" hay poco aumento de la
eficiencia al pasar de la red de 6000 m a otras con mayor nmero de puntos (tabla 12) y por
el contrario los costos, especialmente en la red de 2000 m, tienen aumentos considerables,
lo que hace que se planteen las redes menos densas (5000 m y 6000 m entre puntos de
muestreo) como las ms adecuadas para el seguimiento de estas variables. En las restantes
variables (oxgeno disuelto, silicatos y clorofila a) es un poco ms compleja la decisin
dado que se obtienen aumentos considerables en los costos (Fig. 28), pero tambin
incrementos de eficiencia (tabla 12). De todas formas es claro que se debe descartar en este
caso la red con distancias entre puntos de muestreo de 2000 m dado que entre esta y la red de
3000 m, la eficiencia relativa aumenta en un mximo del 8 % (tabla 12) con costos que se
duplican o triplican para algunas variables (Fig. 28).
P
r
o
f
u
n
d
i
d
a
d
T
e
m
p
e
r
a
t
u
r
a
S
a
l
i
n
i
d
a
d
O
x
g
e
n
o

d
i
s
.
S
e
s
t
o
n

t
o
t
a
l
N
i
t
r
i
t
o
s
S
i
l
i
c
a
t
o
s
C
l
o
r
o
f
i
l
a

"
a
"
C
l
o
r
o
f
i
l
a

"
c
"
0
200000
400000
600000
800000
1000000
1200000
C
o
s
t
o

(
$
)
Red 6000
Red 5000
Red 4000
Red 3000
Red 2000
77

Apndice

6.1. Indicador IGC
i
(P).

Suponga que se tiene informacin dicotmica sobre P variables en n sitios de muestreo.
La estructura de esta informacin se presenta a continuacin:

1 0 1 0 1 0 y x n
1 0 1 0 1 0 y x 3
1 0 1 0 1 0 y x 2
1 0 1 0 1 0 y x 1
V V V Y X Sitio
n n
3 3
2 2
1 1
P 2 1
L
M M M M M M M
L
L
L
L

donde X y Y representan las correspondientes coordenadas de ubicacin geogrfica (grados,
planas o cartesianas), V
1
, . . ., V
p
, son P variables que indican la presencia (1) o ausencia (0)
de la caracterstica. Si las variables observadas son cuantitativas se pueden categorizar baja
diversos criterios. Uno de los ms empleados es el de comparacin de cada valor con su
correspondiente mediana muestral.
La informacin referente a tales variables puede presentarse en una matriz de la siguiente
estructura:

,
nP 2 n 1 n
P 2 22 21
P 1 12 11
|
|
|
|
|
\
|

L
M M M M
L
L
=
caso otro en 0
cin dicotomiza de criterio el
cumple i sitio el en j variable la Si
1
ij

Se define el indicador del nmero de "xitos" por sitio como:

=
P
1 j
i ij

,
n , , 1 i , i L =

y el indicador del nmero de "exitos" par la variable j como:
=
n
1 j
j ij
, P , , 2 , 1 j , j L =
78
Adems sea:
=
=
= =
=
0 Si P
1 Si j
donde , K
ij i
ij
ij
P
1 j
ij i

El indicador IGC
i
(P) en el sitio i-simo se calcula como:

( ) ( ) ( )

+ + =
i i i i
, P h K 2 P P P IGC
donde:

( )
( )
= =
=
=
=

P , , 3 , 2 y 2 m Si P b a
1 Si 0
0 Si P 2
, P h
i i m m
i
i
i
L

con :
( ) m m a a
0 a
2
1 m m
0
+ + =
=
, L , 2 , 1 m =

y
( ) 1 m b b
1 b
1 m m
0
+ =
=
, L , 2 , 1 m =

En la tabla 13 se presentan los valores los valores de
m
a ,
m
b y ( )
. i
, p h necesarios para el
clculo de la variable IGC
i
(P) cuando el nmero de presencias de especies est entre 2 y 15.

Tabla 13. Valores de
m
a y
m
b en la ecuacin 6 para
i
= 2, 3, . . ., 15. P es el nmero de variables de tipo
presencia - ausencia consideradas.
i

m m
a
m
b ( ) P b a
m m

2 0 0 -1
p
3 1 2 -1
( ) p 2 +
4 2 8 0 8
5 3 20 2
( ) p 2 20
6 4 40 5
( ) p 5 40
7 5 70 9
( ) p 9 70
8 6 112 14
( ) p 14 112
9 7 168 20
( ) p 20 168
10 8 240 27
( ) p 27 240
11 9 330 35
( ) p 35 330
12 10 440 44
( ) p 44 440
13 11 572 54
( ) p 54 572
14 12 728 65
( ) p 65 728
15 13 910 77
( ) p 77 910

79
Para ilustrar el clculo de la variable IGC(P), se presenta en la tabla 14 el caso particular de
P = 4. Se utilizan todos los posibles arreglos de ceros y unos que se pueden formar con 4
datos.

Tabla 14. Clculo de los valores de la variable IGC
i
(4) con todos los posibles arreglos formados con 4
smbolos de dos tipos (ceros y unos).
ARREGLO 1 i

2 i

3 i

4 i

i

1 i

2 i

3 i

4 i

i
K ) 2 P ( P
i
) P ( IGC
1 0 0 0 0 0 -4 -4 -4 -4 -16 8 0
2 1 0 0 0 1 1 -3 -3 -3 -8 8 1
3 0 1 0 0 1 -3 2 -3 -3 -7 8 2
4 0 0 1 0 1 -3 -3 3 -3 -6 8 3
5 0 0 0 1 1 -3 -3 -3 4 -5 8 4
6 1 1 0 0 2 1 2 -2 -2 -1 8 5
7 1 0 1 0 2 1 -2 3 -2 0 8 6
8 0 1 1 0 2 -2 2 3 -2 1 8 7
9 1 0 0 1 2 1 -2 -2 4 1 8 7
10 0 1 0 1 2 -2 2 -2 4 2 8 8
11 0 0 1 1 2 -2 -2 3 4 3 8 9
12 1 1 1 0 3 1 2 3 -1 5 8 10
13 1 1 0 1 3 1 2 -1 4 6 8 11
14 1 0 1 1 3 1 -1 3 4 7 8 12
15 0 1 1 1 3 -1 2 3 4 8 8 13
16 1 1 1 1 4 1 2 3 4 10 8 14

Se observa en la tabla anterior que el IGC
i
(4) es una variable discreta montona
creciente con valores entre 0 y 14. Para este caso los valores del indicador definen
puntualmente, excepto cuando el IGC
i
(4) igual a 7, lo ocurrido respecto al nmero de unos y
a la posicin de los mismos dentro de las sucesiones. Valores del IGC
i
(4) entre 1 y 4 indican
que hubo un solo uno en la sucesin y cada nmero revela la posicin que ste ocupa en la
misma. Valores entre 5 y 9 corresponden a sucesiones en las que hubo dos unos, con IGC
i
(4)
igual a 5 cuando los dos unos estn en las primeras dos posiciones de las sucesin ordenada
y a 9 cuando estn en las dos ltimas. Los valores 6, 7 y 8 reflejan la transicin de las dos
primeras a las dos ltimas posiciones. Valores entre 10 y 13 indican que hubo tres unos y
cada uno de estos valores corresponde a una nica sucesin. El valor del IGC
i
(4) ser 10
cuando los unos estn en las tres primeras posiciones e igual a 13 cuando estn en las tres
ultimas. Los valores 0 y 14 se obtendrn cuando en la sucesin no haya unos o todos los
valores sean iguales a uno, respectivamente.

6.2. lgebra de Matrices.

La gran mayora de mtodos estadsticos, incluyendo la geoestadstica, pueden ser
tratados de forma mucho ms sencilla a travs del uso del lgebra de matrices. Por sta razn
es til, si no esencial, tener un cierto conocimiento mnimo de sta rea de las matemticas.
Lo anterior es cierto siempre y cuando el inters sea usar los mtodos como una herramienta.
La notacin del lgebra matricial algunas veces puede resultar desanimante. Sin embargo, no
es difcil entender sus principios bsicos.
80

6.2.1. Matriz
Una matriz A de tamao (mxn) es un arreglo rectangular de m filas con n columnas.
A
a a a
a a a
a a a
n
n
m m mn
=
|
\
|
|
|
|
|
|
|
11 12 1
21 22 2
1 2
. . .
. . .
. . .
. . .
. . .
. . .

6.2.2. Suma y Producto de Matrices
El procesos aritmtico de adicin, sustraccin, multiplicacin y divisin tiene sus contraparte
con matrices. Si A y D son dos matrices de orden 3x2, entonces su suma se define como:
A D
a a
a a
a a
d d
d d
d d
a d a d
a d a d
a d a d
+ =
|
\
|
|
|
+
|
\
|
|
|
=
+ +
+ +
+ +
|
\
|
|
|
11 12
21 22
31 32
11 12
21 22
32 23
11 11 12 12
21 21 22 22
31 31 32 32

En el caso de la multiplicacin se debe cumplir que el nmero de columnas de la primera
matriz sea igual ala nmero de filas de la segunda.
A B
a a
a a
a a
b b b
b b b
a b a b a b
a b a b a b
a b a b a b
i i i i i i
i i i i i i
i i i i i i
=
|
\
|
|
|

|
\
| =
|
\
|
|
|

11 12
21 22
31 32
11 12 13
21 22 23
1 1 1 2 1 3
2 1 2 2 2 3
3 1 3 2 3 32

6.2.3. Inversa y Determinante de una Matriz.
Si k es un nmero, es cierto que k x k
-1
= 1. De forma similar si A es una matriz
cuadrada (nmero de filas igual al nmero de columnas) su inversa es A
-1
, donde AA
-1
=
A
1
A = I, con I igual a la matriz idntica (matriz de unos en la diagonal y cero por fuera de
ella). Un ejemplo de matriz inversa es:

2 1
1 2
2 3 1 3
1 3 2 3
1
|
\
| =
|
\
/ /
/ /

Esto puede comprobarse observando que:

2 1
1 2
2 3 1 3
1 3 2 3
1 0
0 1
|
\
|
\
| =
|
\
|
/ /
/ /

81
la inversa de una matriz 2x2, si existe, puede determinarse fcilmente por medio del
siguiente clculo:

a a
a a
a a
a a
11 12
21 22
1
22 12
21 11
|
\
| =
|
\
|
|

Donde = a
11
a
22
- a
12
a
21.
La cantidad es llamada el determinante de la matriz. Claramente
la inversa no est definida si el determinante es igual a cero. Con matrices grandes el clculo
de la inversa es tedioso y se debe usar un programa de computo para realizarlo.
6.2.4. Valores y Vectores Propios.
Dada una matriz A de orden (n x n), si existe un vector x (n x 1) y un nmero tal que
Ax = x. (A - I)x = 0

donde I es la matriz idntica de orden (n x n) y 0 es un vector (n x 1), entonces se llama a
y x, respectivamente, valor y vector propio de la matriz A. Pueden encontrarse hasta n
valores propios y hay tantos vectores propios como valores propios se encuentren. Los
valores de deben satisfacer que el determinante de A - I = 0. Los vectores propios se
calculan despus de reemplazar los valores propios encontrados en la expresin Ax = x. Al
igual que con la inversa, para matrices grandes se debe emplear un software especializado
para su obtencin. A continuacin, a manera de ilustracin, se realiza el clculo de los
vectores y valores propios de una matriz de orden 2 x 2.
Sea A =
|
\
|
6 3
3 4
, entonces
A I =
|
\
|
|
\
| = 0
6 3
3 4
1 0
0 1
0

6 3
3 4
0
0
0
|
\
|
|
\
| =

( )
( )
6 3
3 4
0

( )( ) 6 4 9 0
10 15 0
2
=
+ =

=
b b ac
a
2
4
2

82

=

=

= =
( ) ( )
. , .
10 100 4 15
2
10 40
2
81623 18377

Para cada valor propio existe un vector propio, el cual se obtiene reemplazando el valor
propio correspondiente en la primera expresin de la pgina anterior y usando la condicin
de que los respectivos vectores propios estn normalizados.
Un vector x
x
x
=
|
\
|
1
2
se dice que est normalizado si satisface que x x
1
2
2
2
1 + = .
Teniendo en cuenta lo anterior se calculan los vectores propios de la siguiente forma:
(A - I)x = 0

( )
( )
6 3
3 4
0
0
1
2
|
\
|
|
\
| =
|
\
x
x

( )
( )
6 3 0
3 4 0
1 2
1 2
+ =
+ =
x x
x x

Restando las dos ecuaciones anteriores y factorizando, obtenemos:

x x
x x
1 2
1 2
6 3 3 4 0
3 1 0
( ) ( )
( ) ( )
+ + =
+ + =

x
x
1
2
1
3
=

( )
( )

Entonces para = 8.1623 y = 1.8377 se tiene respectivamente:
x
1
= 1.3847x
2
y x
1
= -0.7207x
2
. Ahora utilizando la restriccin de que los vectores
estn normalizados se obtiene:

( )
( )
( )
( )
( )
x x
x x
x
x x
1
2 2
1
2
1
2 2
1
2 2
1
2 2 2
1
2
2
2
1
2
13847 1
13847 13847
1 13847 13847
13847
1 13847
13847
1 13847
08107
=
+ =
+ =
=
+
=
+
=
.
( . ) ( . )
. ( . )
( . )
.
.
.
.

Reemplazando el valor de x
1
, obtenemos que x
x
2
1
13847
08107
13847
05855 = = =
.
.
.
. .
83
Luego el vector propio asociado al valor propio = 8.1623 es
x
x
1
2
08107
05855
|
\
| =
|
\
|
.
.

Efectuando un procedimiento similar se puede comprobar que el vector propio asociado al
valor propio = 1.8377 es
x
x
1
2
05847
08113
|
\
| =
|
\
|
.
.

En resumen dada la matriz del ejemplo entonces se puede comprobar que:

6 3
3 4
81623 0
0 81623
08107
05855
0
0
|
\
|
|
\
(
|
\
| =
|
\
|
.
.
.
.

y, con el segundo valor y vector propio, que

6 3
3 4
18377 0
0 18377
05847
08113
0
0
|
\
|
|
\
(
|
\
| =
|
\
|
.
.
.
.

6.3. Conceptos de Probabilidad

A continuacin se presenta una revisin no exhaustiva y a manera introductoria de conceptos
bsicos de la teora de probabilidades. Un estudio profundo y formal de estos se puede hacer
en Mood et al (1963) .

6.3.1. Variable Aleatoria

Si X es una funcin que le asigna a cada uno de los resultados de un experimento aleatorio
(aquel cuya respuesta no puede ser establecida de antemano) un nmero real, entonces X se
llama una Variable Aleatoria. Estas pueden ser discretas o continuas.

6.3.2. Funcin de Probabilidad

Si X es una variable aleatoria discreta. Se llamar a f(x) = P (X = x) funcin de probabilidad
de la variable aleatoria X, si satisface las siguientes propiedades:

i. ( )
X
R x 0 x f
ii. ( ) 1 x f
x
=
.

Si existe una funcin f(x) tal que:

i. ( ) < < x , 0 x f
ii. ( )

= 1 dx x f
iii. ( ) ( )dx x f b X a P
b
a
= < para cualquier a y b, entonces f(x) es la funcin de densidad de

probabilidad de la variable aleatoria continua X.

84
La funcin de probabilidad acumulada, notada como F(x), es igual a ( ) x X P y se evala a
travs de una sumatoria o de una integral dependiendo de si X es discreta o continua.

6.3.2.1. Valor Esperado y Varianza

Si X es una variable aleatoria, el valor esperado de una funcin de la variable aleatoria X,
( ) X g est dado por:

( ) ( )
( ) ( )
( ) ( )

continua X dx x f x g
discreta X x f x g
X g E
x

como caso particular,

( )
( )
( )
= =

continua X dx x xf
discreta X x xf
X E
x

La varianza de la variable aleatoria X est definida como:

( )
( ) ( )
( ) ( )
= = =

continua X dx x f x
discreta X x f x
X E ) X ( V
2
x
2
2 2

La raz cuadrada de la varianza se denomina desviacin estndar y se denota por .

Se cumple que:

1. ( ) ( ) X aE aX E = , con a constante
2. ( ) ( ) b X aE b aX E + = + , con a y b constantes
3. ( ) ( ) X V a aX V
2
= y a constante
4. ( ) ( ) ( ) [ ]
2 2
X E X E X V =

6.3.2.2. Funcin de Probabilidad Binomial y Normal.

Modelo Binomial
Suponga que hay un experimento que consiste en examinar n individuos y evaluar o medir
en cada uno de ellos si tienen o no una caracterstica dada (slo hay dos posibles
resultados).Sea p la probabilidad de xito y q = 1-p la de fracaso en cada uno de los n
ensayos. Se asume que esta probabilidad es constante en cada uno de ellos.
85
Sea X = Nmero de xitos en los n ensayos, entonces asumiendo conocido p entonces es
posible establecer las probabilidades de ocurrencia de cada evento mediante la siguiente
ecuacin, denominada modelo de probabilidad binomial:
n ., . . 2, 1, , 0 ) 1 ( ) ( =
|
|
\
|
= =

x p p
x
n
x X P
x n x

En este modelo:
) 1 ( ) (
) (
2
p np X V
np X E
= =
= =

Modelo Normal

El modelo de probabilidad normal (Gaussiano) es til para encontrar las probabilidades
asociadas a eventos de variables aleatorias cuyas distribuciones de frecuencias son simtricas
alrededor del valor promedio. Algunos ejemplos de este tipo de variables aleatorias son los
siguientes:
Sea el valor promedio de la variable (E(X)) y
2
su correspondiente varianza (V(X)), entonces
las probabilidades de ocurrencia de eventos asociados a los posibles resultados de la variable
estudiada pueden ser encontrados usando la siguiente expresin, llamada modelo de
probabilidad normal:
( ) dx e
2
1
b X a P
2
b
a
x
2 / 1
\
|

.
Obviamente resultara muy dispendioso tener que calcular estas integrales para cada valor de
a, b, y . Por esta razn se acude a un procedimiento llamado estandarizacin, el cul
consiste en hacer la transformacin

=
X
Z
. La variable anterior tendr (si la distribucin
de frecuencias de X se ajusta a un modelo de probabilidad normal con media y varianza
2
) una distribucin de frecuencias que se ajusta a un modelo de probabilidad normal con
media cero y varianza uno, es decir que:
( )
2 2
1
z
2
1 z
z
2 1
e
2
1
z Z z
b
Z
a
) b X a ( P
= < < =
|
|
\
|
|
\
|
|
\
|
=

La ecuacin anterior tambin puede resultar difcil de evaluar, sin embargo para cualquier
valor de a, b, y las correspondientes probabilidades pueden hallarse, sin necesidad de
resolver la integral, empleando la tabla de distribucin acumulada normal estndar que
aparece en los textos de estadstica.

6.3.3. Funcin de Probabilidad Bivariada.

Si X y Y son dos variables aleatorias discretas. La probabilidad de X = x y Y = y est
determinada por la funcin de probabilidad bivariada ( ) [ ] y Y , x X P y , x f = = = donde :

i. ( )
Y X
R , R y , x , 0 y , x f
ii. ( ) 1 y , x f
x y
=

86
Si existe una funcin ( ) y , x f tal que la probabilidad conjunta:

[ ] ( )dydx y , x f d Y c , b X a P
b
a
d
c

= < < < <
para cualquier valor de a, b, c y d en donde ( ) 0 y , x f , < < y , x y ( ) 1 dydx y , x f =

,
entonces ( ) y , x f es la funcin de probabilidad bivariada de X y Y.

La funcin de probabilidad acumulada ( ) y , x F es igual a [ ] y Y , x X P y se evala a travs de
una doble sumatoria o de una doble integral dependiendo de si las variables aleatorias son
discretas o continuas, respectivamente.

6.3.3.1. Funcin de Probabilidad Marginal

Si X y Y son dos variables aleatorias con funcin de probabilidad conjunta ( ) y , x f . Las
funciones de probabilidad marginales de Y y Y estn dadas por

( ) ( )
( ) ( )
=
=
x
y
y , x f y f
y , x f x f
si X y Y son variables aleatorias discretas

por

( ) ( )
( ) ( )

=
=
ydx , x f y f
dy y , x f x f
si X y Y son variables aleatorias continuas

6.3.3.2. Funcin de Probabilidad Condicional

Sean X y Y dos variables aleatorias con funcin de densidad conjunta ( ) y , x f . La funcin de
probabilidad condicional de la variable aleatoria X, denotada por ( ) y / x f , para un valor fijo y
de Y, est definida por:

( )
( )
( ) y f
y , x f
y / x f = , donde ( ) y f es la funcin de probabilidad marginal de Y de manera tal que
( ) 0 y f > .

De manera anloga, la funcin de probabilidad condicional de Y para un valor fijo x de X se
define como:

87
( )
( )
( ) x f
y , x f
x / y f = , donde ( ) x f es la funcin de probabilidad marginal de X de manera tal que
( ) 0 x f > .

6.3.3.3. Independencia Estadstica.

Sean X y Y dos variables aleatorias con funcin de densidad conjunta ( ) y , x f . X y Y son
independientes si y slo si:

( ) ( ) ( ) y f x f y , x f =

donde ( ) x f y ( ) y f son las funciones de probabilidad marginales.

6.3.3.4. Valor Esperado, Varianza y Covarianza
Sean X y Y dos variables aleatorias que se distribuyen conjuntamente. El valor esperado de
una funcin de X y Y, ( ) y , x g , se define como:

( ) ( )
( ) ( )
( ) ( )

continuas son Y y X si dydx y , x f y , x g
discretas son Y y X si y , x f y , x g
Y , X g E
x y

La covarianza entre X y Y, denotada por Cov (X, Y), se define como:
( )( ) [ ] ( ) ( ) ( ) ( ) Y E X E XY E Y X XY E Y X E
Y X X Y Y X
= + =
donde
X
y
Y
representan los valores esperados de X y Y respectivamente.
Si la covarianza de X y Y se divide por el producto de las desviaciones estndar de X y Y,
el resultado es una cantidad sin dimensiones que recibe el nombre de coeficiente de
correlacin y se denota por ( ) Y , X .
( )
( )
Y X
Y , X Cov
Y , X

=

6.3.3.4.1. Propiedades del Valor Esperado y la Varianza.

Si X y Y son dos variables aleatorias con densidad conjunta, entonces se cumple que:

1. ( ) ( ) ( ) Y E X E Y X E + = +
2. ( ) ( ) ( ) ( ) Y , X Cov 2 Y V X V Y X V + =
88
3. ( )

= = =
=
|
|
\
|
n
1 i
n
1 j
j i j i
n
1 i
i i
X , X Cov a a X a V .
Observacin: ( ) ( )
i j j i
X , X Cov X , X Cov = y ( ) ( )
i i i
X V X , X Cov =
Como caso particular:
( ) ( ) ( ) ( )
2 1 2
2
2 1
2
1 2 2 1 1
X , X Cov 2 X V a X V a X a X a V + =
3. Si ( ) ( ) Y E X E = , entonces ( ) [ ] ( ) ( ) ( ) Y , X Cov Y V
2
1
X V
2
1
Y X E
2
1
2
+ = .
6.4. Algunos Mtodos Estadsticos.
6.4.1. Regresin Simple
En el modelo de regresin simple se establece una relacin lineal entre la esperanza
condicional de una variable aleatoria Y dados unos valores fijos de una variable X.
Modelo Poblacional
i i 1 0 i
x Y + + =

( )
i 1 0 i i
x Y
X / Y E + = =

Y
i
: i-simo valor de la variable respuesta o dependiente en la poblacin
x
i
:i-simo valor de la variable predictora o independiente en la poblacin
1 0
y son parmetros poblacionales que representan el intercepto y la pendiente,
respectivamente
i
: i-simo error aleatorio en la poblacin.

Supuestos del Modelo.

1. ( ) 0 E
i
=
2. ( )
2
i
V =
3.
( ) 0 , Cov
j i
=
4.
i
( )
2
, 0 N

Modelo Muestral

i i i
i i 1 0 i
e y y
e x

y
+ =
+ + =

y
i
: i-simo valor de la variable respuesta en la muestra
x
i
: i-simo valor de la variable predictora .
89
1 0

son las estimaciones de los parmetros con base en la informacin muestral.
e
i
: i-simo erro muestral.

Estimacin de
1 0
y

Uno de los mtodos de estimacin de los parmetros es el de mnimos cuadrados, que
consiste en encontrar los estimadores que hacen mnima la suma de cuadrados de los errores,
es decir aquellos valores que hacen ms pequea ( )

= =
=
n
1 i
n
1 i
2
i i
2
i
Y
Y .

( ) ( )

= = =
= =
n
1 i
n
1 i
2
i 1 0 i
2
i i
n
1 i
2
i
x Y Y
Y . Derivando e igualando a cero se obtiene:

( )
=
=
=
n
1 i
i 1 0 i
0
n
1 i
2
i
x Y 2
= 0 y ( )
=
=
=
n
1 i
i 1 0 i i
1
n
1 i
2
i
x Y X 2
= 0.

Al simplificar las dos ecuaciones anteriores y distribuir las sumas se tiene:

= =
+ =
n
1 i
n
1 i
i 1 0 i
x n Y

= = =
+ =
n
1 i
n
1 i
n
1 i
2
i 1 i 0 i i
x x Y x

Las dos ecuaciones anteriores se conocen como ecuaciones normales. Dadas las
realizaciones
n , 2 1
y , y , y K las ecuaciones pueden resolverse para encontrar los estimados de
los parmetros:

x
x

y
x

n y
1 0
1 0
n
1 i
n
1 i
i 1 0 i

=
+ =
+ =

= =

( )

= = =
+ =
n
1 i
n
1 i
n
1 i
2
i 1 i 1 i i
x
x x
y y x

= = =
= =
+
|
|
|
|
|
\
|
|
|
|
|
|
\
|
=
n
1 i
n
1 i
n
1 i
2
i 1 i
n
1 i
i
1
n
1 i
i
i i
x
x
n
x
n
y
y x

90

= =
= = =
+
|
|
\
|
=
n
1 i
n
1 i
2
i 1
2
n
1 i
i
1
n
1 i
i
n
1 i
i
i i
x
n
x
n
x y
y x

( )( )
( )

=
=
=
=
=
= =

=
|
|
\
|
=
n
1 i
2
i
n
1 i
i i
n
1 i
2
n
1 i
i
2
1 i
n
1 i
n
1 i
i i
i i
1
x x
y y x x
n
x
x
n
x y
y x
i

Se puede demostrar que los errores estndar estimados de los estimadores de los parmetros
corresponden a:
( )
( )
=
n
1 i
2
i
1
x x
s
s y ( )
( )
|
|
|
|
|
|
\
|
=
=
n
1 i
2
i
n
1 i
2
i
0
x x n
x
s
s , con
2 n
e
s
n
1 i
2
i
=

6.4.2. Anlisis de Componentes Principales.
El anlisis de componentes principales es uno de los mtodos multivariados ms
difundidos, que permite la estructuracin de un conjunto de datos de mltiples variables de
una poblacin, cuya distribucin de probabilidades no necesita ser conocida (Lebart et al.,
1995).
Se trata de una tcnica matemtica que no requiere un modelo estadstico para explicar
la estructura probabilstica de los errores. Sin embargo, si es posible suponer que la
poblacin muestreada tiene una distribucin conjunta normal multivariada, podr estudiarse
la significacin estadstica de los componentes y ser posible utilizar la muestra
efectivamente observada para efectuar pruebas de hiptesis, que contribuyan a conocer la
estructura de la poblacin original, con un cierto grado de confiabilidad, fijado a priori o a
posteriori (Pla, 1986).
Los objetivos ms importantes del anlisis de componentes principales son:
i. Generar nuevas variables que puedan expresar la informacin contenida en el grupo
original de datos.
ii. Reducir la dimensionalidad del problema que se est estudiando, como paso previo para
futuros anlisis.
iii. Eliminar, cuando sea posible, algunas variables originales, en el caso de que aporten poca
informacin.
Este anlisis se basa en una transformacin lineal de las observaciones originales. Esta
transformacin es conocida en el campo del lgebra vectorial como generacin de vectores y
valores propios. Las nuevas variables generadas se llaman componentes principales y poseen
algunas caractersticas estadsticas deseables, tales como la independencia (cuando se asume
la multinormalidad) y en todos los casos la no correlacin. Esto significa que si las variables
originales no estn correlacionadas, los componentes principales no ofrecen ventaja alguna.

91
Generacin de los Componentes Principales

Se ha dicho que los componentes principales tienen ciertas caractersticas que son
deseables:
a) Los componentes principales no estn correlacionados.
b) Cada componente principal sintetiza la mxima variabilidad residual contenida en los
datos. Es decir, el primer componente sintetiza la mxima variabilidad posible en el
conjunto de datos originales; el segundo componente sintetiza la mxima variabilidad
restante, sujeta a la condicin de no correlacin con el primer componente, y as hasta el
p-simo componentes.
c) Cada componente contiene informacin de todas las variables pero en diferentes
proporciones.
Matricialmente se expresa la generacin de los componentes a travs de:
( ) ( ) ( ) ( )
1
=
pxp pxp nxp nxp
D L X Y
donde :
Y: Matriz cuyas columnas representan las nuevas variables (componentes principales).
Estas tienen la propiedad de ser no correlacionadas.
X: Matriz de datos originales
L: Matriz de vectores propios de: a) X
T
X, si X es la matriz de datos originales; b) S (matriz
de varianzas y covarianzas) si X es centrada; c) R (matriz de correlacin) si X est
estandarizada.
D: Matriz diagonal con valores en la diagonal iguales a la raiz cuadrada de los valores
propios de X
T
X , S o R.
La transformacin lineal para generar los componentes principales (matriz Y) se fundamenta
en el proceso de diagonalizacin de una matriz, X
T
X , S o R., segn el caso, a travs del
teorema de descomposicin del valor singular
92

Referencias

Anderson, T. W. 1984. An Introduction to Multivariate Statistical Analysis.
John Wiley & Sons, New York.
Biau, G., E. Zorita, H. von Storch & H. Wackernagel. 1997. Estimation of
precipitation by kriging in EOF space. GKSS, 97, E45.
Box, G. E. P. y G.M. Jenkins. (1976). Time Series Analysis Forecasting and
Control. Holden -Day, San Francisco.
Bogaert, P., P. Mahau & F. Beckers. 1995. The Spatial Interpolation of
Agroclimatic Data. Cokriging Software and Source Code. FAO, Rome.
Bula-Meyer, G. 1985. Un nuevo ncleo de surgencia en el Caribe colombiano
detectado en correlacin con las macroalgas. Bol. Ectrpica 12:3-25.
Carr, J. , D. Myers y Ch. Glass. 1985. Cokriging - A Computer Program.
Computers & Geosciences. 11(2), 111-127.
Clark, I. 1979. Practical Geostatistics. Elsevier Publishing, New York.
Cressie, N. 1989. Geostatistics. The American Statistician. 43(4): 611(23).
Cressie, N. 1993. Statistical for Spatial Data. John Wiley & Sons, New York.
Cressie, N. & M. M. Majure. 1995. Non-Point Source Pollution of Surface Waters
over a Watershed. Programme Abstracts of the third SPRUCE International
Conference. Merida, Mexico.
Day, J., C. Hall, M. Kemp, & A. Ynez-Arancibia. 1989. Estuarine Ecology. John
Wiley & sons, New York.
Deutsch , C. V. & A. G. Journel. 1992. GSLIB: Geostatistical Software Library
and Users Guide. Oxford University Press, New York.
Daz- Francs, E. (1993). Introduccin a Conceptos Bsicos de Geoestadstica.
Memorias Seminario Estadstica y Medio Ambiente. Centro de Investigacin
en Matemticas, CIMAT. Guanajuato, Mxico.
Diggle, P., L. Harper y S. Simon. (1995). Geoestatistical Analysis of Residual
Contamination from Nuclear Weapons Testing. Programme Abstracts of the
third SPRUCE International Conference. Merida, Mexico.
Englund, E. & A. Sparks. 1988. GeoEAS, Users Guide. EPA, Las Vegas.
Evangelos A. & G. T. Flatman. 1988. On Sampling Nonstationary Spatial
Autocorrelated Data. Computers and Geosciences. 14(5): 667(86).
Gamma Design. 1995. GS+. Geostatistical software for the Agronomic and
Biological Science, version 2.3. Plainwell, Michigan.
Garmin International, Inc. 1993. Garmin Communication and Navigation. GPS
100 SRVY II personal surveyor. Owners manual. Lenexa..
Giraldo, R., D. Ospna & N. Mndez. 2001. Design of a Sampling Network for an
Estuary in the Colombian Caribbean. Rev. Acad. Col. Cienc. 25(97):509-518
Giraldo, R. 2002. Construccin de un Indicador para el Estudio Conjunto de la
Distribucin Espacial de Mltiples Variables Binarias. Tesis de Maestra en
93
Estadstica. Departamento de Estadstica. Universidad Nacional de
Colombia, Bogot.
Giraldo, R. 1996. Geoestadstica Aplicada a Datos Multivariados Provenientes
del Monitoreo de las Aguas de la Cinaga Grande de Santa Marta y el
Complejo Pajarales, Caribe Colombiano. tesis de grado Especializacin en
Estadstica. Universidad Nacional de Colombia..
Giraldo, R., J. Martnez, L. H. Hurtado, S. Zea & R. Madera. 1995. Anlisis de
Clasificacin de Series Temporales: El Caso de la Salinidad en la Cinaga
Grande de Santa Marta, Colombia. An. Inst. Invest. Mar. Punta Betn 24:
123-134.
Hernndez, C.A. & K. Gocke. 1990. Productividad Primaria en la Cinaga
Grande de Santa Marta, Colombia. An. Inst. Invest. Mar. Punta Betn 19
- 20 : 101 - 119
Hoaglin, D. F., F. Mosteller & J. Tukey. 1983. Understanding Robust and
Exploraory Data Anlisis. John Willey & Sons, New York.
IGAC, 1973. Monografa del Departamento del Magdalena. Inst. Geogr. Agustn
Codazzi, Bogot.
Isaaks, E. & R. M. Srivastava. 1989. Applied Geostatistics. Oxford University
Press, New York.
Jay, D.A., R.J. Uncles, J. Largier, W.R. Geyer, J.Vallino & W.R. Boynton. 1997. A Review
of Recent Developments in Estuarine Scalar Flux Estimation. Estuaries. 20(2): 262-
280.
Journel, A.G. y Ch. J. Huijbregts. 1978. Mining Geostatistics, Academics Press,
New York.
Krige, D. G. 1951. A Statistical Approoach to Some Basic Mine Valuation
Problems on the Witwatersrand. Journal of the Chemical, Metallurgical and
Mining Society of South Africa, 52: 119-139.
Lebart, L. A., A. Morineau & M. Piron. 1995. Statistique Exploratoire
Multidimenssionnelle. Dunod, Paris
Mancera, J. E. 1990. Caracterizacin Ecolgica de la Salina Artificial Pozos
Colorados, Caribe colombiano. An. Inst. Invest. Mar. Punta Betn 19-20 :
121 - 138.
Mancera, J. E. & L. A. Vidal. 1994. Florecimiento de microalgas relacionado con
mortandad masiva de peces en el complejo lagunar Cinaga Grande de
Santa Marta, Caribe colombiano. An. Inst. Invest. Mar. Punta Betn 23:
103 - 117.
Matheron, G. 1962. Traite de Geostatistique Apliquee, Tome I. Memoires bureau
de Recherches Geologiques et Minieres, N 24. Editions Bureau de Recherche
et Minieres, Paris.
McBratney, A. B., Webster, R. and Burgess, T. M. 1981. The Design of Optimal
Sampling Schemes for Local Estimation and Mapping of Regionalized
Variables I, Computers and Geosciences. 7(4): 331-334
Mood, A., F. A. Graybill & D. C. Boes. 1974. Introduction to the Theory of
Statistics. McGraw-Hill, New York.
Myers, D. E. 1987. Optimization of Sampling Locations for Variogram
Calculations. Water Resources Research. 23(3): 283(93).
94
Nixon, S.W. 1997. Prehistoric Nutrient Inputs and Productivity in
Narrangansett Bay. Estuaries. 20(2): 253-261
Petitgas, P. 1996. Geostatistics and Their Applications to Fisheries Survey Data
5: 114-142. In: B. A. Megrey & E. Mosknes, (E). Computers and Fisheries
Research. Chapman-Hall, Londres.
Pla, L.1986. Anlisis Multivariado: Mtodo de Componentes Principales.
Monografa No 27. Serie de matemtica. Secretara General de la OEA.
Reid, G. K. & R. D. Wood. 1976. Ecology of Inland Waters and Estuaries. Second
edition. D. Van Nostrand, New York
Roldn, G. 1992. Fundamentos de Limnologa Neotropical. Editorial
Universidad de Antioquia, Medelln.
Robertson, G. P. 1987. Geostatistics in Ecology: Interpolating with Know
Variance. Ecology 68(3) : 744-748.
Samper, F.J. & J. Carrera 1990. Geoestadstica. Aplicaciones a la Hidrogeologa
Subterrnea. Centro Internacional de Mtodos Numricos en Ingeniera.
Universitat Politcnica de Catalunya. Barcelona.
Snchez, C. 1996. Variacin Espacial y Temporal de la Ictiofauna de la Cinaga
Grande de Santa Marta, Complejo de Pajarales y Cinagas delCostado
Occidental de la Isla de Salamanca, Caribe colombiano. Tesis Biologa.
Fac. Cienc. Depto. Biol. Univ. Nacional de Colombia, Santaf de Bogot.
Vidal, L.A. 1995. Estudio del Fitoplancton en el Sistema Lagunar Estuarino
Tropical Cinaga Grande de Santa Marta, Colombia, durante el ao 1987.
tesis de grado M. Sc. Universidad Nacional de Colombia, 270 pp.
Wackernagel. H. 1995. Multivariate Geostatistics. An Introduction with
Applications. Springer-Verlag, Berln.
Warrick, A. W., D. E. Myers & D. R. Nielsen. 1986. Geostatistical Methods
Applied to Soil Science. Methods of Soil Analysis. Part 1. Physical and
Mineralogical Methods- Agronomy Monograph 9: 53 - 81.
Wheaton, F.W. 1977. Aquacultural Engineering. Krieger Publishing Company.
Malabar, Florida.
Welch, E. B. 1992. Ecological Effects of Wastewater. Applied Limnology and
Pollutant Effects. (second edition). Chapman & Hall, Londres.
Wiedemann, H. V. 1973. Reconnaissance of the C.G.S.M., Colombia: Physical
Parameters and Geologid history. Milt. Inst. Colombo-Aleman Inv.
Cientif. 7: 85-119.

Libro - de - Geoestadistica-R Giraldo

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Libro - de - Geoestadistica-R Giraldo

Uploaded by

Copyright:

Available Formats

INTRODUCCION A LA

180 . 2 188 . 0 141 . 0 118 . 0 139 . 0 156 . 0 121 . 0 136 . 0

= < para cualquier a y b, entonces f(x) es la funcin de densidad de

Y . Derivando e igualando a cero se obtiene:

You might also like