You are on page 1of 7

CURSO DE METODOS MATEMATICOS EN LAS

CIENCIAS GEOGRAFICAS.

Profesor; Dr. Julio Iván González Piedra


Universidad de La Habana, CUBA.

Encuentro 2

Tema II. Métodos de Agrupamiento y/o Clasificación. Introducción. Criterios de


homogeneidad (Student, Kolmogorov – Smirnov). Método de Indicador de
Heterogeneidad (Chi – Cuadrado). Método de ponderación de valores. Método de
Distancia. Uso de software.

Desarrollo de contenido.

METODOS MATEMATICOS CON FINES DE AGRUPAMIENTO,


CLASIFICACION Y/O REGIONALIZACION.

Introducción.

Uno de los problemas más complejos de las Geociencias es la Clasificación y


Regionalización. Estos dos aspectos están muy interrelacionados. La Clasificación
puede considerarse como la investigación indispensable o necesaria para resolver tareas
de regionalización. Nuevos métodos de clasificación y regionalización han surgido en
relación a los datos reales existentes.

Independientemente del método de investigación que se aplique, los objetivos y tareas


de la Clasificación y Regionalización pueden ser diferentes. Ante todo, y sobre la base
de los datos obtenibles, se logran definir diferencias entre partes de un territorio,
utilizando las correspondientes unidades taxonómicas.

Para la diferenciación objetiva de regiones y grupos de clasificación, se usa muy


comúnmente aquellos métodos matemáticos que tienen como principio contar con
indicadores de similitud o diferencia (Criterio de Student, Chi-cuadrado, Análisis de
Clusters, Método de ponderación de valores, etc.).

En casos excepcionales la regionalización puede llevarse a cabo sobre la base del


análisis de correlación y el análisis de regresión, con énfasis en la relación entre
variables e interdependencia entre ellas en diferentes partes de un territorio.

No obstante la objetividad de los métodos matemáticos, no se garantiza precisión en los


límites o fronteras entre las partes de un territorio, esto debido a que ante condiciones
naturales no es fácil conciliar el aspecto cualitativo con el cuantitativo.

1
EJEMPLOS DE APLICACIÓN DE CRITERIOS ESTADISTICOS PARA LA
CLASIFICACION Y/O REGIONALIZACION DE OBJETOS GEOGRÁFICOS.

I) CRITERIOS DE HOMOGENEIDAD (SIMILITUD, PARECIDO)

Aplicaciones:
1.- Aplicación del Criterio de “t - Student”

Tabla 2.1.- Cuencas y variables (t – Student)

Cuencas
Variable San Isidro Sebastián
P, mm 1920 1810
S, mm 340 210
N 15 22

Condición: - t t (α / 2) < tc < t t (α / 2)

Donde, tt, valor crítico en la tabla de “t- Student” para el nivel de significación
“α”;
tc, estadígrafo de Student.
tc = (√ N1N2) (P1 - P2) / (S 1, 2) ( √ N 1 + N 2)

Donde, N, No. de miembros de la serie, P, lluvia media, S, Desviación standard


promedio de las dos series.

Siendo los resultados t c = 1,22, y en la tabla t t = 1,96; Por tanto, queda


demostrado que San Isidro y Sebastián son semejantes en cuanto a la lluvia media
y para un nivel de significación “α” del 5 %, constituyendo un grupo.

Otro ejemplo de aplicación de Student.

Se tienen 3 lugares donde se desea conocer el grado de semejanza entre estos con fines
de agrupamiento o clasificación. Como elemento diferenciador o indicador se toma la
lluvia total anual (pudiendo ser otras variables - indicadores). Para cada punto o lugar
existen 5 observaciones anuales. De hecho, se tratará de demostrar la semejanza o no
entre los lugares a través de la lluvia anual. Si son diferentes, de hecho, se han
"clasificado" los lugares en 3 tipos distintos (según lluvia anual). El criterio más
objetivo para estos casos es el de Student, que tiende a diferenciar los valores medios.
Por tanto, si:

Para N = 5 P1 = 533 mm P2 = 587 mm P3 = 622 mm


ΔP1,2 = 54 mm ΔP2,3 = 35 mm

Los grados de libertad: γ = N1 + N2 - 2 = 8

y α = 0,01 = 1% (nivel de significación), y para las series o lugares 1 y 2:

T c = 6,47 > T t = 3,36 (valor crítico de " T t " en la tabla

2
de Student para γ = 8 y α = 0,01)

Se demuestra la no semejanza entre 1 y 2.

Para el caso de los lugares 2 y 3:

T c = 4,61 > T t = 3,36 (ídem al caso anterior)

Los 3 lugares son diferentes, y por tanto se clasifican como 3 tipos de lugares
(según lluvia total anual).

2. Método de Indicador de heterogeneidad ( Chi – cuadrado ).

Es aplicable cuando un territorio se puede dividir en dos o más partes con la convicción
de que objetivamente es divisible. Para ello es indispensable el uso de un complejo de
variables y aplicando la siguiente fórmula:
m
ω = Na Nb / Na + Nb ∑ ( Xia - Xib ) 2 / ( Si (a, b) ) 2 ..... (2.1)
i=1

Donde Na, Nb, cantidad de unidades o puntos de observación en cada parte del territorio
(parte a y parte b).

Xia , Xib , valor medio de las variables i = 1, 2, 3, 4, …m para las partes a y b

Si(a, b), dispersión total para la variable "i" y para las partes a y b.

Se plantea que la parte a es diferente o no semejante (heterogénea) a la parte b si sucede


que χ2 (Chi-cuadrado) para un determinado nivel de significación ∝ y γ = m grados
de libertad es menor que ω, es decir,

. ω > X2 (α, m)
Ejemplo: Sean las cartas o mapas de isolíneas de los territorios a y b.

Las variables a considerar en cada territorio (a y b) son los siguientes: pendiente media
"Yc"; altitud promedio "h"; disección vertical del relieve o amplitud de altitudes "Δ h".

Si tomamos para cada territorio las 25 cuadrículas, y calculamos las 3 variables


anteriores para cada una, el resultado es el siguiente:

Yc1 = 12, 0 h1 = 39, 0 Δh1, = 11.0

Yc2 = 13, 0 h2 = 37, 0 Δh2, = 12, 0

D y = 22,4 dispersión general de la variable " Yc " (para ambos territorios)

D h = 83,0 dispersión general de la variable "h" (para ambos territorios).

D Δh = 8,90 dispersión general de la variable "Δh” (para ambos territorios).

Usando los valores anteriores, el coeficiente de heterogeneidad " ω " es,

3
ω = 12,5 (0,044 + 0,05 + 0,111) = 2,57

Para la evaluación del coeficiente ω se utiliza el criterio de Chi-cuadrado. Por cuanto


ω = 2,57 < χ2 = 7,82 para γ = 3 (grados de libertad) y para α = 0,05, puede
afirmarse que el territorio a y b son homogéneos (si sucediera que ω > χ2 entonces
ambos territorios serían diferentes y constituirían unidades con relativa independencia).

Otro ejemplo de este Indicador:

Tabla 2.2.- Cuencas y variables (Heterogeneidad).

CUENCAS
San Isidro Matías Sebastián San Juan
VARIABLES
P, mm 1920 1700 1810 1740
S, mm 340 260 210 220
Np 15 18 22 20

R, mm 910 800 880 820


S, mm 160 130 110 110
Nr 15 14 16 16

El, mm 1840 1850 1860 1840


S, mm 60 50 40 40
Ne 15 16 20 16

Para las cuencas San Isidro y Matias,

Sustituyendo en (2.1):

ω = {(45) (48) / (45 + 48)} {[(1920-1700) 2 / 89281] + [(910 - 800) 2 /


21411] + [(1840 -1850) 2 / 3031]}

ω = 26,47
Sí en la tabla de Chi-cuadrado, el valor crítico Х 2 = 7,81
Para α = .05 y 3 grados de libertad (m = 3), quiere decir que se cumple que ω > Х2,
por tanto, existe heterogeneidad o diferencia entre San Isidro y Matías, implicando que
pertenecen a grupos diferentes según las variables y el nivel de significación
seleccionados.

(La varianza promedio (S1, 2) 2 de cada variable y para el par de cuencas, se calcula
ponderando las mismas con N-1)
Siguiendo el mismo procedimiento de cálculos, se llega a la matriz de valores de ω
para las cuatro cuencas, tal y como se muestra a continuación:

4
MATRÍZ DE VALORES DE “ω”

San Isidro Matias Sebastián San Juan

San Isidro x 26,47 9,55 23,88


Matias - x 18,82 2,62
Sebastián - - x 13,38
San Juan - - - x

Constituyen grupos (para α = .05; X 2 = 7,81):


1.- Matias y San Juan
2.- San Isidro
3.- Sebastián

Constituyen grupos (para α = .01; X 2 = 11,3):

1.- Matias y San Juan


2.- San Isidro y Sebastián

3.- Método de Clasificación por Ponderación de variables.

Este método se caracteriza por darle peso a cada variable que incide sobre un
determinado fenómeno o proceso, llevándose cada variable, en función de su
variabilidad, a un sistema de "n" categorías, a partir de las cuales se comienza un
proceso de reevaluación, que conlleva a una clasificación final del fenómeno o proceso
resultante. Veamos el ejemplo que a continuación se expone:

Ejemplo de aplicación del "Método de ponderación de variables".

A) Indicadores principales (variables): Lluvia anual, temperatura media anual, altitud


promedio, pendiente promedio, categoría de suelo.
B) Indicador resultante: Riesgo de Erosión del suelo
C) Unidades Hidroedafológicas (UHE: Objetos geográficos): 6 Unidades.

Tabla 2.3.- UHE. y sus valores medios (según variables o Indicadores Principales).

┌────────┬────────┬───────┬──────────┬───────┬────────────┐
│U.H.E. │ Lluvia │ Temp. │ Altitud │ Pend. │ Cat. Suelo │
│ ├────────┼───────┼──────────┼───────┼────────────┼
│ I. P. │ mm │ oC │ m.s.n.m.│ % │ I - V │
├────────┼────────┼───────┼──────────┼───────┼────────────┼
│A │ 1900 │ 18,0 │ 380 │ 430 │ V │
│B │ 1810 │ 20,0 │ 300 │ 340 │ IV - V │
│C │ 1680 │ 22,3 │ 230 │ 210 │ III │
│D │ 1510 │ 24,4 │ 200 │ 170 │ II - III │
│E │ 1400 │ 25,0 │ 100 │ 100 │ I │
│F │ 1240 │ 26,3 │ 40 │ 30 │ I │
└────────┴────────┴───────┴──────────┴───────┴────────────┘

5
Tabla 2.4.- Evaluación de los Indicadores Principales
────────┬───────────┼─────────┬─────────┬───────┬──────────┐
Valor en│ Lluvia │ Temp. │ Altitud │ Pend. │ Cat.Suelo┤
puntaje │ mm │ oC │ m.s.n.m.│ (%) │ I - V │
┌───────┼───────────┼─────────┼─────────┼───────┼──────────┤
│ 1 │ 1240-1372 │24,6-26,3│ 40-108 │ 30-110│ I │
│ 2 │ 1372-1504 │23,0-24,6│ 108-176 │110-190│ II │
│ 3 │ 1504-1636 │21,3-23,0│ 176-244 │190-270│ III │
│ 4 │ 1636-1768 │19,6-21,3│ 270-350 │270-350│ IV │
│ 5 │ 1768-1900 │18,0-19,6│ 312-380 │350-430│ V │
└───────┴───────────┴─────────┴─────────┴───────┴──────────┘

P = 132mm t = 1,66oC H = 68 m Yc = 80%

Tabla 2.5.- Evaluación de las U.H.E.

┌──────────────────────────────────────────────────────────┐
│U.H.E. 1 2 3 4 5 │
│ C.I.P. Lluvia Temp. Altitud Pend. Cat. Suelo Total
├──────────────────────────────────────────────────────────┤
│ A 5 5 5 5 5 25│
│ B 5 4 4 4 4 21│
│ C 4 3 3 3 3 16│
│ D 3 2 2 2 2 12│
│ E 2 1 1 1 1 6│
│ F 1 1 1 1 1 5│
├──────────────────────────────────────────────────────────┤
│Totales 20 16 17 16 16 85│
└──────────────────────────────────────────────────────────

Si las UHE llegaran a “Z” es decir 28 o 30 unidades hidroedafológicas, se determinan


los coeficientes de correlación "r" entre los totales y cada variable serían 28 o 30 pares
de valores. En nuestro caso al tener 6 variables y n = 28 o 30 (el coeficiente de
correlación sería más significativo que con n = 6 (de A-F), se selecciona el "r" mayor,
por ejemplo total / lluvia = 0.8 (el resto total/temperatura; total altitud, etc., son < 0.8) lo
que quiere decir que la lluvia es la variable que más incide en la erosión de los suelos.
Ello nos permitirá ponderar cada UHE. y sus respectivas variables en su coeficiente de
correlación. Siendo 1.0 el "Coeficiente de ponderación" para la lluvia por ser "r" lluvia
/ "r" lluvia = 1.0. El "Coeficiente de ponderación" del resto de los parámetros debe ser
inferior a 1.0. Estos "coeficientes de ponderación" se multiplican por cada indicador de
evaluación (1 - 5) para cada variable en cada UHE y se suman horizontalmente
buscándose un nuevo valor total para cada UHE. Posteriormente, la diferencia entre el
máximo total y el mínimo total se divide entre 5 categorías (opcional) para confeccionar
los intervalos de clasificación.

Ctg. V. max. = 21
V. min. = 6
Δ = 15

6
Las categorías finales para el sistema de 5 evaluaciones o categorías son:

R I E S G O D E E R O S I O N

I II III IV V

Mínimo poco medio Evidente Mucho

6 - 9 9 - 12 12 - 15 15 - 18 18 – 21

< 9 9 - 12 12,01-15 15,01-18 > 18


───────────────────────────────────────────────────────────
A partir de la tabla de clasificación anterior, las UHE quedarían clasificadas según la
misma.
(No se da dicha clasificación por haberse omitido el paso del cálculo de “r”).

4.- Método de Agrupamiento por el Coeficiente de Distancia.

Este método utiliza el enfoque del Análisis de Agrupamiento, y ofrece la posibilidad de


subdividir un territorio según diferentes variables. El Coeficiente de Distancia
representa una medida de diferenciación entre dos puntos en un espacio cualquiera. El
principio de subdivisión en dos conjuntos de puntos dentro de un espacio consiste en
que dentro de cada conjunto, cada punto está relativamente cercano uno del otro en
valor, mientras que cuando ya se pasa a otro conjunto de puntos, los anteriores se van
alejando de estos últimos por no ser homogéneos o semejantes dichos espacios
(territorios). En calidad de variables, pueden usarse los morfométricos (altitud
promedio, pendientes, etc.) y/o variables de otro tipo, como los hidrológicos y
climatológicos (lluvia media, escurrimiento medio, temperatura, etc.). Esta información
se ordena en forma de matriz donde los objetos geográficos (cuencas, paisajes, etc.) se
identifica por i, j, etc. y las variables de cada uno de ellos por "X".

Los objetos se dividen en grupos por el criterio de "cercanía", que se determina con la
ayuda del "Coeficiente de Distancia" (d) por la fórmula:
D (i, j) = √ ∑ (Xi - Xj) 2 ……. (2.2)

Por el cálculo de "D" para todos los grupos de objetos es indispensable lograr la matriz
para definir el valor mínimo de "D". Ello demuestra la homogeneidad en la
comparación de los objetos. Ello permite la clasificación de tales objetos por este
principio. Los valores del coeficiente de distancia (D) permiten la clasificación de los
objetos geográficos al constituir grupos independientes. Los grupos pueden representar
zonas o regiones cuando se emplea un determinado complejo de variables.

Como ejemplo, pueden citarse un grupo de 20 cuencas ubicadas en un determinado


territorio, cada cuenca es un objeto geográfico, y cada una de ellas tiene 4 variables
(área, pendiente, lluvia media y temperatura media). Este método, con la formula (3)
compara todas las cuencas entre si por pares, es decir, la uno con la dos, la dos con la
tres, la una con la tres, y así sucesivamente hasta compararlas todas con sus respectivas
variables. Al final, y haciendo uso una matriz de valores de “D” se sigue el
procedimiento descrito arriba para definir los agrupamientos que existan, pudiéndose
denominar zonas, regiones o como se entienda pertinente. Una de las técnicas mas
utilizadas es la de “Análisis de Agrupamiento” conocida en inglés como “Cluster
Analysis” y hace uso de diferentes métodos y medidas de distancia (ver mas adelante).

You might also like