Clasificación Digital de Imágenes Satelitales

Editado por Marcos Angelini

El objetivo de una clasificación consiste en agrupar los píxeles que posean una
misma característica. Generalmente la característica tomada es el valor digital de
los mismos, que se corresponderá a un tipo de cobertura del terreno.
Básicamente, la clasificación digital de imágenes satelitales consiste en un
método estadístico por el cual, a través de un muestreo de píxeles, se agrupa en
categorías o clases al resto de los píxeles de una imagen.
Los métodos de clasificación pueden agruparse en:
 Clasificación Supervisada
 Clasificación No Supervisada
La clasificación supervisada consiste en conocer a priori las categorías en las
cuales se quiere separar la imagen, y para ello se debe validar el muestreo de
píxeles con un trabajo de campo.
En cambio, en la clasificación no supervisada no se conocen las clases a separar,
por lo tanto se debe determinar en cuantas clases se quiere separar la imagen y el
ordenador definirá las clases. La labor posterior es identificar, con trabajo a campo,
a que cobertura pertenece cada clase. El problema de este método es que no toma
en cuenta la variabilidad que tiene cada clase. Por ejemplo, la variabilidad espectral
de un pastizal natural en mucho mayor que la variabilidad de un cuerpo de agua
profundo y transparente.
En esta guía sólo se desarrollará el método de clasificación supervisada, ya que
es el más utilizado y exacto. No por ello debe descartarse el uso del resto de las
metodologías para casos puntuales.

Clasificación Supervisada

El Proceso de clasificación supervisada se puede separar en una serie de pasos:

 Trabajo de Campo
 Identificación y selección de sitios de entrenamiento
 Selección del método de asignación de píxeles
 Evaluación de la clasificación
 Preparación del mapa temático

Trabajo de Campo
Para la salida a campo debe procesarse la imagen a utilizar (con los métodos
vistos en el apartado anterior) de manera de poder identificar las distintas
coberturas del terreno. La fecha de adquisición de la imagen debe ser lo más
cercana posible a la fecha de salida a campo, y a su ves, que las cobertura de
interés estén es su mayor expresión en la misma.

1

porcentaje de cobertura de suelo. Los sitios de entrenamiento son grupos de píxeles que representan a una clase o categoría. dichos sitios. Esto permite seleccionar áreas homogéneas. El número de sitios visitados debe ser suficientes como para que sean representativos del número de coberturas y de la variabilidad de las mismas. se recolectarán los distintos sitios de entrenamiento. Generalmente los software poseen herramientas interactivas para seleccionar un área sobre la imagen. para cada banda. fenología (para cultivos) y todas aquellas características que puedan modificar la respuesta espectral de la las mismas. de los cuales se extraerá datos como media aritmética. estado de la cobertura. se deberá generar más de una categoría en aquellas clases con gran variabilidad. por ejemplo. que la clase Maíz puede estar definida por las clases Maíz_1. Una herramienta que suele encontrarse en los software con distintos nombres es la de “semillado” (seeding). El objetivo del trabajo de campo es reconocer las distintas coberturas del área de estudio para luego poder identificarlas fehacientemente sobre la imagen. la bibliografía indica que una clase no debería estar definida por menos de 100 píxeles. 2 . Al encerrar un grupo de píxeles se calcula las estadísticas para cada banda incluida en la proceso (en el ejemplo son tres bandas). Así. Identificación y selección de sitios de entrenamiento Esta etapa puede considerarse el punto crítico de una clasificación ya que de la correcta definición de los sitios de entrenamiento dependerá el resultado de la clasificación. Maíz_3…. deben cumplir con los siguientes requisitos:  Deben ser representativos de la clase  Deben ser lo más homogéneos posibles en cuanto a su valor espectral En cuanto al primer requisito. En conocimiento de esta metodología. aunque ello puede resultar insuficiente cuando nos encontramos con clases con gran extensión y variabilidad. que permite hacer un clic sobre un píxel y automáticamente seleccionara los vecinos que tengan un valor espectral dentro de un rango preestablecido. en este caso cada clase de Maíz corresponde a distintos estadios fenológicos del cultivo o diferentes situaciones de campo que modifican la respuesta espectral. como ser un cultivo enmalezado o inundado. etc. Por lo tanto cada clase tendrá una media. La siguiente figura muestra el proceso por el cual se obtienen los valores estadísticos de un sitio de entrenamiento. se tendrá que. Para seleccionarlos. para PCI Geomatics. etc. desvío estándar. Para cumplir con el segundo ítem. desvío estándar. rango. Generalmente es conveniente diseñar el trabajo de campo de manera tal de recorrer todas las coberturas observadas en la imagen. Cada punto visitado debe caracterizarse con datos como tipo de cobertura. Maíz_2. para lo cual debe contarse con buena información de campo. Vale decir que el número de píxeles está en función de la variabilidad y la extensión de una clase.

La más sencilla de todas es la firma espectral de cada clase. y permite ver si dos clases son prácticamente iguales o se diferencian en alguna de las bandas incluidas en la clasificación. Otra de ellas es el Scatter Plot o histograma bidimensional donde cada punto observado en su interior representa el valor de un píxel en una banda y en otra (cada eje es una banda). Para este caso se están visualizando tres clases. para lo que existen una serie de herramientas visuales y estadísticas destinadas a tal fin. si bien sólo se logrará una apreciación cualitativa ya que el gráfico no mostrará la variabilidad de cada clase. Esta se confecciona con los valores medios de cada clase en cada banda. De esta forma podemos visualizar el total de la imagen o solo algunas de las clases generadas. 3 . A continuación se muestran las áreas seleccionadas con la herramienta de semillado: Una vez recolectados los sitios de entrenamiento debe evaluarse su precisión.

aunque sólo es aplicable en casos groseros en que una clase se confunde con otra. A continuación se muestra un histograma bidimensional donde cada punto de color forma parte de los píxeles de los sitios de entrenamiento de cada clase y el punto con recuadro negro representa un píxel a clasificar. Los puntos amarillos en el centro de cada clase representan el promedio de la clase: 4 . Comúnmente es utilizada mientras se seleccionan los sitios de entrenamiento. por ejemplo. Esta herramienta es utilizada generalmente al finalizar la recolección de los sitios de entrenamiento. si asume que la distribución no es normal. Para ayudar a entender cada uno de los métodos se simplificará la clasificación al uso de dos banda (1 y 2) y se supondrá tener sólo tres clases (A. Una herramienta más objetiva es la Transformada Divergente que analiza la separabilidad de dos clases. B y C).018790). mientras que los valores más bajos se encuentran entre las subclases de una misma categoría. si asume que la distribución de los niveles digitales de cada clase es normal. con un índice que va de 0 a 2. Esta herramienta permite ver la dispersión de las clases y evaluar si es necesario redefinir una clase. pero su resultado puede implicar que deben redefinirse uno o más sitios de entrenamiento. Una vez comprobada la exactitud de la definición de sitios de entrenamiento se está en condiciones de realizar la asignación de píxeles a una clase. Forestal1 y Forestal2 (1. donde 0 indica que las clases se encuentran totalmente superpuestas y 2 que están totalmente separadas. En el reporte que se muestra a continuación puede observarse que la clase agua tiene máxima separabilidad con todas las restantes clases. o no paramétricos. Selección del método de asignación de píxeles Los criterios más comunes de asignación de píxeles a una clase de dividen en paramétricos. ya que permite analizar de a pares de bandas por vez.

por lo tanto no será clasificado. En el gráfico se pueden deducir algunos problemas de este método: Por un lado el píxel a clasificar ha quedado fuera de toda clase. por lo contrario quedaría sin clasificar. es decir que si un píxel cumple con la condición de estar dentro del rango de valores para cada banda es incorporado a la clase. que a continuación se detalla: Clasificador por Paralelepípedos Este clasificador toma en cuenta el rango de valores en que se encuentra definida una clase. Dentro de los métodos paramétricos se encuentra el de Paralelepípedos y el de Distancia Mínima. 5 .

es que al ser paramétrico. modificará los rangos de una clase y por ende el resultado de la clasificación. 6 . Suele utilizarse también en casos que se necesita hacer una máscara. A continuación se desarrollará el método de Máxima Probabilidad. el píxel en cuestión es incorporado a la clase más cercana. Como ventajas del método puede remarcarse la sencillez y rapidez de procesado. Además. Clasificador por Distancia Mínima La clasificación por Distancia Mínima más exacto que el método anterior y toma como parámetro de decisión la distancia que hay entre un píxel cualquiera y la media de cada clase. Se debe tener especial cuidado en la selección de los sitios de entrenamiento. El cálculo de la distancia es análogo al el Teorema de Pitágoras (el cuadrado de la distancia es igual a la suma de los cuadrados de los catetos): Una ventaja del método es que todos los píxeles serán incorporados en alguna de las clases. que no sea de la categoría correspondiente. En este caso. que es una clase de por sí homogénea. no toma en cuenta la variabilidad de cada clase y es propenso a cometer errores en este sentido. La desventaja del método. el cual se clasifica como no paramétrico. ya que con sólo seleccionar los sitios de entrenamiento correspondientes a agua se obtendrá una clasificación rápida. si no todos los píxeles de una clase son incluidos en el muestreo pueden quedar sin clasificar alguno de ellos. por lo tanto tampoco serán clasificadas. o sea. como clase C.Por otro lado hay un área de confusión entre las clases A y B. Hasta aquí hemos visto los dos métodos paramétricos más difundidos. ya que un píxel incluido como muestra. Las áreas de superposición entre clases no pueden ser resultas por el método. por ejemplo de la cobertura agua.

por su robustez y por ajustarse con más rigor a la disposición original de los datos. En el gráfico pueden verse las elipses que representan los desvíos estándar de cada clase: En este caso el píxel a clasificar entra en el segundo anillo de probabilidad de la Clase A.) o modelos digitales de terreno. además de nivel digital. Si bien este método es el más ampliamente utilizado en Teledetección. Evaluación de la clasificación 7 .. en los últimos años han surgido software de clasificación (por ejemplo. es el más empleado en teledetección. Sin embargo. donde se le suministra que condiciones debe cumplir un píxel para pertenecer a una clase. asociación y conectividad. En el caso en que un píxel quede incluido en el área de misma probabilidad de dos clases se debe resolver por un método paramétrico (mínima distancia. incorporando parámetros propios de interpretación visual como ser: forma. Clasificador por Máxima Probabilidad Este método mide la probabilidad de que un píxel pertenezca a una clase. e-Cognition) que funcionan a modo de “árbol de decisión”. Mapa de suelos. El clasificador de Máxima Probabilidad es el más complejo y el que demanda mayor volumen de cálculo. También utilizan otras capas de información como pueden ser mapas temáticos (Mapa de uso. tamaño. por ejemplo). y se vale del promedio y la desviación estándar de cada clase para el cálculo. etc. por lo tanto a ella es a quien tiene más probabilidad de pertenecer. etc.

Es decir que habrá una correspondencia entre un número y una clase.09 ha) Matriz de confusión 8 . En el reporte de la clasificación se podrá observar alguno de los siguientes datos: Cantidad de píxeles en cada clase. con lo que se puede deducir la superficie ocupada por dichas clases (30 x 30 m Landsat = 0. Una vez realizada la asignación de píxeles el resultado de la clasificación será una imagen de una banda en el cual el valor de cada píxel corresponderá al número de clase.

Algunos datos de fiabilidad son mostrados en el reporte. los errores por comisión son aquellos píxeles que el clasificador encuentra perteneciente a una clase y que no fue definido de la misma manera por el usuario. si bien cada software posee sus formatos. En el siguiente se muestran la fiabilidad promedio. o sea. los errores por omisión son aquellos píxeles que incluidos como pertenecientes a una clase por el usuario el clasificador los encontró como otra clase. fiabilidad global. Del conjunto de píxeles muestreados. y coeficiente kappa: 9 . La Matriz de confusión se genera a partir del de los píxeles que se tomaron como muestras. Por el contrario. Los residuales de las filas son los errores por omisión mientras que los residuales de las columnas son los de comisión. en la diagonal de la matriz se encuentran los aciertos. aunque más bien esta asociada a correcta definición de los sitios de entrenamiento. aquellos píxeles que tanto el clasificador como el usuario ubicaron en la misma clase. Así. O sea que. La relación entre la suma de los aciertos y el total indica la fiabilidad de la clasificación. la matriz compara como definió las clases el usuario (en las columnas) y como las encontró el clasificador (en las filas).

con el objetivo de facilitar su lectura. en una imagen clasificada se verán una gran cantidad de píxeles que. aunque este valor dependerá del objetivo del trabajo. producto de los bordes de las categorías o de mezclas de las mismas. Hay que tener en cuenta que un filtrado de media no tendría sentido aplicar ya que los valores de la matriz no corresponden a valores espectrales sino a un identificador de las categorías. cursos de agua. pueden encontrarse aislados o poco asociados a las categorías vecinas. a fin de dar con el resultado correcto de clasificación. A continuación se muestra la clasificación original y el resultado del filtrado con una matriz de 3 x 3 de Moda: Para finalizar. Para mejorar visualmente este defecto suelen utilizarse filtros de moda con mascaras de 3 x 3 hasta 5 x 5. Para ello en el trabajo de campo se debió recolectar información a tal fin. entre otros. como ser vías de comunicación. Luego. 10 . que no haya sido utilizada en los sitios de entrenamiento. localidades. Preparación del mapa temático Generalmente. que serán corroborados por la información de campo y la experiencia del intérprete. de la relación entre los sitios bien clasificados y el total se pueden construir indicadores de fiabilidad como los ya mencionados. una grilla de coordenadas. Generalmente son aceptados valores de precisión del orden del 80%. al generar un mapa temático se debe tener en cuenta que el mismo debe contener datos anexos a la imagen clasificada. sobre las clases de interés). Para poder abordar un análisis de la confiabilidad de la clasificación. La clave en esta etapa es determinar de qué manera deben ser distribuidos los puntos (estratificada. Una metodología muy utilizada consta de distribuir puntos al azar sobre la imagen y sobre la clasificación. leyendas. el mejor método es utilizando los resultados de la clasificación contra la información de terreno. el cual interactivamente se analizará la mejor opción.