Professional Documents
Culture Documents
Incendios Mediante Naive Bayes Es
Incendios Mediante Naive Bayes Es
Planificación
Tesis de máster
4 de junio de 2020
Andrea Sulova
Resumen
Estudios recientes sugieren que, debido al cambio climático, aumentará el número de
incendios forestales en todo el mundo. Recientemente, Australia se vio afectada por
grandes incendios forestales durante el verano de 2019-2020, en los que ardieron 46
millones de acres de tierra. Esta catástrofe está planteando la cuestión de hasta qué
punto el riesgo de incendios forestales puede estar vinculado a diversos factores
climáticos, ambientales, topográficos y sociales, y cómo predecir la ocurrencia de
incendios para tomar medidas preventivas. En este estudio se investigan los incendios
forestales australianos a partir de datos de observación de la Tierra obtenidos por
teledetección gratuita, con el fin de extraer conclusiones generales. En los últimos
años, el aprendizaje automático (machine learning, ML) ha demostrado su eficacia e n
muchas tareas gracias a su capacidad para aprender de relaciones obvias, pero
también ocultas. Uno de los objetivos de este estudio es crear un proceso
automatizado de creación de un conjunto de datos de entrenamiento de incendios a
nivel continental con un gasto computacional eficiente para los algoritmos de ML. Los
resultados de las localizaciones de incendios y de ausencia de incendios se mapean
junto con los factores causales de los incendios. El conjunto de datos de
entrenamiento se aplica a diferentes algoritmos de ML, como Random Forest (RF),
Naïve Bayes (NB) y Classification and Regression Tree (CART). El algoritmo de ML con
mejor rendimiento, el modelo RF, se utiliza para identificar los factores determinantes
mediante un análisis de importancia de variables. Normalmente, un modelo puede
aprender ciertas propiedades a partir de un conjunto de datos de entrenamiento para
hacer predicciones. Por lo tanto, el objetivo general de este estudio es revelar la
probabilidad de ocurrencia de incendios en toda Australia, así como identificar los
factores impulsores de los incendios forestales aplicando el conjunto de datos de
ocurrencia de incendios de la temporada de verano 2019-2020. Se pueden aplicar
mejores medidas preventivas en las zonas propensas a los incendios para reducir el
riesgo de incendios forestales en Australia mediante la consideración de los factores
identificados.
3
Prefacio
Esta tesis de máster resume mi último semestre del programa de máster en
Geoinformática de la Universidad de Aalborg. Los principales objetivos de la tesis de
máster son descubrir las características de los incendios forestales australianos
mediante la aplicación de datos de teledetección, identificar los factores impulsores
asociados a los incendios forestales durante la temporada 2019-2020 y dictar
previamente las ubicaciones de los incendios forestales.
La inspiración para la tesis de máster tiene su origen tanto en la pasión por adquirir
más conocimientos relacionados con la teledetección como en el afán por tomar
medidas contra el cambio climático, ya que una de sus consecuencias directas son
los incendios forestales.
Me gustaría expresar mi gratitud a mi supervisor, el Prof. Dr. Jamal Jokar Arsanjani, por
su excepcional cooperación y su valioso apoyo a lo largo de todo el estudio. Además,
mi más profunda gratitud a mi novio y a mis hermanas por su constante apoyo y
continuo aliento durante todos mis años de estudios.
Espero que este estudio y sus resultados aporten nuevos conocimientos sobre los
incendios forestales y sean valiosos para futuras investigaciones". Los códigos
JavaScript pueden obtenerse en el repositorio de GitHub
https://github.com/sulova/AustraliaFires.
4
Lista de figuras
Figura 1 - Radiancia espectral del fuego frente a los distintos fondos típicos en función de la longitud de onda
[11].........................................................................................................................................................................................14
Figura 2 - Visión general de las bandas de Sentinel-2 Fuente: Reseda, Universidad Libre de Berlín.......................15
Figura 3 - Contraste de la curva de respuesta espectral para la vegetación sana y las zonas quemadas
Fuente: Servicio Forestal de EE.UU. ...............................................................................................................................
16
Figura 4 - Un ejemplo de la estructura de los árboles de clasificación RF..............................................................19
Figura 5 - Teorema de Bayes............................................................................................................................................20
Figura 6 - Matriz de confusión.........................................................................................................................................21
Figura 7 - El área de interés definida por los límites de Australia continental......................................................24
Figura 8 - Número total de lugares de incendio a lo largo de 2019 y parcialmente para el año 2020 en el
territorio continental australiano....................................................................................................................................
25
Figura 9 - Distribución espacial de la precipitación mensual (mm/mes) en Australia durante enero de 2020
- febrero de 2020 utilizando el conjunto de datos diarios CHIRPS ...........................................................................
26
Figura 10 - Temperatura media anual en Australia desde 1979 hasta 2019..............................................................27
Figura 11 - Número total de píxeles que presentan fuego activo anualmente (del 1 de enero de 2001 al 1 de marzo de 2020)
...............................................................................................................................................................................................28
Figura 12 - Número total de focos de incendio a lo largo de un año durante casi una década (del 1 de
enero de 2010 al 1 de marzo de 2020), un píxel de 1 km contiene uno o más focos de incendio en un radio
de 500 m ..............................................................................................................................................................................
29
Figura 13 - Distribución de sucesos de incendios basada en el conjunto de datos FIRMS de enero de 2019 a
febrero de 2020 30 Figura 14 - El diagrama de flujo de los procesos empleados en el estudio para generar
el modelo predictivo en GEE.
................................................................................................................................................................................................31
Figura 15 - Diagrama de flujo de los lugares de ocurrencia de incendios aplicado en la metodología...........33
Figura 16 - Composición sin máscara de nubes (izquierda), Composición con máscara de nubes y agua (derecha)
................................................................................................................................................................................................34
Figura 17 - Ejemplo de un incendio forestal utilizado para ilustrar los resultados de los procesos de selección de zonas
quemadas.
a) dNBR, b) dNBR con área de fuego vectorial FIRMS, c) dNBR con área de fuego vectorial FIRM y áreas
umbral d) dNBR con área de fuego vectorial FIRMS y áreas umbral y áreas seleccionadas mayores de
0,25 km2 .........................................................................................................................................................................................................................................................................
35
Figura 18 - Factores topográficos: elevación, aspecto y pendiente ...................................................................38
Figura 19 - Factores medioambientales: cobertura del suelo (la leyenda figura en el Apéndice),
profundidad del suelo, humedad del suelo, índice de gravedad de la sequía y NDVI .........................................
39
Figura 20 - Ejemplo de una imagen obtenida a partir de una función estadística sobre una colección de imágenes 40
5
Figura 21 - Factores climáticos: precipitaciones, temperatura máxima y velocidad del viento........................40
Figura 22 - Factores socioeconómicos: GHM, población, líneas eléctricas y distancia de las carreteras........41
Figura 23 - Fusión de todas las variables predictoras en la imagen final (script GEE de JavaScript)...............42
Figura 24 - Creación de la muestra de entrenamiento...............................................................................................42
Figura 25 - Clasificación supervisada ML, concretamente RF, aplicada en la interfaz GEE ...............................43
Figura 26 - La función de probabilidad en GEE para la cartografía de la probabilidad de incendio ................43
Figura 27 - Evaluación de la precisión............................................................................................................................44
Figura 28 - Distribución de los puntos de incendio y de no incendio del proceso automatizado......................45
Figura 29 - Un ejemplo de incendio forestal en imágenes RGB anteriores y posteriores al incendio y fuego
activo mensual de la misión Sentinel-2 para la verificación visual de los puntos de incendio. .........................
46
6
Figura 30 - Precisión de los modelos CART con un número diferente de nodos hoja aplicados ................48
Figura 31 - Precisión de los modelos de DR con un número diferente de árboles aplicados......................48
Figura 32 - Análisis de la importancia de las variables según el modelo RF .........................................................49
Figura 33 - Mapa de susceptibilidad al fuego utilizando el modelo RF........................................................................50
Figura 34 - El mapa de susceptibilidad al fuego con clases utilizando el modelo RF..................................................51
7
Lista de cuadros
Tabla 1 - Categorías de gravedad de las quemaduras basadas en ∆𝑁𝐵𝑅 según el USGS.................................17
Tabla 2 - Interpretación del valor Kappa según Cohen (1977) ............................................................................22
Cuadro 3 - Lista y descripción de los conjuntos de datos variables incluidos en el estudio................................37
Tabla 4 - Estadísticas generales de los resultados de la evaluación de la precisión de los algoritmos de ML 47
8
Definiciones y acrónimos
Nombre Acrónimo
9
Índice
1. Introducción .................................................................................................................................10
1.1Planteamiento del problema y preguntas de investigación .......................................11
1.2Estructura de la tesis ..............................................................................................................12
2. Antecedentes y teoría ............................................................................................................13
2.1Aplicación de la teledetección en los incendios forestales .........................................13
2.2Misiones centinela.................................................................................................................15
2.3Ratio de quemado normalizado...........................................................................................16
2.4Algoritmos de aprendizaje automático ...........................................................................17
2.4.1 Árbol de clasificación y regresión ..............................................................................18
2.4.2 Bosque aleatorio ...........................................................................................................19
2.4.3 Naive Bayes...................................................................................................................20
2.5Teoría de la evaluación de la precisión ........................................................................20
2.6Análisis de la importancia de las variables ..................................................................22
2.7Tecnología..............................................................................................................................22
2.8Área de estudio ....................................................................................................................23
2.9Identificar el período de la temporada de incendios 2019-2020....................................24
3. Análisis exploratorio de datos ..............................................................................................27
4. Metodología ...............................................................................................................................31
4.1Extracción y preprocesamiento de datos .........................................................................32
4.1.1 Variable dependiente ................................................................................................32
4.1.2 Variables independientes ...........................................................................................36
4.2Clasificación ...........................................................................................................................42
4.3Validación...............................................................................................................................43
5. Resultados ....................................................................................................................................45
5.1Lugar del incendio................................................................................................................45
5.2Evaluación de la precisión de los algoritmos de ML .....................................................46
5.3Importancia de los condicionantes...................................................................................49
5.4Modelo predictivo ................................................................................................................50
6. Debate ..........................................................................................................................................52
7. Conclusión ...................................................................................................................................55
7.1Objetivos de desarrollo sostenible ................................................................................56
8. Trabajos futuros...........................................................................................................................57
9. Bibliografía ..................................................................................................................................58
10
10. Anexo...................................................................................................................................63
A. Descripción de la cubierta terrestre ...............................................................................63
B. Modelo de bosque aleatorio..............................................................................................64
11
1. Introducción
Australia se ha visto gravemente afectada por los incendios conocidos como "Verano Negro".
durante la temporada de verano 2019-2020 [1]. Al menos 46 millones de acres de tierra se han
quemado
[2] y "incendios cerca de mí" se ha convertido en la palabra más buscada en Google en
Australia d u r a n t e esa temporada de incendios [3]. Esta catástrofe está planteando
la cuestión de hasta qué punto el riesgo de incendios forestales puede estar
relacionado con diversos factores climáticos, medioambientales y sociales.
12
ML para la cartografía de incendios forestales y, posteriormente, se utiliza un método
con el mejor rendimiento alcanzado tanto e n el entrenamiento como en la
validación del modelo para cartografiar la probabilidad de incendios forestales
continentales en Australia.
13
La modelización de numerosas y complejas variables medioambientales y
socioeconómicas independientes suele ser una tarea difícil debido a la gran cantidad
de recursos necesarios, es decir, a la complejidad y la heterogeneidad de los
formatos de los datos. A este respecto, la mayoría de las variables predictoras,
como la temperatura, las precipitaciones, la población, etc., se recopilan a partir
del catálogo de datos de Google Earth Engine (GEE).
15
1.2 Estructura de la tesis
El capítulo "El futuro" resume las posibles áreas de mejora y búsqueda en el ámbito
del trabajo presentado.
16
2. Antecedentes y teoría
El siguiente capítulo presenta los antecedentes y la teoría recopilados a través de la
revisión bibliográfica. Este capítulo se divide en varios subcapítulos, cada uno de los
cuales se centra en diferentes dominios del conocimiento aplicados en este trabajo. El
primer subcapítulo hace hincapié en la aplicación de la teledetección por satélite
utilizada en la detección de incendios. Los subcapítulos segundo y tercero se centran
en las misiones del satélite Sentinel y en la definición de la RBN. El quinto subcapítulo
se centra en la tecnología utilizada en este trabajo. El subcapítulo del área de estudio
presenta el área de interés y el último subcapítulo define el marco temporal de la
temporada de incendios.
Esta forma única de recopilación de datos para responder a los incendios depende
también de la rapidez de las revisitas. Algunos satélites ofrecen una perspectiva a
vista de pájaro 24 horas al día, 7 días a la semana, al observar la misma zona que
los satélites geoestacionarios. El satélite geoestacionario japonés Himawari-8
ofrece esta perspectiva sobre Australia y otras partes de la región Asia-Pacífico.
17
incendios que se producen [10].
18
La detección de incendios activos mediante datos de satélite se basa en la
temperatura, ya que los focos de incendio presentan temperaturas significativamente
más altas que otros terrenos. Los focos de incendio emiten radiación electromagnética
en función de su temperatura, que es captada por los sensores térmicos de los
satélites [11]. Para distinguir los incendios del fondo, es importante utilizar la
detección multicanal en las longitudes de onda d e l rango infrarrojo.
Figura 1 - Radiancia espectral del fuego frente a los distintos fondos típicos e n
función de la longitud de onda [11]
19
2.2 Misiones centinela
En este estudio se utiliza la misión Sentinel-2 para detectar incendios activos y zonas
quemadas. Esta misión es una constelación de satélites gemelos Sentinel-2A lanzados
por el programa europeo Co- pernicus el 23 de junio de 2015 y Sentinel-2B seguido el
7 de marzo de 2017 [13]. Cada satélite Sentinel-2 lleva un Instrumento Multiespectral
(MSI) que tiene 13 bandas espectrales que abarcan desde el visible y el infrarrojo
cercano (NIR) hasta las longitudes de onda del infrarrojo de onda corta (SWIR) (Figura
2).
20
Figura 2 - Visión general de las bandas de
Sentinel-2 Fuente: Reseda, Universidad Libre de
Berlín
21
2.3 Ratio de quemado normalizado
𝑁𝐵𝑅 = 𝑁 𝐼 𝑅 𝐵 8 - (1)
𝑆𝑊𝐼𝑅12
𝑁𝐼𝑅𝐵8+𝑆𝑊𝐼𝑅𝐵12
22
Donde B8 y B12 son las bandas de satélite respectivas de Sentinel-2.
Un 𝛥𝑁𝐵𝑅 más alto indica zonas más gravemente dañadas, mientras que las zonas
con valores negativos pueden indicar un aumento de la vegetación tras un incendio
[17]. Se propone 𝛥𝑁𝐵𝑅 para cartografiar la gravedad del quemado basándose en
imágenes multiespectrales en las que los valores 𝛥𝑁𝐵𝑅 pueden interpretarse
basándose en el United States Geological Survey (USGS) tal y como se presenta en
Tabla 1 [18] [19].
24
Por otro lado, el aprendizaje supervisado requiere una muestra previamente
clasificada, es decir, el conjunto de datos de entrenamiento. La información espectral
de los píxeles clasificados se utiliza para entrenar los algoritmos de clasificación [21].
Este aprendizaje es útil principalmente en dos áreas, los problemas de clasificación y
de regresión.
25
2.4.2 Bosque aleatorio
El algoritmo CART mencionado anteriormente proporciona una base para Random
Forest (RF). El modelo RF consta de varios árboles individuales, cada uno de ellos
basado en una muestra aleatoria de los datos de entrenamiento, lo que puede
llevar a superar el modelo CART. El inconveniente de RF es que no se puede
interpretar como un único árbol CART [25].
El modelo RF se emplea para analizar la relación entre los factores que condicionan los
incendios forestales y la aparición de incendios y, posteriormente, se utiliza para
predecir la susceptibilidad de los incendios. Este algoritmo se utiliza habitualmente
para la predicción de datos y es adecuado para el modelado no lineal de la
susceptibilidad a los incendios forestales [26]. El modelo RF también permite investigar
la importancia var- iable, que puede utilizarse para determinar la variable más
importante del conjunto de datos de entrenamiento [27]. Las principales ventajas del
modelo RF son que el algoritmo evita el problema del sobreajuste si hay suficientes
árboles y también puede manejar valores perdidos.
26
2.4.3 Bayes ingenuos
El clasificador Naive Bayes (NB) es un algoritmo popular en muchos modelos ML
potentes. Se conoce como Naive porque asume ingenuamente que la presencia o
ausencia de un elemento particular de una clase no está relacionada con la presencia o
ausencia de cualquier otro elemento [28]. Este algoritmo se basa en el Teorema de
Bayes presentado en la Fig. 5 creado por Thomas Bayes [29].
𝑃(𝐵|𝐴) 𝑃(𝐴) P (B|A) = La probabilidad de que B sea cierto dado que A es cierto
𝑃(𝐴|𝐵) = P (A) = La probabilidad de que A sea cierto
𝑃(𝐵)
P (B) = La probabilidad de que B sea cierto
La evaluación de la precisión ofrece una idea general del rendimiento del modelo.
Los modelos ML son propensos al sobreajuste, por lo que es importante evaluar
cada modelo ML utilizando estrategias de validación cruzada adecuadas. Así pues,
los resultados de los modelos ML seleccionados se validan basándose en las
características comunes de evaluación de la precisión, como la matriz de con-
fusión, la precisión global y los estadísticos kappa. Estas características se detallan
en los párrafos siguientes.
27
La matriz de confusión es un resumen de los resultados de predicción en una
clasificación en el que el número de predicciones correctas e incorrectas se resumen
con valores de recuento y se desglosan por cada clase. Existen cuatro combinaciones
básicas de valores predictivos y reales que se explican en la figura 6. Esto forma parte
de la evaluación de la precisión, que proporciona información no sólo sobre los errores
cometidos por un clasificador, sino, lo que es más importante, sobre los tipos de
errores cometidos [30].
(TP + TN)
𝑂𝑣𝑒𝑟𝑎𝑙𝑙 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑥 100 (3)
(TP + TN + FN + FP)
El estadístico Kappa es uno de los más utilizados para comprobar la fiabilidad entre
evaluadores de ítems categóricos. Esto significa que mide el acuerdo entre más ob-
servadores, donde los observadores a veces están de acuerdo o en desacuerdo
simplemente por casualidad. El valor del estadístico kappa está comprendido entre
-1 y 1 y puede interpretarse según el kappa de Co- hen de la Tabla 2. El valor de 1
significa un acuerdo perfecto y el valor 0 es un acuerdo fortuito, la mayoría de las
veces el valor está entre 0 y 1. Si el valor es inferior a 0, hay algo peor que un
acuerdo fortuito (desacuerdo), lo que pone de manifiesto un clasificador
brutalmente roto [32].
28
Kappa Acuerdo
<0 Sin acuerdo
0 - 0.20 Leve
0.21 - 0.40 Feria
0.41 - 0.60 Moderado
0.61 - 0.80 Sustancial
0.81- 1.0 Perfecto
2.7 Tecnología
Google Earth Engine (GEE) es un producto de Google de acceso libre (no comercial)
lanzado en 2010 [34]. Esta plataforma dominante de computación en nube está
diseñada para almacenar y procesar conjuntos de datos masivos para el análisis
científico y la toma de decisiones en última instancia. Google pretende establecer la
información mundial y hacerla accesible y beneficiosa en todo el mundo. GEE también
cuenta con un programa de licencias comerciales, p o r lo que puede adquirirse con
fines comerciales [35].
29
incendios forestales, la cartografía del Ártico, el seguimiento de los bosques, los
cambios en el uso del suelo, etc. [36].
30
Este almacenamiento en la nube proporciona varios petabytes de imágenes de
satélite públicas de todo el mundo, en su mayoría recogidas por los satélites de
observación de la Tierra de la NASA, por ejemplo MODIS y Landsat, los satélites
Sentinel de la ESA y muchas otras fuentes [37]. Este almacenamiento en la nube
está disponible en este sitio web https://earthengine.google.com/datasets/.
También se incluyen en estos conjuntos de datos vectoriales modelos
demográficos, meteorológicos, climáticos y digitales de elevación y otros datos
vectoriales [34]. Los conjuntos de datos se pueden importar a un entorno de
scripting y los usuarios pueden cargar sus propios datos para uso privado. Además,
cualquier análisis de GEE puede descargarse para ser utilizado por herramientas de
terceros. Estos conjuntos de datos deberían ayudar a los usuarios a dedicar más
tiempo a crear productos y servicios [35].
Australia está situada entre los océanos Índico y Pacífico. Este con- tinente, el más
31
pequeño del mundo, con una población muy concentrada a lo largo de las costas
oriental y sudoriental, presenta una gran variedad de paisajes, desde montañas
nevadas hasta grandes desiertos. La parte oriental de Australia es una de las zonas
más propensas a los incendios del mundo [38].
32
Varios estudios sobre incendios forestales realizados anteriormente no se han
analizado a nivel estatal debido a la falta de potencia informática o a la ausencia de
conjuntos de datos sobre las zonas de estudio. Gracias a la plataforma de
procesamiento espacial en la nube de GEE y a su catálogo de imágenes de satélite de
varios petabytes es posible realizar este análisis exhaustivo.
Los datos de entrada para representar los incendios se obtienen del conjunto de datos
FIRMS (véase más información sobre el conjunto de datos FIRMS en el capítulo 3). En
la Figura 8 se muestra el número total diario de localizaciones de incendios en toda
Australia durante el año 2019 y parcialmente el año 2020. Este gráfico revela el
33
crecimiento significativo a partir de septiembre de 2019 que disminuyó casi a 0 en
febrero de 2019, precisamente entre el 21 y el 22 de febrero.
34
Figura 8 - Número total de localizaciones de incendios a lo largo de 2019 y parcialmente
para el año 2020 sobre el territorio continental
australiano
35
Figura 9 - Distribución espacial de la precipitación mensual (mm/mes) en Australia durante
enero de 2020 - febrero de 2020 utilizando el conjunto de datos diarios
CHIRPS
36
3. Análisis exploratorio de datos
Este capítulo presenta el análisis exploratorio de los incendios australianos en el mar-
son 2019-2020 y los compara con los incendios forestales de los años anteriores para
esbozar las características principales. Los conjuntos de datos empleados para el
análisis exploratorio de datos incluyen diferentes misiones de satélite, por ejemplo,
VIIRS, MODIS, Sentinel-2. Dichas misiones recogen datos regularmente en todo el
planeta. Los códigos fuente para generar las figuras presentadas en este subcapítulo
se incluyen en el repositorio de GitHub.
Para realizar este análisis se utiliza el conjunto de datos del Reanálisis del Centro
Europeo de Predicción Meteorológica a Medio Plazo (ERA5). Este conjunto de
datos es de libre acceso y ofrece una visión detallada de la atmósfera. El conjunto
de datos cubre la Tierra en una cuadrícula de 30 km y la atmósfera se divide en 137
niveles desde la superficie hasta una altura de 80 km. Este producto avanzado fue
publicado por el Centro Europeo de Predicción Meteorológica a Medio Plazo
(ECMWF) [40]. El ERA5 forma parte de los conjuntos de datos de GEE que consisten
en la banda de temperatura del aire como media mensual a 2 m de altura con
disponibilidad desde 1979 hasta la actualidad.
La figura 10 presenta la temperatura media anual en toda Australia desde 1979 hasta
2019. Como puede observarse, la temperatura media anual durante estos 40 años fue
la más alta en 2019. La diferencia entre la temperatura media anual más baja medida
en 2000 y la más alta medida en 2019 es de aproximadamente 1,8 °C. También es
importante señalar que el récord de temperatura media más alta se batió tres veces
durante las dos últimas décadas, en 2005, 2013 y 2019. Esto sugiere que Australia se
está convirtiendo en un lugar cada vez más cálido, lo que muy probablemente se deba
al cambio climático global.
37
Figura 10 - Temperatura media anual en Australia desde 1979 hasta 2019
38
Para calcular el número total de incendios, se utiliza el conjunto de datos FIRMS del
GEE. Fire In- formation for Resource Management System (FIRMS) distribuye datos
obtenidos por satélite casi en tiempo real en las 3 horas siguientes a la observación
por satélite. FIRMS forma parte de Land, Atmosphere Near real-time Capability
(LANCE) de la NASA para EOS y proporciona tanto los datos del Mod- erate Resolution
Imaging Spectroradiometer (MODIS) con Terra y Aqua EOS como los del Visible
Infrared Imaging Radiometer Suite (VIIRS) [41].
Los incendios activos mostrados en las figuras siguientes se presentan como píxeles
que cubren 1 km2 sobre el terreno. Por lo tanto, este píxel puede contener uno o más
focos de incendio en un radio de 500 m. Además, el tamaño mínimo de incendio
detectable depende de muchas variables,
por ejemplo, el ángulo de barrido, la temperatura de la superficie terrestre, la
cantidad de humo, etc. Por lo general, los satélites MODIS pueden detectar
incendios en llamas y latentes de 1000 m2, pero en condiciones de observación
extremadamente limpias pueden detectarse incendios en llamas más pequeños
(50 m2) [41]. Además, las anomalías térmicas, por ejemplo, los volcanes, pueden
identificarse como incendios activos.
El conjunto de datos FIRMS de GEE incluye la banda T21 que muestra las localizaciones
de incendios activos, donde el valor del píxel determina la temperatura de la superficie
[42]. Esta banda se mide en Kelvin [41].
La figura 11 presenta el número total de incendios en Australia cada año desde 2001
hasta 2019. El último año, 2019, comparado con los 18 anteriores no presenta cifras
destacadas. Tanto 2011 como 2012 destacan como los peores años en cuanto a
actividad de incendios. Los incendios activos registrados en 2017 y 2018 tuvieron
ambos aproximadamente 200 000 incendios más que en 2019.
39
Figura 11 - Número total de píxeles que presentan fuego activo anualmente (del 1 de enero de 2001 al 1 de
marzo de 202 0)
40
La visión detallada que muestra la actividad de los incendios a lo largo de un año es
necesaria para descubrir anomalías a lo largo de los meses. Así, la figura 12
muestra los incendios activos a lo largo de un año desde 2010 hasta marzo de 2020
en Australia. Los años 2011 y 2012 presentan un número significativo de incendios
activos en comparación con otros años. Sin embargo, los datos de incendios
obtenidos por satélite revelan que los incendios más activos durante diciembre y
enero a lo largo de la última década se produjeron en 2019 y 2020,
respectivamente. MODIS registró alrededor de 400.000 indicadores de incendios
activos sobre Australia entre diciembre de 2019 y febrero de 2020.
Figura 12 - Número total de incendios localizados a lo largo de un año durante casi una década
(del 1 de enero de 2010 al 1 de marzo de 2020), un píxel de 1 km contiene uno o más focos de incendio en un
radio de 500 m
41
Figura 13 - Distribución de sucesos de incendios basada en el conjunto de datos FIRMS de enero de 2019 a febrero de 2020
42
4. Metodología
En el capítulo siguiente se describe la metodología utilizada para cumplir los dos
objetivos de este estudio, como son la probabilidad de que se produzcan incendios en
toda Australia y la identificación de los factores que los provocan. Toda la estructura se
divide en tres partes: extracción y preprocesamiento de datos, clasificación y
validación. Esta estructura se presenta en el diagrama de flujo de la Figura 14 y
pretende resumir los procesos esenciales empleados en este estudio.
43
Figura 14 - Diagrama de flujo de los procesos empleados en el estudio para generar el
modelo predictivo en GEE
44
El análisis se llevó a cabo en la plataforma de análisis medioambiental en la nube
GEE utilizando Ja- vaScript, ya que permite realizar el análisis a escala mundial de
forma más eficiente en lo que respecta al coste del tiempo de computación en
comparación con la informática de sobremesa. Además, no es necesario descargar
imágenes satelitales, lo que permite ahorrar tiempo de procesamiento. El código
completo puede obtenerse en el repositorio de GitHub.
46
El flujo de trabajo automatizado utiliza dos misiones de satélite, FIRMS y Sentinel-2,
que se preprocesan con el fin de obtener las localizaciones de los incendios. Las
colecciones de imágenes FIRMS agregan ubicaciones de incendios activos durante el
periodo de un mes a partir de las observaciones diarias en toda Australia con un
cuadro delimitador empleado de 1 km2. A continuación, se vectorizan las áreas de las
ubicaciones de los incendios de FIRMS.
47
partir de las máscaras verde ( B3) y
48
(B11) para eliminar las zonas de agua del análisis. La figura 16 muestra una diferencia
entre la imagen general y la imagen sin nubes ni agua.
El siguiente paso es calcular dNBR, véase el capítulo 2.3 para más información sobre
dNBR. El NBR previo al incendio se calcula a partir del intervalo de tiempo <6 días antes
del inicio del mes, mes de inicio> y el NBR posterior al incendio se calcula a partir del
intervalo de tiempo <final del mes, 6 días después del mes>. El cálculo dNBR destaca
las zonas quemadas y obtiene una evaluación inicial de la gravedad de la quemadura.
Las zonas quemadas seleccionadas dentro de los recuadros que delimitan la ubicación
49
del incendio se vectorizan y, a continuación, se calcula el tamaño de las zonas
quemadas seleccionadas. El área mayor que
50
Se selecciona 0,25 km2 (trama de 500 m x 500 m) para generar los puntos aleatorios. El
criterio del tamaño mínimo significa que los puntos aleatorios se sitúan en zonas
seleccionadas de mayor tamaño, ya que representan un píxel que cubre esta zona
concreta.
Figura 17 - Ejemplo de un incendio forestal utilizado para ilustrar los resultados de los procesos de
quemado
selección de áreas. a) dNBR, b) dNBR con área de fuego vector FIRMS, c) dNBR con área de fuego
vector FIRM y áreas umbral d) dNBR con área de fuego vector FIRMS y áreas umbral y áreas
51
seleccionadas mayores de 0,25 km2
52
La función de puntos aleatorios utilizada en los lugares de procesamiento genera
aleatoriamente 300 puntos de incendio y 300 puntos de no incendio para cada
parte seleccionada (3) para cada mes (6), lo que da como resultado 18 archivos
CSV que constan de 600 puntos por cada archivo. Estos archivos CSV se fusionan
en el archivo final utilizando el código JavaScript almacenado en el repositorio de
GitHub. Cada registro de incendio y de no incendio en el archivo final tiene el
nombre de propiedad "Incendio" y un valor almacenado de tipo entero en el que 1
representa un incendio y 0 un no incendio.
53
Categoría Capas de datos Fuente de datos Tipo de Resolución espacial
datos
Elevación 30 m
Datos digitales
Topografía Pendiente de elevación Trama 30 m
SRTM
Aspecto 30 m
3 segundos de arco
Profundidad del suelo CSIRO SLGA Trama
≈ 90 m
0,25 grados de arco
Humedad del suelo Clima Terra Trama
≈ 4 km
Copérnico
Medio ambiente Cubierta terrestre CGLS-LC100
Trama 100 m
Modificación
Socioeconómic CSP gHM5 Trama 1 km
humana global
o
54
Figura 18 - Factores topográficos: elevación, aspecto y pendiente
55
Figura 19 - Factores medioambientales: cobertura del suelo (la leyenda se encuentra en el Apéndice),
profundidad del suelo, humedad del suelo, índice de gravedad de la
sequía y NDVI.
57
Función estadística
(Media, Mín, Máx,...)
Figura 20 - Ejemplo de imagen obtenida a partir de una función estadística sobre una colección de
imágenes
58
La categoría socioeconómica (Figura 22) incluye la M o d i f i c a c i ó n Humana Global
(GHM), la población, las líneas eléctricas y la distancia de las carreteras. El conjunto de
datos GHM proporciona una medida acumulativa de la modificación humana de las
tierras terrestres en todo el planeta con una resolución espacial de 1 km. Los valores
de GHM varían de 0 a 1 y se asocian a un tipo determinado de modificación humana
también conocido como factor de estrés. Se incluyen los principales factores de estrés
antropogénicos, como los asentamientos humanos, el transporte, la minería y la
producción de energía. La población, procedente del conjunto de datos WorldPop,
estimó el número de personas que residen en cuadrículas de ≈ 85 m. Los datos
vectoriales, las líneas eléctricas y la red de carreteras, se obtienen del Open Street
Map (OSM) y se cargan en la plataforma GEE. Los datos se convierten al formato raster
con una resolución de 500 m, donde para la distancia de las carreteras se aplica la
función de costa acumulativa de G E E '.
Figura 22 - Factores socioeconómicos: GHM, población, líneas eléctricas y distancia de las carreteras
59
4.2 Clasificación
Una vez creados los puntos de entrenamiento con fuego y sin fuego y preprocesados
los factores condicionales, el siguiente paso consiste en crear el conjunto de datos de
entrenamiento enriquecido con valores predictores. En primer lugar, se fusionan las
15 variables independientes para crear una imagen compuesta con 15 bandas (Figura
23).
Figura 23 - Fusión de todas las variables predictoras en la imagen final (script GEE de JavaScript)
60
JavaScript.
61
Figura 25 - Clasificación supervisada ML, concretamente RF, aplicada en la interfaz GEE
Además, los clasificadores GEE siguen teniendo una limitación para analizar la
importancia de las variables. Aunque este estudio compara tres algoritmos ML, sólo un
modelo, precisamente RF puede observar la relación entre los factores condicionantes
del incendio y la ocurrencia del mismo, es decir, la importancia de la variable. Además,
el único clasificador RF en GEE proporciona la función de probabilidad que se muestra
en la Figura 26.
4.3 Validación
Los modelos ML entrenados pueden predecir la localización del incendio; sin
embargo, es importante evaluar el rendimiento de estos modelos. Por esta razón,
se lleva a cabo la evaluación de la precisión.
Para la validación del modelo, el conjunto de datos de muestra de lugares con y sin
incendios se divide en conjuntos de datos de entrenamiento y de prueba. Para ello, se
aplica la función randomColumn, que añade una columna al conjunto de datos de
muestra y los valores a una columna por defecto. Los puntos se dividen en una
proporción de 70:30, lo que significa que el 70% se utiliza como conjunto de datos de
entrenamiento y el 30% como conjunto de datos de prueba. La evaluación de la
precisión se aplica al conjunto de datos de prueba, que evalúa la precisión basándose
en la matriz de confusión. A partir de la matriz de confusión, se obtienen la precisión
global y el kappa, como puede verse en la Figura 27. Todos los resultados de la
validación se presentan en la Figura 27. Todos los resultados de la validación se
62
presentan en el capítulo Resultados.
63
Figura 27 - Evaluación de la precisión
64
5. Resultados
En este capítulo se resumen los resultados de este estudio basados en la metodología
aplicada. La primera sección proporciona los resultados de las localizaciones de los
incendios recogidos de las misiones Sentinel-2 y FIRMS. La segunda parte de este
capítulo revela los resultados obtenidos de los diferentes algoritmos ML, donde las
variables de predicción empleadas se recogen de la observación de la Tierra, excepto
los datos de carreteras y redes eléctricas. El resultado de los algoritmos ML, el mapa
de probabilidad de incendios, se presenta en el tercer subcapítulo de este capítulo.
Finalmente, el último subcapítulo proporciona los resultados del análisis de la
importancia de las variables, cuyos resultados se derivan del algoritmo ML.
65
Figura 28 - Distribución de los puntos de incendio y de no incendio en el proceso automatizado
66
El área anterior y posterior al incendio se visualiza en la imagen RGB. Las alertas
mensuales de incendios activos se calculan utilizando las bandas B5 y B12 y verifican
los puntos de incendio dentro de la zona donde se encuentra la alerta de incendio de
Sentinel-2.
67
del 70% que representa 3250 muestras de prueba. Las muestras contienen 1633 clases
de incendio y 1617 clases de no incendio. La tabla 4 recoge los resultados de la
precisión de los modelos ML. La mejor precisión global corresponde al modelo RF
(96%).
68
mientras que el rendimiento más bajo lo representa el modelo NB (64%). Los
resultados de CART (93%) no son tan precisos como los de RF, pero muestran un mejor
rendimiento que el modelo NB.
La matriz de confusión revela que estos 3 algoritmos suelen predecir bien la clase de
no incendio en comparación con la predicción de la clase de incendio. El modelo RF
clasificó correctamente las 1593 muestras de prueba de incendio de 1633, lo que
significa que sólo 40 muestras de prueba de incendio se predijeron incorrectamente.
Las 1540 muestras sin fuego se predijeron correctamente y sólo 77 se clasificaron
incorrectamente.
Los modelos NB y CART no pueden manejar la clasificación con valores perdidos. Esto
puede ocurrir al procesar diferentes factores predictivos representados en raster for-
mat. Estas cuadrículas pueden tener algunas celdas perdidas que representan la
ausencia de datos. Por lo tanto, el número de muestras de prueba es menor en CART y
NB, aunque el conjunto de datos de prueba de entrada es el mismo que para el
modelo RF.
Matriz de confusión
Precisió
Kappa
Predicción Predicted
∑ n global
No-Fuego Fuego
No real -
524 1087 1611
Bayes Incendio
64% 27%
ingen Incendio real 75 1515 1590
Actual
1494 117 1611
No - Fuego
CARRO (300) Incendio real 77 1513 1590
93% 88%
69
El script de evaluación de la precisión con los algoritmos RF y CART se ejecutó
varias veces para encontrar el número adecuado de árboles máximos para el
modelo RF y de nodos hoja máximos para el modelo CART. Se trata de un paso
esencial, ya que estas cifras tienen un impacto directo en la precisión del modelo.
Además, también puede revelar cuántos nodos hoja es importante implementar
cuando se clasifican dos clases.
Como se observa en la Figura 30, la precisión del modelo CART aumenta con el
número de nodos hoja hasta alcanzar los 300 nodos hoja. A partir de más de 300
nodos hoja, la precisión del modelo es casi constante. Los resultados del modelo RF
mostrados en la Figura 31 revelan que con el aumento del número de árboles también
aumenta la precisión. Por tanto, el número óptimo de árboles aplicado en el modelo
RF de este estudio es de 300 árboles.
Figura 30 - Precisión de los modelos CART con un número diferente de nodos hoja aplicados
70
5.3 Importancia de los condicionantes
El modelo RF alcanza una mayor precisión en comparación con otros modelos ML
como NB y CART. Por lo tanto, se elige como el modelo ML más apropiado y adecuado
para la predicción de incendios forestales. Este modelo permite medir
cuantitativamente la contribución de cada variable al resultado de la clasificación, lo
que resulta útil para evaluar la importancia de cada variable. La i m p o r t a n c i a d e
las variables se calculó a p a r t i r del conjunto de datos de entrenamiento.
71
5.4 Modelo predictivo
El modelado predictivo es el concepto general de construcción de un modelo ML
capaz de realizar predicciones. En este estudio, el modelo de RF y el conjunto de datos
de entrenamiento presentan los incendios forestales en Australia durante la
temporada 2019-2020. El mapa de probabilidad se muestra en la Figura 33, donde un
valor bajo presentado por el color verde es un área con la menor probabilidad de
ocurrencia de incendios forestales, mientras que el valor muy alto presentado por el
color rojo representa áreas con la mayor probabilidad de susceptibilidad a incendios
forestales. Las clases de riesgo de incendio mostradas en la Figura 34 se dividen en
cinco clases.
72
Figura 34 - El mapa de susceptibilidad al fuego con clases utilizando el modelo RF
73
6. Debate
El capítulo de debate presenta las conclusiones del estudio realizado y evalúa los
posibles puntos fuertes y débiles de los métodos aplicados.
Una de las limitaciones de este flujo de trabajo son los periodos de tiempo cortos, no
superiores a 1 mes, ya que pueden dar lugar a resultados sesgados debido a que las
zonas quemadas estarían influidas por los cambios naturales de la vegetación.
75
Se probó el número de árboles del modelo RF para aumentar la precisión. Resulta que
el modelo con 300 árboles puede lograr el mejor rendimiento. Sin embargo, este
número d e á r b o l e s e n e l modelo podría aumentar cuando s e implementaran
más variables predictivas en el modelo actual. En general, los algoritmos ML en GEE se
pueden procesar sin identificar los números de árboles de los nodos hoja para el
modelo CART debido a los valores predeterminados implementados.
Siempre es esencial validar la estabilidad de los modelos ML. En este estudio se utilizó
la validación más común, la técnica de división entrenamiento/prueba. Este enfoque
aporta la ventaja de que se puede ver la respuesta del modelo a datos no vistos
anteriormente. Además, la muestra de prueba se produjo mediante números
aleatorios, lo que debería mitigar el riesgo de sesgo de muestreo.
Este desarrollo presenta las grandes oportunidades de las plataformas GEE utilizadas
para la re-búsqueda debido a la libre disponibilidad de los conjuntos de datos y el
procesamiento de los algoritmos en el entorno de la nube. Por estas razones, no hay
necesidad de descargar, almacenar, procesar y analizar la gran cantidad de datos en
un ordenador local, sin embargo, se requiere la conexión a Internet. Así pues, todo el
76
ámbito del estudio, desde la generación de un conjunto de datos de entrenamiento y
el preprocesamiento de los datos de satélite y el modelo ML entrenado se llevó a cabo
en
77
la potente herramienta GEE basada en la nube en toda el área masiva de interés.
Este análisis con conjuntos de datos espaciosos no sería posible llevarlo a cabo en
un ordenador local.
Por otro lado, también existen limitaciones, como la exportación de los datos
rasterizados con una buena resolución en toda Australia, incluso cuando la zona se
dividió en varias cuadrículas. Además, esta plataforma no es óptima en última
instancia debido a la falta de acceso a estadísticas relativas a la clasificación. Aunque
las numerosas misiones por satélite se presentan en la biblioteca GEE, la mayoría de
ellas proporcionan datos para América o Europa. Sería mejor utilizar más variables
condicionantes referidas a los incendios forestales aplicando diferentes misiones por
satélite que cubran Australia.
78
7. Conclusión
En este capítulo se responde a las preguntas de investigación propuestas.
Además, Australia es cada vez más cálida, según los datos por satélite del conjunto de
datos atmosféricos ERA5, debido al cambio climático. Por lo tanto, si no se toman
medidas de mitigación y preparación, Australia sufrirá más incendios forestales y más
graves en el futuro.
79
variables muestran que las más importantes son la humedad del suelo, la temperatura
y la sequía, lo que concuerda con el modelo RF.
80
otros estudios en los que estos factores también desempeñan un papel
importante. Por otro lado, la menor influencia la tuvo la red eléctrica.
La tecnología mejorada ayuda a alcanzar los ODS de muchas maneras. Así, este estudio
combina la teledetección, los macrodatos, los algoritmos de minería de datos y los
modelos de aprendizaje automático para recopilar datos de imágenes de satélite en
grandes áreas y recuperar información para predecir la incidencia de los incendios
forestales. Esto puede ayudar a evitar desastres similares mediante una mejor
planificación de las infraestructuras en las zonas propensas a los incendios.
81
8. Trabajos futuros
Existe un gran potencial para predecir catástrofes naturales basándose en modelos de
aprendizaje automático con enormes cantidades de conjuntos de datos de buena
calidad procedentes de la teledetección. Este estudio muestra la aplicación del modelo
GEE a los incendios con fines aca- démicos, pero el concepto de predicción puede
aplicarse a otras catástrofes naturales. El modelo de predicción podría sustituir a los
métodos tradicionales utilizados en la actualidad.
Todavía hay varias partes que podrían mejorarse en el futuro. Los modelos de
aprendizaje automático utilizan el conjunto de datos de entrenamiento para aprender
a reconocer patrones y aplicar tecnologías. En este estudio sólo se compararon tres
algoritmos de ML que son adecuados en GEE, pero sería interesante comparar otros
modelos como las redes neuronales, en las que cada neurona se representa como
círculos que están conectados. Este modelo puede aprender, crear relaciones
complejas y hacer predicciones precisas cuando se le presentan nuevos datos.
82
9. Bibliografía
[1] Derek Weber, Mehwish Nasim, Lucia Falzon, Lewis Mitchell, "Arson Emergency
and Australia's "Black Summer": Polarización y desinformación en las redes
sociales", 2020.
[2] CDP, "Center for Disaster Philanthropy, Incendios forestales en Australia 2019-
2020". 17 de febrero, pp. h ttp s :/ / d i s a s terp h i l a n th ro p y. org/disaster/2019-
australian-wildfires/, 2 0 2 0 .
[3] Pei Yu, Shanshan Li, "Bushfires in Australia: a serious health emergency under
climate change", 10 de enero de 2020. [en línea].
[6] Nathalie Pettoreli, "Satellite remote sensing for conservation", WWF, 2009, p. 125.
[9] F. Sunar, C. Ozkan, "Forest fire analysis with remote sensing data", Remote
Sensing, p. 13, 14 de marzo de 2000.
[10] Guang Xu, Xu Zhong, "Real-time wildfire detection and tracking in Australia using
geostacionary satellite: Himawari-8", Australia, p. 11, 17 de julio de 2017.
83
[12] Yifang Ban, Puzhao Zhang, Andrea Nascetti, Alexandre R. Bevington, Michael
A. Wulder, "Near Real-Time Wildfire Progression Monitoring with Sentinel-1 SAR
Time Series and Deep Learning", Nature Nature
Research, www.nature.com/scientificreports, 2020.
[15] Carl H. Key, Nathan C. Benson, "Remote sensing of severity, the Normalized Burn
Ratio", en Landscape Assessment (LA), Sampling and Analysis Methods, 2006, p.
56.
[17] Allison E. Snyder, Peter Z. Fulé, Joseph E. Crouse, "Comparison of burn severity
assessments using Differenced Normalized Burn Ratio and ground data,"
Northern Arizona University, p. 11, 2005.
[18] FIREMON BR Cheat Sheet, The Normalized Burn Ratio (NBR) - Breve resumen del
procesamiento Pasos, Junio 2004. [En línea].
Disponible:
https://burnseverity.cr.usgs.gov/pdfs/lav4_br_cheatsheet.pdf.
84
[21] Mohd Hasmadi, Pakhriazad HZ, Shahrin MF, Evaluating supervised and
unsupervised techniques for land, Malaysian Journal of Society and Space,
2009.
[25] Heidi Spratt, Hyunsu Ju, Allan R. Brasierb, "A structured approach to
predictive modeling of a two-class problem using multidimensional data
sets", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3661737/, 2013.
[26] Ljubomir Gigović, Hamid Reza Pourghasemi, Siniša Drobnjak, Shibiao Bai , Testing
a New Ensemble Model Based on SVM and Random Forest in Forest
Susceptibility Assessment and Its Mapping in Serbia's Tara National Park,
Aplicaciones de la tecnología de teledetección en silvicultura y REDD, 2019.
[27] Andy Liaw, Matthew Wiener, Clasificación y regresión por bosque aleatorio, R
News, diciembre de 2002.
[28] Allen Downey, Anders Gorm, Anna Lincoln, Arauzo, "Clasificador Naive Bayes".
[30] Sofia Visa, Brian Ramsay, Anca Ralescu, Easther Knaap, Confusion Matrix-based
Feature Selection, The 22nd Midwest Artificial Intelligence and Cognitive Science,
USA, 2011.
[31] Maria Antonia Brovelli, Monia Elisa Molinari, Eman Hussein, Jun Chen, Ran Li, The
First Comprehensive Accuracy Assessment of Globe Land 30 at National Level:
Methodology and Results, www.mdpi.com/journal/remotesensing, marzo de
2015.
85
[32] Anthony J. Viera, Joanne M. Garrett, Understanding Interobserver Agreement:
The Kappa Statistic, Research Series, mayo de 2005.
[33] Kim Calders, Inge Jonckheere, Joanne Nightingale, Mikko Vastaranta, "Remote
Sensing Technology Applications in Forestry and REDD+", Basilea, 2020.
[34] Onisimo Mutanga, Lalit Kumar, "Aplicaciones del motor Google Earth",
Teledetección, p. 4, 12 de marzo de 2019.
[36] Lalit Kumar, Onisimo Mutanga, "Google Earth Engine Applications", en la edición
impresa del número especial publicado en Remote Sensing, fireBasel, Suiza, ISBN
978-3-03897-884-8, 2019, p. 422.
[37] Li Huan, Wei Wan, Yu Fang, Siyu Zhu, Xi Chen, Baojian Liu, Yang Hong, "A Google
Earth Engine enabled software for efficiently generating high-quality user ready
Landsat mosaic images", p. 7, 6 de noviembre de 2018.
[38] Williams Robyn, Vandenbeld John, Nature of Australia : a portrait of the island
continent, 1988.
[39] Tufa Dinku, Chris Funk, Pete Peterson, Ross Maidment, Tsegaye Tadesse,
"Validation of the CHIRPS Satellite Rainfall Estimates over Eastern of Africa:
Validation of the CHIRPS Satellite Rainfall Estimates," ADVANCES IN REMOTE
SENSING OF RAINFALL AND SNOWFALL, vol. nternational Research Institute for
Climate, p. 23, 2018.
[42] Louis Giglio, Wilfrid Schroeder, Joanne V. Hall, Christopher O. Justice, "MODIS
Guía del usuario del producto Collection 6 Active Fire", diciembre de 2018.
86
[43] Objetivos de Desarrollo Sostenible, "TRANSFORMAR NUESTRO MUNDO: EL 2030
AGENDA PARA Sostenible Sostenible Sostenible". UNITED
NACIONES UNIDAS, sustainabledevelopment.un.org.
87
10. Anexo
A. Descripción de la cubierta terrestre
88
B. Modelo de bosque aleatorio
19
J2
// 1 LaodCover
30 // €OP2BRzCU9 IAt¥D OOVER Tarifas ageype 03ass 'tabLe:
4t var mnaav-r w-.msg l-ct*onUcorr.vr az-na- -r .u=ze-urv o: i'i
39 yep LandCower - LandCower.selsot{'discre e_classification'}.mosaic{}.clip{szstzalia} ;
33 snas €laasnau -'<Ra6tecSymboIi:er''t
t4
y naedleleava.1 r.aresc ' >' +
45 '<€olcrnapEot:y cclor='fO0bdaa' juantity='il0' lalie2='iiC
K''ro1i--Sh*wb;-n']/?.la:-l.in'4"/>' +
'<-:olorFmoxr.-*y' color="€ SiSJ4J' guar.clay=" :£O' laEei=": O
Gra6alan3/8o:est-5hzñbland'/J'
89
.:':' var srtm - ee.Image(":.' ' 'R: ...
var s:tm - sr:m.clip(Australia)
90
v*- # va *-- - m*-[.we*Coll*C:i''o('!''.'''}-
fil:erlee.Fi1ter.eq('
var 6oi*Pepth - datase:.selectl" l.mcsaic(l .clip(Austral:at;
.[iltez(ee.Pilte:.öate('' .: . 'l};
var :e: ' man - temp max.selectl -'. ''}.reducelee.Aeducer.mean(1).cl plAus:ralia};
'';? <var fusión - fusión.selecFl{'.'''. :..' :', '- :', ' :: :.:.',
91
var point - ee.FeatureCollection(" - - 'c '-- ' ,-: ")
'' S c{:'?e *.ne ir.'at -oager\'*: jet a Peatu:e'Z:llect::.:'' .ž *rainii:g :a::a. var
classifierTraining - merge.$amp1eRegionz(
{ co 11 - c c i on : P° i ri I , pr c'po r c i - s : ( ' ' I):
(características:clasificadorEntrenamiento,
classProperty:' ',inputProperties: bandst);
var ccn I ue1onfi'ta t r i x1r ray- -e . Fm- tu r- (rtu11 . (ma c r x : con I us i onJ'ta c r 1x . ar r ay ( ) ) ) : J '
px1nt ( ' : :. - : ' . -- - :." - z t. '-:-" - : :-: . '., con£us lonNacr ixnxxay) :
93
/-" van ove-Accuracy - ee.reacure(null, {matrix: consusionxatriz.accuracyl}l;;
'%. prin:{'..". "' .. ".::.. ', overAccuracyl
' .: var chart u^.Char:. feature.DyDroper:y lvariabie importancia} . 6ettaartZype l' '' .' : :.
leQend.addllegendTitle}.-
'. .' 'nombres var - [' t.'y . '. .'. ',' . '. ,
legent.aJdlRcv[paleta[:l, nombres(i]}l
:} Nap.add(legerdl :
-'.var mapbtyle - [
estilizadores:
[Seatuzet pe: }{color: '-
'IJj,
( :fiea t u c eZ-,'pe '.:.. ,elesentType:
:
stylersr }Ccclor: -.' -. -.'-'}1l,
94
95