Esta investigación propuso diseñar un método automatizado que permita identificar y monitorear los cambios en la superficie deforestada y su localización en Argentina a bajo costo, con alta frecuencia y de modo escalable. Para ello, se utilizaron como fuente imágenes satelitales de MODIS-15, polígonos de deforestación generados por el Monitor de Desmonte, y se evaluaron distintos modelos de clasificación.
¿Por qué monitorear la deforestación?
La deforestación de bosques nativos es una problemática que se profundizó a partir de la década de los 70, con la introducción de tecnologías agropecuarias vinculadas a la producción de soja. Estas permitieron que adquirieran especial relevancia zonas que antes eran consideradas marginales para el modelo agroindustrial, principalmente los bosques del norte del país.
Si bien en 2007 se sancionó la Ley Nacional de Presupuesto Mínimos de Protección Ambiental de los Bosques Nativos, apenas entre los años 2018 y 2020 se han perdido alrededor de 659.595 hectáreas de bosque en las distintas regiones del país. Esto implica una reducción importante de los niveles anteriores (por ejemplo, entre 2008-2011 hubo una pérdida de 1.213.854 hectáreas en la región de Yungas, Parque Chaqueño, Selva Paranaense y Espinal), pero es notoria la continuidad de los desmontes a pesar de la moratoria prevista por la legislación nacional.
¿Por qué imágenes satelitales?
Frente al escenario expuesto previamente, se evidencia la necesidad de disponer de un monitoreo continuo que sirva como insumo para hacer efectiva la legislación nacional, enviando alertas a las provincias sobre el avance de deforestación de montes en zonas protegidas.
El uso de imágenes satelitales resulta sumamente conveniente para precisar información geográfica detallada a lo largo de un amplio período de tiempo. El crecimiento en su accesibilidad ha permitido que se convierta en una herramienta útil para el monitoreo del avance de cambios en la trayectoria de uso de suelo. Un hito en su uso para la política pública es el Sistema de Alerta de Detección Temprana (SAT) Nacional monitorea la pérdida de bosque nativo de forma continua a partir de un análisis descriptivo de los valores de índice de vegetación y una supervisión manual de las regiones detectadas como deforestadas.
¿Cómo se usaron las imágenes satelitales en este proyecto?
Este proyecto se propuso elaborar un modelo de detección interanual de deforestación en regiones del Parque Chaqueño superando dos limitaciones del SAT. La primera, la apertura en la generación de datos públicos. El SAT no presenta un repositorio de código abierto donde se explicite la metodología utilizada ni las bases de datos generadas con información abierta. Por otro lado, se busca escalar los resultados del modelo al no depender de una inspección manual de los resultados.
Para detectar zonas deforestadas y no deforestadas utilizamos tres insumos principales: imágenes satelitales de Google Earth Engine, los polígonos de deforestación etiquetados por el Monitor de Desmonte y los datos etiquetados con trayectorias de suelo elaborados por Rosati (2022) en base a datos de la Agencia Espacial Europea (ESA) producidos en la “Climate Change Initiative-Land”.
En base a estos tres insumos, generamos una base de datos de una serie de puntos aleatorios en regiones del Parque Chaqueño. Para cada uno de estos puntos, obtenemos la trayectoria del índice de vegetación de los últimos 20 años, y les agregamos una etiqueta si ese punto fue deforestado en el último año o no. Luego, entrenamos tres modelos estadísticos para predecir cuáles eran los puntos deforestados y ver cuál funcionaba mejor.
Los resultados
Probamos tres modelos estadísticos distintos para predecir la etiqueta de clasificación. El modelo que mejor funcionó fue Random Forest, que capturó el 91% de los puntos deforestados, y clasificó correctamente el 87% de los puntos deforestados.
Estos modelos también funcionan bien para predecir deforestación según las regiones de protección de bosques nativos definidas por las OTBN provinciales. Podemos observar que si bien hay un sesgo hacia la detección de falsos positivos (es decir, a detectar puntos “de más»), la distribución de puntos predichos como deforestados se distribuyen de manera similar que los puntos reales entre las categorías de conservación.
Categoría de conservación | Deforestación real | Random | Regresión logística | XGBoost |
I | 4,19 | 5,80 | 6,42 | 6,33 |
II | 45,03 | 45,57 | 44,82 | 44,48 |
III | 50,78 | 49,34 | 48,76 | 49,19 |
Tabla 1. Distribución según categoría de conservación de los puntos del set de evaluación, por valor predicho y valor real.
El código con el procesamiento de los datos, el entrenamiento de los modelos, la evaluación y el deployment para nuevas regiones puede encontrarse en un repositorio abierto de Github.
¿Y ahora qué?
Este proyecto permite dar cuenta de las potencialidades que brindan las imágenes satelitales para las transformaciones y cambios en el uso del suelo. Este prototipo desarrolló exitosamente modelos de aprendizaje supervisado en base a etiquetas de fuentes secundarias y el índice de vegetación. Google Earth Engine se presenta como una herramienta abierta, accesible y útil para obtener fuentes de monitoreo de cambios en el suelo. Esto no se limita a las imágenes de MODIS: sólo por mencionar un ejemplo, Dynamic World provee un monitoreo continuo de cobertura de suelo que podría permitir desarrollar un sistema de alerta actualizado en tiempo casi real. Se evidencia que los datos abiertos y el aprendizaje automático brindan herramientas sumamente útiles para el desarrollo de políticas públicas de gestión ambiental.