Cartografía De La Vegetación Terrestre En Menos De 20 Minutos Con Amazon SageMaker

0
34
Map Earth’s vegetation in under 20 minutes with Amazon SageMaker

En un mundo en constante evolución, la vigilancia de la salud de la vegetación de nuestro planeta se ha vuelto más crucial que nunca. La vegetación desempeña un papel vital en el mantenimiento del equilibrio ecológico, proporcionando sustento y actuando como sumidero de carbono. Históricamente, el monitoreo de la salud de la vegetación ha sido una tarea ardua. Métodos como los estudios de campo y el análisis manual de datos satelitales no solo consumen mucho tiempo, sino que también requieren recursos significativos y experiencia en el área. Estas enfoques tradicionales son engorrosos y suelen causar demoras en la recolección y análisis de datos, lo que dificulta el seguimiento y la respuesta rápida a los cambios ambientales. Además, los altos costos asociados con estos métodos limitan su accesibilidad y frecuencia, frenando los esfuerzos globales de monitoreo de vegetación a escala planetaria. En respuesta a estos desafíos, se ha desarrollado una solución innovadora que optimiza y mejora la eficiencia de los procesos de monitoreo de vegetación a nivel mundial.

Cambiando de las tradicionales y laboriosas metodologías, las capacidades geoespaciales de Amazon SageMaker presentan una solución eficiente y rentable. SageMaker ofrece capacidades de aprendizaje automático (ML) geoespacial, permitiendo a científicos de datos e ingenieros construir, entrenar y desplegar modelos ML utilizando datos geoespaciales. Estas nuevas capacidades abren un abanico de posibilidades para el monitoreo ambiental. Con SageMaker, los usuarios pueden acceder a un amplio conjunto de datos geoespaciales, procesarlos y enriquecerlos de manera eficiente, acelerando sus tiempos de desarrollo. Tareas que antes tomaban días o incluso semanas ahora pueden completarse en una fracción del tiempo.

En este artículo, se demuestra el poder de las capacidades geoespaciales de SageMaker al mapear la vegetación mundial en menos de 20 minutos. Este ejemplo no solo destaca la eficiencia de SageMaker, sino también cómo el aprendizaje automático geoespacial puede utilizarse para el monitoreo ambiental con fines de sostenibilidad y conservación.

Se inicia ilustrando cómo SageMaker puede aplicarse al análisis de datos geoespaciales a escala global. El proceso comienza especificando las coordenadas geográficas que definen un cuadro delimitador que cubre las áreas de interés. Este cuadro actúa como filtro para seleccionar únicamente las imágenes satelitales relevantes que abarcan las masas de tierra.

Las capacidades geoespaciales de SageMaker permiten acceder a una amplia variedad de conjuntos de datos geoespaciales públicos, incluyendo Sentinel-2, Landsat 8, Copernicus DEM y NAIP. Para el proyecto de mapeo de la vegetación, se seleccionó Sentinel-2 por su cobertura global y frecuencia de actualización. El satélite Sentinel-2 captura imágenes de la superficie terrestre a una resolución de 10 metros cada 5 días. Para asegurar un análisis preciso, se filtran las imágenes con menos del 10% de cobertura nubosa, utilizando las de la primera semana de diciembre de 2023.

Utilizando la función de búsqueda de colección de datos ráster de SageMaker, se identificaron 8.581 imágenes únicas de Sentinel-2 tomadas durante esa semana. Al validar la precisión de nuestra selección, se confirmaron las imágenes correctas para el análisis.

Las capacidades de procesamiento geoespacial de SageMaker ofrecen un enfoque simplificado y gestionado para crear y ejecutar un clúster. Al emplear distribuidores automatizados de recursos y contenedores geoespaciales específicos, tareas que involucran terabytes de datos pueden ahora abordarse más rápida y fácilmente.

En este proyecto, se utilizaron 25 clústeres, cada uno compuesto por 20 instancias, para escalar la carga de trabajo geoespacial. Las imágenes se dividieron en 25 lotes, cada uno procesando alrededor de 340 imágenes, cargadas en Amazon S3 listas para el trabajo de procesamiento.

La lógica de cómputo definida calculó el Índice de Vegetación de Diferencia Normalizada (NDVI), un criterio esencial para evaluar la salud y distribución de la vegetación. NDVI es calculado con el diferencial entre las reflectancias de infrarrojo cercano (NIR) y rojo, normalizado por su suma.

Para completar el análisis, se configuró el entorno de computación adecuado, se definieron los detalles del cálculo y se organizaron los insumos y resultados. Una vez listos, se iniciaron múltiples trabajos de procesamiento en paralelo, permitiendo procesar todas las imágenes en menos de 20 minutos utilizando 500 instancias.

La eficiencia de SageMaker ha abierto nuevas oportunidades para el monitoreo ambiental, especialmente en el área de mapeo de vegetación. Más allá de demostrar la viabilidad técnica, representa un avance significativo sobre los métodos tradicionales, brindando una flexibilidad que facilita el escalamiento de recursos según sea necesario.

Esta integración de ML y analíticas geoespaciales promete mejorar nuestra comprensión de los sistemas ecológicos del planeta, permitiendo un monitoreo en tiempo real y la capacidad de responder de manera más informada a los cambios, contribuyendo significativamente a los esfuerzos globales de conservación.
vía: AWS machine learning blog