Computación Planetaria: Un Camino a la Acción
Conectando datos para tomar mejores decisiones ambientales y actuar urgentemente.
― 8 minilectura
Tabla de contenidos
La computación planetaria se trata de hacer que los datos de todo el mundo sean fáciles de acceder y usar. Estos datos, que vienen de satélites y otras fuentes, pueden ayudarnos a entender y solucionar problemas ambientales urgentes como el cambio climático y la pérdida de biodiversidad. Hoy en día, muchos expertos necesitan trabajar juntos para enfrentar estos desafíos, pero a menudo les faltan las herramientas para hacerlo de manera efectiva.
La Necesidad de Actuar
Ahora mismo, nuestro planeta enfrenta serios desafíos. Hay niveles crecientes de dióxido de carbono en el aire, pérdida rápida de especies y desiertos en expansión. Para abordar estos problemas, necesitamos una comprensión clara de qué tan bien están funcionando nuestros esfuerzos para adaptarnos y reducir el daño. Esto requiere reunir y procesar grandes cantidades de datos sobre nuestro entorno rápidamente.
La complejidad de estos problemas significa que no podemos depender solo de las acciones del gobierno. Los científicos, líderes empresariales, periodistas y responsables de políticas tienen un interés en determinar el estado de nuestro ambiente y predecir futuros cambios. Necesitan información confiable para guiar los esfuerzos de conservación e informar al público.
El Rol de los Datos de teledetección
Los datos de teledetección son cruciales para tener una visión global de la salud ambiental. Estos datos provienen de satélites que orbitan la Tierra, drones que vuelan sobre ecosistemas y dispositivos de medición en el suelo. Sin embargo, los sistemas que se necesitan para manejar estos datos de manera eficiente no son amigables. Muchas personas que podrían usar esta información carecen de las habilidades técnicas necesarias para navegar estos sistemas.
A medida que la urgencia de la crisis climática aumenta, la relación entre los estudios ambientales y las decisiones políticas se vuelve más inmediata. Desafortunadamente, esta velocidad crea oportunidades para el mal uso, ya que actores malintencionados podrían malinterpretar o manipular los datos para sus propios fines.
Construyendo Confianza con la Tecnología
Los sistemas informáticos pueden jugar un papel importante en el procesamiento e interpretación de datos planetarios. También pueden ayudar a construir confianza en los conocimientos derivados de estos datos al asegurar transparencia, responsabilidad y respuestas oportunas en la toma de decisiones.
Para ilustrar esta necesidad, podemos ver varios escenarios del mundo real que destacan lo que los científicos y responsables de políticas requieren de estos sistemas.
Escenarios del Mundo Real
Calculando Tasas de Extinción
Los ecólogos estudian hábitats para crear estadísticas globales de extinción. A menudo combinan datos satelitales con décadas de observaciones manuales. El desafío es que si se revelan los puntos de observación individuales, las especies pueden estar en peligro por cazadores furtivos. Por lo tanto, el proceso de limpiar y normalizar los datos es esencial antes de usar el aprendizaje automático para estimar información faltante. Estos datos impulsan los esfuerzos de restauración de hábitats, que deben actualizarse regularmente a medida que nueva información está disponible.
Política de Uso de Suelo
Gestionar el uso del suelo requiere un equilibrio entre la producción de alimentos y la protección de hábitats naturales. Un funcionario público que evalúa los impactos del uso del suelo en la biodiversidad necesita acceder a conjuntos de datos de alta resolución que retrocedan varias décadas. Estos conjuntos de datos deben centrarse en numerosas especies que están en riesgo de extinción. Los gestores de recursos naturales también necesitan explorar estos datos de manera interactiva mientras pueden escalar sus análisis para países enteros.
Protegiendo Bosques Tropicales
Para proyectos de conservación destinados a proteger grandes áreas de selva tropical de la tala ilegal, los guardaparques necesitan datos de uso de suelo actualizados. Un sistema interactivo les permitiría superponer estos datos con información local sobre áreas de preocupación, como carreteras ilegales. La integración continua de datos de teledetección con informes locales puede impulsar acciones inmediatas, mientras que el seguimiento de fuentes de datos asegura fiabilidad.
Características Esenciales del Sistema
Para apoyar efectivamente a científicos, periodistas y responsables de políticas, un sistema debería ser fácil de usar, permitiéndoles analizar datos espaciales y temporales sin necesidad de conocimientos expertos en sistemas informáticos. Las siguientes características son esenciales:
- Acceso a grandes conjuntos de datos: Los usuarios necesitan acceder fácilmente a datos de observación primaria, conocimientos derivados de IA y resultados anteriores.
- Cálculos amigables para el usuario: El sistema debería permitir a los usuarios expresar sus cálculos mediante lenguajes de programación familiares como R o Python.
- Almacenamiento a largo plazo: Los resultados y datos deberían archivarse para uso futuro, con un seguimiento claro de las fuentes de datos y protecciones de privacidad.
- Exploración Interactiva: El sistema debería permitir a los usuarios explorar datos de manera incremental e incorporar conocimientos locales.
Ideal Flujo de Datos
Un sistema exitoso necesita gestionar un flujo de datos confiable, que consta de varias fases:
- Ingestión: Esto implica adquirir conjuntos de datos de teledetección, que generalmente necesitan normalizarse a un formato común.
- Transformar: Aquí, se realizan cálculos complejos en los conjuntos de datos, a menudo utilizando diferentes lenguajes de programación.
- Analizar: Los sistemas externos deberían poder acceder a estos datos a través de APIs u otras interfaces.
- Publicar: Los resultados deben almacenarse de una manera que los investigadores puedan consultar en el futuro.
Abordando Necesidades del Usuario
Los sistemas también deberían priorizar la usabilidad para científicos y responsables de políticas:
- Extensibilidad: Los usuarios deberían poder agregar nuevas herramientas o bibliotecas sin necesidad de ayuda técnica.
- Accesibilidad: El sistema debe ser lo suficientemente sencillo para que cualquier persona pueda usar sin capacitación especializada.
- Rastreo: Los usuarios deberían poder rastrear resultados hasta sus fuentes de datos originales, asegurando que se cumplan todas las preocupaciones de privacidad.
Herramientas Actuales y Limitaciones
Existen varios sistemas actualmente para ayudar con la ciencia ambiental, pero tienen notables deficiencias. Por ejemplo, Google Earth Engine y Microsoft Planetary Computer son soluciones basadas en la nube que brindan acceso a imágenes satelitales y permiten a los usuarios procesar datos con lenguajes de programación familiares. Sin embargo, ambos tienen límites en transparencia, reproducibilidad y accesibilidad.
Construir sistemas personalizados utilizando componentes de código abierto también es una opción, pero a menudo implica gestionar complejidades significativas y no es amigable para usuarios no técnicos. Esto dificulta que una comunidad más amplia adopte estrategias ambientales esenciales.
Introduciendo Ark: Un Nuevo Enfoque
El sistema prototipo "Ark" busca abordar estos desafíos al cumplir con todos los requisitos mencionados. Ark permite a los científicos trabajar en lenguajes de programación familiares mientras proporciona herramientas para la gestión de datos.
Ark soporta flujos de datos que gestionan la información de manera eficiente. Usa un formato de datos común que permite un procesamiento rápido a través de varios recursos informáticos. Las características clave de Ark incluyen:
- Normalización de datos en la ingestión: Esto facilita el trabajo con los datos sin transformaciones repetidas.
- Flujo de datos dinámico: Ark puede ajustarse a las necesidades del usuario y secuenciar cálculos de manera eficiente.
- Soporte para inferencia basada en IA: Ark puede rastrear entradas y salidas para modelos de aprendizaje más profundos, promoviendo la responsabilidad y claridad.
- Entrega de resultados simplificada: El sistema puede enviar salidas más pequeñas a otros servicios, asegurando que los datos sensibles puedan mantenerse protegidos.
Un Llamado a la Colaboración
Para construir un modelo exitoso de computación planetaria, necesitamos un esfuerzo colectivo que involucre a varios expertos. Las necesidades únicas de científicos y responsables de políticas deben dar forma al diseño de estos sistemas, creando herramientas que sean fluidas para usuarios no técnicos.
Mantener un equilibrio entre privacidad y transparencia es crucial. Los sistemas existentes a menudo priorizan uno sobre el otro, dejando la puerta abierta para el mal uso. Una posible solución es adoptar un enfoque por fases para la liberación de datos, donde la información sensible se mantenga privada inicialmente y solo luego se haga pública.
Necesitamos un marco impulsado por la comunidad que apoye el intercambio de datos y algoritmos entre diferentes organizaciones. Esto no solo mejorará nuestra comprensión de los desafíos ambientales, sino que también llevará a acciones efectivas.
Al integrar conocimientos de sistemas informáticos a gran escala con datos satelitales, podemos crear una plataforma accesible para científicos y responsables de políticas en todo el mundo, asegurando la protección de la biodiversidad y abordando el cambio climático de manera eficiente.
Título: Planetary computing for data-driven environmental policy-making
Resumen: We make a case for "planetary computing" -- infrastructure to handle the ingestion, transformation, analysis and publication of global data products for furthering environmental science and enabling better informed policy-making. We draw on our experiences as a team of computer scientists working with environmental scientists on forest carbon and biodiversity preservation, and classify existing solutions by their flexibility in scalably processing geospatial data, and also how well they support building trust in the results via traceability and reproducibility. We identify research gaps in the intersection of computing and environmental science around how to handle continuously changing datasets that are often collected across decades and require careful access control rather than being fully open access.
Autores: Patrick Ferris, Michael Dales, Sadiq Jaffer, Amelia Holcomb, Eleanor Toye Scott, Thomas Swinfield, Alison Eyres, Andrew Balmford, David Coomes, Srinivasan Keshav, Anil Madhavapeddy
Última actualización: 2024-06-01 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2303.04501
Fuente PDF: https://arxiv.org/pdf/2303.04501
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.