La contaminación del aire en África se ha consolidado como una de las crisis de salud ambiental más urgentes, desencadenando múltiples enfermedades en todo el continente. Organizaciones como sensors.AFRICA luchan por abordar este desafío implantando cientos de sensores de calidad del aire, aunque enfrentan serios problemas de datos. Las mediciones de PM2.5 sufren de lagunas significativas debido a la inestabilidad eléctrica y problemas de conectividad en áreas de alto riesgo, donde el mantenimiento físico es limitado.
Estas carencias en los datos no solo disminuyen el poder estadístico, sino que también introducen sesgos que conducen a inferencias poco fiables sobre la calidad del aire. Esto compromete decisiones críticas en el control de la contaminación, la evaluación de su impacto en la salud y el cumplimiento normativo.
Para mitigar estos problemas, se ha recurrido a Amazon SageMaker Canvas, una plataforma de aprendizaje automático sin código que permite predecir niveles de PM2.5 a partir de datos incompletos. Este avance es vital, ya que la exposición al PM2.5 es responsable de millones de muertes prematuras a nivel mundial por enfermedades cardiovasculares y respiratorias.
La principal ventaja de SageMaker Canvas es su capacidad para manejar datos incompletos eficazmente. A diferencia de los sistemas de monitoreo tradicionales que requieren datos completos, esta plataforma puede generar predicciones fiables incluso con huecos en la información. Esto asegura el funcionamiento continuo de las redes de monitoreo, evitando costosos tiempos de inactividad y la falta de datos, proporcionando así a las agencias medioambientales y de salud pública información crítica sobre la calidad del aire de forma ininterrumpida.
La solución propuesta, integrada con Amazon SageMaker AI, AWS Lambda y AWS Step Functions, está dirigida a analistas ambientales y funcionarios de salud pública que necesitan datos confiables para el análisis y la toma de decisiones. El sistema utiliza más de 15 millones de registros recolectados entre marzo y octubre de 2022 en diversas áreas de Kenia y Nigeria.
La metodología no solo aborda el análisis actual, sino que también se enfoca en identificar y llenar las brechas de datos causadas por limitaciones en los sensores y problemas de conectividad. Este esfuerzo es esencial para mejorar la respuesta a los desafíos emergentes de calidad del aire y para informar decisiones oportunas en salud pública.