ApisTox: Un Conjunto de Datos Clave para la Salud de las Abejas
ApisTox ofrece información clave sobre los efectos de los pesticidas en las abejas.
― 10 minilectura
Tabla de contenidos
- Presentando ApisTox: Un Nuevo Conjunto de Datos
- Antecedentes sobre los Datos de Toxicidad en Abejas
- Características del Conjunto de Datos ApisTox
- Fuentes de Datos Utilizadas en ApisTox
- Pasos de Procesamiento de Datos
- Divisiones del Conjunto de Datos para Análisis
- Disponibilidad del Conjunto de Datos ApisTox
- Calidad del Conjunto de Datos ApisTox
- Importancia de los Grupos Funcionales y el Análisis Molecular
- Aplicación del Conjunto de Datos ApisTox
- Conclusión
- Fuente original
- Enlaces de referencia
Las poblaciones de abejas están disminuyendo en todo el mundo, lo que plantea graves problemas para la agricultura, la naturaleza y el medio ambiente. Las abejas son vitales para polinizar plantas, lo cual es necesario para el crecimiento de muchos cultivos y flores. Sin abejas, enfrentaríamos desafíos en la producción de alimentos y el equilibrio ecológico. Para abordar este problema, necesitamos información confiable sobre los factores que afectan la salud de las abejas, como los Pesticidas que encuentran.
Datos
Presentando ApisTox: Un Nuevo Conjunto dePara llenar el vacío en el conocimiento sobre la toxicidad de las abejas relacionada con los pesticidas, se ha creado un nuevo conjunto de datos llamado ApisTox. ApisTox se centra específicamente en cómo diferentes pesticidas afectan a las abejas melíferas (Apis mellifera). Este conjunto de datos ha recopilado información de varias fuentes, resultando en una colección amplia y bien organizada de datos sobre la toxicidad química hacia las abejas.
El conjunto de datos ApisTox incluye información detallada como los niveles de toxicidad para varios químicos y otros detalles relevantes como cuándo se publicó la información y cómo se conecta con otras bases de datos químicas. Se espera que este conjunto de datos ayude a investigadores, formuladores de políticas y agricultores a entender mejor los impactos de los pesticidas en las abejas, lo que podría llevar a estrategias más efectivas para proteger a estas criaturas importantes.
Antecedentes sobre los Datos de Toxicidad en Abejas
La disminución de las poblaciones de abejas es una preocupación creciente, ya que podría llevar a una reducción en los rendimientos agrícolas y una pérdida de biodiversidad. Para evaluar los impactos de diferentes factores en la salud de las abejas, como los pesticidas y los cambios ambientales, necesitamos datos de alta calidad. Los conjuntos de datos existentes, como BeeTox y partes de ECOTOX, ofrecen información útil, pero tienen limitaciones en cuanto a su alcance y detalle.
Muchos conjuntos de datos separan la información sobre pesticidas de los datos relacionados con la toxicidad de las abejas, lo que complica un análisis integral. ApisTox busca reunir datos curados de múltiples fuentes, convirtiéndose en el conjunto de datos más grande y consistente disponible para estudiar la toxicidad de los pesticidas en las abejas melíferas.
La creación de este conjunto de datos fue impulsada por el deseo de comprender mejor las conexiones entre las abejas y sus Entornos. La disminución global de las poblaciones de abejas involucra una mezcla de muchos factores, incluyendo la exposición a pesticidas y cambios climáticos. Al recopilar y organizar datos de varias fuentes confiables, ApisTox permite a los investigadores analizar una gama más amplia de químicos y proporciona un recurso consistente para el análisis de datos.
Características del Conjunto de Datos ApisTox
ApisTox contiene una amplia variedad de tipos de datos, que incluyen los niveles de toxicidad de diferentes pesticidas, herbicidas, insecticidas y otros químicos. También incluye información sobre el momento en que se registraron los químicos y referencias a otras fuentes químicas. El conjunto de datos asegura que los datos de alta calidad y estandarizados para la investigación sobre abejas estén fácilmente disponibles.
Un aspecto único de ApisTox es su potencial para evaluar métodos utilizados para predecir propiedades moleculares relacionadas con químicos agrícolas. El conjunto de datos permite a los investigadores probar y mejorar modelos de predicción tanto en ciencia ambiental como en quimioinformática, avanzando nuestro conocimiento en estos campos y ayudando en los esfuerzos de conservación de las abejas.
Fuentes de Datos Utilizadas en ApisTox
Para construir el conjunto de datos ApisTox, se reunió información de tres fuentes principales, todas conocidas por proporcionar datos de calidad en ciencia ambiental:
ECOTOX: Esta base de datos es mantenida por la Agencia de Protección Ambiental de los Estados Unidos (EPA). Contiene datos en bruto y resultados experimentales sobre diferentes sustancias que afectan a varias especies, incluidas las abejas melíferas. Aunque es rica en datos, tiene menos información estructurada que otras bases de datos.
Base de Datos de Propiedades de Pesticidas (PPDB): Esta base de datos cataloga información detallada sobre químicos pesticidas, incluyendo sus propiedades y efectos sobre la salud y el medio ambiente. Proporciona datos estructurados que ayudan en el análisis del uso de pesticidas y la gestión de riesgos.
Base de Datos de Bio-Pesticidas (BPDB): Esta fuente se centra en pesticidas derivados de productos naturales, como microorganismos y extractos de plantas. Proporciona información sobre sus propiedades y efectividad.
Los datos de estas fuentes fueron cuidadosamente filtrados y limpiados antes de ser combinados en el conjunto de datos ApisTox, asegurando consistencia y precisión.
Pasos de Procesamiento de Datos
El procesamiento de los datos recolectados de ECOTOX, PPDB y BPDB involucró varios pasos:
Filtrado de Datos de ECOTOX: Los datos de ECOTOX fueron filtrados para incluir solo registros relacionados con las abejas melíferas, enfocándose en los efectos de mortalidad y los valores de dosis letal media (LD50). Se eliminaron las mediciones no relacionadas con las abejas melíferas, así como las mediciones de campo poco confiables.
Estandarización de Mediciones: Luego, los datos fueron estandarizados para asegurar unidades de medición consistentes. Se convirtieron o eliminaron las unidades no estándar, resultando en un conjunto de datos más limpio.
Mapeo de Tipos de Exposición: Se estandarizaron las diversas formas en que los pesticidas pueden afectar a las abejas, como la exposición oral o por contacto, para facilitar el análisis.
Agregación de Datos: Las mediciones en bruto fueron compiladas y organizadas bajo pesticidas individuales, permitiendo comparaciones más claras entre diferentes estudios.
Adición de Información Química: Se obtuvo información adicional sobre cada pesticida, incluidos los strings SMILES y números CID de PubChem, que ayudan con el procesamiento de datos y la identificación de químicos en bases de datos más grandes.
Combinación de los Conjuntos de Datos: Después de limpiar y procesar los datos de todas las fuentes, los conjuntos de datos se fusionaron para crear una colección unificada que fue tanto completa como organizada.
Divisiones del Conjunto de Datos para Análisis
Para un uso efectivo del conjunto de datos ApisTox en investigación, se divide en partes de entrenamiento y prueba. Esto asegura que los modelos entrenados con los datos puedan ser evaluados con precisión en su rendimiento predictivo. El conjunto de datos se dividió de tres maneras diferentes:
División Aleatoria Estratificada: Este método divide aleatoriamente los datos mientras mantiene la proporción de pesticidas tóxicos y no tóxicos.
División por Tiempo: Este método organiza los datos según las fechas de publicación de los químicos, simulando la introducción real de nuevos pesticidas a lo largo del tiempo.
División MaxMin: Este enfoque selecciona el conjunto de prueba para maximizar la diversidad de químicos, asegurando una amplia cobertura del espacio químico.
Cada una de estas divisiones ayuda en la validación del rendimiento de los modelos predictivos desarrollados utilizando el conjunto de datos ApisTox.
Disponibilidad del Conjunto de Datos ApisTox
El conjunto de datos ApisTox es accesible en plataformas como GitHub y Zenodo. Se proporciona en formato CSV, lo que lo hace fácil de usar y trabajar para los investigadores. El archivo principal del conjunto de datos, junto con los datos en bruto y limpiados, está bien estructurado, permitiendo un análisis directo de la información contenida.
Calidad del Conjunto de Datos ApisTox
Las verificaciones de calidad en el conjunto de datos ApisTox muestran que cubre una amplia gama de puntos de datos en comparación con las fuentes originales. El conjunto de datos compilado es más grande que cualquiera de las fuentes de datos individuales y demuestra una integración de datos efectiva. La naturaleza única de este conjunto de datos, junto con los rigurosos pasos de limpieza y procesamiento tomados, confirma su confiabilidad para la investigación sobre la toxicidad de pesticidas en las abejas.
Además, se analizaron varias propiedades químicas básicas de las moléculas para asegurar que se ajusten a los estándares esperados. Las distribuciones de estas propiedades indican una rica variedad de químicos, reflejando la naturaleza diversa del conjunto de datos.
Importancia de los Grupos Funcionales y el Análisis Molecular
Entender la estructura de las moléculas de pesticidas es crucial para analizar su toxicidad hacia las abejas melíferas. Diferentes grupos funcionales dentro de estas moléculas pueden afectar cómo interactúan con los sistemas biológicos. El conjunto de datos ApisTox proporciona información sobre qué grupos funcionales son más comunes en compuestos tóxicos frente a no tóxicos, ofreciendo información valiosa para futuras investigaciones.
Al identificar características específicas asociadas con la toxicidad, los investigadores pueden trabajar para desarrollar pesticidas más seguros. Esto no solo beneficia a las abejas, sino que también mejora la calidad de las prácticas agrícolas.
Aplicación del Conjunto de Datos ApisTox
El conjunto de datos ApisTox está diseñado para diversas aplicaciones prácticas. Los investigadores pueden usarlo para analizar los impactos de diferentes pesticidas en las poblaciones de abejas melíferas, llevando a mejores prácticas en agricultura y gestión ambiental. Algunas de las aplicaciones potenciales incluyen:
Modelado Predictivo: El conjunto de datos puede ser utilizado para crear modelos que predicen la toxicidad de pesticidas basados en características químicas.
Desarrollo de Políticas: La información del conjunto de datos puede informar a los formuladores de políticas y partes interesadas sobre regulaciones y prácticas que minimizan el daño de los pesticidas a las abejas.
Herramientas Educativas: El conjunto de datos sirve como recurso para instituciones académicas y organizaciones enfocadas en la conservación de abejas y la investigación ambiental.
Evaluaciones de Seguridad Química: Al entender los efectos de los pesticidas en las abejas, los investigadores pueden identificar alternativas más seguras para su uso agrícola.
Evaluación de Modelos Moleculares: ApisTox puede servir como referencia para evaluar diferentes técnicas de modelado predictivo en ciencia ambiental y quimioinformática, ayudando a avanzar el conocimiento en estas áreas.
Conclusión
La disminución global de las poblaciones de abejas es un problema apremiante que puede tener consecuencias de gran alcance para la seguridad alimentaria y la salud ambiental. La creación del conjunto de datos ApisTox marca un paso significativo hacia adelante en la mejora de nuestro conocimiento sobre la toxicidad de pesticidas hacia las abejas melíferas.
Al proporcionar un recurso completo y estructurado, ApisTox ofrece a investigadores y formuladores de políticas las herramientas que necesitan para estudiar los efectos de sustancias químicas dañinas en la salud de las abejas y abogar por prácticas agrícolas más seguras. El conjunto de datos tiene un gran potencial para mejorar nuestra comprensión de las complejas interacciones entre químicos, medio ambiente y poblaciones de abejas, contribuyendo, en última instancia, a los esfuerzos por proteger a estos polinizadores vitales.
Título: ApisTox: a new benchmark dataset for the classification of small molecules toxicity on honey bees
Resumen: The global decline in bee populations poses significant risks to agriculture, biodiversity, and environmental stability. To bridge the gap in existing data, we introduce ApisTox, a comprehensive dataset focusing on the toxicity of pesticides to honey bees (Apis mellifera). This dataset combines and leverages data from existing sources such as ECOTOX and PPDB, providing an extensive, consistent, and curated collection that surpasses the previous datasets. ApisTox incorporates a wide array of data, including toxicity levels for chemicals, details such as time of their publication in literature, and identifiers linking them to external chemical databases. This dataset may serve as an important tool for environmental and agricultural research, but also can support the development of policies and practices aimed at minimizing harm to bee populations. Finally, ApisTox offers a unique resource for benchmarking molecular property prediction methods on agrochemical compounds, facilitating advancements in both environmental science and cheminformatics. This makes it a valuable tool for both academic research and practical applications in bee conservation.
Autores: Jakub Adamczyk, Jakub Poziemski, Pawel Siedlecki
Última actualización: 2024-11-29 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2404.16196
Fuente PDF: https://arxiv.org/pdf/2404.16196
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.