Avanzando en la Identificación de Plantas con Aprendizaje Profundo
Este estudio explora el uso del aprendizaje profundo para identificar especies de plantas en arqueología.
― 8 minilectura
Tabla de contenidos
Desde filósofos antiguos hasta científicos modernos, la forma de los seres vivos siempre ha llamado la atención. En campos como la arqueobotánica, la forma de los restos vegetales a menudo es la única pista que tenemos. Los investigadores han usado tanto características visuales como medibles para identificar plantas, especialmente semillas y huesos de fruta, típicamente hasta el nivel de especie. Han surgido nuevos métodos para analizar estas formas de manera más precisa y entender cómo varían en tamaño y forma.
Morfometría Geométrica?
¿Qué es laLa morfometría geométrica (GMM) es una forma de describir la forma de los objetos usando matemáticas. Este enfoque implica convertir las formas en números que se pueden analizar. Los investigadores suelen mirar puntos específicos en un objeto o usar las curvas que componen una forma. En arqueobotánica, se estudian frecuentemente las curvas porque dan buena información incluso cuando los puntos claros son difíciles de encontrar.
Al comparar materiales vegetales antiguos con ejemplos modernos, GMM proporciona información sobre cómo las plantas han cambiado con el tiempo, cómo han aparecido nuevos tipos y cómo la historia humana está vinculada con las plantas que cultivaron.
Aprendizaje Profundo
El Papel delRecientemente, el aprendizaje profundo ha surgido como una herramienta importante en muchas áreas, desde la investigación académica hasta aplicaciones industriales. Un método específico, llamado Redes Neuronales Convolucionales (CNN), ha sido particularmente útil para tareas como el reconocimiento de imágenes. Esta tecnología se ha utilizado en varios campos, incluida la identificación de plantas, pero aún no es común en arqueobotánica o estudios morfométricos.
Especies Vegetales Estudiadas
Este estudio se centra en cuatro plantas importantes: palma datilera, oliva, vid y cebada. Estas plantas han sido clave para la supervivencia humana en el Mediterráneo durante miles de años. Las formas silvestres de estas plantas pueden parecer muy similares a sus versiones cultivadas, lo que hace difícil la identificación. Además, la cebada tiene varias variedades que se han utilizado para diferentes propósitos, lo que añade otra capa de complejidad.
Los investigadores han logrado un gran avance en distinguir entre tipos silvestres y domésticos de aceitunas y vides usando GMM. Sin embargo, determinar las diferencias entre las palmas datileras silvestres y cultivadas y entre cebada de dos hileras y de seis hileras sigue siendo un desafío.
Objetivos del Estudio
El objetivo de esta investigación es ver qué tan bien el aprendizaje profundo puede ayudar a identificar diferentes tipos de estas plantas en comparación con los métodos tradicionales de morfometría geométrica. Específicamente, busca responder a dos preguntas clave: ¿Puede CNN superar las líneas base establecidas por GMM? ¿Y cuántos datos se necesitan para entrenar efectivamente los modelos?
El estudio evaluó cuatro modelos de plantas para diferenciar entre tipos silvestres y domesticados de palma datilera, oliva y vid, así como entre cebada de dos hileras y de seis hileras.
Expectativas de CNN
Se anticipa que CNN, cuando se entrene con grandes cantidades de datos, rendirá mejor que los métodos tradicionales como EFT, especialmente porque CNN puede analizar más que solo la forma de un objeto; también puede analizar la textura y otras características. Sin embargo, hay desafíos que los modelos deben superar:
Bajas diferencias: Las diferencias entre las formas de los tipos silvestres y domésticos pueden ser bastante sutiles, lo que hace que sean difíciles de identificar con precisión.
Conjuntos de datos pequeños: Los conjuntos de datos utilizados son más pequeños de lo que normalmente se necesita para tareas de aprendizaje profundo, lo que puede limitar el rendimiento del modelo.
Líneas base existentes fuertes: GMM ya ha demostrado ser bastante efectivo en esta área.
Modelos amigables para el usuario: El objetivo es hacer que los modelos de CNN sean lo suficientemente simples para que cualquiera los use, incluso aquellos que no son expertos, y que se puedan ejecutar en computadoras estándar.
Métodos Utilizados
Entorno Estadístico
Los análisis se realizaron utilizando herramientas de software específicas. El hardware utilizado era bastante básico según los estándares actuales, lo que resalta la accesibilidad de los métodos.
Conjuntos de Datos
El estudio utilizó imágenes de semillas y huesos de fruta de las cuatro especies vegetales. Cada semilla fue fotografiada desde dos ángulos, lo que ayudó a aumentar la variedad de formas disponibles para análisis. Los investigadores se aseguraron de tener suficiente material y una identificación segura para las plantas involucradas.
Modelos de Aprendizaje Profundo
Para los modelos de CNN, los investigadores utilizaron una arquitectura común conocida como VGG16. La estructura del modelo se ajustó para enfocarse en las tareas de clasificación específicas. El proceso de entrenamiento incluyó equilibrar el número de imágenes utilizadas para diferentes clasificaciones para asegurar comparaciones justas.
Línea Base de Morfometría Geométrica
Para los métodos tradicionales, los investigadores emplearon transformadas de Fourier elípticas para analizar los contornos de los materiales vegetales. Transformaron imágenes en máscaras de silueta para extraer datos relevantes de forma para el análisis, ayudándoles a determinar los tipos de plantas mediante métodos estadísticos clásicos.
Comparaciones de Modelos
Los investigadores repitieron el proceso de prueba varias veces con diferentes tamaños de muestra para comparar el rendimiento de CNN contra GMM. Cada método fue evaluado sobre qué tan precisamente podía identificar los diferentes tipos de plantas.
Resultados
El estudio encontró que los modelos de CNN pudieron superar a GMM en muchos casos, especialmente cuando se utilizaron conjuntos de datos más grandes. De 280 pruebas, CNN tuvo un mejor desempeño en 213 casos, lo que es alrededor del 76% del tiempo.
Para las plantas de vid y oliva, donde GMM ya funcionaba bien, los modelos de CNN mostraron incluso mayor precisión, especialmente con muestras de entrenamiento más grandes. El rendimiento mejoró significativamente cuando el número de imágenes de entrenamiento superó las 500 para estos tipos de plantas.
Por otro lado, para la cebada y la palma datilera, aunque CNN todavía tuvo un mejor rendimiento cuando había suficientes puntos de datos, las mejoras no fueron tan grandes en comparación con el rendimiento existente de GMM.
En general, los modelos de CNN tomaron un tiempo considerable para ejecutarse, pero requirieron mucha menos preparación para las imágenes que los métodos de GMM, que necesitaron mucho trabajo cuidadoso.
Conclusiones
Los hallazgos sugieren que los enfoques de CNN pueden superar los métodos tradicionales al identificar semillas y frutas de plantas. Aunque las mejoras en precisión pueden no ser siempre enormes, sigue siendo un resultado sorprendente, especialmente dado que CNN funcionó bien incluso con conjuntos de datos pequeños.
Identificar variedades silvestres y domésticas de aceitunas y vides fue relativamente sencillo, mientras que la palma datilera y la cebada presentaron más complejidades.
El estudio indica que CNN podría ser particularmente útil para identificar taxa específicos, especialmente cuando los tamaños de muestra son grandes. Esto tiene implicaciones para investigaciones futuras, ya que las técnicas de CNN podrían ahorrar tiempo y costos al intentar identificar tipos de plantas en contextos arqueológicos.
Direcciones Futuras
La investigación abre caminos para estudios más amplios usando CNN en varios otros materiales arqueológicos y especies. Con el potencial de explorar niveles taxonómicos más bajos, estos métodos podrían beneficiar no solo a los arqueobotanistas sino también a conservacionistas y otros interesados en la identificación de plantas.
En el futuro, estudios más profundos podrían abordar cómo se puede utilizar CNN para otros artefactos arqueológicos y cómo pueden complementar los métodos tradicionales de GMM. Hay una fuerte posibilidad de que, en lugar de competir entre sí, estos dos enfoques puedan trabajar juntos de manera efectiva.
Aplicaciones Más Amplias del Aprendizaje Profundo
Más allá de la identificación, el aprendizaje profundo se puede aplicar a muchos más desafíos en arqueología y otros campos. Podría ayudar en tareas como la segmentación de datos, la reconstrucción de partes rotas y la corrección de métodos de recolección de datos.
En resumen, la investigación demuestra que CNN es una herramienta prometedora para identificar restos vegetales en arqueología, mostrando el potencial para desarrollos futuros en métodos tradicionales y nuevas tecnologías en el campo.
Título: Deep learning versus geometric morphometrics for archaeobotanical domestication study and subspecific identification
Resumen: Taxonomical identification of archaeological fruit and seed is of prime importance for any archaeobotanical studies. We compared the relative performance of deep learning and geometric morphometrics at identifying pairs of plant taxa. We used their seeds and fruit stones that are the most abundant recovered organs in archaeobotanical assemblages, and whose morphological identification, chiefly between wild and domesticated types, allow to document their domestication and biogeographical history. We used existing modern datasets of four plant taxa (date palm, barley, olive and grapevine) corresponding to photographs of two orthogonal views of their seeds that were analysed separately to offer a larger spectrum of shape diversity. On these eight datasets, we compared the performance of a deep learning approach, here convolutional neural networks (CNN), to that of a geometric morphometric approach, here outline analyses using elliptical Fourier transforms (EFT). Sample sizes were at minimum eight hundred seeds in each class, which is quite small when training deep learning models but of typical magnitude for archaeobotanical studies. Our objectives were twofold: i) to test whether deep learning can beat geometric morphometrics in taxonomic identification and if so, ii) to test which minimal sample size is required. We ran simulations on the full datasets and also on subsets, starting from 50 images in each binary class. For CNN networks, we deliberately used a candid approach relying on pre-parameterised VGG16 network. For EFT, we used a state-of-the art morphometrical pipeline. The main difference rests in the data used by each model: CNN used bare photographs where EFT used (x, y) outline coordinates. This "pre-distilled" geometrical description of seed outlines is often the most time-consuming part of morphometric studies. Results show that CNN beats EFT in most cases, even for very small datasets. We finally discuss the potential of CNN for archaeobotany, why outline analyses and morphometrics have not yet said their last word by providing quantitative descriptions, and how bioarchaeological studies could embrace both approaches, used in a complementary way, to better assess and understand the past history of species.
Autores: Vincent Bonhomme, L. Bouby, J. Claude, C. Dham, M. Gros-Balthazard, S. Ivorra, A. Jeanty, C. Pagnoux, T. Pastor, J.-F. Terral, A. Evin
Última actualización: 2024-04-26 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2023.09.15.557939
Fuente PDF: https://www.biorxiv.org/content/10.1101/2023.09.15.557939.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.