Usando YOLOv8 para detectar fresas
Este artículo examina la efectividad de YOLOv8 para identificar la madurez de las fresas.
Abdul-Razak Alhassan Gamani, Ibrahim Arhin, Adrena Kyeremateng Asamoah
― 7 minilectura
Tabla de contenidos
- Importancia de una Detección Precisa
- Resumen del Modelo YOLOv8
- Rendimiento de los Modelos YOLOv8
- Aprendizaje Profundo en Agricultura
- La Necesidad de Automatización
- Revisión de la Literatura Existente
- Objetivo de la Investigación
- Metodología
- Entrenamiento y Pruebas de los Modelos
- Métricas de Rendimiento
- Resultados y Discusión
- Conclusión
- Fuente original
Identificar Fresas en diferentes etapas de madurez es importante para manejar su crecimiento y asegurar una buena cosecha. Este artículo analiza qué tan bien funcionan diferentes configuraciones del modelo YOLOv8, una herramienta para reconocer y segmentar imágenes, para detectar fresas maduras e inmaduras en un campo abierto.
Importancia de una Detección Precisa
Detectar fresas con Precisión ayuda a los agricultores a mejorar sus rendimientos y manejar mejor las plagas. Este conocimiento les permite tomar mejores decisiones sobre cuándo cosechar y cómo manejar sus cultivos después de la recolección. Nuestro enfoque está en el modelo YOLOv8, que ha mostrado buenos resultados en la identificación de fresas y puede ayudar a automatizar estas tareas en la agricultura.
Resumen del Modelo YOLOv8
El modelo YOLOv8n demostró ser el mejor en nuestras pruebas, logrando una media de Precisión Promedio (mAP) del 80.9% para Segmentación. Esto significa que pudo identificar y separar fresas en las imágenes de manera efectiva. Además, este modelo procesó imágenes más rápido que otros, tomando solo 12.9 milisegundos por imagen. El modelo YOLOv8s, el más lento en nuestras pruebas, tomó alrededor de 22.2 milisegundos.
En nuestras pruebas con 86 imágenes, el modelo YOLOv8n identificó 235 fresas maduras y 51 inmaduras de un total de 251 fresas maduras y 97 inmaduras. En contraste, el modelo YOLOv8s detectó solo 204 fresas maduras y 37 inmaduras.
Rendimiento de los Modelos YOLOv8
El modelo YOLOv8n destacó no solo en precisión, sino también en velocidad. Aquí hay un vistazo rápido al rendimiento de varios modelos YOLOv8:
- YOLOv8n: El más rápido y preciso.
- YOLOv8s: Más lento y menos preciso que el YOLOv8n.
- YOLOv8m, YOLOv8l y YOLOv8x: Más lentos con diferentes precisiones.
El modelo YOLOv8n es capaz de detectar rápida y precisamente fresas maduras e inmaduras, lo cual es esencial para prácticas agrícolas efectivas.
Aprendizaje Profundo en Agricultura
El aprendizaje profundo está cambiando la forma en que los agricultores monitorean sus cultivos. Ayuda a las máquinas a aprender a reconocer y segmentar objetos en imágenes, convirtiéndose en un jugador clave en tareas agrícolas como contar frutas y detectar plagas. Al analizar imágenes, el aprendizaje profundo puede llevar a mejores prácticas agrícolas, uso eficiente de recursos y mayores rendimientos de cultivos.
En el caso de las fresas, usar tecnologías avanzadas de reconocimiento de imágenes puede ayudar a identificar patrones de crecimiento y problemas potenciales, como plagas o deficiencias de nutrientes. Esto es especialmente importante para las fresas, que crecen rápido y pueden requerir mano de obra significativa para la cosecha.
La Necesidad de Automatización
La cosecha tradicional de fresas puede ser intensa en mano de obra y consumir mucho tiempo. Aquí es donde la automatización se vuelve crucial. Al usar modelos como YOLOv8, los agricultores pueden automatizar la detección de frutas, lo que lleva a reducir costos laborales y mejorar la salud de los cultivos.
Los robots equipados con visión por máquina también pueden ayudar a evaluar la calidad de la fruta y el momento de la cosecha. Al detectar irregularidades en el crecimiento de la fruta temprano, los agricultores pueden actuar antes de que los problemas escalen.
Revisión de la Literatura Existente
Muchos estudios han investigado la detección automática de frutas, utilizando varios métodos. Por ejemplo, algunos investigadores usaron técnicas de aprendizaje automático para mejorar el reconocimiento de frutas en imágenes. Estudios específicos se centraron en los modelos YOLO que detectaron cultivos con éxito bajo diferentes condiciones y fondos.
A medida que los modelos de la serie YOLO continúan adaptándose a las necesidades agrícolas, han mostrado gran promesa en mejorar la precisión de detección. Estos avances facilitan la automatización de los procesos de detección de frutas, incluidas las fresas.
Objetivo de la Investigación
A pesar de los avances, no ha habido suficiente enfoque en comparar los modelos de la serie YOLO para identificar la mejor opción para detectar fresas. Este artículo tiene como objetivo evaluar varios modelos YOLO para ver cuál funciona mejor para detectar fresas maduras e inmaduras.
El objetivo principal es evaluar el rendimiento de diferentes configuraciones de YOLO para segmentar imágenes de fresas. Contar las frutas con precisión puede dar mejores perspectivas sobre los rendimientos esperados y ayudar en el monitoreo del crecimiento.
Metodología
El estudio siguió un proceso de tres pasos: capturar imágenes, segmentar frutas y estimar el rendimiento. El conjunto de datos se recopiló de una plataforma en línea y contenía imágenes de fresas con etiquetas que indicaban maduras, inmaduras y sus pedúnculos (la parte del tallo).
Para preparar el conjunto de datos para el aprendizaje profundo, las imágenes se aumentaron para mejorar el entrenamiento. Los modelos YOLOv8 se entrenaron en una computadora usando GPUs de NVIDIA, donde se emplearon configuraciones específicas de los modelos YOLOv8.
Entrenamiento y Pruebas de los Modelos
Durante el entrenamiento, analizamos varias configuraciones de YOLOv8, como YOLOv8n, YOLOv8s, YOLOv8m, YOLOv8l y YOLOv8x. Cada configuración tenía ajustes como tamaños de lote y tasas de aprendizaje ajustadas para optimizar el rendimiento.
El proceso de entrenamiento varió; por ejemplo, el YOLOv8n terminó el entrenamiento después de aproximadamente 2.5 horas, mientras que otros modelos completaron el entrenamiento dentro de plazos similares o ligeramente más largos.
Métricas de Rendimiento
Para evaluar el rendimiento del modelo, utilizamos métricas como precisión, recuperación y puntaje F1. La precisión mide cuántas de las detecciones predichas eran correctas. La recuperación indica qué tan bien el modelo encontró todas las fresas reales. El puntaje F1 proporciona un único puntaje de rendimiento al combinar precisión y recuperación.
Después de realizar pruebas, nuestros resultados mostraron que el modelo YOLOv8n detectó 286 fresas con precisión del total disponible.
Resultados y Discusión
Al evaluar el rendimiento de los modelos YOLOv8 en las 86 imágenes de prueba, el modelo YOLOv8n tuvo el mAP más alto en 80.9%. También tuvo las mejores métricas de Precisión y Recuperación en comparación con otros modelos. Se incluyeron figuras que muestran ejemplos de imágenes de verdad en el suelo, junto con las predicciones del modelo, para ilustrar la efectividad del modelo YOLOv8n.
Las velocidades de detección efectivas de los diferentes modelos también se registraron, siendo el YOLOv8n el más rápido, reforzando sus ventajas para aplicaciones agrícolas prácticas.
Conclusión
En conclusión, el modelo de segmentación de instancias YOLOv8n es muy efectivo para detectar fresas maduras e inmaduras. Con su alta precisión y velocidad, podría beneficiar enormemente a los agricultores que buscan automatizar sus procesos de recolección y monitoreo de frutas. Con los avances en tecnología, hay oportunidades para mejorar aún más estos sistemas, haciéndolos aún más útiles en entornos agrícolas.
Para futuros esfuerzos, usar mejores métodos de recolección de datos, como cámaras avanzadas montadas en vehículos, y examinar nuevos métodos de aprendizaje automático podría mejorar los resultados. Aplicar estos hallazgos en campos de fresas reales puede ayudar a los agricultores a detectar frutas de manera eficiente y predecir rendimientos con precisión. Integrar estas tecnologías en sistemas robóticos podría transformar la forma en que se cosechan las fresas, llevando a prácticas agrícolas rentables y sostenibles.
Título: Performance Evaluation of YOLOv8 Model Configurations, for Instance Segmentation of Strawberry Fruit Development Stages in an Open Field Environment
Resumen: Accurate identification of strawberries during their maturing stages is crucial for optimizing yield management, and pest control, and making informed decisions related to harvest and post-harvest logistics. This study evaluates the performance of YOLOv8 model configurations for instance segmentation of strawberries into ripe and unripe stages in an open field environment. The YOLOv8n model demonstrated superior segmentation accuracy with a mean Average Precision (mAP) of 80.9\%, outperforming other YOLOv8 configurations. In terms of inference speed, YOLOv8n processed images at 12.9 milliseconds, while YOLOv8s, the least-performing model, processed at 22.2 milliseconds. Over 86 test images with 348 ground truth labels, YOLOv8n detected 235 ripe fruit classes and 51 unripe fruit classes out of 251 ground truth ripe fruits and 97 unripe ground truth labels, respectively. In comparison, YOLOv8s detected 204 ripe fruits and 37 unripe fruits. Overall, YOLOv8n achieved the fastest inference speed of 24.2 milliseconds, outperforming YOLOv8s, YOLOv8m, YOLOv8l, and YOLOv8x, which processed images at 33.0 milliseconds, 44.3 milliseconds, 53.6 milliseconds, and 62.5 milliseconds, respectively. These results underscore the potential of advanced object segmentation algorithms to address complex visual recognition tasks in open-field agriculture effectively to address complex visual recognition tasks in open-field agriculture effectively.
Autores: Abdul-Razak Alhassan Gamani, Ibrahim Arhin, Adrena Kyeremateng Asamoah
Última actualización: 2024-08-13 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2408.05661
Fuente PDF: https://arxiv.org/pdf/2408.05661
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.