Mejorando la Calidad de Impresión en Botellas de Vidrio con Aprendizaje Automático
Los métodos de aprendizaje automático mejoran el control de calidad para los defectos de impresión en botellas de vidrio.
― 7 minilectura
Tabla de contenidos
- El Reto
- Recolección y Preprocesamiento de Datos
- Selección de Imágenes No Supervisada
- Preparando los Datos
- Métricas de Calidad de Imagen
- Filtros de Imagen
- Alineación de imágenes
- Enfoques de Aprendizaje Automático
- Enfoque 1: Características de Imagen y Clasificadores Clásicos
- Enfoque 2: Ajuste Fino de Modelos CNN
- Visualización con Grad-Cam
- Resultados
- Métricas de Rendimiento
- Perspectivas para la Manufactura
- Conclusión
- Fuente original
En la producción de botellas de vidrio, asegurarse de que las impresiones en estas botellas sean de alta calidad es crucial. Hasta los pequeños fallos en la impresión pueden tener un gran impacto, y factores como los reflejos en el vidrio pueden dificultar la detección de estos defectos. Para abordar este problema, trabajamos con una empresa mediana que se especializa en la fabricación de botellas de vidrio. Desarrollamos dos métodos usando aprendizaje automático que pueden ayudar con el control de calidad de las impresiones en las botellas.
El Reto
Las botellas de vidrio pueden reflejar la luz de una manera que complica la fotografía. Al tomar fotos de estas botellas, cualquier reflejo puede dificultar saber si una impresión es aceptable o no. El sistema actual que usa nuestro socio captura imágenes de botellas y las compara con una imagen "perfecta" de referencia. Si las diferencias entre ambas imágenes superan un límite establecido, la botella se marca como defectuosa. Sin embargo, este sistema tiene problemas con las variaciones causadas por los reflejos, lo que lleva a falsas alarmas o a no detectar defectos.
Nuestro socio dejó claro que el enfoque debería estar en identificar correctamente las botellas defectuosas, incluso si eso significaba que algunas botellas aceptables pudieran ser marcadas incorrectamente. Querían reducir los costos asociados con aceptar botellas defectuosas, que pueden ser bastante altos.
Recolección y Preprocesamiento de Datos
Las imágenes que usamos para nuestro análisis se recolectaron del sistema existente de la empresa, que captura fotos de botellas al final de la línea de producción. Cada botella es fotografiada en un entorno controlado, con la cámara y las luces en posiciones fijas. La botella se rota para tener una vista clara.
Como no pudimos interrumpir la producción, creamos un proceso para copiar imágenes a un disco externo sin afectar las operaciones principales de la fábrica. Determinamos que solo podíamos capturar un número limitado de imágenes periódicamente, priorizando aquellas marcadas como inaceptables por el sistema de control de calidad existente.
Selección de Imágenes No Supervisada
Para facilitar el proceso de etiquetado, usamos un método para filtrar las imágenes que recolectamos. Comparamos cada imagen con una imagen de referencia de una impresión aceptable, utilizando ciertas medidas para determinar cuán similares eran. Las imágenes que eran demasiado diferentes fueron marcadas para su examen por nuestros expertos en control de calidad.
Nuestros expertos luego etiquetaron las imágenes basándose en defectos específicos, como manchas, rotación, o cualquier otro problema. Clasificaron las impresiones en dos categorías: aceptables y no aceptables. Esto ayudó a reducir el gran número de imágenes que necesitaban ser revisadas manualmente.
Preparando los Datos
Una vez que tuvimos nuestras imágenes etiquetadas, comenzamos a prepararlas para el análisis. Trabajamos con imágenes tanto en color como en escala de grises y empleamos diversas técnicas para mejorar su calidad. Esto incluyó aplicar filtros para minimizar los reflejos y usar Métricas de Calidad de Imagen para comparar las imágenes de prueba con la imagen de referencia.
Métricas de Calidad de Imagen
Usamos ciertas métricas para evaluar cuán similares eran dos imágenes. Una mayor diferencia indicaba un posible defecto en la impresión. Las métricas en las que nos enfocamos incluyeron el Error Cuadrático Medio, el Error Cuadrático Medio Normalizado y el Índice de Similitud Estructural.
Filtros de Imagen
Para mejorar la calidad de la imagen, aplicamos diferentes filtros diseñados para resaltar las impresiones mientras se reducen los efectos de los reflejos. Filtros como Sobel y Canny ayudaron a enfatizar los bordes en las imágenes, haciendo que las impresiones fueran más claras y fáciles de analizar.
Alineación de imágenes
Las botellas pueden aparecer en ángulos ligeramente diferentes en las imágenes debido a la configuración. Para manejar esto, alineamos las imágenes usando una técnica conocida como ORB (Oriented FAST and Rotated BRIEF). Esto nos permitió ajustar la rotación y otras variaciones, facilitando la comparación de las impresiones con la imagen de referencia.
Enfoques de Aprendizaje Automático
Desarrollamos dos métodos principales para analizar las imágenes.
Enfoque 1: Características de Imagen y Clasificadores Clásicos
En nuestro primer enfoque, tomamos imágenes alineadas y aplicamos los filtros que habíamos elegido. Luego usamos diferentes modelos de aprendizaje supervisado como Máquinas de Vectores de Soporte y k-Vecinos Más Cercanos para clasificar las imágenes como aceptables o no aceptables basándonos en las características que extrajimos.
Este enfoque nos permitió lograr un nivel de precisión relativamente alto, demostrando que incluso con distorsiones específicas como reflejos, podíamos clasificar las imágenes de manera efectiva. Sin embargo, descubrimos que alinear las imágenes marcaba una gran diferencia en el rendimiento.
Enfoque 2: Ajuste Fino de Modelos CNN
Nuestro segundo método involucró el uso de Redes Neuronales Convolucionales (CNN) preentrenadas. Estos modelos ya habían sido entrenados con un gran conjunto de imágenes y podían ajustarse a nuestra tarea específica de identificar defectos en las impresiones de botellas de vidrio.
Usando modelos como ResNet y VGG, pudimos clasificar imágenes directamente sin depender de características específicas. Este método entregó resultados sólidos, especialmente en términos de sensibilidad, lo que significa que identificó correctamente impresiones inaceptables.
Visualización con Grad-Cam
Para analizar aún más nuestros modelos, usamos una herramienta llamada Grad-Cam, que ayuda a visualizar qué partes de una imagen son más importantes para una decisión de clasificación. Al aplicar esta técnica, pudimos ver qué regiones de las impresiones eran frecuentemente marcadas como defectuosas, proporcionando información útil para el proceso de fabricación.
Resultados
Al evaluar nuestros dos enfoques, encontramos que ambos métodos mejoraron el sistema de control de calidad existente. Nuestro primer enfoque mostró un rendimiento fuerte, particularmente debido al proceso de alineación de imágenes. El segundo enfoque usando CNN en general superó al primero en precisión.
Métricas de Rendimiento
En términos de tasas de verdaderos positivos, nuestros modelos sobresalieron en identificar impresiones inaceptables mientras mantenían una tasa de falsos positivos manejable. Este equilibrio es crucial en la manufactura, ya que el objetivo es minimizar los costos vinculados a botellas defectuosas sin abrumar al personal de control de calidad con falsas alarmas.
Perspectivas para la Manufactura
Ambas técnicas no solo mejoraron la precisión de clasificación, sino que también proporcionaron perspectivas que podrían ayudar a optimizar el proceso de fabricación real. Por ejemplo, rastrear las rotaciones de las botellas a lo largo del tiempo puede indicar problemas subyacentes en la producción que podrían llevar a defectos.
Además, los mapas de calor generados por nuestros modelos CNN ofrecieron una representación visual clara de las áreas comunes de defectos. Esta información puede ayudar a los fabricantes a centrar sus esfuerzos en regiones específicas del proceso de impresión que podrían requerir ajustes o mejoras.
Conclusión
En conclusión, nuestro trabajo demuestra el potencial del aprendizaje automático para mejorar los procesos de control de calidad en la industria de fabricación de botellas de vidrio. Al implementar una recolección de datos efectiva, procesamiento de imágenes y técnicas de aprendizaje automático, desarrollamos con éxito dos enfoques que mejoraron significativamente la identificación de impresiones defectuosas. De cara al futuro, la recolección continua de datos y el refinamiento adicional de estos métodos podrían generar incluso mejores resultados, ayudando a los fabricantes a mantener altos estándares mientras reducen los costos asociados con errores de producción.
Título: Machine Learning in Industrial Quality Control of Glass Bottle Prints
Resumen: In industrial manufacturing of glass bottles, quality control of bottle prints is necessary as numerous factors can negatively affect the printing process. Even minor defects in the bottle prints must be detected despite reflections in the glass or manufacturing-related deviations. In cooperation with our medium-sized industrial partner, two ML-based approaches for quality control of these bottle prints were developed and evaluated, which can also be used in this challenging scenario. Our first approach utilized different filters to supress reflections (e.g. Sobel or Canny) and image quality metrics for image comparison (e.g. MSE or SSIM) as features for different supervised classification models (e.g. SVM or k-Neighbors), which resulted in an accuracy of 84%. The images were aligned based on the ORB algorithm, which allowed us to estimate the rotations of the prints, which may serve as an indicator for anomalies in the manufacturing process. In our second approach, we fine-tuned different pre-trained CNN models (e.g. ResNet or VGG) for binary classification, which resulted in an accuracy of 87%. Utilizing Grad-Cam on our fine-tuned ResNet-34, we were able to localize and visualize frequently defective bottle print regions. This method allowed us to provide insights that could be used to optimize the actual manufacturing process. This paper also describes our general approach and the challenges we encountered in practice with data collection during ongoing production, unsupervised preselection, and labeling.
Autores: Maximilian Bundscherer, Thomas H. Schmitt, Tobias Bocklet
Última actualización: Sep 30, 2024
Idioma: English
Fuente URL: https://arxiv.org/abs/2409.20132
Fuente PDF: https://arxiv.org/pdf/2409.20132
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.