Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones

Perfeccionando la Detección de Objetos: El Conjunto de Datos COCO-ReM

COCO-ReM mejora la detección de objetos al perfeccionar las anotaciones del conjunto de datos original de COCO.

― 6 minilectura


COCO-ReM: Un NuevoCOCO-ReM: Un NuevoEstándardatos en la detección de objetos.para la calidad de los conjuntos deCOCO-ReM establece un nuevo estándar
Tabla de contenidos

El conjunto de datos de Objetos Comunes en Contexto (COCO) ha sido clave para probar qué tan bien diferentes Modelos pueden detectar objetos. A lo largo de los años, por su tamaño y detalle, ha sido el conjunto de datos preferido por muchos investigadores. Sin embargo, como cualquier conjunto de datos grande, COCO tiene algunos defectos que pueden afectar los resultados de los modelos que se están probando.

A medida que surgen modelos nuevos y mejores, es importante asegurarse de que conjuntos de datos como COCO sigan siendo útiles. Ahí es donde entra la idea de COCO-ReM (Máscaras Refinadas). COCO-ReM tiene como objetivo abordar los problemas presentes en el conjunto de datos original de COCO al refinar sus anotaciones, haciéndolo más confiable para evaluar modelos de detección de objetos.

Identificando Problemas en COCO

COCO se ha utilizado durante casi una década, pero muchos modelos han comenzado a revelar que el conjunto de datos puede tener errores. Estos errores provienen de cómo se etiquetaron los objetos en las imágenes. Las etiquetas inexactas pueden crear un ambiente confuso para las máquinas que intentan aprender de los datos. Por ejemplo, los límites de las máscaras de los objetos pueden ser imprecisos, algunos objetos pueden no estar etiquetados en absoluto, o algunos pueden estar etiquetados incorrectamente.

Cuando los modelos entrenados en COCO intentan evaluar su rendimiento, pueden ser engañados por estas imperfecciones. Esto significa que los modelos podrían ser penalizados por hacer predicciones correctas simplemente porque la verdad de base (la respuesta correcta real) en COCO está defectuosa.

¿Qué es COCO-ReM?

COCO-ReM se desarrolló para mejorar estos aspectos. Incluye las mismas imágenes que el conjunto de datos original de COCO, pero ofrece un conjunto de anotaciones más limpio. El objetivo es proporcionar una mejor calidad de máscara que pueda ayudar a evaluar los modelos de manera más precisa.

Al refinar las anotaciones, COCO-ReM busca eliminar los errores presentes en COCO, permitiendo que los nuevos modelos se comparen de manera más justa. Esta versión refinada se centra en hacer que el proceso de evaluación sea mucho más directo.

Cómo se Desarrolló COCO-ReM

El desarrollo de COCO-ReM pasó por tres pasos principales. Cada paso fue diseñado cuidadosamente para asegurar que el nuevo conjunto de datos fuera confiable:

Paso 1: Refinar los Límites de las Máscaras

El primer paso consistió en arreglar los límites de las máscaras. El conjunto de datos original de COCO usó un método que a menudo llevaba a contornos imprecisos e incorrectos alrededor de los objetos. Para mejorar esto, se empleó un modelo conocido como el Modelo Segmenta Cualquier Cosa (SAM).

SAM ayuda a crear máscaras más precisas. Toma como entrada las máscaras originales de COCO y las mejora utilizando indicaciones adicionales. Estas indicaciones guían al modelo para producir mejores contornos. Después de que SAM procesa las máscaras, cada nueva máscara se verifica manualmente para asegurarse de que cumple con los estándares de calidad.

Paso 2: Anotación Exhaustiva

Luego, era esencial asegurarse de que todos los objetos estuvieran etiquetados correctamente. Muchos objetos en el conjunto de datos original estaban ausentes por completo o agrupados incorrectamente. Para abordar esto, se importó información de otro conjunto de datos, el LVIS, para ayudar a llenar los vacíos.

Al verificar si LVIS podía proporcionar etiquetas adicionales para las imágenes, el proceso aseguró que cada instancia de un objeto específico fuera tenida en cuenta. Este enfoque exhaustivo dio como resultado anotaciones más completas.

Paso 3: Corrección de Errores de Etiquetado

El paso final se centró en corregir cualquier error que se hubiera escapado. Esto incluía verificar y resolver duplicados en el etiquetado donde el mismo objeto podría haber recibido diferentes etiquetas en el conjunto de datos original.

Al asegurarse de que solo permanecieran las mejores y más precisas etiquetas, COCO-ReM proporciona un marco de evaluación más confiable.

Análisis de COCO-ReM

Las mejoras realizadas en COCO-ReM han llevado a varios resultados positivos. Se crearon más de 1 millón de máscaras de alta calidad a través de las refinaciones en ambos conjuntos de entrenamiento y validación. El conjunto de datos mejorado permite evaluar los modelos de manera más confiable, llevando a evaluaciones más precisas de sus habilidades.

Evaluando Detectores de Objetos

Un objetivo importante de COCO-ReM es ofrecer una plataforma para evaluar modelos de detección de objetos con precisión. Para probar su efectividad, se evaluaron cincuenta modelos diferentes usando COCO-ReM. Estos modelos iban desde diseños más antiguos hasta innovaciones más nuevas que utilizaban diferentes tecnologías.

Hallazgos de las Evaluaciones

Los modelos entrenados en COCO-ReM obtuvieron puntajes más altos en promedio que aquellos evaluados usando el conjunto de datos original de COCO. Esto demostró que las anotaciones refinadas ayudan a resaltar las verdaderas capacidades de un modelo.

Curiosamente, los modelos que utilizan enfoques basados en consultas, como Mask2Former, funcionaron mejor que aquellos que utilizan enfoques tradicionales basados en regiones. Esto sugiere que COCO-ReM proporciona una mejor plataforma de evaluación, mostrando las fortalezas de los nuevos diseños de modelos más claramente.

Importancia de la Calidad de los Datos

Los resultados destacaron el impacto directo de la calidad de los datos en el rendimiento del modelo. Los modelos entrenados con el conjunto de datos refinado convergieron más rápido y tuvieron un mejor rendimiento que aquellos que utilizaron el conjunto de datos original de COCO. Esto enfatiza que los datos utilizados para el entrenamiento pueden moldear significativamente las capacidades de un modelo.

La Necesidad de Conjuntos de Datos de Alta Calidad

Con los avances en tecnología, la necesidad de conjuntos de datos de alta calidad solo aumentará. A medida que investigadores y desarrolladores empujan los límites de lo que los modelos pueden hacer, los conjuntos de datos deben mantenerse al día para asegurar evaluaciones justas. COCO-ReM establece un precedente para re-evaluar y refinar conjuntos de datos para mantenerlos relevantes a medida que la investigación avanza.

Conclusión

En resumen, COCO-ReM proporciona una mejora crucial sobre el conjunto de datos original de COCO. Al abordar errores de etiquetado, refinar los límites de las máscaras y asegurar la exhaustividad de las anotaciones, permite un benchmarking más preciso de los modelos de detección de objetos. A través de evaluaciones rigurosas, COCO-ReM demuestra su capacidad para guiar a los investigadores hacia mejores modelos, contribuyendo positivamente al campo general de la visión por computadora.

A medida que la comunidad avanza, adoptar conjuntos de datos como COCO-ReM será esencial para impulsar más avances en tecnología e investigación, asegurando que las herramientas utilizadas para la evaluación sean tan sofisticadas como los propios modelos.

Fuente original

Título: Benchmarking Object Detectors with COCO: A New Path Forward

Resumen: The Common Objects in Context (COCO) dataset has been instrumental in benchmarking object detectors over the past decade. Like every dataset, COCO contains subtle errors and imperfections stemming from its annotation procedure. With the advent of high-performing models, we ask whether these errors of COCO are hindering its utility in reliably benchmarking further progress. In search for an answer, we inspect thousands of masks from COCO (2017 version) and uncover different types of errors such as imprecise mask boundaries, non-exhaustively annotated instances, and mislabeled masks. Due to the prevalence of COCO, we choose to correct these errors to maintain continuity with prior research. We develop COCO-ReM (Refined Masks), a cleaner set of annotations with visibly better mask quality than COCO-2017. We evaluate fifty object detectors and find that models that predict visually sharper masks score higher on COCO-ReM, affirming that they were being incorrectly penalized due to errors in COCO-2017. Moreover, our models trained using COCO-ReM converge faster and score higher than their larger variants trained using COCO-2017, highlighting the importance of data quality in improving object detectors. With these findings, we advocate using COCO-ReM for future object detection research. Our dataset is available at https://cocorem.xyz

Autores: Shweta Singh, Aayan Yadav, Jitesh Jain, Humphrey Shi, Justin Johnson, Karan Desai

Última actualización: 2024-03-27 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2403.18819

Fuente PDF: https://arxiv.org/pdf/2403.18819

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares