Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Computación y lenguaje# Multimedia

Presentando MMPKUBase: Un Grafo de Conocimiento Chino

MMPKUBase ofrece más de 52,000 temas chinos con imágenes increíbles.

― 6 minilectura


MMPKUBase: Un recurso deMMPKUBase: Un recurso deconocimiento chinode alta calidad.Una gran colección de información china
Tabla de contenidos

Los gráficos de conocimiento multimodal son herramientas que ayudan a organizar información combinando diferentes tipos de datos, como texto e imágenes. Estos gráficos se han vuelto útiles para tareas como responder preguntas y dar recomendaciones. Sin embargo, todavía hay problemas al crearlos, especialmente en lo que respecta al idioma chino. Este artículo presenta MMPKUBase, un nuevo gráfico de conocimiento centrado en la información china que incluye una variedad de temas como animales y plantas.

¿Qué es MMPKUBase?

MMPKUBase es una gran colección de información en forma de gráfico de conocimiento, específicamente diseñado para el idioma chino. Contiene más de 52,000 entradas y más de 1.5 millones de imágenes. Los temas cubiertos son muy variados, incluyendo aves, mamíferos, plantas, arquitectura y vehículos. Uno de los objetivos principales es proporcionar imágenes confiables y de alta calidad para que los usuarios puedan acceder y usar en diversas aplicaciones.

¿Por qué necesitamos MMPKUBase?

La demanda de información de alta calidad en chino ha crecido, pero muchos recursos existentes no satisfacen esta necesidad. Si bien hay muchos gráficos de conocimiento disponibles en inglés, el mismo nivel de calidad falta en el idioma chino. Como resultado, MMPKUBase busca llenar este vacío proporcionando un recurso integral enriquecido con imágenes relacionadas con diversos temas.

¿Cómo se construye MMPKUBase?

Construir MMPKUBase implica varias etapas. Primero, hay Recolección de datos de fuentes confiables. El equipo selecciona los temas de interés y recopila imágenes relacionadas. Luego, filtran imágenes de baja calidad o irrelevantes para asegurar que la colección final sea útil.

Recolección de Datos

Los datos para MMPKUBase provienen de dos fuentes principales: un gran recurso de conocimiento chino y un motor de búsqueda de imágenes. El recurso de conocimiento contiene millones de entradas, mientras que el motor de búsqueda de imágenes proporciona acceso a innumerables imágenes de diferentes páginas web.

Selección de Temas

Para crear un gráfico de conocimiento útil, el equipo decidió enfocarse en temas específicos que tengan representaciones visuales claras. Esta decisión ayuda a asegurar que las imágenes incluidas en el gráfico sean relevantes y útiles. Algunos de los temas seleccionados incluyen diferentes tipos de aves, mamíferos y varias plantas.

Recolección de Imágenes

Una vez que se seleccionan los temas, el siguiente paso es recopilar imágenes. El equipo utiliza los nombres de los sujetos elegidos como consultas de búsqueda para encontrar imágenes relacionadas con ellos. Su objetivo es recopilar hasta 30 de las mejores imágenes para cada tema, asegurándose de que haya una selección diversa de visuales.

Control de Calidad de Imágenes

Después de recopilar imágenes, es importante asegurarse de que sean de alta calidad. El proceso de filtrado elimina imágenes que podrían confundir a los usuarios o malrepresentar los temas. Se eliminan imágenes de baja calidad, archivos corruptos o imágenes no relacionadas de la colección final.

Proceso de Filtrado de imágenes

El filtrado de imágenes involucra múltiples pasos. Primero, se eliminan las imágenes corruptas o mal formateadas. Luego, el equipo utiliza métodos avanzados para evaluar la relevancia de las imágenes restantes. Las imágenes que no coinciden estrechamente con los temas se filtran también.

Uso de Técnicas Avanzadas

Para mejorar la calidad de las imágenes en MMPKUBase, el equipo emplea técnicas avanzadas. Una de estas técnicas se conoce como Aprendizaje Contraste Prototípico. Este método ayuda a identificar qué imágenes son más representativas de sujetos específicos. Otro método utilizado se llama Bosque de Aislamiento, que ayuda a detectar y eliminar imágenes atípicas que no encajan bien con el resto.

Aprendizaje Contraste Prototípico

Este método agrupa imágenes similares juntas según sus características. Ayuda a crear una imagen más clara de cómo debería lucir un sujeto específico. Por ejemplo, las imágenes de un ave particular pueden agruparse según características distintas, facilitando la búsqueda de los mejores visuales para ese tema.

Bosque de Aislamiento

La técnica del Bosque de Aislamiento identifica imágenes que no pertenecen a ningún grupo o clúster. Al aislar estas imágenes atípicas, el equipo puede asegurar que la colección final contenga solo imágenes relevantes y útiles. Este método es especialmente efectivo para manejar grandes cantidades de datos de imágenes.

Finalizando el Gráfico de Conocimiento

El último paso en la creación de MMPKUBase es conectar las imágenes a los temas relevantes en un formato estructurado. Cada tema está vinculado con sus imágenes correspondientes, creando un gráfico completo que los usuarios pueden explorar. Esto permite un fácil acceso tanto a información textual como visual.

Accediendo a MMPKUBase

Para hacer que MMPKUBase sea fácil de usar, el equipo ha creado una plataforma sencilla donde la gente puede explorar el gráfico de conocimiento. Los usuarios pueden buscar temas específicos y ver las imágenes e información relacionadas. La interfaz está diseñada para hacer que la navegación sea sencilla, permitiendo a cualquier persona encontrar rápidamente lo que necesita.

Buscando Información

Los usuarios pueden ingresar consultas en una barra de búsqueda en la plataforma para buscar temas específicos. Por ejemplo, ingresar el nombre de una marca de automóvil mostrará todas las entradas e imágenes relevantes conectadas a esa marca. Esta función hace que sea fácil para los usuarios acceder a la información que desean.

Conclusión

MMPKUBase representa un paso importante hacia adelante en la creación de gráficos de conocimiento multimodal de alta calidad en chino. Con más de 52,000 temas y más de 1.5 millones de imágenes, proporciona información valiosa que cubre una amplia gama de temas. El uso de técnicas avanzadas asegura que los datos sean confiables y relevantes, haciéndolos adecuados para diversas aplicaciones.

Los esfuerzos futuros se enfocarán en integrar MMPKUBase en usos del mundo real. Al continuar expandiendo el gráfico de conocimiento para incluir aún más temas e imágenes, se convertirá en un recurso valioso para aquellos que buscan acceder a información de alta calidad en chino.

Fuente original

Título: MMPKUBase: A Comprehensive and High-quality Chinese Multi-modal Knowledge Graph

Resumen: Multi-modal knowledge graphs have emerged as a powerful approach for information representation, combining data from different modalities such as text, images, and videos. While several such graphs have been constructed and have played important roles in applications like visual question answering and recommendation systems, challenges persist in their development. These include the scarcity of high-quality Chinese knowledge graphs and limited domain coverage in existing multi-modal knowledge graphs. This paper introduces MMPKUBase, a robust and extensive Chinese multi-modal knowledge graph that covers diverse domains, including birds, mammals, ferns, and more, comprising over 50,000 entities and over 1 million filtered images. To ensure data quality, we employ Prototypical Contrastive Learning and the Isolation Forest algorithm to refine the image data. Additionally, we have developed a user-friendly platform to facilitate image attribute exploration.

Autores: Xuan Yi, Yanzeng Li, Lei Zou

Última actualización: 2024-08-03 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2408.01679

Fuente PDF: https://arxiv.org/pdf/2408.01679

Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares