Integrando LLMs en las Prácticas de Ingeniería del Conocimiento
Explorando el papel y los desafíos de los LLMs en la ingeniería del conocimiento.
― 8 minilectura
Tabla de contenidos
- El Papel de los Modelos de Lenguaje Grande (MLG)
- Objetivos de la Investigación
- Resumen del Hackathon
- Hallazgos Clave del Hackathon
- Desafíos en el Uso de MLG
- Habilidades Necesarias para el Uso Efectivo de MLG
- Conciencia de Consideraciones Éticas
- Confianza y Adopción de la Tecnología MLG
- La Importancia de la Evaluación
- Técnicas de Evaluación Actual
- Sugerencias para Nuevas Métricas de Evaluación
- La Necesidad de Desarrollar Habilidades
- El Papel de la Capacitación
- Introduciendo Tarjetas GK
- Componentes de las Tarjetas GK
- Conclusión
- Direcciones Futuras
- Fuente original
- Enlaces de referencia
La Ingeniería del Conocimiento (EK) trata de capturar, organizar y mantener información para que las máquinas la entiendan. Esto a menudo lleva a la creación de grafos de conocimiento (GK), que representan entidades del mundo real y sus relaciones de manera estructurada. A pesar de los avances en el campo, siguen existiendo desafíos, especialmente al tratar con grandes conjuntos de información y asegurarse de que esta información esté actualizada. Los ingenieros del conocimiento enfrentan obstáculos como trabajar en diferentes idiomas y formatos y evaluar la calidad del conocimiento que manejan.
Modelos de Lenguaje Grande (MLG)
El Papel de losRecientemente, los MLG, que son herramientas de IA avanzadas entrenadas con enormes cantidades de texto, han comenzado a jugar un papel en la EK. Pueden automatizar algunas tareas, ayudando a los ingenieros del conocimiento a ahorrar tiempo y mejorar la eficiencia. Sin embargo, descubrir cómo usar mejor estos modelos en EK sigue siendo un área en desarrollo.
Objetivos de la Investigación
Para entender cómo los MLG pueden apoyar a los ingenieros del conocimiento, se realizó un estudio durante un hackathon, donde los participantes compartieron sus experiencias y desafíos al usar estos modelos. El estudio buscaba recopilar ideas sobre varios aspectos clave, incluyendo:
- Los desafíos que enfrentan los ingenieros del conocimiento al usar MLG.
- Cómo evalúan la salida generada por los MLG.
- Las habilidades necesarias para trabajar de manera efectiva con MLG.
- Su conciencia sobre el uso responsable y ético de los MLG.
Resumen del Hackathon
Durante el hackathon, investigadores y profesionales de diversos antecedentes se unieron para examinar cómo los MLG pueden ayudar en tareas de EK. Los participantes enfrentaron diferentes desafíos, particularmente al tratar de identificar conjuntos de datos adecuados para pruebas, crear peticiones efectivas y asegurarse de la precisión de los resultados.
Hallazgos Clave del Hackathon
Desafíos en el Uso de MLG
Los participantes indicaron que encontrar el conjunto de datos correcto era crucial para sus tareas. Sin estos datos fundamentales, era difícil avanzar. Muchos expresaron que aunque los MLG tienen el potencial de ayudar en la creación de conjuntos de datos, a menudo luchaban con cómo formular las peticiones de manera efectiva.
Formular peticiones puede ser una tarea compleja. Algunos ingenieros del conocimiento carecen de experiencia en procesamiento de lenguaje natural, lo que les dificulta crear peticiones efectivas. Otros señalaron que la naturaleza iterativa de probar peticiones puede consumir mucho tiempo, especialmente cuando se busca consistencia en los resultados.
La Evaluación de las salidas generadas por los MLG también presentó dificultades. La falta de estándares de referencia para tareas de EK significa que muchas evaluaciones deben hacerse manualmente. Esto complica la valoración de la calidad de las salidas. Incluso cuando se pueden aplicar evaluaciones automáticas, a menudo no cubren todo lo que necesita ser evaluado.
Habilidades Necesarias para el Uso Efectivo de MLG
A través de las discusiones, quedó claro que varias habilidades son importantes para los ingenieros del conocimiento que trabajan con MLG:
- Habilidades de Comunicación: Poder compartir ideas y escuchar a otros es crucial, especialmente en equipos diversos.
- Construcción de Ontologías: Saber cómo crear representaciones estructuradas del conocimiento ayuda a formular peticiones efectivas.
- Creación de Peticiones: Entender cómo construir y refinar iterativamente peticiones es una habilidad esencial que mejora la interacción con los MLG.
- Habilidades de Programación: La competencia en programación ayuda a los ingenieros a interactuar más eficazmente con los MLG, especialmente al automatizar tareas.
- Enfoque Científico: Poder definir objetivos y experimentos puede simplificar las tareas de EK.
Sin embargo, muchos participantes notaron vacíos en su conocimiento, especialmente en lo que respecta a la creación de ontologías y la formulación efectiva de peticiones.
Conciencia de Consideraciones Éticas
Al discutir IA responsable, muchos participantes parecían conscientes del concepto de sesgo, pero no estaban profundamente comprometidos con cómo mitigarlo. Había un entendimiento general de que el sesgo puede provenir de fuentes de datos, pero era evidente la falta de conocimiento sobre cómo abordar esto en la práctica. Algunos entrevistados señalaron que el sesgo también podría surgir de cómo los MLG procesan datos y crean salidas.
Confianza y Adopción de la Tecnología MLG
Hubo sentimientos encontrados sobre la fiabilidad de los MLG. Algunos participantes expresaron optimismo sobre el potencial de los MLG para acelerar tareas y ayudar en actividades de EK, mientras que otros seguían escépticos sobre su precisión y fiabilidad. Se plantearon preocupaciones sobre los MLG que no siempre están actualizados o no proporcionan información precisa. Estas dudas iban acompañadas de una fuerte creencia de que, aunque los MLG podrían ayudar en ciertas tareas, no reemplazarían la necesidad de supervisión humana en el proceso de EK.
La Importancia de la Evaluación
Un aspecto esencial de la ingeniería del conocimiento es la evaluación de calidad. Para que los GK sean confiables, deben ser evaluados por su precisión, relevancia y exhaustividad. El proceso de evaluación a menudo requiere experiencia humana, especialmente al intentar medir el significado semántico y las relaciones en los datos que las máquinas pueden tener dificultad para interpretar correctamente.
Técnicas de Evaluación Actual
Los métodos de evaluación existentes pueden variar significativamente según las tareas específicas de EK. Algunas técnicas convencionales incluyen medir la precisión utilizando puntajes F1 o comparar salidas contra estándares de oro. Sin embargo, estos métodos pueden no cubrir todos los aspectos de las tareas de EK, especialmente al evaluar la profundidad y calidad de la representación del conocimiento.
Sugerencias para Nuevas Métricas de Evaluación
Los participantes sugirieron varias ideas para mejorar las prácticas de evaluación, incluidas:
- Desarrollar ontologías de estándar dorado para comparaciones más efectivas.
- Crear herramientas que puedan ayudar a identificar errores en las salidas.
- Emplear técnicas de otros campos, como la verificación de hechos o pruebas adversariales, para asegurar la calidad del contenido generado por los MLG.
La Necesidad de Desarrollar Habilidades
La integración de los MLG en los procesos de EK señala un cambio que puede requerir nuevos conjuntos de habilidades. Si bien la EK tradicional aún tiene valor, adaptarse a estos avances será crucial. La capacitación en áreas como la creación de peticiones y la conciencia de Sesgos será importante para que los ingenieros del conocimiento trabajen de manera efectiva junto a herramientas de IA.
El Papel de la Capacitación
Para aprovechar con éxito los beneficios de los MLG, hay una clara necesidad de programas de capacitación integrales. Estos programas deberían cubrir los fundamentos de la IA, consideraciones éticas y habilidades prácticas necesarias para interactuar con los MLG. Solo así los ingenieros del conocimiento podrán navegar eficazmente las complejidades de trabajar con estas herramientas.
Introduciendo Tarjetas GK
Una posible solución para mejorar la transparencia y responsabilidad en los GK es la introducción de "tarjetas GK". Estas tarjetas proporcionarían una forma estructurada de documentar la procedencia, completitud y seguridad de los GK. Al igual que los marcos existentes en la documentación de datos, estas tarjetas GK buscan ayudar a los ingenieros del conocimiento a asegurar que los GK que construyen sean confiables y éticos.
Componentes de las Tarjetas GK
Las tarjetas GK incluirían idealmente información sobre:
- Procedencia: Detallar las fuentes y orígenes de los datos.
- Construcción: Explicar cómo se construyó el GK y las metodologías utilizadas.
- Conocimiento: Describir el rango de información representada.
- Completitud: Evaluar la cobertura y representatividad del GK.
- Seguridad: Esbozar cualquier sesgo o consideraciones éticas asociadas con los datos.
Conclusión
A medida que los MLG continúan evolucionando, su impacto en el campo de la ingeniería del conocimiento será dramático. Si bien hay ventajas significativas al trabajar con estos sistemas avanzados, se deben abordar los desafíos relacionados con la evaluación, el desarrollo de habilidades y las consideraciones éticas. Al fomentar una comprensión más profunda de estas áreas e introducir herramientas como las tarjetas GK, el campo puede mejorar la calidad y fiabilidad de la representación del conocimiento mientras integra la tecnología de IA de manera responsable en todos los aspectos de la ingeniería del conocimiento.
Direcciones Futuras
Se necesita más investigación para profundizar en cómo los MLG pueden apoyar de manera efectiva a los usuarios menos experimentados en el desarrollo de GK. También hay una necesidad de metodologías más robustas para identificar y mitigar sesgos en los GK asistidos por MLG. A medida que los ingenieros del conocimiento trabajan para adoptar estos cambios, será crucial mantener el enfoque en desarrollar prácticas que prioricen la transparencia, responsabilidad y consideraciones éticas en el uso de tecnologías de IA.
Título: Knowledge Prompting: How Knowledge Engineers Use Large Language Models
Resumen: Despite many advances in knowledge engineering (KE), challenges remain in areas such as engineering knowledge graphs (KGs) at scale, keeping up with evolving domain knowledge, multilingualism, and multimodality. Recently, KE has used LLMs to support semi-automatic tasks, but the most effective use of LLMs to support knowledge engineers across the KE activites is still in its infancy. To explore the vision of LLM copilots for KE and change existing KE practices, we conducted a multimethod study during a KE hackathon. We investigated participants' views on the use of LLMs, the challenges they face, the skills they may need to integrate LLMs into their practices, and how they use LLMs responsibly. We found participants felt LLMs could contribute to improving efficiency when engineering KGs, but presented increased challenges around the already complex issues of evaluating the KE tasks. We discovered prompting to be a useful but undervalued skill for knowledge engineers working with LLMs, and note that natural language processing skills may become more relevant across more roles in KG construction. Integrating LLMs into KE tasks needs to be mindful of potential risks and harms related to responsible AI. Given the limited ethical training, most knowledge engineers receive solutions such as our suggested `KG cards' based on data cards could be a useful guide for KG construction. Our findings can support designers of KE AI copilots, KE researchers, and practitioners using advanced AI to develop trustworthy applications, propose new methodologies for KE and operate new technologies responsibly.
Autores: Elisavet Koutsiana, Johanna Walker, Michelle Nwachukwu, Albert Meroño-Peñuela, Elena Simperl
Última actualización: 2024-08-02 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2408.08878
Fuente PDF: https://arxiv.org/pdf/2408.08878
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://dl.acm.org/ccs.cfm
- https://www.dagstuhl.de/22372
- https://king-s-knowledge-graph-lab.github.io/knowledge-prompting-hackathon/
- https://www.microsoft.com/en-gb/microsoft-teams/group-chat-software
- https://otter.ai/
- https://help-nv.qsrinternational.com/20/win/Content/about-nvivo/about-nvivo.htm
- https://forms.office.com/Pages/DesignPageV2.aspx
- https://huggingface.co/
- https://pytorch.org/
- https://git-scm.com/
- https://huggingface.co/docs/hub/datasets-cards
- https://huggingface.co/docs/hub/model-cards
- https://proceedings.neurips.cc/paper_files/paper/2013/file/1cecc7a77928ca8133fa24680a88d2f9-Paper.pdf
- https://ojs.aaai.org/index.php/AAAI/article/view/11573