Un nuevo referente para evaluar modelos de lenguaje en contextos médicos en chino.
― 12 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo referente para evaluar modelos de lenguaje en contextos médicos en chino.
― 12 minilectura
Evaluando métodos de atribución de características a través de solidez y completitud para mejores predicciones de IA.
― 7 minilectura
Este estudio evalúa cómo se desempeña ChatGPT en emparejar ontologías.
― 6 minilectura
Una visión general de cómo evaluar los sistemas GEC de manera efectiva.
― 8 minilectura
Este documento explora métodos para evaluar la relación entre conceptos usando DBpedia.
― 8 minilectura
Una mirada a cómo la adaptación de instrucciones mejora las respuestas de los modelos de lenguaje.
― 10 minilectura
KGrEaT evalúa la calidad y utilidad de los gráficos de conocimiento para varias tareas.
― 6 minilectura
Un nuevo método mejora los modelos de lenguaje específicamente para el portugués.
― 6 minilectura
Un estándar para mejorar la vinculación de entidades biomédicas y las comparaciones en investigaciones.
― 6 minilectura
Investigando Sistemas de Salud Aprendientes para mejorar la entrega de atención médica.
― 7 minilectura
SciEval evalúa modelos de lenguaje en sus habilidades de investigación científica con preguntas diversas.
― 7 minilectura
Un enfoque práctico para evaluar sistemas de orientación para un análisis de datos efectivo.
― 9 minilectura
Este artículo habla sobre la necesidad de mejores técnicas de clasificación de documentos.
― 8 minilectura
Combinar redes neuronales con métodos tradicionales mejora la seguridad y el rendimiento de los frenos de aire.
― 6 minilectura
Este artículo revisa qué tan bien puntúan los métodos de evaluación actuales las traducciones a nivel de párrafo.
― 7 minilectura
Un nuevo conjunto de datos ayuda a evaluar modelos de lenguaje para aplicaciones en salud.
― 9 minilectura
Un nuevo método para mejorar la calidad del habla usando redes eficientes en energía.
― 6 minilectura
Presentamos un conjunto de datos centrado en conversaciones de preguntas y respuestas fácticas.
― 6 minilectura
Un estudio evalúa la efectividad de la vigilancia de One Health en once sistemas europeos.
― 6 minilectura
Un nuevo método para evaluar mejor las propuestas de objetos en tareas de visión y lenguaje.
― 8 minilectura
Los investigadores utilizan la traducción automática para mejorar las evaluaciones de calidad del diálogo en varios idiomas.
― 7 minilectura
Este artículo examina la alucinación en los modelos de lenguaje de IA y la investigación en curso.
― 8 minilectura
Examinando problemas y soluciones para optimizadores de consultas aprendidos en la gestión de bases de datos.
― 6 minilectura
HAE-RAE Bench se centra en evaluar el conocimiento cultural en modelos de lenguaje coreano.
― 8 minilectura
Este trabajo evalúa qué tan bien los VLMs razonan a partir del contenido visual.
― 7 minilectura
Un estudio sobre cómo generar preguntas de seguimiento significativas para profundizar en la comprensión.
― 7 minilectura
Un nuevo conjunto de datos mejora la síntesis de voz al captar la expresión emocional sin depender del texto.
― 6 minilectura
Un modelo que integra la evaluación y el aprendizaje por refuerzo mejora la evaluación emocional.
― 6 minilectura
Este estudio examina cómo clasificar las revisiones para mejorar la escritura argumentativa.
― 6 minilectura
Explorando cómo los LLMs pueden evaluar los resultados de los modelos en varios idiomas.
― 8 minilectura
SLIDE mejora las evaluaciones de traducción automática al incorporar un contexto más amplio durante la evaluación.
― 6 minilectura
Este método mejora la planificación de rutas de robots móviles en entornos cambiantes.
― 7 minilectura
Este estudio compara el rendimiento de varios modelos de lenguaje al responder preguntas complejas.
― 5 minilectura
Un estudio examina la efectividad de los enmascaradores de sonido automáticos en espacios públicos.
― 5 minilectura
Un enfoque centrado para identificar rápidamente errores de software a través de pruebas específicas.
― 6 minilectura
Un nuevo método mejora el diagnóstico del cáncer al integrar señales de causalidad débiles en la imagen médica.
― 9 minilectura
Nuevos métodos mejoran la transferencia de estilo para el texto, manteniendo su significado.
― 8 minilectura
Un estudio sobre la detección del discurso de odio en el lenguaje de las redes sociales argelinas.
― 9 minilectura
Este artículo habla sobre las métricas de evaluación para chatbots de salud efectivos.
― 8 minilectura
Este estudio examina cómo cambian los modelos de aprendizaje profundo durante la búsqueda de arquitecturas neuronales.
― 8 minilectura