Últimos artículos para Evaluación

Ingeniería del software Simplificando el aprendizaje de videos de programación

Un método para simplificar el aprendizaje de videos de programación extrayendo los pasos clave.

2025-11-23T00:48:24+00:00 ― 6 minilectura

Computación y lenguaje Evaluando Modelos de Resumen con el Benchmark TempoSum

El benchmark TempoSum evalúa el rendimiento de los modelos de resumir con información cambiante.

2025-11-21T04:10:18+00:00 ― 7 minilectura

Computación y lenguaje Nueva Métrica de Densidad Mejora la Evaluación de Sistemas de Diálogo

DEnsity ofrece una forma nueva de evaluar sistemas de diálogo según los patrones de conversación humana.

2025-11-19T08:03:48+00:00 ― 8 minilectura

Recuperación de información Mejorando las recomendaciones a través de la integración de comentarios de los usuarios

Este artículo habla sobre los beneficios de usar retroalimentación diversa de usuarios para hacer mejores recomendaciones.

2025-11-18T22:03:24+00:00 ― 7 minilectura

Computación y lenguaje ArgU: Una Nueva Herramienta para Generar Argumentos

ArgU crea argumentos estructurados basados en información factual para discusiones efectivas.

2025-11-18T18:06:24+00:00 ― 6 minilectura

Computación y lenguaje Evaluando GPT-3 en Resumen Médico

Este estudio evalúa la capacidad de GPT-3 para resumir la literatura médica de manera efectiva.

2025-11-18T08:06:00+00:00 ― 6 minilectura

Sonido Midiendo la belleza en la música: un nuevo enfoque

Un método matemático para evaluar la belleza de las actuaciones musicales.

2025-11-18T07:37:25+00:00 ― 6 minilectura

Odontología y Medicina Oral Mejorando el Cuidado Dental en Brasil: Un Estudio

Este estudio evalúa la atención periodontal en los Centros de Especialidad Dental de Brasil.

2025-11-18T03:45:30+00:00 ― 6 minilectura

Computación y lenguaje Evaluando Razonamientos Generados por Máquinas para Usuarios Humanos

Este artículo examina la efectividad de las explicaciones generadas por IA para los usuarios.

2025-11-17T22:53:00+00:00 ― 9 minilectura

Sonido DCASE 2023: Avanzando en la Síntesis Automática de Sonido Foley

Una competencia para mejorar la creación automática de sonido Foley para multimedia.

2025-11-17T14:37:10+00:00 ― 6 minilectura

Computación y lenguaje Presentamos C-Eval: Una Nueva Herramienta de Evaluación para Modelos de Lenguaje Chino

C-Eval evalúa las habilidades de razonamiento y conocimiento de los LLMs en chino.

2025-11-17T02:52:12+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la Comprensión de Documentos: Un Nuevo Conjunto de Datos

Un nuevo conjunto de datos mejora cómo las máquinas leen y responden a los documentos.

2025-11-16T12:39:00+00:00 ― 6 minilectura

Computación y lenguaje Evaluando el conjunto de datos de comprensión lectora RACE

Un análisis de las fortalezas y debilidades del conjunto de datos RACE para la comprensión de lectura.

2025-11-16T12:15:18+00:00 ― 9 minilectura

Computación y lenguaje Evaluando las afirmaciones de rendimiento sobrehumano en NLP

Una mirada crítica a los benchmarks de modelos de lenguaje y sus implicaciones para el rendimiento humano.

2025-11-16T11:51:36+00:00 ― 6 minilectura

Computación y lenguaje Abordando la falta de puntajes en evaluaciones de PLN

Este artículo presenta un nuevo método para manejar las puntuaciones faltantes en las evaluaciones de sistemas de NLP.

2025-11-15T11:45:54+00:00 ― 7 minilectura

Computación y lenguaje Avanzando la empatía en los chatbots

Aprende cómo se está entrenando a los chatbots para responder con empatía.

2025-11-15T09:00:00+00:00 ― 6 minilectura

Computación y lenguaje mLongT5: Avanzando en el Procesamiento Multilingüe de Texto

mLongT5 gestiona de forma eficiente textos más largos en varios idiomas.

2025-11-15T00:10:42+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la evaluación de la síntesis de texto a imagen

Un nuevo método mejora la forma en que evaluamos las imágenes generadas por IA a partir de descripciones de texto.

2025-11-15T00:02:48+00:00 ― 7 minilectura

Computación y lenguaje Avances en la generación de guiones jerárquicos

Un estudio sobre cómo crear instrucciones estructuradas a través de la descomposición jerárquica de tareas.

2025-11-14T19:26:18+00:00 ― 8 minilectura

Computación y lenguaje IKDSumm: Un Nuevo Enfoque para Resumir Tweets de Desastres

IKDSumm resume de manera efectiva los tweets durante desastres usando conocimientos específicos del desastre.

2025-11-14T07:51:06+00:00 ― 6 minilectura

Inteligencia artificial Mejorando los LLMs: La Taxonomía TELeR

Una nueva taxonomía para mejorar el rendimiento de LLM en tareas complejas.

2025-11-14T04:49:24+00:00 ― 7 minilectura

Computación y lenguaje Evaluando Argumentos en un Mundo Desinformado

Un nuevo método para evaluar la calidad de los argumentos teniendo en cuenta el contexto.

2025-11-14T03:46:12+00:00 ― 6 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje: Una Mirada Más Cercana

El estudio evalúa métodos para analizar modelos de lenguaje en su comprensión del idioma.

2025-11-13T03:08:54+00:00 ― 7 minilectura

Computación y lenguaje Presentando Seahorse: Un conjunto de datos de resumén multilingüe

Seahorse ofrece una gran colección de resúmenes multilingües con calificaciones de humanos.

2025-11-13T01:42:00+00:00 ― 7 minilectura

Computación y lenguaje Contenido cultural en la traducción automática: Nuevas perspectivas

Avances en la investigación sobre la traducción de referencias culturales usando sistemas de traducción automática.

2025-11-12T14:14:42+00:00 ― 10 minilectura

Inteligencia artificial Conectando Diferentes Tipos de Datos con LoReTTa

Un nuevo método para integrar varios tipos de datos médicos para un mejor análisis.

2025-11-12T13:51:00+00:00 ― 10 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje: Cerrando la Brecha Demográfica

Evaluar el rendimiento de los modelos de lenguaje en diferentes demografías humanas es clave para un uso efectivo.

2025-11-12T13:35:12+00:00 ― 7 minilectura

Computación y lenguaje Desafíos de los Modelos de Lenguaje Aumentados por Recuperación

Un estudio revela limitaciones en los modelos de lenguaje aumentados por recuperación para la generación de texto.

2025-11-12T08:11:18+00:00 ― 6 minilectura

Computación y lenguaje Una Nueva Forma de Enfrentar el Razonamiento en Documentos Largos

Presentando un marco estructurado para un razonamiento efectivo sobre textos largos.

2025-11-12T05:41:12+00:00 ― 5 minilectura

Computación y lenguaje Presentamos MMSMR: Un Nuevo Conjunto de Datos para Evaluar Chatbots

El conjunto de datos MMSMR tiene como objetivo mejorar la evaluación de conversaciones de chatbots con respuestas humanas diversas.

2025-11-12T04:38:00+00:00 ― 6 minilectura

Computación y lenguaje Normas Culturales: Una Comparación entre China y América

Este estudio compara las normas sociales entre las culturas china y americana a través del análisis de datos.

2025-11-12T03:50:36+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la resumación de tablas para consultas de usuarios

Un nuevo enfoque para resumir tablas basado en las preguntas del usuario para obtener mejores insights.

2025-11-12T00:48:54+00:00 ― 7 minilectura

Computación y lenguaje Una nueva forma de evaluar el texto generado

Presentamos un sistema que explica de manera clara la evaluación de texto generado por máquinas.

2025-11-12T00:17:18+00:00 ― 6 minilectura

Computación y lenguaje Avances en Modelos de Lenguaje Multilingües

Un nuevo conjunto de datos mejora la habilidad de los modelos de lenguaje para entender instrucciones en varios idiomas.

2025-11-10T17:20:48+00:00 ― 6 minilectura

Computación y lenguaje Mejorando la Precisión en Modelos de Lenguaje

Un nuevo método aborda los desafíos que enfrentan los modelos de lenguaje para ofrecer respuestas precisas.

2025-11-10T09:58:24+00:00 ― 7 minilectura

Aprendizaje automático Evaluando clasificadores abstencionistas con puntajes contrafactuales

Un método para evaluar clasificadores que se abstienen al estimar sus predicciones faltantes.

2025-11-10T06:52:08+00:00 ― 9 minilectura

Recuperación de información El Papel de las Preguntas de Clarificación en Sistemas de Conversación

Las preguntas de aclaración son clave para una buena comunicación en sistemas de conversación.

2025-11-09T18:34:06+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Resumiendo Videos de Lengua de Señas para Mejorar la Comunicación

Un nuevo método mejora la resumición de videos para contenido en lengua de señas.

2025-11-09T12:22:48+00:00 ― 6 minilectura

Computación y lenguaje Avanzando Técnicas de Vínculo de Entidades de Múltiples Modalidades

Mejorando las capacidades del modelo para vincular varios tipos de datos de manera efectiva.

2025-11-09T09:44:48+00:00 ― 6 minilectura

Computación y lenguaje Hub de Cadena de Pensamiento: Evaluando el Razonamiento en Modelos de Lenguaje

Una herramienta para evaluar las capacidades de razonamiento en varios pasos de los modelos de lenguaje grandes.

2025-11-09T08:41:36+00:00 ― 7 minilectura