Últimos artículos para Evaluación

Sistemas sanitarios y mejora de la calidad Conectando la investigación y el cuidado del paciente en sistemas de salud

Investigando Sistemas de Salud Aprendientes para mejorar la entrega de atención médica.

2025-10-05T07:57:00+00:00 ― 7 minilectura

Computación y lenguaje Presentamos SciEval: Un Nuevo Estándar para la Prueba de LLM en Ciencia

SciEval evalúa modelos de lenguaje en sus habilidades de investigación científica con preguntas diversas.

2025-10-05T01:01:24+00:00 ― 7 minilectura

Interacción Persona-Ordenador Evaluando Sistemas de Asesoría en Análisis Visual

Un enfoque práctico para evaluar sistemas de orientación para un análisis de datos efectivo.

2025-10-04T23:02:54+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la Clasificación de Documentos para Aplicaciones del Mundo Real

Este artículo habla sobre la necesidad de mejores técnicas de clasificación de documentos.

2025-10-04T21:43:54+00:00 ― 8 minilectura

Optimización y control Avanzando Sistemas de Frenos de Aire con Tecnología AI

Combinar redes neuronales con métodos tradicionales mejora la seguridad y el rendimiento de los frenos de aire.

2025-10-04T20:23:40+00:00 ― 6 minilectura

Computación y lenguaje Evaluando la Traducción Automática: Métricas de Oración vs. Métricas de Párrafo

Este artículo revisa qué tan bien puntúan los métodos de evaluación actuales las traducciones a nivel de párrafo.

2025-10-04T14:29:24+00:00 ― 7 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje en Salud: Un Nuevo Conjunto de Datos

Un nuevo conjunto de datos ayuda a evaluar modelos de lenguaje para aplicaciones en salud.

2025-10-03T22:25:36+00:00 ― 9 minilectura

Sonido Avances en el Mejora del Habla Usando Redes Neuronales de Picos

Un nuevo método para mejorar la calidad del habla usando redes eficientes en energía.

2025-10-03T21:44:15+00:00 ― 6 minilectura

Computación y lenguaje Un nuevo conjunto de datos para la generación de conocimiento conversacional

Presentamos un conjunto de datos centrado en conversaciones de preguntas y respuestas fácticas.

2025-10-03T00:26:18+00:00 ― 6 minilectura

Epidemiología Evaluando los Sistemas de Vigilancia de Una Salud en Europa

Un estudio evalúa la efectividad de la vigilancia de One Health en once sistemas europeos.

2025-10-02T14:44:00+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando Propuestas de Objetos en Tareas de Visión-Lenguaje

Un nuevo método para evaluar mejor las propuestas de objetos en tareas de visión y lenguaje.

2025-10-02T04:25:30+00:00 ― 8 minilectura

Computación y lenguaje Avances en sistemas de evaluación de diálogos multilingües

Los investigadores utilizan la traducción automática para mejorar las evaluaciones de calidad del diálogo en varios idiomas.

2025-10-02T01:08:00+00:00 ― 7 minilectura

Computación y lenguaje Abordando la alucinación en modelos de lenguaje grandes

Este artículo examina la alucinación en los modelos de lenguaje de IA y la investigación en curso.

2025-10-01T04:19:48+00:00 ― 8 minilectura

Bases de datos Desafíos en la Optimización de Consultas Aprendidas

Examinando problemas y soluciones para optimizadores de consultas aprendidos en la gestión de bases de datos.

2025-10-01T01:26:00+00:00 ― 6 minilectura

Computación y lenguaje Nuevo conjunto de datos HAE-RAE evalúa modelos de lenguaje en coreano

HAE-RAE Bench se centra en evaluar el conocimiento cultural en modelos de lenguaje coreano.

2025-09-30T02:31:24+00:00 ― 8 minilectura

Computación y lenguaje Evaluando el razonamiento en modelos de visión-lenguaje

Este trabajo evalúa qué tan bien los VLMs razonan a partir del contenido visual.

2025-09-29T06:14:48+00:00 ― 7 minilectura

Computación y lenguaje Creando preguntas de seguimiento efectivas

Un estudio sobre cómo generar preguntas de seguimiento significativas para profundizar en la comprensión.

2025-09-28T14:03:06+00:00 ― 7 minilectura

Computación y lenguaje Avanzando en la síntesis de habla expresiva con un nuevo conjunto de datos

Un nuevo conjunto de datos mejora la síntesis de voz al captar la expresión emocional sin depender del texto.

2025-09-27T18:22:05+00:00 ― 6 minilectura

Interacción Persona-Ordenador Un Nuevo Modelo para Entender las Emociones

Un modelo que integra la evaluación y el aprendizaje por refuerzo mejora la evaluación emocional.

2025-09-27T18:10:12+00:00 ― 6 minilectura

Computación y lenguaje Clasificando Revisiones en Ensayos Argumentativos

Este estudio examina cómo clasificar las revisiones para mejorar la escritura argumentativa.

2025-09-27T09:44:36+00:00 ― 6 minilectura

Computación y lenguaje Evaluando modelos de lenguaje en diferentes idiomas

Explorando cómo los LLMs pueden evaluar los resultados de los modelos en varios idiomas.

2025-09-27T00:00:00+00:00 ― 8 minilectura

Computación y lenguaje Mejorando la calidad de la traducción con evaluación contextual

SLIDE mejora las evaluaciones de traducción automática al incorporar un contexto más amplio durante la evaluación.

2025-09-26T15:10:42+00:00 ― 6 minilectura

Robótica Nuevo Método para la Navegación de Robots Móviles

Este método mejora la planificación de rutas de robots móviles en entornos cambiantes.

2025-09-26T02:56:00+00:00 ― 7 minilectura

Computación y lenguaje Evaluando la respuesta a preguntas largas en modelos de lenguaje

Este estudio compara el rendimiento de varios modelos de lenguaje al responder preguntas complejas.

2025-09-26T02:24:24+00:00 ― 5 minilectura

Procesado de Audio y Voz Evaluando un sistema automático de enmascaramiento de sonido en parques urbanos

Un estudio examina la efectividad de los enmascaradores de sonido automáticos en espacios públicos.

2025-09-25T18:35:40+00:00 ― 5 minilectura

Ingeniería del software Fuzzing Dirigido: Pruebas de Software Enfocadas para Descubrir Errores

Un enfoque centrado para identificar rápidamente errores de software a través de pruebas específicas.

2025-09-25T00:36:00+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el diagnóstico del cáncer con señales de causalidad en imágenes médicas

Un nuevo método mejora el diagnóstico del cáncer al integrar señales de causalidad débiles en la imagen médica.

2025-09-24T21:02:42+00:00 ― 9 minilectura

Computación y lenguaje Avances en la Transferencia de Estilo de Texto Complejo

Nuevos métodos mejoran la transferencia de estilo para el texto, manteniendo su significado.

2025-09-24T17:53:06+00:00 ― 8 minilectura

Computación y lenguaje Abordando el discurso de odio en el dialecto argelino

Un estudio sobre la detección del discurso de odio en el lenguaje de las redes sociales argelinas.

2025-09-24T05:22:36+00:00 ― 9 minilectura

Computación y lenguaje Evaluando Chatbots de Salud: Métricas para el Éxito

Este artículo habla sobre las métricas de evaluación para chatbots de salud efectivos.

2025-09-23T19:53:48+00:00 ― 8 minilectura

Inteligencia artificial Evolucionando Modelos de Aprendizaje Profundo con Evolución Regularizada

Este estudio examina cómo cambian los modelos de aprendizaje profundo durante la búsqueda de arquitecturas neuronales.

2025-09-23T17:07:54+00:00 ― 8 minilectura

Lógica en Informática Mejorando la Evaluación de Expresiones en Cálculo Lambda

Descubre un nuevo enfoque para mejorar la eficiencia de evaluación en el cálculo lambda.

2025-09-23T16:28:24+00:00 ― 8 minilectura

Aprendizaje automático SALSA-CLRS: Un nuevo estándar para algoritmos

Presentamos SALSA-CLRS para mejorar la evaluación de algoritmos usando gráficos dispersos.

2025-09-23T14:06:12+00:00 ― 7 minilectura

Computación y lenguaje Una nueva forma de evaluar sistemas de respuesta a preguntas

SQuArE métrico mejora la evaluación de sistemas de QA a través de múltiples referencias de respuestas.

2025-09-23T13:58:18+00:00 ― 6 minilectura

Aprendizaje automático Mejorando la atención médica en línea con clasificación automática

Un nuevo sistema busca conectar a los usuarios con profesionales de la medicina a través de una clasificación automatizada.

2025-09-21T11:16:48+00:00 ― 5 minilectura

Computación y lenguaje El futuro de la telemedicina: Resumiendo interacciones con pacientes

Los avances en resumir las conversaciones entre doctores y pacientes mejoran la comunicación en la telemedicina.

2025-09-21T04:18:06+00:00 ― 10 minilectura

Lenguajes de programación Probando la Confiabilidad en el Cálculo Lambda Tipo Simple

Explorando técnicas de prueba para evaluar funciones en lenguajes de programación.

2025-09-21T03:46:30+00:00 ― 7 minilectura

Estructuras de datos y algoritmos La Importancia de la Estabilidad de Preferencias Individuales en el Agrupamiento

La estabilidad en el clustering asegura que los grupos sean efectivos y significativos.

2025-09-20T18:01:54+00:00 ― 7 minilectura

Aprendizaje automático Presentamos GRANDE: Un Nuevo Método para Datos Tabulares

GRANDE usa descenso por gradiente para mejorar el aprendizaje a partir de datos tabulares.

2025-09-20T08:17:18+00:00 ― 5 minilectura

Computación y lenguaje Evaluando Modelos de IA con Meta Características

Un nuevo método para evaluar modelos de IA a través de embeddings y metacaracterísticas.

2025-09-19T10:10:06+00:00 ― 8 minilectura