Últimos artículos para Evaluación

Inteligencia artificial Aprovechando Modelos de Lenguaje para la Generación de Hipótesis Científicas

Este artículo explora cómo los LLMs generan y refinan hipótesis científicas a partir de datos existentes.

2025-08-22T06:43:06+00:00 ― 8 minilectura

Inteligencia artificial Mejorando la Compleción de Grafos de Conocimiento con KGExplainer

KGExplainer mejora la transparencia en la completación de grafos de conocimiento a través de explicaciones significativas.

2025-08-22T01:42:54+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método para crear imágenes humanas realistas

Un nuevo enfoque para generar imágenes detalladas de personas en escenas complejas.

2025-08-21T20:26:54+00:00 ― 7 minilectura

Computación y lenguaje Evaluando la seguridad de los modelos de lenguaje grandes

Una revisión de conjuntos de datos centrados en mejorar la seguridad de los LLM.

2025-08-21T08:04:18+00:00 ― 8 minilectura

Inteligencia artificial Un nuevo enfoque para el aprendizaje multiagente

Revolucionando el rendimiento de los agentes a través de la evaluación y la acumulación de experiencia.

2025-08-21T05:42:06+00:00 ― 7 minilectura

Inteligencia artificial Evaluando y Mejorando Agentes Digitales

Un enfoque en métodos para evaluar y mejorar el rendimiento de los agentes digitales.

2025-08-21T02:24:36+00:00 ― 4 minilectura

Ingeniería del software Mejorando la Solución de Errores con Modelos de Lenguaje Grandes

Un nuevo método usa LLMs para mejorar la eficiencia en la reparación de programas.

2025-08-20T06:55:24+00:00 ― 6 minilectura

Computación y lenguaje Evaluando la autorreflexión en modelos de lenguaje

La investigación revela cómo la autorreflexión impacta el rendimiento de los modelos de lenguaje en diferentes tipos de preguntas.

2025-08-20T01:15:42+00:00 ― 7 minilectura

Lógica El Papel de la Sustitución Esquemática y la Unificación en la Lógica

Explorando conceptos clave en lógica y ciencias de la computación para un razonamiento efectivo.

2025-08-19T18:55:30+00:00 ― 8 minilectura

Ingeniería del software Evaluando Requisitos de Software con Modelos de Lenguaje

Una mirada a usar modelos de lenguaje para evaluar la satisfacción de los requisitos del software.

2025-08-18T13:50:36+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando la percepción visual en modelos de lenguaje

Un nuevo estándar revela brechas en la comprensión visual de los modelos de lenguaje grandes.

2025-08-18T12:23:42+00:00 ― 8 minilectura

Economía Teórica Mercados de emparejamiento: El impacto del ruido en las admisiones universitarias

Analizando cómo el ruido afecta el emparejamiento de estudiantes y universidades en los procesos de admisión.

2025-08-18T06:13:18+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la Precisión en Resúmenes Científicos con Retroalimentación

Usando mecanismos de retroalimentación para mejorar los resúmenes científicos generados por LLM.

2025-08-18T05:40:48+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la Respuesta a Preguntas Visuales Centrado en Texto

El nuevo conjunto de datos Square-10M mejora significativamente las capacidades de respuesta a preguntas visuales de código abierto.

2025-08-18T02:31:12+00:00 ― 8 minilectura

Ingeniería del software Automatizando la Generación de Escenarios de Prueba en el Desarrollo de Software

Este artículo presenta un método para generar escenarios de prueba a partir de requisitos en lenguaje natural.

2025-08-18T02:15:24+00:00 ― 9 minilectura

Computación y lenguaje Un nuevo método para la automatización web

Este enfoque mejora la extracción de datos de páginas web usando reglas estructuradas.

2025-08-18T01:59:36+00:00 ― 6 minilectura

Computación y lenguaje Evaluando la Precisión de Grandes Modelos de Lenguaje y Visión

Un nuevo estándar mejora cómo evaluamos los LVLMs y su precisión.

2025-08-17T06:46:12+00:00 ― 6 minilectura

Lógica en Informática CHC-COMP 2023: Evaluando solucionadores de cláusulas de Horn restringidas

La competencia CHC mostró avances en los solucionadores y sus aplicaciones en la verificación de programas.

2025-08-17T00:50:42+00:00 ― 7 minilectura

Computación y lenguaje Retroalimentación Automatizada: Un Nuevo Enfoque para Escribir Ensayos

Este estudio investiga sistemas automatizados para dar retroalimentación sobre ensayos usando modelos de lenguaje.

2025-08-16T18:31:30+00:00 ― 7 minilectura

Aprendizaje automático El Creciente Papel de los Datos Sintéticos en la Investigación

Los datos sintéticos ofrecen soluciones económicas mientras garantizan la privacidad y reducen el sesgo.

2025-08-16T18:07:48+00:00 ― 7 minilectura

Computación y lenguaje Evaluando modelos de lenguaje con el benchmark VISLA

Un nuevo estándar evalúa la comprensión de los modelos de lenguaje sobre los significados de las palabras y sus relaciones.

2025-08-16T08:07:24+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando la Extracción de Información en Textos Manuscritos

N nuevas métricas mejoran la evaluación de sistemas de extracción de información en documentos manuscritos.

2025-08-15T11:58:42+00:00 ― 8 minilectura

Sistemas multiagente Evaluando el rendimiento de la IA en sistemas multiagente

Un marco para evaluar estrategias de IA en entornos competitivos y cooperativos.

2025-08-15T07:22:12+00:00 ― 8 minilectura

Ingeniería del software Midiendo la Confianza en Resúmenes de Código Generados por IA

Evaluando la fiabilidad de los resúmenes producidos por IA para mejorar el mantenimiento del software.

2025-08-15T02:53:36+00:00 ― 9 minilectura

Informática sanitaria El Papel de ChatGPT en la Salud

Examinando cómo ChatGPT impacta en la salud y sus posibles usos.

2025-08-14T23:39:30+00:00 ― 6 minilectura

Computación y lenguaje DynaMo: Impulsando Modelos de Lenguaje con Predicción de Múltiples Tokens

Los modelos DynaMo generan texto más rápido y con mejor calidad usando predicción de múltiples tokens.

2025-08-14T23:04:30+00:00 ― 6 minilectura

Computación y lenguaje Mejorando las Secciones de Trabajo Relacionado en Artículos de Investigación

Un nuevo conjunto de datos mejora la generación de secciones de trabajos relacionados en artículos científicos.

2025-08-14T00:33:36+00:00 ― 10 minilectura

Recuperación de información Avanzando en la búsqueda conversacional con TREC iKAT

TREC iKAT busca mejorar las interacciones con agentes conversacionales a través de diálogos personalizados.

2025-08-13T20:28:42+00:00 ― 8 minilectura

Computación y lenguaje Automatizando Respuestas a Reseñas de Clientes

SCRABLE ofrece soluciones automatizadas para una gestión efectiva de reseñas de aplicaciones.

2025-08-13T13:53:42+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando el futuro de los modelos multimodales grandes de video

Evaluando las capacidades y desafíos de los modelos avanzados de comprensión de video.

2025-08-13T12:42:36+00:00 ― 7 minilectura

Computación y lenguaje Evaluando explicaciones de IA: un nuevo enfoque

Este estudio analiza la efectividad de los LLMs para evaluar explicaciones generadas por IA.

2025-08-12T12:36:54+00:00 ― 9 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje: El Benchmark DoLoMiTes

Un nuevo marco evalúa qué tan bien los modelos de lenguaje ayudan a los expertos con tareas de escritura.

2025-08-12T08:39:54+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Presentando PEAVS: Una nueva forma de medir la sincronización audio-vídeo

PEAVS analiza qué tan bien funcionan el audio y el video juntos para mejorar la experiencia del espectador.

2025-08-12T03:19:55+00:00 ― 8 minilectura

Inteligencia artificial Evaluando el impacto del entrenamiento de DNN: un nuevo método

Una forma rápida de evaluar el rendimiento de una DNN después de un nuevo entrenamiento.

2025-08-12T00:22:12+00:00 ― 7 minilectura

Aprendizaje automático Mejorando la Transparencia de los Modelos de IA con Autoencoders Escasos

Los autoencoders dispersos mejoran la interpretabilidad de los sistemas de IA y sus procesos de toma de decisiones.

2025-08-11T02:07:06+00:00 ― 13 minilectura

Computación y lenguaje Evaluando la comprensión del mundo por parte de la IA

Una mirada a cómo los modelos de IA entienden el conocimiento esencial del mundo.

2025-08-10T22:41:42+00:00 ― 7 minilectura

Computación y lenguaje Evaluando la toxicidad en modelos de lenguaje multilingües

Nueva evaluación mide la toxicidad en modelos de lenguaje grandes en varios idiomas.

2025-08-10T21:30:36+00:00 ― 9 minilectura

Ingeniería del software Mejorando las evaluaciones de fuzzing para una mejor calidad de software

Este artículo habla sobre la necesidad de mejores prácticas de evaluación en la investigación de fuzzing.

2025-08-10T15:11:24+00:00 ― 7 minilectura

Interacción Persona-Ordenador Evaluando Métodos de Saliencia en NLP: Una Perspectiva Humana

Este estudio evalúa métodos de saliencia en NLP a través de la evaluación humana.

2025-08-10T07:56:54+00:00 ― 10 minilectura

Aprendizaje automático Mejorando el Análisis de Mapas de Calor para Decisiones de IA

Presentamos PQAH para entender mejor los mapas de calor de IA y su evaluación.

2025-08-09T15:29:24+00:00 ― 9 minilectura