Últimos artículos para Evaluación

Computación y lenguaje Presentamos CORE-GPT: Un recurso de investigación confiable

CORE-GPT ofrece respuestas confiables usando artículos científicos de acceso abierto.

2025-10-23T04:10:54+00:00 ― 5 minilectura

Ingeniería del software Mejorando la Revisión de Código con ReviewRanker

Un nuevo sistema para mejorar el proceso de revisión de código y asegurar la calidad.

2025-10-22T07:46:24+00:00 ― 7 minilectura

Aprendizaje automático Un Enfoque Sostenible para la Búsqueda de Arquitecturas Neurales

Nuevo marco equilibra la eficiencia del aprendizaje profundo y las emisiones de carbono.

2025-10-22T01:58:48+00:00 ― 7 minilectura

Medicina Forense Desafíos que enfrentan los niños no acompañados que buscan asilo

Más de 300,000 niños están buscando asilo en EE. UU., enfrentando un montón de obstáculos.

2025-10-21T16:46:00+00:00 ― 7 minilectura

Procesado de Audio y Voz FALL-E: Una Nueva Era en la Creación de Sonido

FALL-E crea efectos de sonido de alta calidad a partir de descripciones de texto.

2025-10-21T13:13:20+00:00 ― 5 minilectura

Inteligencia artificial Desafíos en la IA Explicable: Un Análisis Profundo

Examinando los problemas y el potencial de los métodos de IA explicable.

2025-10-20T10:13:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Usando el lenguaje para crear escenarios de tráfico dinámicos

Un método que genera escenas de tráfico usando lenguaje natural para pruebas de conducción autónoma.

2025-10-19T09:27:48+00:00 ― 8 minilectura

Computación y lenguaje El Auge de los Modelos de Lenguaje Pequeños

Descubre el potencial de los modelos de lenguaje pequeños en la tecnología de IA.

2025-10-19T09:12:00+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la Evaluación de Taxonomías con Modelos de Lenguaje

Un nuevo método para evaluar taxonomías usando modelos de lenguaje muestra potencial.

2025-10-18T17:08:12+00:00 ― 8 minilectura

Computación y lenguaje Evaluando los Efectos en la Edición del Conocimiento

Nueva investigación destaca la importancia de los efectos en cadena al actualizar modelos de lenguaje.

2025-10-16T11:40:48+00:00 ― 10 minilectura

Sistemas multiagente Mejorando el Presupuesto Participativo a Través del Consenso

Un nuevo método mejora la equidad en el presupuesto participativo al promover el diálogo entre los votantes.

2025-10-16T11:01:18+00:00 ― 7 minilectura

Comunicación científica y educación Examinando la claridad del lenguaje en la revisión por pares de eLife

El estudio evalúa la claridad de las frases de revisión por pares de eLife y sugiere mejoras.

2025-10-16T05:29:36+00:00 ― 7 minilectura

Recuperación de información Evaluando Sistemas de Recomendación: DCG vs nDCG

Una mirada a la efectividad de las métricas de recomendación en las experiencias de los usuarios.

2025-10-15T06:11:12+00:00 ― 11 minilectura

Aprendizaje automático Evaluando la incertidumbre en modelos de aprendizaje automático

Evaluando la capacidad de los modelos para estimar la incertidumbre y mejorar las predicciones.

2025-10-15T03:22:00+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la generación de imágenes a partir de descripciones de texto

Un nuevo método mejora cómo las imágenes coinciden con las entradas de texto.

2025-10-14T14:00:56+00:00 ― 7 minilectura

Computación y lenguaje Nuevo estándar de evaluación para modelos multimodales

Un nuevo estándar busca mejorar la evaluación de Modelos de Lenguaje Multimodal Grandes.

2025-10-14T06:05:30+00:00 ― 7 minilectura

Computación y lenguaje Evaluando Estrategias de Aprendizaje Activo en PLN

Un marco para comparar métodos de aprendizaje activo para mejorar la eficiencia en el etiquetado de datos.

2025-10-13T16:31:48+00:00 ― 7 minilectura

Computación y lenguaje Nuevo método para evaluar las respuestas de modelos de lenguaje

Un enfoque nuevo usa redes más amplias para mejorar la calidad de evaluación de los modelos de lenguaje.

2025-10-12T17:13:30+00:00 ― 7 minilectura

Computación y lenguaje Abordando el sesgo en los datos de texto: El marco Nbias

Un marco para identificar y reducir el sesgo en datos textuales para resultados más justos.

2025-10-12T14:51:18+00:00 ― 11 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la generación de datos de radar para la conducción automática

Un nuevo método usa GANs para crear datos de radar realistas y hacer que la conducción automática sea más segura.

2025-10-12T08:40:00+00:00 ― 6 minilectura

Criptografía y seguridad Evaluando detectores de abuso de Crypto-API con MASC

MASC ofrece un nuevo enfoque para probar eficazmente los detectores de uso indebido de API criptográficas.

2025-10-12T06:49:24+00:00 ― 6 minilectura

Optimización y control Optimización Estocástica: Enfrentando la Incertidumbre en la Toma de Decisiones

Aprende cómo la optimización estocástica aborda la incertidumbre en diferentes campos.

2025-10-12T04:55:12+00:00 ― 6 minilectura

Computación y lenguaje Mejorando las Evaluaciones de Resumen con Conciencia de Redundancia

Una nueva métrica mejora la calidad del resumen al abordar la redundancia y las múltiples referencias.

2025-10-12T04:11:24+00:00 ― 7 minilectura

Ingeniería del software Evaluando Modelos de Lenguaje Grandes para Código

Nuevos métodos mejoran la comprensión de los modelos de lenguaje utilizados para tareas de codificación.

2025-10-11T13:18:42+00:00 ― 8 minilectura

Computación y lenguaje Presentamos SciGraphQA: Un Nuevo Conjunto de Datos para Gráficos Científicos

SciGraphQA ofrece un conjunto de datos muy completo para entender gráficos científicos a través de preguntas y respuestas.

2025-10-11T06:20:00+00:00 ― 6 minilectura

Computación y lenguaje CheXOFA: Un paso hacia el reporte automático de rayos X

CheXOFA resume informes de radiografías de tórax, mejorando la eficiencia en la salud.

2025-10-11T05:26:50+00:00 ― 6 minilectura

Computación y lenguaje Presentamos CLEVA: una plataforma de evaluación para modelos de lenguaje chino

CLEVA ofrece evaluaciones estandarizadas para evaluar modelos de lenguaje chino de manera efectiva.

2025-10-10T07:57:00+00:00 ― 7 minilectura

Recuperación de información Tendencias en recomendaciones personalizadas de PDI para turistas

Examinando los avances recientes en sistemas de recomendación de POI del 2017 al 2022.

2025-10-09T04:25:54+00:00 ― 12 minilectura

Aprendizaje automático Presentamos UPREVE: Una herramienta para el descubrimiento causal

UPREVE simplifica el descubrimiento causal en sistemas sociales y de comportamiento para investigadores.

2025-10-08T18:39:48+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método de evaluación para la síntesis de texto a imagen

Un enfoque nuevo para evaluar la calidad de generación de imágenes a partir de descripciones de texto.

2025-10-08T01:26:24+00:00 ― 8 minilectura

Física de altas energías - Experimento Generando Imágenes a Partir de Datos de Física de Partículas Usando Modelos de IA

Este artículo destaca el uso de modelos generativos para crear imágenes de física de partículas.

2025-10-07T19:22:00+00:00 ― 7 minilectura

Computación y lenguaje Presentamos el Referente Médico Integral para LLMs en China

Un nuevo referente para evaluar modelos de lenguaje en contextos médicos en chino.

2025-10-07T18:51:24+00:00 ― 12 minilectura

Aprendizaje automático Mejorando los métodos de atribución de características en IA

Evaluando métodos de atribución de características a través de solidez y completitud para mejores predicciones de IA.

2025-10-07T18:35:36+00:00 ― 7 minilectura

Computación y lenguaje Evaluando ChatGPT para la alineación de ontologías

Este estudio evalúa cómo se desempeña ChatGPT en emparejar ontologías.

2025-10-07T15:57:36+00:00 ― 6 minilectura

Computación y lenguaje Evaluando Sistemas de Corrección de Errores Gramaticales

Una visión general de cómo evaluar los sistemas GEC de manera efectiva.

2025-10-07T12:40:06+00:00 ― 8 minilectura

Inteligencia artificial Midiendo la Relación Semántica en DBpedia

Este documento explora métodos para evaluar la relación entre conceptos usando DBpedia.

2025-10-07T02:16:00+00:00 ― 8 minilectura

Computación y lenguaje Mejorando Modelos de Lenguaje a Través del Ajuste de Instrucciones

Una mirada a cómo la adaptación de instrucciones mejora las respuestas de los modelos de lenguaje.

2025-10-06T12:02:48+00:00 ― 10 minilectura

Inteligencia artificial Evaluando Grafos de Conocimiento con KGrEaT

KGrEaT evalúa la calidad y utilidad de los gráficos de conocimiento para varias tareas.

2025-10-06T01:22:54+00:00 ― 6 minilectura

Computación y lenguaje Mejorando los Modelos de Lenguaje para el Portugués

Un nuevo método mejora los modelos de lenguaje específicamente para el portugués.

2025-10-05T21:10:06+00:00 ― 6 minilectura

Computación y lenguaje Presentamos el Benchmark de Enlace de Entidades Biomédicas (BELB)

Un estándar para mejorar la vinculación de entidades biomédicas y las comparaciones en investigaciones.

2025-10-05T17:28:54+00:00 ― 6 minilectura