Últimos artículos para Evaluación

Computación y lenguaje Perspectivas Automatizadas en el Análisis de Textos Legales

Un nuevo método revela patrones en las decisiones legales usando análisis de texto automatizado.

2025-09-19T06:21:00+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en el Procesamiento de Imágenes en Smartphones

Un modelo para una calidad de foto consistente en diferentes smartphones.

2025-09-18T16:39:24+00:00 ― 10 minilectura

Recuperación de información Mejorando las recomendaciones de moda con alternativas

Introducir alternativas puede mejorar la satisfacción del usuario en los sistemas de recomendación de moda.

2025-09-17T15:30:30+00:00 ― 7 minilectura

Computación y lenguaje Evaluando LLMs en Competencias de Matemáticas de Secundaria

Un nuevo conjunto de datos evalúa las habilidades de los modelos de lenguaje en la resolución de problemas de matemáticas avanzadas.

2025-09-17T08:47:36+00:00 ― 6 minilectura

Ingeniería del software Abordando la duplicación de código entre conjuntos de datos en la evaluación de modelos

Examinando los efectos de la duplicación de código entre conjuntos de datos en las métricas de rendimiento del modelo.

2025-09-17T01:33:06+00:00 ― 10 minilectura

Aprendizaje automático Mejorando RAG para la Generación de Texto en Portugués Brasileño

Este estudio se centra en mejorar los métodos de generación aumentada por recuperación para el portugués brasileño.

2025-09-17T00:53:36+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones WAVES: Un Nuevo Estándar para la Marcas de Agua en Imágenes

Este estudio presenta WAVES, un estándar para evaluar técnicas de marca de agua contra varios ataques.

2025-09-16T13:42:06+00:00 ― 5 minilectura

Computación y lenguaje Orion-14B: Una Nueva Era en Modelos de Lenguaje

Orion-14B se destaca en entender y generar texto multilingüe con 14 mil millones de parámetros.

2025-09-15T17:49:12+00:00 ― 7 minilectura

Recuperación de información Evaluando la Persona en Sistemas de Diálogo

Nuevos métodos evalúan cómo los sistemas de diálogo mantienen la consistencia de la personalidad.

2025-09-15T11:14:12+00:00 ― 8 minilectura

Computación y lenguaje Un nuevo enfoque para la composición del conocimiento en PLN

Este marco mejora cómo se combina el conocimiento en los modelos de aprendizaje automático para tener un mejor rendimiento.

2025-09-14T22:59:30+00:00 ― 8 minilectura

Inteligencia artificial Usando Modelos de Lenguaje para Resumir Informes PET

Un estudio revela que los modelos de lenguaje pueden generar impresiones útiles de informes PET.

2025-09-14T07:36:21+00:00 ― 7 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje Grandes en Diagnóstico Médico

Evaluando la precisión de los LLMs para diagnosticar condiciones médicas a partir de imágenes y síntomas.

2025-09-13T23:41:12+00:00 ― 5 minilectura

Computación y lenguaje Mejorando la Evaluación de IA en Informes de Radiología

Esta investigación mejora la evaluación de informes de radiología generados por IA a través de la colaboración de expertos.

2025-09-13T18:56:48+00:00 ― 9 minilectura

Informática y sociedad Evaluando la Seguridad de la IA Generativa: El Papel del Red-Teaming

Analizando cómo el red-teaming puede mejorar la seguridad de la IA y abordar riesgos potenciales.

2025-09-13T12:13:54+00:00 ― 9 minilectura

Informática y sociedad Abordando la Amplificación de Daño en Modelos de IA

Examinando la amplificación de daño en modelos de texto a imagen y su impacto en la sociedad.

2025-09-12T18:11:36+00:00 ― 8 minilectura

Computación y lenguaje Ajustando los Modelos de Lenguaje a las Preferencias Humanas

Este documento habla sobre cómo ajustar los modelos de lenguaje para que se alineen con los valores y expectativas humanas.

2025-09-12T13:03:30+00:00 ― 7 minilectura

Computación y lenguaje Presentando un Modelo de Lenguaje Abierto y Transparente

Un nuevo modelo de lenguaje abierto para la investigación y la innovación en el procesamiento del lenguaje natural.

2025-09-12T09:14:24+00:00 ― 7 minilectura

Sonido Un Nuevo Marco para la Anonimización de Voces

Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.

2025-09-12T05:05:10+00:00 ― 8 minilectura

Interacción Persona-Ordenador EvaLLM: Un marco para evaluar visualizaciones generadas por IA

EvaLLM ofrece un enfoque estructurado para evaluar el contenido visual generado por IA.

2025-09-11T21:07:36+00:00 ― 7 minilectura

Aprendizaje automático Asegurando la Confianza en el Aprendizaje Automático: Un Nuevo Enfoque

Un método para verificar modelos de aprendizaje automático para aumentar la confianza y la transparencia.

2025-09-11T16:15:18+00:00 ― 7 minilectura

Computación y lenguaje Entendiendo la IA con SIDU-TXT: Un Nuevo Enfoque

SIDU-TXT ilumina las decisiones de IA en el procesamiento del lenguaje natural.

2025-09-11T02:57:24+00:00 ― 7 minilectura

Comunicación científica y educación Sesgo de género en las evaluaciones de investigación académica

Investigaciones muestran que las mujeres enfrentan sesgos en evaluaciones y financiamiento en la academia.

2025-09-11T00:05:30+00:00 ― 12 minilectura

Visión por Computador y Reconocimiento de Patrones Transformando notas escritas a mano en tinta digital

Un nuevo método convierte notas escritas a mano en tinta digital para usarlas fácilmente.

2025-09-09T20:56:12+00:00 ― 9 minilectura

Ingeniería del software Desafíos de Reproducibilidad en la Predicción de Fallos de Software

Un análisis de problemas de reproducibilidad en la investigación sobre la predicción de fallos en software de aprendizaje profundo.

2025-09-09T19:21:24+00:00 ― 10 minilectura

Computación y lenguaje Abordando la Confusión de Nombres en la Generación de Texto

Nuevo método mejora la verificación de hechos para textos generados por computadora con nombres ambiguos.

2025-09-09T17:30:48+00:00 ― 9 minilectura

Multimedia Diseño de Pósters Efectivo a Través de Métricas Sencillas

Aprende a diseñar carteles que comuniquen mensajes de manera clara y atractiva.

2025-09-09T08:49:24+00:00 ― 6 minilectura

Aprendizaje automático Abordando el hacking de recompensas en el entrenamiento de IA

Explorando los desafíos y soluciones del hacking de recompensas en el entrenamiento de modelos de IA.

2025-09-09T06:58:48+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo marco para evaluar modelos de respuesta a preguntas visuales

Un método nuevo para evaluar cómo los modelos responden a preguntas relacionadas con imágenes.

2025-09-09T06:11:24+00:00 ― 6 minilectura

Procesado de Audio y Voz Presentamos AV-SUPERB: Un Nuevo Referente para Modelos Audiovisuales

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

Computación y lenguaje Evaluando Modelos de Generación de Expresiones Referenciales

Nuevos métodos mejoran cómo evaluamos el texto generado por computadora.

2025-09-08T20:18:54+00:00 ― 10 minilectura

Inteligencia artificial Evaluando Modelos de Lenguaje Grande en Ciberseguridad

Una mirada detallada a la evaluación de expertos en inteligencia artificial y humanos en ciberseguridad por parte de CyberMetric.

2025-09-08T19:39:24+00:00 ― 10 minilectura

Aprendizaje automático La necesidad de olvidar máquinas en IA

Abordando preocupaciones éticas mediante la eliminación selectiva de memoria en modelos de IA.

2025-09-08T16:53:30+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la Generación de Texto a Imagen

Explorando cómo las máquinas crean imágenes a partir de indicaciones de texto y se alinean con las preferencias humanas.

2025-09-08T11:29:36+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en la Personalización de Modelos de Lenguaje

Este estudio examina los beneficios de las respuestas personalizadas en los modelos de lenguaje.

2025-09-08T05:02:30+00:00 ― 5 minilectura

Recuperación de información Estrategias de comparación para sistemas de recomendación

Un nuevo enfoque para evaluar y comparar algoritmos de RecSys usando conjuntos de datos diversos.

2025-09-07T16:00:24+00:00 ― 19 minilectura

Computación y lenguaje Mejorando los métodos de evaluación de preguntas y respuestas

Un nuevo marco para evaluar la corrección de las respuestas de IA con un juicio parecido al humano.

2025-09-07T13:06:36+00:00 ― 8 minilectura

Computación y lenguaje Mejorando la educación en ciencias con modelos de lenguaje

Los modelos de lenguaje buscan mejorar el aprendizaje de la ciencia al ofrecer ayuda personalizada.

2025-09-07T12:27:06+00:00 ― 10 minilectura

Aprendizaje automático Evaluando la Detección de Anomalías en Series de Tiempo con TimeSeriesBench

Una herramienta de referencia para mejorar los métodos de detección de anomalías en series temporales.

2025-09-07T10:04:54+00:00 ― 8 minilectura

Computación y lenguaje Sesgo en el Juicio de Modelos de Lenguaje

La investigación revela sesgos significativos en las evaluaciones humanas y de LLM sobre las respuestas.

2025-09-07T05:12:36+00:00 ― 8 minilectura

Computación y lenguaje Evaluando la IA médica: un nuevo estándar para los Med-MLLMs

Este benchmark evalúa el rendimiento de los modelos de lenguaje médico en el cuidado de la salud.

2025-09-07T01:47:12+00:00 ― 10 minilectura