Últimos artículos para Referencia

Aprendizaje automático Avanzando en el Desaprendizaje Automático: Un Benchmark Unificado

Un nuevo punto de referencia para el desaprendizaje automático mejora la evaluación y comparación de métodos.

2025-07-26T12:42:42+00:00 ― 9 minilectura

Ingeniería del software Avances en la Generación de Código con Técnicas Aumentadas por Recuperación

Un nuevo método mejora la precisión de generación de código usando documentos externos.

2025-07-26T08:06:12+00:00 ― 8 minilectura

Rendimiento CEBench: Un Enfoque Equilibrado para Evaluar LLMs

CEBench ayuda a las empresas y a los investigadores a evaluar LLMs mientras manejan costos y rendimiento.

2025-07-26T00:43:48+00:00 ― 7 minilectura

Computación y lenguaje Evaluando el Aprendizaje en Contexto en Modelos de Lenguaje

Los estudios destacan las habilidades de aprendizaje en contexto en modelos de lenguaje grandes.

2025-07-25T16:18:12+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando modelos SLAM en entornos ruidosos

Nuevo marco evalúa el rendimiento de SLAM en condiciones desafiantes.

2025-07-25T00:06:30+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando alucinaciones en modelos de video-lenguaje

Nuevo estándar evalúa cómo los modelos de lenguaje en video manejan las imprecisiones de manera efectiva.

2025-07-24T17:47:18+00:00 ― 8 minilectura

Computación y lenguaje La Influencia de los Modelos de Lenguaje en la Persuasión

Evaluando cómo los LLMs crean textos persuasivos sobre varios temas.

2025-07-24T13:26:36+00:00 ― 7 minilectura

Computación y lenguaje Evaluando modelos de lenguaje italiano con pruebas INVALSI

Este estudio evalúa el rendimiento de los Modelos de Lenguaje utilizando las pruebas INVALSI italianas.

2025-07-24T09:37:30+00:00 ― 9 minilectura

Aprendizaje automático Mejorando el Aprendizaje Activo con Nueva Herramienta de Referencia

Una herramienta de referencia avanza en estrategias de aprendizaje activo en el aprendizaje automático.

2025-07-24T06:51:36+00:00 ― 8 minilectura

Ingeniería del software Evaluación de LLMs para la generación de aserciones en el diseño de hardware

Este artículo evalúa la efectividad de los modelos de lenguaje grandes en la creación de afirmaciones de hardware.

2025-07-24T01:27:42+00:00 ― 8 minilectura

Computación y lenguaje Mejorando la lectura en pantalla para discapacidades visuales

Un nuevo sistema de IA mejora la accesibilidad para usuarios con discapacidades visuales a través de una mejor lectura de pantalla.

2025-07-23T10:27:06+00:00 ― 6 minilectura

Computación y lenguaje Presentando un nuevo punto de referencia para los modelos de lenguaje ruso

Un punto de referencia de pares mínimos tiene como objetivo mejorar la comprensión de la gramática rusa por parte de los modelos de lenguaje.

2025-07-23T09:55:30+00:00 ― 8 minilectura

Aprendizaje automático Descubrimiento de datos eficiente con modelos basados en bocetos

Un nuevo modelo simplifica el análisis de datos en grandes conjuntos de datos utilizando bocetos.

2025-07-23T03:44:12+00:00 ― 8 minilectura

Aprendizaje automático Presentando las Funciones de Ehrlich para la Optimización de Secuencias

Un nuevo referente para mejorar los métodos de optimización de secuencias biofísicas.

2025-07-23T01:53:36+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Un Enfoque Novel para la Detección de Anomalías

Este estudio presenta un nuevo método para detectar anomalías en diversos contextos.

2025-07-22T23:47:12+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Repensando los Métodos de Evaluación para Modelos Multimodales

Nuevo estándar mejora la evaluación de modelos multimodales al minimizar sesgos.

2025-07-22T12:12:00+00:00 ― 7 minilectura

Biomoléculas Avances en la Clasificación de Enzimas con el Benchmark CARE

Nuevo estándar ayuda a predecir el comportamiento de las enzimas usando aprendizaje automático.

2025-07-22T04:11:30+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Modelos avanzados para la generación de descripciones de videos

Nuevos modelos producen descripciones de video de alta calidad de manera efectiva.

2025-07-22T02:35:18+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo estándar para modelos de visión-lenguaje en microscopía

Un benchmark completo mejora la evaluación de modelos de lenguaje y visión para el análisis de imágenes biológicas.

2025-07-21T21:03:30+00:00 ― 9 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje para la Investigación Científica

Un nuevo estándar para evaluar modelos de lenguaje grandes en pruebas de hipótesis.

2025-07-21T19:52:24+00:00 ― 8 minilectura

Recuperación de información Mejorando la Recuperación de Código con un Nuevo Benchmark

Un nuevo estándar aborda los desafíos en la recuperación de código para los desarrolladores.

2025-07-20T02:47:36+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando la Robustez Visual en Sistemas de VQA

Esta investigación examina cómo los problemas visuales afectan a los modelos de Preguntas y Respuestas Visuales.

2025-07-19T18:22:00+00:00 ― 8 minilectura

Criptografía y seguridad NFARD: Un Nuevo Enfoque para la Detección de Reutilización de Modelos

NFARD ofrece métodos innovadores para proteger los derechos de autor de modelos de aprendizaje profundo.

2025-07-19T07:02:36+00:00 ― 8 minilectura

Inteligencia artificial Modelo de Barandilla Innovadora Mejora la Seguridad de los Modelos de Lenguaje

Un nuevo modelo mejora el monitoreo de seguridad para modelos de lenguaje grandes contra contenido dañino.

2025-07-18T02:12:30+00:00 ― 8 minilectura

Aprendizaje automático Avanzando en la Optimización Bayesiana para Problemas Complejos

Una mirada a cómo la optimización bayesiana aborda los desafíos de alta dimensión.

2025-07-17T19:40:44+00:00 ― 9 minilectura

Inteligencia artificial Evaluando Agentes de Análisis de Datos con un Nuevo Punto de Referencia

Un nuevo método para evaluar agentes de análisis de datos para mejores percepciones comerciales.

2025-07-17T16:35:48+00:00 ― 7 minilectura

Inteligencia artificial Estandarizando la Evaluación de Algoritmos para Problemas de Corte Máximo

Presentando MaxCut-Bench para una evaluación consistente de algoritmos en retos de optimización.

2025-07-17T09:34:08+00:00 ― 8 minilectura

Computación y lenguaje Evaluando la confianza en el procesamiento de documentos largos

Mejorar cómo los modelos manejan la evidencia en documentos largos genera confianza en los usuarios.

2025-07-15T22:35:42+00:00 ― 5 minilectura

Inteligencia artificial Evaluando Modelos de Lenguaje a Través de Juegos Clásicos

Evaluando las capacidades de los LLM usando juegos en cuadrícula como Tres en Raya y Cuatro en Raya.

2025-07-15T22:27:48+00:00 ― 8 minilectura

Informática y sociedad Asegurando la Seguridad de la IA: Nuevo Estándar Introducido

Un nuevo estándar busca evaluar de manera efectiva los riesgos de seguridad de la IA.

2025-07-15T13:14:48+00:00 ― 9 minilectura

Arquitectura de hardware Avances en el diseño de hardware multimodal

Combinar visuales y lenguaje mejora la precisión en la generación de código de hardware.

2025-07-15T02:50:42+00:00 ― 7 minilectura

Aprendizaje automático Evaluando Modelos de Predicción Espacio-Temporales

Un nuevo estándar aborda la necesidad de una evaluación estándar en la predicción espaciotemporal.

2025-07-15T01:47:30+00:00 ― 9 minilectura

Computación y lenguaje Avanzando en las Técnicas de Evaluación de Modelos de Lenguaje

Nuevos métodos mejoran las pruebas para modelos de lenguaje, centrados en áreas clave de rendimiento.

2025-07-15T00:20:36+00:00 ― 7 minilectura

Aprendizaje automático Abordando Desafíos en el Aprendizaje de Grafos con un Nuevo Referente

Un nuevo punto de referencia para evaluar métodos de aprendizaje de grafos que abordan la heterofilia y la heterogeneidad.

2025-07-13T09:22:12+00:00 ― 7 minilectura

Computación y lenguaje Evaluando LLMs Usando Intérpretes de Código para Tareas de Ciencia de Datos

Un marco para evaluar las habilidades de los LLM en tareas relacionadas con datos usando intérpretes de código.

2025-07-13T01:20:18+00:00 ― 6 minilectura

Computación y lenguaje Analizando la comprensión de la negación por parte de CLIP

Una mirada a cómo CLIP procesa la negación en el lenguaje.

2025-07-13T01:04:30+00:00 ― 7 minilectura

Aprendizaje automático Equidad en el Aprendizaje de Grafos: Un Nuevo Referente

Estableciendo un estándar para evaluar la equidad en los métodos de aprendizaje de grafos.

2025-07-12T17:26:18+00:00 ― 9 minilectura

Inteligencia artificial Avances en el razonamiento con modelos de lenguaje

Explorando cómo los modelos de lenguaje abordan tareas de razonamiento de manera efectiva.

2025-07-12T06:46:24+00:00 ― 6 minilectura

Inteligencia artificial Evaluando Modelos de Lenguaje en Programación Científica

Un nuevo estándar evalúa modelos de lenguaje en desafíos de codificación científica en varios campos.

2025-07-10T17:22:48+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la Interpretación de Gráficos de Máquinas

Un nuevo modelo mejora cómo las máquinas leen gráficos, incluso sin etiquetas.

2025-07-10T11:11:30+00:00 ― 6 minilectura