Últimos artículos para Referencia

Aprendizaje automático Prediciendo el rendimiento de modelos de lenguaje en pruebas

Los investigadores analizan la capacidad de predecir el rendimiento de los modelos de lenguaje a medida que aumenta la potencia de entrenamiento.

2025-09-18T05:27:54+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Examinando el Aprendizaje de Puertas Traseras en Redes Neuronales Profundas

Una mirada a los ataques y defensas de puerta trasera en modelos de aprendizaje profundo.

2025-09-14T06:00:24+00:00 ― 8 minilectura

Ingeniería del software Evaluando Modelos de Generación de Código para Eficiencia

Este documento evalúa la eficiencia del código generado por varios modelos.

2025-09-11T17:42:12+00:00 ― 8 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje con Nuevos Estándares

Este artículo presenta un estándar para evaluar modelos de lenguaje grandes con tareas complejas.

2025-09-11T04:55:54+00:00 ― 8 minilectura

Inteligencia artificial Evaluando LLMs en tareas de planificación asíncrona

Este estudio evalúa las capacidades de los modelos de lenguaje grande en escenarios de planificación compleja.

2025-09-10T23:16:12+00:00 ― 8 minilectura

Inteligencia artificial Evaluando el Comportamiento de Robots Usando Modelos de Video-Lenguaje

La investigación examina el uso de VLMs para evaluar las acciones de los robots.

2025-09-10T19:19:12+00:00 ― 8 minilectura

Aprendizaje automático Avances en Modelado y Diseño Molecular

Explorando el papel de los modelos de lenguaje grandes en la ciencia molecular.

2025-09-10T18:55:30+00:00 ― 9 minilectura

Robótica Probando robots para desafíos inesperados

Explorando métodos para mejorar el rendimiento de los robots en entornos impredecibles.

2025-09-09T02:53:54+00:00 ― 5 minilectura

Procesado de Audio y Voz Presentamos AV-SUPERB: Un Nuevo Referente para Modelos Audiovisuales

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

Recuperación de información Avances en Modelos de Recuperación de Documentos Largos

Nuevas herramientas mejoran la forma en que los sistemas recuperan información de documentos largos.

2025-09-08T20:26:48+00:00 ― 5 minilectura

Computación y lenguaje Evaluando la IA médica: un nuevo estándar para los Med-MLLMs

Este benchmark evalúa el rendimiento de los modelos de lenguaje médico en el cuidado de la salud.

2025-09-07T01:47:12+00:00 ― 10 minilectura

Computación y lenguaje Edición de Conocimiento a Nivel de Evento: Un Nuevo Enfoque

Un método para mantener actualizados los modelos de IA basados en eventos del mundo real.

2025-09-06T00:54:06+00:00 ― 7 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje Multimodal en Tareas de Redes Sociales

Nuevas pruebas de referencia MLLMs en tareas de redes sociales como desinformación y discurso de odio.

2025-09-05T16:28:30+00:00 ― 12 minilectura

Robótica Avanzando en la Generación de Código para Robots con RobotScript

RobotScript mejora la forma en que los robots llevan a cabo tareas a partir del lenguaje natural.

2025-09-05T03:58:00+00:00 ― 8 minilectura

Criptografía y seguridad Detección de Troyanos de Hardware: Nuevos Enfoques

Una nueva perspectiva para encontrar amenazas ocultas en el diseño de hardware.

2025-09-03T18:55:06+00:00 ― 6 minilectura

Inteligencia artificial Mejorando la Evaluación del Razonamiento en Modelos de Lenguaje

Nuevos métodos tienen como objetivo evaluar mejor las habilidades de razonamiento en modelos de lenguaje de IA.

2025-09-02T23:25:54+00:00 ― 8 minilectura

Ingeniería del software Presentamos DyPyBench: Una Nueva Herramienta de Benchmarking para Python

DyPyBench ofrece un conjunto diverso de proyectos para análisis dinámico en Python.

2025-09-02T10:15:54+00:00 ― 8 minilectura

Computación y lenguaje IA Transformando el Desarrollo Web a Través del Diseño Visual

La capacidad de la IA para convertir diseños en código está cambiando el desarrollo web.

2025-09-01T08:03:48+00:00 ― 10 minilectura

Ingeniería del software Evaluando Modelos de Lenguaje: El Reto de la Contaminación de Datos

Un estudio revela que hay una superposición de datos significativa que afecta las evaluaciones de modelos de lenguaje en la generación de código.

2025-09-01T02:16:12+00:00 ― 7 minilectura

Bioinformática Evaluando Modelos de Lenguaje Grandes para el Análisis de Bio-Imágenes

Evaluando el rendimiento de los LLM a través de un benchmark dedicado para el análisis de bio-imágenes.

2025-08-31T18:04:57+00:00 ― 7 minilectura

Computación y lenguaje Evaluando herramientas de procesamiento de lenguaje para mejor rendimiento

Un nuevo método para evaluar herramientas de procesamiento de lenguaje muestra promesas de mejora.

2025-08-31T11:31:24+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluación Eficiente de Detectores de Objetos Pre-entrenados

Un método para evaluar la transferibilidad de modelos preentrenados para la detección de objetos.

2025-08-29T09:37:18+00:00 ― 5 minilectura

Robótica Nuevo estándar para el aprendizaje de robots en tareas diarias

Un recurso diseñado para ayudar a los robots a aprender tareas cotidianas de manera efectiva.

2025-08-29T07:46:42+00:00 ― 8 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje Grandes en la Toma de Decisiones

Una mirada a cómo evaluar las capacidades de toma de decisiones de los modelos de lenguaje grandes.

2025-08-29T02:44:12+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el PLN para dialectos diversos

Un marco para mejorar el rendimiento de NLP en varios dialectos de idiomas.

2025-08-28T20:51:00+00:00 ― 5 minilectura

Aprendizaje automático Nuevo estándar revela las limitaciones de los modelos de lenguaje visual

Un nuevo benchmark revela las fortalezas y debilidades de los VLLMs en tareas multimodales.

2025-08-28T00:50:12+00:00 ― 7 minilectura

Física computacional Cumbre Computacional de Monte Carlo: Avanzando en Técnicas de Simulación

Los expertos se reúnen para charlar sobre simulaciones de Monte Carlo y mejoras en GPU.

2025-08-27T20:09:15+00:00 ― 8 minilectura

Ingeniería del software Desafiando modelos de generación de código con nuevos benchmarks

Nuevos estándares revelan las fortalezas y debilidades de los modelos de lenguaje de codificación.

2025-08-25T06:36:30+00:00 ― 4 minilectura

Computación y lenguaje Presentamos Meerkat-7B: Una Nueva Era en la IA Médica

Meerkat-7B establece un nuevo estándar para los modelos de lenguaje médico de código abierto.

2025-08-24T01:22:42+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en técnicas de resumido de video

Nuevos métodos mejoran la resumencia de videos usando grandes conjuntos de datos y modelos avanzados.

2025-08-22T11:11:42+00:00 ― 8 minilectura

Computación y lenguaje Mejorando la comprensión de textos largos en modelos de lenguaje

La investigación revela los desafíos que enfrentan los LLMs para entender textos largos y propone nuevos estándares.

2025-08-21T09:07:30+00:00 ― 7 minilectura

Arquitectura de hardware Unidad de Monitoreo de Rendimiento para RISC-V en Aplicaciones Espaciales

Explorando el diseño y los beneficios de un PMU para procesadores RISC-V usados en el espacio.

2025-08-21T07:56:24+00:00 ― 6 minilectura

Ingeniería del software Analizando los benchmarks de generación de código para problemas de calidad

Este estudio examina los problemas de calidad en los prompts para modelos de generación de código.

2025-08-19T17:45:24+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando la percepción visual en modelos de lenguaje

Un nuevo estándar revela brechas en la comprensión visual de los modelos de lenguaje grandes.

2025-08-18T12:23:42+00:00 ― 8 minilectura

Computación y lenguaje Evaluando la Precisión de Grandes Modelos de Lenguaje y Visión

Un nuevo estándar mejora cómo evaluamos los LVLMs y su precisión.

2025-08-17T06:46:12+00:00 ― 6 minilectura

Lógica en Informática CHC-COMP 2023: Evaluando solucionadores de cláusulas de Horn restringidas

La competencia CHC mostró avances en los solucionadores y sus aplicaciones en la verificación de programas.

2025-08-17T00:50:42+00:00 ― 7 minilectura

Computación y lenguaje Desafíos al interpretar respuestas indirectas

Este artículo explora cómo mejorar la comprensión de las respuestas indirectas.

2025-08-16T21:56:54+00:00 ― 6 minilectura

Computación y lenguaje Avanzando el Aprendizaje de Pocas Muestras para Tareas en Polaco

Un estudio que evalúa métodos de aprendizaje de pocos disparos para la clasificación del idioma polaco.

2025-08-15T22:38:36+00:00 ― 5 minilectura

Computación y lenguaje Presentando PatentGPT: LLMs especializados en Propiedad Intelectual

Los modelos de PatentGPT están diseñados para enfrentar desafíos únicos en Propiedad Intelectual.

2025-08-15T17:38:24+00:00 ― 5 minilectura

Ingeniería del software Evaluando Herramientas de Seguridad de Contratos Inteligentes

Un estudio sobre la efectividad de las herramientas SAST para contratos inteligentes.

2025-08-15T17:30:30+00:00 ― 9 minilectura