Un enfoque novedoso mejora las comparaciones de algoritmos de aprendizaje por refuerzo en diferentes entornos.
― 9 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un enfoque novedoso mejora las comparaciones de algoritmos de aprendizaje por refuerzo en diferentes entornos.
― 9 minilectura
Un nuevo estándar busca mejorar el entrenamiento de robots en entornos hogareños realistas.
― 8 minilectura
Un nuevo marco de referencia mejora la eficiencia para evaluar modelos de lenguaje.
― 7 minilectura
Un nuevo enfoque para mejorar las evaluaciones de tareas de codificación para modelos de lenguaje.
― 7 minilectura
La investigación examina la efectividad de los benchmarks actuales en tareas de visualización.
― 6 minilectura
Un nuevo marco evalúa la dificultad en tareas de codificación para modelos de lenguaje grandes.
― 10 minilectura
El estudio evalúa las habilidades de razonamiento de los modelos de lenguaje grandes con preguntas complejas.
― 6 minilectura
Un nuevo marco para evaluar modelos de visión-lenguaje de manera efectiva.
― 7 minilectura
Presentamos una herramienta para evaluar métodos de detección de anomalías no supervisados en el aprendizaje federado.
― 8 minilectura
Evaluando modelos de IA por su capacidad para seguir procedimientos de laboratorio.
― 8 minilectura
Una revisión de las mejoras recientes en las herramientas de conteo de modelos y sus aplicaciones prácticas.
― 7 minilectura
Un nuevo estándar mejora la evaluación de los sistemas de reconocimiento de emociones en el habla a través de distintos idiomas y emociones.
― 7 minilectura
Este artículo examina la efectividad de los modelos 3D basados en imágenes en la estimación de pose.
― 10 minilectura
Nuevos estándares prueban el razonamiento causal de la IA usando solo imágenes.
― 9 minilectura
Un nuevo enfoque para evaluar LLMs con conjuntos de evaluación diversos.
― 7 minilectura
Un nuevo estándar evalúa a los agentes de modelos de lenguaje para manejar el análisis de datos científicos.
― 9 minilectura
Un análisis de los LLMs y sus diferencias con la adquisición del lenguaje humano.
― 9 minilectura
Estudiando cómo los cilindros en movimiento crean ondas de sonido en fluidos para aplicaciones prácticas.
― 6 minilectura
Un nuevo estándar evalúa cómo los LLM aprenden a través de interacciones.
― 6 minilectura
O-HuBERT mejora el reconocimiento de voz al separar la información del contenido y la información expresiva.
― 7 minilectura
Te presentamos PermitQA, un referente para evaluar sistemas RAG en energía eólica.
― 8 minilectura
Un nuevo método mejora el reconocimiento de voz para Hindi usando técnicas de pseudoetiquetado.
― 5 minilectura
Un benchmark multidominio evalúa las habilidades de generación de código de los LLM en varios campos.
― 8 minilectura
Un nuevo método prueba cómo la IA interpreta gráficos engañosos.
― 7 minilectura
Un nuevo proyecto de referencia tiene como objetivo evaluar las capacidades de resolución de problemas en Java.
― 6 minilectura
Un nuevo enfoque simplifica la seguridad y la utilidad en el entrenamiento de modelos de lenguaje.
― 11 minilectura
Mejorando cómo las máquinas ayudan a los usuarios a través de mejor interacción y respuestas.
― 6 minilectura
Este estudio examina la efectividad de los LLMs en musicología y su fiabilidad.
― 7 minilectura
Una herramienta completa para evaluar sistemas de computación de alto rendimiento.
― 8 minilectura
Un sistema para grabar y reproducir acciones en aplicaciones WebAssembly.
― 8 minilectura
Explorando técnicas de aprendizaje automático para un particionado eficiente en el diseño VLSI.
― 7 minilectura
VisScience prueba grandes modelos en razonamiento científico usando texto e imágenes.
― 5 minilectura
OpenACE ofrece un punto de referencia justo para evaluar códecs de audio en distintas condiciones.
― 6 minilectura
Esfuerzos para mejorar la tecnología de voz para el idioma Faetar, que tiene pocos recursos.
― 6 minilectura
Este documento evalúa la capacidad de los VLMs para razonar sobre tamaños y distancias.
― 7 minilectura
Investigando cómo los agentes de IA reproducen resultados científicos a través de un nuevo estándar.
― 7 minilectura
TDC-2 mejora la investigación en el desarrollo de medicamentos gracias a un mejor acceso a datos y modelos multimodales.
― 6 minilectura
LightSABRE mejora el rendimiento de circuitos cuánticos con mejoras en velocidad y calidad.
― 5 minilectura
Investigadores de física de altas energías están optimizando software para diversos recursos de computación.
― 11 minilectura
Este enfoque simplifica la elección de conjuntos de datos de preentrenamiento efectivos para modelos de lenguaje.
― 10 minilectura