Últimos artículos para Modelos de Lenguaje

Computación y lenguaje Mejorando los Agentes LLM con Guía Nivel por Nivel

Un nuevo marco mejora cómo los agentes LLM aprenden a través de una guía de procesos detallada.

2025-07-28T09:20:48+00:00 ― 9 minilectura

Computación y lenguaje Optimizando Prompts para Agentes de Modelos de Lenguaje

Presentamos RePrompt para mejorar el rendimiento del modelo de lenguaje a través de mensajes optimizados.

2025-07-28T08:41:18+00:00 ― 7 minilectura

Computación y lenguaje RUPBench: Evaluando la Robustez en Modelos de Lenguaje

Un nuevo estándar evalúa cómo los modelos de lenguaje manejan los cambios de texto.

2025-07-28T07:06:30+00:00 ― 7 minilectura

Computación y lenguaje El impacto de las personas usuarias en las respuestas de IA

Los rasgos de los usuarios influyen en las respuestas de los modelos de lenguaje y en su seguridad.

2025-07-27T23:36:12+00:00 ― 8 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje Grande Aumentados con Recuperación

Un conjunto de herramientas para evaluar el rendimiento de modelos aumentados por recuperación en dominios específicos.

2025-07-27T18:28:06+00:00 ― 12 minilectura

Aprendizaje automático Detectando Cambios de Fase en Modelos de Lenguaje

Este estudio revela cómo los modelos de lenguaje cambian de comportamiento durante el entrenamiento.

2025-07-27T13:18:06+00:00 ― 8 minilectura

Computación y lenguaje Mejorando las habilidades de planificación en modelos de lenguaje

Este artículo examina formas de mejorar las habilidades de planificación en modelos de lenguaje grandes.

2025-07-27T08:35:36+00:00 ― 9 minilectura

Computación y lenguaje DetectBench: Un Nuevo Estándar para la Detección de Evidencias en Modelos de Lenguaje

DetectBench evalúa LLMs en su habilidad para detectar evidencia oculta en tareas de razonamiento.

2025-07-27T05:02:18+00:00 ― 6 minilectura

Inteligencia artificial Activación de Neuronas y Razonamiento Aritmético en LLMs

Examinando cómo la activación de neuronas mejora el razonamiento aritmético en modelos de lenguaje grandes.

2025-07-27T00:17:54+00:00 ― 11 minilectura

Computación y lenguaje Avanzando en la Generación de Poesía en Checo

Un nuevo modelo genera poesía checa con mejor rima y ritmo.

2025-07-26T22:43:06+00:00 ― 7 minilectura

Computación y lenguaje Evaluando el razonamiento en modelos de lenguaje

Un nuevo estándar evalúa las habilidades de razonamiento en modelos de lenguaje.

2025-07-26T22:11:30+00:00 ― 10 minilectura

Computación y lenguaje Racionalizaciones en el Ranking de Argumentos por Modelos de Lenguaje

Un estudio sobre cómo los modelos de lenguaje generan razones persuasivas para la evaluación de argumentos.

2025-07-26T20:52:30+00:00 ― 7 minilectura

Computación y lenguaje Evaluando la Honestidad en Modelos de Lenguaje Grandes

Este estudio evalúa la honestidad de los LLM en tres áreas clave.

2025-07-26T14:33:18+00:00 ― 6 minilectura

Computación y lenguaje Los Desafíos de la Colaboración Entre Modelos de Lenguaje

Este artículo explora cómo los adversarios impactan el trabajo en equipo entre los modelos de lenguaje.

2025-07-26T11:00:00+00:00 ― 14 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje Multilingües en Idiomas Indic

Un estudio completo sobre el rendimiento de los modelos de lenguaje en 10 idiomas indios.

2025-07-25T17:37:12+00:00 ― 8 minilectura

Aprendizaje automático Avanzando en técnicas de reparación de código para lenguajes menos comunes

Un nuevo método mejora la reparación de código para lenguajes de programación poco utilizados.

2025-07-25T15:07:06+00:00 ― 8 minilectura

Aprendizaje automático La atención se hunde en los modelos de lenguaje

Explorando cómo los sinks de atención afectan el rendimiento de los modelos de lenguaje y presentando una técnica de calibración.

2025-07-25T11:02:12+00:00 ― 7 minilectura

Computación y lenguaje RankAdaptor: Una Nueva Frontera en la Compresión de Modelos

RankAdaptor optimiza el ajuste fino para modelos de IA podados, mejorando el rendimiento de manera eficiente.

2025-07-25T10:30:36+00:00 ― 9 minilectura

Computación y lenguaje Abordando el plagio en modelos de lenguaje grandes

Un estudio sobre PlagBench y su papel en la detección de plagio en los resultados de LLM.

2025-07-25T09:43:12+00:00 ― 5 minilectura

Computación y lenguaje Evaluando el razonamiento lógico de múltiples pasos en los modelos de lenguaje

Nuevo conjunto de datos evalúa la capacidad de los LLM para tareas complejas de razonamiento lógico.

2025-07-25T01:57:06+00:00 ― 9 minilectura

Computación y lenguaje Examinando la transferencia de lenguaje en tareas de razonamiento

Esta investigación examina cómo las habilidades de razonamiento se transfieren entre idiomas en los modelos de lenguaje.

2025-07-24T21:20:36+00:00 ― 9 minilectura

Aprendizaje automático El papel de la autocorrección en los modelos de lenguaje de IA

Este artículo habla de cómo los modelos de IA aprenden de los errores a través de la autocorrección.

2025-07-24T21:04:16+00:00 ― 7 minilectura

Computación y lenguaje Evaluando la comprensión de los Modelos de Lenguaje Grande sobre las Direcciones Cardinales

Este estudio evalúa qué tan bien los LLMs razonan sobre las direcciones cardinales.

2025-07-24T19:53:42+00:00 ― 6 minilectura

Computación y lenguaje Evaluando LLMs en la Toma de Decisiones Secuenciales a Través de UNO Arena

Este estudio evalúa qué tan bien manejan los LLMs la toma de decisiones en un entorno de juego.

2025-07-24T18:34:42+00:00 ― 9 minilectura

Computación y lenguaje Examinando el rendimiento del modelo de lenguaje entre grupos de usuarios

Un estudio revela cómo las características del usuario afectan las respuestas y la precisión de los LLM.

2025-07-24T12:47:06+00:00 ― 9 minilectura

Computación y lenguaje CharED: Un Nuevo Método para Mejorar Modelos de Lenguaje

CharED combina modelos de lenguaje para mejorar el rendimiento sin vocabularios compartidos.

2025-07-24T05:48:24+00:00 ― 5 minilectura

Computación y lenguaje Avances en Sistemas RAG: Un Nuevo Marco de Evaluación

RAGBench presenta un conjunto de datos completo para evaluar sistemas de Generación Aumentada de Recuperación.

2025-07-24T05:24:42+00:00 ― 8 minilectura

Computación y lenguaje Desafíos de imparcialidad en grandes modelos de lenguaje

Explorando problemas de equidad en los modelos de lenguaje de IA y sus implicaciones.

2025-07-24T05:13:00+00:00 ― 10 minilectura

Computación y lenguaje Nueva herramienta de moderación para modelos de lenguaje

Presentamos una herramienta para mejorar la seguridad en las interacciones con modelos de lenguaje.

2025-07-24T00:08:42+00:00 ― 7 minilectura

Computación y lenguaje Abordando Errores Silenciosos en Herramientas de Modelos de Lenguaje

Este artículo explora la detección de errores en las herramientas utilizadas por los modelos de lenguaje.

2025-07-23T09:39:42+00:00 ― 7 minilectura

Computación y lenguaje Examinando Plantillas Sintácticas en Modelos de Lenguaje

Este artículo analiza estructuras repetitivas en textos generados por modelos de lenguaje.

2025-07-23T01:29:54+00:00 ― 9 minilectura

Computación y lenguaje Evaluación del seguimiento de instrucciones secuenciales en LLMs

Un nuevo punto de referencia evalúa qué tan bien los modelos de lenguaje siguen múltiples instrucciones en secuencia.

2025-07-22T21:32:54+00:00 ― 5 minilectura

Computación y lenguaje Probando Grandes Modelos de Lenguaje con MalAlgoQA

El conjunto de datos MalAlgoQA evalúa el razonamiento de los Modelos de Lenguaje Grande en escenarios contrafactuales.

2025-07-22T07:35:30+00:00 ― 7 minilectura

Inteligencia artificial MathCAMPS: Un nuevo enfoque para evaluar modelos de lenguaje

MathCAMPS ofrece una forma nueva de evaluar el razonamiento matemático en modelos de lenguaje.

2025-07-22T06:56:00+00:00 ― 11 minilectura

Computación y lenguaje Mejorando la Representación Numérica en Modelos de Lenguaje

Este trabajo se centra en una mejor representación de números usando incrustaciones de dígitos para mejorar las predicciones.

2025-07-22T06:48:06+00:00 ― 9 minilectura

Aprendizaje automático Evaluando Modelos de Lenguaje Grandes en Banditos Enfrentados

Explorando la efectividad de los LLMs en la toma de decisiones a través de escenarios de Dueling Bandits.

2025-07-21T23:41:30+00:00 ― 10 minilectura

Computación y lenguaje Evaluando Modelos de Lenguaje para la Investigación Científica

Un nuevo estándar para evaluar modelos de lenguaje grandes en pruebas de hipótesis.

2025-07-21T19:52:24+00:00 ― 8 minilectura

Inteligencia artificial Presentando CRAB: Un Nuevo Estándar para Modelos de Lenguaje

CRAB mejora las pruebas para modelos de lenguaje en entornos del mundo real.

2025-07-21T18:41:18+00:00 ― 8 minilectura

Aprendizaje automático Avanzando en el ajuste fino en el dispositivo para modelos de lenguaje

Ajustando modelos de lenguaje grandes directamente en smartphones mientras protegemos los datos del usuario.

2025-07-21T08:40:54+00:00 ― 7 minilectura

Inteligencia artificial Descifrando la Interpretabilidad Mecánica en Modelos de Transformadores

Una visión general de la interpretabilidad mecanicista en modelos de lenguaje basados en transformadores.

2025-07-21T02:05:54+00:00 ― 9 minilectura