Este artículo examina métodos para evaluar la variabilidad en los criterios de evaluación de modelos de lenguaje.
― 9 minilectura
Ciencia de vanguardia explicada de forma sencilla
Este artículo examina métodos para evaluar la variabilidad en los criterios de evaluación de modelos de lenguaje.
― 9 minilectura
Un estudio sobre el uso de LLMs para juzgar otros LLMs y sus implicaciones.
― 8 minilectura
La contaminación de datos afecta el rendimiento de los modelos de lenguaje y los métodos de evaluación.
― 6 minilectura
¿Siguen siendo relevantes las tareas de NLI para probar modelos de lenguaje grandes?
― 7 minilectura