Nuevos métodos buscan mejorar las capacidades de razonamiento en los modelos de lenguaje.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevos métodos buscan mejorar las capacidades de razonamiento en los modelos de lenguaje.
― 7 minilectura
N nuevas métricas iluminan las limitaciones de los modelos de lenguaje para representar la realidad.
― 8 minilectura
Un nuevo sistema para evaluar modelos de lenguaje usando flujos de datos del mundo real.
― 6 minilectura
Presentamos IrokoBench para mejorar la evaluación de LLM en lenguas africanas.
― 8 minilectura
El desafío ULS23 tiene como objetivo mejorar la segmentación de tumores en escáneres CT para una mejor atención del cáncer.
― 6 minilectura
Un enfoque nuevo mejora la detección de imágenes falsas creadas por la IA.
― 7 minilectura
Un nuevo estándar busca evaluar MLLMs en la comprensión de videos sobre múltiples temas.
― 8 minilectura
Este estudio presenta un nuevo método para identificar imágenes clave de entrenamiento en visuales generados por IA.
― 9 minilectura
Explorando la importancia de los métodos de desaprendizaje en el aprendizaje automático moderno.
― 6 minilectura
Examinando los problemas clave en MARL offline y proponiendo soluciones estandarizadas.
― 7 minilectura
Aprende sobre CGP, su función, ventajas, aplicaciones y desafíos en la programación.
― 5 minilectura
Un nuevo conjunto de datos mejora la coherencia en las secuencias de imagen-texto para una creación de contenido efectiva.
― 6 minilectura
SciEx revela las fortalezas y desafíos de los LLMs en la evaluación científica.
― 8 minilectura
SEACrowd busca mejorar la representación de IA para los idiomas y culturas del sudeste asiático.
― 8 minilectura
Un estudio evalúa modelos de lenguaje en cómo manejan múltiples tareas al mismo tiempo.
― 9 minilectura
Una nueva evaluación pone a prueba las habilidades de los LLMs con formatos de datos estructurados.
― 7 minilectura
VCEval ofrece una forma automatizada de evaluar la efectividad de los cursos en línea.
― 6 minilectura
Un nuevo estándar busca la composicionalidad en la comprensión de video y los modelos de lenguaje.
― 7 minilectura
Un nuevo método mejora las pruebas para modelos de lenguaje usando datos reales de usuarios.
― 6 minilectura
La familia Nemotron-4 340B ofrece modelos potentes para diversas aplicaciones y generación de datos sintéticos.
― 8 minilectura
Evaluando cómo los modelos de lenguaje manejan las señales culturales en tareas reales.
― 9 minilectura
VideoVista ofrece una evaluación completa para modelos de preguntas y respuestas de video.
― 7 minilectura
Este artículo explora métodos para mejorar la fiabilidad de los artefactos de investigación en informática.
― 9 minilectura
Los modelos GLM-4 muestran capacidades mejoradas en comprensión y generación de lenguaje.
― 10 minilectura
Un estudio sobre el uso de LLMs para juzgar otros LLMs y sus implicaciones.
― 8 minilectura
Un estudio sobre cómo los modelos de lenguaje generan razones persuasivas para la evaluación de argumentos.
― 7 minilectura
Dos nuevos modelos buscan mejorar el acceso a la tecnología para los hablantes de gallego.
― 6 minilectura
Examinando las dificultades de traducir lenguaje metafórico en la traducción automática.
― 7 minilectura
DF40 ofrece un enfoque integral para mejorar los métodos de detección de deepfakes.
― 7 minilectura
Este estudio evalúa la honestidad de los LLM en tres áreas clave.
― 6 minilectura
Descubre cómo las empresas mejoran sus sistemas de preguntas y respuestas para dar un mejor soporte a los usuarios.
― 5 minilectura
Un estudio sobre cómo la IA comprende los algoritmos y sus implicaciones.
― 8 minilectura
Una nueva métrica mejora la evaluación de modelos de clasificación de texto en diferentes dominios.
― 8 minilectura
La contaminación de datos afecta mucho la evaluación de los modelos de lenguaje grandes.
― 6 minilectura
Un nuevo método para evaluar LLMs se alinea con los valores humanos.
― 8 minilectura
Una nueva herramienta para evaluar sesgos en grandes modelos de visión-lenguaje.
― 7 minilectura
Un estudio evalúa cómo las máquinas crean poesía variada y creativa en comparación con los humanos.
― 7 minilectura
Un nuevo método mejora cómo evaluamos las contranarrativas al discurso de odio.
― 7 minilectura
InternLM-Law mejora las respuestas a diversas preguntas legales chinas con un entrenamiento avanzado.
― 8 minilectura
Explorando cómo los perfiles de usuario mejoran la personalización en los modelos de lenguaje.
― 7 minilectura