DEnsity ofrece una forma nueva de evaluar sistemas de diálogo según los patrones de conversación humana.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
DEnsity ofrece una forma nueva de evaluar sistemas de diálogo según los patrones de conversación humana.
― 8 minilectura
Este artículo habla sobre los beneficios de usar retroalimentación diversa de usuarios para hacer mejores recomendaciones.
― 7 minilectura
ArgU crea argumentos estructurados basados en información factual para discusiones efectivas.
― 6 minilectura
Este estudio evalúa la capacidad de GPT-3 para resumir la literatura médica de manera efectiva.
― 6 minilectura
Un método matemático para evaluar la belleza de las actuaciones musicales.
― 6 minilectura
Este estudio evalúa la atención periodontal en los Centros de Especialidad Dental de Brasil.
― 6 minilectura
Este artículo examina la efectividad de las explicaciones generadas por IA para los usuarios.
― 9 minilectura
Una competencia para mejorar la creación automática de sonido Foley para multimedia.
― 6 minilectura
C-Eval evalúa las habilidades de razonamiento y conocimiento de los LLMs en chino.
― 6 minilectura
Un nuevo conjunto de datos mejora cómo las máquinas leen y responden a los documentos.
― 6 minilectura
Un análisis de las fortalezas y debilidades del conjunto de datos RACE para la comprensión de lectura.
― 9 minilectura
Una mirada crítica a los benchmarks de modelos de lenguaje y sus implicaciones para el rendimiento humano.
― 6 minilectura
Este artículo presenta un nuevo método para manejar las puntuaciones faltantes en las evaluaciones de sistemas de NLP.
― 7 minilectura
Aprende cómo se está entrenando a los chatbots para responder con empatía.
― 6 minilectura
mLongT5 gestiona de forma eficiente textos más largos en varios idiomas.
― 5 minilectura
Un nuevo método mejora la forma en que evaluamos las imágenes generadas por IA a partir de descripciones de texto.
― 7 minilectura
Un estudio sobre cómo crear instrucciones estructuradas a través de la descomposición jerárquica de tareas.
― 8 minilectura
IKDSumm resume de manera efectiva los tweets durante desastres usando conocimientos específicos del desastre.
― 6 minilectura
Una nueva taxonomía para mejorar el rendimiento de LLM en tareas complejas.
― 7 minilectura
Un nuevo método para evaluar la calidad de los argumentos teniendo en cuenta el contexto.
― 6 minilectura
El estudio evalúa métodos para analizar modelos de lenguaje en su comprensión del idioma.
― 7 minilectura
Seahorse ofrece una gran colección de resúmenes multilingües con calificaciones de humanos.
― 7 minilectura
Avances en la investigación sobre la traducción de referencias culturales usando sistemas de traducción automática.
― 10 minilectura
Un nuevo método para integrar varios tipos de datos médicos para un mejor análisis.
― 10 minilectura
Evaluar el rendimiento de los modelos de lenguaje en diferentes demografías humanas es clave para un uso efectivo.
― 7 minilectura
Un estudio revela limitaciones en los modelos de lenguaje aumentados por recuperación para la generación de texto.
― 6 minilectura
Presentando un marco estructurado para un razonamiento efectivo sobre textos largos.
― 5 minilectura
El conjunto de datos MMSMR tiene como objetivo mejorar la evaluación de conversaciones de chatbots con respuestas humanas diversas.
― 6 minilectura
Este estudio compara las normas sociales entre las culturas china y americana a través del análisis de datos.
― 7 minilectura
Un nuevo enfoque para resumir tablas basado en las preguntas del usuario para obtener mejores insights.
― 7 minilectura
Presentamos un sistema que explica de manera clara la evaluación de texto generado por máquinas.
― 6 minilectura
Un nuevo conjunto de datos mejora la habilidad de los modelos de lenguaje para entender instrucciones en varios idiomas.
― 6 minilectura
Un nuevo método aborda los desafíos que enfrentan los modelos de lenguaje para ofrecer respuestas precisas.
― 7 minilectura
Un método para evaluar clasificadores que se abstienen al estimar sus predicciones faltantes.
― 9 minilectura
Las preguntas de aclaración son clave para una buena comunicación en sistemas de conversación.
― 7 minilectura
Un nuevo método mejora la resumición de videos para contenido en lengua de señas.
― 6 minilectura
Mejorando las capacidades del modelo para vincular varios tipos de datos de manera efectiva.
― 6 minilectura
Una herramienta para evaluar las capacidades de razonamiento en varios pasos de los modelos de lenguaje grandes.
― 7 minilectura
Combinando métodos basados en referencias y métodos sin referencias para mejorar la evaluación de resúmenes.
― 7 minilectura
Un estudio muestra que los LLMs ofrecen traducciones más naturales, especialmente para frases idiomáticas.
― 6 minilectura