TeXBLEU ofrece una forma confiable de evaluar expresiones de LaTeX a partir de matemáticas habladas.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
TeXBLEU ofrece una forma confiable de evaluar expresiones de LaTeX a partir de matemáticas habladas.
― 6 minilectura
Un marco para mejorar el rendimiento de la IA en tareas visuales imitando los juicios humanos.
― 7 minilectura
Un enfoque novedoso para evaluar la calidad en la generación de imágenes MRI del cerebro.
― 7 minilectura
Explora el auge y el impacto de los Modelos de Fundación en la inteligencia artificial.
― 6 minilectura
Un nuevo modelo mejora la precisión en la predicción de proteínas que se unen al ADN en plantas.
― 8 minilectura
Usando LLMs para generar características claras de textos científicos para mejores predicciones.
― 8 minilectura
Un nuevo sistema de índices busca mejorar la gestión de trastornos de deglución en personas mayores.
― 7 minilectura
Usar modelos de lenguaje más débiles puede mejorar la alineación de la IA de manera eficiente.
― 7 minilectura
Mejorar las evaluaciones de robots puede llevar a una comprensión más profunda de sus capacidades.
― 9 minilectura
Un nuevo conjunto de datos busca mejorar los sistemas de QA para el Corán y los Ahadith.
― 10 minilectura
Este estudio examina el sesgo de género en las evaluaciones de profesores generadas por modelos de IA.
― 12 minilectura
Los robots autoconcientes pueden adaptar sus movimientos para interacciones más seguras.
― 7 minilectura
Un nuevo método mejora la generación de datos de textura para modelos de aprendizaje automático.
― 8 minilectura
Muchos sobrevivientes de cáncer infantil enfrentan pérdida de audición debido al tratamiento.
― 6 minilectura
THaMES ofrece un marco para reducir las alucinaciones en modelos de lenguaje.
― 7 minilectura
Un método para evaluar las evaluaciones de los agentes de IA en cuanto a seguridad y fiabilidad.
― 9 minilectura
Un nuevo estándar mejora la evaluación de los sistemas de detección de paráfrasis.
― 6 minilectura
La IA puede ayudar a crear materiales de estudio efectivos para exámenes de medicina.
― 7 minilectura
Aprende a crear gráficos de conocimiento efectivos para aplicaciones industriales.
― 7 minilectura
Nuevo marco y conjunto de datos mejoran la detección de la excitación en estudios de sueño.
― 7 minilectura
Un nuevo marco evalúa el conocimiento médico en modelos de lenguaje grandes.
― 6 minilectura
Este documento habla sobre la equidad al elegir candidatos para instituciones en medio de evaluaciones sesgadas.
― 9 minilectura
Forester simplifica el aprendizaje automático para los usuarios de R con un paquete fácil de usar.
― 8 minilectura
Nuevos métodos mejoran el realismo de los reflejos en los espejos en imágenes generadas por computadora.
― 6 minilectura
Un estudio sobre cómo los agentes de IA siguen las reglas definidas por los usuarios usando el dataset ACS.
― 10 minilectura
Este estudio evalúa qué tan bien los modelos de lenguaje ayudan a los programadores principiantes con los comentarios de código.
― 5 minilectura
Evaluando el papel de los modelos de lenguaje en los juicios de relevancia para la recuperación de información.
― 7 minilectura
Una nueva métrica que mejora la evaluación de la consistencia factual en resúmenes automáticos.
― 6 minilectura
Un nuevo enfoque mejora los resúmenes de sesiones de salud mental a través de un motor de planificación.
― 9 minilectura
RAGProbe automatiza la evaluación de sistemas RAG, mejorando su rendimiento y fiabilidad.
― 7 minilectura
Esta investigación presenta métodos automáticos para evaluar la pulverización precisa en la agricultura.
― 8 minilectura
Mejorando las evaluaciones a través de la Teoría de Respuesta al Ítem para un mejor aprendizaje de idiomas.
― 9 minilectura
Un nuevo estándar evalúa qué tan bien los modelos de IA imitan el lenguaje humano.
― 6 minilectura
Un nuevo método mejora la precisión al responder preguntas de tablas al combinar dos sistemas.
― 9 minilectura
Un nuevo método para generar distractores interesantes en evaluaciones educativas.
― 6 minilectura
Un nuevo método busca mejorar el texto alternativo para los íconos de aplicaciones móviles para ayudar a los usuarios con discapacidades visuales.
― 6 minilectura
DREAMS simplifica el aprendizaje profundo para datos de EEG, promoviendo la transparencia y prácticas éticas.
― 8 minilectura
Una mirada a cómo evaluar la confiabilidad de las explicaciones de IA a través de la sensibilidad adversarial.
― 9 minilectura
Modelos recientes mejoran la capacidad de la IA para generar y entender varios tipos de medios.
― 5 minilectura
ARLBench simplifica la sintonización de hiperparámetros para el aprendizaje reforzado con herramientas de evaluación eficientes.
― 9 minilectura