Examinando qué tan bien los modelos detectan comentarios tóxicos en diferentes dialectos de idioma.
Fahim Faisal, Md Mushfiqur Rahman, Antonios Anastasopoulos
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Examinando qué tan bien los modelos detectan comentarios tóxicos en diferentes dialectos de idioma.
Fahim Faisal, Md Mushfiqur Rahman, Antonios Anastasopoulos
― 7 minilectura
MTFusion combina imágenes y texto para crear modelos 3D avanzados.
Yu Liu, Ruowei Wang, Jiaqi Li
― 7 minilectura
Una mirada a las admisiones holísticas y su impacto en los futuros doctores.
Andrew D. Bergemann, Stephen R. Smith, Joel A. Daboub
― 8 minilectura
Un nuevo método para crear materiales realistas mejora la flexibilidad para artistas y diseñadores.
Chenliang Zhou, Zheyuan Hu, Alejandro Sztrajman
― 7 minilectura
Un nuevo enfoque aborda los sesgos en los modelos de imagen-texto de manera efectiva.
Haoyu Zhang, Yangyang Guo, Mohan Kankanhalli
― 8 minilectura
Evaluando la efectividad de los modelos de lenguaje en tareas de programación con nuevos estándares.
Nidhish Shah, Zulkuf Genc, Dogu Araci
― 6 minilectura
Entender cómo los Grafos de Conocimiento pueden reducir la información falsa en las respuestas de IA.
Ernests Lavrinovics, Russa Biswas, Johannes Bjerva
― 7 minilectura
Una nueva forma de evaluar los modelos de toma de decisiones de IA usando mapas de atribución.
Lars Nieradzik, Henrike Stephani, Janis Keuper
― 8 minilectura
Examinando cómo los humanos y la IA pueden colaborar de manera efectiva.
Filip Ilievski, Barbara Hammer, Frank van Harmelen
― 11 minilectura
Una visión general de cómo los LLM mejoran los procesos de evaluación mientras abordan desafíos clave.
Jiawei Gu, Xuhui Jiang, Zhichao Shi
― 8 minilectura
Este estudio examina qué tan bien los LLMs evalúan la creatividad en el Test de Usos Alternativos.
Abdullah Al Rabeyah, Fabrício Góes, Marco Volpe
― 6 minilectura
STAR automatiza la construcción de modelos de IA para resultados más inteligentes y rápidos.
Armin W. Thomas, Rom Parnichkun, Alexander Amini
― 8 minilectura
ER 2Score mejora la evaluación de calidad de los informes de radiología automatizados.
Yunyi Liu, Yingshu Li, Zhanyu Wang
― 6 minilectura
Transformando textos en videos realistas al incorporar leyes físicas.
Qiyao Xue, Xiangyu Yin, Boyuan Yang
― 7 minilectura
¿Son los modelos de lenguaje grandes evaluadores fiables? Explorando la consistencia en sus evaluaciones.
Noah Lee, Jiwoo Hong, James Thorne
― 8 minilectura
ChemTEB ayuda a mejorar el procesamiento de textos químicos evaluando modelos especializados.
Ali Shiraee Kasmaee, Mohammad Khodadad, Mohammad Arshi Saloot
― 9 minilectura
AgriBench evalúa herramientas de IA para apoyar decisiones de agricultura más inteligentes.
Yutong Zhou, Masahiro Ryo
― 9 minilectura
Aprende cómo SelfPrompt ayuda a evaluar la efectividad de los modelos de lenguaje.
Aihua Pei, Zehua Yang, Shunan Zhu
― 4 minilectura
Aprende cómo el sandbagging afecta las evaluaciones de IA y maneras de detectarlo.
Cameron Tice, Philipp Alexander Kreer, Nathan Helm-Burger
― 7 minilectura
Descubre cómo los investigadores simplifican los textos en Sinhala para que sean más fáciles de entender.
Surangika Ranathunga, Rumesh Sirithunga, Himashi Rathnayake
― 8 minilectura
TDD-Bench mejora la generación automática de pruebas para desarrolladores que usan métodos TDD.
Toufique Ahmed, Martin Hirzel, Rangeet Pan
― 9 minilectura
Los investigadores mejoran el reconocimiento automático de voz usando supervisión de paráfrasis para una mejor comprensión.
Amruta Parulekar, Abhishek Gupta, Sameep Chattopadhyay
― 6 minilectura
Un nuevo método mejora la precisión en los informes automatizados de radiografías de tórax.
R. Mahmood, K. C. L. Wong, D. M. Reyes
― 7 minilectura
Descubre el emocionante mundo de la IA en el juego competitivo.
Chengwei Hu, Jianhui Zheng, Yancheng He
― 9 minilectura
Una mirada a cómo las métricas de traducción automática pueden ser justas y coherentes.
Pius von Däniken, Jan Deriu, Mark Cieliebak
― 9 minilectura
Los benchmarks de IA revelan el rendimiento pero a menudo no entienden el uso en el mundo real.
Amelia Hardy, Anka Reuel, Kiana Jafari Meimandi
― 9 minilectura
Una competencia destinada a mejorar cómo las máquinas aprenden lenguas como lo hacen los niños.
Michael Y. Hu, Aaron Mueller, Candace Ross
― 9 minilectura
Investigadores desarrollan un nuevo método para mejorar la precisión de la IA de texto a imagen.
Ziyuan Qin, Dongjie Cheng, Haoyu Wang
― 10 minilectura
Un nuevo método permite que las neuronas trabajen de forma independiente, mejorando el entrenamiento de redes neuronales.
Deepak Kumar
― 9 minilectura
Explorando temas de evaluación en Inteligencia Artificial Explicable y la búsqueda de confianza.
Kristoffer Wickstrøm, Marina Marie-Claire Höhne, Anna Hedström
― 7 minilectura
Descubre el papel de DECO en hacer las tareas de ingeniería más fáciles y eficientes.
Yiwen Zhu, Mathieu Demarne, Kai Deng
― 10 minilectura
Los avances en el procesamiento de imágenes están cambiando la forma en que las computadoras entienden el contenido visual.
XuDong Wang, Xingyi Zhou, Alireza Fathi
― 7 minilectura
Un nuevo método mejora el rendimiento de los LLM en evaluaciones personalizadas con datos limitados.
Javad Seraj, Mohammad Mahdi Mohajeri, Mohammad Javad Dousti
― 7 minilectura
Explorando cómo los estudiantes manejan sus propios procesos de aprendizaje desde la secundaria hasta la educación superior.
Yixin Cheng, Rui Guan, Tongguang Li
― 8 minilectura
Descubre cómo el Control Predictivo Modelado mejora las habilidades de decisión de las máquinas.
Kehan Wen, Yutong Hu, Yao Mu
― 5 minilectura
Nuevo estándar mejora los datos en neerlandés para modelos de recuperación de información.
Nikolay Banar, Ehsan Lotfi, Walter Daelemans
― 7 minilectura
Descubre cómo los objetos clásicos se relacionan con el extraño comportamiento de las partículas cuánticas.
Giuseppe Nisticò
― 9 minilectura
El conjunto de datos MALAMUTE prueba modelos de lenguaje sobre temas educativos para una mejor comprensión.
Sagi Shaier, George Arthur Baker, Chiranthan Sridhar
― 9 minilectura
CG-Bench ayuda a las máquinas a analizar videos largos mejor con preguntas basadas en pistas.
Guo Chen, Yicheng Liu, Yifei Huang
― 7 minilectura
Un nuevo punto de referencia para probar el razonamiento de los LLM a través de diferentes contextos culturales.
Mohammad Aflah Khan, Neemesh Yadav, Sarah Masud
― 8 minilectura