Llama-AVSR kombiniert Audio- und visuelle Eingaben für eine verbesserte Spracherkennungsgenauigkeit.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Llama-AVSR kombiniert Audio- und visuelle Eingaben für eine verbesserte Spracherkennungsgenauigkeit.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 6 min Lesedauer
Eine Studie über Sprachassistenten für ältere Menschen, die in ihren Alltag durchgeführt wurde.
Amama Mahmood, Chien-Ming Huang
― 5 min Lesedauer
In diesem Artikel geht's um die Integration von visuellen und akustischen Daten in UUVs für die Fischzucht.
David Botta, Luca Ebner, Andrej Studer
― 5 min Lesedauer
Nutzung von grossen Sprachmodellen zur Verbesserung der Analyse von Nutzerfeedback für mobile Apps.
Tanmai Kumar Ghosh, Atharva Pargaonkar, Nasir U. Eisty
― 10 min Lesedauer
Dieses System hilft Forschern dabei, die UX-Bewertung für KI-Interaktionen zu verbessern.
Qingxiao Zheng, Minrui Chen, Pranav Sharma
― 8 min Lesedauer
Ein neuer Roboter geht die Herausforderungen der Bestäubung beim indoor Erdbeeranbau an.
Chuizheng Kong, Alex Qiu, Idris Wibowo
― 6 min Lesedauer
Ein neues Framework verbessert die Dialogqualität in Bildungs-Chatbots für effektives Lernen.
Haoyu Huang, Tong Niu, Rui Yang
― 7 min Lesedauer
Studie zeigt koordinierte Desinformationskampagnen während der bevorstehenden Präsidentschaftswahl.
Marco Minici, Luca Luceri, Federico Cinus
― 6 min Lesedauer
PASS nutzt probabilistische Berechnungen, um effizient schwierige Herausforderungen in verschiedenen Bereichen zu lösen.
Saavan Patel, Philip Canoza, Adhiraj Datar
― 6 min Lesedauer
Silq vereinfacht die Quantenprogrammierung mit benutzerfreundlichen Funktionen.
Viktorija Bezganovic, Marco Lewis, Sadegh Soudjani
― 6 min Lesedauer
ZeroSCD erkennt Änderungen in Bildern, ohne dass vorheriges Training oder beschriftete Daten erforderlich sind.
Shyam Sundar Kannan, Byung-Cheol Min
― 6 min Lesedauer
Robot-Hunde könnten die Überwachung und Datensammlung auf Baustellen revolutionieren.
Miguel Arturo Vega Torres, Fabian Pfitzner
― 6 min Lesedauer
Neue Methoden mit Sprachmodellen verbessern die Datenverarbeitung in Erdbeobachtungssystemen.
Hong-fu Chou, Vu Nguyen Ha, Prabhu Thiruvasagam
― 7 min Lesedauer
Diese Studie untersucht, wie wandgrosse Displays die Zusammenarbeit mit gemischter Präsenz verbessern können.
Adrien Coppens, Lou Schwartz, Valérie Maquil
― 6 min Lesedauer
Erfahre, wie mehrere RGB-D-Sensoren das Verfolgen von menschlichen Bewegungen verbessern.
Adrien Coppens, Valérie Maquil
― 6 min Lesedauer
Ein neues Framework verbessert die Erstellung von Prompts für grosse Sprachmodelle.
Mingqi Li, Karan Aggarwal, Yong Xie
― 6 min Lesedauer
Analyse von Linien-basierten Dial-a-Ride und MinTurn-Problemen für bessere Transporteffizienz.
Antonio Lauerbach, Kendra Reiter, Marie Schmidt
― 5 min Lesedauer
Die Kombination aus humanoiden Robotern und Drohnen verbessert Such- und Rettungsaktionen in schwierigen Umgebungen.
Abdulaziz Shamsah, Jesse Jiang, Ziwon Yoon
― 6 min Lesedauer
Eine einfache Methode, um versteckte Kameras mit günstigen Geräten zu entdecken.
Xiang Zhang, Jie Zhang, Zehua Ma
― 5 min Lesedauer
CuRIOS-ED will unser Bild vom schnelllebigen Universum mit CubeSats verbessern.
Hannah Gulick, Jessica R. Lu, Aryan Sood
― 6 min Lesedauer
CAMAL kombiniert maschinelles Lernen und traditionelle Methoden, um die Leistung des LSM-Baums zu optimieren.
Weiping Yu, Siqiang Luo, Zihao Yu
― 8 min Lesedauer
Untersuchung von Sicherheitsfortschritten in UAV-unterstützten mobilen Edge-Computing-Systemen.
Hongjiang Lei, Mingxu Yang, Ki-Hong Park
― 6 min Lesedauer
Eine neue Datenbank und Technik verbessern das Tracking von Drohnen ohne manuelle Beschriftung.
Yu-Hsi Chen
― 4 min Lesedauer
Ein neuer Ansatz verbessert die Erkennung von gefälschter Audio mit vortrainierten Modellen.
Zhiyong Wang, Ruibo Fu, Zhengqi Wen
― 6 min Lesedauer
Die Effektivität von LLMs für Bedrohungsanalysen bewerten.
Sanchana Srikanth, Mohammad Hasanuzzaman, Farah Tasnur Meem
― 10 min Lesedauer
EMERS hilft Forschern, den Energieverbrauch in Empfehlungssystemen zu verfolgen und fördert das Umweltbewusstsein.
Lukas Wegmeth, Tobias Vente, Alan Said
― 6 min Lesedauer
VIVRA hilft dabei, Gedanken in coole 3D-Visualisierungen umzuwandeln, um besser brainstormen zu können.
Yunhao Xing, Jerrick Ban, Timothy D. Hubbard
― 7 min Lesedauer
Neue Methode verbessert die Sprachgenerierung in Qualität und Effizienz.
Xin Qi, Ruibo Fu, Zhengqi Wen
― 4 min Lesedauer
Neue Methode verbessert die Genauigkeit von Tiefenkarten mit mehreren Blickwinkeln.
Jungeon Kim, Soongjin Kim, Jaesik Park
― 6 min Lesedauer
Eine Studie, die die LLMs Mistral und LLaMa auf verschiedenen GPUs vergleicht.
Yannis Bendi-Ouis, Dan Dutarte, Xavier Hinaut
― 7 min Lesedauer
Wissenschaftler fangen schnelle molekulare Veränderungen in Echtzeit mit Attosekunden-Röntgentechniken ein.
Henry N. Chapman, Chufeng Li, Saša Bajt
― 7 min Lesedauer
Neue Methoden zeigen, wie Licht in dichten atomaren Wolken interagiert.
Antoine Glicenstein, Apoorva Apoorva, Daniel Benedicto Orenes
― 6 min Lesedauer
Ein neues Framework verbessert die Reaktionsfähigkeit in Systemen, die mit unterschiedlichen Aufgabenprioritäten umgehen.
Jiapeng Guan, Ran Wei, Dean You
― 6 min Lesedauer
Lern über Deep-Learning-Techniken, um Gesichter in Videoaufnahmen automatisch zu verwischen.
Roman Plaud, Jose-Luis Lisani
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Erkennung von Unregelmässigkeiten in industriellen Daten mithilfe von Edge Computing.
Alessio Mascolini, Sebastiano Gaiardelli, Francesco Ponzio
― 5 min Lesedauer
Das Roman-Weltraumteleskop hat das Ziel, die direkte Abbildung von Exoplaneten zu verbessern.
Alexis Lau, Élodie Choquet, Lisa Altinier
― 6 min Lesedauer
Ein neuer Controller verbessert die Timing-Genauigkeit in sicherheitskritischen Systemen.
Zhe Jiang, Shuai Zhao, Ran Wei
― 7 min Lesedauer
Entdeck, wie Viren Gene mischen und neue Stämme erschaffen.
Alexey Markin, Catherine A. Macken, Amy L. Baker
― 5 min Lesedauer
Die Untersuchung der Natur des Bewusstseins in Maschinen und deren Auswirkungen.
Ryan Williams
― 9 min Lesedauer
Kombination von Lernen und Kontrolle für mehr Sicherheit bei laufenden Robotern.
Jeonghwan Kim, Yunhai Han, Harish Ravichandar
― 7 min Lesedauer