Video-XL verarbeitet lange Videos effizient und verbessert Genauigkeit und Leistung.
Yan Shu, Peitian Zhang, Zheng Liu
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Video-XL verarbeitet lange Videos effizient und verbessert Genauigkeit und Leistung.
Yan Shu, Peitian Zhang, Zheng Liu
― 6 min Lesedauer
Ein detaillierter Blick auf die CXL-Speicherleistung und Optimierungstechniken.
Jinshu Liu, Hamid Hadian, Hanchen Xu
― 5 min Lesedauer
EVA kombiniert Audio- und visuelle Signale für eine bessere Spracherkennungsgenauigkeit.
Yihan Wu, Yifan Peng, Yichen Lu
― 5 min Lesedauer
Dieser Artikel stellt ein neues Framework vor, um Techniken zur Inferenzzeit für Sprachmodelle zu verbessern.
Jon Saad-Falcon, Adrian Gamarra Lafuente, Shlok Natarajan
― 5 min Lesedauer
Untersuchung von Sicherheitsfortschritten in UAV-unterstützten mobilen Edge-Computing-Systemen.
Hongjiang Lei, Mingxu Yang, Ki-Hong Park
― 6 min Lesedauer
Eine neue Methode verbessert die Flash Attention-Leistung für spärliche Aufmerksamkeitsmasken.
Agniv Sharma, Jonas Geiping
― 5 min Lesedauer
Diese Studie verbessert die Schlüssel-Infos-Extraktion mit einem neuen Modell für unstrukturierte Dokumente.
Furkan Pala, Mehmet Yasin Akpınar, Onur Deniz
― 9 min Lesedauer
Diese Studie analysiert, wie verschiedene Prozessoren in KI-Anwendungen abschneiden.
Rakshith Jayanth, Neelesh Gupta, Viktor Prasanna
― 5 min Lesedauer
Neue Methoden verbessern die Genauigkeit der Videozusammenfassung und senken gleichzeitig die Rechenkosten.
Ashish Prasad, Pranav Jeevan, Amit Sethi
― 6 min Lesedauer
Erläuterung der Wirksamkeit und Fragen rund um rekurrente neuronale Netzwerke bei der Verarbeitung von sequenziellen Daten.
Yuling Jiao, Yang Wang, Bokai Yan
― 7 min Lesedauer
Ein Blick auf dynamische Quantisierungsverfahren zur Verbesserung der LLM-Leistung.
Yifan Tan, Haoze Wang, Chao Yan
― 5 min Lesedauer
HEN verbessert die Gedächtnisabfrage in neuronalen Netzen, indem es die Mustertrennung verbessert.
Satyananda Kashyap, Niharika S. D'Souza, Luyao Shi
― 6 min Lesedauer
Das EuroLLM-Projekt hat das Ziel, vielfältige Sprachmodelle für eine bessere Kommunikation in Europa zu entwickeln.
Pedro Henrique Martins, Patrick Fernandes, João Alves
― 5 min Lesedauer
Dieser Ansatz verbessert die Effizienz und Genauigkeit bei der Analyse von Daten von mehreren Geräten.
Marco Palena, Tania Cerquitelli, Carla Fabiana Chiasserini
― 7 min Lesedauer
Ein neuer Ansatz verbessert den Prozess, unvollständige 3D-Formen auszufüllen.
Mengya Liu, Ajad Chhatkuli, Janis Postels
― 7 min Lesedauer
Ein neues Verfahren verbessert die LiDAR-Ortungserkennung für Roboter und selbstfahrende Autos.
Saimunur Rahman, Peyman Moghadam
― 5 min Lesedauer
Innovative Methoden zur Verbesserung der Bildgenauigkeit und -klarheit durch Quaternionen-Tensor-Techniken.
Alaeddine Zahir, Ahmed Ratnani, Khalide Jbilou
― 5 min Lesedauer
Neue verteilte Methoden verbessern das Zieltracking und senken gleichzeitig die Energiekosten.
Xingchi Liu, Lyudmila Mihaylova, Jemin George
― 6 min Lesedauer
Eine Methode für Roboter, um mit unbekannten Objekten durch Berührung und Daten zu interagieren.
Jinhoo Kim, Yifan Zhu, Aaron Dollar
― 6 min Lesedauer
Die Kombination von Features verbessert die Genauigkeit der Unterwasser-Schallklassifikation.
Amirmohammad Mohammadi, Iren'e Masabarakiza, Ethan Barnes
― 6 min Lesedauer
Eine neue Methode für schnellere Auswertung von String-Abfragen mit MSO-Logik.
Pierre Bourhis, Florent Capelli, Stefan Mengel
― 5 min Lesedauer
Ein neuer Ansatz, um Daten mit Ausreissern effizient zu bearbeiten.
Lakshmi Jayalal, Gokularam Muthukrishnan, Sheetal Kalyani
― 5 min Lesedauer
Lern, wie du die Effizienz von Sprachmodellen mit langem Kontext verbessern kannst.
Amey Agrawal, Junda Chen, Íñigo Goiri
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Ausführung von Datenbankabfragen mit dynamischen Kostenanpassungen.
Nikita Vasilenko, Alexander Demin, Denis Ponomaryov
― 6 min Lesedauer
Eine Methode, um zu zeigen, was tiefe neuronale Netze lernen und wie das mit bestehendem Wissen übereinstimmt.
Mert Keser, Gesina Schwalbe, Niki Amini-Naieni
― 6 min Lesedauer
Neue Methode verbessert die Erkennung von Text aus Bildern, was bei handschriftlichen und gedruckten Formaten hilft.
Raphael Baena, Syrine Kalleli, Mathieu Aubry
― 6 min Lesedauer
Ein neues Framework verbessert die Ereigniserkennung mit Ereigniskameras.
Jiazhou Zhou, Kanghao Chen, Lei Zhang
― 6 min Lesedauer
Ein neues System verbessert die Kommunikation und Sensoreffizienz von Fahrzeugen mithilfe von Fluidantennen.
Yiping Zuo, Jiajia Guo, Weicong Chen
― 5 min Lesedauer
Eine neue Methode verbessert die Genauigkeit bei der Beantwortung von Fragen aus Tabellen, indem sie zwei Systeme kombiniert.
Siyue Zhang, Anh Tuan Luu, Chen Zhao
― 8 min Lesedauer
Innovative Methoden verbessern das Verständnis der Umgebung für selbstfahrende Fahrzeuge.
Helin Cao, Sven Behnke
― 6 min Lesedauer
Der ECHO-Rahmen verbessert die Genauigkeit der Klangklassifizierung mit strukturierten Labels und einem zweistufigen Lernprozess.
Pranav Gupta, Raunak Sharma, Rashmi Kumari
― 5 min Lesedauer
Das ORGaNICs-Modell verbessert die neuronale Stabilität durch divisive Normalisierung.
Shivang Rawat, David J. Heeger, Stefano Martiniani
― 4 min Lesedauer
Eine neue Methode, um Allgemeinwissen und aufgabenspezifische Anpassung in Modellen auszubalancieren.
Ge Wu, Xin Zhang, Zheng Li
― 7 min Lesedauer
M3CoL verbessert die Fähigkeit von KI, aus verschiedenen Datentypen zu lernen.
Raja Kumar, Raghav Singhal, Pranamya Kulkarni
― 7 min Lesedauer
Ein neuer Ansatz kombiniert Quantencomputing mit maschinellem Lernen zur Bildklassifizierung.
Jishnu Mahmud, Shaikh Anowarul Fattah
― 5 min Lesedauer
Untersuchung lokaler Updates für bessere Kommunikation in adaptiven Optimierungsmethoden.
Ziheng Cheng, Margalit Glasgow
― 7 min Lesedauer
Lern, wie das Zusammenlegen von KI-Modellen die Verarbeitungsgeschwindigkeit verbessern und die Komplexität reduzieren kann.
Stefan Hackmann
― 6 min Lesedauer
Audio Moment Retrieval ermöglicht es, bestimmte Momente in langen Aufnahmen genau zu finden.
Hokuto Munakata, Taichi Nishimura, Shota Nakada
― 5 min Lesedauer
Neue Methoden verbessern die Effizienz und Genauigkeit in SSM-basierten Vision-Modellen.
Zheng Zhan, Zhenglun Kong, Yifan Gong
― 6 min Lesedauer
Cottention bietet eine speichereffiziente Alternative zu traditionellen Aufmerksamkeitsmethoden im maschinellen Lernen.
Gabriel Mongaras, Trevor Dohm, Eric C. Larson
― 6 min Lesedauer