Forscher haben herausgefunden, wie KI das menschliche Sehen durch Faltungsneuronale Netze nachahmt.
Yudi Xie, Weichen Huang, Esther Alter
― 7 min Lesedauer
New Science Research Articles Everyday
Forscher haben herausgefunden, wie KI das menschliche Sehen durch Faltungsneuronale Netze nachahmt.
Yudi Xie, Weichen Huang, Esther Alter
― 7 min Lesedauer
Eine neue Methode verbessert die OCR-Genauigkeit für unterrepräsentierte Sprachen.
Harshvivek Kashid, Pushpak Bhattacharyya
― 9 min Lesedauer
Entdecke, wie VehiclePaliGemma die Technologie zur Kennzeichenlesung verändert.
Nouar AlDahoul, Myles Joshua Toledo Tan, Raghava Reddy Tera
― 7 min Lesedauer
Eine neue Methode nutzt 3D-Scans für Gesichtsvorhersagen nach der Operation.
Huijun Han, Congyi Zhang, Lifeng Zhu
― 8 min Lesedauer
Entdecke, wie AURORA virtuelles Interior Design für Profis und Enthusiasten vereinfacht.
Huijun Han, Yongqing Liang, Yuanlong Zhou
― 8 min Lesedauer
Verwandle einfache Anfragen in lebendige Bildbeschreibungen mit CapAgent.
Xinran Wang, Muxi Diao, Baoteng Li
― 6 min Lesedauer
Entdecke, wie generative Modelle neue Daten mit einzigartigen Ansätzen erstellen.
Zeeshan Patel, James DeLoye, Lance Mathias
― 8 min Lesedauer
Neue Methoden verbessern die Fehlererkennung in der industriellen Bildverarbeitung.
Alejandro Garnung Menéndez
― 7 min Lesedauer
RapidNet verbessert die Geschwindigkeit und Genauigkeit der mobilen Bildverarbeitung.
Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
― 6 min Lesedauer
Die Analyse von Stimmen kann Anzeichen von Depressionen zeigen und zu einer frühen Intervention führen.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 6 min Lesedauer
Lern, wie 3D-Segmentierung Robotern hilft, Objekte in komplexen Umgebungen zu erkennen und zu kennzeichnen.
Luis Wiedmann, Luca Wiehe, David Rozenberszki
― 6 min Lesedauer
Entdecke, wie SoftVQ-VAE die Bilderstellung mit Effizienz und Qualität verbessert.
Hao Chen, Ze Wang, Xiang Li
― 6 min Lesedauer
Eine neue Methode entfernt effektiv Reflexionen aus Bildern mit fortschrittlichen Techniken.
Abdelrahman Elnenaey, Marwan Torki
― 8 min Lesedauer
SegHeD+ verbessert die Genauigkeit bei der Identifizierung von Läsionen bei Multipler Sklerose.
Berke Doga Basaran, Paul M. Matthews, Wenjia Bai
― 5 min Lesedauer
Forscher arbeiten daran, KI-Erklärungen klarer und zuverlässiger zu machen.
Miquel Miró-Nicolau, Antoni Jaume-i-Capó, Gabriel Moyà-Alcover
― 7 min Lesedauer
Lerne, wie Maschinen Videos interpretieren, von lustigen Clips bis hin zu wichtigen Anwendungen.
Katrina Drozdov, Ravid Shwartz-Ziv, Yann LeCun
― 7 min Lesedauer
HGT-Track kombiniert sichtbare und thermale Kameras für effektives Verfolgen von kleinen Objekten.
Qingyu Xu, Longguang Wang, Weidong Sheng
― 4 min Lesedauer
Das SEW-Framework revolutioniert die Bildanalyse in der Pathologie für eine bessere Krebsbehandlung.
Haoming Luo, Xiaotian Yu, Shengxuming Zhang
― 6 min Lesedauer
KI-Systeme verbessern ihr Verständnis von grafischen Benutzeroberflächen für bessere Benutzererlebnisse.
Hai-Ming Xu, Qi Chen, Lei Wang
― 8 min Lesedauer
Entdecke, wie Technologie Familienmerkmale mit hochwertiger Bilderzeugung vorhersagt.
Pin-Yen Chiu, Dai-Jie Wu, Po-Hsun Chu
― 7 min Lesedauer
Entdecke, wie In-Context-Lernen die Videokreation verändert.
Zhengcong Fei, Di Qiu, Changqian Yu
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Genauigkeit und Effizienz bei audio-visuellen Fragen und Antworten.
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 7 min Lesedauer
Entdecke, wie geteilte Daten autonomes Fahren sicherer und smarter machen.
Jingyu Zhang, Yilei Wang, Lang Qian
― 7 min Lesedauer
Ein neues Framework, um Videos und Bilder effizient zu erstellen.
Cong Wan, Xiangyang Luo, Zijian Cai
― 6 min Lesedauer
Eine neue Methode verbessert die Personenidentifikation mithilfe von Informationen aus benachbarten Bildern.
Xiao Teng, Long Lan, Dingyao Chen
― 8 min Lesedauer
Neuer Datensatz ermöglicht bessere Vergleiche von CT-Rekonstruktionsalgorithmen.
Maximilian B. Kiss, Ander Biguri, Zakhar Shumaylov
― 7 min Lesedauer
Neue Methode verbessert die Erkennung abnormaler Geweberegionen in der medizinischen Forschung.
Kaichen Xu, Qilong Wu, Yan Lu
― 5 min Lesedauer
Ein neues System hilft dabei, die Sitzgewohnheiten zu überwachen und zu verbessern für eine bessere Gesundheit.
Hang Jin, Xin He, Lingyun Wang
― 7 min Lesedauer
Eine neue Methode verbessert maschinelles Lernen ohne die Originaldaten.
Yingping Liang, Ying Fu
― 6 min Lesedauer
Ein frischer Ansatz hilft dabei, nervige Lens Flares in Bildern mit mehreren Ansichten zu entfernen.
Gopi Raju Matta, Rahul Siddartha, Rongali Simhachala Venkata Girish
― 8 min Lesedauer
Revolutioniere dein Videoerlebnis mit modernen Frame-Interpolationstechniken.
Wonyong Seo, Jihyong Oh, Munchurl Kim
― 5 min Lesedauer
Roboter lernen jetzt Aufgaben, indem sie Menschen zuschauen, was die Zusammenarbeit in verschiedenen Branchen verbessert.
Ehsan Asali, Prashant Doshi
― 10 min Lesedauer
Entdeck, wie Bildveränderungen unsere Sicht auf visuelle Inhalte beeinflussen.
Paula Daudén-Oliver, David Agost-Beltran, Emilio Sansano-Sansano
― 8 min Lesedauer
Neues Modell erstellt Schriftarten für verschiedene Sprachen und löst Designprobleme effizient.
Zhiheng Wang, Jiarui Liu
― 6 min Lesedauer
Ein neues Framework verbessert die Abstimmung von Sounds und Bildern in Videos.
Kexin Li, Zongxin Yang, Yi Yang
― 6 min Lesedauer
Neue Methoden ermöglichen es Maschinen, Emotionen in VR anhand von Gesichtsausdrücken zu lesen.
Thorben Ortmann, Qi Wang, Larissa Putzar
― 8 min Lesedauer
Forscher entwickeln eine neue Methode, um die Bewegungsverfolgung mit normaler Flussabschätzung zu verbessern.
Dehao Yuan, Levi Burner, Jiayi Wu
― 6 min Lesedauer
Neue Methoden verbessern die Bilderkennung, indem sie sich auf kleine Bereiche in grossen Bildern konzentrieren.
Max Riffi-Aslett, Christina Fell
― 10 min Lesedauer
Verpass deinen Fotos mühelos einen neuen Look mit GenLit’s innovativer Lichttechnik.
Shrisha Bharadwaj, Haiwen Feng, Victoria Abrevaya
― 6 min Lesedauer
GEM verwandelt die Video-Vorhersage und Objekt-Interaktion mit innovativer Technologie.
Mariam Hassan, Sebastian Stapf, Ahmad Rahimi
― 7 min Lesedauer