Ein neuer Ansatz verbessert die Überlebensanalyse in der Krebsforschung, indem visuelle und sprachliche Daten genutzt werden.
Pei Liu, Luping Ji, Jiaxiang Gou
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neuer Ansatz verbessert die Überlebensanalyse in der Krebsforschung, indem visuelle und sprachliche Daten genutzt werden.
Pei Liu, Luping Ji, Jiaxiang Gou
― 7 min Lesedauer
LawDNet verbessert die Lippenbewegungen für realistische digitale Menschen.
Deng Junli, Luo Yihao, Yang Xueting
― 5 min Lesedauer
FKAN verbessert die Bild- und 3D-Formdarstellung mit lernbaren Aktivierungsfunktionen.
Ali Mehrabian, Parsa Mojarad Adi, Moein Heidari
― 5 min Lesedauer
Eine neue Methode verbessert das Verständnis von KI für menschliche Aktionen durch spezielle Daten.
Dewen Zhang, Wangpeng An, Hayaru Shouno
― 7 min Lesedauer
Ein System zur Echtzeit-Bilderzeugung verbessert den Betrieb von Robotern in der Landwirtschaft aus der Ferne.
Neeloy Chakraborty, Yixiao Fang, Andre Schreiber
― 6 min Lesedauer
Fortschritte bei der Nutzung von Ultraschall zur Erkennung von Handgesten auf kleinen Geräten.
Keshav Bimbraw, Haichong K. Zhang, Bashima Islam
― 5 min Lesedauer
Wissenschaftler verbessern die Effizienz der Hochwasserüberwachung mit fortschrittlicher Satellitenbildanalyse.
Karthick Panner Selvam, Raul Ramos-Pollan, Freddie Kalaitzis
― 5 min Lesedauer
Eine neue Methode verbessert die Erkennung von Strassenobjekten, indem sie das Klassenungleichgewicht angeht.
Teerapong Panboonyuen
― 6 min Lesedauer
Neue Methoden verbessern die Videoqualität bei schwachem Licht erheblich mit innovativen Techniken.
Jinhong He, Minglong Xue, Wenhai Wang
― 6 min Lesedauer
Eine neue Methode verbessert die Genauigkeit beim Verfolgen von Teilnehmern während Online-Meetings.
Oriel Perl, Ido Leshem, Uria Franko
― 5 min Lesedauer
Neue Methoden verbessern die Gesichtserkennung in schwierigen Umgebungen und Bedingungen.
Anirudh Nanduri, Rama Chellappa
― 6 min Lesedauer
Eine neue Methode kombiniert mehrere Merkmale für eine verbesserte Videoanomalieerkennung.
Darshan Venkatrayappa
― 6 min Lesedauer
Dieses Verfahren schätzt Orientierungen ohne beschriftete Daten mithilfe von Deep Learning.
Shiqi Li, Jihua Zhu, Yifan Xie
― 5 min Lesedauer
Dieses Papier bewertet die Fähigkeit von VLMs, über Grössen und Entfernungen nachzudenken.
Yuan-Hong Liao, Rafid Mahmood, Sanja Fidler
― 6 min Lesedauer
MesonGS vereinfacht die Verwaltung von 3D-Gaussian-Dateien, indem es die Kompressionseffizienz verbessert.
Shuzhao Xie, Weixiang Zhang, Chen Tang
― 5 min Lesedauer
DARDA verbessert die Fähigkeit von Deep-Learning-Modellen, sich an sich ändernde Datenbedingungen anzupassen.
Shahriar Rifat, Jonathan Ashdown, Francesco Restuccia
― 6 min Lesedauer
Übersicht über Techniken zur Erkennung und Klassifizierung menschlicher Aktionen.
Jungpil Shin, Najmul Hassan, Abu Saleh Musa Miah1
― 5 min Lesedauer
SparX verbessert die Bildbearbeitung, indem es das menschliche Sehsystem nachahmt.
Meng Lou, Yunxiang Fu, Yizhou Yu
― 6 min Lesedauer
Forschung zeigt, dass LLMs das Potenzial haben, Objekte in ereignisbasierten Visuals zu erkennen.
Zongyou Yu, Qiang Qu, Xiaoming Chen
― 6 min Lesedauer
Die Integration von Bewegungsinformationen verbessert die Genauigkeit der Objekterkennung in Bildern.
Cagri Gungor, Adriana Kovashka
― 6 min Lesedauer
ScaleFlow++ verbessert die 3D-Bewegungsschätzung mit monokularen Kameras für verschiedene Anwendungen.
Han Ling, Yinghui Sun, Quansen Sun
― 6 min Lesedauer
NSSR-DIL wandelt niedrigqualitative Bilder effizient um, ohne grosse Datensätze zu brauchen.
Sree Rama Vamsidhar S, Rama Krishna Gorthi
― 5 min Lesedauer
Ein maschinelles Lernverfahren, das Bewegung nutzt, um visuelle Daten effektiv zu lernen.
Simone Marullo, Matteo Tiezzi, Marco Gori
― 8 min Lesedauer
Diese Studie überwacht die Waldveränderungen in der Elfenbeinküste mit Hilfe von fortschrittlichen Satellitendaten.
Gabriele Sartor, Matteo Salis, Stefano Pinardi
― 6 min Lesedauer
Neue Methoden zur Verbesserung der Bildgenerierung durch flexible latente Raumdarstellung.
Xin Li, Anand Sarwate
― 6 min Lesedauer
Text in lebendige digitale Bewegungen verwandeln mit innovativen Modellen.
S. Rohollah Hosseyni, Ali Ahmad Rahmani, S. Jamal Seyedmohammadi
― 4 min Lesedauer
Neue Methode verbessert die Genauigkeit der Polypenerkennung bei Koloskopie-Verfahren.
Mobina Mansoori, Sajjad Shahabodini, Jamshid Abouei
― 6 min Lesedauer
Ein neuer Ansatz verbessert die Bild- und Formenrepräsentation mit einer lernbaren Aktivierungsfunktion.
Moein Heidari, Reza Rezaeian, Reza Azad
― 6 min Lesedauer
Die Automatisierung der Tumorsegmentierung in PET/CT-Bildern verbessert die Genauigkeit und beschleunigt die Diagnose.
Maximilian Rokuss, Balint Kovacs, Yannick Kirchhoff
― 6 min Lesedauer
Forschung zeigt Lücken in Bildklassifizierungsmodellen, wenn Objekte teilweise versteckt sind.
Kaleb Kassaw, Francesco Luzi, Leslie M. Collins
― 6 min Lesedauer
Dieses Framework ermöglicht ein schnelles Lernen neuer Objektkategorien mit minimalen Daten.
Yanan Jian, Fuxun Yu, Qi Zhang
― 6 min Lesedauer
Erforschen, wie Fahrzeuge in Echtzeit Informationen austauschen, um Sicherheit und Effizienz zu verbessern.
Jinlong Li, Xinyu Liu, Baolu Li
― 6 min Lesedauer
Playground v3 verwandelt Textvorgaben in hochwertige Bilder mit Präzision.
Bingchen Liu, Ehsan Akhgari, Alexander Visheratin
― 7 min Lesedauer
Ein neues System verbessert die Geschwindigkeit und Genauigkeit der Videobeschriftung.
Alexandru Bobe, Jan C. van Gemert
― 6 min Lesedauer
KAT verbessert Deep Learning, indem es fortschrittliche KANs anstelle von MLPs verwendet.
Xingyi Yang, Xinchao Wang
― 6 min Lesedauer
SoccerNet 2024 fördert Innovationen im Videoverständnis für Fussball.
Anthony Cioppa, Silvio Giancola, Vladimir Somers
― 5 min Lesedauer
Ein neues Framework verbessert das Verständnis menschlicher Handlungen durch Skelettdaten.
Lehong Wu, Lilang Lin, Jiahang Zhang
― 6 min Lesedauer
CCT-R verbessert die medizinische Bildsegmentierung mithilfe von semi-supervisiertem Lernen und räumlicher Registrierung.
Qianying Liu, Paul Henderson, Xiao Gu
― 5 min Lesedauer
Neue Methode verbessert die Bildanalyse im Gesundheitswesen mithilfe realistischer kontrafaktischer Bilder.
Mélanie Roschewitz, Fabio De Sousa Ribeiro, Tian Xia
― 6 min Lesedauer
FOLK verbessert das selbstüberwachte Lernen durch adaptive Frequenzmaskierung und ein Lehrer-Schüler-Design.
Amin Karimi Monsefi, Mengxi Zhou, Nastaran Karimi Monsefi
― 5 min Lesedauer