GazeGen erlaubt es Nutzern, Bilder mit Augenbewegungen zu bearbeiten.
He-Yen Hsieh, Ziyun Li, Sai Qian Zhang
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
GazeGen erlaubt es Nutzern, Bilder mit Augenbewegungen zu bearbeiten.
He-Yen Hsieh, Ziyun Li, Sai Qian Zhang
― 6 min Lesedauer
Die Kombination von medizinischen Bildern und genetischen Daten verbessert die Vorhersagen zur Überlebensrate bei Lungenkrebs.
Aiman Farooq, Deepak Mishra, Santanu Chaudhury
― 4 min Lesedauer
Forschung hebt Sicherheitsprobleme in verschiedenen Schichten von Vision-Sprachmodellen hervor.
Saketh Bachu, Erfan Shayegani, Trishna Chakraborty
― 6 min Lesedauer
Event-Kameras verbessern die Geschwindigkeit und Effizienz in der visuellen Verarbeitungstechnologie.
Piotr Wzorek, Kamil Jeziorek, Tomasz Kryjak
― 6 min Lesedauer
Ein neues Modell verbessert die Beurteilung der Gesundheit von Kuhzitzen mithilfe digitaler Bilder.
Minghao Wang
― 6 min Lesedauer
Erforschung von Gesichts- und Gestenerkennung, um die Interaktionen mit Technologie zu verbessern.
Kaushik Ranade, Tanmay Khule, Riddhi More
― 8 min Lesedauer
Ein Blick auf neue Methoden zur Identifizierung von Personen in verschiedenen Kamerasetups.
Siddharth Seth, Akash Sonth, Anirban Chakraborty
― 6 min Lesedauer
Ein neuer Ansatz für realistische 3D-Avatare mit lockerer Kleidung.
Siddharth Seth, Rishabh Dabral, Diogo Luvizon
― 7 min Lesedauer
Einsatz von One-Shot GANs zur Verbesserung der Erkennung seltener Krankheiten in der medizinischen Bildgebung.
Kunal Deo, Deval Mehta, Kshitij Jadhav
― 6 min Lesedauer
WiFlexFormer nutzt WLAN-Signale, um menschliche Aktivitäten ohne aufdringliche Methoden zu erkennen.
Julian Strohmayer, Matthias Wödlinger, Martin Kampel
― 5 min Lesedauer
Lern, wie du Bild-Text-Modelle verbessern und häufige Fehler reduzieren kannst.
Maya Varma, Jean-Benoit Delbrouck, Zhihong Chen
― 7 min Lesedauer
Neues Tool H-POPE verbessert die Genauigkeit von Vision-Sprachmodellen.
Nhi Pham, Michael Schott
― 5 min Lesedauer
Die 3D-Ising-Modell erkunden und wie kritische Exponenten Phasenübergänge charakterisieren.
Timothy A. Burt
― 5 min Lesedauer
Neue Methoden verbessern die Videountertitelung mit weniger Beispielen.
Ping Li, Tao Wang, Xinkui Zhao
― 5 min Lesedauer
Ein Blick darauf, wie verschiedene Darstellungen in KI das Verständnis verbessern.
Julien Colin, Lore Goetschalckx, Thomas Fel
― 6 min Lesedauer
Lern, wie moderne Tools die Fotobearbeitung einfacher und schneller machen.
Ashutosh Srivastava, Tarun Ram Menta, Abhinav Java
― 4 min Lesedauer
Forscher kombinieren Audio- und visuelle Hinweise, um Lügen genauer zu erkennen.
Abdelrahman Abdelwahab, Akshaj Vishnubhatla, Ayaan Vaswani
― 6 min Lesedauer
Die Auswirkungen der Gesichtsbilderstellung aus Embeddings erkunden.
Hatef Otroshi Shahreza, Anjith George, Sébastien Marcel
― 6 min Lesedauer
ToF-Bilderstellung nutzt Lichtpulse, um 3D-Bilder für verschiedene Anwendungen zu erstellen.
Ruiming Guo, Ayush Bhandari
― 7 min Lesedauer
Forscher entwickeln innovative Techniken, um Zellteilung und -tod in Videos zu studieren.
Cangxiong Chen, Vinay P. Namboodiri, Julia E. Sero
― 6 min Lesedauer
FedRISE verbessert das föderierte Lernen, indem es schlechte Datenaktualisierungen filtert, um das Modelltraining zu optimieren.
Joseph Geo Benjamin, Mothilal Asokan, Mohammad Yaqub
― 7 min Lesedauer
Ein neues Framework erkennt, wann multimodale Modelle ungeeignete Trainingsdaten verwenden.
Dingjie Song, Sicheng Lai, Shunian Chen
― 5 min Lesedauer
Harmformer verbessert die Bilderkennung, indem es Drehungen und Verschiebungen richtig verarbeitet.
Tomáš Karella, Adam Harmanec, Jan Kotera
― 5 min Lesedauer
Diese Studie nutzt Deep Learning und Transferlernen für die HER2-Bewertung bei Brustkrebs.
Rawan S. Abdulsadig, Bryan M. Williams, Nikolay Burlutskiy
― 6 min Lesedauer
Forscher entwickeln Methoden, um Computern beizubringen, Rechnungen zu verarbeiten und dabei die Privatsphäre zu schützen.
Marlon Tobaben, Mohamed Ali Souibgui, Rubèn Tito
― 6 min Lesedauer
Dieses Papier untersucht die Rolle von CCTV beim Verständnis der Dynamik zwischen Einzelhandelsmitarbeitern und Kunden.
Claus D. Hansen, Thuy Hai Le, David Campos
― 6 min Lesedauer
Dieser Artikel untersucht, wie SHAP die Aktivitätserkennung durch die Analyse wichtiger Merkmale verbessert.
Felix Tempel, Espen Alexander F. Ihlen, Lars Adde
― 7 min Lesedauer
Ein neuer Ansatz, um Maschinen auf kleinen Geräten mit weniger Komplexität zu trainieren.
Yequan Zhao, Hai Li, Ian Young
― 7 min Lesedauer
Untersuchen, wie die Vereinfachung von Modellen die Entscheidungsfindung und Leistung beeinflusst.
Elmira Mousa Rezabeyk, Salar Beigzad, Yasin Hamzavi
― 7 min Lesedauer
Forscher haben stMMC entwickelt, um die räumliche Analyse von Genexpressionsdaten zu verbessern.
Bingjun Li, Mostafa Karami, Masum Shah Junayed
― 7 min Lesedauer
Eine neue Methode vereinfacht, wie Maschinen komplizierte Dokumente lesen.
Jaeyoo Park, Jin Young Choi, Jeonghyung Park
― 6 min Lesedauer
Dieses System verbessert die DR-Erkennung und wahrt dabei die Privatsphäre der Patienten.
Gajan Mohan Raj, Michael G. Morley, Mohammad Eslami
― 6 min Lesedauer
Eine Studie zur Verbesserung der Navigationssicherheit in der Arktis durch bessere Datentools.
Corwin Grant Jeon MacMillan, K. Andrea Scott, Zhao Pan
― 6 min Lesedauer
RLT verkürzt die Trainingszeit für KI in der Videoverarbeitung, indem es überflüssige Tokens entfernt.
Rohan Choudhury, Guanglei Zhu, Sihan Liu
― 6 min Lesedauer
Ein Überblick über die Stärken und Schwächen der heutigen Vision-Sprach-Modelle.
Siting Li, Pang Wei Koh, Simon Shaolei Du
― 6 min Lesedauer
Neue Methode verbessert die Farbübertragung von Videos für besseren Kontrolle und Geschwindigkeit.
Xintao Jiang, Yaosen Chen, Siqin Zhang
― 7 min Lesedauer
Ein Blick darauf, wie CNNs Bilder und ihre Merkmale interpretieren.
David Chapman, Parniyan Farvardin
― 6 min Lesedauer
Neue Methoden vereinfachen Röntgenberichte vom Thorax für eine bessere Patienten-Diagnose.
Daniel C. Castro, Aurelia Bustos, Shruthi Bannur
― 7 min Lesedauer
Diese Studie hebt die wichtige Rolle genauer Bildunterschriften beim Training von Modellen hervor.
Sheng Cheng, Maitreya Patel, Yezhou Yang
― 6 min Lesedauer
Eine neue Methode verbessert die Analyse von Brustultraschallbildern mithilfe von Deep-Learning-Techniken.
Lipismita Panigrahi, Prianka Rani Saha, Jurdana Masuma Iqrah
― 6 min Lesedauer