Neue Methoden schaffen realistische Interaktionen zwischen digitalen Menschen und Objekten anhand von Textbeschreibungen.
Thomas Hanwen Zhu, Ruining Li, Tomas Jakab
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Neue Methoden schaffen realistische Interaktionen zwischen digitalen Menschen und Objekten anhand von Textbeschreibungen.
Thomas Hanwen Zhu, Ruining Li, Tomas Jakab
― 7 min Lesedauer
Ein neues System verbessert das Abrufen persönlicher Erinnerungen mit kontextuellem Verständnis.
Jiahao Nick Li, Zhuohao Jerry Zhang, Jiaju Ma
― 7 min Lesedauer
Neue Methode ermöglicht die einzigartige Bildcreation aus einem einzigen Referenzfoto.
NaHyeon Park, Kunhee Kim, Hyunjung Shim
― 6 min Lesedauer
Lerne, wie Transferlernen die Ergebnisse von maschinellem Lernen mit begrenzten Daten verbessert.
Steve Hanneke, Samory Kpotufe
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Genauigkeit der Bildgenerierung mit mehreren Objekten.
Yinwei Wu, Xianpan Zhou, Bing Ma
― 6 min Lesedauer
Eine neue Zero-Shot-Methode verbessert die Genauigkeit der Sprachumwandlung und minimiert Tonverlust.
Wangjin Zhou, Fengrun Zhang, Yiming Liu
― 5 min Lesedauer
KI nutzen, um die Effektivität von Honeypots gegen Cyberbedrohungen zu verbessern.
Hakan T. Otal, M. Abdullah Canbaz
― 7 min Lesedauer
Forschung zu arithmetischen Schaltungen verbessert die Effizienz bei der Planung von Roboterbewegungen.
Matthias Bentert, Daniel Coimbra Salomao, Alex Crane
― 6 min Lesedauer
Eine neue Methode hilft Robotern, Aufgaben effizienter zu lernen, indem sie Sprachmodelle nutzen.
Andi Peng, Belinda Z. Li, Ilia Sucholutsky
― 7 min Lesedauer
Ein neuer Ansatz verfeinert die Verbindung zwischen Bildern und Text in VLMs.
Ali Abdollah, Amirmohammad Izadi, Armin Saghafian
― 6 min Lesedauer
Lern, wie Agenten zusammenarbeiten, um effektives Energiemanagement mit verteilter Optimierung zu erreichen.
Zehui Lu, Shaoshuai Mou
― 6 min Lesedauer
MagicStyle verbindet Porträtinhalte effektiv mit künstlerischen Stilen.
Zhaoli Deng, Kaibin Zhou, Fanyi Wang
― 5 min Lesedauer
Ein neues Framework analysiert die Debattenleistungen von Kandidaten mit grossen Sprachmodellen.
Zhengliang Liu, Yiwei Li, Oleksandra Zolotarevych
― 10 min Lesedauer
Ein neues Modell kombiniert Spracherkennung und Entitätserkennung für bessere Ergebnisse.
Gil Ayache, Menachem Pirchi, Aviv Navon
― 6 min Lesedauer
EZIGen verbessert die Bildqualität durch bessere Erhaltung der Subjektidentität.
Zicheng Duan, Yuxuan Ding, Chenhui Gou
― 6 min Lesedauer
Überprüfung von wichtigen Sicherheitsfragen im Zusammenhang mit grossen Sprachmodellen in der KI.
Benji Peng, Keyu Chen, Ming Li
― 6 min Lesedauer
Eine neue Methode verbessert die KI-Leistung bei verschiedenen Bildtypen.
Chenyang Lei, Liyi Chen, Jun Cen
― 6 min Lesedauer
Neue Methode verbessert die Erkennung von Parkinson durch Sprachanalyse mit moderner Technologie.
Shakeel A. Sheikh, Yacouba Kaloga, Md Sahidullah
― 5 min Lesedauer
Eine neue Methode verbessert Bildbearbeitungen mit besserer Genauigkeit und Effizienz.
Junsung Lee, Minsoo Kang, Bohyung Han
― 7 min Lesedauer
Neue Methode beschleunigt NeRF-Training und erhält dabei die Qualität.
Weixiang Zhang, Shuzhao Xie, Shijia Ge
― 5 min Lesedauer
Ein genauer Blick auf Beliebtheitsbias in UserKNN-Systemen.
Savvina Daniil, Manel Slokom, Mirjam Cuper
― 6 min Lesedauer
HetSheaf verbessert die Datenrepräsentation in heterogenen Grafen für eine bessere Modellleistung.
Luke Braithwaite, Iulia Duta, Pietro Liò
― 6 min Lesedauer
Eine neue Methode verbessert die Tiefenwahrnehmung von Autos nachts mit HD-Scheinwerfern.
Simon de Moreau, Yasser Almehio, Andrei Bursuc
― 6 min Lesedauer
Eine neue Methode verbessert die Bildgenerierung mit einfachen Kritzeleien von Nutzern.
Seonho Lee, Jiho Choi, Seohyun Lim
― 7 min Lesedauer
Neues Framework bewertet die Genauigkeit und Quellensicherheit von Antworten, die von Sprachmodellen generiert werden.
Hanane Djeddal, Pierre Erbacher, Raouf Toukal
― 6 min Lesedauer
Forschung zeigt eine Methode, um die Bilderkennung mit weniger Beispielen zu verbessern.
Fatemeh Askari, Amirreza Fateh, Mohammad Reza Mohammadi
― 6 min Lesedauer
Eine strukturierte Methode zur Bewertung von KI-Sicherheit und -Effektivität.
Charlie Griffin, Louis Thomson, Buck Shlegeris
― 5 min Lesedauer
Ein neues Modell verbessert die Genauigkeit der Schiffsdetektion in SAR-Bildern.
Kamirul Kamirul, Odysseas Pappas, Alin Achim
― 4 min Lesedauer
Innovative Techniken verbessern das Lernen für selbstfahrende Autos.
Asen Nachkov, Danda Pani Paudel, Luc Van Gool
― 6 min Lesedauer
Diese Studie hebt die Effektivität von grundlegenden Modellen zur Verbesserung der medizinischen Bildsegmentierung hervor.
Kerem Cekmeceli, Meva Himmetoglu, Guney I. Tombak
― 5 min Lesedauer
Erforsche, wie die Kombination von Tensorfaktorisierungen und Schaltkreisdarstellungen das Datenmodellieren verbessert.
Lorenzo Loconte, Antonio Mari, Gennaro Gala
― 6 min Lesedauer
Forschung zeigt, wie optische Technologie die Leistung von maschinellem Lernen verbessern kann.
Pierre Azam, Robin Kaiser
― 7 min Lesedauer
Neue Methoden helfen zu verstehen, wie Modelle auf Datenänderungen reagieren.
Roy Friedman, Rhea Chowers
― 7 min Lesedauer
Ein Blick auf die Trainings-Effizienz in CNNs und BCNNs mit MNIST und CIFAR-10.
Eduardo Cueto-Mendoza, John D. Kelleher
― 4 min Lesedauer
Eine neue Methode zur Identifizierung von KI-generierten Fake-Bildern mit verbesserter Genauigkeit.
Inzamamul Alam, Muhammad Shahid Muneer, Simon S. Woo
― 6 min Lesedauer
Forschung verbindet Gemälde mit Musik, indem sie Emotionen interpretiert.
Tanisha Hisariya, Huan Zhang, Jinhua Liang
― 6 min Lesedauer
Eine Studie zeigt einen neuen Weg, um Emotionen mit Video, Sound und Text zu identifizieren.
Jiehui Jia, Huan Zhang, Jinhua Liang
― 5 min Lesedauer
Ein neues Modell verbessert die Wiederherstellung von Funktionsnamen in der Analyse von Binärcode.
Tristan Benoit, Yunru Wang, Moritz Dannehl
― 8 min Lesedauer
Eine Studie zeigt, dass die Leute LLMs für rechtliche Ratschläge mehr vertrauen als Anwälten.
Eike Schneiders, Tina Seabrooke, Joshua Krook
― 6 min Lesedauer
Eine Studie über die Verwendung von Sprachmodellen zur Korrektur von Fehlern in Spracherkennungssystemen.
Zhiyuan Tang, Dong Wang, Shen Huang
― 5 min Lesedauer