Warum Vision-Language-Modelle mit Bildern mehr kämpfen als mit Text.
Ido Cohen, Daniela Gottesman, Mor Geva
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Warum Vision-Language-Modelle mit Bildern mehr kämpfen als mit Text.
Ido Cohen, Daniela Gottesman, Mor Geva
― 8 min Lesedauer
Lern, wie Transferlernen KI verbessert, indem es Wissen über verschiedene Bereiche hinweg teilt.
Jun Wu, Jingrui He
― 8 min Lesedauer
Die Kombination aus Fundamentmodellen und erschwinglichen Sensoren verbessert die Tiefenwahrnehmung in verschiedenen Anwendungen.
Rémi Marsal, Alexandre Chapoutot, Philippe Xu
― 7 min Lesedauer
Lern, wie CONDA der KI hilft, sich anzupassen und verständlich zu bleiben, auch wenn sich die Bedingungen ändern.
Jihye Choi, Jayaram Raghuram, Yixuan Li
― 7 min Lesedauer
KI verändert Videospiele, schafft neue Erlebnisse und fesselt Spieler wie nie zuvor.
Markus Dablander
― 7 min Lesedauer
Erforschen, wie generative KI verschiedene kulturelle Identitäten in der Kunst widerspiegeln kann.
Rida Qadri, Piotr Mirowski, Aroussiak Gabriellan
― 7 min Lesedauer
Sprachmodelle müssen trainiert werden, um mit Vorurteilen und Giftigkeit in verschiedenen Sprachen umzugehen.
Vera Neplenbroek, Arianna Bisazza, Raquel Fernández
― 7 min Lesedauer
Ein neues Framework hilft Sprachmodellen, präzise Antworten zu generieren.
Seoha Song, Junhyun Lee, Hyeonmok Ko
― 7 min Lesedauer
Maschinelles Lernen nutzen, um die Stickstoffentfernung in Kläranlagen zu verbessern.
Eivind Bøhn, Sølve Eidnes, Kjell Rune Jonassen
― 6 min Lesedauer
Die Sicherheit von KI und wie sie unseren Alltag beeinflusst.
Ronald Schnitzer, Lennart Kilian, Simon Roessner
― 8 min Lesedauer
Entdecke, wie Brain Connectomics Echo State Networks verbessert, um bessere Vorhersagen zu treffen.
Bach Nguyen, Tianlong Chen, Shu Yang
― 7 min Lesedauer
Ein neues Modell bringt Computern bei, Bilder mit natürlicher Sprache zu verstehen.
Cong Wei, Yujie Zhong, Haoxian Tan
― 7 min Lesedauer
KI passt sich individuellen Vorlieben mit weniger Beispielen an und verbessert so die Interaktionen mit Nutzern.
Katarzyna Kobalczyk, Claudio Fanconi, Hao Sun
― 7 min Lesedauer
Ein Blick darauf, wie man die Leistung von Text-zu-Bild-Modellen effektiv misst.
Candace Ross, Melissa Hall, Adriana Romero Soriano
― 9 min Lesedauer
Eine neue Methode verbessert das Verständnis von KI für Ursache und Wirkung.
Eleni Sgouritsa, Virginia Aglietti, Yee Whye Teh
― 6 min Lesedauer
Forscher bringen KI bei, Objekte anhand detaillierter Beschreibungen statt Namen zu erkennen.
Ethan Baron, Idan Tankel, Peter Tu
― 7 min Lesedauer
Lerne, wie kleine Modelle von ihren grösseren Mentoren profitieren.
Gereziher Adhane, Mohammad Mahdi Dehshibi, Dennis Vetter
― 8 min Lesedauer
Ein neues Werkzeug hilft, KI-Modelle zu trainieren, damit sie sich gegen clevere Angriffe in 3D wehren können.
Tommy Nguyen, Mehmet Ergezer, Christian Green
― 7 min Lesedauer
Entdecke, wie Roboter ihren Energieverbrauch ausbalancieren, während sie ihre Umgebung kartieren.
Zidong Han, Ruibo Jin, Xiaoyang Li
― 7 min Lesedauer
Ein smartes Modell, das die Analyse medizinischer Bilder mit Gedächtnisfunktionen verbessert.
Xinyuan Shao, Yiqing Shen, Mathias Unberath
― 6 min Lesedauer
Künstliche Intelligenz verbessert die Diagnose von Handgelenkfrakturen bei Kindern und Jugendlichen.
Ammar Ahmed, Ali Shariq Imran, Mohib Ullah
― 7 min Lesedauer
KI-Technologie verwandelt, wie Sprachen sich verbinden und effektiv kommunizieren.
Vageesh Saxena, Sharid Loáiciga, Nils Rethmeier
― 7 min Lesedauer
SHAP-Werte können die Vorhersagen und Entscheidungen von KI-Modellen irreführen.
Olivier Letoffe, Xuanxiang Huang, Joao Marques-Silva
― 6 min Lesedauer
Innovative Methoden push Sprachmodelle für ressourcenarme Sprachen wie Nepali.
Sharad Duwal, Suraj Prasai, Suresh Manandhar
― 8 min Lesedauer
Grosse Sprachmodelle verbessern die Dokumentklassifikation und verringern die Abhängigkeit von Trainingsdaten.
Anna Scius-Bertrand, Michael Jungo, Lars Vögtlin
― 8 min Lesedauer
Das Verständnis menschlicher Bewegungen ist entscheidend für die Zusammenarbeit von Robotern.
Kevin Haninger, Luka Peternel
― 5 min Lesedauer
Die Revolution, wie KI Bilder und Texte versteht, für schlauere Systeme.
Yuchong Geng, Ao Tang
― 8 min Lesedauer
Forschung zeigt, dass visuelle Sprachmodelle Schwierigkeiten mit Mehrdeutigkeit in der Kommunikation haben.
Alberto Testoni, Barbara Plank, Raquel Fernández
― 8 min Lesedauer
Entdecke, wie cross-modale Abfragevorschläge die Effizienz von Bildersuchen verbessern.
Giacomo Pacini, Fabio Carrara, Nicola Messina
― 6 min Lesedauer
Während Maschinen Musik produzieren, müssen wir die menschliche Kreativität durch effektive Erkennungsmethoden schützen.
Yupei Li, Qiyang Sun, Hanqian Li
― 9 min Lesedauer
Über die Balance zwischen KI-Innovation und Sicherheit durch effektive Governance sprechen.
Edward Kembery
― 8 min Lesedauer
Forscher arbeiten an der Objekt-Halluzination in KI, um Genauigkeit und Zuverlässigkeit zu verbessern.
Le Yang, Ziwei Zheng, Boxu Chen
― 6 min Lesedauer
Untersuchen, wie Roboter lernen, mit sich verändernden Objekten zu interagieren.
Zixuan Chen, Jiaxin Li, Liming Tan
― 9 min Lesedauer
Durchbrüche im maschinellen Lernen für personalisierte Medizin und bessere Gesundheits Ergebnisse erkunden.
Gideon Vos, Liza van Eijk, Zoltan Sarnyai
― 10 min Lesedauer
Eine neue App hilft Nutzern, rhetorische Figuren in deutschen Texten zu erkennen.
Ramona Kühn, Jelena Mitrović, Michael Granitzer
― 10 min Lesedauer
Ein frischer Ansatz, um die Leistung grosser Sprachmodelle zu verbessern.
Pengxiang Li, Lu Yin, Shiwei Liu
― 5 min Lesedauer
Lern, wie Wissensbearbeitung die Genauigkeit bei komplexen Fragen verbessert.
Yifan Lu, Yigeng Zhou, Jing Li
― 6 min Lesedauer
Entdecke, wie FedSSI das maschinelle Lernen verbessert, ohne vergangenes Wissen zu vergessen.
Yichen Li, Yuying Wang, Tianzhe Xiao
― 6 min Lesedauer
Ein neues Tool macht klar, wie graph-neurale Netze Vorhersagen treffen.
Whitney Sloneker, Shalin Patel, Michael Wang
― 7 min Lesedauer
Eine neue Methode zur Verbesserung von Entscheidungsbäumen im maschinellen Lernen.
Adam Żychowski, Andrew Perrault, Jacek Mańdziuk
― 6 min Lesedauer