Neuste Artikel für Künstliche Intelligenz

Rechnen und Sprache Herausforderungen bei der Sprechererkennung für Sprachmodelle

Speech-LLMs zeigen Potenzial, haben aber Schwierigkeiten mit der Sprecheridentifikation in Gesprächen.

Jun 17, 2025 ― 5 min Lesedauer

Rechnen und Sprache LongLLaVA: Eine neue Ära in der Bildverarbeitung

LongLLaVA verbessert das Verständnis von mehreren Bildern für verschiedene Anwendungen.

Jun 17, 2025 ― 5 min Lesedauer

Künstliche Intelligenz Verbesserung grosser Sprachmodelle mit modularen Bausteinen

Die Effizienz und Anpassungsfähigkeit von Sprachmodellen durch modulare Gestaltung erkunden.

Jun 17, 2025 ― 7 min Lesedauer

Computer Vision und Mustererkennung Gesichtserkennung mit echten und synthetischen Daten verbessern

Dieser Artikel untersucht, wie die Kombination aus echten und synthetischen Bildern die Genauigkeit und Fairness bei der Gesichtserkennung verbessert.

Jun 17, 2025 ― 5 min Lesedauer

Neuronales und evolutionäres Rechnen Einführung von SNNAX: Ein neues Tool zur Simulation von spiking neuronalen Netzen

SNNAX vereinfacht und beschleunigt die Simulation von spiking neural networks für Forscher.

Jun 17, 2025 ― 5 min Lesedauer

Rechnen und Sprache CMM-Math: Ein neuer Datensatz für multimodale Mathe-Herausforderungen

CMM-Math bewertet das Lösen von Matheproblemen in multimodalen Modellen mit Text und visuellen Darstellungen.

Jun 17, 2025 ― 6 min Lesedauer

Mensch-Computer-Interaktion Datenvisualisierung neu denken: Widersprüche und KI

Die Mischung aus traditionellem Design und KI bei der Erstellung von Visualisierungen erkunden.

Jun 17, 2025 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte im Reinforcement Learning mit probabilistischen Belohnungsmaschinen

Ein neuer Algorithmus verbessert die Entscheidungsfindung in komplexen Umgebungen mithilfe von historischen Daten.

Jun 17, 2025 ― 5 min Lesedauer

Rechnen und Sprache Sprachemodelle mit menschlichen Vorlieben abstimmen

Untersuchen, wie Präferenzlernen die Ausrichtung von Sprachmodellen an menschlichen Erwartungen verbessert.

Jun 17, 2025 ― 9 min Lesedauer

Maschinelles Lernen Fortschritte im Offline-Lernen in RDPs

Neue Techniken verbessern das Offline-Lernen für Regular Decision Processes in komplexen Umgebungen.

Jun 17, 2025 ― 5 min Lesedauer

Rechnen und Sprache Bewertung von LLM-basierten Embedding-Modellen: Eine Studie

Wir analysieren Pooling- und Aufmerksamkeitsstrategien in LLM-basierten Embedding-Modellen.

Jun 17, 2025 ― 5 min Lesedauer

Rechnen und Sprache Optimierung von Sprachmodellen für medizinische Texte

Eine Studie zur Verbesserung von Sprachmodellen mit gezielten medizinischen Artikeln.

Jun 17, 2025 ― 6 min Lesedauer

Robotik Automatisierung von chirurgischen Aufgaben mit KI und Robotik

Die Rolle von KI bei der Verbesserung der chirurgischen Effizienz und Präzision erkunden.

Jun 17, 2025 ― 5 min Lesedauer

Kryptographie und Sicherheit Lokale Verstärkungsdestillation: Eine neue Methode für Modell-Extraktionsangriffe

LoRD verbessert die Effizienz bei Modellausbruchsangriffen auf grosse Sprachmodelle.

Jun 17, 2025 ― 6 min Lesedauer

Informatik und Spieltheorie Fortschritt in der Spieltheorie mit Glaubensupdate und fiktivem Spiel

Eine neue Methode verbessert die Entscheidungsfindung in komplexen Strategiespielen.

Jun 17, 2025 ― 6 min Lesedauer

Robotik Fortschritt beim autonomen Fahren mit Lerntechniken

Die Kombination aus Verhaltensklonierung und PPO verbessert die Trajektorienplanung für selbstfahrende Autos.

Jun 17, 2025 ― 7 min Lesedauer

Soziale und Informationsnetzwerke Produkterempfehlungen mit Gleichgesinnten verbessern

Dieser Artikel untersucht ein neues Modell für bessere Online-Shopping-Vorschläge.

Jun 17, 2025 ― 6 min Lesedauer

Mensch-Computer-Interaktion Integration von Sprachmodellen in der visuellen Analyse

Entdecke, wie Sprachmodelle die visuelle Datenanalyse verändern.

Jun 17, 2025 ― 7 min Lesedauer

Signalverarbeitung Verbesserung der Bildrekonstruktion mit Parseval CNNs

Lerne, wie Parseval-Operatoren die Bildverarbeitung in CNNs verbessern.

Jun 17, 2025 ― 6 min Lesedauer

Computer Vision und Mustererkennung Bewertung der Generierung handschriftlicher Texte: Ein neuer Ansatz

Vorstellung neuer Metriken zur Bewertung von Systemen zur Generierung von handgeschriebenem Text.

Jun 17, 2025 ― 6 min Lesedauer

Robotik Geräuschbasierte Hinderniserkennung für mobile Roboter

In diesem Artikel geht's darum, wie man mit Sound Robotern helfen kann, Hindernisse zu erkennen.

Jun 17, 2025 ― 6 min Lesedauer

Atmosphären- und Ozeanphysik Neue KI-Methode verändert Vorhersagen für extremes Wetter

Eine neue KI-Methode verbessert, wie wir extremes Wetter im Zusammenhang mit dem Klimawandel einschätzen.

Jun 17, 2025 ― 5 min Lesedauer

Rechnen und Sprache Misinformation mit adversarialen Beispielen angehen

Die Forschung konzentriert sich darauf, adversariale Beispiele zu erstellen, um Systeme zur Glaubwürdigkeitsbewertung zu testen.

Jun 17, 2025 ― 6 min Lesedauer

Computer Vision und Mustererkennung MADiff: Fortschrittliche Handbewegungsvorhersage in Videos

Eine neue Methode verbessert die Vorhersagen von Handbewegungen in Videos für Roboter und virtuelle Realität.

Jun 17, 2025 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von LLMs in der visuellen Datenanalyse

Ein neuer Datensatz bewertet die Fähigkeiten grosser Sprachmodelle bei der Interpretation visueller Darstellungen.

Jun 17, 2025 ― 7 min Lesedauer

Signalverarbeitung Verbesserung der Generalisierung in Graph-Neuronalen-Netzwerken

Lern, wie GNNs besser auf unbekannte Daten generalisieren können.

Jun 17, 2025 ― 6 min Lesedauer

Computergestützte Technik, Finanzen und Wissenschaft Innovatives Design: KI mit struktureller Sicherheit vereinen

KI und mechanische Simulation verbessern die Geschwindigkeit und Sicherheit im Architekturd Design.

Jun 17, 2025 ― 7 min Lesedauer

Computer und Gesellschaft Bewertung der Rolle von ChatGPT in sozialen Umfragen

Diese Studie bewertet die Fähigkeit von ChatGPT, demografische und Einstellungsdaten zu simulieren.

Jun 17, 2025 ― 5 min Lesedauer

Logik Viele-Werte-Logik: Über Wahr und Falsch hinaus

Ein Überblick über die mehrwertige Logik und ihre Bedeutung in verschiedenen Bereichen.

Jun 17, 2025 ― 6 min Lesedauer

Chaotische Dynamik Memristoren und Chaos: Eine neue Grenze

Die Erkundung des Potenzials von Memristoren im chaotischen Verhalten für fortgeschrittene Anwendungen.

Jun 17, 2025 ― 6 min Lesedauer

Ton Fortschritte bei der Emotionserkennung für soziale Roboter

Eine Studie zeigt, wie Sprachdaten dabei helfen, Emotionen bei spanischsprechenden Personen zu erkennen.

Jun 17, 2025 ― 6 min Lesedauer

Kryptographie und Sicherheit Fortschritte in der Cyberforensik: GenDFIR-Framework

Das neue Framework GenDFIR verbessert die Analyse von Cyber-Event-Zeitlinien.

Jun 17, 2025 ― 7 min Lesedauer

Computer Vision und Mustererkennung Gesichtsausdrücke und Kontext: Ein neuer Ansatz

Diese Studie stellt ein Modell vor, das den Kontext integriert, um die Gesichtsausdruckserkennung zu verbessern.

Jun 17, 2025 ― 8 min Lesedauer

Verteiltes, paralleles und Cluster-Computing Verbesserung des mobilen Aufgabenmanagements durch föderiertes Lernen

Neuer Ansatz nutzt föderiertes Lernen, um mobile Aufgabenverlagerungsentscheidungen zu optimieren.

Jun 17, 2025 ― 6 min Lesedauer

Computer Vision und Mustererkennung StyleTokenizer: Eine neue Möglichkeit, Bildstile zu steuern

StyleTokenizer verbessert die Bildgenerierung, indem es Stil- und Textanweisungen trennt.

Jun 17, 2025 ― 7 min Lesedauer

Methodik Neuronale Netze in der räumlichen Datenanalyse

Wie neuronale Netzwerke die Parameterschätzung in räumlichen Modellen verbessern.

Jun 17, 2025 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachqualität in lauten Umgebungen

Eine neue Methode verbessert die Sprachklarheit in lauten Umgebungen.

Jun 17, 2025 ― 5 min Lesedauer

Maschinelles Lernen Fortschritte im kontinuierlichen Lernen mit dem kontinuierlichen Diffusormodell

Ein neues Modell verbessert die Fähigkeit von KI, zu lernen, ohne zu vergessen.

Jun 17, 2025 ― 8 min Lesedauer

Maschinelles Lernen CoAst: Eine neue Methode zur Bewertung von Beiträgen im föderierten Lernen

CoAst bietet eine innovative Bewertung von Beiträgen im föderierten Lernen, ohne dass Validierungsdaten nötig sind.

Jun 17, 2025 ― 5 min Lesedauer

Computer Vision und Mustererkennung Verbesserung der Tiefenschätzung mit Plane2Depth

Plane2Depth verbessert die Tiefenschätzung in komplexen Szenen und geht die Herausforderungen bei niedriger Textur an.

Jun 17, 2025 ― 6 min Lesedauer