Die Nemotron-4 340B Familie bietet starke Modelle für verschiedene Anwendungen und die Generierung von synthetischen Daten.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Die Nemotron-4 340B Familie bietet starke Modelle für verschiedene Anwendungen und die Generierung von synthetischen Daten.
― 8 min Lesedauer
Ein Toolkit zur Bewertung der Leistung von retrieval-unterstützten Modellen in bestimmten Bereichen.
― 10 min Lesedauer
Untersuchen, wie kulturelle Vorurteile das Verständnis von KI-Bildern beeinflussen.
― 9 min Lesedauer
Neue Methoden zeigen Herausforderungen beim Vergessen von Wissen aus Sprachmodellen.
― 6 min Lesedauer
Ein Blick auf intersymbolische KI, die symbolische und subsymbolische Methoden kombiniert, um schlauere Systeme zu schaffen.
― 6 min Lesedauer
Sprachagenten werden immer anpassungsfähiger und verbessern ihre Kommunikations- und Problemlösungsfähigkeiten.
― 5 min Lesedauer
Forscher entwickeln das GECO-Datensatz und GECOBench, um Geschlechterbias in KI zu bekämpfen.
― 6 min Lesedauer
Neue Methode verbessert retrieval-unterstützte Generierung für komplexe Fragenbeantwortung.
― 7 min Lesedauer
Ein neues Dual-Transformator-Modell verbessert die Vorhersagen für die Ausführungszeit aus der Quellcodeanalyse.
― 6 min Lesedauer
Untersucht die Herausforderungen, fortgeschrittene KI-Modelle mit schwächeren Gegenstücken zu überwachen.
― 7 min Lesedauer
Dieses Papier stellt Methoden vor, um unzuverlässige Websites mithilfe von Dredge-Wörtern zu erkennen.
― 7 min Lesedauer
Eine Studie zur Leistung von kleineren, offenen Sprachmodellen in verschiedenen Aufgaben.
― 6 min Lesedauer
Refiner verbessert die Antworten des Sprachmodells, indem er die abgerufenen Informationen umstrukturiert.
― 7 min Lesedauer
Eine Studie über die Fähigkeit von Copilot, Code in verschiedenen Programmiersprachen zu generieren.
― 7 min Lesedauer
Neue Ansätze verbessern die Robustheit von RL-Controllern in unsicheren Umgebungen.
― 6 min Lesedauer
GUICourse hat das Ziel, die Interaktion mit digitalen Schnittstellen durch gezielte Datensätze für GUI-Agenten zu verbessern.
― 5 min Lesedauer
VideoVista bietet eine umfassende Bewertung für Video-Frage-Antwort-Modelle.
― 6 min Lesedauer
Diese Studie zeigt, wie Sprachmodelle ihr Verhalten während des Trainings ändern.
― 7 min Lesedauer
CubeSats und Drohnen kombinieren, um den Zugang zur globalen Kommunikation zu verbessern.
― 4 min Lesedauer
Dieser Artikel untersucht, wie vortrainierte Modelle durch Hypergraphen über Beziehungen lernen.
― 6 min Lesedauer
Die Adressierung der Energieverteilung für robuste kooperative Systeme.
― 6 min Lesedauer
Die Analyse des Zusammenhangs zwischen Verschmutzung und steigenden Temperaturen für effektive politische Massnahmen.
― 7 min Lesedauer
Eine neue Methode, um zu verstehen, wie Audiomodelle Vorhersagen treffen.
― 5 min Lesedauer
Eine Studie über die Entscheidungsprozesse von grossen Sprachmodellen.
― 5 min Lesedauer
MMNeedle-Benchmark-Tests für multimodale Modelle zur Handhabung von langen Kontexten.
― 5 min Lesedauer
Ein neuer Datensatz verbessert die Effizienz der Codesuche für Entwickler, die natürliche Sprache verwenden.
― 7 min Lesedauer
Neue Methoden verbessern Vorhersagen, indem sie sich auf die Funktionalität des Codes statt auf Variablennamen konzentrieren.
― 6 min Lesedauer
DrugWatch hilft Nutzern, Infos zur Arzneimittelsicherheit ganz einfach zu finden.
― 6 min Lesedauer
Eine Methode zur Identifizierung von Emotionen und deren Ursachen in unbeschrifteten Daten.
― 5 min Lesedauer
SHiRA verbessert die Effizienz beim Wechseln von Modellen in KI, ohne wichtige Konzepte zu verlieren.
― 5 min Lesedauer
APPL vereinfacht die Entwicklung mit grossen Sprachmodellen und nutzt eine intuitive, pythonähnliche Syntax.
― 2 min Lesedauer
Untersuchung der Wurzeln und Auswirkungen von Vorurteilen in der Sprachtechnologie.
― 7 min Lesedauer
Eine Studie zur Vorhersage von Stromnetzfehlern durch Analyse von Deep Reinforcement Learning.
― 7 min Lesedauer
Langzeit-Kontext-Sprachmodelle machen komplexe Aufgaben einfacher und verbessern die Interaktion mit KI.
― 8 min Lesedauer
Ein neues Framework geht Herausforderungen bei der Wissensdistillation für langgestreckte Daten an.
― 8 min Lesedauer
Dieser Artikel untersucht Möglichkeiten, die Planungsfähigkeiten in grossen Sprachmodellen zu verbessern.
― 8 min Lesedauer
Ein Blick auf neuronale Netzwerke, Unsicherheit und deren Einfluss auf die Entscheidungsfindung von KI.
― 8 min Lesedauer
Die Erkundung der Synergie zwischen Foundation-Modellen und föderiertem Lernen für verbesserte KI-Anwendungen.
― 7 min Lesedauer
Ein Tool, das KI nutzt, hilft dabei, wichtige Konfigurationseinstellungen für die Softwareleistung zu identifizieren.
― 7 min Lesedauer
Ein Machine-Learning-Ansatz zur Bewertung und Verbesserung der Produktivität von Mitarbeitern.
― 8 min Lesedauer