Forscher analysieren die Vorhersehbarkeit der Leistung von Sprachmodellen, wenn die Trainingsrechenleistung steigt.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Forscher analysieren die Vorhersehbarkeit der Leistung von Sprachmodellen, wenn die Trainingsrechenleistung steigt.
― 7 min Lesedauer
Ein Blick auf Backdoor-Angriffe und Abwehrmassnahmen in Deep-Learning-Modellen.
― 6 min Lesedauer
Dieses Papier bewertet die Effizienz des generierten Codes von verschiedenen Modellen.
― 7 min Lesedauer
Der Artikel stellt einen Benchmark vor, um grosse Sprachmodelle mit komplexen Aufgaben zu bewerten.
― 7 min Lesedauer
Diese Studie bewertet die Fähigkeiten grosser Sprachmodelle in komplexen Planungsszenarien.
― 7 min Lesedauer
Forschung untersucht die Verwendung von VLMs, um Roboteraktionen zu bewerten.
― 7 min Lesedauer
Die Rolle von grossen Sprachmodellen in der Molekularwissenschaft erkunden.
― 8 min Lesedauer
Methoden erkunden, um die Leistung von Robotern in unvorhersehbaren Umgebungen zu verbessern.
― 5 min Lesedauer
AV-SUPERB bewertet Audio- und visuelle Modelle über verschiedene Aufgaben hinweg für eine bessere Leistung.
― 6 min Lesedauer
Neue Werkzeuge verbessern, wie Systeme Informationen aus langen Dokumenten abrufen.
― 5 min Lesedauer
Dieser Benchmark bewertet die Leistung von medizinischen Sprachmodellen im Gesundheitswesen.
― 8 min Lesedauer
Eine Methode, um KI-Modelle basierend auf realen Ereignissen aktuell zu halten.
― 6 min Lesedauer
Neue Benchmark-Tests bewerten MLLMs bei Aufgaben in sozialen Medien wie Fehlinformationen und Hassrede.
― 11 min Lesedauer
RobotScript verbessert, wie Roboter Aufgaben aus natürlicher Sprache ausführen.
― 7 min Lesedauer
Eine frische Perspektive, um versteckte Bedrohungen im Hardware-Design zu finden.
― 6 min Lesedauer
Neue Methoden sollen die Bewertungsmöglichkeiten für das Denkvermögen von KI-Sprachmodellen verbessern.
― 7 min Lesedauer
DyPyBench bietet eine vielfältige Auswahl an Projekten für dynamische Analysen in Python.
― 7 min Lesedauer
Die Fähigkeit von KI, Designs in Code umzuwandeln, verändert die Webentwicklung.
― 8 min Lesedauer
Studie zeigt erheblichen Datenüberschneidungen, die die Bewertungen von Sprachmodellen bei der Codegenerierung beeinflussen.
― 6 min Lesedauer
Die Bewertung der LLM-Leistung durch ein spezielles Benchmark für die Bio-Bildanalyse.
― 6 min Lesedauer
Eine neue Methode zur Bewertung von Sprachverarbeitungstools zeigt vielversprechende Verbesserungsmöglichkeiten.
― 6 min Lesedauer
Eine Methode zur Bewertung der Übertragbarkeit von vortrainierten Modellen für die Objekterkennung.
― 4 min Lesedauer
Eine Ressource, die dazu gedacht ist, Robotern zu helfen, alltägliche Aufgaben effektiv zu lernen.
― 7 min Lesedauer
Ein Blick auf die Bewertung der Entscheidungsfähigkeit von grossen Sprachmodellen.
― 8 min Lesedauer
Ein Framework, um die NLP-Leistung über verschiedene Sprachdialekte hinweg zu verbessern.
― 4 min Lesedauer
Ein frischer Benchmark zeigt die Stärken und Schwächen von VLLMs bei multimodalen Aufgaben.
― 6 min Lesedauer
Experten versammeln sich, um über Monte-Carlo-Simulationen und GPU-Verbesserungen zu sprechen.
― 7 min Lesedauer
Neue Benchmarks zeigen Stärken und Schwächen von Programmiersprachen-Modellen.
― 4 min Lesedauer
Meerkat-7B setzt einen neuen Standard für Open-Source-Modelle in der medizinischen Sprache.
― 6 min Lesedauer
Neue Methoden verbessern die Video-Zusammenfassung mit grossen Datensätzen und fortschrittlichen Modellen.
― 7 min Lesedauer
Forschung zeigt die Herausforderungen, die LLMs beim Verstehen von langen Texten haben, und schlägt neue Benchmarks vor.
― 6 min Lesedauer
Die Erforschung des Designs und der Vorteile eines PMU für RISC-V-Prozessoren, die im Weltraum eingesetzt werden.
― 5 min Lesedauer
Diese Studie untersucht Qualitätsprobleme bei Prompts für Codegenerierungsmodelle.
― 5 min Lesedauer
Ein neuer Benchmark zeigt Lücken im visuellen Verständnis von grossen Sprachmodellen.
― 7 min Lesedauer
Ein neuer Massstab verbessert, wie wir LVLMs und ihre Genauigkeit bewerten.
― 5 min Lesedauer
Der CHC-Wettbewerb hat Fortschritte bei den Lösungsverfahren und deren Anwendungen in der Programmverifikation gezeigt.
― 6 min Lesedauer
Dieser Artikel untersucht, wie man das Verständnis von indirekten Antworten verbessern kann.
― 6 min Lesedauer
Eine Studie zur Bewertung von Few-Shot-Lernmethoden für die Klassifizierung der polnischen Sprache.
― 4 min Lesedauer
PatentGPT-Modelle sind darauf ausgelegt, die speziellen Herausforderungen im Bereich des geistigen Eigentums zu bewältigen.
― 4 min Lesedauer
Eine Studie zur Effektivität von SAST-Tools für Smart Contracts.
― 9 min Lesedauer