Neuste Artikel für Bewertung

Künstliche Intelligenz Nutzung von Sprachmodellen zur Generierung wissenschaftlicher Hypothesen

Dieser Artikel untersucht, wie LLMs wissenschaftliche Hypothesen aus bestehenden Daten generieren und verfeinern.

2025-08-22T06:43:06+00:00 ― 8 min Lesedauer

Künstliche Intelligenz Verbesserung der Wissensgraph-Vervollständigung mit KGExplainer

KGExplainer verbessert die Transparenz bei der Vervollständigung von Wissensgraphen durch aussagekräftige Erklärungen.

2025-08-22T01:42:54+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Neue Methode zur Erstellung realistischer menschlicher Bilder

Ein neuer Ansatz, um detaillierte Bilder von Menschen in komplexen Szenen zu erzeugen.

2025-08-21T20:26:54+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Bewertung der Sicherheit von grossen Sprachmodellen

Eine Übersicht über Datensätze, die darauf abzielen, die Sicherheit von LLMs zu verbessern.

2025-08-21T08:04:18+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Ein neuer Ansatz für Multi-Agenten-Lernen

Die Leistung von Agenten durch Bewertungen und Erfahrung sammeln revolutionieren.

2025-08-21T05:42:06+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Bewertung und Verbesserung von digitalen Agenten

Ein Fokus auf Methoden zur Bewertung und Verbesserung der Leistung von digitalen Agenten.

2025-08-21T02:24:36+00:00 ― 3 min Lesedauer

Software-Entwicklung Verbesserung der Fehlersuche mit grossen Sprachmodellen

Eine neue Methode nutzt LLMs, um die Effizienz der Programmunterstützung zu verbessern.

2025-08-20T06:55:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache Selbstreflexion bei Sprachmodellen bewerten

Forschung zeigt, wie Selbstreflexion die Leistung von Sprachmodellen bei verschiedenen Fragetypen beeinflusst.

2025-08-20T01:15:42+00:00 ― 6 min Lesedauer

Logik Die Rolle von schematischer Substitution und Unifikation in der Logik

Die Erkundung wichtiger Konzepte in Logik und Informatik für effektives Denken.

2025-08-19T18:55:30+00:00 ― 8 min Lesedauer

Software-Entwicklung Bewertung von Softwareanforderungen mit Sprachmodellen

Ein Blick darauf, wie man Sprachmodelle nutzen kann, um die Zufriedenheit mit Softwareanforderungen zu bewerten.

2025-08-18T13:50:36+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Bewertung der visuellen Wahrnehmung in Sprachmodellen

Ein neuer Benchmark zeigt Lücken im visuellen Verständnis von grossen Sprachmodellen.

2025-08-18T12:23:42+00:00 ― 7 min Lesedauer

Theoretische Wirtschaftswissenschaften Matching Märkte: Der Einfluss von Lärm auf die Zulassung zu Universitäten

Analyzieren, wie Lärm die Zuordnung von Studenten und Hochschulen im Zulassungsprozess beeinflusst.

2025-08-18T06:13:18+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung der Genauigkeit in wissenschaftlichen Zusammenfassungen durch Feedback

Feedbackmechanismen nutzen, um von LLM generierte wissenschaftliche Zusammenfassungen zu verbessern.

2025-08-18T05:40:48+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Fortschritte im textzentrierten visuellen Fragenbeantworten

Das neue Dataset Square-10M verbessert die Open-Source-Fähigkeiten im Bereich visuelle Fragen und Antworten erheblich.

2025-08-18T02:31:12+00:00 ― 6 min Lesedauer

Software-Entwicklung Automatisierung von Testfallszenarien in der Softwareentwicklung

Dieser Artikel stellt eine Methode vor, um Test-Szenarien aus Anforderungen in natürlicher Sprache zu erstellen.

2025-08-18T02:15:24+00:00 ― 8 min Lesedauer

Rechnen und Sprache Eine neue Methode für Webautomatisierung

Dieser Ansatz verbessert die Datenerfassung von Webseiten mit Hilfe von strukturierten Regeln.

2025-08-18T01:59:36+00:00 ― 5 min Lesedauer

Rechnen und Sprache Die Genauigkeit von grossen Vision-Language-Modellen bewerten

Ein neuer Massstab verbessert, wie wir LVLMs und ihre Genauigkeit bewerten.

2025-08-17T06:46:12+00:00 ― 5 min Lesedauer

Logik in der Informatik CHC-COMP 2023: Bewertung von Constrained Horn Clause Solver

Der CHC-Wettbewerb hat Fortschritte bei den Lösungsverfahren und deren Anwendungen in der Programmverifikation gezeigt.

2025-08-17T00:50:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Automatisiertes Feedback: Ein neuer Ansatz fürs Aufsatzschreiben

Diese Studie untersucht automatisierte Systeme zur Bereitstellung von Essay-Feedback mithilfe von Sprachmodellen.

2025-08-16T18:31:30+00:00 ― 6 min Lesedauer

Maschinelles Lernen Die wachsende Rolle von synthetischen Daten in der Forschung

Künstliche Daten bieten kostengünstige Lösungen und sorgen gleichzeitig für Datenschutz und weniger Vorurteile.

2025-08-16T18:07:48+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen mit dem VISLA-Benchmark

Ein neuer Massstab bewertet, wie gut Sprachmodelle Wortbedeutungen und -beziehungen verstehen.

2025-08-16T08:07:24+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Bewertung der Informationsgewinnung in handgeschriebenen Texten

Neue Metriken verbessern die Bewertung von Informationsextraktionssystemen in handschriftlichen Dokumenten.

2025-08-15T11:58:42+00:00 ― 7 min Lesedauer

Multiagentensysteme Bewertung der KI-Leistung in Multiagenten-Systemen

Ein Rahmen zur Bewertung von KI-Strategien in wettbewerbsorientierten und kooperativen Umgebungen.

2025-08-15T07:22:12+00:00 ― 7 min Lesedauer

Software-Entwicklung Vertrauen in KI-generierte Code-Zusammenfassungen messen

Bewertung der Zuverlässigkeit von KI-erstellten Zusammenfassungen für verbesserte Softwarewartung.

2025-08-15T02:53:36+00:00 ― 7 min Lesedauer

Gesundheitsinformatik Die Rolle von ChatGPT im Gesundheitswesen

Überprüfen, wie ChatGPT das Gesundheitswesen beeinflusst und welche potenziellen Anwendungen es gibt.

2025-08-14T23:39:30+00:00 ― 5 min Lesedauer

Rechnen und Sprache DynaMo: Sprachmodelle mit Multi-Token-Vorhersage voranbringen

DynaMo-Modelle generieren Texte schneller und mit besserer Qualität durch Multi-Token-Vorhersage.

2025-08-14T23:04:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung von verwandten Arbeiten in Forschungsarbeiten

Ein neuer Datensatz verbessert die Erstellung von verwandten Arbeiten in wissenschaftlichen Artikeln.

2025-08-14T00:33:36+00:00 ― 9 min Lesedauer

Informationsbeschaffung Konversationelle Suche mit TREC iKAT voranbringen

TREC iKAT will die Interaktionen mit Gesprächsagenten durch personalisierte Dialoge verbessern.

2025-08-13T20:28:42+00:00 ― 7 min Lesedauer

Rechnen und Sprache Automatisierung von Antworten auf Kundenbewertungen

SCRABLE bietet automatisierte Lösungen für ein effektives Management von App-Bewertungen.

2025-08-13T13:53:42+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Bewertung der Zukunft von Video-grossen multimodalen Modellen

Die Fähigkeiten und Herausforderungen von fortgeschrittenen Modellen zur Videoverstehens beurteilen.

2025-08-13T12:42:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von KI-Erklärungen: Ein neuer Ansatz

Diese Studie analysiert die Effektivität von LLMs bei der Bewertung von KI-generierten Erklärungen.

2025-08-12T12:36:54+00:00 ― 8 min Lesedauer

Rechnen und Sprache Bewertung von Sprachmodellen: Der DoLoMiTes-Benchmark

Ein neues Framework bewertet, wie gut Sprachmodelle Experten bei Schreibaufgaben helfen.

2025-08-12T08:39:54+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Einführung von PEAVS: Eine neue Methode zur Messung der Audio-Visual-Synchronisation

PEAVS analysiert, wie gut Audio und Video zusammenarbeiten, um das Zuschauererlebnis zu verbessern.

2025-08-12T03:19:55+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Bewertung der Auswirkungen von DNN-Training: Eine neue Methode

Eine schnelle Möglichkeit, die Leistung von DNN nach dem neuen Training zu bewerten.

2025-08-12T00:22:12+00:00 ― 6 min Lesedauer

Maschinelles Lernen Verbesserung der Transparenz von KI-Modellen mit Sparse Autoencodern

Sparse Autoencoder verbessern die Verständlichkeit von KI-Systemen und deren Entscheidungsprozesse.

2025-08-11T02:07:06+00:00 ― 11 min Lesedauer

Rechnen und Sprache Die Bewertung des Verständnisses von KI über Weltwissen

Ein Blick darauf, wie KI-Modelle wichtiges Wissen über die Welt erfassen.

2025-08-10T22:41:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von Toxizität in mehrsprachigen Sprachmodellen

Neuer Massstab bewertet die Toxizität in grossen Sprachmodellen in verschiedenen Sprachen.

2025-08-10T21:30:36+00:00 ― 8 min Lesedauer

Software-Entwicklung Verbesserung der Fuzzing-Bewertungen für bessere Softwarequalität

In diesem Artikel geht's um die Notwendigkeit besserer Bewertungsmethoden in der Fuzzing-Forschung.

2025-08-10T15:11:24+00:00 ― 6 min Lesedauer

Mensch-Computer-Interaktion Bewertung von Salienzmethoden in NLP: Eine menschliche Perspektive

Diese Studie bewertet Salienzmethoden in NLP durch menschliche Evaluierung.

2025-08-10T07:56:54+00:00 ― 9 min Lesedauer

Maschinelles Lernen Verbesserung der Heatmap-Analyse für KI-Entscheidungen

Einführung von PQAH für ein besseres Verständnis von AI-Hitzekarten und deren Bewertung.

2025-08-09T15:29:24+00:00 ― 8 min Lesedauer