Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Elektrotechnik und Systemtechnik# Computer Vision und Mustererkennung# Bild- und Videoverarbeitung

Qualität in Computergraphik-Bildern bewerten

Eine neue Methode und Datenbank verbessern die Bildqualitätsbewertung in der Computer Grafik.

― 6 min Lesedauer


Neue Methoden zurNeue Methoden zurBewertung derCGI-QualitätBewertung von Computergrafikbildern.Innovative Techniken verbessern die
Inhaltsverzeichnis

Computergrafikbilder (CGIs) sind Bilder, die von Computerprogrammen erstellt werden und oft in Videospielen, Filmen und im Online-Streaming zu sehen sind. Allerdings kann die Qualität dieser Bilder oft schlecht sein, aus verschiedenen Gründen. Manchmal sehen sie nicht gut aus, weil sie während der Produktion nicht gut gerendert wurden. Andere Male können sie durch Kompressionsartefakte leiden, wenn sie über das Internet gesendet werden, oder sie sind einfach nicht visuell ansprechend wegen schlechter Designentscheidungen. Trotz dieser Probleme wurde nicht viel Forschung betrieben, um die Qualität von Computergrafikbildern zu messen.

Der Bedarf an Qualitätsbewertung

Die meisten Werkzeuge zur Messung der Bildqualität wurden für natürliche Bilder aufgenommen mit Kameras entwickelt. Diese Werkzeuge basieren oft auf anderen "guten" Bildern zum Vergleich, was für computergenerierte Bilder nicht gut funktioniert. Die Unterschiede, wie natürliche Bilder und Computergrafikbilder erstellt werden, zeigen, dass die gleichen Werkzeuge nicht effektiv genutzt werden können. Das hebt eine Lücke hervor, die gefüllt werden muss – es besteht ein Bedarf an Bewertungswerkzeugen speziell für Computergrafikbilder.

Erstellung einer neuen Datenbank

Um dieses Problem anzugehen, wurde eine neue gross angelegte Datenbank speziell zur Bewertung von Computergrafikbildern erstellt. Diese Datenbank umfasst 6.000 CGIs, die aus verschiedenen Quellen gesammelt wurden. Ziel ist es, die Lücke in bestehenden Bewertungsmethoden zu schliessen, indem ein Referenzpunkt zur Bewertung der Qualität von Computergrafikbildern bereitgestellt wird.

Ein neuer Ansatz zur Qualitätsbewertung

Die neu vorgeschlagene Methode zur Bewertung der Bildqualität benötigt kein Referenzbild zum Vergleich. Stattdessen betrachtet sie sowohl Verzerrungen als auch die ästhetische Anziehungskraft eines Bildes. Durch den Fokus auf diese beiden Aspekte kann die Methode eine genauere Bewertung der Qualität eines Computergrafikbildes geben.

Die Auswirkungen von Verzerrungen und Ästhetik

CGIs können verschiedene Arten von Verzerrungen aufweisen, wie Unschärfe oder Verlust von Details aufgrund schlechter Renderings oder Kompressionsprobleme. Diese Verzerrungen können stark beeinflussen, wie ein Nutzer das Bild wahrnimmt. Zudem spielt der persönliche Geschmack eine grosse Rolle bei der Bewertung von Bildern. Ein Bild mag schlecht gerendert sein, aber wenn es eine bestimmte emotionale Reaktion hervorruft oder ästhetische Merkmale hat, die einem Betrachter gefallen, kann es dennoch hoch bewertet werden, unabhängig von seinen technischen Mängeln.

Verschiedene Arten von Bewertungsmethoden

Die Methoden zur Qualitätsbewertung lassen sich in drei Kategorien einteilen, je nachdem, wie sie Referenzbilder nutzen:

  1. Vollreferenzmethoden vergleichen ein verzerrtes Bild mit einem einwandfreien Original.
  2. Reduzierte Referenzmethoden nutzen einige Informationen aus dem Original, ohne das gesamte Bild zu benötigen.
  3. Keine Referenzmethoden benötigen kein Originalbild und stützen sich stattdessen darauf, das Bild selbst zu bewerten.

Die meisten Bewertungen von Computergrafiken fallen in die Kategorie ohne Referenz, da Originalbilder nicht immer verfügbar sind.

Herausforderungen bei der Qualitätsbewertung

Viele bestehende Werkzeuge zielen darauf ab, natürliche Bilder zu bewerten und sind nicht für Computergrafikbilder geeignet. Zum einen haben Computergrafiken oft einfache, regelmässige Formen und weniger Variation in der Textur im Vergleich zu natürlichen Bildern. Ausserdem basieren die Qualitätsmasse in bestehenden Werkzeugen auf Annahmen, die auf CGIs nicht zutreffen.

Viele frühere Bemühungen konzentrierten sich auf die Verwendung von Vollreferenzmethoden, die nicht gut mit CGIs funktionieren, da originale Bilder oft nicht zugänglich sind. Es gibt auch nur eine begrenzte Anzahl von Datenbanken speziell für Computergrafikbilder, was die Entwicklung neuer Bewertungswerkzeuge behindert.

Aufbau der CGIQA-6k-Datenbank

Um die hervorgehobenen Probleme anzugehen, wurde eine gross angelegte CGIQA-Datenbank mit 6.000 CGIs erstellt. Diese Datenbank umfasst Bilder, die aus verschiedenen Plattformen wie Videospielen und Filmen stammen, und bietet eine vielfältige Palette an Inhalten und Auflösungen. Der Prozess umfasste das Sammeln von Bildern aus verschiedenen Quellen, einschliesslich lokaler Spiele und Streaming-Dienste, um eine breitere Vielfalt von Bildern und Qualitätsstufen sicherzustellen.

Die subjektive Komponente

Um sicherzustellen, dass die Qualitätsbeurteilungen genau sind, wurde ein subjektives Experiment durchgeführt. Dabei wurde getestet, wie Menschen die CGIs bewerteten. In einer kontrollierten Umgebung wurden den Teilnehmern die Bilder gezeigt und sie wurden gebeten, diese nach Qualität zu bewerten. So konnten Daten darüber gesammelt werden, wie durchschnittliche Zuschauer die Qualität dieser CGI-Bilder wahrnehmen.

Ergebnisse des subjektiven Experiments

Die subjektiven Bewertungen der Teilnehmer zeigten Trends darin, wie bestimmte Arten von CGIs wahrgenommen wurden. Zum Beispiel erhielten Film-CGIs generell höhere Bewertungen im Vergleich zu Spiel-CGIs. Dieser Unterschied liegt wahrscheinlich an den höheren Ressourcen, die für das Rendern von Filmen im Vergleich zu dem, was typischerweise in Videospielumgebungen verfügbar ist, zur Verfügung stehen.

Qualitätsmessung mit neuen Techniken

Durch die Entwicklung einer neuen Bewertungsmethode wird es möglich, die Qualität von CGIs sowohl effektiv als auch konsistent zu bewerten. Die Methode kombiniert alle Informationen, die aus dem subjektiven Experiment gesammelt wurden, und wendet sie an, um ein detailliertes Verständnis davon zu schaffen, was ein Bild ansprechend oder technisch hochwertig macht.

Verzerrungsstream vs. Ästhetikstream

Die neue Methode besteht aus zwei Hauptschichten:

  1. Verzerrungsstream: Dieser konzentriert sich auf die Identifizierung und Messung von Verzerrungen in der CGI. Sie berücksichtigt verschiedene Faktoren, die die Bildqualität beeinträchtigen können, wie Unschärfe oder Pixelierung.
  2. Ästhetikstream: Dieser Teil bewertet die künstlerischen Qualitäten des Bildes, einschliesslich Komposition und Farbgleichgewicht. Dieser Stream nutzt vorhandene Daten zur ästhetischen Qualität, um die Bewertung zu verbessern.

Beide Streams arbeiten zusammen, um eine ganzheitliche Messung der CGI-Qualität zu bieten. Während die Verzerrungsaspekte offenbar einen grösseren Einfluss auf die allgemeine Wahrnehmung des Zuschauers haben, spielen auch die ästhetischen Qualitäten eine wichtige Rolle.

Leistung der neuen Methode

Die neue Bewertungsmethode wurde gegen bestehende Techniken getestet. Die Ergebnisse zeigten, dass sie besser abschnitt, insbesondere bei der neu erstellten CGIQA-6k-Datenbank. Das deutet darauf hin, dass sie in der Lage ist, ein klareres Verständnis der CGI-Qualität im Vergleich zu älteren Methoden zu bieten.

Vergleich mit bestehenden Modellen

Vergleichstests an der CGIQA-6k-Datenbank und anderen zeigten, dass auf Deep Learning basierende Bewertungsmethoden signifikant besser abschnitten als traditionelle, handgefertigte Methoden. Die neue Methode, die sowohl ästhetische als auch Verzerrungsbewertungen integriert, erzielte die höchsten Leistungswerte im Vergleich zu anderen modernen Modellen.

Validierung in verschiedenen Szenarien

Die neue Bewertungsmethode wurde auch an anderen bestehenden Datenbanken validiert. Diese Cross-Validierung zeigte, dass die neue Methode ihre Effektivität beibehält, selbst wenn sie auf verschiedenen Datensätzen von Computergrafikbildern angewendet wird, was ihre Robustheit und Anpassungsfähigkeit unterstreicht.

Die Bedeutung einer neuen Datenbank

Durch den Aufbau einer grossen Datenbank wie CGIQA-6k haben Forscher jetzt eine reiche Ressource zur Verfügung, mit der sie im Bereich der CGI-Qualitätsbewertung arbeiten können. Dies wird den Weg für zukünftige Werkzeuge und Forschungen ebnen, die helfen, wie wir Computergrafikbilder bewerten, zu verbessern.

Fazit

Die Entwicklung der CGIQA-6k-Datenbank und der begleitenden Bewertungsmethode stellt einen bedeutenden Fortschritt im Bereich der Qualitätsbewertung von Computergrafikbildern dar. Die Kombination aus Verzerrungs- und ästhetischer Bewertung ermöglicht ein umfassenderes Verständnis davon, was ein qualitativ hochwertiges Bild ausmacht. Mit der Verbesserung der Methoden wird auch das Benutzererlebnis in verschiedenen Anwendungen von Spielen bis hin zu Filmen verbessert. Zukünftige Forschungen werden weiterhin auf diesem Fundament aufbauen und neue Wege erkunden, um die Qualität von Computergrafikbildern zu bewerten und zu verbessern.

Originalquelle

Titel: Subjective and Objective Quality Assessment for in-the-Wild Computer Graphics Images

Zusammenfassung: Computer graphics images (CGIs) are artificially generated by means of computer programs and are widely perceived under various scenarios, such as games, streaming media, etc. In practice, the quality of CGIs consistently suffers from poor rendering during production, inevitable compression artifacts during the transmission of multimedia applications, and low aesthetic quality resulting from poor composition and design. However, few works have been dedicated to dealing with the challenge of computer graphics image quality assessment (CGIQA). Most image quality assessment (IQA) metrics are developed for natural scene images (NSIs) and validated on databases consisting of NSIs with synthetic distortions, which are not suitable for in-the-wild CGIs. To bridge the gap between evaluating the quality of NSIs and CGIs, we construct a large-scale in-the-wild CGIQA database consisting of 6,000 CGIs (CGIQA-6k) and carry out the subjective experiment in a well-controlled laboratory environment to obtain the accurate perceptual ratings of the CGIs. Then, we propose an effective deep learning-based no-reference (NR) IQA model by utilizing both distortion and aesthetic quality representation. Experimental results show that the proposed method outperforms all other state-of-the-art NR IQA methods on the constructed CGIQA-6k database and other CGIQA-related databases. The database is released at https://github.com/zzc-1998/CGIQA6K.

Autoren: Zicheng Zhang, Wei Sun, Yingjie Zhou, Jun Jia, Zhichao Zhang, Jing Liu, Xiongkuo Min, Guangtao Zhai

Letzte Aktualisierung: 2023-11-01 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2303.08050

Quell-PDF: https://arxiv.org/pdf/2303.08050

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel