アートにおける感情と香りの結びつき
研究は、感情と芸術作品における感覚体験のつながりを探求している。
― 1 分で読む
感情は私たちの生活において大事な部分だけど、歴史や遺産に関する研究ではあんまり注目されてこなかったんだ。最近、学者たちは、嗅覚を含む感覚が私たちの気持ちや文化との関わりにどう影響するかをもっと詳しく見始めてる。この新しい考え方は、視覚だけじゃなくて色々な感覚が私たちの体験にどう関わってるかを研究する道を開いてるんだ。
文化遺産についての理解が広がっていく中で、物理的なものだけじゃなくて、感情や匂いのような非物質的な要素も含めるようになってきた。この変化は、違う感覚が歴史とつながる手助けになるか考えるきっかけを研究者に与えてる。最近の「計算人文学」という分野では、匂いや音を含む様々な感覚体験に関連する感情を認識することを目指しているんだ。
感情は書かれたテキストや写真の中では認識されてきたけど、特に匂いに関連するアート作品の中で感情を特定する方法の研究はまだ進行中だ。既存の感情認識の方法は主に写真に依存していて、アートのスタイルと合わないこともあるんだ。
研究者たちはアート作品に対する感情反応を示すリソースをまとめてるけど、そのアートの中に描かれている人々の具体的な感情反応についてはあんまり調べられていない。この研究は、匂いに関連するアートの中で、個々の感情を認識できるかどうかを探ることに焦点を当ててる。匂いに関するアートを調べることで、この研究は感情と匂いを結びつける未来の研究の基礎を築くことを目指しているんだ。
研究に使用したデータセット
この研究を行うために、チームはEMOTICというデータセットを使った。このデータセットには、様々な感情を持つ人々を写した日常の写真が23,000枚以上含まれてる。それぞれの画像には、その人の気持ちや位置が示されたラベルがついてる。感情は明確なタイプに分類され、感情のバレンス(ポジティブまたはネガティブな気持ち)、覚醒(興奮または落ち着き)、支配(コントロールまたは従属)の連続的な尺度も含まれてる。
ODOR-emotionsという小さいテストセットは、Europeraプロジェクトに関連する画像を使って作成された。このテストセットには、感情がEMOTICシステムに従ってラベル付けされた一人の人を示すアート作品の画像が100枚含まれてる。
スタイライズされたデータセットの作成
研究を改善するために、研究者たちはEMOTICデータセットのスタイライズ版であるEMOTIC-sを開発した。このバージョンは、通常の写真とアートの表現の間のギャップを埋めることを目的としていて、スタイル転送という方法を応用してる。このプロセスは、写真の内容とアート作品のスタイルを混ぜ合わせて、新しい画像を作り出して、アートの文脈をよりよく表現するんだ。
この目的のために、研究者たちはオンラインコレクションからランダムに選んだアート作品を使用した。このコレクションには様々なスタイルが含まれてるから、EMOTICの画像と組み合わせることで、研究したいアートのイメージにもっと合ったデータセットを作ろうとしたんだ。
ネットワークの動作
研究者たちは、画像を分析するために畳み込みニューラルネットワーク(CNN)という技術を使った。この特定のモデルは、体の言語や周囲のシーンを考慮して、その人の感情についての情報を集めるように設計されてる。モデルは、個人から特徴を抽出する部分、全体のシーンを分析する部分、そして両方の情報を融合して感情を予測する部分の3つの主要な部分で構成されてる。
人に焦点を当てたモジュールは、その人の姿勢や顔の表情を見て気持ちの洞察を得ようとする。一方、シーンのコンテクストモジュールは、人物が描かれている状況を理解するために広い環境を評価する。
ResNet-18やResNet-50など、異なるCNNアーキテクチャからのデータを使って、どのモデルが画像に基づいて感情を認識するのに最適かをテストした。研究者たちは、モデルの精度を向上させるために様々な技術を使ってトレーニングプロセスを洗練させたんだ。
パフォーマンス結果
最初のCNNモデルのパフォーマンスを評価して、EMOTICデータセットの画像における感情認識の精度を見た。結果は先行研究とよく一致していて、彼らの方法が一貫して信頼できることを示していたんだ。しかし、これらのモデルがODOR-eデータセットのアート画像でテストされたとき、パフォーマンスは大きく低下した。
この低下に対処するために、研究者たちはモデルに調整を加えた。一つのモデルのバックボーンを変更してパフォーマンスを改善し、人物の切り抜かれた画像のサイズを大きくして、感情認識のための詳細を提供した。
これらの変更はEMOTICデータセットではいくつかの改善をもたらしたけど、ODOR-eデータセットでの認識精度の低下を招いてしまった。彼らは、アート表現における感情を評価することの複雑さを考慮しながら、パフォーマンスを向上させるための異なる方法を引き続き調査したんだ。
スタイル転送技術
モデルを改善するために、研究者たちはEMOTIC-sデータセットを使って実験した。このデータセットには、先に言ったスタイル転送プロセスを通じて作成されたスタイライズされた画像が含まれてる。結果として、あるモデルのパフォーマンスがわずかに向上したことが示されたけど、スタイル転送中に重要な顔の特徴が失われることで、感情認識能力が低下することも分かったんだ。これは、特に感情を認識するためにそれらの特徴が重要な場合に、正確に感情を評価するのに重大なことになるかもしれない。
研究者たちは、重要な顔の特徴を維持するためにスタイル転送方法を洗練させることが、将来の研究努力において有望な方向性になるだろうと考えている。彼らは、アートにおける感情表現の詳細を保持することで、モデルのパフォーマンスが大きく向上する可能性があると主張してる。
研究の重要性
この研究は、特に匂いに関連するアート作品の中で感情を認識する可能性を強調してる。研究は、感情的なつながりを作るために文脈情報が不可欠であることを示してる。現在、歴史的なアート作品に対するパフォーマンスは自然画像と比べて劣るけど、これらの発見は今後の改善の道を開くものだ。
これから先、データセットを拡張することで、研究者たちはアートの表現の中で感情をより正確に認識するための方法を洗練させることができる。さらに、重要な顔の特徴を保持するためにスタイル転送技術を向上させることで、感情認識プロセスが改善される可能性が高い。
最終的には、この研究が匂いと感情をアートの領域で結びつける分野横断的な協力を促進することになるんだ。学者たちがこれらのつながりを探求し続ける中で、私たちの感覚がどのように感じ方や文化への感謝に影響を与えるかを深く理解するための大きな可能性がある。この研究とその発見は、アート、感情、感覚的知覚のこの魅力的な交差点をさらに探求するための基盤を形成しているんだ。
タイトル: Smell and Emotion: Recognising emotions in smell-related artworks
概要: Emotions and smell are underrepresented in digital art history. In this exploratory work, we show that recognising emotions from smell-related artworks is technically feasible but has room for improvement. Using style transfer and hyperparameter optimization we achieve a minor performance boost and open up the field for future extensions.
著者: Vishal Patoliya, Mathias Zinnen, Andreas Maier, Vincent Christlein
最終更新: 2024-07-05 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2407.04592
ソースPDF: https://arxiv.org/pdf/2407.04592
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。