Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# コンピュータビジョンとパターン認識# 情報検索# 機械学習

オンラインファッションショッピングにおけるユーザー生成画像のランキング

ファッションECでの画像品質ランキングを改善する新しい方法。

― 1 分で読む


ファッションEコマースのユファッションEコマースのユーザー画像ランキングを改善すること。オンラインでファッション画像のランキング
目次

オンラインファッションストアでは、顧客は購入前に商品を直接触ったり見ることができないから、他の買い手の画像やレビューを見ることがめっちゃ重要になってくる。これによって、顧客は何を買うかの選択をより良くできるんだ。時間が経つにつれ、多くの顧客が購入したアイテムについて自分の意見や写真を快くシェアしてきたよ。

顧客がシェアした画像が増える中で、特に役立つ画像をリストのトップに表示することも大切になってきた。これは顧客のオンラインショッピングに大きな影響を与えるかもしれない。このディスカッションでは、画像の質に基づいて顧客の画像をランク付けする方法を紹介するよ。

最初に、有名なインドのファッションEC企業から画像のコレクションを作った。プロのスタジオ画像や、顧客からたくさんのエンゲージメント(いいねや嫌い)があった画像が含まれてる。質の低い画像を改善するために、画像を歪めて質の悪い画像に似せる技術を使った。目標は、質の低い画像を質の高い画像の下にランク付けするシステムをトレーニングすることだった。この方法は、2つの重要な指標に基づいて既存モデルよりも良い結果を示したよ。

オンライン購入の数は特に最近数年で大幅に増加している。例えば、2021年にはインドで約1億9000万人がオンラインショッピングをしていて、2019年の1億3500万人から増えた。この成長は主に、拡大するEC業界とCOVID-19パンデミックによる消費者行動の変化によるもの。今後もこのトレンドが続くと予想されている。

商品の正確な画像を取得することはオンラインショッピングにとって重要だよ。例えば、ファッション会社が提供する画像は理想的な照明条件の下で撮影されている。しかし、ユーザーはしばしばブランドによって撮影された画像よりも他の顧客がシェアした画像を信頼する。会社では、ユーザーが自分の画像をレビューと一緒にシェアすることができるんだけど、残念ながら、そういった画像の中には許可基準を満たしていないものもある。例えば、照明が悪い写真や、変なアングルで撮られたもの、商品がうまく見えないように切り取られたものがある。これに対処するために、私たちはより良いユーザーがシェアした画像と悪いものを区別できるモデルを提案する。このことで、顧客は質の高い画像を簡単に見ることができるようになる。

でも、どうやって画像が良いか悪いかを知るの?一つの方法はユーザーに画像を評価してもらうことだけど、これだと体験が複雑になるかも。もっと簡単なのは、ユーザーが各画像を見ている時間をモニタリングすること。長く見られれば見られるほど、その画像が魅力的である可能性が高いってこと。でも、これを追跡するために現在のシステムを改善する必要がある。

別の選択肢は、いいね数と総評価数の比率に基づいて画像をソートすることだけど、新しいレビューやあまり見られていない商品があるときは難しい。私たちのケースでは、画像付きの多くのレビューに投票がないため、その画像の質を測るのが難しい。他にもこの問題を扱う方法があるけど、それも既存のセットアップに変更が必要。

私たちのモデルは、どちらの画像が良いかを学ぶために画像のペアを使ってる。一般的にプロが撮影した画像の方がユーザーがシェアしたものより良いだろうと仮定してる。また、ユーザーはレビューを読むときに画像に注目すると思ってる。

主な貢献

私たちは、手動でタグ付けすることなくファッションオンラインショッピングで画像の質を評価するために、事前にトレーニングされたモデルを使った学習アプローチを紹介する。私たちの知る限り、ファッションにおけるユーザー生成コンテンツ画像のランク付けは初めての試み。

関連文献

最近の画像質評価の方法は、一般的に単一の質スコアを予測するか、画像を分類することに焦点を当ててきた。多くの研究が特定のデータセットを使用して精度を測定している。いくつかの研究者はこの問題をバイナリーとして見ていて、質スコアに基づいて画像を良いか悪いかで分類する。彼らは確立されたモデルを微調整して結果を報告する。他の研究者たちは、美的スコアの分布を予測する戦略を提案していて、新しい方法と同じような結果を出している。

関連するタスクとして、何の参照もなく画像の質を評価することがある。このアプローチは、画像を適切にスコア付けするためにラベル付きデータに依存している。しかし、このタスクはしばしば多くのラベル付きデータセットを必要とし、それが集めるのは難しい。

この問題に対処するために、一部の研究者は高品質の画像を変更して低品質のものをシミュレートする合成データを作成している。そうすることで、彼らはモデルをより簡単にトレーニングできる。私たちはこのアプローチに触発されて、顧客からよく見られる低品質の画像のタイプを再現するためにさまざまな画像操作技術を使用した。

データ収集

私たちのプロジェクトでは、ファッション会社から大量の高品質画像を集めて、たくさんのエンゲージメントを得たユーザーがシェアした画像と混ぜた。次に、これらの画像を歪める技術を使用して、商品レビューにしばしば見られる低品質のものに似せた。

収集した画像を、製品を着ている人の画像と製品単体の画像の2つのカテゴリに分けた。この区別はアパレルにとって重要で、服を着ている人の画像の方が一般的に役立つ傾向がある。

画像ペアを作成する際には、質に基づいて構成されていることを確認し、良い画像と悪い画像の明確な区別をつけた。各ペアは、モデルにどの画像を高くランク付けするべきかを教えることを目的としている。

ニューラルネットワークアーキテクチャ

テストのために、画像質評価向けに設計されたネットワークアーキテクチャを使用した。このモデルは画像を入力として受け取り、さまざまな質に基づいてスコアを生成する。画像の高さや幅などの特徴を追加して、モデルが画像のサイズや比率を正しく理解できるようにした。

画像ペアを評価する際、一方の画像がもう一方より良ければ、ネットワークからより高いスコアを受けるはずだ。実験中に、モデルを効果的にトレーニングする方法を確立し、性能を最適化するために重みや学習率を調整した。

実装詳細

私たちは作成した画像ペアを使ってモデルをトレーニングした。データセットにはさまざまなソースから集めた数千の画像が含まれていて、正確な結果を確保するためにいくつかを検証用に確保した。フィーチャー抽出のために事前にトレーニングされたモデルを使用しながら、自分たちの処理を別のアーキテクチャで実行した。

私たちは、既存のモデルと結果を比較して、より良いスコアを達成し、画像を質に基づいて確実にランク付けできることを確認した。

結論と今後の課題

このディスカッションは、既存のディープラーニングモデルを活用してファッション関連の画像の質を評価する効果的な方法を強調している。私たちのアプローチが、より良い画像の質を系統的に低下させて質の悪いものと一致させることによって、伝統的なモデルよりも優れていることを示した。

今後は、私たちのアプローチを拡張することでさらなる利点が得られるかもしれない。私たちは、商品ページの機能を向上させ、顧客がシェアする画像の質についてのフィードバックを改善することを目指している。これによって、よりユーザーフレンドリーな体験が生まれ、買い物客がより良い選択をする手助けができるだろう。

オリジナルソース

タイトル: Product Review Image Ranking for Fashion E-commerce

概要: In a fashion e-commerce platform where customers can't physically examine the products on their own, being able to see other customers' text and image reviews of the product is critical while making purchase decisions. Given the high reliance on these reviews, over the years we have observed customers proactively sharing their reviews. With an increase in the coverage of User Generated Content (UGC), there has been a corresponding increase in the number of customer images. It is thus imperative to display the most relevant images on top as it may influence users' online shopping choices and behavior. In this paper, we propose a simple yet effective training procedure for ranking customer images. We created a dataset consisting of Myntra (A Major Indian Fashion e-commerce company) studio posts and highly engaged (upvotes/downvotes) UGC images as our starting point and used selected distortion techniques on the images of the above dataset to bring their quality at par with those of bad UGC images. We train our network to rank bad-quality images lower than high-quality ones. Our proposed method outperforms the baseline models on two metrics, namely correlation coefficient, and accuracy, by substantial margins.

著者: Sangeet Jaiswal, Dhruv Patel, Sreekanth Vempati, Konduru Saiswaroop

最終更新: 2023-08-10 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2308.05390

ソースPDF: https://arxiv.org/pdf/2308.05390

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事