図書館の本の推薦を革命的に変える
公共図書館でパーソナライズされた本のおすすめを提案する革新的なアプリを紹介!
― 1 分で読む
最近、テクノロジー、特に情報通信技術(ICT)が、ユーザーの好みや行動についてのデータを集めたり分析したりするのが簡単になってきたんだ。これが、医療、ショッピング、農業、産業など、いろんな分野でユーザーのニーズに合ったサービスやアプリを作るのに役立ってる。教育もこの進歩の恩恵を受けてるよ。新しいテクノロジーのおかげで、教育サービスを向上させて、学生にもっとパーソナライズされた学習が提供できるようになったんだ。
図書館は教育と文化において重要な役割を果たしてる。デジタルの変化に適応しながら、教育、平等、透明性のための基本的なサービスを提供し続ける必要があるんだ。そんな中で、公共図書館での本の推薦を目的とした「リーディングマシンプロジェクト」というプロジェクトがあるんだ。
リーディングマシンプロジェクト
リーディングマシンプロジェクトは、読者の興味に基づいて本を提案するアプリを作ることが目的なんだ。このアプリはイタリアのトリノの公共図書館で使えるようになって、仮想現実のインターフェイスを使ってユーザーが楽しめる本を見つけるのを手助けするよ。プロジェクトはまだ初期段階で、現在はいろんなデータセットを分析して、いくつかの推薦システムを設計・評価しているところだよ。
このアプリを開発するために、二つの主要なデータソースを使っているんだ。一つ目のデータセットは、トリノの公共図書館からのもので、過去9年間の本の貸出データを含んでいる。二つ目は、Anobiiという、読書経験を共有するソーシャルネットワークからのデータで、ここには100万人以上のユーザーがいて、それぞれが読んだ本についての意見を共有しているんだ。
このデータを基に、二つのタイプの推薦システムを構築しているよ。一つは本の特性に基づく(コンテンツベース)、もう一つはユーザーの行動に基づく(コラボレーションフィルタリング)もの。この結果、私たちのケースではコラボレーションフィルタリングのアプローチがより良い結果を出す傾向があるってわかったんだ。Anobiiのデータを使うことで、もっと多くのユーザーを含められ、本の詳細も充実させることができるんだ。
関連する作品
推薦システムは日常生活で広く使われているよ。ユーザーのフィードバックに基づいて好みを理解するんだ。このフィードバックは、評価などで直接集めることもあれば、ユーザーの行動を観察して間接的に集めることもあるよ。推薦システムには大きく分けて、コンテンツベースとコラボレーションフィルタリングの2種類があるんだ。
コンテンツベースのシステムは、ユーザーが好きなアイテムの特性を見るんだ。例えば、あるユーザーが特定の著者の本が好きなら、その著者の他の本や似たテーマの本を推薦するんだ。逆に、コラボレーションフィルタリングシステムは、似たようなユーザーの好みに基づいて推薦を行うんだ。これらのシステムは、テレビ番組や旅行オプションの推薦など、さまざまな目的で使われているよ。
他の分野での成功にもかかわらず、図書館の本に対する推薦システムはあまり一般的じゃないんだ。これは、ユーザーの読書習慣について正確で広範なデータを取得するのが難しいからかもしれない。一例として、大学生向けの推薦システムがあって、学生の履修科目を使って本を推薦するものがあるけど、私たちのプロジェクトは一般の公共図書館を対象にしていて、異なるアプローチで推薦を行っているんだ。
フィンランドでは、ヘルシンキ中央図書館オーディが、読者の好みに基づいて本を提案するAI駆動のボット「オボッティ」を導入しているよ。オボッティはチャットを通じてユーザーの興味を集めているけど、私たちのプロジェクトはソーシャルネットワークからの情報と図書館データを組み合わせて、さまざまな推薦システムを比較できるようにしているんだ。
データセットとその重要性
このプロジェクトでは、トリノの公共図書館49館からなる「Biblioteche Civiche di Torino (Bct)」のデータを使用しているよ。この図書館は貸出システムを通じてさまざまな本にアクセスできるんだ。
BCTデータセットには、主に本と貸出の2つのテーブルがあるよ。本のテーブルには、ユニークな識別子、著者、タイトル、タイプ、言語といった詳細が含まれている。貸出のテーブルは、各貸出の詳細を追跡していて、匿名化されたユーザーIDや貸出日が記録されているよ。
BCTに加えて、Anobiiからのデータも利用しているんだ。このプラットフォームでは、ユーザーが仮想ライブラリを作成したり、意見を共有したり、読んだ本を評価したりできるんだ。Anobiiのデータセットは、本の説明、ジャンル、読者の評価など、貴重な情報を提供してくれるよ。
BCTとAnobiiのデータを統合することで、両方のソースの強みを活かした包括的なデータセットを作っているんだ。この組み合わせによって、本のメタデータを強化できて、より多くのユーザーを含めることができるから、推薦システムにとって特に便利なんだ。
推薦システムの設計
推薦システムを開発する際、ユーザーから得られるフィードバックの種類は重要な役割を果たすよ。図書館の設定では、ユーザーが読んだ本を評価することはあまりないから、ユーザーが本を借りたら、何らかの形でその本を気に入ったと仮定することにしているんだ。この仮定が常に正しいとは限らないけど、推薦の基準として使えるよ。
推薦システムは、各ユーザーの読書履歴に基づいて、本のランキングリストを生成するんだ。このリストは、ユーザーが最も楽しむ可能性が高い本を提案することを目指しているよ。推薦する本の数は、質と選択肢が多すぎることによるユーザーの負担のバランスを考慮して慎重に選ばれているんだ。
推薦を生成するためのさまざまな方法を探っているよ:
- ランダム推薦: この基本的なアプローチは、ユーザーがまだ読んでいない本をランダムに選ぶんだ。
- 最も読まれた推薦: この方法は、すべてのユーザーの中で最も人気のある本を推薦するよ。
- 最も近いアイテム: このコンテンツベースの方法は、ユーザーが過去に読んだ本に似た本を探すんだ。
- ベイズ個別ランキング (BPR): このコラボレーションフィルタリングのアプローチは、ユーザーが本とどのように関わっているかに基づいて推薦を調整するんだ。
主要パフォーマンス指標
推薦システムのパフォーマンスを評価するために、いくつかの指標を測定するよ。これらの指標は、システムがユーザーにとって関連性のある本を提案するのがどれほど上手くいっているかを理解するのに役立つんだ。主要なパフォーマンス指標には以下が含まれるよ:
- 関連する推薦を受けたユーザーの数: これにより、どのくらいの割合のユーザーが少なくとも一つの役立つ推薦を受け取っているかがわかるよ。
- ユーザーあたりの平均関連推薦数: これは、ユーザーがどれだけ役立つと感じる推薦された本の数を測るんだ。
- 精度: この指標は、推薦された本のうち、どれだけがユーザーの読書履歴にあるかの割合を計算するよ。
- 再現率: これは、システムがユーザーの読書リストからどれだけ効果的に本を提案できているかを測るんだ。
- 平均初回ランク位置: これは、最初の関連推薦の位置を示していて、数字が低いほど良いってことになるんだ。
結果とインサイト
さまざまな推薦システムを評価した結果、コラボレーションフィルタリングの方法がコンテンツベースのシステムよりも良い結果を出すことがわかったんだ。Anobiiのデータを使うことで、私たちの推薦の質が大幅に向上したよ。
全体として、非パーソナライズされた推薦は、パーソナライズされたアプローチと比較してパフォーマンスが悪かった。特にBPRモデルが最も良い結果を出していて、BCTとAnobiiのユーザーデータを使用することで、より効果的な推薦システムを生み出せたんだ。
また、本を読んだ数や推薦を行うために使用したメタデータの種類など、システムのパフォーマンスに対するさまざまな要因の影響も分析したよ。私たちの調査によると、たくさん本を読むユーザーは、より良い推薦を受け取る傾向があることがわかったんだ。
メタデータの分析では、本の著者とジャンルをデータサマリーに組み合わせることで、最も良い結果が得られることがわかって、推薦システムにおけるさまざまな情報源の使用が重要であることを再確認したよ。
結論
リーディングマシンプロジェクトは、公共図書館のユーザーにパーソナライズされた本の推薦を提供することで、彼らの体験を向上させることを目指しているんだ。図書館の貸出データとソーシャルネットワークからのユーザーフィードバックを組み合わせることで、読者が楽しめる本を見つける方法を大幅に改善できるシステムを開発しているんだ。
これからも推薦システムを洗練させ、最適化し続けて、ユーザーが考えもしなかったけれどきっと楽しめるような多様なタイトルを推薦できるように探求していきたいと思ってるよ。将来的には、ユーザーの読書の順序を取り入れることもできれば、さらに個別化された推薦ができるようになるだろうね。
進行中の研究と開発を通じて、公共図書館がコミュニティにとってさらに魅力的で関連性のある場所になるようにして、もっと多くの人が読書の喜びを発見することを奨励したいと思ってるよ。
タイトル: Recommendation Systems in Libraries: an Application with Heterogeneous Data Sources
概要: The Reading&Machine project exploits the support of digitalization to increase the attractiveness of libraries and improve the users' experience. The project implements an application that helps the users in their decision-making process, providing recommendation system (RecSys)-generated lists of books the users might be interested in, and showing them through an interactive Virtual Reality (VR)-based Graphical User Interface (GUI). In this paper, we focus on the design and testing of the recommendation system, employing data about all users' loans over the past 9 years from the network of libraries located in Turin, Italy. In addition, we use data collected by the Anobii online social community of readers, who share their feedback and additional information about books they read. Armed with this heterogeneous data, we build and evaluate Content Based (CB) and Collaborative Filtering (CF) approaches. Our results show that the CF outperforms the CB approach, improving by up to 47\% the relevant recommendations provided to a reader. However, the performance of the CB approach is heavily dependent on the number of books the reader has already read, and it can work even better than CF for users with a large history. Finally, our evaluations highlight that the performances of both approaches are significantly improved if the system integrates and leverages the information from the Anobii dataset, which allows us to include more user readings (for CF) and richer book metadata (for CB).
著者: Alessandro Speciale, Greta Vallero, Luca Vassio, Marco Mellia
最終更新: 2023-03-21 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2303.11746
ソースPDF: https://arxiv.org/pdf/2303.11746
ライセンス: https://creativecommons.org/licenses/by-nc-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。