Simple Science

La science de pointe expliquée simplement

# Informatique# Recherche d'informations# Ordinateurs et société# Apprentissage automatique

Révolutionner les recommandations de livres dans les bibliothèques

Présentation d'une appli innovante pour des suggestions de livres personnalisées dans les bibliothèques publiques.

― 9 min lire


Suggestions de livresSuggestions de livressympas pour lesbibliothèquespubliques.personnalisées dans les bibliothèquesViser des expériences de lecture
Table des matières

Ces dernières années, la technologie, surtout celle de l’information et de la communication (TIC), a rendu plus facile la collecte et l’analyse d’un max de données sur ce que les utilisateurs aiment et comment ils se comportent. Ça a aidé à créer des services et des applis qui peuvent mieux répondre aux besoins des utilisateurs dans plusieurs domaines, y compris la santé, les achats, l'agriculture et l'industrie. L'éducation a aussi profité de ces avancées. Avec les nouveaux outils offerts par la technologie, on peut améliorer les services éducatifs et rendre l'apprentissage plus personnalisé pour les étudiants.

Les bibliothèques jouent un rôle important dans l'éducation et la culture. Elles doivent s’adapter au monde numérique en constante évolution tout en continuant à fournir les services essentiels d'éducation, d'égalité et de transparence. Un projet qui vise à faire ça est le projet Reading Machine, qui se concentre sur la recommandation de livres dans les bibliothèques publiques.

Le projet Reading Machine

Le projet Reading Machine consiste à créer une appli qui suggère des livres aux lecteurs en fonction de leurs intérêts. Cette appli sera disponible dans les bibliothèques publiques de Turin, en Italie, et utilisera une interface de réalité virtuelle pour aider les utilisateurs à trouver des livres qui pourraient leur plaire. Le projet est encore au début, et on analyse actuellement divers ensembles de données pour concevoir et évaluer différents Systèmes de recommandation.

Pour développer cette appli, on utilise deux principales sources de données. Le premier ensemble de données provient des bibliothèques publiques de Turin, couvrant les emprunts de livres des neuf dernières années. Le deuxième ensemble vient d'Anobii, un réseau social où les gens discutent et partagent leurs expériences de lecture. Ce réseau compte plus d'un million d’utilisateurs, qui partagent tous leurs avis sur les livres qu’ils lisent.

Avec ces données, on construit deux types de systèmes de recommandation : l’un basé sur les caractéristiques des livres (Basé sur le contenu) et l’autre basé sur le comportement des utilisateurs (Filtrage Collaboratif). Nos évaluations montrent que l'approche de filtrage collaboratif a tendance à mieux fonctionner dans notre cas. En utilisant les données d'Anobii, on peut inclure plus d'utilisateurs et enrichir les détails disponibles pour les livres.

Travaux connexes

Les systèmes de recommandation ont une large gamme d’utilisations dans la vie quotidienne. Ils s'appuient sur les retours des utilisateurs pour comprendre leurs préférences. Ces retours peuvent être collectés directement, comme à travers des notations, ou indirectement, en observant les actions des utilisateurs. Il existe deux principaux types de systèmes de recommandation : les systèmes basés sur le contenu et les systèmes de filtrage collaboratif.

Les systèmes basés sur le contenu regardent les caractéristiques des objets que les utilisateurs aiment. Par exemple, si un utilisateur aime les livres d’un certain auteur, le système recommandera d’autres livres de cet auteur ou avec des thèmes similaires. Les systèmes de filtrage collaboratif, en revanche, font des suggestions basées sur les préférences d’utilisateurs similaires. Ces systèmes ont été utilisés pour divers objectifs, y compris recommander des séries TV ou des options de voyage.

Malgré leur succès dans d'autres domaines, les systèmes de recommandation pour les livres dans les bibliothèques ne sont pas aussi courants. Ça pourrait être dû aux défis pour obtenir des données précises et étendues sur les habitudes de lecture des utilisateurs. Un exemple de système de recommandation dans un cadre de bibliothèque se concentre sur les étudiants des collèges et universités, utilisant leurs choix de cours pour fournir des suggestions de livres. Notre projet diffère car il se concentre sur les bibliothèques publiques générales, en utilisant plusieurs approches pour les recommandations.

En Finlande, par exemple, la Bibliothèque centrale d'Helsinki Oodi a introduit un bot alimenté par l'intelligence artificielle appelé Obotti, qui suggère des livres aux utilisateurs en fonction de leurs préférences de lecture. Alors qu'Obotti s'appuie sur des chats pour recueillir les intérêts des utilisateurs, notre projet améliore les données des bibliothèques avec des informations d'un réseau social, permettant une comparaison de divers systèmes de recommandation.

Ensembles de données et leur importance

Pour ce projet, on utilise des données des Biblioteche Civiche di Torino (Bct), un réseau de 49 bibliothèques publiques à Turin. Ces bibliothèques donnent accès à une large gamme de livres via un système de prêt.

L'ensemble de données BCT comprend deux tableaux principaux : un pour les livres et un autre pour les prêts. Le tableau des livres contient des détails comme l'identifiant unique du livre, l'auteur, le titre, le type et la langue. Le tableau des prêts suit les détails de chaque prêt, y compris un ID utilisateur anonymisé et la date du prêt.

En plus de BCT, on utilise des données provenant d'Anobii. Cette plateforme permet aux utilisateurs de créer des bibliothèques virtuelles, de partager des avis et de noter les livres qu'ils lisent. L'ensemble de données d'Anobii fournit des informations précieuses, notamment des descriptions de livres, des genres et des évaluations de lecteurs.

En fusionnant les ensembles de données BCT et Anobii, on crée un ensemble de données complet qui intègre les forces des deux sources. Cette combinaison nous permet d’enrichir les métadonnées des livres et inclut une plus large gamme d’utilisateurs, ce qui est particulièrement bénéfique pour nos systèmes de recommandation.

Conception de systèmes de recommandation

Lors de l'élaboration d'un système de recommandation, le type de retours reçus des utilisateurs joue un rôle crucial. Dans les bibliothèques, les utilisateurs ne notent généralement pas les livres qu'ils lisent. Au lieu de cela, on suppose que si un utilisateur a emprunté un livre, il l’a apprécié d'une certaine manière. Bien que cette hypothèse ne soit pas toujours vraie, elle sert de base pour nos recommandations.

Le système de recommandation génère une liste classée de livres pour chaque utilisateur en fonction de son historique de lecture. Cette liste vise à suggérer les livres que l'utilisateur est le plus susceptible d'apprécier. Le nombre de livres recommandés est soigneusement choisi pour équilibrer qualité et surcharge d'options pour l'utilisateur.

On explore différentes méthodes pour créer des recommandations, y compris :

  1. Recommandations aléatoires : Cette approche de base sélectionne aléatoirement des livres que l'utilisateur n'a pas encore lus.
  2. Recommandations les plus lues : Cette méthode recommande les livres les plus populaires chez tous les utilisateurs, sans tenir compte des préférences individuelles.
  3. Objets les plus proches : Cette méthode basée sur le contenu trouve des livres similaires à ceux qu'un utilisateur a déjà lus.
  4. Classement personnalisé bayésien (BPR) : Cette approche de filtrage collaboratif ajuste les recommandations en fonction des interactions des utilisateurs avec les livres.

Indicateurs de performance clés

Pour évaluer la performance de nos systèmes de recommandation, on mesure plusieurs indicateurs. Ces indicateurs nous aident à comprendre à quel point les systèmes sont efficaces pour suggérer des livres pertinents aux utilisateurs. Certains indicateurs de performance clés incluent :

  • Nombre d'utilisateurs avec des recommandations pertinentes : Cela indique quel pourcentage d'utilisateurs reçoit au moins une recommandation utile.
  • Moyenne du nombre de recommandations pertinentes par utilisateur : Cela mesure combien de livres recommandés un utilisateur trouve utiles.
  • Précision : Cet indicateur calcule le pourcentage de livres recommandés qui figurent également dans l'historique de lecture de l'utilisateur.
  • Rappel : Cela mesure l’efficacité du système à suggérer des livres de la liste de lecture de l'utilisateur.
  • Position du premier rang moyen : Cela indique la position de la première recommandation pertinente, avec des nombres plus bas étant meilleurs.

Résultats et insights

En évaluant les différents systèmes de recommandation, on a découvert que la méthode de filtrage collaboratif donnait de meilleurs résultats par rapport aux systèmes basés sur le contenu. L'utilisation des données d'Anobii a considérablement amélioré la qualité de nos recommandations.

Globalement, les recommandations non personnalisées ont mal performé par rapport aux approches personnalisées. Le modèle BPR, en particulier, a produit les meilleurs résultats, montrant qu’utiliser les données utilisateur des deux BCT et Anobii crée un système de recommandation plus efficace.

On a aussi analysé l'impact de différents facteurs sur la performance des systèmes, comme le nombre de livres lus par les utilisateurs et le type de métadonnées utilisées pour faire des recommandations. Nos résultats indiquent que les utilisateurs qui lisent un plus grand nombre de livres tendent à recevoir de meilleures recommandations.

Dans notre analyse des métadonnées, on a découvert que combiner les auteurs de livres et les genres dans le résumé des données a donné les meilleurs résultats pour notre méthode des objets les plus proches, soulignant l'importance d'utiliser des sources d'information diverses dans les systèmes de recommandation.

Conclusion

Le projet Reading Machine vise à améliorer l'expérience des utilisateurs de bibliothèques publiques en fournissant des recommandations de livres personnalisées. En combinant les données d'emprunt des bibliothèques avec les retours des utilisateurs d'un réseau social, on développe des systèmes qui peuvent considérablement améliorer la façon dont les lecteurs trouvent des livres qui pourraient leur plaire.

Alors qu'on continue à affiner et à optimiser les systèmes de recommandation, on vise à explorer comment recommander des titres plus diversifiés que les utilisateurs n’auraient peut-être pas envisagés mais qu'ils pourraient apprécier. À l'avenir, il serait aussi bénéfique d'incorporer les séquences de lecture des utilisateurs, permettant encore plus de recommandations sur mesure.

À travers une recherche et un développement continus, on espère rendre les bibliothèques publiques encore plus engageantes et pertinentes pour les communautés qu'elles desservent, encourageant plus de gens à découvrir les joies de la lecture.

Source originale

Titre: Recommendation Systems in Libraries: an Application with Heterogeneous Data Sources

Résumé: The Reading&Machine project exploits the support of digitalization to increase the attractiveness of libraries and improve the users' experience. The project implements an application that helps the users in their decision-making process, providing recommendation system (RecSys)-generated lists of books the users might be interested in, and showing them through an interactive Virtual Reality (VR)-based Graphical User Interface (GUI). In this paper, we focus on the design and testing of the recommendation system, employing data about all users' loans over the past 9 years from the network of libraries located in Turin, Italy. In addition, we use data collected by the Anobii online social community of readers, who share their feedback and additional information about books they read. Armed with this heterogeneous data, we build and evaluate Content Based (CB) and Collaborative Filtering (CF) approaches. Our results show that the CF outperforms the CB approach, improving by up to 47\% the relevant recommendations provided to a reader. However, the performance of the CB approach is heavily dependent on the number of books the reader has already read, and it can work even better than CF for users with a large history. Finally, our evaluations highlight that the performances of both approaches are significantly improved if the system integrates and leverages the information from the Anobii dataset, which allows us to include more user readings (for CF) and richer book metadata (for CB).

Auteurs: Alessandro Speciale, Greta Vallero, Luca Vassio, Marco Mellia

Dernière mise à jour: 2023-03-21 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2303.11746

Source PDF: https://arxiv.org/pdf/2303.11746

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires