Apprendre les règles de vote grâce aux approches basées sur les données
De nouvelles méthodes améliorent la prise de décision en groupe en utilisant des modèles probabilistes.
Leonardo Matone, Ben Abramowitz, Nicholas Mattei, Avinash Balakrishnan
― 14 min lire
Table des matières
- Comprendre les Mécanismes de Prise de Décision
- À Quoi Ressemble le Vote
- La Relation Entre Agents et Préférences
- Nos Fonctions de Choix Social Probabilistes
- Apprendre des Fonctions de Choix Social Probabilistes
- Traiter le Paradoxe de la Non-Participation
- Aperçus et Directions Futures
- Source originale
- Liens de référence
Quand des groupes de personnes doivent prendre une décision ensemble, ils font souvent face au défi de combiner différentes préférences individuelles en un choix collectif. C'est un processus compliqué dans des domaines comme l'informatique, où développer des systèmes pour des trucs comme des recommandations, des jeux, etc., est super important.
Les chercheurs se penchent sur la manière de prendre ces décisions collectives depuis un bon moment, surtout à travers le prisme de la théorie du choix social. Cette théorie explore les meilleures façons de créer des algorithmes qui peuvent collecter et traiter les préférences individuelles selon certaines normes, appelées axiomes. Cependant, créer ces algorithmes peut être très difficile, et parfois, c'est même prouvé que c'est impossible.
Au lieu de programmer ces algorithmes étape par étape, il y a une nouvelle approche : apprendre à prendre des décisions à partir de données existantes. Cette méthode se concentre principalement sur les Règles de vote, qui sont un moyen populaire pour les groupes d'arriver à des décisions. Cependant, les tentatives passées dans ce domaine ont rencontré des problèmes comme le besoin de modèles énormes ou d'être limités dans les manières de représenter les préférences individuelles.
On propose une méthode qui voit la création d'une bonne règle de vote comme un apprentissage à partir d'exemples, en utilisant spécifiquement des modèles probabilistes. Ces modèles aident à proposer une gamme de choix possibles plutôt qu'un seul gagnant. Le secret de notre méthode est d'utiliser des réseaux neuronaux, un type de programme informatique qui imite le fonctionnement de notre cerveau, pour apprendre ce qu'on appelle des fonctions de choix social probabilistes.
Notre recherche démontre qu'utiliser des représentations personnalisées des préférences des électeurs nous aide à apprendre les règles de vote existantes plus efficacement. C'est particulièrement vrai lorsque la représentation s'aligne avec les objectifs d'apprentissage spécifiques. En plus, on a découvert que ces règles apprises peuvent être ajustées pour créer de nouvelles règles de vote qui ont de meilleures propriétés selon les axiomes établis. Dans une de nos découvertes, on montre que modifier les règles de vote actuelles peut aider à régler des problèmes comme le paradoxe de la non-participation, où un électeur peut obtenir un résultat plus favorable en ne votant pas du tout.
Comprendre les Mécanismes de Prise de Décision
Dans la Prise de Décision Collective, les individus expriment leurs préférences pour diverses options, et un système est nécessaire pour combiner tout ça en un seul résultat. La conception de ces systèmes est un sujet principal dans des domaines comme le choix social computationnel et la théorie des jeux algorithmiques. L'objectif est de créer des mécanismes qui non seulement fonctionnent bien, mais qui respectent aussi certains principes ou axiomes.
Une découverte importante dans ce domaine est le théorème d'impossibilité générale d'Arrow. Ce théorème explique qu'il est impossible pour un processus de prise de décision de satisfaire tous les axiomes souhaités en même temps. Depuis le travail d'Arrow, les chercheurs ont identifié quels axiomes divers mécanismes peuvent satisfaire, ainsi que quelles combinaisons conduisent à l'impossibilité. En plus, ces études se penchent sur les aspects algorithmiques, où ils analysent à quel point ces processus peuvent être réalisés efficacement.
Trouver des règles de vote qui répondent à des axiomes spécifiques peut être un véritable casse-tête, surtout quand on sait pas s'il existe même une telle règle. Récemment, il y a eu un tournant vers l'utilisation de méthodes d'apprentissage automatique pour créer de nouveaux mécanismes qui correspondent aux critères. Cette philosophie a touché plusieurs domaines, y compris les enchères et les systèmes de vote.
Pourtant, les premières tentatives d'utiliser l'apprentissage automatique pour les règles de vote ont rencontré des barrières importantes. Les obstacles comprenaient le besoin de réseaux neuronaux grands et complexes, la disponibilité limitée des données, et l'incapacité à prendre pleinement en compte les implications des décisions de conception.
Notre approche cherche à améliorer l'apprentissage des règles de vote existantes et nouvelles en utilisant des représentations bien pensées tirées de la littérature sur le choix social. Ces représentations simplifient le processus d'apprentissage, permettant moins de paramètres et une meilleure évolutivité lors du travail avec de grands groupes. Notre méthode réduit la taille d'entrée pour le réseau neuronal, ce qui diminue significativement le nombre de paramètres nécessaires. Des travaux passés ont constaté que leurs conceptions de réseaux neuronaux étaient restreintes par une taille d'entrée fixe, ce qui les a poussés à créer des architectures plus complexes pour s'adapter et à ajouter des éléments pour des profils plus petits. En revanche, nos représentations permettent à la taille de la couche d'entrée de rester flexible, ce qui facilite la généralisation à mesure que le nombre d'électeurs change.
En accord avec des études antérieures, on reconnaît que les mécanismes de prise de décision peuvent être évalués en considérant quelles informations ils utilisent ou négligent des profils de préférences. Une des grandes contributions de notre étude est d'améliorer la prise de conscience de la manière dont le choix de la représentation est lié à l'efficacité avec laquelle ces systèmes apprennent et fonctionnent. Nos expériences ont soulevé de nouvelles questions théoriques sur combien d'informations sont conservées par ces représentations et leur effet sur l'apprentissage des règles.
À Quoi Ressemble le Vote
Quand beaucoup de gens pensent au vote, ils imaginent souvent des règles traditionnelles qui prennent les préférences d'un petit groupe et produisent un seul gagnant. En réalité, le monde du choix social est bien plus vaste, comprenant des mécanismes qui peuvent gérer divers types d'entrées et de sorties de données. Par exemple, les électeurs peuvent donner des notes d'approbation, classer des candidats, ou attribuer des poids à leurs choix. Les résultats peuvent inclure un seul gagnant, un ensemble de gagnants, ou une liste ordonnée de candidats, parmi d'autres choix.
On s'intéresse particulièrement aux fonctions de choix social probabilistes (FCSP), qui prennent un ensemble de préférences et fournissent une distribution de probabilité sur les candidats. Les FCSP ont plusieurs avantages quand il s'agit d'apprendre des règles de vote avec des réseaux neuronaux comparé aux règles traditionnelles à gagnant unique. En produisant une distribution, on élimine les complications que les départages introduisent. Le départage aléatoire n'est pas quelque chose qui peut être appris efficacement non plus.
Notre première tâche est de montrer comment les règles établies peuvent être apprises efficacement grâce à ces représentations. Après ça, on s'attaque au défi de peaufiner les règles existantes pour améliorer leurs propriétés basées sur les axiomes établis. On se concentre spécifiquement sur le paradoxe de la non-participation, qui se produit quand un électeur peut obtenir un meilleur résultat en ne votant pas.
Certaines règles traditionnelles comme la pluralité, Borda, et Simpson-Kramer sont connues pour respecter l'axiome de participation, ce qui signifie qu'aucun électeur ne peut bénéficier de l'abstention, évitant ainsi le paradoxe. Cependant, beaucoup d'autres règles de vote courantes tombent dans ce piège. Dans nos expériences, on prend des modèles formés sur des FCSP existantes et les ajuste en utilisant une fonction de perte qui intègre une version assouplie de l'axiome de participation, montrant comment les règles peuvent être modifiées pour réduire leur vulnérabilité au paradoxe sans perdre en précision.
L'axiome de participation est appelé un axiome inter-profils puisqu'il nécessite de considérer ce qui aurait pu se passer si les électeurs avaient agi différemment. Ce type d'axiome est particulièrement difficile à apprendre car il augmente la complexité computationnelle du calcul des fonctions de perte. Il faut aussi que le modèle gère des profils de tailles variées, ce que nos représentations facilitent.
La Relation Entre Agents et Préférences
Dans notre scénario de recherche, on définit un groupe d'électeurs et un ensemble de candidats. Chaque électeur fournit un classement strict de tous les candidats, représentant leur préférence. Ce classement crée un profil, qui est simplement la collection de tous les bulletins de vote des électeurs.
Le nombre de classements possibles est immense, résultant en de nombreux profils différents. Le défi réside dans la création d'une fonction connue sous le nom de fonction de choix social probabiliste (FCSP) qui prend un profil et renvoie une loterie (une distribution de probabilité) sur les candidats. Chaque FCSP peut être utilisée pour établir une règle de vote non déterministe en sélectionnant aléatoirement un gagnant à partir de la loterie donnée.
Une FCSP déterministe choisira toujours le même candidat pour chaque profil. Dans un bon nombre de cas, les loteries que l'on examine produisent des résultats montrant des chances égales pour plusieurs candidats, ce qui mène à des résultats plus complexes que de simplement choisir un gagnant.
Pour les réseaux neuronaux qui apprennent des règles basées sur le profil complet, le besoin d'une couche d'entrée de taille fixe complique les choses. À mesure que le nombre d'électeurs augmente, la taille d'entrée augmente aussi, ce qui peut freiner l'évolutivité. Si le nombre d'électeurs diminue, il faut des ajustements soigneux pour maintenir l'intégrité du modèle. Pour surmonter ce défi, on crée des représentations qui conservent des informations pertinentes tout en gardant une taille fixe, permettant une flexibilité sur le nombre d'électeurs pouvant être inclus dans les données d'entrée. Chaque type de représentation conserve différentes quantités d'informations du profil original, influençant à quel point le réseau peut apprendre diverses règles.
Nos trois représentations s'inspirent de la littérature sur les mécanismes de vote, bien qu'elles ne soient pas largement reconnues dans la communauté de l'apprentissage automatique. Chaque représentation découle d'un profil de bulletin, mais varie en quantité d'informations qu'elles préservent.
Nos Fonctions de Choix Social Probabilistes
On a plusieurs types de FCSP que l'on explore. Par exemple, on a des règles de pointage comme Borda et la pluralité. Le résultat de ces règles de pointage peut être calculé directement à partir des profils. Le score Borda pour un candidat est déterminé en totalisant les votes des profils, tandis que le score de pluralité choisit simplement le candidat classé le plus haut par le plus grand nombre d'électeurs.
D'autres méthodes, comme Copeland et Simpson-Kramer, sont généralement classées comme règles de tournoi puisque leur résultat peut être dérivé de leurs matrices de comparaisons de préférence respectives.
Dans notre analyse, on porte une attention particulière à la préservation des FCSP par diverses représentations. Une représentation est considérée comme préservant une FCSP si elle maintient assez d'informations pour que la fonction reste intacte lorsqu'elle est vue à travers le prisme de la représentation.
Certaines représentations, comme celles qui trient les ordres de préférence, préservent toutes les informations nécessaires pour certaines fonctions. D'autres peuvent manquer de la complétude requise, ce qui souligne l'importance de choisir la bonne représentation pour diverses règles.
Apprendre des Fonctions de Choix Social Probabilistes
Dans nos expériences, on montre qu'avec de bonnes représentations, on peut apprendre des FCSP qui reflètent des règles de vote couramment utilisées sans avoir besoin de conceptions de réseaux neuronaux trop complexes. On a formé et testé différentes paires de règles et de représentations pour comparer leurs performances de près, illustrant à quel point le choix de la représentation est crucial pour un apprentissage efficace.
On a formé nos FCSP en utilisant des profils générés de manière aléatoire, assurant un ensemble divers de combinaisons de préférences. Les embeddings qu'on a utilisés ont offert plusieurs avantages, notamment en réduisant la taille de la couche d'entrée dans nos réseaux neuronaux. Cette caractéristique unique nous a permis d'utiliser la même architecture pour toutes les sessions d'entraînement.
On a utilisé une structure spécifique à plusieurs couches pour nos réseaux, incorporant des fonctions d'activation modernes pour produire des sorties efficaces. Nos expériences ont montré que lorsque les règles sont assorties à des représentations adaptées, l'apprentissage de ces règles se produit plus rapidement et plus précisément.
Par exemple, des règles comme la pluralité et Borda ont montré des rythmes d'apprentissage rapides, convergeant vite vers de faibles taux d'erreurs. Cependant, on a aussi noté que certaines représentations fonctionnaient mieux pour des règles spécifiques tout en peinant avec d'autres.
Quand on a élargi nos modèles pour gérer différents nombres d'électeurs, la performance variait. Bien qu'il y ait pu y avoir une légère baisse de précision avec des groupes plus grands, la plupart des règles ont maintenu des taux d'erreur relativement bas à travers différentes représentations. Cette flexibilité d'ajuster à différents nombres d'électeurs sans modifier la taille de la couche d'entrée était une caractéristique bénéfique de nos représentations.
Traiter le Paradoxe de la Non-Participation
Le paradoxe de la non-participation pose un défi à de nombreuses règles de vote. Ce paradoxe se produit quand un électeur bénéficie de s'abstenir au lieu de voter. On a traité ce problème en réentraînant nos modèles pour se concentrer sur la minimisation des effets de ce paradoxe tout en maintenant l'exactitude.
Dans nos tests, on a examiné comment différentes FCSP se comportaient face au paradoxe de la non-participation. Les résultats ont révélé que certaines règles à gagnant unique comme Borda et pluralité évitaient ce paradoxe entièrement, tandis que d'autres rencontraient des difficultés.
Notre réentraînement impliquait d'ajouter un terme au processus d'apprentissage qui visait spécifiquement à surmonter le paradoxe de la non-participation. Cette méthode a fourni des aperçus sur l'efficacité de chaque règle de vote à résister à un comportement stratégique potentiel des électeurs.
À travers notre analyse, on a compilé des résultats fascinants. Bien que certaines règles satisfassent naturellement l'axiome de participation, les modèles appris de ces règles ont montré des pertes de participation similaires à d'autres qui sont plus susceptibles au paradoxe. Les niveaux de pertes de participation indiquaient que l'apprentissage des règles nécessite une compréhension de comment minimiser les incitations des électeurs à s'abstenir.
Utiliser moins d'électeurs pour le réentraînement était un choix stratégique qui a aussi permis un calcul plus efficace. Étant donné la complexité d'évaluer les pertes basées sur de potentielles alternatives, cet ajustement a amélioré notre capacité à analyser à quel point nos FCSP pouvaient s'adapter à l'axiome de participation.
Aperçus et Directions Futures
En résumé, on a montré qu'il est possible d'apprendre efficacement des fonctions de choix social probabilistes connues tout en les améliorant d'une manière que les méthodes de conception traditionnelles n'ont pas accomplies. Notre attention sur les bonnes représentations des préférences des électeurs nous a aidés à obtenir des résultats efficaces dans l'apprentissage et la conception de nouvelles règles.
Comme prochaine étape, on vise à explorer si d'autres représentations peuvent être créées qui surpassent celles que nous avons déjà dérivées de la littérature sur le choix social. Cette exploration pourrait apporter de nouvelles perspectives, surtout pour des règles qui peuvent être difficiles ou coûteuses en calcul à analyser de manière traditionnelle.
Globalement, notre travail ouvre la voie à des recherches continues qui combinent l'apprentissage automatique avec des principes de choix social établis, avec le potentiel de raffiner les mécanismes par lesquels les décisions sont prises dans divers contextes de groupe.
Titre: DeepVoting: Learning Voting Rules with Tailored Embeddings
Résumé: Aggregating the preferences of multiple agents into a collective decision is a common step in many important problems across areas of computer science including information retrieval, reinforcement learning, and recommender systems. As Social Choice Theory has shown, the problem of designing algorithms for aggregation rules with specific properties (axioms) can be difficult, or provably impossible in some cases. Instead of designing algorithms by hand, one can learn aggregation rules, particularly voting rules, from data. However, the prior work in this area has required extremely large models, or been limited by the choice of preference representation, i.e., embedding. We recast the problem of designing a good voting rule into one of learning probabilistic versions of voting rules that output distributions over a set of candidates. Specifically, we use neural networks to learn probabilistic social choice functions from the literature. We show that embeddings of preference profiles derived from the social choice literature allows us to learn existing voting rules more efficiently and scale to larger populations of voters more easily than other work if the embedding is tailored to the learning objective. Moreover, we show that rules learned using embeddings can be tweaked to create novel voting rules with improved axiomatic properties. Namely, we show that existing voting rules require only minor modification to combat a probabilistic version of the No Show Paradox.
Auteurs: Leonardo Matone, Ben Abramowitz, Nicholas Mattei, Avinash Balakrishnan
Dernière mise à jour: 2024-08-24 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2408.13630
Source PDF: https://arxiv.org/pdf/2408.13630
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.