Utiliser les réseaux sociaux pour étudier les insights sur la santé
Des recherches montrent comment les réseaux sociaux aident à comprendre les discussions sur l'épilepsie.
― 10 min lire
Table des matières
- Ce qu’on a fait
- Importance des Cohortes Numériques
- Médias Sociaux et Conditions Chroniques
- Le Défi de Trouver des Utilisateurs Pertinents
- Une Nouvelle Approche pour Filtrer les Utilisateurs
- Résultats de l'Étude
- La Valeur de la Méthode du Backbone
- Implications pour la Recherche
- Conclusion
- Source originale
- Liens de référence
Les réseaux sociaux sont devenus une ressource précieuse pour les chercheurs qui étudient les problèmes de santé. Leur énorme quantité de données peut aider à former de grands groupes de personnes, appelés cohortes numériques, qui peuvent donner des aperçus sur la façon dont le comportement humain interagit avec les traitements médicaux. Par contre, trouver les bons utilisateurs qui parlent de problèmes de santé spécifiques peut être compliqué. Ce défi se pose parce que les plateformes de médias sociaux varient en type de discussions qu'elles hébergent. Par exemple, des plateformes comme Twitter, Instagram et Facebook couvrent de nombreux sujets, tandis que des groupes sur Reddit et des forums spécialisés se concentrent davantage sur des problèmes de santé spécifiques.
Cet article parle d'une méthode pour identifier les utilisateurs pertinents sur les réseaux sociaux en utilisant une approche structurée. On a pris l'épilepsie comme étude de cas pour démontrer notre approche. L'épilepsie est une condition courante dont beaucoup de gens parlent en ligne. Pour trouver des informations utiles, on a recueilli des publications sur différentes plateformes de médias sociaux où les gens discutent de l'épilepsie et de ses traitements.
Ce qu’on a fait
On a commencé par rassembler des textes de publications sur différentes plateformes, y compris Twitter (maintenant appelé X), Instagram, Reddit (spécifiquement la communauté r/Epilepsy) et les forums de la Fondation Épilepsie. On a cherché des publications mentionnant des médicaments contre l'épilepsie pour comprendre ce dont les utilisateurs discutaient.
Ensuite, on a créé un dictionnaire de termes médicaux liés à l'épilepsie. Ce dictionnaire incluait des termes pour les médicaments, les symptômes et les conditions médicales. On a ensuite construit un graphique de connaissances (KG) pour chaque communauté en ligne. Un graphique de connaissances est une façon de visualiser les relations entre différents termes. Dans notre cas, les termes représentaient des concepts médicaux, et les liens entre eux montraient à quelle fréquence ils apparaissaient ensemble dans les publications des utilisateurs.
Pour rendre nos graphiques plus faciles à analyser, on a utilisé une technique appelée le backbone métrique. Cette méthode aide à identifier les connexions les plus importantes dans un réseau. En gros, ça nous aide à voir quelles associations entre les termes sont essentielles pour comprendre comment les gens parlent de leurs informations de santé.
En comparant les utilisateurs qui contribuent aux connexions les plus importantes dans notre graphique de connaissances à ceux qui ne le font pas, on a découvert que les utilisateurs parlant d'épilepsie sur des plateformes ciblées contribuaient beaucoup plus aux connexions essentielles que ceux venant de plateformes générales.
Importance des Cohortes Numériques
Les cohortes numériques créées à partir des données des réseaux sociaux offrent plusieurs avantages pour la recherche en santé. Elles peuvent capter des informations sur des résultats centrés sur les patients, comme la qualité de vie et la satisfaction face au traitement. Ces cohortes peuvent souvent inclure une population plus large que les cohortes cliniques, qui peuvent avoir des critères de sélection stricts. De plus, rassembler des données à partir des réseaux sociaux est généralement plus rapide et moins cher, car cela n'implique pas le même niveau de tests médicaux et de recrutement de participants que les essais cliniques.
Surveiller les Événements indésirables liés au traitement dans ces cohortes numériques peut révéler des préoccupations de sécurité avant qu'elles n'apparaissent dans des études traditionnelles. C'est parce que les réseaux sociaux permettent aux chercheurs de collecter des informations en temps réel directement des patients.
Médias Sociaux et Conditions Chroniques
Les réseaux sociaux sont particulièrement utiles pour étudier des conditions de santé chroniques comme l'épilepsie. Ils fournissent une richesse de données longitudinales, aidant à comprendre comment les individus gèrent leur condition au fil du temps. Les utilisateurs partagent leurs expériences, défis et résultats de traitement, ce qui peut fournir des aperçus précieux sur les besoins des patients et l'efficacité des différentes thérapies.
Malgré le potentiel des données des réseaux sociaux, l'épilepsie n'a pas reçu beaucoup d'attention dans la recherche par rapport à d'autres problèmes de santé. L'épilepsie affecte de nombreuses personnes dans le monde, et analyser les discussions à son sujet sur les réseaux sociaux peut améliorer notre compréhension de la façon dont les gens perçoivent leur maladie et accèdent au traitement.
Le Défi de Trouver des Utilisateurs Pertinents
Toutes les plateformes de médias sociaux ne sont pas également adaptées pour tirer des conclusions significatives sur les problèmes de santé. Des plateformes générales comme Twitter, Instagram et Facebook hébergent un mélange de sujets, rendant plus difficile de trouver des discussions pertinentes sur des conditions spécifiques. En revanche, des plateformes comme Reddit et les forums de la Fondation Épilepsie sont dédiées à discuter de l'épilepsie.
Pour créer une cohorte numérique pertinente à partir de plateformes générales, on doit filtrer les utilisateurs pour sélectionner ceux qui parlent de l'épilepsie de manière significative. Les études précédentes s'appuyaient souvent sur le fait de faire correspondre des mots-clés spécifiques dans les publications pour trouver des utilisateurs. Cependant, cette approche peut produire des résultats larges et bruyants, menant à de nombreuses publications non pertinentes, d'où la nécessité d'un processus de filtrage.
Une Nouvelle Approche pour Filtrer les Utilisateurs
Pour s'attaquer au défi d'identifier des utilisateurs pertinents, on a développé une nouvelle méthode de filtrage basée sur le graphique de connaissances et le backbone métrique. Notre approche se concentre sur les relations entre les termes dans notre dictionnaire médical soigneusement élaboré. En analysant comment les utilisateurs contribuent à ces relations, on peut identifier ceux qui sont plus susceptibles d'offrir des aperçus précieux sur l'épilepsie.
Création du Dictionnaire Médical
On a commencé par élaborer un dictionnaire médical, rassemblant des termes liés à l'épilepsie et à ses traitements. Ce dictionnaire incluait des médicaments, des symptômes et des produits naturels. On a veillé à inclure des synonymes et des variations de termes pour capturer une plus large gamme de discussions.
Collecte de Données à partir des Réseaux Sociaux
Ensuite, on a collecté des publications liées à l'épilepsie sur nos plateformes sélectionnées. On s'est concentré sur les utilisateurs qui mentionnaient des médicaments spécifiques contre l'épilepsie. Ce processus a généré un ensemble de données riche en contenu généré par les utilisateurs que l'on pouvait analyser plus en profondeur.
Construction des Graphiques de Connaissances
Après avoir rassemblé les données, on a construit des graphiques de connaissances pour chaque plateforme. Dans ces graphes, les nœuds représentaient des termes médicaux de notre dictionnaire, tandis que les arêtes reliaient les termes en fonction de la fréquence à laquelle ils apparaissaient ensemble dans les publications. La force de ces connexions était mesurée par la co-occurrence : à quelle fréquence deux termes apparaissaient dans la même publication.
Calcul du Backbone Métrique
Pour analyser efficacement les graphiques de connaissances, on a calculé le backbone métrique, qui met en évidence les connexions les plus fortes entre les termes. Ce sous-graphe conserve les chemins les plus courts entre les termes tout en réduisant le bruit provenant de connexions moins importantes.
En trouvant des utilisateurs qui contribuent à ces connexions clés dans le graphique de connaissances, on peut identifier ceux qui participent à des discussions plus pertinentes sur l'épilepsie.
Résultats de l'Étude
Quand on a appliqué notre méthode aux données, on a observé plusieurs tendances clés. D'abord, on a trouvé que les utilisateurs des communautés ciblées sur l'épilepsie contribuaient davantage au graphique de connaissances que les utilisateurs des plateformes générales. Cela indique que les discussions sur l'épilepsie sur des plateformes dédiées contiennent probablement plus d'informations pertinentes.
De plus, notre analyse a montré que les utilisateurs qui ne contribuaient pas aux connexions centrales dans le graphique utilisaient souvent les termes médicaux de manière incorrecte ou hors contexte. Cela souligne la nécessité de filtrer les utilisateurs en fonction de leur pertinence par rapport au sujet au lieu de se baser uniquement sur leur niveau d'engagement.
La Valeur de la Méthode du Backbone
Notre méthode de filtrage basée sur le backbone offre plusieurs avantages. Elle identifie les utilisateurs qui peuvent ne pas s'engager fréquemment mais qui fournissent des aperçus significatifs sur l'épilepsie. Elle filtre également les utilisateurs très bavards qui contribuent à des discussions moins pertinentes.
Dans notre étude, on a validé nos conclusions en examinant manuellement les publications. On a découvert que les utilisateurs qui n'étaient pas des contributeurs au backbone étaient plus susceptibles d'utiliser les termes médicaux de manière inexacte. Cela soutient l'efficacité de notre méthode pour identifier les utilisateurs qui contribuent à des discussions pertinentes sur l'épilepsie.
Implications pour la Recherche
Les implications de nos résultats sont larges. Les chercheurs intéressés à utiliser les réseaux sociaux pour des études liées à la santé peuvent tirer profit de notre approche, car elle fournit un moyen plus précis d'identifier des cohortes pertinentes. En filtrant les utilisateurs non pertinents, on peut se concentrer sur ceux qui offrent des aperçus liés à des problèmes de santé spécifiques, rendant notre recherche plus robuste.
De plus, notre méthode est sans paramètre, ce qui signifie qu'elle ne repose pas sur des seuils subjectifs pour le filtrage, réduisant ainsi les biais potentiels dans la sélection des utilisateurs. Cela permet une identification des cohortes plus uniforme à travers différentes efforts de recherche.
Conclusion
Les plateformes de médias sociaux ont un grand potentiel pour la recherche en santé, en particulier pour comprendre des conditions chroniques comme l'épilepsie. En utilisant des approches structurées comme les graphiques de connaissances et les méthodes de backbone métriques, les chercheurs peuvent tirer efficacement parti de ce potentiel.
Cette nouvelle façon de filtrer les utilisateurs sur les réseaux sociaux aide à créer des cohortes numériques pertinentes qui contribuent des aperçus précieux aux discussions médicales. Cela peut à son tour aider à améliorer notre compréhension des expériences et des résultats des patients, améliorant finalement les soins et le soutien apportés à ceux vivant avec l'épilepsie et d'autres conditions de santé chroniques.
En continuant de peaufiner nos méthodes et de les appliquer à d'autres domaines de la recherche en santé, on peut ouvrir la voie à des découvertes encore plus significatives qui peuvent informer les pratiques cliniques et les soins aux patients. Les réseaux sociaux continueront d'être une ressource vitale dans la quête de meilleurs résultats de santé et de compréhension des maladies chroniques.
Titre: Selecting focused digital cohorts from social media using the metric backbone of biomedical knowledge graphs
Résumé: The abundance of social media data allows researchers to construct large digital cohorts to study the interplay between human behavior and medical treatment. Identifying the users most relevant to a specific health problem is, however, a challenge in that social media sites vary in the generality of their discourse. While X (formerly Twitter), Instagram, and Facebook cater to wide ranging topics, Reddit subgroups and dedicated patient advocacy forums trade in much more specific, biomedically-relevant discourse. To hone in on relevant users anywhere, we have developed a general framework and applied it to epilepsy discourse in social media as a test case. We analyzed the text from posts by users who mention epilepsy drugs in the general-purpose social media sites X and Instagram, the epilepsy-focused Reddit subgroup (r/Epilepsy), and the Epilepsy Foundation of America (EFA) forums. We curated a medical terms dictionary and used it to generate a knowledge graph (KG) for each online community. For each KG, we computed the metric backbone--the smallest subgraph that preserves all shortest paths in the network. By comparing the subset of users who contribute to the backbone to the subset who do not, we found that epilepsy-focused social media users contribute to the KG backbone in much higher proportion than do general-purpose social media users. Furthermore, using human annotation of Instagram posts, we demonstrated that users who do not contribute to the backbone are more than twice as likely to use dictionary terms in a manner inconsistent with their biomedical meaning. For biomedical research applications, our backbone-based approach thus has several benefits over simple engagement-based approaches: It can retain low-engagement users who nonetheless contribute meaningful biomedical insights. It can filter out very vocal users who contribute no relevant content.
Auteurs: Ziqi Guo, Jack Felag, Jordan C. Rozum, Rion Brattig Correia, Luis M. Rocha
Dernière mise à jour: 2024-05-11 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2405.07072
Source PDF: https://arxiv.org/pdf/2405.07072
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.