Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Intelligence artificielle# Technologies émergentes# Interaction homme-machine# Réseaux sociaux et d'information

Évaluer les intentions de vapotage sur les réseaux sociaux

Cette étude analyse comment GPT-4 détecte les intentions d'arrêter chez les utilisateurs de vapes sur Reddit.

― 6 min lire


Intentions de vaper surIntentions de vaper surRedditcomportements d'arrêt du vapotage.Utiliser l'IA pour analyser les
Table des matières

Le Vapotage est devenu de plus en plus populaire aux États-Unis, surtout chez les jeunes. Cette tendance a conduit à de graves problèmes de Santé, y compris des blessures pulmonaires liées au vapotage qui ont entraîné des hospitalisations et des décès. À cause de ces tendances alarmantes, il est crucial de comprendre pourquoi les gens vapotent et comment les aider à arrêter. Les Réseaux sociaux, en particulier Reddit, sont devenus une source riche d'infos sur les pensées et comportements des gens concernant le vapotage. Cette étude examine comment on peut utiliser la technologie avancée, comme GPT-4, pour repérer les Intentions d'arrêter de vapoter parmi les utilisateurs sur Reddit.

L'essor du vapotage

Au cours de la dernière décennie, le vapotage a pris une immense popularité, surtout chez les adolescents et les jeunes adultes. L'utilisation de cigarettes électroniques et de produits similaires a explosé, soulevant des préoccupations de santé mises en avant lors de l'épidémie d'EVALI en 2019. Malgré la prise de conscience des risques associés au vapotage, de nombreux jeunes utilisateurs ne sont toujours pas conscients des dangers, comme la dépendance et les risques cachés pour la santé.

Les récents efforts pour informer les jeunes sur ces dangers ont conduit à une augmentation des utilisateurs souhaitant arrêter de vapoter. Des études montrent que près de la moitié des jeunes vapoteurs expriment le désir d'arrêter, tandis qu'une part significative a tenté de le faire ces dernières années.

Le rôle des réseaux sociaux

Une grande partie des gens utilise les réseaux sociaux, ce qui fournit une source précieuse d'infos sur les problèmes de santé publique. Des plateformes comme Twitter et Reddit ont été utilisées pour étudier les tendances de santé, y compris le vapotage. Les discussions autour du vapotage sur ces plateformes peuvent offrir des aperçus sur les comportements et intentions d'arrêt.

Les chercheurs ont découvert que l'analyse des discussions sur les réseaux sociaux peut aider à identifier les individus qui pourraient bénéficier d'interventions visant à réduire le vapotage. Cette recherche est particulièrement importante pour engager des groupes à risque comme les jeunes.

Méthodologie de recherche

Dans cette étude, on s'est concentré sur une communauté Reddit dédiée à aider les gens à arrêter de vapoter. On a collecté des posts de cette communauté pour analyser les intentions des utilisateurs d'arrêter. On a utilisé GPT-4, un modèle linguistique puissant, pour évaluer le texte et comparer son efficacité par rapport aux annotateurs humains.

Le processus de collecte de données a impliqué l'extraction d'un ensemble de posts de la communauté Reddit r/QuitVaping. Ces posts allaient des utilisateurs parlant de leur parcours d'arrêt à ceux demandant motivation et soutien. On a sélectionné un échantillon de posts à analyser, en les décomposant en phrases individuelles pour une évaluation plus facile.

Annotation humaine

Pour évaluer les données, on a fait appel à deux types d'annotateurs : des néophytes et des experts. Les néophytes ont examiné les phrases pour les étiqueter selon que le locuteur voulait arrêter de vapoter ou non. Les experts ont suivi les mêmes directives mais ont apporté leurs perspectives cliniques à la tâche. On a comparé les résultats des deux groupes pour évaluer leur fiabilité.

Annotation GPT-4

Ensuite, on a utilisé GPT-4 pour annoter les mêmes phrases. Cela a impliqué de créer des prompts pour guider les réponses du modèle. Chaque prompt demandait si le locuteur avait l'intention d'arrêter de vapoter, avec des niveaux de détail variés. En comparant les résultats de GPT-4 avec ceux des annotateurs humains, on visait à voir à quel point le modèle performait dans la reconnaissance des intentions.

Résultats

Les résultats de notre analyse ont montré que bien que GPT-4 ait bien fonctionné, il n'a pas totalement atteint le niveau des annotateurs humains. Les Annotations des néophytes étaient souvent plus proches de celles des experts, tandis que GPT-4 était plus libéral dans l'étiquetage des intentions d'arrêter.

Évaluation qualitative

Quand on a examiné l'accord entre GPT-4 et les annotateurs humains, on a constaté que les néophytes avaient un accord élevé avec les étiquettes des experts. GPT-4, en revanche, avait un accord plus faible, surtout avec ses meilleurs prompts.

Évaluation quantitative

On a calculé plusieurs métriques de classification pour évaluer quantitativement la performance de chaque annotateur. Les néophytes ont obtenu les meilleurs scores dans l'ensemble, tandis que les scores de GPT-4, bien que prometteurs, restaient inférieurs. Le modèle avait particulièrement des difficultés avec la précision, indiquant qu'il prédisait souvent les mauvaises intentions.

En analysant les résultats de différents prompts, on a trouvé que des prompts plus détaillés menaient généralement à de meilleures performances, mais le modèle faisait toujours face à des défis.

Discussion

Bien qu'il ne corresponde pas à l'exactitude des annotateurs humains, les résultats suggèrent un certain potentiel pour GPT-4 dans l'analyse des données des réseaux sociaux. La capacité du modèle à fournir des scores de confiance et des raisons pour ses prédictions offre des aperçus précieux dans son processus de décision. Cependant, cela souligne aussi l'importance de l'apport humain dans ces tâches.

En analysant les raisons derrière les prédictions incorrectes de GPT-4, on a identifié plusieurs domaines à améliorer. Le modèle classe souvent mal les phrases discutant des résultats de santé négatifs ou celles où les utilisateurs ont déjà arrêté de vapoter. Cela souligne le besoin d'un meilleur contexte et de définitions dans l'analyse.

Directions de recherche futures

Pour l'avenir, les chercheurs prévoient d'élargir l'étude en intégrant un ensemble de données plus large et plus diversifié provenant de divers sous-reddits liés au vapotage et d'autres sujets non liés. Construire un modèle plus robuste pourrait améliorer sa précision et sa fiabilité. En développant des stratégies permettant une classification multi-étiquettes, il pourrait être possible d'obtenir des aperçus plus profonds sur les comportements d'arrêt des utilisateurs.

De plus, aborder les problèmes avec les prédictions de GPT-4 peut impliquer la mise en œuvre d'annotations au niveau des posts. Cela donnerait au modèle plus de contexte, aidant à réduire les erreurs et à améliorer sa performance globale.

Conclusion

En résumé, bien que GPT-4 montre un potentiel en tant qu'alternative aux annotateurs humains pour identifier les intentions d'arrêter de vapoter, de nouveaux développements sont nécessaires avant qu'il puisse totalement remplacer les insights humains. Les résultats de cette étude ouvrent diverses perspectives pour la recherche future qui peut renforcer le rôle de l'IA dans les interventions de santé et la recherche en santé publique.

Remerciements

Cette recherche a été financée par des subventions du NIH et de l'Université de Caroline du Sud. Les auteurs n'ont déclaré aucun conflit d'intérêt lié à cette étude.

Source originale

Titre: Can GPT-4 Help Detect Quit Vaping Intentions? An Exploration of Automatic Data Annotation Approach

Résumé: In recent years, the United States has witnessed a significant surge in the popularity of vaping or e-cigarette use, leading to a notable rise in cases of e-cigarette and vaping use-associated lung injury (EVALI) that caused hospitalizations and fatalities during the EVALI outbreak in 2019, highlighting the urgency to comprehend vaping behaviors and develop effective strategies for cessation. Due to the ubiquity of social media platforms, over 4.7 billion users worldwide use them for connectivity, communications, news, and entertainment with a significant portion of the discourse related to health, thereby establishing social media data as an invaluable organic data resource for public health research. In this study, we extracted a sample dataset from one vaping sub-community on Reddit to analyze users' quit-vaping intentions. Leveraging OpenAI's latest large language model GPT-4 for sentence-level quit vaping intention detection, this study compares the outcomes of this model against layman and clinical expert annotations. Using different prompting strategies such as zero-shot, one-shot, few-shot and chain-of-thought prompting, we developed 8 prompts with varying levels of detail to explain the task to GPT-4 and also evaluated the performance of the strategies against each other. These preliminary findings emphasize the potential of GPT-4 in social media data analysis, especially in identifying users' subtle intentions that may elude human detection.

Auteurs: Sai Krishna Revanth Vuruma, Dezhi Wu, Saborny Sen Gupta, Lucas Aust, Valerie Lookingbill, Wyatt Bellamy, Yang Ren, Erin Kasson, Li-Shiun Chen, Patricia Cavazos-Rehg, Dian Hu, Ming Huang

Dernière mise à jour: 2024-06-28 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.00167

Source PDF: https://arxiv.org/pdf/2407.00167

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires