Nano-ESG : Une nouvelle approche de la durabilité en entreprise
Analyser la durabilité des entreprises à travers des articles de news en temps réel.
― 8 min lire
Table des matières
Ces dernières années, le sujet de la Durabilité est devenu super important pour le grand public et les entreprises. Les gens s'inquiètent de l'impact des sociétés sur l'environnement et la société. Cette préoccupation a amené un intérêt croissant autour des critères ESG, qui signifient Environnemental, Social et Gouvernance. Les investisseurs et autres parties prenantes veulent savoir à quel point les entreprises sont responsables en matière de pratiques durables. Mais évaluer la durabilité d'une entreprise, c'est pas facile. C'est compliqué, et beaucoup de notations ou de scores fournis par les agences compliquent encore les choses. Parfois, différentes agences peuvent donner des scores complètement différents pour la même entreprise. C'est un peu comme comparer des pommes et des oranges-si les pommes étaient rouges et les oranges bleues.
Le défi des notations ESG
Beaucoup de gens s'appuient sur les scores ESG pour évaluer les entreprises, mais ces scores ont souvent leurs propres problèmes. Ils peuvent être confus et difficiles à comprendre. Après tout, qui a vraiment envie de lire un rapport de 20 pages pour savoir si une entreprise fait des bonnes ou des mauvaises choses ? En plus, les méthodes complexes utilisées pour calculer ces scores rendent les choses encore plus floues pour le commun des mortels. C’est comme essayer de résoudre un Rubik's Cube les yeux bandés tout en faisant du monocycle-frustrant et ça finit souvent en larmes.
Sources de données alternatives
Pour simplifier les choses, il y a une mine d'informations qui attendent d'être exploitées : les articles de presse. Les reportages peuvent donner un aperçu de comment les entreprises opèrent en temps réel, capturant les perceptions du public et les réactions immédiates à leurs actions. Contrairement aux rapports formels qui mettent souvent du temps à sortir ou qui peuvent éluder certaines questions, les articles de presse peuvent offrir une image plus précise de ce qui se passe maintenant. En analysant ces données, les chercheurs peuvent aider les investisseurs et le public à mieux suivre la durabilité des entreprises sans se fier uniquement à des scores parfois douteux.
Présentation de Nano-ESG
C'est là qu'intervient le jeu de données Nano-ESG, qui offre un nouveau regard sur la durabilité des entreprises. Ce jeu de données comprend une énorme collection d'articles de presse sur de grandes entreprises en Allemagne de janvier 2023 à septembre 2024. L'objectif est d'identifier les opportunités et les défis clés auxquels les entreprises font face dans leurs efforts de durabilité. Avec l'aide du traitement du langage naturel (NLP), une méthode technique pour analyser les données textuelles, les chercheurs peuvent trier ces articles, les résumer et évaluer leur sentiment en lien avec les questions ESG. En gros, les chercheurs utilisent des algorithmes sophistiqués pour déterminer si les articles parlent plutôt de temps ensoleillé ou de tempêtes pour les entreprises.
Collecte des données
La première étape pour créer le jeu de données Nano-ESG consiste à rassembler des articles provenant de diverses sources médiatiques allemandes et anglaises. Différents mots-clés liés aux entreprises sont utilisés pour trouver des histoires pertinentes. Imaginez devoir trier plus d'un millier d'articles ! Mais attendez, ça devient encore mieux. Pour rendre le jeu de données encore plus maniable, les chercheurs appliquent des techniques pour filtrer les articles similaires ou non pertinents, un peu comme trier une pile de linge pour retrouver votre paire de chaussettes préférée.
Données clés des articles
Après avoir ramassé plein d'articles, l'étape suivante consiste à les résumer pour capturer les points essentiels. Dans ce processus, les chercheurs étiquettent aussi les articles selon leur sentiment lié aux ESG. Le sentiment désigne si les nouvelles sont généralement positives, négatives ou neutres concernant les pratiques de durabilité de l'entreprise. L'entreprise a-t-elle fait quelque chose de génial pour l'environnement ? Pouce en l'air ! Ont-ils fait une bêtise et se sont fait prendre dans un scandale ? Pouce en bas ! C’est comme un jeu télé où les entreprises essaient d'impressionner un jury, mais au lieu d'applaudissements, elles se font soit recevoir des fleurs, soit se faire lancer des tomates.
Évaluation du jeu de données
Pour assurer la qualité du jeu de données Nano-ESG, les chercheurs ont procédé à une évaluation approfondie. Ils ont rassemblé un groupe d'experts en durabilité pour examiner un échantillon des articles et leurs résumés correspondants. Cette évaluation a inclus la vérification si les résumés capturaient vraiment l'essence des articles et si les Sentiments attribués étaient corrects. C'est un peu comme rassembler des critiques culinaires pour goûter et évaluer un nouveau plat-chacun a son avis, et les résultats peuvent être assez éclairants.
Caractéristiques du jeu de données
Le jeu de données final Nano-ESG inclut des informations essentielles comme les dates de publication, les URLs des articles, et le contenu résumé. Ce jeu de données est une ressource précieuse pour quiconque s'intéresse à l'étude de la durabilité des entreprises au fil du temps. Par exemple, les entreprises peuvent être évaluées sur leurs performances ESG et comment elles évoluent dans le temps. C'est comme avoir une boule de cristal qui montre comment les actions des entreprises influencent la perception publique, leur permettant de faire des ajustements rapides dans leur stratégie.
Les limitations
Bien que le jeu de données Nano-ESG présente des possibilités passionnantes, il n'est pas sans défis. D'une part, il a parfois du mal à saisir des sentiments nuancés. Si un article contient un compliment élogieux caché sous une pile de critiques, le sentiment global peut ne pas refléter cette complexité. Pensez à une critique de film qui vante la cinématographie mais déchire le scénario.
En plus, ce n’est pas toujours évident de pointer des commentaires qui se rapportent directement à une entreprise spécifique, surtout dans les articles qui discutent de problèmes à l'échelle de l'industrie. Un article peut parler du changement climatique et mentionner plusieurs entreprises sans vraiment préciser qui est responsable de quoi. C'est comme un bulletin de nouvelles montrant un match de dodgeball où tout le monde se fait toucher, mais un seul joueur est vraiment à l'origine du chaos.
Suivi continu
Un des grands avantages du jeu de données Nano-ESG est sa capacité de suivi continu. Étant donné que des articles de presse sont publiés en permanence, ce jeu de données peut être mis à jour régulièrement pour refléter les dernières nouvelles ESG pour chaque entreprise. Ça aide les parties prenantes à rester informées sans attendre le prochain rapport trimestriel. C’est comme avoir un assistant personnel qui chuchote les dernières nouvelles à votre oreille au lieu de vous faire lire des rapports ennuyeux-super pratique !
Perspectives d'avenir
Les chercheurs s'engagent à élargir le projet Nano-ESG en ajoutant en continu plus de données et en affinant les méthodes utilisées pour l'extraction des données. Ils veulent créer une application conviviale qui permettrait aux parties prenantes d'accéder facilement aux dernières informations sur la durabilité des entreprises. À long terme, il y a l'espoir d'étendre les projets à des entreprises au-delà de l'Allemagne, offrant une image plus globale des pratiques de durabilité des entreprises. À mesure que de nouvelles technologies se développent, des modèles spécialisés destinés à différentes tâches d'extraction de données pourraient également entrer en jeu.
Conclusion
Le jeu de données Nano-ESG sert d'outil précieux dans la discussion continue sur la durabilité des entreprises. En utilisant des articles de presse comme source directe, il propose une manière innovante d'analyser et de suivre comment les entreprises gèrent les questions environnementales, sociales et de gouvernance. Bien que des défis existent, le potentiel d'améliorations continues et de mises à jour rend cette approche prometteuse pour quiconque s'intéresse au comportement et à la durabilité des entreprises.
Dans un monde où les nouvelles se répandent plus vite qu'une rumeur lors d'une réunion de famille, la capacité d'analyser les actions des entreprises en temps réel pourrait mener à une meilleure responsabilité et responsabilité parmi elles. À la vôtre, pour un avenir où les entreprises sont incitées non seulement à avoir l'air bien sur le papier, mais aussi à vraiment faire le bien dans le monde-un article de presse à la fois !
Titre: Nano-ESG: Extracting Corporate Sustainability Information from News Articles
Résumé: Determining the sustainability impact of companies is a highly complex subject which has garnered more and more attention over the past few years. Today, investors largely rely on sustainability-ratings from established rating-providers in order to analyze how responsibly a company acts. However, those ratings have recently been criticized for being hard to understand and nearly impossible to reproduce. An independent way to find out about the sustainability practices of companies lies in the rich landscape of news article data. In this paper, we explore a different approach to identify key opportunities and challenges of companies in the sustainability domain. We present a novel dataset of more than 840,000 news articles which were gathered for major German companies between January 2023 and September 2024. By applying a mixture of Natural Language Processing techniques, we first identify relevant articles, before summarizing them and extracting their sustainability-related sentiment and aspect using Large Language Models (LLMs). Furthermore, we conduct an evaluation of the obtained data and determine that the LLM-produced answers are accurate. We release both datasets at https://github.com/Bailefan/Nano-ESG.
Auteurs: Fabian Billert, Stefan Conrad
Dernière mise à jour: Dec 19, 2024
Langue: English
Source URL: https://arxiv.org/abs/2412.15093
Source PDF: https://arxiv.org/pdf/2412.15093
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.