Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem

Estimando Emissões de Escopo 3 com Modelos de Linguagem

Um novo método pra estimar as emissões de Escopo 3, que são difíceis de rastrear, usando dados de transações.

― 7 min ler


Nova Método para EmissõesNova Método para Emissõesde Escopo 3acompanhar dados difíceis de emissões.Usando modelos de linguagem pra
Índice

Muitas empresas grandes precisam reduzir seu impacto nas mudanças climáticas. Um jeito de fazer isso é diminuindo suas emissões de gases de efeito estufa, especialmente as que vêm de suas cadeias de suprimento. Essas emissões, chamadas de emissões de Escopo 3, representam mais de 90% do total de emissões de muitas empresas. Mas, rastrear essas emissões é complicado porque as empresas precisam coletar dados de muitos fornecedores.

Esse artigo fala sobre uma nova forma de estimar as emissões de Escopo 3 usando modelos de linguagem avançados. Essa técnica usa dados de transações financeiras como um substituto para os bens e serviços realmente comprados.

A Importância das Emissões de Escopo 3

As Nações Unidas estabeleceram Objetivos de Desenvolvimento Sustentável (ODS) que incluem um foco em lidar com as mudanças climáticas. Um dos principais objetivos é limitar o aumento da temperatura global. Para alcançar essas metas, é crucial que as empresas tomem medidas em relação às suas emissões de gases de efeito estufa. Esforços anteriores se concentraram principalmente nas emissões de Escopo 1 e Escopo 2, que são as emissões diretas de fontes possuídas e as emissões indiretas de energia comprada, respectivamente. No entanto, a maioria das emissões geralmente vem do Escopo 3, que inclui todas as emissões indiretas na cadeia de suprimento.

Desafios na Rastreabilidade das Emissões de Escopo 3

Rastrear as emissões de Escopo 3 traz muitos desafios. Alguns deles incluem:

  • Coleta de Dados: Coletar os dados certos é difícil. As empresas têm dificuldade em encontrar informações detalhadas necessárias para calcular com precisão suas emissões de Escopo 3.

  • Cooperação com Fornecedores: Muitas vezes, as empresas precisam contar com seus fornecedores para fornecer os dados necessários, mas muitos fornecedores não estão dispostos a compartilhar essas informações.

  • Transparência: As empresas podem não saber como seus fornecedores estão medindo as emissões ou quais dados estão usando, levando a informações de baixa qualidade.

  • Múltiplos Stakeholders: Muitas partes diferentes estão envolvidas nas emissões de Escopo 3-isso torna a coleta e análise de dados difícil.

  • Recursos Limitados: As empresas podem não ter o pessoal, expertise e processos necessários para gerenciar efetivamente as emissões de Escopo 3.

Métodos Existentes para Estimar Emissões de Escopo 3

Existem alguns métodos amplamente utilizados para estimar as emissões de Escopo 3:

  1. Avaliação de Ciclo de Vida (ACV): Essa abordagem avalia o impacto ambiental total de produtos ou atividades do início ao fim. A ACV requer informações detalhadas sobre todos os processos envolvidos, o que é impraticável para grandes empresas com muitos produtos.

  2. Análise de Insumo-Produto Ambientalmente Estendida (AIE): Este método analisa as relações econômicas entre diferentes setores da economia. Usando dados financeiros, estima as emissões associadas aos gastos em vários setores.

Embora esses métodos possam ser eficazes, muitas vezes eles requerem dados extensivos que as empresas podem não ter facilmente disponíveis.

O Papel dos Modelos de Linguagem

Recentemente, houve um aumento no uso de grandes modelos de linguagem (MLs) em várias áreas. Esses modelos são treinados em grandes quantidades de dados textuais e podem ser ajustados para tarefas específicas. Embora tenham sido bem-sucedidos em muitas áreas, sua aplicação a questões relacionadas ao clima, particularmente às emissões de Escopo 3, não foi totalmente explorada.

Por que usar Modelos de Linguagem para Emissões de Escopo 3?

Os dados de transações financeiras estão facilmente disponíveis nas empresas, tornando-se um recurso útil para estimar as emissões de Escopo 3. No entanto, esses dados costumam ser escritos em linguagem natural, o que pode ser difícil de analisar.

Os modelos de linguagem podem ajudar de duas maneiras principais:

  • Reconhecimento de Commodities: Eles podem identificar produtos e serviços a partir das descrições de transações, mesmo quando a redação varia muito.

  • Mapeamento de Dados: Uma vez identificados, esses modelos podem vincular as commodities a fatores de emissão específicos, permitindo assim que as empresas calculem suas emissões de Escopo 3.

Estrutura Proposta para Estimar Emissões de Escopo 3

A nova estrutura utiliza modelos de linguagem para processar qualquer registro de transação. Ela consiste em quatro etapas principais:

  1. Preparação de Dados: Coletar e preparar exemplos de despesas categorizadas de acordo com as diretrizes da EPA dos EUA. Isso inclui criar um conjunto de dados para treinar o modelo.

  2. Adaptação ao Domínio: Ajustar modelos de linguagem pré-treinados usando o conjunto de dados preparado para melhorar sua precisão nas tarefas específicas de classificar transações.

  3. Classificação: Usar os modelos adaptados para classificar dados de transações em categorias apropriadas de commodities.

  4. Cálculo de Emissões: Calcular as emissões com base na classificação e nos fatores de emissão correspondentes.

Usando essa estrutura, as empresas podem acelerar significativamente a estimativa de suas emissões de Escopo 3 enquanto minimizam o esforço manual.

Resultados Experimentais

Vários experimentos foram realizados para testar o desempenho da estrutura proposta em comparação com métodos tradicionais. Diferentes modelos de linguagem foram testados para determinar qual funcionava melhor na identificação de commodities e na estimativa de emissões.

Aprendizado Zero-shot

Em um experimento, o aprendizado zero-shot foi empregado para ver como os modelos podiam classificar dados de transações sem treinamento específico. Os resultados mostraram que usar descrições em vez de títulos levou a um desempenho melhor. No entanto, as taxas de sucesso gerais foram baixas, destacando os benefícios de uma abordagem de aprendizado supervisionado.

Modelos Clássicos de Aprendizado de Máquina

Modelos tradicionais como TF-IDF e Word2Vec também foram testados. Esses métodos demonstraram que podiam ter um desempenho melhor do que o aprendizado zero-shot, especialmente o Word2Vec, que conseguiu capturar relações entre palavras de forma mais eficaz.

Ajuste Fino de Modelos de Linguagem

O ajuste fino dos modelos de linguagem mostrou resultados promissores. Ajustando hiperparâmetros como taxas de aprendizado, os modelos conseguiram mostrar melhorias de desempenho. No geral, modelos ajustados superaram métodos clássicos, sugerindo que poderiam ser mais eficazes para essa tarefa.

Usando uma combinação de abordagens, a nova estrutura forneceu uma maneira de estimar as emissões de Escopo 3 de forma mais precisa e eficiente.

Insumos e Oportunidades

Os dados coletados durante os experimentos forneceram várias percepções sobre a relação entre gastos e emissões. As empresas muitas vezes descobriram que despesas altas nem sempre se correlacionavam com altas emissões. Por exemplo, enquanto algumas categorias relacionadas a serviços tinham emissões menores, outras, como utilitários, tinham emissões mais altas em relação aos gastos.

Essas percepções podem ajudar as empresas a adotarem ações efetivas para reduzir suas emissões, permitindo que se concentrem em áreas que terão mais impacto em sua pegada de carbono.

Conclusão

A estrutura proposta para estimar as emissões de Escopo 3 usando modelos de linguagem mostra um grande potencial em ajudar as empresas a rastrear e gerenciar melhor suas emissões de gases de efeito estufa. Aproveitando os dados de transações financeiras existentes, as empresas podem simplificar e acelerar o processo de coleta de informações relacionadas às suas cadeias de suprimento.

À medida que as empresas buscam cumprir suas metas climáticas, ferramentas e métodos eficazes como o discutido serão vitais. Essa nova abordagem não só ajuda no cálculo de emissões, mas também abre oportunidades para as organizações darem passos significativos em direção à sustentabilidade e ao cumprimento de seus compromissos para combater as mudanças climáticas.

Fonte original

Título: Supply chain emission estimation using large language models

Resumo: Large enterprises face a crucial imperative to achieve the Sustainable Development Goals (SDGs), especially goal 13, which focuses on combating climate change and its impacts. To mitigate the effects of climate change, reducing enterprise Scope 3 (supply chain emissions) is vital, as it accounts for more than 90\% of total emission inventories. However, tracking Scope 3 emissions proves challenging, as data must be collected from thousands of upstream and downstream suppliers.To address the above mentioned challenges, we propose a first-of-a-kind framework that uses domain-adapted NLP foundation models to estimate Scope 3 emissions, by utilizing financial transactions as a proxy for purchased goods and services. We compared the performance of the proposed framework with the state-of-art text classification models such as TF-IDF, word2Vec, and Zero shot learning. Our results show that the domain-adapted foundation model outperforms state-of-the-art text mining techniques and performs as well as a subject matter expert (SME). The proposed framework could accelerate the Scope 3 estimation at Enterprise scale and will help to take appropriate climate actions to achieve SDG 13.

Autores: Ayush Jain, Manikandan Padmanaban, Jagabondhu Hazra, Shantanu Godbole, Kommy Weldemariam

Última atualização: 2023-08-03 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2308.01741

Fonte PDF: https://arxiv.org/pdf/2308.01741

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes