Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões# Inteligência Artificial

Usando IA pra Mirar na Publicidade de Tabaco

Esse estudo usa tecnologia pra revelar anúncios de tabaco escondidos e medir seu impacto.

― 6 min ler


IA Alvo Anúncios deIA Alvo Anúncios deTabaco Ocultosconteúdo sobre fumo na mídia.Métodos avançados revelam e medem o
Índice

A publicidade de tabaco costuma tentar ficar nas sombras, o que leva a regras rígidas contra isso. Este estudo mostra que usar tecnologia, especialmente Aprendizado Profundo, pode ajudar a encontrar esses anúncios escondidos e medir o conteúdo relacionado ao tabaco sem viés.

Por Que Fumar é um Problema?

A Organização Mundial da Saúde diz que fumar causa cerca de 8 milhões de mortes por ano. É uma das principais causas de vários problemas de saúde, incluindo doenças cardíacas, doenças pulmonares e vários tipos de câncer. Em países que fazem parte da OCDE, cerca de 15% das pessoas com 15 anos ou mais fumam. Na União Europeia, esse número é de 17%. Além disso, 15% dessas 8 milhões de mortes são devido ao fumo passivo. Estudos anteriores indicam que como o fumo é mostrado nos filmes impacta a visão das pessoas, mas medir essa influência não é fácil. Rastrear anúncios online é complicado porque estatísticas detalhadas costumam não estar disponíveis, e identificar anúncios rotulados e não rotulados aumenta a complexidade. Saber que tipo de conteúdo sobre fumo está online pode ajudar a diminuir seu apelo. Formas de encontrar esse conteúdo incluem monitoramento contínuo da intensidade dos anúncios, pesquisas e soluções tecnológicas que podem ajudar nesses esforços. Especialistas sugerem que tecnologia como inteligência artificial pode realmente aumentar a pesquisa e as políticas voltadas para controlar o uso do tabaco.

O Desafio dos Dados

Apesar dos avanços na tecnologia, muitos métodos atuais precisam de muitos dados. Por exemplo, redes populares de Processamento de Imagem como ResNet aprenderam com grandes conjuntos de dados. A ResNet usou mais de 14 milhões de imagens, enquanto modelos de linguagem como BERT precisaram de uma grande coleção de textos. Até mesmo modelos mais novos como GPT usam centenas de gigabytes de dados. Ferramentas eficazes para analisar texto incluem modelos que identificam tópicos e reconhecem palavras, frases ou sentenças. Na análise de imagens, o foco costuma estar na classificação e detecção de objetos, e alguns modelos são feitos especificamente para detectar fumo.

Uma Nova Abordagem

Atualmente, não existe um conjunto de dados específico dedicado ao fumo que seja grande o suficiente para treinar modelos complexos. Para lidar com esse problema, propomos um novo sistema usando modelos de imagem e linguagem existentes para detectar fumo em textos e imagens. Ao combinar técnicas das duas áreas, criamos uma solução robusta que funciona bem mesmo com dados limitados. Nossas descobertas sugerem que o aprendizado profundo, principalmente através da IA, é uma ferramenta poderosa para identificar anúncios escondidos e medir com precisão o conteúdo da mídia relacionado ao tabaco.

Arquitetura do Modelo

Nosso sistema consiste em uma combinação de modelos pré-treinados para texto e imagens, permitindo processar os dois tipos de dados. A primeira tarefa é identificar se os dados recebidos são um vídeo ou texto. Os vídeos são divididos em quadros, enquanto os textos são analisados através de um Modelo de Linguagem. Os dados de vídeo são processados usando um modelo multilíngue que suporta várias línguas, incluindo húngaro. Após filtrar com esse modelo, usamos outro modelo para classificar imagens de fumo.

Para a análise de texto, utilizamos um método para identificar termos relacionados ao fumo. Como não havia um conjunto de dados pronto com termos de fumo em húngaro, criamos um usando técnicas generativas, consultando dicionários e ferramentas linguísticas. Montamos uma lista abrangente de palavras e frases relacionadas ao fumo.

Etapas de Processamento de Dados

Primeiro, definimos quais tipos de dados nosso sistema vai aceitar: mp4 para vídeos e txt para arquivos de texto. Consideramos apenas arquivos de texto limpos e não marcados. Para os dados de vídeo, dividimos os vídeos em quadros amostrando a cada segundo. Os quadros de vídeo processados são redimensionados para tamanhos padrão para análise.

Em seguida, filtramos as imagens usando nosso modelo multilíngue para detectar conteúdo de fumo. Cada imagem e texto é transformado em um vetor, que representa seu significado de maneira matemática. Depois, medimos quão semelhantes esses vetores são a um termo relacionado ao fumo. Isso nos ajuda a determinar quais quadros de vídeos contêm fumo.

Melhorando a Precisão

Após a filtragem, melhoramos a precisão usando um modelo de classificação de imagem para analisar as imagens restantes. Ajustamos um modelo usando conjuntos de dados de fumo existentes, com um modelo alcançando mais de 90% de precisão na classificação de imagens com e sem fumo.

Para a detecção de texto, tratamos como uma tarefa de reconhecimento de entidades nomeadas, focando na língua húngara. Usando técnicas generativas e prompts, produzimos um conjunto de textos com palavras relacionadas ao fumo. Geramos cerca de 80 parágrafos, o que ajuda a construir uma boa base de treinamento para nosso modelo de reconhecimento de linguagem.

Melhoria Contínua

Para garantir que nosso sistema continue melhorando, integramos feedback humano ao nosso modelo. Isso permite ajustes e refinamentos durante sua operação. O sistema coleta erros e detecções bem-sucedidas, o que ajuda na atualização dos modelos e na redução de erros no futuro.

Testando o Sistema

Testamos nosso modelo de processamento de imagem usando vídeos de uma plataforma popular de compartilhamento de vídeos. Seguimos as diretrizes legais e focamos em anúncios curtos para garantir uma análise eficiente. Amostrando os vídeos e anotando-os, estabelecemos uma base para medir a eficácia do nosso modelo.

Usando o processo de filtragem, identificamos uma quantidade significativa de conteúdo de fumo nos anúncios. A precisão das imagens detectadas inicialmente foi satisfatória, e melhoramos ainda mais combinando diferentes modelos para aumentar as taxas de detecção. No final, nossa abordagem combinada trouxe bons resultados, permitindo maior precisão na identificação de casos de fumo.

Conclusão

Nossas descobertas mostram que misturar modelos pré-treinados para imagens e texto pode detectar efetivamente conteúdo de fumo mesmo com dados limitados. Ao contar com suporte humano e métodos generativos, podemos continuar aprimorando nossa abordagem. No futuro, vemos potencial para adicionar técnicas como detecção de objetos para melhorar o tempo e a posição dos itens detectados. À medida que o poder computacional cresce, os métodos aplicados aos textos também podem se estender para as imagens, mostrando a adaptabilidade da nossa abordagem.

No geral, este estudo destaca o papel significativo que a tecnologia pode desempenhar na compreensão e controle da publicidade de tabaco, oferecendo uma avaliação imparcial e precisa do conteúdo relacionado ao tabaco em várias mídias.

Fonte original

Título: A multimodal deep learning architecture for smoking detection with a small data approach

Resumo: Introduction: Covert tobacco advertisements often raise regulatory measures. This paper presents that artificial intelligence, particularly deep learning, has great potential for detecting hidden advertising and allows unbiased, reproducible, and fair quantification of tobacco-related media content. Methods: We propose an integrated text and image processing model based on deep learning, generative methods, and human reinforcement, which can detect smoking cases in both textual and visual formats, even with little available training data. Results: Our model can achieve 74\% accuracy for images and 98\% for text. Furthermore, our system integrates the possibility of expert intervention in the form of human reinforcement. Conclusions: Using the pre-trained multimodal, image, and text processing models available through deep learning makes it possible to detect smoking in different media even with few training data.

Autores: Robert Lakatos, Peter Pollner, Andras Hajdu, Tamas Joo

Última atualização: 2023-09-19 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2309.10561

Fonte PDF: https://arxiv.org/pdf/2309.10561

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes