Abordando a desinformação em prints de tela

Uma ferramenta pra verificar a autenticidade de prints de redes sociais.

2025-10-31T00:51:36+00:00 ― 5 min ler

Índice

Importância dos Prints
Desafios com Tweets Falsos
Validando Prints
Extraindo Informações dos Prints
Visão Geral da Metodologia
Criação do Conjunto de Dados
Retrocedendo para o Conteúdo Original
Usando Motores de Busca
Utilizando Sites de Checagem
Pesquisando Arquivos da Web
Reconhecimento Óptico de Caracteres (OCR)
Avaliando Métodos de Extração de Data e Hora
Desafios na Extração de Data e Hora
Extraindo Usuários do Twitter
Desempenho do Método de Extração de Usernames
Conclusão
Fonte original
Ligações de referência

Prints de tela são super usados nas redes sociais pra compartilhar informações. Muita gente manda essas imagens sem checar se o post original é verdadeiro ou falso. Compartilhar prints falsos pode causar muita desinformação e confusão na internet. O nosso objetivo é criar uma ferramenta que consiga analisar um print de um tweet e calcular as chances dele ser genuíno, usando informações de sites ao vivo e páginas arquivadas.

Importância dos Prints

Os prints permitem que os usuários compartilhem posts de um jeito prático em várias plataformas. Por exemplo, alguém pode compartilhar o tweet no Facebook como um print pra alcançar mais pessoas. Prints também servem como prova quando há risco de um post ser deletado. Por exemplo, um usuário compartilhou um print de um tweet sobre um evento trágico que depois foi tirado do ar.

Desafios com Tweets Falsos

Criar tweets falsos é fácil com ferramentas online. Uma vez que um tweet falso vira print, é difícil saber se é real ou não. Não existem ferramentas que chequem automaticamente se um print é genuíno. As pessoas costumam buscar online ou consultar sites de checagem de fatos pra verificar conteúdo, mas isso pode demorar. Por exemplo, um tweet fabricado foi checado por um site de checagem logo depois de ser compartilhado.

Validando Prints

Pra verificar se um print é real, as pessoas podem usar buscadores ou sites de checagem. Elas também podem explorar arquivos da web pra encontrar posts deletados. Ferramentas automatizadas poderiam simplificar esse processo. A gente quer criar uma ferramenta que ajude os usuários a confirmar se o conteúdo de um print é autêntico ou falso.

Extraindo Informações dos Prints

Antes de checar a autenticidade de um print, a gente precisa extrair informações importantes dele. Isso inclui o texto do tweet, a data e hora, e o usuário do Twitter. Estamos desenvolvendo métodos pra fazer isso de forma eficaz.

Visão Geral da Metodologia

O processo envolve coletar imagens de prints, definir estratégias de busca e verificar se o conteúdo original pode ser encontrado online. Se a gente conseguir verificar o conteúdo, ele é real; se não, vamos estimar as chances de ser falso.

Criação do Conjunto de Dados

A gente coletou um conjunto de dados com 200 imagens de tweets, incluindo exemplos reais e falsos. Esse conjunto vai ajudar a gente a criar e testar nossa ferramenta de forma eficaz.

Retrocedendo para o Conteúdo Original

Uma etapa importante é encontrar o link original do tweet que aparece no print. O texto do tweet e o usuário do Twitter podem ser usados como palavras-chave em um motor de busca. Dessa forma, se o tweet for real, o link original pode ser encontrado.

Usando Motores de Busca

A gente pode usar uma parte do texto do tweet junto com o usuário do Twitter pra buscar em plataformas como o Google. Isso geralmente leva ao URL do tweet original, mostrando que o conteúdo é genuíno.

Utilizando Sites de Checagem

Outro método envolve usar a data e hora e o texto em um site de checagem pra ver se o conteúdo foi postado pelo autor que diz ter postado. Por exemplo, um tweet com informações falsas foi desmentido por um desses sites.

Pesquisando Arquivos da Web

Arquivos da web, como o Wayback Machine, podem ajudar a encontrar tweets deletados. Esses arquivos guardam páginas antigas da web e podem ser pesquisados usando o usuário do Twitter e a data em que o tweet foi postado. Isso é muito útil pra encontrar conteúdo que pode não estar mais visível no Twitter.

Reconhecimento Óptico de Caracteres (OCR)

Pra extrair texto de um print, a gente vai usar uma ferramenta chamada Reconhecimento Óptico de Caracteres (OCR). Essa tecnologia lê texto de imagens e transforma em texto editável. Isso permite que a gente consiga puxar o texto do tweet, o usuário e a data do print.

Avaliando Métodos de Extração de Data e Hora

A gente testou dois métodos pra extrair datas e horas de prints. O primeiro usa uma ferramenta especial em Python pra encontrar strings de data, enquanto o segundo busca por padrões numéricos no texto. Nossos resultados mostraram que o segundo método é mais preciso pra puxar a data e hora corretas.

Desafios na Extração de Data e Hora

Alguns prints não têm timestamps em um formato padrão, o que dificulta a extração. Por exemplo, se um timestamp aparece como "27m", não dá pra gerar uma data completa.

Extraindo Usuários do Twitter

Extrair o usuário do Twitter de um print exige atenção. Usuários do Twitter começam com "@" e pode haver mais de um handle em um tweet. Então, a gente só extrai o primeiro handle que aparece no print.

Desempenho do Método de Extração de Usernames

A gente testou nosso método pra extrair usuários do Twitter. Os resultados mostraram que nossa abordagem pra identificar handles foi bem sucedida, embora possa haver casos em que o handle esteja incompleto.

Conclusão

Prints se tornaram uma forma comum de compartilhar conteúdo nas redes sociais. No entanto, o risco de espalhar desinformação através de prints falsos é real. Esse trabalho visa enfrentar o desafio de verificar a autenticidade de prints. O conjunto de dados que coletamos e a ferramenta automatizada que estamos desenvolvendo serão valiosos na luta contra desinformação e na garantia de que o conteúdo compartilhado online é confiável.

Abordando a desinformação em prints de tela

Uma ferramenta pra verificar a autenticidade de prints de redes sociais.

#Importância dos Prints

#Desafios com Tweets Falsos

#Validando Prints

#Extraindo Informações dos Prints

#Visão Geral da Metodologia

#Criação do Conjunto de Dados

#Retrocedendo para o Conteúdo Original

#Usando Motores de Busca

#Utilizando Sites de Checagem

#Pesquisando Arquivos da Web

#Reconhecimento Óptico de Caracteres (OCR)

#Avaliando Métodos de Extração de Data e Hora

#Desafios na Extração de Data e Hora

#Extraindo Usuários do Twitter

#Desempenho do Método de Extração de Usernames

#Conclusão

Ligações de referência

Tópicos referenciados