Avaliando a Identidade do Lugar Urbano com IA Generativa
Um estudo sobre como a IA generativa pode captar a identidade das cidades.
― 8 min ler
Índice
Pesquisadores estão buscando entender melhor como as pessoas veem as cidades e o que torna cada lugar único. Recentemente, uma nova tecnologia chamada Inteligência Artificial Generativa (IA) tornou possível criar textos e imagens realistas analisando grandes quantidades de informação. Este estudo testa quão bem a IA generativa consegue capturar a identidade das cidades através de descrições e imagens.
Para isso, os pesquisadores fizeram perguntas sobre 31 cidades ao redor do mundo a dois modelos de IA generativa chamados ChatGPT e DALL·E2. Há preocupações sobre se os resultados da IA generativa podem ser confiáveis, então o estudo comparou os dados da IA com informações da Wikipedia e imagens do Google. O objetivo é ver se a IA consegue refletir com precisão como as pessoas percebem essas cidades.
O que é identidade de lugar?
Identidade de lugar é um termo usado para descrever o que faz um local ser diferente dos outros. É importante em áreas como design urbano, geografia e turismo. As experiências das pessoas moldam como elas veem um lugar, então entender essas características é vital. Saber mais sobre identidade de lugar pode ajudar a tornar as cidades melhores para se viver.
Medir o que torna um lugar especial pode ser complicado. Isso acontece principalmente porque as opiniões e sentimentos das pessoas sobre os lugares podem variar. Tradicionalmente, os pesquisadores coletavam dados através de pesquisas, entrevistas e observações diretas. Nos últimos dez anos, novas fontes de dados surgiram para ajudar nesse entendimento.
Os pesquisadores agora usam dois tipos principais de dados: texto e imagens. Eles aplicam métodos de Processamento de Linguagem Natural (NLP) para analisar sentimentos e tópicos em textos online. Enquanto isso, o Aprendizado de Máquina é usado para obter insights a partir de fotos tiradas nas ruas e compartilhadas online. Esses avanços ajudam a coletar e analisar uma gama mais ampla de informações sobre lugares.
Avanços na IA Generativa
A IA generativa ganhou atenção recentemente porque consegue produzir imagens e textos realistas com base em solicitações que recebe. Ferramentas populares como ChatGPT e DALL·E2 mostram potencial em várias áreas, incluindo estudos urbanos. Os pesquisadores estão explorando como essas ferramentas podem avaliar qualidades de design no ambiente construído e melhorar o Planejamento Urbano.
Apesar do seu potencial, a IA generativa também traz preocupações éticas. Há receios sobre desinformação, viés e sua capacidade de representar lugares específicos com precisão. Isso destaca a necessidade de uma análise cuidadosa de quão bem os resultados da IA generativa refletem contextos do mundo real.
Objetivos da Pesquisa
Este estudo visa avaliar como a IA generativa pode ser usada como uma ferramenta para entender a identidade de lugar em diferentes cidades. Os pesquisadores buscaram responder a duas perguntas principais:
- Os modelos de IA generativa conseguem identificar a identidade de lugar de várias cidades?
 - Quão confiáveis são os resultados quando comparados a exemplos da vida real?
 
A esperança é que este estudo ajude pesquisadores urbanos a usar a IA generativa de maneira eficaz para coletar dados e analisar a identidade de lugar de forma econômica e eficiente.
Estrutura do Estudo
Os pesquisadores criaram uma estrutura para explorar as capacidades da IA generativa em capturar a identidade de lugar. Eles geraram dois conjuntos de dados para sua análise. O primeiro conjunto continha textos criados usando o ChatGPT ao perguntar: "Qual é a identidade de lugar da cidade? Me dê em dez pontos." Esse formato garantiu que as respostas fossem claras e estruturadas, facilitando a comparação entre diferentes cidades.
O segundo conjunto consistia em imagens produzidas pelo DALL·E2 que mostravam paisagens urbanas. Os pesquisadores solicitaram à IA: "Qual é a identidade de lugar das paisagens urbanas da cidade?" Cada cidade teve dez imagens geradas, que tinham tamanho 256x256 pixels. Ao combinar os conjuntos de dados de texto e imagem, os pesquisadores buscaram uma compreensão completa da identidade de cada cidade.
Eles também coletaram dois conjuntos de dados confiáveis - um da Wikipedia para texto e outro do Google para imagens. Devido às preocupações sobre a precisão da IA generativa, os pesquisadores compararam os resultados gerados pela IA com esses conjuntos de dados de referência.
Para a validação do texto, os pesquisadores segmentaram os textos da Wikipedia em frases e mediram a similaridade entre os resultados do ChatGPT e as frases da Wikipedia usando uma métrica chamada similaridade cosseno. Eles também criaram nuvens de palavras visuais para comparação. Quanto à validação de imagens, eles usaram um método chamado Similaridade de Patch de Imagem Perceptual Aprendida (LPIPS) para medir quão semelhantes eram as imagens geradas pela IA em relação às imagens do mundo real encontradas online.
Resultados do ChatGPT
Os pesquisadores analisaram os scores de similaridade entre as frases do ChatGPT e da Wikipedia para avaliar a precisão dos resultados do ChatGPT. Eles encontraram casos onde os scores eram muito altos, significando que as descrições geradas pela IA batiam muito com as descrições encontradas na Wikipedia. Por exemplo, a cidade de Madri teve um alto score de similaridade de 0,94 para sua descrição climática.
No entanto, nem todas as comparações mostraram matches próximos. Algumas frases do ChatGPT variaram bastante do que foi encontrado na Wikipedia, indicando dificuldades em capturar toda a essência da identidade de lugar. A análise da nuvem de palavras revelou diferentes tópicos destacados pela IA, mostrando como ela captura aspectos culturais e emocionais dos lugares. Para Seul, temas como "cultura", "vibrante" e "moderna" foram proeminentes, enquanto os resultados de Cingapura incluíam palavras relacionadas à governança.
Resultados do DALL·E2
Da mesma forma, os pesquisadores avaliaram as imagens geradas pelo DALL·E2 em comparação com as imagens encontradas no Google. Essa etapa tinha como objetivo determinar a confiabilidade do DALL·E2 em representar lugares específicos. Os resultados indicaram que algumas cidades, como Almaty, Blantyre, Lisboa e Sydney, tiveram scores de similaridade perceptual mais altos.
Lisboa, em particular, mostrou consistentemente scores de similaridade baixos, indicando que o DALL·E2 capturou com sucesso a essência de suas paisagens urbanas. As imagens geradas pela IA de prédios residenciais de baixa altura em Lisboa foram encontradas como correspondendo bem às imagens do mundo real.
Conclusões Gerais
O estudo encontrou que tanto o ChatGPT quanto o DALL·E2 produziram efetivamente descrições em texto e imagens que muitas vezes representam as características-chave das cidades. O forte alinhamento entre os resultados da IA e os dados reais apoia a ideia de que a IA generativa pode ser uma ferramenta valiosa para entender a identidade de lugar.
Apesar dos resultados promissores, os pesquisadores reconheceram algumas limitações. Por exemplo, algumas imagens produzidas pelo DALL·E2 foram muito gerais e não refletiram com precisão o que torna um lugar especial. As imagens geradas pela IA muitas vezes mostravam características urbanas comuns sem capturar os atributos únicos de cada cidade.
Outra limitação envolveu a incerteza em torno dos resultados de similaridade de imagem. Embora a métrica LPIPS oferecesse uma maneira de avaliar a similaridade perceptual, houve casos em que cenas semelhantes receberam scores variados, tornando incerto quais imagens representavam melhor a identidade de uma cidade.
Direções para Pesquisas Futuras
Para melhorar a confiabilidade dos resultados da IA generativa, os pesquisadores sugeriram algumas abordagens para estudos futuros. Um design de prompt melhorado pode levar a resultados mais precisos que mostrem melhor aspectos específicos de cada cidade. Adicionar detalhes sobre o ponto de vista ou objetos específicos pode resultar em saídas visuais mais consistentes.
Incluir fatores socioeconômicos nos prompts também pode ajudar a abordar a equidade da IA generativa na representação de ambientes urbanos. Para aprimorar a validação dos resultados, os pesquisadores podem usar conjuntos de dados diversos de redes sociais, onde as pessoas compartilham suas opiniões e experiências relacionadas a lugares.
Além disso, usar diferentes métodos de avaliação além dos scores de similaridade pode oferecer mais insights. Algoritmos de detecção mais sofisticados podem ajudar a comparar vários recursos entre conjuntos de dados e melhorar a compreensão.
Conclusão
Este estudo oferece uma primeira olhada em como a IA generativa pode refletir a identidade de lugar em diferentes cidades. Ao analisar tanto textos quanto imagens produzidas pela IA, os pesquisadores estão abrindo caminho para que planejadores e designers urbanos usem essas ferramentas em seu trabalho, visando melhores espaços urbanos e branding das cidades. Apesar de algumas limitações, os achados sugerem um futuro promissor para integrar a IA generativa na compreensão das identidades urbanas.
Título: Understanding Place Identity with Generative AI
Resumo: Researchers are constantly leveraging new forms of data with the goal of understanding how people perceive the built environment and build the collective place identity of cities. Latest advancements in generative artificial intelligence (AI) models have enabled the production of realistic representations learned from vast amounts of data. In this study, we aim to test the potential of generative AI as the source of textual and visual information in capturing the place identity of cities assessed by filtered descriptions and images. We asked questions on the place identity of a set of 31 global cities to two generative AI models, ChatGPT and DALL-E2. Since generative AI has raised ethical concerns regarding its trustworthiness, we performed cross-validation to examine whether the results show similar patterns to real urban settings. In particular, we compared the outputs with Wikipedia data for text and images searched from Google for image. Our results indicate that generative AI models have the potential to capture the collective image of cities that can make them distinguishable. This study is among the first attempts to explore the capabilities of generative AI in understanding human perceptions of the built environment. It contributes to urban design literature by discussing future research opportunities and potential limitations.
Autores: Kee Moon Jang, Junda Chen, Yuhao Kang, Junghwan Kim, Jinhyung Lee, Fábio Duarte
Última atualização: 2023-06-06 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2306.04662
Fonte PDF: https://arxiv.org/pdf/2306.04662
Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.