Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computadores e sociedade# Computação e linguagem

A IA Revoluciona a Coleta de Dados de Viagem Urbana

Novo método de IA melhora a coleta de dados de viagem para um planejamento urbano mais eficiente.

Prabin Bhandari, Antonios Anastasopoulos, Dieter Pfoser

― 7 min ler


A IA transforma asA IA transforma asinformações sobre viagensurbanas.planejamento mais eficaz.estudos de viagens urbanas pra umDados gerados por IA estão mudando os
Índice

Entender como as pessoas se movem nas cidades é muito importante. Isso ajuda a tornar as cidades lugares melhores para viver. Boas ideias podem resultar em sistemas de transporte melhores, menos trânsito e melhor acesso ao transporte público. Mas, conseguir dados precisos sobre como as pessoas viajam pode ser complicado. Métodos tradicionais, como rastreamento de usuários e pesquisas de viagem, têm seus problemas. Por exemplo, muitas pessoas não querem compartilhar suas informações de viagem por questões de privacidade. Além disso, as pesquisas de viagem podem ser caras e muitas pessoas não respondem a elas.

Nova Abordagem para Coletar Dados de Viagem

Para resolver esses problemas, foi proposta uma nova forma de coletar dados de viagem. Esse método usa inteligência artificial, especialmente Modelos de Linguagem Grandes (LLMs), que são projetados para gerar texto. Esses modelos podem criar dados de pesquisas de viagem com base no conhecimento existente. Usando prompts, conseguimos fazer esses modelos simular respostas semelhantes às de pesquisas reais, tornando a coleta de dados mais barata e fácil sem comprometer a privacidade.

Como o Estudo Funciona

Esse estudo testa como esse novo método baseado em IA se sai em diferentes cidades dos EUA. Ele compara os dados gerados pela IA com dados reais de pesquisas de viagem. A pesquisa analisa dados em três níveis:

  1. Nível de Padrão: Compara métricas gerais como a média de locais visitados e o tempo médio de viagem.
  2. Nível de Viagem: Aqui, as viagens são vistas como jornadas completas de um lugar para outro. Essa análise usa probabilidades sobre viajar de um local a outro.
  3. Nível de Cadeia de Atividades: Examina a sequência de lugares visitados por uma pessoa ao longo do dia.

A pesquisa abrange tanto LLMs proprietários quanto de código aberto. Descobriu-se que até modelos básicos de código aberto, quando ajustados com dados do mundo real, podem criar dados sintéticos que são muito parecidos com os resultados reais de pesquisas de viagem.

Desafios Significativos na Pesquisa de Mobilidade Urbana

As cidades estão cada vez mais lotadas, e entender como as pessoas se movem é fundamental. Boas informações de mobilidade ajudam os planejadores urbanos a tomarem decisões que melhoram a vida dos residentes. No entanto, coletar esses dados não é simples. Os métodos atuais costumam envolver rastreamento de usuários via GPS ou a realização de pesquisas, mas ambos têm desvantagens. O rastreamento levanta questões de privacidade, e as pesquisas muitas vezes têm taxas de resposta baixas e custos altos.

A Necessidade de um Novo Método

Diante desses problemas, há uma necessidade de uma abordagem inovadora para os estudos de mobilidade urbana. O método proposto usa modelos de linguagem grandes para gerar pesquisas de viagem simuladas, aproveitando o extenso conhecimento que esses modelos possuem. Essa abordagem busca superar as barreiras enfrentadas pelos métodos tradicionais de coleta de dados.

Como Funcionam os Modelos de Linguagem Grandes

Modelos de linguagem grandes são sistemas avançados de IA que conseguem criar textos parecidos com os humanos. Eles são treinados em grandes quantidades de dados, permitindo gerar textos coerentes e relevantes ao contexto. Quando solicitados corretamente, esses modelos podem fornecer respostas que simulam a escrita e o comportamento humano, incluindo o comportamento de viagem.

Configurando o Estudo

Para esse estudo, vários modelos, incluindo Llama-2 e GPT-4, foram encarregados de gerar pesquisas de viagem. Esses modelos receberam prompts específicos desenhados para imitar diários de viagem reais. A IA foi solicitada a detalhar locais visitados, horários de chegada e partida, e tipos de locais.

Para garantir que o modelo gerasse dados precisos, um amostrador populacional também identificou várias demografias, como idade e raça, para combinar com a população da área-alvo. Um amostrador de datas selecionou datas aleatórias para as pesquisas de viagem.

Avaliação dos Dados Gerados

Os dados de viagem gerados foram então comparados com dados reais da Pesquisa Nacional de Viagem Familiar (NHTS) realizada em 2017. A avaliação foi detalhada, usando três níveis principais de análise para fornecer insights sobre o quão bem os dados sintéticos refletiam os dados do mundo real.

Comparações no Nível de Padrão

No nível de padrão, o estudo analisou comportamentos de viagem agregados, como o número médio de locais visitados e o tempo total de viagem. O modelo Llama-2, especialmente quando afinado com dados reais de pesquisas, produziu números que se aproximavam muito dos resultados reais das pesquisas. Em contraste, outros modelos superestimaram ou subestimaram essas métricas.

Comparações no Nível de Viagem

Passando para o nível de viagem, a análise comparou viagens específicas feitas por indivíduos. Ao calcular probabilidades de transição, a pesquisa avaliou quão provável era que indivíduos viajassem de um local para outro. Novamente, o Llama-2 afinado mostrou a melhor correspondência com os dados reais das pesquisas, superando outros modelos.

Comparações no Nível de Cadeia de Atividades

No nível de cadeia de atividades, a sequência de locais visitados foi analisada. O modelo Llama-2 afinado não só correspondeu a muitas das cadeias de atividades reais, mas também demonstrou um alto grau de realismo. Uma melhoria notável foi observada na capacidade do modelo de criar cadeias de atividades que espelhavam aquelas encontradas em pesquisas reais.

Importância da Afinação

O processo de afinar os modelos com dados de pesquisas reais se mostrou crucial. Mesmo sem dados locais, os modelos se saíram muito bem, mostrando que podiam generalizar informações de várias regiões. Essa robustez sugere que os dados gerados podem ser confiáveis, mesmo para lugares com informações limitadas ou sem pesquisas de viagem disponíveis.

Comparação com Outras Técnicas de Simulação

O método baseado em LLM proposto também foi comparado com técnicas de simulação existentes, como o modelo Patterns of Life (POL), que usa uma abordagem baseada em agentes para gerar dados de mobilidade. Os resultados indicaram que a abordagem LLM superou o POL em quase todas as métricas, alcançando uma melhor correspondência com os comportamentos de viagem do mundo real.

Conclusão

Resumindo, a abordagem proposta baseada em IA para avaliação de mobilidade urbana mostra grande potencial. A capacidade dos modelos de linguagem grandes de gerar dados de viagem sintéticos permite uma coleta de dados mais eficiente e econômica. Essa tecnologia pode desempenhar um papel vital na melhoria da pesquisa de mobilidade urbana e na melhoria dos esforços de planejamento urbano. O estudo demonstra que, com a devida afinação, até modelos simples podem criar dados de viagem realistas que podem ser usados para informar melhores decisões para a vida urbana.

Direções Futuras

Olhando para frente, há planos de expandir essa abordagem para outras regiões e refinar o sistema para incluir dados de localização mais precisos. Isso poderia aprimorar significativamente a usabilidade desse método para entender a mobilidade urbana em uma escala global, tornando a vida nas cidades mais eficiente e agradável para todos os envolvidos.

Fonte original

Título: Urban Mobility Assessment Using LLMs

Resumo: Understanding urban mobility patterns and analyzing how people move around cities helps improve the overall quality of life and supports the development of more livable, efficient, and sustainable urban areas. A challenging aspect of this work is the collection of mobility data by means of user tracking or travel surveys, given the associated privacy concerns, noncompliance, and high cost. This work proposes an innovative AI-based approach for synthesizing travel surveys by prompting large language models (LLMs), aiming to leverage their vast amount of relevant background knowledge and text generation capabilities. Our study evaluates the effectiveness of this approach across various U.S. metropolitan areas by comparing the results against existing survey data at different granularity levels. These levels include (i) pattern level, which compares aggregated metrics like the average number of locations traveled and travel time, (ii) trip level, which focuses on comparing trips as whole units using transition probabilities, and (iii) activity chain level, which examines the sequence of locations visited by individuals. Our work covers several proprietary and open-source LLMs, revealing that open-source base models like Llama-2, when fine-tuned on even a limited amount of actual data, can generate synthetic data that closely mimics the actual travel survey data, and as such provides an argument for using such data in mobility studies.

Autores: Prabin Bhandari, Antonios Anastasopoulos, Dieter Pfoser

Última atualização: 2024-08-22 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2409.00063

Fonte PDF: https://arxiv.org/pdf/2409.00063

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes