Simple Science

Ciência de ponta explicada de forma simples

# Informática# Bases de dados# Inteligência Artificial

Apresentando a LaDe: Um Novo Conjunto de Dados para Pesquisa em Entrega de Última Milha

A LaDe traz insights cruciais sobre a logística de entrega de última milha usando dados do mundo real.

― 9 min ler


LaDe: Conjunto de DadosLaDe: Conjunto de Dadosde Entrega da ÚltimaMilhaúltima milha.pesquisa e a eficiência na entrega deNovo conjunto de dados melhora a
Índice

A entrega de última milha é uma parte importante da Logística que conecta o centro de envio com o cliente final. Essa etapa inclui tanto o processo de coleta de Pacotes quanto a entrega deles. Não é só vital para satisfazer os clientes, mas também é a parte mais cara e que mais consome tempo do processo de envio. Com o crescimento das cidades e o aumento das compras online, o estudo da entrega de última milha ganhou atenção de muitos pesquisadores e especialistas da indústria. Muitos artigos foram publicados sobre problemas relacionados a essa entrega, incluindo como planejar rotas e prever tempos de entrega.

Os pesquisadores estão cada vez mais usando técnicas de machine learning para resolver problemas na entrega de última milha. Uma das principais necessidades para essa pesquisa é ter acesso a bons Conjuntos de dados. Ter uma quantidade grande de dados de qualidade pode ajudar muito a avançar ideias nessa área, assim como outros conjuntos de dados ajudaram em campos como visão computacional e processamento de linguagem natural. No entanto, até agora, não houve um conjunto de dados amplamente conhecido e disponível ao público focado especificamente na entrega de última milha. Isso fez com que a pesquisa ficasse, na maioria, restrita a um pequeno número de empresas, limitando tanto a transparência quanto o progresso. Além disso, a falta de conjuntos de dados públicos dificulta que profissionais do setor desenvolvam melhores algoritmos para a entrega de última milha.

Para resolver essa lacuna, estamos lançando um novo conjunto de dados chamado LaDe, que é o primeiro do tipo na indústria. LaDe inclui dados sobre coletas e entregas de pacotes e possui várias características principais:

  1. Grande Escala: O conjunto de dados abrange mais de 10 milhões de pacotes manuseados por 21.000 entregadores ao longo de um período de seis meses.
  2. Informação Abrangente: Inclui informações essenciais sobre cada pacote, como localização e requisitos de tempo, além de detalhes sobre as ações dos entregadores durante os eventos de entrega.
  3. Diversidade: O conjunto de dados contém informações de vários cenários, incluindo entregas em diferentes cidades com características e padrões únicos.

Nós avaliamos LaDe aplicando-o a três tarefas e executando vários modelos estabelecidos. A natureza diversificada e detalhada de LaDe pode ajudar significativamente pesquisadores em logística, mineração de dados e áreas relacionadas.

Visão Geral da Entrega de Última Milha

A entrega de última milha desempenha um papel crítico no processo de envio, conectando o ponto de entrega do pacote com os clientes. É um fator chave para garantir a satisfação do cliente, enquanto é a parte mais cara do envio. Ao longo dos anos, pesquisadores de várias disciplinas têm se concentrado em problemas importantes relacionados à entrega de última milha. Isso inclui otimização de rotas de entrega, previsão de tempos de chegada e modelagem de fluxos de trabalho.

Em estudos recentes, os pesquisadores têm usado métodos de machine learning para lidar com desafios dentro da entrega de última milha. Para esse campo, ter acesso a conjuntos de dados grandes e de alta qualidade é necessário para avançar na pesquisa. Infelizmente, a ausência de conjuntos de dados disponíveis publicamente resultou em oportunidades limitadas para exploração e desenvolvimento de novas ideias.

Para preencher essa lacuna, criamos o LaDe, um extenso conjunto de dados para pesquisas sobre entrega de última milha, coletado por uma empresa líder em logística. Esse conjunto de dados captura tanto as fases de coleta quanto de entrega, permitindo que os pesquisadores analisem vários aspectos da logística de última milha.

Conjunto de Dados LaDe

LaDe é o primeiro conjunto de dados abrangente de entrega de última milha que é acessível ao público. Ele tem várias vantagens que o destacam em relação a conjuntos de dados existentes:

  1. Grande Escala: LaDe consiste em mais de 10 milhões de pacotes, tornando-o um dos maiores conjuntos de dados disponíveis publicamente neste campo.
  2. Abrangente: O conjunto de dados inclui informações detalhadas sobre pacotes, os respectivos entregadores e vários eventos de tarefas que ocorrem ao longo do processo de entrega.
  3. Diversidade: Os dados são coletados de diferentes cidades, permitindo que os pesquisadores explorem o impacto de diferentes demografias e características urbanas nos padrões de entrega.

Os ricos detalhes em LaDe permitem que ele suporte uma ampla gama de atividades de pesquisa. Nós o testamos em três tarefas: previsão de rotas, previsão de tempo estimado de chegada (ETA) e previsão de gráficos espaço-temporais. Através desses exemplos, demonstramos como LaDe pode impulsionar a pesquisa em logística de entrega de última milha.

Processo de Coleta de Dados

LaDe foi coletado por uma das maiores plataformas de logística da China. O processo para obter dados para esse conjunto envolve várias etapas:

  1. Um cliente faz um pedido para a coleta de pacotes através de um portal online.
  2. A plataforma de logística atribui esse pedido a um entregador.
  3. O entregador coleta o pacote dentro de um período de tempo especificado e retorna ao depósito.
  4. O pacote é então enviado pela rede logística até chegar ao depósito alvo.
  5. Finalmente, o entregador pega o pacote do depósito e leva até o cliente final.

A entrega de última milha inclui as etapas três e cinco, onde os entregadores interagem com os clientes durante a coleta e entrega. Notavelmente, durante a fase de coleta, os entregadores podem não saber quais pacotes vão pegar até que os clientes façam os pedidos, acrescentando um nível de imprevisibilidade ao processo.

LaDe é uma rica fonte de dados do mundo real que captura as complexidades da entrega de última milha. O conjunto de dados apresenta várias cidades na China, cada uma com características únicas. Ao examinar dados de diferentes áreas, os pesquisadores podem obter insights sobre como os ambientes urbanos afetam a logística de entrega.

Detalhes e Estatísticas do Conjunto de Dados

LaDe é dividido em dois segmentos principais: LaDe-P, que foca no processo de coleta de pacotes, e LaDe-D, que se centra no processo de entrega. O conjunto completo inclui dados de um total de 10.667.000 pacotes e mais de 600.000 entregas, representando uma visão abrangente da logística de última milha.

Cada entrada em LaDe-P fornece informações cruciais sobre o pacote, incluindo:

  • ID do pacote
  • Janela de tempo para coleta
  • Coordenadas de localização
  • O entregador responsável pela entrega
  • O tempo relacionado à aceitação e conclusão da entrega

LaDe-D igualmente possui informações relevantes sobre a fase de entrega, incluindo horários de chegada e locais de entrega.

O conjunto de dados inclui informações de cinco grandes cidades na China, cada uma selecionada por suas demografias únicas e padrões espaço-temporais. Essa diversidade enriquece o conjunto de dados, permitindo que pesquisadores analisem vários cenários de entrega de última milha.

Descobertas e Observações Chave

Através da análise de LaDe, várias descobertas significativas foram notadas:

  • Padrões de Tempo: As coletas de pacotes tendem a ocorrer em horários específicos do dia, especialmente atingindo o pico de manhã e no final da tarde.
  • Padrões de Distância: Em média, a distância entre coletas consecutivas de pacotes por um entregador geralmente é inferior a um quilômetro.
  • Tipos de Área: Uma parte significativa das entregas de pacotes vem de tipos específicos de áreas urbanas, mostrando a importância do conhecimento local na otimização de rotas de entrega.

Esses insights estabelecem LaDe como um ativo valioso para pesquisadores que buscam entender a dinâmica da logística de última milha.

Aplicações de Pesquisa

A versatilidade de LaDe permite que ele suporte diversas tarefas dentro da pesquisa sobre entrega de última milha. Em nosso artigo, exploramos três tarefas principais:

  1. Previsão de Rotas: Isso envolve estimar a futura rota que um entregador tomará com base em seus pacotes atuais e condições.
  2. Previsão de ETA: Essa tarefa se concentra em prever quando um entregador terminará suas entregas, o que é crítico para a satisfação do cliente.
  3. Previsão de Gráficos Espaço-Temporais: Essa tarefa visa prever o número de pacotes em determinadas regiões ao longo de um período especificado, ajudando a otimizar recursos logísticos.

Ao aplicar métodos de machine learning a LaDe, mostramos como isso pode facilitar essas tarefas e levar a melhores soluções na logística de entrega de última milha.

Limitações do Conjunto de Dados

Embora LaDe seja um conjunto de dados inovador para entrega de última milha, ele tem algumas limitações:

  1. Cobertura Geográfica: LaDe atualmente inclui dados apenas de cidades selecionadas na China, que podem não representar a entrega de última milha em outras regiões ou países.
  2. Dados Faltantes: Em algumas instâncias, a localização dos entregadores durante eventos específicos pode não ser registrada devido a problemas tecnológicos. Isso resulta em uma proporção de dados faltantes no conjunto.

Apesar dessas limitações, LaDe continua sendo um recurso poderoso para pesquisadores. Sua abrangência e grande escala permitem uma infinidade de estudos e análises para aprimorar a compreensão da logística de última milha.

Conclusão

O lançamento do LaDe marca um avanço significativo no estudo da entrega de última milha. Ao fornecer um conjunto de dados grande, abrangente e acessível ao público, essa iniciativa abre novas avenidas para pesquisa em logística e gestão da cadeia de suprimentos. Com aplicações em otimização de rotas, previsões de tempos de entrega e mais, o LaDe está prestes a se tornar um recurso central para acadêmicos e profissionais.

Em resumo, o LaDe visa fomentar a colaboração entre pesquisadores de várias áreas e incentivar o desenvolvimento de soluções inovadoras para os desafios da entrega de última milha. O conjunto de dados não só oferece uma riqueza de informações, mas também atua como um catalisador para futuros estudos com o objetivo de melhorar a eficiência na logística e aprimorar a experiência do cliente.

Fonte original

Título: LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry

Resumo: Real-world last-mile delivery datasets are crucial for research in logistics, supply chain management, and spatio-temporal data mining. Despite a plethora of algorithms developed to date, no widely accepted, publicly available last-mile delivery dataset exists to support research in this field. In this paper, we introduce \texttt{LaDe}, the first publicly available last-mile delivery dataset with millions of packages from the industry. LaDe has three unique characteristics: (1) Large-scale. It involves 10,677k packages of 21k couriers over 6 months of real-world operation. (2) Comprehensive information. It offers original package information, such as its location and time requirements, as well as task-event information, which records when and where the courier is while events such as task-accept and task-finish events happen. (3) Diversity. The dataset includes data from various scenarios, including package pick-up and delivery, and from multiple cities, each with its unique spatio-temporal patterns due to their distinct characteristics such as populations. We verify LaDe on three tasks by running several classical baseline models per task. We believe that the large-scale, comprehensive, diverse feature of LaDe can offer unparalleled opportunities to researchers in the supply chain community, data mining community, and beyond. The dataset homepage is publicly available at https://huggingface.co/datasets/Cainiao-AI/LaDe.

Autores: Lixia Wu, Haomin Wen, Haoyuan Hu, Xiaowei Mao, Yutong Xia, Ergang Shan, Jianbin Zhen, Junhong Lou, Yuxuan Liang, Liuqing Yang, Roger Zimmermann, Youfang Lin, Huaiyu Wan

Última atualização: 2024-01-02 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2306.10675

Fonte PDF: https://arxiv.org/pdf/2306.10675

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes