Presentamos LaDe: Un Nuevo Conjunto de Datos para la Investigación en Entregas de Última Milla
LaDe ofrece información clave sobre la logística de entrega de última milla usando datos del mundo real.
― 10 minilectura
Tabla de contenidos
La entrega de última milla es una parte clave de la Logística que conecta el centro de envío con el cliente final. Esta etapa incluye tanto el proceso de recoger Paquetes como de entregarlos. No solo es vital para satisfacer a los clientes, sino que también es la parte más costosa y que más tiempo consume del proceso de envío. A medida que las ciudades crecen y las compras en línea aumentan, el estudio de la entrega de última milla ha llamado la atención de muchos investigadores y expertos de la industria. Se han publicado muchos documentos sobre los problemas relacionados con la entrega de última milla, incluyendo cómo planificar rutas y predecir tiempos de entrega.
Los investigadores están usando cada vez más técnicas de aprendizaje automático para abordar problemas en la entrega de última milla. Una de las principales necesidades para esta investigación es el acceso a buenos Conjuntos de datos. Tener una gran cantidad de datos de calidad puede ayudar mucho a avanzar en ideas en esta área, al igual que otros conjuntos de datos lo han hecho en campos como la visión por computadora y el procesamiento de lenguaje natural. Sin embargo, hasta ahora, no ha habido un conjunto de datos conocido y disponible públicamente centrado específicamente en la entrega de última milla. Esto ha llevado a que la investigación se confine principalmente a un pequeño número de empresas, limitando tanto la transparencia como el progreso. Además, la falta de conjuntos de datos públicos dificulta que los profesionales de la industria desarrollen mejores algoritmos para la entrega de última milla.
Para abordar esta brecha, presentamos un nuevo conjunto de datos llamado LaDe, que es el primero de su tipo en la industria. LaDe incluye datos sobre la recogida y entrega de paquetes y tiene varias características clave:
- Gran Escala: El conjunto de datos cubre más de 10 millones de paquetes manejados por 21,000 mensajeros durante un período de seis meses.
- Información Completa: Incluye información clave sobre cada paquete, como su ubicación y requisitos de tiempo, así como detalles sobre las acciones de los mensajeros durante los eventos de entrega.
- Diversidad: El conjunto de datos contiene información de varios escenarios, incluyendo entregas en diferentes ciudades con características y patrones únicos.
Evaluamos LaDe aplicándolo a tres tareas y ejecutando varios modelos establecidos. La naturaleza diversa y detallada de LaDe puede ayudar mucho a los investigadores en logística, minería de datos y campos relacionados.
Visión General de la Entrega de Última Milla
La entrega de última milla juega un papel crítico en el proceso de envío, conectando el punto de entrega del paquete con los clientes. Es un factor clave para garantizar la satisfacción del cliente, aunque sea la parte más costosa del envío. Con el paso de los años, investigadores de varias disciplinas se han enfocado en problemas importantes relacionados con la entrega de última milla. Esto incluye la optimización de rutas de entrega, la predicción de tiempos de llegada y el modelado de flujos de trabajo.
En estudios recientes, los investigadores han estado utilizando métodos de aprendizaje automático para enfrentar desafíos dentro de la entrega de última milla. Para este campo, tener acceso a grandes conjuntos de datos de alta calidad es necesario para avanzar en la investigación. Desafortunadamente, la ausencia de conjuntos de datos disponibles públicamente ha resultado en oportunidades limitadas para la exploración y el desarrollo de nuevas ideas.
Para llenar este vacío, hemos creado LaDe, un extenso conjunto de datos para la investigación de entrega de última milla, recopilado por una empresa líder en logística. Este conjunto de datos captura tanto las fases de recogida como de entrega, permitiendo a los investigadores analizar varios aspectos de la logística de última milla.
Conjunto de Datos LaDe
LaDe es el primer conjunto de datos completo de entrega de última milla que es accesible públicamente. Tiene varias ventajas que lo diferencian de los conjuntos de datos existentes:
- Gran Escala: LaDe consiste en más de 10 millones de paquetes, lo que lo convierte en uno de los conjuntos de datos más grandes disponibles públicamente en este campo.
- Completo: El conjunto de datos abarca información detallada sobre paquetes, los mensajeros correspondientes y varios eventos de tareas que ocurren a lo largo del proceso de entrega.
- Diverso: Los datos se recopilan de diferentes ciudades, lo que permite a los investigadores explorar el impacto de la demografía y las características urbanas en los patrones de entrega.
Los ricos detalles en LaDe permiten que apoye una amplia gama de actividades de investigación. Lo evaluamos en tres tareas: predicción de rutas, predicción del tiempo estimado de llegada (ETA) y pronóstico de gráficos espaciotemporales. A través de estos ejemplos, demostramos cómo LaDe puede impulsar la investigación en la logística de entrega de última milla.
Proceso de Recolección de Datos
LaDe fue recopilado por una de las plataformas de logística más grandes de China. El proceso de obtención de datos para este conjunto implica varios pasos:
- Un cliente realiza un pedido para la recogida de un paquete a través de un portal en línea.
- La plataforma de logística asigna este pedido a un mensajero.
- El mensajero recoge el paquete dentro de un marco de tiempo especificado y regresa al depósito.
- El paquete se envía a través de la red logística hasta que alcanza el depósito objetivo.
- Finalmente, el mensajero de entrega recoge el paquete del depósito y lo lleva al cliente final.
La entrega de última milla incluye los pasos tres y cinco, donde los mensajeros interactúan con los clientes durante la recogida y la entrega. Es importante destacar que durante la fase de recogida, los mensajeros pueden no saber qué paquetes recogerán hasta que los clientes realicen sus pedidos, lo que añade un nivel de imprevisibilidad al proceso.
LaDe es una rica fuente de datos del mundo real que captura las complejidades de la entrega de última milla. El conjunto de datos presenta varias ciudades en China, cada una con características únicas. Al examinar datos de diferentes áreas, los investigadores pueden obtener información sobre cómo los entornos urbanos afectan la logística de entrega.
Detalles y Estadísticas del Conjunto de Datos
LaDe se divide en dos segmentos principales: LaDe-P, que se centra en el proceso de recogida de paquetes, y LaDe-D, que se centra en el proceso de entrega. El conjunto de datos completo incluye datos de un total de 10,667,000 paquetes y más de 600,000 entregas, representando una visión completa de la logística de última milla.
Cada entrada en LaDe-P proporciona información crucial sobre el paquete, incluyendo:
- ID del paquete
- Ventana de tiempo para la recogida
- Coordenadas de ubicación
- El mensajero responsable de la entrega
- Tiempo relacionado con la aceptación y finalización de la entrega
LaDe-D de manera similar contiene información relevante sobre la etapa de entrega, incluyendo tiempos de llegada y ubicaciones de entrega.
El conjunto de datos incluye información de cinco ciudades principales en China, cada una seleccionada por sus demografías y patrones espaciotemporales únicos. Esta diversidad enriquece el conjunto de datos, permitiendo a los investigadores analizar varios escenarios de entrega de última milla.
Hallazgos y Observaciones Clave
A través de un análisis de LaDe, se notaron varios hallazgos significativos:
- Patrones de Tiempo: Las recogidas de paquetes tienden a ocurrir durante horas específicas del día, particularmente alcanzando un pico en la mañana y la tarde tarde.
- Patrones de Distancia: En promedio, la distancia entre recogidas de paquetes consecutivas por un mensajero suele ser inferior a un kilómetro.
- Tipos de Área: Una parte significativa de las entregas de paquetes proviene de tipos específicos de áreas urbanas, mostrando la importancia del conocimiento local en la optimización de rutas de entrega.
Estos hallazgos establecen a LaDe como un recurso valioso para investigadores que buscan entender la dinámica de la logística de última milla.
Aplicaciones de Investigación
La versatilidad de LaDe permite que apoye numerosas tareas dentro de la investigación de entrega de última milla. En nuestro artículo, exploramos tres tareas clave:
- Predicción de Rutas: Esto implica estimar la ruta futura que tomará un mensajero basado en sus paquetes actuales y condiciones.
- Predicción de ETA: Esta tarea se enfoca en pronosticar cuándo un mensajero finalizará sus entregas, lo cual es crítico para la satisfacción del cliente.
- Pronóstico de Gráficos Espaciotemporales: Esta tarea tiene como objetivo predecir el número de paquetes en ciertas regiones durante un período específico, ayudando a optimizar los recursos logísticos.
Al aplicar métodos de aprendizaje automático a LaDe, demostramos cómo puede facilitar estas tareas y llevar a mejores soluciones en la logística de entrega de última milla.
Limitaciones del Conjunto de Datos
Si bien LaDe es un conjunto de datos innovador para la entrega de última milla, tiene algunas limitaciones:
- Cobertura Geográfica: LaDe actualmente solo incluye datos de ciudades seleccionadas en China, lo que puede no representar la entrega de última milla en otras regiones o países.
- Datos Faltantes: En algunas ocasiones, la ubicación de los mensajeros durante eventos específicos puede no estar registrada debido a problemas tecnológicos. Esto resulta en una proporción de datos faltantes en el conjunto.
A pesar de estas limitaciones, LaDe sigue siendo un recurso poderoso para los investigadores. Su exhaustividad y gran escala permiten una multitud de estudios y análisis para mejorar la comprensión de la logística de última milla.
Conclusión
El lanzamiento de LaDe marca un avance significativo en el estudio de la entrega de última milla. Al proporcionar un conjunto de datos grande, completo y accesible públicamente, esta iniciativa abre nuevas avenidas para la investigación en logística y gestión de la cadena de suministro. Con aplicaciones en la optimización de rutas, predicciones de tiempos de entrega y más, LaDe está en camino de convertirse en un recurso central para académicos y profesionales.
En conclusión, LaDe busca fomentar la colaboración entre investigadores de diversos campos y alentar el desarrollo de soluciones innovadoras para los desafíos de entrega de última milla. El conjunto de datos no solo ofrece una gran cantidad de información, sino que también sirve como un catalizador para futuros estudios destinados a mejorar la eficiencia en la logística y enriquecer la experiencia del cliente.
Título: LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry
Resumen: Real-world last-mile delivery datasets are crucial for research in logistics, supply chain management, and spatio-temporal data mining. Despite a plethora of algorithms developed to date, no widely accepted, publicly available last-mile delivery dataset exists to support research in this field. In this paper, we introduce \texttt{LaDe}, the first publicly available last-mile delivery dataset with millions of packages from the industry. LaDe has three unique characteristics: (1) Large-scale. It involves 10,677k packages of 21k couriers over 6 months of real-world operation. (2) Comprehensive information. It offers original package information, such as its location and time requirements, as well as task-event information, which records when and where the courier is while events such as task-accept and task-finish events happen. (3) Diversity. The dataset includes data from various scenarios, including package pick-up and delivery, and from multiple cities, each with its unique spatio-temporal patterns due to their distinct characteristics such as populations. We verify LaDe on three tasks by running several classical baseline models per task. We believe that the large-scale, comprehensive, diverse feature of LaDe can offer unparalleled opportunities to researchers in the supply chain community, data mining community, and beyond. The dataset homepage is publicly available at https://huggingface.co/datasets/Cainiao-AI/LaDe.
Autores: Lixia Wu, Haomin Wen, Haoyuan Hu, Xiaowei Mao, Yutong Xia, Ergang Shan, Jianbin Zhen, Junhong Lou, Yuxuan Liang, Liuqing Yang, Roger Zimmermann, Youfang Lin, Huaiyu Wan
Última actualización: 2024-01-02 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2306.10675
Fuente PDF: https://arxiv.org/pdf/2306.10675
Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.