2023 [KDD] ProbTTE

您所在的位置:网站首页 材料与化工学科评估第五轮结果公布 2023 [KDD] ProbTTE

2023 [KDD] ProbTTE

2024-07-02 13:18:23| 来源: 网络整理| 查看: 265

论文标题:Uncertainty-Aware Probabilistic Travel Time Prediction for On-Demand Ride-Hailing at DiDi

作者: Hao Liu, Wenzhao Jiang, Shui Liu, Xi chen

机构: 香港科技大学(广州)、滴滴出行

发表: 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. (KDD 2023 Ads Track)

0.论文概述

预计到达时间估计(Travel Time Estimation,TTE)旨在准确预测从出发地到目的地的预期行程持续时间。作为全球最大的网约车平台之一,滴滴每天回答数十亿条 TTE 查询。 TTE的质量直接决定客户的体验以及乘客与司机匹配的有效性。然而,现有研究主要将TTE视为确定性回归问题,并专注于提高单个标签的预测精度,忽略了各种动态上下文因素引起的行程时间不确定性。为此,本文提出了一个概率框架 ProbTTE,用于不确定性感知的旅行时间预测。具体来说,该框架首先将单标签回归任务转换为多类分类问题,以估计隐式旅行时间分布。此外,还提出了一种自适应局部标签平滑方案来捕获软旅行时间标签之间的有序类间关系。此外,构建了一个按路线对数正态分布正则化器,以从大规模历史旅行数据中吸收先验知识。通过明确考虑出行不确定性,所提出的方法不仅提高了 TTE 准确性,而且还提供了额外的出行时间信息,以有利于网约车的下游任务。对现实世界数据集的大量实验证明了所提出的框架与最先进的旅行时间预测算法相比的优越性。此外,ProbTTE已于2022年底在滴滴生产中部署,赋能各类订单调度服务,显着改善乘客和司机的体验。

1. 问题动机

预计到达时间估计(Travel Time Estimation,TTE)问题,大多数现有方法主要侧重于提高单标签预测精度(即实际出行时间),而忽视了各种动态上下文因素(例如意外事件引起的拥堵、临时交通管制)引起的出行时间的不确定性 )。如图 1 所示,行程时间遵循长尾分布。在不同的交通状况下,每条路线的行车时间可能会有很大差异。在不考虑这种概率性质的情况下无缝预测单标签旅行时间可能会导致有偏差的预测。

long-tail travel time

图1滴滴出行平台2021年5月至2021年6月北京真实历史出行的长尾出行时间分布

为解决上述为题,主要有如下三大挑战:

不可观察的旅行不确定性。给定路线的行驶时间很大程度上取决于其未来的行驶环境(例如拥堵、天气状况、意外的交通事件)。尽管现有方法集成了各种实时上下文特征来提高 TTE 准确性,但未来的旅行上下文仍然未知。一种直接的方法可能是利用额外的预测模型来推断未来的旅行动态。然而,这种方法可能会引入额外的噪声并导致严重的错误累积。此外,车载传感器(例如GPS)收集的某次行程的实际行程时间是一个标量标签。在单标签监督信号下对随机旅行时间分布进行显式建模具有挑战性。路线变化分布。在实际过程中,每条路线的隐含行程时间分布可能不同。例如,郊区高速公路上的出行时间通常比市中心的主干道稳定得多,这不仅是因为交通流畅,而且出行环境更简单(例如,路口和红绿灯较少)。如何正确建模按路线行驶时间分布以提高预测性能是第二个挑战。服务实用性。作为一项基础服务,TTE 支持各种下游叫车任务,例如订单调度和路线推荐 。概率出行时间分布为下游任务提供了额外的出行信息,提高了TTE服务的效用。然而,滴滴现有的 TTE 服务涉及复杂的基础设施流程和高度优化的神经架构,从头开始开发概率 TTE 服务成本高昂且不切实际。因此,如何在考虑当前系统架构的情况下经济有效地实现概率行程时间预测是另一个挑战。2 本文贡献

(1) 首次尝试研究网约车平台的概率出行时间估计问题。 (2) 提出了一种概率框架ProbTTE,用于提高 TTE 服务的准确性和实用性。 ProbTTE 与预测模型无关,可以轻松地与现有的 TTE 替代方案集成。 (3)在滴滴打车平台部署了ProbTTE,成功提高了出行时间预测的准确性和订单调度质量。我们分享部署和集成经验,造福社区。 (4) 对现实世界 TTE 数据集和两个订单调度服务的广泛实验证明了我们提出的框架针对五个基线和之前的订单调度策略的有效性。

3.问题定义

路网:\mathcal{G}=(V,E),其中v_i\in V表示路口,e_{ij}\in E表示v_i和v_j之间的路段。一条路线(route)表示为:r=\{e_1,e_2,...,e_k\},k为一条路线中路段的中枢。

定义1:行程查询(Trip query)4元组q=(l_o,l_d,t,r),分别表示出发地,目的地,行程开始时间和行程路线。叫车平台中起止点通常与地理位置(经纬度)并且与兴趣点(POI)相关。 y_i:实际行程时间问题1:给定查询q,估计概率旅行时间分布\hat y,即\hat y=\mathcal{F}(q,\mathcal{G}),\mathcal{G}表示路网,\mathcal{F}(·)是需要学习的函数。4.模型架构

ProbTTE

:个人感觉模型图回归和分类两个模块反了,因为分类应该是离散的,回归是连续的,与图上标注不符

4.1 行程时间分布编码(Distributional Travel Time Encoding,DTTE)

以往的TTE模型主要侧重于确定性单标签的指导下捕获特征和时空依赖性。这限制了模型的性能和实用性。在该模块中,首先将原始回归任务转换为多分类任务,其目标是预测离散行程时间分布作为一般(任意)分类。将真实值y\in \mathbb{R}_{>0}编码为one-hot向量。为了解决长尾分布问题,均匀划分时间间隔也可能让模型过度加强对少数类别的关注。考虑行程时间分布的情况下分割标签空间,如图3所示,通过持续时间和密度来定义每个旅行时间间隔的边界。

b_{j}=\left\{\begin{array}{ll} j \cdot \Delta t, & \text { if } 0 \leq j \leq M \\ M \cdot \Delta t+j \cdot \Delta T, & \text { if } M+1 \leq j \leq N, \\ +\infty, & \text { if } j=M+N+1 \end{array}\right. \\

其中,\Delta t和\Delta T分别为普通行程时间间隔和长尾旅行时间间隔的预定义窗口大小,M和N控制普通和长尾行程时间的超参。现实中\Delta t \ll \Delta T,给定一个行程查询q和真实值y,可以推导出one-hot标签y\in \mathbb{R}^{|C|},C是行程时间类别的集合,其中c_j \in C,如果y\in[b_j,b_{j+1}]置为1,否则为0。预测的时间\hat y输出为: \hat{\mathbf{y}}=\frac{e^{\mathbf{w}_{i}^{\top} \mathbf{x}}}{\sum_{j=1}^{|C|} e^{\mathbf{w}_{j}^{\top} \mathbf{x}}} 其中w_i是第i类可学习参数,损失函数为交叉熵: L_{cla}==\frac{1}{|Q|}\sum_{i=1}^{|Q|}y_i \cdot log(\hat y_i)

旅行时间标签离散化

DTTE的优势主要有2个:(1)多分类目标在模型训练过程中保留了更多的信息,提高了行程时间预测的准确率。(2)分布输出提供了额外的信息,例如预测的置信度,这在下游任务中很有用。

4.2 自适应局部标签平滑(Adaptive Local Label Smoothing,ALLS)

one-hot编码可能使得模型对于目标类过于自信。为了缓解该问题,采用标签平滑(LS),将软标签除正确的分类外,每个类设置为\frac{\epsilon}{|C|-1},将真实概率从1降低到1-\epsilon。但是,简单地为每个类分配同等重要性会忽略多类旅行时间预测问题中的类间关系。为了解决上述限制,对于行程查询 q,我们修改了|C|维one-hoe向量y如下, y[j]=\left\{\begin{array}{ll} p,&\text{if} |j-c|=0,\\ \frac{1-p}{2\tau}, &\text{if} 1\le|j-c|\le\tau\\ 0,&\text{else}, \end{array}\right. \\

其中 y[ j] 表示 y 的第 j 类,c 表示真实行程时间分类,p 是控制标签平滑度的超参,\tau 是控制局部分布支持宽度的另一个超参。ALLS 的主要修改是软标签仅分配给具有真实值类位置感知的 2\tau 最近邻类。设定为: \tau=\frac{y\cdot\alpha}{\Delta t},p=\frac{\Delta t}{\Delta t+y\cdot\beta} 其中\alpha和\beta是从历史行程数据经验得出的先前行驶时间分布的参数。\alpha和\beta满足\frac{1-p}{2\tau}\le p,化简为: \beta\le2\alpha 通过这种方式,模型被强制使用自适应时间窗口更加关注真实值周围的附近类。

4.3 路线级先验正则化

两种不同路径的概率分布,可以用两种不同的对数正态先验分布很好地拟合。

每条路径的概率行驶时间分布可能会有所不同。上图说明了实际旅行路线的多样化分布。在之前的研究中,由于数据稀疏性,很难量化这种路线分布。滴滴作为全球最大的网约车平台之一,积累了大规模的出行数据,这为提升概率出行时间预测提供了新的机会。为此,本文提出了一个额外的正则化模块来整合这种路线先验知识。引入了参数化对数正态分布来拟合路线长尾先验 Y_{i} \sim p_{i}(y)=\frac{1}{y \sqrt{2 \pi \sigma_{i}^{2}}} \exp \left(-\frac{\left(\log y-\mu_{i}\right)^{2}}{2 \sigma_{i}^{2}}\right) logY_i的均值\mu_i和方差为\sigma^2_i

\mathrm{p}_{i}[j]=\left\{\begin{array}{ll} p_{i}\left(\frac{b_{j}+b_{j+1}}{2}\right) \cdot\left(b_{j+1}-b_{j}\right), & \text { if } 0 \leq j \leq|C|-2 \\ p_{i}\left(\frac{2 b_{j}+\Delta T}{2}\right) \cdot \Delta T, & \text { if } j=|C|-1 \end{array}\right. \\

其中p_i[j]表示p_i第j个元素,p_i是连续分布p_i(y)的连续表示。最小化\hat y_i和p_i的交叉熵获取最接近模型输出分布的对数正态分布。 \operatorname*{min}_{\mu_{i},\sigma_{i}}{\mathcal{L}}_{\rho r i o r}=-{\hat{y}}_{i}\cdot\log(\mathbf{p}_{i}). 上式是一个光滑凸问题,最优解满足 \nabla L_{prior} = 0,求解得到解析解 \mu_{i}={\hat{y}}_{i}\cdot\log({\mathsf{b}}),\ \sigma_{i}^{2}={\hat{y}}_{i}\cdot\left(\log({\mathsf{b}})-\mu_{i}\cdot\mathbf{1}_{|C|}\right)^{2} 其中\mathbf{b}=\left({\frac{b_{0}+b_{1}}{2}},\ldots,{\frac{b_{|C|-2}+b_{|C|-1}}{2}},{\frac{2b_{|C|-1}+\Delta T}{2}}\right),\boldsymbol 1_{|C|}表示大小为|C|的全1向量。通过估计的对数正态分布,我们可以直接获得最可能的行程时间和预期的行程时间 \hat{y}_{i}^{max}:=\arg\operatorname*{max}_{y}p_{i}(y)=e^{\mu_{i}-\sigma_{i}^{2}}, \\ \hat{y}_{i}^{exp}:=\mathbb{E}[Y_{i}]=e^{\mu_{i}+\sigma_{i}^{2}/2}=\hat{y}_{i}^{m a x}\cdot e^{\frac{3}{2}\sigma_{i}^{2}}. \\ \hat{y}_{i}^{m a x}和\hat{y}_{i}^{exp}均可以作为预测结果,\hat{y}_{i}^{exp}表示为放大后的理想校准,为\hat y ^{max}的e^{\frac{3}{2}\sigma^2}倍。这在极端条件下(例如,交通拥堵)下更能防止行驶时间低估问题。在实践中,选择期望 \hat{y}_{i}^{exp}作为概率预测模型的联合输出之一。引入新的损失函数,让模型能在最可能的行驶时间和校准后的行驶时间之间自我适应平衡。 {\mathcal{L}}_{e x p}={\frac{1}{|Q|}}\sum_{i=1}^{[Q]}|{\dot{y}}_{i}^{e x p}-y_{i}|. \\

4.4 联合优化

结合前文所使ProbTTE的联合损失函数为: {\cal L}={\cal L}_{r e g}+\lambda_{1}{\cal L}_{c l a}+\lambda_{2}{\cal L}_{e x p}, 其中\mathcal{L}_{reg}是回归损失,\mathcal{L}_{cla}是分明类损失。\mathcal{L}_{exp}是平衡损失。

5.应用和部署5.1 应用

展示了ProbTTE的两个应用,(1)行程时间的基本预测(2)行程分布分数的评估。第一个应用程序在路线规划中起着重要作用,第二个应用程序为订单调度服务提供了有效的指标。

5.1.1 行程时间预测

\hat{y}_{i}^{\widehat{\jmath}}=\lambda\hat{y}_{i}+(1-\lambda)\hat{y}_{i}^{e x p} \\

5.1.2 订单调度的行程分配分数

分布分数通过利用 ProbTTE 分布输出中编码的附加信息来反映行驶时间预测的不确定性。直观地说,最大概率越高、单调性越好的最集中分布,最大概率两侧的分布得分就越大,表明旅行时间不确定性越小。因此,订单调度服务可以直接采用分配分数,以过滤掉具有较高取件时间不确定性的潜在司机,并防止调度行程时间不确定性较高的订单。

\begin{array}{c}{{s(\hat{\mathbf{y}})=\displaystyle\sum_{0\leq i数据集信息

数据集描述:如表1所示,采用滴滴在北京和上海两个真实的网约车数据集,每个行程查询对应一个出行记录。删除了异常记录,例如旅行时间少于一分钟和行驶速度超过 120 公里/小时。每条路线的平均路段数分别为 115 和 87 个。每条路线的平均长度分别为5.55公里和4.27公里。动态道路特征(例如,交通速度)每 5 分钟更改一次。对于每条记录,历史特征(例如,车辆的平均速度)来自过去七周。评价指标:MAE,RMSE,MAPE,满意度(Satisfaction Rate):表示MAPE低于10%的行程比率6.2 RQ1 TTE性能比较

TTE性能

在两个数据集上,ProbTTE性能最佳,其中ProbTTE与滴滴TTE服务目前使用的WDR模型相比,在不修改原有神经网络架构的情况下,实现了持续改进。WDR在多个指标方面优于最先进的HierETA(KDD 22,笔者也做了解读:2022 [KDD] 多视图解释轨迹:用于预计到达时间的层次自注意网络),这是因为WDR在生产环境中进行了高度优化。这也证明了机器学习系统工程优化对于实际部署的重要性。

6.3 RQ2 消融实验

(1) ProbTTE -WoSR去除了自适应局部标签平滑(ALLS)和路由先验正则化模块。

(2) ProbTTE -WLS 将本地自适应标签平滑替换为原版标签平滑方案。

(3) ProbTTE -WoR 删除了路由上的先验正则化模块。

(4) ProbTTE -WND 用常规正态分布代替对数正态分布。

消融实验

6.4 RQ3 超参实验

超参实验

6.4 RQ4 在线测试

除了旅行时间预测的实验外,还进一步证明了所提出的概率预测框架对下游任务的实用性。具体来说,从 2022 年 9 月 16 日至 2022 年 9 月 29 日在五个城市进行了在线 A/B 测试,共涉及 300 万个订单发送请求。比较了滴滴部署的两种网约车服务(即业务I和服务II)的当前无分配评分(WoDS)的无分配分数(WoDS)的优化订单调度策略。在实验中,将乘车请求随机抽样到不同的订单调度策略,以考虑公平性。

在线测试

7 结论

本文提出了ProbTTE,一种用于不确定性感知旅行时间估计的概率预测框架。通过明确量化出行时间分布并将其纳入现有的TTE服务,该框架提高了出行时间预测的准确性,有利于各种下游网约车任务。具体来说:

通过分布旅行时间编码器将单标签回归任务转换为多类分类任务。然后设计自适应局部标签平滑模块,通过考虑类间序数关系来缓解过度置信问题通过利用大规模历史行程数据,我们提出了一种路由先验正则化器来强制模型吸收先验分布知识。在真实世界数据集上的大量实验证明了所提框架的优越性。自2022年以来,ProbTTE已在滴滴的网约车平台上部署和测试。概率框架改进了旅行时间估计服务,并在准确性能和实用性方面使多个TTE授权的任务受益。该框架与模型无关,这意味着它可以轻松地与其他TTE模型集成并扩展以支持一般回归问题。

相关阅读:



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭