自动驾驶车辆轨迹规划方法、装置、电子设备及存储介质

2024-06-26 13:15| 来源: 网络整理| 查看: 265

1.本发明属于轨迹规划技术领域，特别涉及一种自动驾驶车辆轨迹规划方法、装置、电子设备及存储介质。

背景技术：

2.随着通信技术和人工智能的进步，联网和自动驾驶汽车(connected;autonomous vehicles，cav)取代人工驾驶汽车(human-being driving vehicle，hdv)成为城市交通的主要交通工具将变成主流趋势。然而，在cav完全取代hdv，实现车路协同之前，混行交通状态(cav与hdv同时存在并分享城市道路通行权)作为从传统城市交通环境向高度互联的新型城市交通环境发展的中间状态，是更有可能出现的情景。混行状态下对cav的行为预测和路径规划功能的准确提出了更严苛的要求。这是主要因为hdv驾驶员的决策和行为存在不可预测性，很难要求hdv配合cav规划好的轨迹通行，对于cav和hdv的通行权分配规则成为主要问题。3.根据交通控制的类型，交叉路口可以分为受控制(包括信号控制、“停车”或“让行”标志控制)以及不受控制，不受控制的十字路口是没有信号灯或标志的十字路口，在世界各地的城市和乡村地区都很普遍。4.现有关于自动驾驶和人工驾驶混合交通流环境下的路口管理，更多地依赖于信号灯的调节。而在通行权模糊的复杂交通环境中，尤其是无信号交叉口，现有技术无法解决自动驾驶汽车所面临的决策困难和通行权归属不清的问题。先前的研究表明，交叉路口的驾驶员行为可能会严重影响交通强度和通行能力。尤其是在无信号路口，因为驾驶员在进入路口时无法获得正向的反馈。此外，周围驾驶员行为的不确定性进一步增加了发生冲突的风险。由于人类驾驶员的限制，hdv具有更大的随机性和不可预测性，导致无信号路口cav的轨迹预测与规划存在较大的困难。混合环境中，自动驾驶汽车因为不能综合心理和环境等因素而无法对人工驾驶员意图进行全面理解，故而无法保证在无信号交叉口高效、安全的通行管理。

技术实现要素：

5.本说明书实施例的目的是提供一种自动驾驶车辆轨迹规划方法、装置、电子设备及存储介质。6.为解决上述技术问题，本技术实施例通过以下方式实现的：7.第一方面，本技术提供一种自动驾驶车辆轨迹规划方法，该方法包括：8.获取控制区内所有车辆的车辆集合；9.若所述车辆集合中包括至少一个自动驾驶车辆和至少一个人工驾驶车辆，判断所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域是否存在空间冲突；10.若所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域存在空间冲突，则根据第一预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。11.第二方面，本技术提供一种自动驾驶车辆轨迹规划装置，该装置包括：12.获取模块，用于获取控制区内所有车辆的车辆集合；13.处理模块，用于若所述车辆集合中包括至少一个自动驾驶车辆和至少一个人工驾驶车辆，判断所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域是否存在空间冲突；14.规划模块，用于若所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域存在空间冲突，则根据第一预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。15.第三方面，本技术提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现如第一方面的自动驾驶车辆轨迹规划方法。16.第四方面，本技术提供一种可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面的自动驾驶车辆轨迹规划方法。17.由以上本说明书实施例提供的技术方案可见，该方案可以使自动驾驶车辆在混合环境下高效安全的通过无信号交叉口。附图说明18.为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。19.图1为本技术提供的自动驾驶车辆轨迹规划方法的流程示意图；20.图2为本技术提供的无信号路口博弈双方示意图；21.图3为本技术提供的驾驶员风险决策区间示意图；22.图4为本技术提供的信号灯相位图；23.图5为本技术提供的混行状态下的无信号交叉口示意图；24.图6为图5对应的车辆三维轨迹图；25.图7为三辆hdv在路口区域内的轨迹及交互车辆对其产生的风险值示意图；26.图8为运行时间内通过路口的车辆平均速度示意图；27.图9为车辆平均延迟示意图；28.图10为车辆平均通行时间示意图；29.图11为运行时间内驶离交叉口的车辆平均能源消耗示意图；30.图12为运行时间内交叉口的吞吐量示意图；31.图13为本技术提供的自动驾驶车辆轨迹规划装置的结构示意图；32.图14为本技术提供的电子设备的结构示意图。具体实施方式33.为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。34.在不背离本技术的范围或精神的情况下，可对本技术说明书的具体实施方式做多种改进和变化，这对本领域技术人员而言是显而易见的。由本技术的说明书得到的其他实施方式对技术人员而言是显而易见得的。本技术说明书和实施例仅是示例性的。35.关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等，均为开放性的用语，即意指包含但不限于。36.本技术中的“份”如无特别说明，均按质量份计。37.下面结合附图和实施例对本发明进一步详细说明。38.参照图1，其示出了适用于本技术实施例提供的自动驾驶车辆轨迹规划方法的流程示意图。39.如图1所示，自动驾驶车辆轨迹规划方法，可以包括：40.s110、获取控制区内所有车辆的车辆集合。41.具体的，控制区包括受控制的交叉路口和不受控制的交叉路口，其中受控制的交叉路口例如受信号灯控制或“停车”或“让行”等标志控制等的交叉路口，不受控制的交叉路口即为没有信号灯或标志等的交叉路口。42.控制区内所有车辆包括仅有自动驾驶车辆(cav)，及既有自动驾驶车辆又有人工驾驶车辆(hdv)，还包括仅有人工驾驶车辆(该情况不在本技术讨论的范围内)。43.可以对控制区内所有车辆进行分类，所有cav加入集合ct，所有hdv加入集合ht，控制区内所有车辆的车辆集合jt＝ct∪ht。44.s120、若所述车辆集合中包括至少一个自动驾驶车辆和至少一个人工驾驶车辆，判断所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域是否存在空间冲突。45.具体的，空间冲突，是指cav和hdv行驶的路线有冲突点。即当车辆集合中既有cav又有hdv时，需判断cav和hdv的行驶路线在路口区域是否存在空间冲突，而当车辆集合中仅有cav而没有hdv时，无需判断是否存在空间冲突。46.例如，东西车道及南北车道均为双向四车道，当cav由西向东直行而hdv由北向东左转时，cav和hdv行驶的路线没有冲突点，即cav和hdv的行驶路线在路口区域不存在空间冲突；当cav由西向东直行而hdv由东向南左转时，cav和hdv行驶的路线有冲突点，即cav和hdv的行驶路线在路口区域存在空间冲突。47.假设，车道i∈i上的与其他车道上的车辆的关系用c(i,m)来表示，通过下式判断两车行驶路线在路口区域是否存在空间冲突，判断方法如下：48.49.若c(i,m)＝0，说明车道i与车道m上的车辆不存在冲突风险；若c(i,m)＝1，说明车道i与车道m上的车辆存在冲突风险。50.可选的，若所述车辆集合中包括至少一个自动驾驶车辆且无人工驾驶车辆，则根据第二预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。51.具体的，第二预建cav-hdv的轨迹规划模型是纯粹自动环境下的规划模型。可以通过下述实施例的方式进行构建，也可以通过其他方式进行构建。52.s130、若所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域存在空间冲突，则根据第一预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。53.具体的，第一预建cav-hdv的轨迹规划模型是在混合交通流环境下cav的轨迹规划模型，及在纯粹自动环境下cav的轨迹规划模型基础上添加hdv的风险约束。可以通过下述实施例的方式进行构建，也可以通过其他方式进行构建。54.可选的，若所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域不存在空间冲突，则根据第二预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。55.具体的，当车辆集合中既包括cav又包括hdv但cav和hdv之间不存在空间冲突，此时，对cav进行轨迹规划时，也无需考虑hdv，即采用纯粹自动环境下的cav的轨迹规划模型(即第二预建cav-hdv的轨迹规划模型)进行轨迹规划即可。56.在一个实施例中，可以通过下述构建第二预建cav-hdv的轨迹规划模型。57.本实施例建立基于中心化控制的minlp(mixed integer nonlinear programming，混合整数非线性规划)模型，以确定纯粹自动环境下的cav的最佳无冲突轨迹。58.每一辆控制区内的cav都可以通过v2x技术，将自己的位置、速度、加速度和预测轨迹等信息传递给中央控制器，同时也能从中央控制器获取其他车辆的相关信息。我们让γ表示研究期间捕获cav轨迹的时间维度的离散时间步长总数，其中t∈t＝{1,2,…,γ-1}表示cav采取行动(加速或减速)的时刻。在t时刻，cav的运动学约束包括如下：59.距离约束：[0060][0061]速度约束：[0062][0063]加速度约束：[0064][0065]速度取值范围约束：[0066][0067]加速度取值范围约束：[0068][0069]加速度变化率取值范围约束：[0070][0071]cav要保证与其他车辆保持安全距离，约束条件如下：[0072]跟驰车辆安全轨迹约束：[0073][0074]路线冲突车辆安全轨迹约束：[0075][0076]其中，为t时刻车道i上的车辆j相对于的距离，为参照位置的车道i的起始点，为t时刻车道i上的车辆j的速度，为t时刻车道i上的车辆j的加速度，为t时刻车道i上的车辆j的加速度变化率；vmax为速度最大值；amin为加速度最小值；amax为加速度最大值；umin为加速度变化率的最小值；umax为加速度变化率的最大值；lv为cav和hdv的车身长度；τ为cav的反应时间；fim为车道i、m的冲突点与车道i起始点之间的距离，之间的距离，为与车道i存在路线冲突的车道集合；d为车道上cav或hdv之间的最小安全距离。t∈t，i为路口车道集合，i＝{lane1,lane2,…,lane8}；为车道i上的所有车辆的集合，i∈i,t∈t；为车道i上的所有cav的集合；为车道i上的所有hdv的集合。[0077]基于约束条件(1)～(8)，提出中心化控制的全局优化目标函数：[0078][0079]其中，α,β为多目标规划的系数。[0080]通过非负辅助变量将非线性的目标函数线性化：[0081]o.f.min[0082]s.t.[0083][0084][0085][0086]ρij∈{0,1}ꢀꢀ(15)[0087]其中，和为线性化变量，m为极大的常数。[0088]然而，上述模型存在两个问题：[0089]1)新进入控制区域的车由于缺乏足够的协调，导致全局轨迹规划存在次优解或不可行解。[0090]2)约束(8)具有非凸性，它将可行域划分为两个相互独立的区域，问题成为minlp，导致求解问题的复杂性增大。[0091]针对第一个问题，引入松弛变量δ以保证问题存在可行解。约束(7)(8)可改写成如下形式：[0092]松弛后的跟驰车辆安全轨迹约束：[0093][0094]松弛后的路线冲突车辆安全轨迹约束：[0095][0096]松弛变量的取值范围约束：[0097][0098]其中，δmax为松弛变量的最大值。[0099]针对第二个问题，引入二元变量将非线性约束线性化，从而将minlp转换为milp，这样能够极大降低问题的复杂性。约束(17)重写后如下：[0100][0101][0102][0103][0104][0105][0106]为了将cav轨迹规划的可行解推向全局最优，重新定义目标函数(10)：[0107][0108]是一个极大的常量，可以保证取到最小值，从而避免出现安全约束过度松弛的情况。[0109]除了安全、高效和舒适，能源损耗也是一个必不可少的约束条件。在此假设系统内所有车辆均为电动汽车，以电动汽车为对象研究cav在无信号路口的能源消耗最小约束。根据(ehsani et al.,2018；mi et al.,2011；zhang and mi,2011)的研究，车辆特性和道路运行条件都影响功率需求，可以量化为车辆牵引功率：[0110][0111]其中，m为车辆重量(kg)；ρair为空气密度(kg/m3)；ar为迎风面积(m2)；cd为阻力系数；cr为滚动摩擦系数；c1,c2为随路面类型、路况和车辆轮胎类型而变化的滚动阻力参数；g为重力加速度(9.8m/s2)；为道路等级(弧度)。[0112]能源消耗(即t时刻车道i上的车辆j消耗的电能)(kwh/km)可通过下式计算：[0113][0114]s是[0,t]时段内行驶的距离。该函数计算的是连续时段t内的车辆电能消耗，在本技术中，时间步长是离散的，因此每一时间步长内车辆的电能消耗可表示为：[0115][0116]在假设每一辆车质量相同的前提下，发现电力消耗与cav的速度相关。因此考虑到能量消耗最少，需要最小化速度变化。对目标函数(25)做如下修改：[0117][0118]其中，α,β,γ为多目标规划的系数，ei为目的地的车道i的终止点。[0119]考虑到实际运行过程中cav可能遇到的突发事件，为了避免预测时段过长引发的轨迹误差过大，我们采用模型预测控制(mpc)来应对系统的动态特性，即cav获得预测时域轨迹规划信息后，只执行第一步动作，然后向前滚动一个时间步长，重复上述规划过程。[0120]至此，形成了第二预建cav-hdv的轨迹规划模型problem1，该问题属于mixed-integer liner programming(milp，混合整数线性规划)：[0121]problem 1：(29)[0122]s.t.:(1)～(6)，(11)～(16)，(18)～(24)。[0123]其中，式(29)为目标函数；式(1)～(6)为运动学约束，(11)～(15)为目标函数线性化约束、(16)、(18)～(24)为松弛后cav与其他车辆保持安全距离的约束。[0124]由于hdv的行为特征因人而异，存在不确定性，使得usi(unsignalized intersection，无信号灯交叉口)的管理问题充满严峻的挑战。cav可以通过v2x技术接受并分享本车和其他车的详细信息，并根据信息预测轨迹，以最合适的速度通过路口。hdv做不到这一点。hdv的行为高度依赖驾驶员的自我感受。驾驶员的决策行为受环境、心理、生理等众多内外部因素的共同影响，存在着极大的差异。这种差异给usi带来无序性和不可预测性。为了寻找hdv混行状态的无信号交叉口管理的解决方案，需要先对hdv的行为有所了解。hdv在路段和路口的行为遵循不同的规则。[0125]例如，hdv在路段遵循krauss跟车模型，则可以采用krauss跟车模型，计算hdv在路段上的速度。[0126]在每个时间步长t，车辆的速度适应于前车的速度，避免在随后的时间步长产生碰撞。安全速度的计算过程如下：[0127][0128][0129]其中，为t时刻车道i上的车辆j的前方车辆的集合，t∈t，κ为司机反应时间(1秒)。[0130]车辆的期望速度取下面三个中的最小值：可能的最大速度vmax、车速加上最大加速度如上计算的安全速度因此，其期望车速为：[0131][0132]考虑到驾驶员的不完美特征，仿真中认为，驾驶员会犯错从而没有完全执行期望的速度，这样需要实际速度减去随机的“人为错误”，形成一个驾驶员驾驶汽车的速度区间，在此区间内随机选择一个速度值赋予hdv：[0133][0134]其中ε是扰动系数。由于车辆不得向后行驶，所以车辆当前速度是计算的速度和零的最大值。[0135]hdv在无信号灯控制的双向四车道组成的独立路口可以形成多方博弈局面，例如可以采用基于距离判断的通行权博弈模型，判断hdv在无信号灯路口时选择让行还是通行。[0136]示例性的，为了简化问题，通过制定一个简单的规则来尽量还原hdv在无信号路口的驾驶行为。t∈t时刻，车道i∈i上的与其冲突车辆同时出现在路口区域，hdv j根据自己与其他车辆至相对应冲突点的距离的关系，确定主要博弈对象，即：[0137][0138]其中，为车道i上的hdv j到冲突点的距离，为车道m上的车辆n到冲突点的距离。[0139]取其中rateijmn最大的车辆n，作为hdvj的主要博弈对象，其他车辆则被忽略，按照上述方法寻找自己的主要交互对象，这样，决策区内的hdv将构成对状或链状博弈关系。hdvj和车辆n进行通行权博弈，我们分别称为博弈方1和博弈方2，如图2所示。[0140]在图2中，博弈方1到冲突点的距离比博弈方2远，即博弈方分别有抢行和让行两种行为可供选择。当博弈方双方都选择抢行时，两人都会面临撞车的惩罚。当双方都选择让行时，双方并没有安全隐患，也就没有损失。当其中一方抢行，另一方让行时，抢行的一方率先通过冲突点，获得较大的效率收益，让行的一方不会遭到惩罚也不会获得收益，此时构成了一个胆小鬼博弈模型(t》r》s》p)，双方得益矩阵如表1所示。[0141]表1胆小鬼博弈中博弈双方的得益矩阵[0142][0143]先通过的车比后通过的车花的时间要少。在出行过程中，时间成本是影响驾驶员决策的重要因素之一。假设驾驶员的驾驶水平、生理状态和车辆性能相同。当两名司机都选择让步策略时，他们将为在交叉口等待对方所浪费的时间付出代价。当两名驾驶员都选择了通行策略时，他们将在十字路口的交通冲突中承担更多的成本损失，甚至造成交通事故。当两个驾驶员分别选择这两种策略时，选择通过策略的驾驶员先通过，选择让步策略的驾驶员后通过。在这个例子中，t+s》2r。可以发现该博弈有两个纯策略纳什均衡，分别是(让行，抢行)和(抢行，让行)。在该博弈中，如果一方知道了另一方的策略，那么与对方相互配合显然才是明智的选择，双方的利益具有较大的一致性。双方不仅不害怕对方知道自己的选择，甚至希望对方了解自己的选择。然而，博弈方双方对于两个纳什均衡的偏好是矛盾的，博弈方2偏好前一个纳什均衡，博弈方1偏好后一个纳什均衡。[0144]在胆小鬼博弈中最重要的一点是，如果能确定其他博弈方会选择通过，那么就必须选择让步策略。因此，只要博弈方能够找到一种方法让其他博弈方相信博弈方绝对不会让行，那么它就会迫使其他博弈方选择让行。设置了驾驶员行为偏好规则，那就是当rate＝1时，驾驶员选择通行和让行的概率均为1/2，当rate》1时，驾驶员将选择让行策略，当rate《1时，驾驶员将选择通过策略。在当前情境中，博弈方1显然比博弈方2有更大的rate，因此，在当前这个胆小鬼博弈中，混合策略的纳什均衡是(让行，抢行)。时原理相同，在此不做赘述。[0145]若博弈方1按上述博弈策略采取行动却发现博弈方2并未采取相配合行动，说明博弈方2与其他博弈方构成了更高级别的博弈关系。在下一时间步长，博弈方1将配合博弈方2的策略调整自己的行为，直到新的博弈方3出现，形成优先级高于博弈方1-博弈方2的博弈关系博弈方1-博弈方3。[0146]基于上述hdv在无信号灯交叉口的通行模型，构建混合交通流环境下第一预建cav-hdv的轨迹规划模型。[0147]进入路口控制区，面临来自四个方向车流的碰撞风险。本发明设置速度差和距离差两个变量，来建立hdv的风险模型，并根据计算的风险感知值(取值范围是[0,1])和当前二者的速度、位置来决定下一步的行为，称其为hdv对于cav的风险约束条件。[0148]车道i∈i上的和车道上的车辆在路线冲突，假设二者均会以不超过最大允许速度的速度进入控制区，即两车在控制区将进行实时风险判断。hdvj的风险感知值计算如下：[0149][0150][0151][0152][0153][0154][0155]λ1+λ2＝1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(41)[0156]0＜λ1,λ2＜1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(42)[0157]其中，σ为风险感知系数；λ1为速度差的权重系数；λ2为距离差的权重系数；为hdv j和车辆n的距离差；为hdv j和车辆n的速度差。[0158]在式(35)中，驾驶员通过风险感知系数σ来体现其驾驶风格，σ值导致的风险感知值偏差是正值或者负值也意味着驾驶员在行为上表现出保守或者激进的不同驾驶风格。在式(36)、(41)、(42)中，λ1,λ2分别是和的权重系数，表示驾驶员在预测感知风险时对两种影响因素重要程度的考量，二者的和等于1，且取值范围是[0,1]。参数μ1,μ2是为了将不同单位体系的参数作归一化处理。式(37),(38)分别约束为hdv j到冲突点fim的距离和车辆n到冲突点fim的距离。式(39)～(40)分别约束hdv j和车辆n的距离差和速度差。[0159]驾驶员都有一个固定的可接受风险感知水平用以指导其行为。同时，风险平衡理论(rht)认为人们所感受到的目标风险水平会尽量趋近于内心所期望的目标风险水平，两者一旦出现较大的差异，驾驶员会决策出一系列驾驶操作行为使二者恢复大致一致的状态，从而达到一种动态的平衡。根据rht，驾驶员群体的行为特征具有不均质性，每个驾驶员具有不同的风险接受水平。(liu et al.,2017)指出，综合统计驾驶员的驾驶行为数据并建立定量方法分析结果后发现，驾驶员的让行或通行行为所对应的风险感知值会对应在某一个区间内，如图3所示。[0160]假设这两个区间的相交区间为[a,b]，若risk在区间[0,a)内，说明驾驶员认为当前的风险感知值不会对安全行驶造成影响，hdv将选择“通过”；当risk在区间(b,1]内，说明驾驶员认为当前的驾驶状态会在未来导致碰撞，hdv将减速来降低risk以达到驾驶员可以接受的风险水平；若风险感知值落在区间[a,b]内，hdv可能做出让行或“通过”的决策，区间[a,b]被认为是hdv的可接受风险水平，这样就形成了驾驶员过路策略选择，见式(43)。驾驶员依据风险感知值决定驾驶策略(让行或通行)，随后驾驶员根据个人驾驶风格选择对应的加速度值。[0161][0162]根据上述风险感知区间式(43)，中央控制器对控制区内的cav添加关于hdv的风险约束条件，使cav对于hdv造成的风险值处于安全范围，为hdv创造低风险的驾驶环境，即利用cav的可控制和可预测性消除hdv行为的随机性对系统的影响。[0163]对于cav j，若其前车是hdv，利用mpc(multimedia personal computer，多媒体个人计算机)预测前车在预测时域的轨迹，并添加如下约束：[0164]混行环境下松弛后的跟驰车辆安全轨迹约束：[0165][0166][0167]其中，dh为cav与hdv的最小安全距离，dh＞d表示cav与hdv的最小安全距离大于cav与cav的最小安全距离。[0168]对于cav j，需要添加关于其冲突hdv n的风险约束：[0169][0170]其中，riskmnij为车道i上的cav j给车道m上的hdv n造成的风险感知值。[0171]上述，式(36)～(42)，(44)～(46)构成了cav面对hdv的轨迹规划约束条件。[0172]但是，式(37)～(38)是非凸的，下述对式(37)其进行线性化处理：[0173][0174][0175][0176][0177]同样地，下述对式(38)进行线性化处理：[0178][0179][0180][0181][0182]为解决求解过程中的无可行解的问题，式(36)需要添加松弛变量作为惩罚函数。可以改写成如下形式：[0183][0184]至此，形成了第一预建cav-hdv的轨迹规划模型problem.2，(miqcp，混合整数二次约束规划)：[0185]problem 2：(29)[0186]s.t.:(1)～(6)，(11)～(15)，(39)～(42)，(44)～(55)[0187]其中，式(29)为目标函数；式(1)～(6)为运动学约束，(11)～(15)为目标函数线性化约束，式(39)～(42)、(46)～(55)为hdv对于cav的风险约束，式(44)～(45)为cav与前车安全距离约束。[0188]本技术提供的自动驾驶车辆轨迹规划方法，利用风险均衡理论，将驾驶员的风险感知纳入自动驾驶轨迹规划，形成无信号交叉口有效的通行状态。[0189]本技术提供的自动驾驶车辆轨迹规划方法，在无信号交叉口混合交通流环境，不需要将自动驾驶汽车和人工驾驶汽车在空间上或时间上相互隔离。[0190]本技术提供的自动驾驶车辆轨迹规划方法，通过针对不同类型的车辆添加不同的约束条件，分别形成minlp和miqcp问题，借助mpc，结合车辆的当前状态预测交叉口车辆的未来轨迹，寻找可行的解决方案避免碰撞，有效解决了复杂交通环境下随机性和不可控性给无信号交叉口带来的管理难题。[0191]本技术提供的自动驾驶车辆轨迹规划方法，在处理cav与hdv交互的过程中，将影响hdv驾驶员过路决策行为的因素考虑在内，构建了cav针对hdv潜在的风险感知值函数，从而保证cav为hdv提供安全、高效的通行环境。[0192]本技术提供的自动驾驶车辆轨迹规划方法与固定时间信号控制的交叉口的交通数据结果进行对比，从安全、效率、能耗等几个方面对不同交通需求和情景加以比较，数值研究表明，本技术方法与固定时间信号控制相比，降低了时间成本，提高了通行效率，保证了安全性能，节省了通行能耗。[0193]下述通过计算实验仿真验证，证明本技术提供的自动驾驶车辆轨迹规划方法的可行性。仿真主要从车辆平均速度、车辆平均通行时间、车辆平均延迟、车辆平均能耗、路口吞吐量等在内的移动性性能指标进行横向和纵向对比，从而在安全、效率、能耗等方面评估本发明中的混合交通流环境下的自动驾驶轨迹规划方法。具体的仿真证明过程与结果如下：[0194]1)场景描述与参数设定[0195]本技术的仿真场景在一个双向四车道(一条左转专用车道，一条直行专用车道)的无信号交叉口。交叉口被划分为两个区域，即交互区域和接近区域。交叉口配置了中央控制器，可以收集交互区域自动/人工驾驶汽车的位置、速度、加速度信息，储存在状态集合，并且可以与所有cav进行实时信息交换，而不考虑任何信号时延和检测错误。每条车道只服务一个方向的车流，不考虑换道模型和超车行为。为了避免混合车流中hdv所占比例过高导致的路口管理秩序失灵，本技术将混行的范围限制在0～50％。[0196]利用sumo的需求分布，设计了3种不同流量的纯粹自动环境的方案，基于直行车道的[800,1500]veh/lane/h、左转车道的[300,500]veh/lane/h。每种流量又设计了5种10％～50％不同混行比例的方案，进行仿真和测试，表3总结了18种上述方案。[0197]表3[0198][0199]除了本技术提供的自动驾驶车辆轨迹规划方法之外，还对上述18种方案进行了用sumo开发的固定时间信号控制的测试，以进行比较。信号控制分为两个阶段：阶段一包括车道1、2、5、6上的车辆绿灯通行27秒、黄灯等待3秒，车道3、4、7、8红灯禁止通行30秒；阶段二则正好相反。信号灯控制周期和相位状态如图4所示(图中红绿灯颜色均用灰色示出)。[0200]2)安全性的验证[0201]图5展示了无信号路口同时出现8辆车时的混行交通状态。3辆长方形的车是hdv，5辆三角形的车是cav。以该路口的通行情况为对象来分析混行状态下的安全性表现。8辆车关于时间和轨迹的三维图在图6进行展示。从图中可知，按照本技术提供的自动驾驶车辆轨迹规划方法，cav和hdv可以通过交互和博弈，无碰撞地通过无信号交叉口。[0202]图7(包括图7a、图7b、图7c)展示了三辆hdv在交叉口区域内的轨迹，及其存在潜在冲突的车辆对其产生的风险值。图中黑色粗线条表示轨迹随时间的变化，线条上为空心方形和线条上为实心方形线分别表示冲突cav和hdv对驾驶员产生的风险值随时间的变化趋势，将驾驶员采取减速行为的风险值阈值设置为0.7。由图可知，在本技术方法控制下，cav对其冲突车辆驾驶员所产生的风险值，随着时间推移可以控制在阈值范围内，这意味着该方法可以使控制范围内的cav为hdv提供符合现实安全和驾驶员心理预期的驾驶环境，当hdv驾驶员面对4个冲突方向的不同类型的车辆时，可以将更多精力放在与hdv的交互上，大大降低路口的混乱状态和碰撞风险。[0203]3)通行效果验证[0204]验证结果表明：在co-usicl控制下，车辆以期望的速度行驶并保持安全的行进路线，直到可能发生的冲突迫使其减速为止。经过冲突地区或获得足够的安全范围后，他们会加速直到再次达到期望的速度。在ftsc控制下，cav在红色信号之前停在十字路口；但是在co-usicl下，车辆会略微降低速度以避免冲突并继续通过交叉路口。与ftsc相比，co-usicl控制下的cav停车的次数近乎零，随着混行比例的增大，由于hdv的不可控制性，偶尔会出现停车情况，但是cav可以在中央控制器的协调下很快恢复畅通的交通状态，因此混行比例的增加对于本技术方法控制的交通状态影响不大。然而ftsc控制下的路口各项指标受混行比例的影响更明显，这是因为cav和hdv相比，反应时间和最小车间距更小，也就意味着cav可以比hdv更快地做出停车或启动的反应。在co-usicl控制下的路口，不管是在纯粹自动环境下，还是在混行状态下，路口的交通表现均要优于ftsc控制下的路口。[0205]4)自动驾驶汽车在本方法和固定时间信号控制两种控制方法下的移动性能对比[0206]图8显示了运行时间内通过路口的车辆平均速度。几种状态下co-usicl控制的cav平均速度明显大于ftsc。这是因为前者不受信号灯周期影响，仅需要根据交通状态提前做出速度调节，同时为hdv提供了安全的驾驶环境，避免了cav/hdv急刹车和等待导致的速度波动过大。在纯粹自动环境下，拿case1和case3对比，随着交通量的增加，co-usicl的车辆平均速度下降了1.88％，而ftsc则下降了16.65％。车辆平均速度也会随着混行比例的增大而下降，混行比例从0升至50％的过程中，co-usicl的降幅为2.92％，ftsc的降幅为18.51％。显然co-usicl控制的车辆受车流量变化和混行比例变化导致的速度波动更小。[0207]图9-10显示了车辆平均延迟和车辆平均通行时间。可以看出，ftsc的两项指标明显高于co-usicl，且随着混行比例的增大，两项指标的值都会增大，但是ftsc的增长幅度远大于co-usicl。具体而言，在纯粹自动环境下的case1(直行800veh/lane/h，左转300veh/lane/h)，两种控制方法的车辆平均延迟分别为0.2442秒和15.5840秒。当需求量增加到case3时，两种控制方法的车辆平均延迟分别为0.3833秒和20.0961秒，ftsc控制的车辆平均延迟显著增大。在case2中，随着混行比例的增大，两种控制方法的两个指标均有增加，显然混行比例对于ftsc的影响要远甚对co-usicl的影响。我们提出的方法消除了交叉路口的完全停靠，从而大大减少了延迟和通行时间。[0208]图11展示了运行时间内驶离交叉口的车辆平均能源消耗。正如所预期的，由于需要在红灯时停在交叉口前方，ftsc控制的车辆平均能耗指标远高于co-usicl控制的车辆。具体而言，后者的能耗平均仅为前者的48.75％。上述提到，在控制其他因素不变的情况下，能耗受到车辆的速度和加速度两个因素的影响，而混行比例不会显著影响co-usicl控制下的车辆速度变化，因此，co-usicl控制的车辆平均能耗能够在混行比例变化的前提下，保证较稳定且较低的能源消耗。[0209]图12展示了运行时间内交叉口的吞吐量。可以看到，在需求量较低的case1，两种控制方法都可以较好保证通行量。通过将需求量从case1增加到case3，路口通行量的差异也变大了。co-usicl控制的交叉口吞吐量明显高于ftsc控制的交叉口。混行比例对co-usicl控制的路口吞吐量影响甚微。然而，对于ftsc控制的路口，混行比例的增大会显著降低单个路口的吞吐量。这是因为cav的反应时间、安全间隙均小于hdv，一旦在信号控制环境中出现排队情况，hdv很容易形成交通波，而cav可以化解交通波现象，从而减少拥堵，提高路口吞吐量。这表明我们的算法大大增加了交叉路口的通行能力。[0210]参照图13，其示出了根据本技术一个实施例描述的自动驾驶车辆轨迹规划装置的结构示意图。[0211]如图13所示，自动驾驶车辆轨迹规划装置1300，可以包括：[0212]获取模块1310，用于获取控制区内所有车辆的车辆集合；[0213]处理模块1320，用于若所述车辆集合中包括至少一个自动驾驶车辆和至少一个人工驾驶车辆，判断所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域是否存在空间冲突；[0214]规划模块1330，用于若所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域存在空间冲突，则根据第一预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。[0215]可选的，规划模块1330，还用于若所述至少一个自动驾驶车辆与所述至少一个人工驾驶车辆的行驶路线在路口区域不存在空间冲突，则根据第二预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。[0216]可续的，处理模块1320，还用于若所述车辆集合中包括至少一个自动驾驶车辆且无人工驾驶车辆，则根据第二预建cav-hdv的轨迹规划模型规划所述自动驾驶车辆的轨迹。[0217]可选的，第二预建cav-hdv的轨迹规划模型的目标函数为：[0218][0219]其中，为t+1时刻车道i上的车辆j相对于的距离，t∈t，i为路口车道集合；为车道i上的所有车辆的集合；被设为参照位置的车道i的起始点；为t+1时刻车道i上的车辆j的速度，为常数；α,β,γ为多目标规划的系数；[0220]所述第二预建cav-hdv的轨迹规划模型满足运动学约束、目标函数线性化约束、松弛后cav与其他车辆保持安全距离的约束。[0221]可选的，第二预建cav-hdv的轨迹规划模型的松弛后cav与其他车辆保持安全距离的约束包括：[0222][0223][0224][0225][0226][0227][0228][0229][0230]其中，为t时刻车道i上的车辆j相对于的距离；为t时刻车道i上的车辆j的速度；lv为cav和hdv的车身长度；τ为cav的反应时间；fim为车道i、m的冲突点与车道i起始点之间的距离，之间的距离，为与车道i存在路线冲突的车道集合；d为车道上cav或hdv之间的最小安全距离；为车道i上的所有cav的集合；δmax为松弛变量的最大值；为二元变量；m为极大的常数。[0231]可选的，第一预建cav-hdv的轨迹规划模型的目标函数为：[0232][0233]其中，为t+1时刻车道i上的车辆j相对于的距离，t∈t，i为路口车道集合；为车道i上的所有车辆的集合；被设为参照位置的车道i的起始点；为t+1时刻车道i上的车辆j的速度；为常数；α,β,γ为多目标规划的系数；[0234]所述第一预建cav-hdv的轨迹规划模型满足运动学约束、目标函数线性化约束、cav与前车安全距离约束、hdv对于cav的风险约束。[0235]可选的，第一预建cav-hdv的轨迹规划模型的cav与前车安全距离约束及hdv对于cav的风险约束包括：[0236][0237][0238]λ1+λ2＝1[0239]0＜λ1,λ2＜1[0240][0241][0242][0243][0244][0245][0246][0247][0248][0249][0250][0251][0252]其中，为t时刻hdv j和车辆n的距离差；为t时刻hdv j和车辆n的速度差；为t时刻车道i上的hdv j到冲突点的距离，为t时刻车道m上的车辆n到冲突点的距离；为t时刻车道i上的所有hdv的集合；为t时刻车道i上的车辆j的速度；λ1为速度差的权重系数；λ2为距离差的权重系数；σ为风险感知系数；dh为cav与hdv的最小安全距离，dh＞d表示cav与hdv的最小安全距离大于cav与cav的最小安全距离；为松弛变量；riskmnij为车道i上的cav j给车道m上的hdv n造成的风险感知值。[0253]本实施例提供的一种自动驾驶车辆轨迹规划装置，可以执行上述方法的实施例，其实现原理和技术效果类似，在此不再赘述。[0254]图14为本发明实施例提供的一种电子设备的结构示意图。如图3所示，示出了适于用来实现本技术实施例的电子设备300的结构示意图。[0255]如图14所示，电子设备300包括中央处理单元(cpu)301，其可以根据存储在只读存储器(rom)302中的程序或者从存储部分308加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram 303中，还存储有设备300操作所需的各种程序和数据。cpu 301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。[0256]以下部件连接至i/o接口305：包括键盘、鼠标等的输入部分306；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分307；包括硬盘等的存储部分308；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至i/o接口306。可拆卸介质311，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器310上，以便于从其上读出的计算机程序根据需要被安装入存储部分308。[0257]特别地，根据本公开的实施例，上文参考图1描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，计算机程序包含用于执行上述自动驾驶车辆轨迹规划方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分309从网络上被下载和安装，和/或从可拆卸介质311被安装。[0258]附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。[0259]描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。[0260]上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、笔记本电脑、行动电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。[0261]作为另一方面，本技术还提供了一种存储介质，该存储介质可以是上述实施例中前述装置中所包含的存储介质；也可以是单独存在，未装配入设备中的存储介质。存储介质存储有一个或者一个以上程序，前述程序被一个或者一个以上的处理器用来执行描述于本技术的自动驾驶车辆轨迹规划方法。[0262]存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。[0263]本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

【本文地址】

公司简介

联系我们