技术巡猎蔚来智能设备轨迹预测方法、智能设备及计算机可读存储介质。自动驾驶模型

技术巡猎蔚来智能设备轨迹预测方法、智能设备及计算机可读存储介质。自动驾驶模型怎么在“想去哪儿”的同时，也可以知道“该以多快的速度去”---这句话放在高速NOA里，可能还不够刺激。但放到漫游泊车里，就挺有工程味了。停车场里的自动驾驶，不是跑得越快越好，也不是只要能绕开障碍物就算合格。真正难受的场景，往往是车明明没撞、也没压线，但速度节奏让人心里发毛。比如经过柱子突然窜一下，贴着行人还不够克制，快到车位时又刹得很突兀。

这份专利要解决的，就是现有轨迹规划没有把限速有效结合进去的问题。它的输入不复杂，主要包括感知结果、历史轨迹、目标位置和限速值。感知结果负责告诉模型周围有什么，比如车、人、路沿、墙、柱子；历史轨迹告诉模型车刚才怎么走；目标位置告诉模型最后要去哪；限速值则告诉模型当前环境下速度边界在哪里。

这几个东西合在一起，才像一个完整司机的判断现场。只知道目标位置，车会变成“只想完成任务”；只知道障碍物，车会变成“哪里能过就往哪里挤”；只靠规则限速，又容易变成后处理阶段的硬裁剪。工程上最怕的就是这种补丁式逻辑：模型先规划一条轨迹，后面发现速度超了，再强行压速度。听起来简单，实际很容易把轨迹连续性、到达节奏、转向曲率和舒适性一起搞乱。

专利里的做法更靠前。它不是等模型输出之后再处理，而是在模型训练和输入阶段就把限速纳入进去。训练分两步：先用感知样本、历史轨迹样本、目标位置样本和限速样本做监督训练，让模型学会基本的轨迹预测；然后再基于超速奖励函数进行强化训练。这个“奖励函数”普通人可以理解成一套训练里的扣分机制：如果预测轨迹算出来的规划速度超过限速，就把规划速度和限速之间的差值拿出来，通过预设系数转成奖励值或者惩罚项，让模型在迭代里慢慢减少这种超速行为。

这就有意思了。它不是简单告诉车“你不能超过10km/h”，而是让模型在生成未来轨迹的时候，自己意识到速度边界。比如停车场限速很低，车前方又有行人和柱子，模型输出的轨迹点之间距离和时间间隔就应该自然收敛。轨迹点排得太稀、时间又短，算出来速度就高；速度高了，训练阶段就会被惩罚。经过足够多样本之后，模型会倾向于生成更符合限速的轨迹。

专利还写了一个比较关键的预处理：限速值会基于预设离散策略转成限速编号。模型不一定喜欢直接处理一个连续的“46km/h”“12km/h”数字，尤其在轨迹预测这种时序任务里，离散化后更像一种语义标签。类似告诉模型：当前是低速区、中低速区、较高限速区，不同编号对应不同速度边界。这样模型更容易把限速和轨迹生成关联起来。

历史轨迹也类似。专利里提到对历史轨迹点做聚类，得到轨迹点集合和轨迹编号，还可以进一步对时间窗口里的轨迹点偏移量做聚类。普通人可以把它理解成：车过去怎么动，不只是几个坐标点，而是被整理成一套“运动语法”。比如刚才是在缓慢直行、轻微转弯、靠近目标、还是调整姿态。把这些轨迹变化编码之后，模型再接着预测未来轨迹，会比直接丢一堆连续坐标更稳。

网络架构上，它用了嵌入层、线性层、特征合并，再输入 transformer 解码器。这个不用神化。这里的 transformer，不是重点。重点是它把感知表征、历史轨迹表征、目标位置表征、限速表征放在同一个特征空间里，让模型同时考虑“环境、过去、目标、规则”。这四个词放在一起，才比较接近低速自动驾驶的真实难点。

很多人聊智能驾驶，容易被“能不能开”“能不能泊”吸引。但低速自动驾驶做到后面，拼的往往不是功能有没有，而是行为是不是像人。停车场里尤其明显，速度低，空间窄，障碍物多，参与者混杂，车还要在非常有限的空间里做连续微调。这个时候，车的每一次加速、减速、转向，都在影响用户信任。

众力资讯网

技术巡猎蔚来智能设备轨迹预测方法、智能设备及计算机可读存储介质。自动驾驶模型

热门分类

技术巡猎 蔚来 智能设备轨迹预测方法、智能设备及计算机可读存储介质。自动驾驶模型

热门分类

技术巡猎蔚来智能设备轨迹预测方法、智能设备及计算机可读存储介质。自动驾驶模型