定位导航篇之四足机器人定位导航概述

您所在的位置：网站首页 › 机器人导航算法定制 › 定位导航篇之四足机器人定位导航概述

定位导航篇之四足机器人定位导航概述

2024-07-08 03:34:45| 来源: 网络整理| 查看: 265

欢迎关注微信公众号 “四足机器人研习社”，本公众号的文章和资料和四足机器人相关，包括行业的经典教材、行业资料手册，同时会涉及到职业知识学习及思考、行业发展、学习方法等一些方面的文章。

最近看到一篇不错的四足英文综述，截取部分翻译后给大家分享，原文和链接见文末！！！

前情提要：

》》机械结构篇之四足机器人结构

》》四足控制篇之控制综述

4 自主运动

四足机器人的自主运动是独立评估外部环境和帮助人类在复杂环境中完成任务的关键技术方法。实现自主运动的关键在于路径规划和地形识别技术。

4.1 路径规划

路径规划是机器人从起点导航到目的地的基本策略，同时避免与环境中的静态和动态障碍物发生碰撞。根据路径规划方法的特点，可分为传统路径规划方法、智能仿生路径规划方法和基于学习的路径规划方法。具体的路径规划方法及其优缺点如表3所示。

表 3. 标准路径规划算法及其优缺点

常规算法代表性方法优势弊传统算法人工势场简单描述;易于实施局部最优;路径规划不一致Dijkstra适应动态环境;全局路径规划效率低下;内存使用率高A*高效率大存储空间RRT适应性强;高度随机死区;不一定能获得最佳路径智能仿生算法神经网络算法较强的非线性建模能力;计算效率高;和并行处理能力可解释性弱，泛化能力差遗传算法强大的全局搜索能力和鲁棒性收敛速度慢;局部最优解蚁群算法强大的全局搜索能力;适用于多目标问题收敛速度慢;需要大量的参数调整基于学习的算法强化学习不依赖模型和先验知识;适应复杂环境维度的诅咒;局部最优 4.1.1 传统算法

人工势场法基于平衡重力和排斥力的原理，计算机器人在环境中的可行路径。该方法近似于不同物体在不同位置的力平衡。它可在动态环境中实现实时运动控制，规划时间短，执行效率高。然而，有时它可能会被困在局部最优解中，导致路径规划失败。Ge 等人。[140]提出了一种在目标和障碍物都在运动的动态环境中进行机器人路径规划的潜在场方法。他们成功地解决了局部最优值的问题。五十岚等人。[141]利用人工势场法增强了四足机器人的机动性，使其能够顺利通过不平坦和不规则的地形，包括头顶障碍物、狭窄通道和台阶。Lee等人。[142]通过引入人工热场扩展了人工势场方法，该热场不仅考虑了避障和碰撞，还考虑了障碍物穿越。此外，还考虑了步态约束，以确保计划路径的可行性。

Dijkstra 算法系统地搜索节点之间的最佳路径，从中心点开始，迭代地向目的地扩展，直到找到最短路径。[143]但是，这种方法不适合实时控制，在处理大量元素的问题时会消耗大量的时间和资源。Noto等人。[144]扩展了传统的 Dijkstra 方法，以获得在指定时间内接近最优路径的路径（最优路径）。这种方法旨在平衡计算效率和路径最优性。为了解决不确定环境中的最短路径问题，邓等人。[145]提出了模糊Dijkstra算法，该算法处理具有模糊弧长的最短路径问题。通过用模糊数字表示弧长，查找最短路径变得更加容易。[145]Liu等人。[143]提出了一种基于Dijkstra算法的四足机器人全局地形自主导航路径规划方法。他们还利用人工势场理论实施了局部地图自主避障策略。这种方法可以实现精确的全局路径规划，在本地地图内自主避障，以及四足机器人在具有挑战性的环境中的自主导航[143]

A* 算法可以看作是 Dijkstra 算法的扩展，Dijkstra 算法是一种通过使用启发式函数来提高搜索效率的路径搜索方法。启发式搜索利用启发式搜索规则来评估当前搜索位置与目标位置之间的距离。通过对目标位置的搜索方向进行优先排序，该算法提高了搜索效率。波士顿动力公司使用Big Dog平台对四足机器人在复杂环境中的自主运动进行了研究。这些机器人的路径规划利用 A* 算法。[146]该方法是求解静态道路网络中最短路径的最有效直接搜索方法，但在具有移动障碍物的动态环境中应用时面临挑战。虽然它有能力捕获完整的解决方案，但算法复杂度相对较高。因此，改进的A*算法得到了广泛的研究。Li et al.[147]提出了自适应动态萤火虫算法，该算法优化了现有的路线搜索结果，而不是从起点进行新的搜索。这种方法减轻了计算负担，提高了动态地图环境中的路径搜索效率。[147]傅等人.[148]提出了一种改进的 A * 算法，与原来的 A* 算法相比，该算法实现了更高的搜索成功率，从而实现了更短、更平滑的路径。这种改进的A*算法有效地提高了机器人路径规划的成功率，并扩大了机器人路径的最优范围。

快速探索随机树（RRT）是一种利用树状结构的随机搜索方法。这种方法从非凸高维空间中的根节点开始，并通过在空间中创建分支来迭代采样新状态。然后，它连接更接近每个样本的现有节点，最终创建从起点到目标的最佳路线图。[149]阿吉拉尔等人。[150]基于RRT方法，通过形态分割确定检测到的障碍物环境中初始位置与最终位置之间的路径，从而实现蜘蛛机器人的自主运动。然而，RRT算法生成的路径可能缺乏平滑性，导致在通道狭窄或障碍物众多的环境中收敛时间增加。因此，许多研究人员致力于改进RRT算法。改善 RRT 的经典方法包括 RRT-connect 和 RRT*。[151、152]RRT连接方法使随机树能够快速向目标附近扩展，提高算法的优化效率。[153]相比之下，RRT* 算法评估树中新节点附近的节点以找到更好的路径，从而解决了生成不必要的绕行路径的问题。[149]

4.1.2 智能仿生算法

随着学者们对智能优化算法的广泛研究，各种算法在解决机器人路径规划问题时得到了广泛的应用。这些算法旨在获得满足特定评估标准的最佳路径。常见的智能优化算法包括神经网络算法、遗传算法（GA）和蚁群算法。

神经网络算法从人脑中的神经网络中汲取灵感，模拟大脑机制以进行建模。因此，这种方法是灵活的，可以处理输入信息，而不管其连续性如何。[154]虽然神经网络具有良好的学习能力和鲁棒性，但它们难以有效地利用现有的先验知识。此外，随着神经元数量的增加，仿生神经网络中神经活动值的计算和时间成本急剧增加。为了解决这些局限性，Wang等人。[155]提出了一种用于移动机器人路径规划的模糊神经网络算法。该算法结合模糊理论和神经网络的优点，有效地确定了从初始点到目标点的最优路径。即使在完全未知和静态的环境条件下，该算法也表现出高效和快速的收敛速度，从而增强了移动机器人的智能性。Luo et al.[156]通过引入多尺度地图方法进行机器人路径规划，改进了传统的神经网络算法。这种方法大大减少了路径规划算法的时间和复杂性。为了适应各种应用场景，神经网络算法往往与传统算法集成，[157]群体智能算法，[158、159]和学习算法[160、161]满足收敛速度、计算成本等性能要求。

GA是一种基于自然遗传进化原理开发的自适应算法。GA 的优化过程如图 13 所示。种群进化从随机个体开始，通过多次交叉和突变产生具有不同基因和适应度的新个体。当种群达到令人满意的适应度水平时，该算法会收敛到最优解。GA 具有随机性和详尽的搜索范围，非常适合解决复杂的路径规划问题。因此，它被广泛用于机器人路径规划。伊斯梅尔等人。[162]描述了如何使用 GA 解决非动态环境中的路径规划问题。他们的实验结果证明了该方法在不同静态域中的有效性。Tuncer 等人。[163]使用 GA 解决动态环境中的路径规划问题。他们还提出了新的突变算子，以克服传统随机突变算子的局限性，因为传统随机突变算子会产生不可行的路径。GA 被广泛认为是针对复杂和行为不端的目标函数的最强大的搜索技术之一。其固有的并行搜索技术允许同时探索多个潜在解决方案，从而更快地识别最佳路径。[162]为了在机器人路径规划中取得更好的效果，研究人员对 GA 进行了改进[164、165]或将其与其他智能算法相结合，从而产生混合方法。这些混合方法的示例包括模糊 GA、[166]神经GA，[167、168]以及GA粒子群优化。[169]

图13

蚁群算法来源于蚂蚁的觅食行为。蚂蚁能够找到从巢穴到食物来源的有效路径，即使不知道食物的确切位置。该算法已应用于各种科学和工程领域，例如车间调度、旅行推销员问题和图像着色。它还被用于解决机器人导航问题，目标是实现避障和高效的路径规划。优化过程如图 14 所示。布兰德等人。[170]探索了蚁群优化（ACO）算法在网格网络中寻找最短且无碰撞路径的应用，以进行机器人路径规划。他们使用各种障碍物的形状和大小来模拟动态环境，并通过仿真验证了这种方法的可行性。机器人在未知动态地形上的路径规划主要依赖于启发式方法。拉杰普特等人。[171]改进了传统的蚁群算法，将机器人在网格上的定向运动历史合并为向量作为概率乘数，有助于提高收敛速度，避免不必要的运动。

图14

为了克服传统ACO算法在室内移动机器人路径规划中的弊端，如规划时间长、收敛速度慢、路径非最优、局部最优等，Miao等人进行了研究。[172]提出了一种改进的自适应ACO算法。在方法中，他们将角度引导因子和障碍物排除因子引入到ACO的转移概率中，以增强算法的探索和利用能力。此外，他们将启发式信息、自适应调整因子和自适应信息素蒸发因子纳入ACO的信息更新规则中。通过考虑路径长度、安全性、能耗等指标，将路径规划问题转化为多目标优化问题，使机器人实现全局路径优化。蚁群算法是一种基于种群的方法，涉及自组织和正反馈。[173]它为解决复杂环境中的路径规划问题提供了一种独特的方法。

4.1.3 基于学习的算法

经典的路径规划算法达到了一个相对成熟的发展阶段。然而，他们依赖于建立环境模型，缺乏感知环境和自动学习的能力。RL使机器人能够通过自主探索获取环境信息，使其能够适应各种地理环境，实现多场景下的路径规划。RL中求解路径规划问题的主要方法包括Q学习、状态-行动-奖励-状态-行动（SARSA）、Q（λ）学习和SARSA（λ）。其中，Q-learning是路径规划领域最常用、最有效的RL算法。[174]它不需要建模，可以保证收敛。Maoudj A 等人。[175]通过引入新的奖励函数来改进 Q-learning 算法。此函数用于初始化 Q 表，并向机器人提供环境的先验知识。他们还提出了一种新的、有效的选择策略，以加速学习过程。这种策略减少了搜索空间，同时确保快速收敛到优化的解决方案。Q 学习算法中的 Q 值是根据状态、操作和奖励值计算的。与Q-learning类似，SARSA方法密切相关，但不同之处在于它是一种基于策略的学习算法。[176]SARSA 根据当前策略学习 Q 表值，而不是使用贪心策略。这意味着SARSA在探索替代行动方面存在局限性。[177]Q-learning是一种无模型的方法，这意味着它不需要显式的环境模型，可以广泛应用于解决路径规划问题。Q （λ）算法是 Q 学习的扩展，它结合了资格跟踪，将最近操作的跟踪存储为短期记忆的一种形式。[178]通过存储状态-动作对的痕迹，可以同时采取多个步骤，与Q学习相比，可以实现更高效的学习和更快的收敛到接近最优的路径。[179]RL在解决顺序决策问题方面起着至关重要的作用，并且擅长通过与环境的互动进行自我学习。将基于RL的局部路径规划算法SARSA（λ）算法与RRT算法相结合，有助于降低采样的随机性，从而提高实时性能和可靠性。[180]

DRL 也被广泛用于路径规划任务。DL 擅长感知任务，而 RL 擅长决策。这两种学习方法的结合可以在路径规划中产生显着的效果。雷等人。[181]将 DeepMind 于 2016 年提出的 DRL 算法 Double Q-Network 应用于未知环境下的动态路径规划。Yang 等人。[182]通过将深度Q网络算法与Q学习算法相结合，解决了机器人路径规划中收敛缓慢和随机性过强的问题。Yu 等人。[161]提出了一种基于神经网络和分层强化学习（HRL）的移动机器人路径规划算法。该算法利用神经网络使机器人能够感知环境并提取相关特征。HRL 将当前状态映射到特定操作。与Q-learning算法相比，该方法缩短了收敛时间，提高了规划路径的平滑度。此外，它还在不同场景下表现出良好的泛化性能。

4.2 地形识别

地形识别是指机器人使用安装在其平台上的传感器对未知地形环境进行识别和分类的能力。四足机器人与其环境之间的相互作用是复杂的，地形特征对机器人的运动性能有重大影响。因此，机器人需要对地形具有准确的感知和分类能力，以做出适当的路径和轨迹规划，并设计合适的运动控制策略。这确保了机器人能够有效地穿越地形，实现所需的运动轨迹，并保持运动稳定性。机器人通过其携带的硬件设备获取地形信息。根据地形识别算法的不同发展阶段，可分为传统的地形识别算法和基于深度学习的地形识别算法。详细分类如图 15 所示。

图15

依赖于非视觉特征的地形识别算法通常配备传感器，例如光探测和测距（LiDAR）、红外传感器、惯性测量传感器和振动传感器。基于这些传感器的特点，非视觉地形识别算法可以进一步分为两类：基于点云信息的地形识别算法和基于振动的地形识别算法。

基于点云特征的地形识别算法涉及利用激光雷达扫描地形环境轮廓，获取点云数据并构建网格图。随后，该算法计算网格图中点云数据的最大值和最小值，以创建可达性地图。荣格等人。[183]利用一台激光测距仪来跟踪跑步者，并避免在非结构化户外环境中动态移动的障碍物。Leigh 等人。[184]设计了Smart Wheeler机器人，该机器人利用2D激光扫描仪帮助行动不便的人在不同条件下进行个人跟踪和跟踪。Meng 等人。[185]介绍了一种基于3D LiDAR（）点云数据的边坡检测方法。通过根据不同的坡度角度不断调整四足机器人的步态，机器人可以避免潜在的危险，并在运动过程中保持稳定。与2D LiDAR点云数据相比，3D LiDAR数据已经从感知单个平面发展到感知3D空间。Saputra 等人。[186]提出了一种能够基于三维点云、地面触摸传感器和惯性测量单元生成合适行为的多行为生成模型。该模型设计用于在没有扶手的梯子环境中从下层楼梯导航到上层楼梯。获取的点云特征数据的精度受雷达探测范围的影响，导致近距离点云密度较高，生成的可穿越性图精度较高。然而，远距离点云的精度较低。在实践中，通常需要校正数据以实现更平衡的表示。

基于振动的地形识别算法利用集成在机器人中的振动传感器，收集和分析机器人穿越未知地形环境时产生的振动，从而实现地形识别。布鲁克斯等人。[187]提出了一种更全面的基于振动的地形分类方法。分类器使用标记的振动数据进行离线训练，并对地形进行在线线性分类识别。Weiss等人。[188]提出了一种基于车体振动的地形分类方法。他们使用支持向量机（SVM）执行基于振动的地形分类，采用径向基函数（RBF）核和特征提取技术。根据确定的地形，车辆可以调整其行驶模式。Hoepflinger等人。[189]提出了一种地形形状和属性识别算法。该算法从机器人运动过程中产生的关节电机电流数据和地面振动接触力测量中提取特征。该算法实现了94%的地形形状识别率和73%的地形属性识别率。Bai 等人。[190]提出了一种基于车轮与地形相互作用的三维振动地形识别算法。他们使用快速傅里叶变换光谱将三轴振动矢量转换为频域。通过对转换后的数据进行归一化，研究人员获得了训练特征向量，并在五种不同的地形环境中进行了算法分类测试。

四足机器人的工作环境具有复杂性、动态性和高不确定性的特点，这给传感器的可靠性带来了挑战。此外，体积、重量和成本的限制使得在机器人上携带全套传感器是不切实际的。在这种情况下，视觉传感器具有多种优势。它们用途广泛，能够提供有价值的地形信息，这对于防止机器人意外坠落至关重要。

自主机器人运动依赖于对周围环境的感知和解释。与非视觉方法相比，基于视觉的地形识别方法提供了丰富的信息，并且不受机器人本身的影响，使其成为机器人地形识别的首选。为了进一步对基于视觉的地形识别方法进行分类，可以将它们分为两个子类别：结构化视觉特征和抽象视觉特征。

结构化的视觉特征，如颜色和纹理，通过清晰的数学或算法定义得到精确量化。这些功能不仅在计算机视觉任务中提供一致和可靠的信息，而且主要应用于传感器捕获的特定视觉元素的选择和提取。随后，将这些特征输入到分类器中进行精确分类，如图 16 所示。科尔特斯等人。[191]评估纹理描述符，并将纹理与颜色描述符相结合。他们选择了具有RBF的SVM作为核函数，并将其与Gabor小波滤波器相结合。这种方法的识别准确率超过91%。Filitchkin等人。[192]提出了一种基于加速鲁棒特征（SURF）和支持向量机（SVM）分类器创建的视觉词袋融合的地形识别算法。该算法是在 LittleDog 平台上实现的，用于实时地形分类。这提高了机器人地形识别的准确性和步态速度。Wu et al.[193]结合堆叠去噪稀疏自动编码器和Fisher矢量技术，通过无监督机器学习实现参数自调优。他们在一个腿部弯曲的四足机器人上进行了户外实验，并使用来自不同地形的数据集在地形识别方面取得了有希望的结果。

图16

结构化视觉特征算法涉及使用分类器进行特征提取和分类。识别过程以离散的步骤进行，这阻止了端到端的培训。此限制阻碍了全局反向传播算法参数的能力，使参数更新更具挑战性。因此，训练算法变得更加困难，阻碍了有效的优化。此外，分类器的设计通常依赖于人类的专业知识来确定。这种对人为干预的依赖降低了地形识别的效率和准确性。

卷积神经网络（CNN）是人脑中神经网络的仿生表示;它模拟大脑的多层感受野并处理视觉信息。通过构建多层卷积网络结构，CNN可以逐层提取和卷积图像的颜色、结构、纹理等结构化视觉特征。在逐层卷积过程中，这些结构化的视觉特征相互交织、融合，最终形成具有语义内容的抽象视觉特征。基于深度学习的地形识别算法主要利用CNN提取这些抽象的视觉特征，然后使用分类器（如全连接层）将其转换为可识别的标签。这种方法允许对网络内传感器提取的特征进行端到端处理。通过采用这种端到端方法，可以在输出端获得结果，而无需特征设计和分类器选择。主要过程如图 17 所示。Abou-Nasr等人。[194]提出了一种基于递归神经网络的灰度图像地形识别方法。此方法对道路上的草、树和落叶进行分类。当从上到下扫描图像的像素时，分类器会识别地形类。Liu等人。[195]提出了一种基于深度稀疏滤波网络（DSFN）的地形识别方法。他们采用了一种突破性的深度学习网络，该网络可以自主地从原始输入数据中学习特征。与传统的深度网络不同，DSFN只需要在预训练和微调期间调整几个参数。Borijindakul 等人。[196]提出了一种递归神经网络来对软地形进行分类，以扩大四足机器人的运动范围。这种方法成功地对六种不同的地形进行了分类。

图17

Sun 等人。[197]提出了一种使用全卷积网络的语义分割模型[198]用于户外环境中腿部机器人的地形感知。他们利用深度神经网络来识别地面纹理，从而实现对地形环境的感知。Kong等人。[199]将视觉可遍历性分析问题表述为图像分类任务。他们训练了CNN对不同的地形补丁进行分类，并实时动态调整腿部配置。这种适应性确保了机器人准确而稳健地穿越地形，适应环境条件。Junaid 等人。[200]提出了基于多特征视图的浅卷积神经网络（MVS-CNN），该网络从输入图像的显式表示中提取抽象特征。输入图像的梯度信息被用作增强所提深度学习架构的学习过程的附加通道。多个要素视图被输入到一个完全连接的神经网络中，以准确分割道路区域。与流行的语义分割网络（SegNet）相比，[201]所提出的方法在训练和评估过程中表现更好，同时效率也更高。

在机器人地形识别中，无论是基于非视觉特征还是视觉特征，选择一种快速高效的地形分类方法至关重要。地形识别的准确性和算法的效率是提高分类方法实用性的关键因素。然而，基于非视觉特征的地形识别算法和基于视觉特征的地形识别算法都有其不足之处。例如，基于视觉特征的地形识别算法可能不适合强光照条件，[190]而基于非视觉特征的地形识别算法则难以区分具有相似几何特征的不同地形。两种方法的结合是未来地形识别方法研究的一个趋势。[202]

参考：

[1]Fan, Y., Pei, Z., Wang, C., Li, M., Tang, Z., & Liu, Q. A Review of Quadruped Robots: Structure, Control, and Autonomous Motion. Advanced Intelligent Systems, 2300783. https://doi.org/10.1002/aisy.202300783

原文链接：A Review of Quadruped Robots: Structure, Control, and Autonomous Motion - Fan - Advanced Intelligent Systems - Wiley Online Library

更多相关文章：

》》机械结构篇之四足机器人结构

》》四足控制篇之控制综述

》》机械结构篇之四足机器人身体设计

》》机械结构篇之四足机器人腿部结构

》》四足综述（二）一个四足机器人系统都由些什么组成？

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

定位导航篇之四足机器人定位导航概述

定位导航篇之四足机器人定位导航概述

今日新闻

点击排行

推荐新闻

图片新闻

专题文章