美国发布最新版《机器人路线图》，拥抱“不确定的时代”_行业新闻_资讯动态

2024年4月29日，美国发布最新版《机器人路线图》，这是自2009年首次发布以来的第四次更新。随着发展形势的变化及技术演进，其主题亦随之演进，从2009年关注“经济衰退后生产力的重启”，2013年展望“超越工厂车间追求更广泛的影响”，2016年着眼于“制造业回流”，到2020年重点关注“后疫情时代社会和经济的增长”，再到今年聚焦人工智能的应用、劳动力短缺的解决及可持续性发展。

当前，全球范围内前沿技术与颠覆性技术正以前所未有的速度实现突破，新一轮科技革命和产业变革正在加速推进，科学技术对社会经济发展的影响变得更为直接、迅速且广泛。机器人正处于一个重要的转折点上，人工智能、大数据、新材料、新型传感、生物仿生等多种技术迅速崛起，并与机器人加速融合，推动机器人向更智能、更高效、更灵活和更安全的方向发展，不断拓宽机器人技术和应用的边界。

相关技术的飞速发展，使得对机器人未来发展的预测已经难以用传统的线性方式加以推断。在此背景下，2024年美国《机器人路线图》放弃制定此前一贯的5年、10年和15年的愿景与目标，不再以明确的时间框架推动技术的发展，转而更侧重于表达趋势和方向，共提出物理具身、操作、感知、控制、规划、边缘AI、机器学习和与人交互八个研究方向，以保持可持续发展和确保美国成为机器人技术的领导者之一。以下是对这八个研究方向的简要概述。

物理具身

物理具身指的是智能不能仅以抽象算法的形式存在，而需要一个物理身体与世界互动，机器人系统是具身智能的体现。

软体机器人技术

软体机器人技术运用软材料和结构设计、制造和控制机器人系统，并借助形态计算简化与外界的交互。为模拟生物的多功能性，需在材料、制造、建模和控制上不断创新。借助生成设计和多材料增材制造等前沿设计与制造方法，软体机器人技术或将超越生物启发，实现新的物理能力。数字化生产和即时制造为个性化机器人设计带来新机遇，实现软性与刚性组件的无缝过渡。

作动与动力

创建高力量、长寿命、低成本的机器人作动与动力系统仍具挑战。动物的肌肉和新陈代谢被视为黄金标准，工程系统尚未企及。电磁作动器适用于刚性机器人但功率重量比待提升。液压系统功率高但不适于移动机器人。气动作动器适用于软体机器人但控制难。智能材料如电活性聚合物、HASEL作动器，有优势但力量小，并需专用电源。作动技术和电源存储/传输系统的新突破将帮助机器人实现长期移动性、安全性和强度。

感知

对于软体机器人，感知能力尤为关键。生物体拥有密集的感知系统，同时监测外界与自身。应推动柔性及软性传感器与软体机器人的融合，集成多类型传感器信息，并有效利用这些信息，以建模并控制软体机器人执行精细操作、狭窄空间移动及安全人机交互等复杂任务。

操作

目前，机器人操作器面临着成本高、通用性不足的双重挑战。为克服这些不足，可以开展以下研究活动。

发展先进的抓握机制：利用仿生学和软体机器人的概念来设计多功能抓握机构；探索柔韧性和适应性突出的新材料；开发功能性的非传统抓握器设计。

加强先进的触觉感知：开发密集、耐磨的触觉传感器，并能完全覆盖操作器；创建复杂的算法，将密集的感知信号解释为可操作的运动策略。

基于学习的控制策略：通过应用机器学习和强化学习技术，使机器人能够适应性地控制操作任务，并通过反复试验学习新技能，并将学到的技能转移到不同的机器人平台上，以增强机器人系统的通用性和效率。

人机协作领域：提高协作式机器人系统与人在共享工作空间中的安全性，包括发展自然语言处理和手势识别技术，以能确保无缝互动和协作的安全机制。

复杂环境中的灵巧操纵：增强机器人系统在动态杂乱环境下的操纵能力，包括开发用于路径规划和避障的先进算法，以及探索多模态感知技术的集成。

规划和控制的基本算法：稳固发展基本算法，以改善机器人在日常任务中的稳健性、效率和易用性，为新的操作器和传感器设计提供更强有力的支持，使学习大模型能够自我探索。

自主机器人操作：整合用于对象识别和场景理解的复杂感知系统；开发能够实现自主决策和任务规划的算法，并打造动态抓握和操作策略。

感知

感知是连接机器人与物理世界的关键方式，可以开展以下研究活动。

复杂的高维推断：高维推断在计算机视觉中是关键，尤其是在预测抓取对象等任务上。这些任务要求的方法和架构与识别或检测任务不同。随着AI和大型语言模型（LLMs）的发展，系统往往变得像“黑盒子”，缺乏透明度。这不仅影响了机器人的问责性，也影响了人们对机器人的信任。

网络安全和计算机视觉：确保网络安全与计算机视觉系统设计紧密融合至关重要，以避免错误预测和推论。采用对抗性训练和输入验证等方法可有效降低安全风险。

主动感知：目前系统主要被动处理数据，未能充分利用主动感知和捕获冗余信息的能力。开发能够主动探索环境的系统，将显著提升其性能。

开放世界的表现：计算机视觉系统往往基于封闭世界假设，仅从有限数据学习。然而，机器人需适应未知刺激和新任务变化，实现在开放世界中泛化的能力。

与系统集成：视觉系统需与其他系统集成，提供自我性能评估，包括验证视觉组件或基于视觉系统的方法，并确保输出与可靠性和不确定性相关的信息。

系统结构：通过图像任务进行端到端强化学习，但不利于相似任务或环境的迁移。传统方法分别训练视觉与动作模块，但现代视觉模块在动作或规划上的适应性受限于可靠性问题。

控制

安全控制：在高度非线性的机器人系统、高维系统、多机器人系统和人机协同系统中，设计安全控制器面临挑战，需对数据驱动型控制器的安全性进行认证，解决实时性能问题，嵌入式控制器或边缘计算单元上有效运行。

生物启发控制：研究新生物机制以设计控制器，构建和利用大规模数据集严格设计控制器，并考虑机器人的传感器、作动器和通信系统的限制。

控制高维度和不连续系统：机器人与人类和现实环境的交互会导致系统状态的突变，设计协调机器人关节执行任务的控制器极具挑战，需开发混合系统控制器，确保机器人能成功应用于现实世界。

机器人机构、控制和学习的共同发展：未来机器人需在材料、设计、控制、学习、感知和测试等方面实现协同，优化整体性能以适应现实任务。控制系统是连接设计与学习的关键，需进行基础研究来认证机器人性能，以支持机构-控制-学习的整合设计。

规划

随着机器人继续走出实验室，进入现实世界，它们将继续需要规划和控制算法，更好地处理它们将遇到的非结构化、不可预测和更复杂的情况。

不确定性下的规划

规划方法必须适应真实世界的不确定性，优先考虑概率方法和那些不依赖于对世界的准确高保真模型；在危险环境中，评估潜在错误的严重性和对机器人操作可行性的影响，以避免完全故障；传统离线规划和实时执行模型在动态环境中效果不佳，而在线规划可能因短视错过更优解，实现方法间的平衡是当前的重要挑战。

与人类互动中的安全性

随着机器人进入人类空间，需平衡效率与安全，提高透明度和可解释性；研究人机共同规划，探讨任务分配和避免物理干扰；混合自治允许在故障时移交控制权给人类；大语言模型将促进机器人与人类的对话。

操作和全身规划

深入研究操作规划和全身规划，将两者结合会增加问题复杂性，需开发新技术和算法，并与GPU等硬件集成。

边缘AI

能源效率和自主性：探索诸如模型量化、修剪和压缩等技术，降低AI算法的计算复杂性；发展能源感知硬件设计，包括低功耗处理器、能源高效传感器和功率管理技术，延长机器人系统的运行自主性。

实时处理和减少延迟：重点优化AI算法，在边缘设备上以低延迟执行，利用诸如模型并行性、流水线和硬件加速等技术；边缘计算架构必须设计成最小化处理延迟，通过将AI推理与数据采集和执行同步。

硬件-软件协同设计：探索协同设计方法，将硬件架构定制为机器人应用中使用的AI算法的特定计算要求，包括开发专门用于卷积神经网络（CNN）推理、递归神经网络（RNN）处理和传感器数据融合等任务的加速器，集成高效的软件框架，实现无缝部署和管理。

稳健的感知和态势感知：提高AI算法的鲁棒性以实现传感器融合、SLAM、目标检测和跟踪、语义分割和场景理解，并处理光照条件的变化、遮挡、杂乱环境和传感器噪声等挑战性场景，增强机器人系统的态势感知。

适应性和持续学习：探索持续学习技术，机器人可以逐步获得新技能，调整其行为以适应不断变化的任务和环境，并通过经验不断改善性能，包括在线强化学习、元学习、迁移学习和知识蒸馏方法。

隐私保护和安全性：重点开发强大的加密、认证和访问控制机制，以维护数据的完整性和隐私；探索安全多方计算、联邦学习和差分隐私等技术，以实现协作AI而不损害安全性。

边缘-云协作和资源管理：探索动态工作负载分配、数据卸载和边缘-云同步等技术，以平衡资源利用率，同时最小化延迟、带宽和能源消耗，包括分散式编排算法、边缘缓存策略和适应性通信协议的开发。

互操作性和标准化：开发用于在边缘设备和机器人之间交换数据、命令和服务的开放标准、通信协议和软件接口；简化即插即用的互操作性、可互操作的软件框架以及促进机器人系统中可重用性、可扩展性和灵活性的模块化架构。

机器学习

深度学习极大推动了机器视觉和机器人控制。基础模型使机器人能对话、实现语言训练，并与视觉演示相结合，推进了从演示中学习的机器人（LfD）。然而，大型多模态模型虽有价值，但缺乏可解释性可能导致系统不受信任。可解释AI和可解释性的研究正在填补这一差距。此外，完全自主系统的性能超过其他部件之和，学习组件需根据其对整体性能的影响评估，而评估过程耗时费力。为构建和评估完整的自主系统，需要改进评估方法，包括主动测试、利用历史数据的评估方法，以及适用于复杂环境的可扩展技术。

与人交互

协作机器人（物理人机交互）

协作机器人能与人安全直接地进行交互，以提高任务的速度、准确性、力量或规模，协作机器人需要更安全、灵活、紧凑且易于使用。

安全：在保证完成任务的同时，设计低惯性质量、柔顺表面的机器人以防止对人造成伤害。材料上，研究新材料，包括渐变刚度的作动器和表面，轻量级可部署和形状可控的结构，以及将作动器与结构集成在一起的智能材料；软件上，强化安全评级和人体检测，提高自主机器人可解释性。

灵活性：通过演示学习或模仿学习，借助少量数据，机器人能够执行自主任务，也是实现协作的有效方法；强化学习可以调整以符合用户偏好，也有助于创建以人为本的协作系统；在交互背景下，构建用户模型，涵盖感知、行动、目标和偏好，适用于多用户与机器人协同，也可在特定交互中实现高度个性化。

紧凑性：发展新的智能材料和作动器，实现在人类工作空间内占用最小体积的机器人；探索利用机械相互作用来改变其姿势或形状的新设计。

易用性：探索人机互助的交互模式，确保机器人以“零学习曲线”相似的无缝方式传达其能力和限制；进一步发展可解释性；深入研究协作机器人在家庭移动操作、人类护理及动态任务如协作工具处理、物体共同操纵等领域的应用。

社交陪伴机器人（社交人机交互）

陪伴机器人在人类生活各领域潜力巨大，包括老年人护理、儿童发展、教育、治疗和心理健康支持。尽管自然语言处理提升了机器人的交流能力，但稳健和易用的对话系统尚未普及，特别是对于具有口音、语音不连贯的用户。机器人需发展多模式通信能力，包括头部、身体姿势、面部表情、手势等非语言信号；机器人需要感知和理解用户状态、行为和意图，基础模型虽有望推动这一能力，但训练数据可能不足且存在偏见，影响对特殊群体的正确理解；情感计算研究将帮助机器人理解人类情感，并需考虑到不同的环境，包括不同的视角、光照条件、运动、遮挡等；陪伴机器人的物理设计需跨学科合作，考量安全性、成本、效能和文化适应性，需探索机器人形态与功能在不同环境中的最优组合。

媒介交互

协作机器人和社交机器人不仅可以与用户共享空间，还能执行远程操作，以及在危险环境中执行任务，如远程手术、管道桥梁等基础设施检查和太空探索。交互媒介也多种多样，如摇杆、语音指令、脑机接口等。交互难点一般在于操作者要具有足够的“处境意识”，并做出正确的控制决策。需发展增强现实和混合现实技术以提高“处境意识”，新的可穿戴设备也可为“处境意识”的集成提供机会；触觉反馈对精准操作和社交互动至关重要，需进一步实现大面积接触感知和高效封装，并开发轻巧、舒适和便携的可穿戴触觉设备，可以从软体机器人技术借鉴。此外，在安全场景中，人类可以操作控制非人形或运动学不匹配的机器人，如一群机器人或连续外科机器人，需开发能够直观映射人类输入与机器人动作的界面。