分享好友 资讯动态首页 频道列表

美国发布最新版《机器人路线图》,拥抱“不确定的时代”

2024-08-20 14:111230
 2024年4月29日,美国发布最新版《机器人路线图》,这是自2009年首次发布以来的第四次更新。随着发展形势的变化及技术演进,其主题亦随之演进,从2009年关注“经济衰退后生产力的重启”,2013年展望“超越工厂车间追求更广泛的影响”,2016年着眼于“制造业回流”,到2020年重点关注“后疫情时代社会和经济的增长”,再到今年聚焦人工智能的应用、劳动力短缺的解决及可持续性发展。

 

当前,全球范围内前沿技术与颠覆性技术正以前所未有的速度实现突破,新一轮科技革命和产业变革正在加速推进,科学技术对社会经济发展的影响变得更为直接、迅速且广泛。机器人正处于一个重要的转折点上,人工智能、大数据、新材料、新型传感、生物仿生等多种技术迅速崛起,并与机器人加速融合,推动机器人向更智能、更高效、更灵活和更安全的方向发展,不断拓宽机器人技术和应用的边界。

 

 

相关技术的飞速发展,使得对机器人未来发展的预测已经难以用传统的线性方式加以推断。在此背景下,2024年美国《机器人路线图》放弃制定此前一贯的5年、10年和15年的愿景与目标,不再以明确的时间框架推动技术的发展,转而更侧重于表达趋势和方向,共提出物理具身、操作、感知、控制、规划、边缘AI、机器学习和与人交互八个研究方向,以保持可持续发展和确保美国成为机器人技术的领导者之一。以下是对这八个研究方向的简要概述。

物理具身

物理具身指的是智能不能仅以抽象算法的形式存在,而需要一个物理身体与世界互动,机器人系统是具身智能的体现。

软体机器人技术

软体机器人技术运用软材料和结构设计、制造和控制机器人系统,并借助形态计算简化与外界的交互。为模拟生物的多功能性,需在材料、制造、建模和控制上不断创新。借助生成设计和多材料增材制造等前沿设计与制造方法,软体机器人技术或将超越生物启发,实现新的物理能力。数字化生产和即时制造为个性化机器人设计带来新机遇,实现软性与刚性组件的无缝过渡。

作动与动力

创建高力量、长寿命、低成本的机器人作动与动力系统仍具挑战。动物的肌肉和新陈代谢被视为黄金标准,工程系统尚未企及。电磁作动器适用于刚性机器人但功率重量比待提升。液压系统功率高但不适于移动机器人。气动作动器适用于软体机器人但控制难。智能材料如电活性聚合物、HASEL作动器,有优势但力量小,并需专用电源。作动技术和电源存储/传输系统的新突破将帮助机器人实现长期移动性、安全性和强度。

感知

对于软体机器人,感知能力尤为关键。生物体拥有密集的感知系统,同时监测外界与自身。应推动柔性及软性传感器与软体机器人的融合,集成多类型传感器信息,并有效利用这些信息,以建模并控制软体机器人执行精细操作、狭窄空间移动及安全人机交互等复杂任务。

操作

目前,机器人操作器面临着成本高、通用性不足的双重挑战。为克服这些不足,可以开展以下研究活动。

发展先进的抓握机制:利用仿生学和软体机器人的概念来设计多功能抓握机构;探索柔韧性和适应性突出的新材料;开发功能性的非传统抓握器设计。

加强先进的触觉感知:开发密集、耐磨的触觉传感器,并能完全覆盖操作器;创建复杂的算法,将密集的感知信号解释为可操作的运动策略。

基于学习的控制策略:通过应用机器学习和强化学习技术,使机器人能够适应性地控制操作任务,并通过反复试验学习新技能,并将学到的技能转移到不同的机器人平台上,以增强机器人系统的通用性和效率。

人机协作领域:提高协作式机器人系统与人在共享工作空间中的安全性,包括发展自然语言处理和手势识别技术,以能确保无缝互动和协作的安全机制。

复杂环境中的灵巧操纵:增强机器人系统在动态杂乱环境下的操纵能力,包括开发用于路径规划和避障的先进算法,以及探索多模态感知技术的集成。

规划和控制的基本算法:稳固发展基本算法,以改善机器人在日常任务中的稳健性、效率和易用性,为新的操作器和传感器设计提供更强有力的支持,使学习大模型能够自我探索。

自主机器人操作:整合用于对象识别和场景理解的复杂感知系统;开发能够实现自主决策和任务规划的算法,并打造动态抓握和操作策略。

感知

感知是连接机器人与物理世界的关键方式,可以开展以下研究活动。

复杂的高维推断:高维推断在计算机视觉中是关键,尤其是在预测抓取对象等任务上。这些任务要求的方法和架构与识别或检测任务不同。随着AI和大型语言模型(LLMs)的发展,系统往往变得像“黑盒子”,缺乏透明度。这不仅影响了机器人的问责性,也影响了人们对机器人的信任。

网络安全和计算机视觉:确保网络安全与计算机视觉系统设计紧密融合至关重要,以避免错误预测和推论。采用对抗性训练和输入验证等方法可有效降低安全风险。

主动感知:目前系统主要被动处理数据,未能充分利用主动感知和捕获冗余信息的能力。开发能够主动探索环境的系统,将显著提升其性能。

开放世界的表现:计算机视觉系统往往基于封闭世界假设,仅从有限数据学习。然而,机器人需适应未知刺激和新任务变化,实现在开放世界中泛化的能力。

与系统集成:视觉系统需与其他系统集成,提供自我性能评估,包括验证视觉组件或基于视觉系统的方法,并确保输出与可靠性和不确定性相关的信息。

系统结构:通过图像任务进行端到端强化学习,但不利于相似任务或环境的迁移。传统方法分别训练视觉与动作模块,但现代视觉模块在动作或规划上的适应性受限于可靠性问题。

控制

安全控制:在高度非线性的机器人系统、高维系统、多机器人系统和人机协同系统中,设计安全控制器面临挑战,需对数据驱动型控制器的安全性进行认证,解决实时性能问题,嵌入式控制器或边缘计算单元上有效运行。

生物启发控制:研究新生物机制以设计控制器,构建和利用大规模数据集严格设计控制器,并考虑机器人的传感器、作动器和通信系统的限制。

控制高维度和不连续系统:机器人与人类和现实环境的交互会导致系统状态的突变,设计协调机器人关节执行任务的控制器极具挑战,需开发混合系统控制器,确保机器人能成功应用于现实世界。

机器人机构、控制和学习的共同发展:未来机器人需在材料、设计、控制、学习、感知和测试等方面实现协同,优化整体性能以适应现实任务。控制系统是连接设计与学习的关键,需进行基础研究来认证机器人性能,以支持机构-控制-学习的整合设计。

规划

随着机器人继续走出实验室,进入现实世界,它们将继续需要规划和控制算法,更好地处理它们将遇到的非结构化、不可预测和更复杂的情况。

不确定性下的规划

规划方法必须适应真实世界的不确定性,优先考虑概率方法和那些不依赖于对世界的准确高保真模型;在危险环境中,评估潜在错误的严重性和对机器人操作可行性的影响,以避免完全故障;传统离线规划和实时执行模型在动态环境中效果不佳,而在线规划可能因短视错过更优解,实现方法间的平衡是当前的重要挑战。

与人类互动中的安全性

随着机器人进入人类空间,需平衡效率与安全,提高透明度和可解释性;研究人机共同规划,探讨任务分配和避免物理干扰;混合自治允许在故障时移交控制权给人类;大语言模型将促进机器人与人类的对话。

操作和全身规划

深入研究操作规划和全身规划,将两者结合会增加问题复杂性,需开发新技术和算法,并与GPU等硬件集成。

边缘AI

能源效率和自主性:探索诸如模型量化、修剪和压缩等技术,降低AI算法的计算复杂性;发展能源感知硬件设计,包括低功耗处理器、能源高效传感器和功率管理技术,延长机器人系统的运行自主性。

实时处理和减少延迟:重点优化AI算法,在边缘设备上以低延迟执行,利用诸如模型并行性、流水线和硬件加速等技术;边缘计算架构必须设计成最小化处理延迟,通过将AI推理与数据采集和执行同步。

硬件-软件协同设计:探索协同设计方法,将硬件架构定制为机器人应用中使用的AI算法的特定计算要求,包括开发专门用于卷积神经网络(CNN)推理、递归神经网络(RNN)处理和传感器数据融合等任务的加速器,集成高效的软件框架,实现无缝部署和管理。

稳健的感知和态势感知:提高AI算法的鲁棒性以实现传感器融合、SLAM、目标检测和跟踪、语义分割和场景理解,并处理光照条件的变化、遮挡、杂乱环境和传感器噪声等挑战性场景,增强机器人系统的态势感知。

适应性和持续学习:探索持续学习技术,机器人可以逐步获得新技能,调整其行为以适应不断变化的任务和环境,并通过经验不断改善性能,包括在线强化学习、元学习、迁移学习和知识蒸馏方法。

隐私保护和安全性:重点开发强大的加密、认证和访问控制机制,以维护数据的完整性和隐私;探索安全多方计算、联邦学习和差分隐私等技术,以实现协作AI而不损害安全性。

边缘-云协作和资源管理:探索动态工作负载分配、数据卸载和边缘-云同步等技术,以平衡资源利用率,同时最小化延迟、带宽和能源消耗,包括分散式编排算法、边缘缓存策略和适应性通信协议的开发。

互操作性和标准化:开发用于在边缘设备和机器人之间交换数据、命令和服务的开放标准、通信协议和软件接口;简化即插即用的互操作性、可互操作的软件框架以及促进机器人系统中可重用性、可扩展性和灵活性的模块化架构。

机器学习

深度学习极大推动了机器视觉和机器人控制。基础模型使机器人能对话、实现语言训练,并与视觉演示相结合,推进了从演示中学习的机器人(LfD)。然而,大型多模态模型虽有价值,但缺乏可解释性可能导致系统不受信任。可解释AI和可解释性的研究正在填补这一差距。此外,完全自主系统的性能超过其他部件之和,学习组件需根据其对整体性能的影响评估,而评估过程耗时费力。为构建和评估完整的自主系统,需要改进评估方法,包括主动测试、利用历史数据的评估方法,以及适用于复杂环境的可扩展技术。

与人交互

协作机器人(物理人机交互)

协作机器人能与人安全直接地进行交互,以提高任务的速度、准确性、力量或规模,协作机器人需要更安全、灵活、紧凑且易于使用。

安全:在保证完成任务的同时,设计低惯性质量、柔顺表面的机器人以防止对人造成伤害。材料上,研究新材料,包括渐变刚度的作动器和表面,轻量级可部署和形状可控的结构,以及将作动器与结构集成在一起的智能材料;软件上,强化安全评级和人体检测,提高自主机器人可解释性。

灵活性:通过演示学习或模仿学习,借助少量数据,机器人能够执行自主任务,也是实现协作的有效方法;强化学习可以调整以符合用户偏好,也有助于创建以人为本的协作系统;在交互背景下,构建用户模型,涵盖感知、行动、目标和偏好,适用于多用户与机器人协同,也可在特定交互中实现高度个性化。

紧凑性:发展新的智能材料和作动器,实现在人类工作空间内占用最小体积的机器人;探索利用机械相互作用来改变其姿势或形状的新设计。

易用性:探索人机互助的交互模式,确保机器人以“零学习曲线”相似的无缝方式传达其能力和限制;进一步发展可解释性;深入研究协作机器人在家庭移动操作、人类护理及动态任务如协作工具处理、物体共同操纵等领域的应用。

社交陪伴机器人(社交人机交互)

陪伴机器人在人类生活各领域潜力巨大,包括老年人护理、儿童发展、教育、治疗和心理健康支持。尽管自然语言处理提升了机器人的交流能力,但稳健和易用的对话系统尚未普及,特别是对于具有口音、语音不连贯的用户。机器人需发展多模式通信能力,包括头部、身体姿势、面部表情、手势等非语言信号;机器人需要感知和理解用户状态、行为和意图,基础模型虽有望推动这一能力,但训练数据可能不足且存在偏见,影响对特殊群体的正确理解;情感计算研究将帮助机器人理解人类情感,并需考虑到不同的环境,包括不同的视角、光照条件、运动、遮挡等;陪伴机器人的物理设计需跨学科合作,考量安全性、成本、效能和文化适应性,需探索机器人形态与功能在不同环境中的最优组合。

媒介交互

协作机器人和社交机器人不仅可以与用户共享空间,还能执行远程操作,以及在危险环境中执行任务,如远程手术、管道桥梁等基础设施检查和太空探索。交互媒介也多种多样,如摇杆、语音指令、脑机接口等。交互难点一般在于操作者要具有足够的“处境意识”,并做出正确的控制决策。需发展增强现实和混合现实技术以提高“处境意识”,新的可穿戴设备也可为“处境意识”的集成提供机会;触觉反馈对精准操作和社交互动至关重要,需进一步实现大面积接触感知和高效封装,并开发轻巧、舒适和便携的可穿戴触觉设备,可以从软体机器人技术借鉴。此外,在安全场景中,人类可以操作控制非人形或运动学不匹配的机器人,如一群机器人或连续外科机器人,需开发能够直观映射人类输入与机器人动作的界面。

举报 0
收藏 0
评论 0