新闻动态

  

近日,,,,,,,我院冀晓强教授团队创新性地提出了一个基于图神经网络的物体中心化(object-centric)进建框架GraphSlot。。。。 。 。该框架通过物理学问驱动,,,,,,,可能凭据物体的空间邻近关系和表力(如沉力)影响动态构建交互图,,,,,,,并在相连的节点间传布嵌入信息,,,,,,,从而显式地建模物体间的相互作用。。。。 。 。我院具身智能中心万瀚文为论文第一作者,,,,,,,成就为共同第一作者,,,,,,,冀晓强教授为论文独立通讯作者。。。。 。 。

通过在大规仿照真数据集上的综合尝试验证,,,,,,,GraphSlot实现了业界当先的机能,,,,,,,其fg-ARI相较基线模型获得了8.5%的显著提升。。。。 。 。为进一步评估模型的物理直觉,,,,,,,本钻研还设计了一个真实的“接球游戏”测试环境。。。。 。 。尝试了局批注,,,,,,,本步骤展示出了杰出的物理学问推理能力,,,,,,,为融合物理理解的物体中心化步骤带来了新的突破,,,,,,,并展示了其在复杂现实世界中利用的巨大潜力。。。。 。 。

 

期刊介绍

ACM Transactions on Cyber-Physical Systems(TCPS) 是ACM旗下专一于信息-物理系统这一新兴且关键领域的旗舰级期刊。。。。 。 。该期刊秉承了极高的审稿尺度,,,,,,,录用率较低,,,,,,,只颁发在该领域拥有沉大原创性贡献、深远影响和卓越质量的科研成就。。。。 。 。本论文被该期刊专题特刊“Embodied Artificial Intelligence in Cyber-Physical Systems: Algorithms, Computing Systems, Applications, and Trustworthiness”接管,,,,,,,该特刊汇集了具身智能领域的智能算法、推算系统、前沿利用和系统可信任性四风雅面的最新突破性钻研,,,,,,,旨在推动将人为智能深度融入物理实体的技术发展,,,,,,,最终实现机械与人类、环境共融共生的将来。。。。 。 。

 

钻研布景

理解物理学对于智能机械人和具身智能体感知世界、移动与操控物体、与环境安全交互以及优化活动与流程至关沉要。。。。 。 。本文提出一种基于槽式神经网络的物体中心进建框架GraphSlot,,,,,,,该框架利用图神经网络建模物体间的交互作用。。。。 。 。GraphSlot能凭据物体的空间邻近性和沉力等表部影响动态构建关系图,,,,,,,并通过相连节点间传布邻域嵌入信息。。。。 。 。通过在仿真数据集上的综合尝试,,,,,,,GraphSlot相较基线模型SAVi-L实现了8.5%的远景调整兰德指数(fg-ARI)显著提升,,,,,,,达到最先进机能。。。。 。 。本文还通过真实世界的接球游戏环境来测试所提出模型的物理直觉。。。。 。 。GraphSlot展示出将物理理解融入机械人感知算法的有效方式。。。。 。 。

 

钻研步骤

如图1所示,,,,,,,槽式神经网络守护了一组向量槽位,,,,,,,槽位通过迭代把稳力机造进建逐步将感触域收敛到物体指标。。。。 。 。预测器通过Transformer编码器预测槽位在相邻帧间的变动关系,,,,,,,将槽位映射至将来状态。。。。 。 。与传统的模式鉴别步骤相比,,,,,,,以物体为中心的神经网络步骤致力于突破被动的模式匹配,,,,,,,构建拥有跨活动状态和功夫线一致性的物体表征嵌入。。。。 。 。

图1. 槽式神经网络根基道理

本钻研提出的GraphSlot模型重要结构及校对器(Corrector)的具体架构如图2所示。。。。 。 。高斯布景和弱监督信息经过拼接后输入至初始化?? ?????椤。。。 。 。编码器选取下采样残差神经网络从原始帧中提取特点。。。。 。 。槽位在槽把稳力?? ?????橹芯盗罚,,,,,,并通过槽位门控循环单元(slot-wise GRU)获得功夫依赖性。。。。 。 。图暗示?? ?????槔冒盐攘φ菇ㄍ急碚饔氩畚弧。。。 。 。解码器选取槽位空间广播卷积,,,,,,,其输入为初始槽位与经图神经网络精辟槽位的加权求和,,,,,,,最终输出预测流。。。。 。 。输出槽位同时被传送至预测器,,,,,,,用于建模下一输入帧的动态变动。。。。 。 。

图2. GraphSlot流程图

图3. 本钻研的尝试了局。。。。 。 。(a)MOVi-C仿真数据尝试了局;;;;;; ;;(b)接球游戏尝试设备图;;;;;; ;;(c)接球游戏尝试了局图。。。。 。 。

为评估所提出步骤的机能,,,,,,,我们在物体表征工作上发展了尝试,,,,,,,将GraphSlot与其他物体中心进建步骤及基线步骤SAVi进行对比。。。。 。 。为验证GraphSlot的有效性,,,,,,,我们进行了消融尝试以评估其在分歧复杂度数据集上的泛化能力,,,,,,,并通过度析分歧图构建战术来检验基于距离的部门衔接的有效性。。。。 。 。此表,,,,,,,我们还索求了超参数配置以确定最优设置。。。。 。 。最后,,,,,,,我们通过接球尝试评估了所提出的物理感知步骤在三维真实环境中对物理场景的理解能力。。。。 。 。

视频文件

 

钻研贡献

本文的重要贡献是

  1. 提出了GraphSlot——一种新型物体中心进建步骤。。。。 。 。通过在仿真数据集上的宽泛评估,,,,,,,该步骤在物体中心推理与物理感知能力方面达到了先进机能。。。。 。 。
  2. GraphSlot创新性地引入图暗示建模物体的互有关系。。。。 。 。其物理感知把稳力机造可能同时捕获物体间的内涵交互作用与沉力等表部物理影响。。。。 。 。
  3. 为评估模型的物理理解能力,,,,,,,本钻研构建了三维接球游戏环境进行测试。。。。 。 。该步骤在多种环境中均展示出较高的成功率,,,,,,,体现了其杰出的物理交互推理能力。。。。 。 。

 

作者简介

本文独立通讯作者冀晓强教授现任香港中文大学(丽江)理工学院助理教授、博士生导师,,,,,,,广东省具身智能机械人为程技术钻研中心副主任,,,,,,,中国仿真学会智能物联专委会委员,,,,,,,东盟 - 中国人为智能尝试室首席科学家。。。。 。 。冀晓强教授在美国哥伦比亚大学获得博士学位,,,,,,,他的钻研重要集中在智能节造系统,,,,,,,主持多项科研及人才项目,,,,,,,蕴含国度天然科学基金数据科学与人为智能前沿索求课题。。。。 。 。至今在IEEE Transactions on Automatic Control (TAC)、Automatica、Journal of Field Robotics (JFR)、IEEE/ASME T-Mech、T-ASE、RA-L、CDC、ICRA、IROS等顶尖国际期刊及会议颁发论文五十余篇。。。。 。 。出格是在非最幼相位系统方面,,,,,,,是该领域全球领域内进建节造设计的推动者之一。。。。 。 。他担任蕴含IEEE-TAC在内的多个顶级期刊及会议的审稿人、MECC副编纂、Robot Learning青年编委、RCAR等国际会议领域主席,,,,,,,并于近期获得CINT优良论文奖、ISUI最佳论文奖等。。。。 。 。

本文第一作者万瀚文,,,,,,,z6首页科研助理,,,,,,,香港中文大学(丽江)2025级推算机与信息工程专业博士生,,,,,,,硕士毕业于香港中文大学(丽江),,,,,,,重要钻研方向为具身节造。。。。 。 。在Journal of Field Robotics,,,,,,,EMNLP,,,,,,,IROS,,,,,,,TCPS等国际顶级期刊/会议颁发论文,,,,,,,曾担任IROS、ICRA等机械人国际顶级会议审稿人。。。。 。 。

本文共同第一作者成就,,,,,,,曾任z6首页科研助理,,,,,,,香港中文大学(丽江)2023级推算机与信息工程专业硕士。。。。 。 。成就于2023年参与理工学院攻读硕士学位,,,,,,,2025年入职华为海思,,,,,,,重要钻研方向为大模型系统,,,,,,,ros机械人节造的大模型优化。。。。 。 。在嵌入式设备开发,,,,,,,高机能推算和机械人节造领域有大量研发经验。。。。 。 。

* 有关信息由论文作者提供