网站首页 焦点 > 正文
根据本周发表的一篇预印稿和一篇博客文章,谷歌的研究人员已经开发出一种人工智能系统,该系统可以模仿动物的动作,赋予机器人更大的灵活性。两位作者认为,他们的方法可以促进机器人的发展,使其能够完成现实世界中的任务,例如在多层仓库和配送中心之间运输材料。
团队的框架采用动物(这里是狗)的动作捕捉片段,并使用强化学习(reinforcement learning)——一种通过奖励激励软件代理完成目标的训练技术——来训练控制策略。研究人员说,给系统提供不同的参考动作,可以让研究人员“教”Unitree Laikago四足机器人完成一系列动作,从快走(最高可达每小时2.6英里)到跳跃和转弯。
为了验证他们的方法,研究人员首先收集了一组真实的狗的各种技能的数据。(训练主要是在物理模拟中进行的,以便能密切跟踪参考运动的姿态。)然后,通过在奖励函数中使用不同的动作(描述行为者应该如何表现),研究人员使用了大约2亿个样本来训练一个模拟机器人模仿动作技能。
但是模拟器通常只提供真实世界的粗略近似。为了解决这个问题,研究人员采用了一种适应性技术,在模拟中随机化动力学,例如,改变机器人的质量和摩擦力等物理量。这些值是用编码器映射到数字表示-即。,一个编码——作为输入传递给机器人控制策略。当将该策略部署到一个真实的机器人上时,研究人员删除了编码器,并直接搜索一组变量,这些变量允许机器人成功地执行技能。
该团队表示,他们能够在大约50次试验中,利用不到8分钟的真实数据,使一项政策适应现实世界。此外,他们还演示了现实世界中的机器人学会模仿狗的各种动作,包括踱步和小跑,以及艺术家动画的关键帧动作,如动态跳跃转弯。
“我们证明,通过利用参考运动数据,一种单一的基于学习的方法能够自动合成控制器,适用于多种多样的腿机器人行为,”论文的合著者写道。“通过将示例高效领域适应技术纳入到培训过程中,我们的系统能够在模拟中学习适应策略,然后能够快速适应真实的部署。”
控制策略并不完美——由于算法和硬件的限制,它不能学习高度动态的行为,如大的跳跃和运行,也不像最好的手动设计的控制器那样稳定。(在每一种方法总共15次试验的5次试验中,现实世界中的机器人在踱步时平均在6秒后摔倒;向后小跑5秒钟后;旋转时9秒;和10秒钟的跳跃。)研究人员还需要进一步提高控制器的鲁棒性,并开发能够从视频剪辑等其他运动数据来源学习的框架。
版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
猜你喜欢:
- 2022-12-25 据说Realme X3 SuperZoom是Realme X2的继承者
- 2023-01-27 苹果将在2月14日限时开放北京的5家商店
- 2022-08-28 一加手机可能最终会在其新设备上提供无线充电
- 2021-02-09 自2020年3月以来 OESC支付了超过40亿美元
- 2022-08-07 新款小米Mijia智能体温计正式上市仅售69元
- 2022-07-15 三星GalaxyA71在亚马逊上有疯狂的折扣
- 2023-01-17 中等规格的华为MED AL00智能手机出现在Geekbench上
- 2022-12-02 海盗船已经发布了最新的Dominator Platinum RGB系列产品
最新文章:
- 2023-03-07 战斗机突破音障有没有尾焰(战斗机突破音障)
- 2023-03-07 贵州人长相特点(贵州人)
- 2023-03-07 虐杀原形二最后一个任务(虐杀原形2莫瑟死后有什么任务)
- 2023-03-07 赛尔号博卡特技能表(赛尔号博卡特)
- 2023-03-07 摩尔庄园庄园任务(摩尔庄园精英任务)
- 2023-03-07 bobo toto燕尾蝶 解析(bobo toto)
- 2023-03-07 金融风暴指的是什么(金融风暴是什么意思)
- 2023-03-07 天龙八部真元系统怎么获得(天龙八部真元系统)
- 热点推荐
- 热评文章
- 随机文章
-
- 中等规格的华为MED AL00智能手机出现在Geekbench上
- 一项新专利推出了一款内置TWS耳机的小米智能手机
- 小米用于MIUI 12相机的新功能的灵感来自谷歌相机
- 美国T-Mobile宣称拥有全球首个全国性SA 5G网络
- LG Q92 5G首次亮相 搭载Snapdragon 765G和48MP四摄
- 小米Amazfit GTR 2和GTS 2正式发布:向前迈进了一步
- 有关GeForce RTX 3090的新详细信息
- MSI借助Nvidia RTX 3000显卡全面革新游戏笔记本电脑阵容
- 索尼前老板说索尼封杀Fortnite交叉播放是为了钱
- Google Pixel 4a获得更多认证 即将发布