网站首页 焦点 > 正文
在本周发表的一篇论文在预印本服务器Arxiv.org,一个研究小组从谷歌大脑,Google X,和加利福尼亚州伯克利大学的描述一个扩展现有人工智能方法,使代理人——例如,一个机器人——决定行动在执行之前采取行动。这个想法是,模仿一个人或动物的行为将在未来导致更健壮、更不易失败的系统。
研究人员指出,虽然在视频游戏AI算法取得了成功,机器人抓住,和操作任务,大多数使用阻塞observe-think-act范式——一个代理假设环境仍将静态虽然“认为”,因此其行动将执行在同一州的计算。这在模拟中是正确的,但在现实世界中则不然,在现实世界中,环境状态随着代理处理观察和计划下一步操作而演变。
该团队的解决方案是一个可以在机器学习上下文中处理并发环境的框架。它利用标准的强化学习公式——通过奖励驱动agent向目标前进的公式——其中,agent从一组可能的状态接收一个状态,并根据策略从一组可能的动作中选择一个动作。环境返回从转换分布中采样的下一个状态和一个奖励,以便代理学习如何最大化每个状态的期望回报。
除了前面的操作之外,还有两个额外的特性——操作选择时间和向量化(vectorto -to-go, VTG)——有助于封装并发知识。(研究人员将VTG定义为在测量环境状态时要执行的最后一个动作。)并发操作环境在执行前一个操作和捕获状态之后捕获状态。策略选择一个操作并执行它,而不管前一个操作是否已经完成——即使这需要中断前一个操作。
研究人员在一个真实世界的机器人手臂上进行了实验,他们的任务是抓住并移动垃圾箱中的各种物体。他们说,他们的框架取得了可与基线阻塞模型相比的成功,但就策略持续时间而言,它比阻塞模型快了49%,而阻塞模型可以度量策略的总执行时间。此外,并发模型能够执行比基线“更平滑”和更快速的轨迹。
“并发方法可能允许机器人在动态环境中进行控制,在此环境中,机器人不可能在计算动作之前停止环境,”合著者写道。“在这些情况下,机器人必须同时思考和行动。”
此前,谷歌(google)领导的一项研究描述了一种人工智能系统,该系统通过模仿动物的动作来赋予机器人更大的灵活性。两位作者认为,他们的方法可以促进机器人的发展,使其能够完成现实世界中的任务,比如在多层仓库和配送中心之间运输材料。
版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
猜你喜欢:
- 2022-12-12 三星的GalaxyFold终于有了一个发布日期但仍然有更多的坏消息
- 2023-01-11 nubia Red Magic 5G带来144Hz屏幕 为手机提供主动风冷
- 2022-12-24 Microsoft延迟某些Windows Phone应用的终止
- 2022-07-27 华硕和微星发布了他们的Rocket Lake Z590主板价格表
- 2022-11-02 OPPO A72 5G与联发科MT6853芯片组一起出现在Geekbench上
- 2023-01-25 TCL奇怪的可扩展手机原型的泄漏图像让您大饱眼福
- 2022-08-06 注意AmazfitGTS2Mini智能手表的特性和设计
- 2022-08-05 小米MiMix4在Geekbench上以这些分数展示了自己的肌肉
最新文章:
- 2023-03-07 战斗机突破音障有没有尾焰(战斗机突破音障)
- 2023-03-07 贵州人长相特点(贵州人)
- 2023-03-07 虐杀原形二最后一个任务(虐杀原形2莫瑟死后有什么任务)
- 2023-03-07 赛尔号博卡特技能表(赛尔号博卡特)
- 2023-03-07 摩尔庄园庄园任务(摩尔庄园精英任务)
- 2023-03-07 bobo toto燕尾蝶 解析(bobo toto)
- 2023-03-07 金融风暴指的是什么(金融风暴是什么意思)
- 2023-03-07 天龙八部真元系统怎么获得(天龙八部真元系统)
- 热点推荐
- 热评文章
- 随机文章
-
- 英特尔i911900K的存储速度比Ryzen95950X高出11%
- 华为将放弃Windows在其PC上使用HarmonyOS
- 联想开始大肆宣传即将推出的Z5智能手机
- 三星为Galaxy Note 9带来了绝对庞大的One UI 2.1更新
- 随着AI的不断发展 放射科医生必须再次拥抱变化
- 三星出色的GalaxyBuds+降到有史以来最低价
- 人工智能机构Neil Sahota呼吁建立一个新的专家生态系统
- Realme 30W Dart Charge 10000mAh移动电源估价为27美元
- 华为Mate 40的相机周围可能有一个屏幕
- 育碧在Xbox Series X上以4K 60 FPS运行刺客信条瓦尔哈拉