切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
擀面皮包饺子,MIT、CMU等的研究员让机器人自己学会了 ...
菲龙网编辑部7
有 744 人收听 TA
147261
主题
147278
回复
173376
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/54
田轩:10月非传统银行市场表现强劲,长期资金入市可促稳定
0/40
理财公司如何探索构建多资产多策略体系?当下时点哪些大类资产更具投资价值?南财理财通第九期策略会成功举办!
0/49
服务实体经济,这家银行不是说说而已
0/39
中国工商银行:未来五年将为苏州市提供不低于10000亿元的投融资支持
0/35
独家专访芝商所全球金属产品主管Jin Hennig:多交易中心对市场参与者有利,金属市场交易参与度上升
0/41
广银理财“幸福添利1个月持有期第3号A”近3月净值增长率领跑最短持有期产品榜单,成立来收益超基准上限75bps丨机警理财日报
0/36
服务实体经济,这家银行不是说说而已|新京智库
0/37
国家医保局发文,商业健康保险迎来利好!国新健康回应
0/38
服务实体经济,这家银行不是说说而已 | 新京智库
查看TA的全部帖子>>
擀面皮包饺子,MIT、CMU等的研究员让机器人自己学会了
时间:2022-4-2 10:56
0
567
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
你能想象让机器人揉面团,擀面皮,包饺子吗?对机器人来说,操纵衣物、面团等柔软无坚固形状的可形变材料一直是个棘手的问题。面团的形状可以以多种方式变化,而这些变化很难用方程式表示。
此外,从面团中创建新形状需要多个步骤并使用不同的工具。对于机器人来说,学习具有长步骤序列的操作任务尤其困难,因为学习通常是通过反复试验完成的,其中有许多可能的选择。
当地时间3月30日,麻省理工学院、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员为这种任务提出了一种更好的方法。他们创造了一种“两阶段学习框架”,名为“Teacher”(老师)的算法解决机器人要完成任务所必需的每个步骤,然后它训练“Student”(学生)机器学习模型去学习关于何时及如何执行任务所需的每项技能的抽象概念,比如用擀面杖。有了这些知识,系统就会推理出如何执行技能来完成整个任务。
研究人员认为,这种他们称之为DiffSkill的方法可以在模拟中执行复杂的操作任务,例如切和揉面团,或从砧板周围收集面团,同时优于其他机器学习方法。
除了制作披萨、饺子外,这种方法还可以应用于机器人需要操纵可形变物体的其他环境中,如为老年人或运动障碍者喂食、洗澡或穿衣的护理机器人。
“这种方法更接近我们人类计划行动的方式。当一个人执行一项长期任务时,我们并没有写下所有的细节。我们有一个更高级别的计划者,它大致告诉我们在此过程中需要实现哪些阶段以及一些中间目标,然后我们执行它们,”论文作者之一,MIT计算机科学与人工智能专业的研究生李云珠说道。
分开来看具体的工作原理。DiffSkill框架中的“Teacher”是一种轨迹优化算法,可以解决物体初始状态和目标位置很接近的短视界(short-horizon)任务。轨迹优化器在模拟现实世界的物理模拟器中工作(称为可微物理模拟器,它将“Diff”放入“DiffSkill”中)。“Teacher”算法使用模拟器中的信息来学习面团在每个阶段必然如何移动,一次一个,然后输出这些轨迹。
然后“Student”神经网络学会模仿老师的动作。作为输入,它使用两个摄像头图像,一个显示当前状态的面团,另一个显示任务结束时的面团。神经网络生成一个高级计划,以确定如何将不同的技能联系起来以达到目标。然后,它为每个技能生成特定的、短视界的轨迹,并将命令直接发送到工具。
研究人员使用这种技术对三种不同的模拟面团操作任务进行了实验。在一项任务中,机器人使用抹刀将面团举到砧板上,然后使用擀面杖将其压平。在另一个例子中,机器人使用抓手从柜台上收集面团,将其放在抹刀上,然后将其转移到砧板上。在第三个任务中,机器人用刀将一堆面团切成两半,然后使用夹具将每一块面团运送到不同的位置。
“DiffSkill能够胜过依赖强化学习的流行技术,在强化学习中,机器人通过反复试验来学习任务。事实上,DiffSkill是唯一能够成功完成所有三个面团操作任务的方法。有趣的是,我们发现‘Student’神经网络甚至能够胜过‘Teacher’算法,”卡内基梅隆大学 (CMU) 研究生林兴宇说道。
林兴宇认为,这个框架为机器人获得新技能提供了一种新颖的方式,可以将这些技能链接起来,以解决更复杂的任务。这些任务超出了以前的机器人系统的能力。
因为他们的方法侧重于控制工具(抹刀、刀、擀面杖等),所以它可以应用于不同的机器人,但前提是它们要使用研究人员定义的特定工具。未来,他们计划将工具的形状整合到“Student”网络的推理中,以便将其应用于其他设备。
研究人员打算通过使用3D数据作为输入来提高DiffSkill的性能,而不是使用难以从模拟传输到现实世界的2D图像。他们还希望使神经网络规划过程更高效,并收集更多样的训练数据,以增强DiffSkill对新情况的泛化能力。从长远来看,他们希望将 DiffSkill应用到更多样化的任务中,包括布料操作。
这项研究由卡内基梅隆大学(CMU)研究生林兴宇,加州大学圣地亚哥分校研究生黄志奥,麻省理工学院脑与认知科学系认知科学与计算职业发展教授Joshua B. Tenenbaum,CMU助理教授David Held,以及MIT-IBM Watson AI Lab的研究科学家 Chuang Gan合作完成。其得到了美国国家科学基金会、LG电子、麻省理工学院-IBM 沃森人工智能实验室、美国海军研究办公室和国防高级研究计划局的部分支持。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部