振东制药达霏欣创新推出“内服外治”方案：焕活毛囊新生

发布时间：2025/07/29

近年来，随着生活压力加剧、作息不规律及环境因素影响，脱发、白发问题呈现年轻化趋势，成为困扰现代人的普遍健康难题。面对庞大的市场需求，传统单一治疗手段逐渐显露出局限性。近日，专注毛发健康领域22年的达...
中信银行北京分行精准服务“双循环”战略成功投资京东科技首单“出口转内销”ABS产品

发布时间：2025/07/11

近日，中信银行精准把握国家“畅通国民经济循环”战略机遇，成功投资京东科技发行的市场首单“出口转内销”主题ABS产品——“禾昱7-5资产支持专项计划”优先A级份额1.6亿元。本项目积极响应国家“稳外贸、...
零食新鲜化，来伊份的产品溯源里藏着这些秘密···

发布时间：2023/07/03

在“新鲜零食”的战略引领下，“主板零食第一股”来伊份迈入了企业发展的第23个年头，其传统的线下溯源活动“寻鲜之旅”也已经发展至第九届，本次再度启程将探索芒果之乡——百色，继续为用户展现以“青山绿水”铸“新鲜零食...
雷科智途联合太平洋财产保险共同举办商用车AEBS防碰撞演示活动

发布时间：2022/01/04

2021年12月16日，“安全出行·科技护航”-商用车自动紧急制动系统(AdvancedEmergencyBrakingSystem，简称“AEBS”）防碰撞演示在山东省青岛莱西市隆重举行。出席本次活动的领导和嘉宾有：莱西市应急管理局副局长李凌云...

破记录的2万亿美元刺激计划中有什么?

发布时间：2020/03/27

经过几天的谈判，美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持，而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...
世界在煤炭支持上花费了半万亿美元

发布时间：2020/03/17

全世界的国家有可能继续支持煤炭行业，而不是投资于成本更低，对环境更友好的风能和太阳能项目，从而浪费6400亿美元。金融智囊团Carbon Tracker在周四发布的一份报告中说，全球60%的燃煤发电厂以比可再生能源替...
您还不知道怎么毫无危险的投资？

发布时间：2020/03/13

查看了许多财务平台，阅读有关加密货币、证券交易所的信息并没找到了答案？我也处于过类似情况。我现在写出这篇文章，以帮助您与AlysDax公司一起开始工作！前几天，我的朋友建议我AlysDax平台，哪个专为机构投...
MK FOREX提醒您：黄金:迈向短期阻力的路上

发布时间：2020/03/02

金价延续自1625美元/盎司开始的反弹正常的RSI情况表明反弹将持续关键的斐波纳奇回撤位，附近的上升趋势线限制了短线下跌截至周四早间，金价在每盎司1,650美元附近。金价周三走出了U型走势。黄金价格最近从162...

Google的机械手AI只需很少的训练数据就可以学习旋转保定球

发布时间：2019/09/30 要闻 浏览次数：775

尽管我们的手部解剖学很原始，但同时使用几根手指抓握和操纵对象是人类的一个直截了当的问题。但是机器人要艰难得多。那是因为诸如用铅笔在纸上书写之类的任务需要物理模型来指导将力施加到目标对象上，以及反复建立和断开接触。并且对于解决右手操作问题的常规方法，通常难以精确地生成这样的模型。
因此，Google Brain的研究人员追求一种新颖的机器人任务计划技术，该技术涉及深度动力学模型或DDM。他们声称，他们的方法(本周在Arxiv.org上发布的预印本论文(“用于学习敏捷操作的深度动力学模型”)中描述了该方法，使机械手可以仅用四个小时的实际数据来操纵多个对象。
它建立在AI研究的丰富基础上，致力于研究机器人的手部操纵问题，其中包括腾讯最近的一项研究，该研究调查了五指魔方的立方体求解器。另外，OpenAI研究人员于去年7月详细介绍了一种系统，该系统能够以最先进的精度指导手抓握和操纵对象。去年9月，麻省理工学院CSAIL小组提出了一种名为“密集物体网”的计算机视觉系统，该系统使机器人能够检查，视觉理解和操纵他们从未见过的物体。就其本身而言，Google于今年早些时候与哥伦比亚普林斯顿大学和麻省理工学院的研究人员合作，开发了一种被称为TossBot的捡拾机器人，该机器人学会了将物体抓握并扔入其“自然范围”之外的盒子中。
“无需模型的[机器学习]…方法可以学习在复杂的[机器人操纵]任务上能达到良好性能的策略。 […]但是……当需要高度灵活性时，这些最先进的算法就会遇到困难。”合著者写道。 “ [C]复杂的联系动态和任务失败的可能性很大，使整体技能更加困难。无模型方法还需要大量数据，使其难以在现实世界中使用……在这项工作中，我们旨在突破这种任务复杂性的界限。”
为此，团队的方法将他们描述为“不确定性”的AI模型与最新的轨迹优化相结合。强化学习(一种算法培训技术，采用奖励将软件策略推向目标)，有助于教导系统细微的手和对象交互。计算每个动作是跨多个机器学习模型的平均预测奖励，该模型用于优化候选动作序列。手只执行第一个动作，然后接收更新的状态信息并在接下来的步骤中重新计划。
研究人员指出，“闭环”重新计划方法具有防止错误累积的优点，从而可以减轻误差。此外，他们说，它允许在运行时与训练有素的机器学习模型无关地交换新目标。
研究人员为系统分配了解决一些实际操作难题的任务，所有这些难题都需要与对象接触并将其最终定位到目标位置。最困难的一项是将两个保定球绕着手掌旋转而不会掉落，但研究人员的模型令人印象深刻地设法仅使用100,000个数据点(或2.7小时)的数据来解决该问题。
在一个单独的实验中，该团队重新调整了在保定任务中训练的模型的用途，而无需进行额外的培训即可完成其他任务，包括将单个球移动到机械手的目标位置，并执行顺时针旋转而不是学习逆时针旋转。 (有问题的手是“影子手”，它的手腕带有两个已激活的关节，外加中指和无名指，每个中指和无名指都有三个已激活的关节和一个未激活的关节，还有一个小手指和拇指，有五个已激活的关节。)它成功地将两个球旋转了90度和180度，而没有将它们从相机捕获的两个小时的真实数据中掉落，成功率分别约为100%和54%。
在旨在研究其系统灵活性的后续测试中，该团队在模拟环境中进行了手写体实验。他们说，该方法将建模与特定于任务的控制分离，从而可以跨行为进行概括，而不是发现并记住特定任务或动作的答案。
该论文的合著者写道：“基于深度模型[强化学习]的方法挑战了通用机器学习社区的观念，即模型难以学习且尚未提供像无模型方法一样令人印象深刻的控制结果。” 。 “在我们的灵巧操作任务模拟套件中，[在学习速度和最终性能方面，它始终优于这些先前方法，经常解决那些先前方法无法做到的灵活任务……就我们所知，本文首次证明了这一点。深层神经网络模型确实可以利用高维操纵器，包括高效地利用样本，自动发现精细的运动技能，其中包括只用……小时的真实数据训练的真实灵巧手。”
研究人员打算尽快将代码开源。

上一篇: 针对古巴度假胜地的诉讼指控Expedia非法贩运了卡斯特罗革命中没收的财产

下一篇: Recurly筹集了1,950万美元以通过机器学习提高订阅收入

相关推荐