盈彩网app下载安装

  • <tr id='8LgGjv'><strong id='8LgGjv'></strong><small id='8LgGjv'></small><button id='8LgGjv'></button><li id='8LgGjv'><noscript id='8LgGjv'><big id='8LgGjv'></big><dt id='8LgGjv'></dt></noscript></li></tr><ol id='8LgGjv'><option id='8LgGjv'><table id='8LgGjv'><blockquote id='8LgGjv'><tbody id='8LgGjv'></tbody></blockquote></table></option></ol><u id='8LgGjv'></u><kbd id='8LgGjv'><kbd id='8LgGjv'></kbd></kbd>

    <code id='8LgGjv'><strong id='8LgGjv'></strong></code>

    <fieldset id='8LgGjv'></fieldset>
          <span id='8LgGjv'></span>

              <ins id='8LgGjv'></ins>
              <acronym id='8LgGjv'><em id='8LgGjv'></em><td id='8LgGjv'><div id='8LgGjv'></div></td></acronym><address id='8LgGjv'><big id='8LgGjv'><big id='8LgGjv'></big><legend id='8LgGjv'></legend></big></address>

              <i id='8LgGjv'><div id='8LgGjv'><ins id='8LgGjv'></ins></div></i>
              <i id='8LgGjv'></i>
            1. <dl id='8LgGjv'></dl>
              1. <blockquote id='8LgGjv'><q id='8LgGjv'><noscript id='8LgGjv'></noscript><dt id='8LgGjv'></dt></q></blockquote><noframes id='8LgGjv'><i id='8LgGjv'></i>
                关于科盛

                DeepMind研究人员研发出了一种解决机器人控制问题的混合方案

                时间:2020-01-10 14:32:11点击量:62 作者:杨超月

                  机器人技术的基本问题既涉及离散变盈彩吧量(比如控制模式或齿轮切换的选盈彩平台是不是黑平台择),又涉及连续变量(比如速度设定点和控制增新盈彩674332 com益)。通常来说,由于算法或控制策略并不总是适合的,因此这些问题盈彩骗局很难解决。这就是为什么谷盈彩骗局吗歌母公司Alphabet的DeepMind的研究人员最近提出了一种技术:连续-离散混合学习,即可以同时优化离散和连续动作,以其盈彩厅下载本来的形式处理混合问题。

                 


                来源:DeepMind

                 

                  在预印本服务器Arxiv.org上发表的一篇论文详细介绍了他们的工作,这篇论文也在去亿盈彩国际彩票app年10月日本大阪的第三届机器人学习会议上被人接多盈彩票手机版登录受。作者写道:“许多先进的方法都进行了优化,它们能很好处理离散的或是连续的动作空间,但是却很少有乐盈彩票是正规网站吗方法能同时处理。能够使用同一算法强大地处理离散和连易盈彩票app 12.cc下载续动作空间,使我们能够针对任何给定问题都能选择最自然的解决方案策略,而不盈彩哦哟是让算法上的便利性来决定做出哪种选择。”

                 

                  团队研发的无模型算法,是指利用强化学习或者奖励实现目标的自主代理人的培训技术,通过连续和离散动作空间来解决控制问题,并通过受控和自主切换来解决混合最优控盈彩注册制问题。此外,这种算法通过使用“元动作”或其他类似方案来扩大动作空间(分别定义了盈彩彩票靠不靠谱代理人可能感知和采取的状态和动作的范围),从而为解决现有的机器人问题提盈彩网9369.cc供了新颖的解决方案,并使策略可以解决类似人工智能训练期间的机械磨损等挑盈彩网有app吗战 。

                 

                DeepMind研究人员研发出了一种解决机器人控制问题的混合方案


                来源:DeepMind

                 

                  DeepMind机器人技术

                 

                  研究人员在一系列模拟和现实基准测试中验盈彩彩票网址证了他们的方法,包括Rethink Robotics公司的Sawyer机器人手臂。据称,基于给定的到达、抓取和拿起魔方的任务,其中奖励是三个子任务的新盈彩网站总和,因此他们的算法要优于无法解盈彩彩票安卓版决任务的现有方法。

                 

                  那是因为到达魔方需要代理盈彩登陆地址yc9099 com人打开手臂的抓具,而抓取方块注册登录网址新盈彩653092com需要关闭抓具。作者写道:“一开始,基线将大部分概率集中在较小的动作值上,因此很难移动抓具的手指来看到任何奖励,从而解澳客彩票网 盈彩网释了学习曲线上的平稳期。另一方面,这个算法能始终以全速操作抓具,因盈彩官网此改进了探查性,使机多盈彩票 官方网站dy288器人可以完全完成任务。”

                 

                  在一个单独的实验中,团队将其算法设置为参数t999.cc 有盈彩票化动作空间马尔可夫决策过程(PAMDP)或一个新盈彩是正规公司吗分层问题,其中,代理人首先选择离散动作,然后为该动作选择一组连续的参数集。在这种盈彩网可信吗情况下,代理人的任务是操纵机器人手臂,以宝盈彩便将钉子插入孔中,然后根据孔的易盈彩票客户端下载位置和运动学来计算奖励。

                 

                  研究人员表示,他们的方法比精细方法和粗略方法获得了更大的回报,并且这种算法将来可盈彩平台以作为基础应用到更多的混合强化学习中。论文中写道:“对于专业设计师而言,事先选择合适的模式可能很困难。而我们的方法是很有用的,因为它只需要一个实验,而别的方法都需要通过消融来进行验证。”