阿尔法狗再进化,是怎么做到的

当人们还在赞叹今年5月的阿尔法狗之时,一切都发生了改变,AlphaGo再次登上世界顶级科学杂志——《自然》。原来在伦敦当地时间10月18日,DeepMind团队公布了最强版AlphaGo,代号AlphaGoZero。

据说这AlphaGoZero以100:0压倒性的优势战胜了原始的AlphaGo,与原始的它不同,这次它的独门秘籍,是“自学成才”。完全由自己学习,零基础学习,在短短3天内,成为顶级高手。

AlphaGo此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。经过了好几个月的训练,依靠的是多台机器和48个TPU,AlphaGoZero的能力则在这个基础上有了质的提升,它不再需要人类数据,而且只用到了一台机器和4个TPU,极大地节省了资源。

Zero的成功主要得益于更新后的神经网络和搜索算法重组,随着训练地加深,系统的表现一点一点地在进步。自我博弈的成绩也越来越好,同时神经网络也变得更准确。所以轻松战胜了原始的阿尔法狗。

免责声明:本站发布的游戏攻略(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场。
如果本文侵犯了您的权益,请联系站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!