去年阿法狗(AlphaGo)代表人工智能在围棋领域首次战胜了人类的世界冠军,但其棋艺的精进,是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上,进而自我训练,实现超越。图为阿法狗棋艺增长曲线。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。新一代的阿法元(AlphaGoZero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcementlearning)和参悟,棋艺增长远超阿法狗,百战百胜,击溃阿法狗100阿发元算法与之前的AlphaGo有两个大的区别。1.与之前将走子策略(policy)网络和胜率值(value)网络分开训练不同,新的网络结构可以同时输出该步的走子策略(policy)和当前情形下的胜率值(value)。2.实际上policy与value网络相当于共用了之前大部分的特征提取层,输出阶段的最后几层结构仍然是相互独立的。训练的损失函数也同时包含了policy和value两部分。这样的显然能够节省训练时间,更重要的是混合的policy与value网络也许能适应更多种不同情况。由此可见阿法狗能被打败。人工智能也会有一天打败人类。
阿法狗这样的程序能否被人工智能打败
阅读:9
免责声明:本站发布的游戏攻略(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场。
如果本文侵犯了您的权益,请联系站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!
上一篇:阿尔法狗是不是真正意义的人工智能
热门推荐
相关攻略
最新攻略
猜你喜欢
- 12023梦幻西游兔年元宵活动2023梦幻西游兔年元宵活动攻略
- 2朕的江山2小乔值得培养吗小乔技能实力分析
- 3破晓九天攻略大全前期开局玩法介绍
- 4为什么盗版FC卡带上总有一个“牛屎芯片”黑疙瘩
- 5龙珠z之战攻略大全(龙珠z之战攻略)
- 6职场保卫战攻略升职率,职场攻略:如何提高升职率
- 7最强蜗牛医学博士来信怎么获得
- 8诛仙手游元魂珠在哪里获取
- 9都江堰的故事
- 10魔兽世界猎人抓什么BB好
- 11逆水寒手游剑梦临渊绝技怎么获得
- 12《魔兽世界》人类坐骑在哪买
- 13梦幻西游120级剧情杀到最后那个牛魔王怎么杀不了
- 14有哪些长相上明显不行却令你越看越喜欢的韩国爱豆吗
- 15起点白金大神的成名书各是什么
- 16DNF死灵被动觉醒点不点