阿法狗这样的程序能否被人工智能打败

去年阿法狗（AlphaGo）代表人工智能在围棋领域首次战胜了人类的世界冠军，但其棋艺的精进，是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上，进而自我训练，实现超越。图为阿法狗棋艺增长曲线。人工智能的一项重要目标，是在没有任何先验知识的前提下，通过完全的自学，在极具挑战的领域，达到超人的境地。新一代的阿法元(AlphaGoZero),完全从零开始，不需要任何历史棋谱的指引，更不需要参考人类任何的先验知识，完全靠自己一个人强化学习（reinforcementlearning）和参悟,棋艺增长远超阿法狗，百战百胜，击溃阿法狗100阿发元算法与之前的AlphaGo有两个大的区别。1.与之前将走子策略(policy)网络和胜率值(value)网络分开训练不同，新的网络结构可以同时输出该步的走子策略(policy)和当前情形下的胜率值(value)。2.实际上policy与value网络相当于共用了之前大部分的特征提取层，输出阶段的最后几层结构仍然是相互独立的。训练的损失函数也同时包含了policy和value两部分。这样的显然能够节省训练时间，更重要的是混合的policy与value网络也许能适应更多种不同情况。由此可见阿法狗能被打败。人工智能也会有一天打败人类。

阿法狗这样的程序能否被人工智能打败

热门推荐

相关攻略

最新攻略

热门攻略

当前位置：首页 > 游戏攻略 > 阿法狗这样的程序能否被人工智能打败

阿法狗这样的程序能否被人工智能打败

热门推荐

相关攻略

最新攻略

热门攻略