10月19日消息 说起当习最流行的人工智能技术,许多人印象最深的应该就是击败柯洁后宣布不再参加围棋比赛的谷歌AlphaGo了。而据最新消息显示,谷歌旗下的人工智能研究部门DeepMind日前又发布了新版的AlphaGo软件!那么,新版AlphaGo又有哪些特别之处呢?就让我们一起去看看吧。
据悉,这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。
经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。
结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。
值得注意的是,除了可以通过自我对弈进行学习外,AlphaGo Zero还比此前的几代产品更加节能!与需要占用大量资源的AlphaGo Lee、AlphaGo Fan不同,AlphaGo Zero只需要使用一台配有4个TPU的机器。