人工智能“阿尔法围棋”在几次世界瞩目的人机大战后站在了围棋之巅,现在它又以一种新的方式超越了自己:新版本“从零开始”学习围棋,仅用3天就击败其前辈版本,成为新的王者。
英国“深度思维”公司开发出了“阿尔法围棋”,该公司团队在新一期英国《自然》杂志上发表题为《在没有人类知识条件下掌握围棋游戏》的论文,介绍了最新版的“阿尔法围棋-零”。
该公司将“阿尔法围棋”的发展分为四个阶段:第一个版本是“阿尔法围棋-樊”,它在2015年战胜欧洲围棋冠军樊麾,标志着人工智能首次战胜人类职业棋手;第二个版本是“阿尔法围棋-李”,它在2016年战胜曾多次夺得世界冠军的韩国棋手李世石,标志着人工智能战胜人类顶级棋手;第三个版本是“阿尔法围棋-大师”,在今年战胜现在世界排名第一的柯洁,并在与多位有世界冠军头衔的人类棋手“群战”中完胜。
但是,这些版本在刚开始学习围棋时,都要依靠人类知识,即先教它们一些人类摸索出的基本下法,然后再开始自己学习。第四个版本,即最新的“阿尔法围棋-零”摆脱了这个限制,研究人员没有给它除棋盘和棋子之外的任何输入,它完全是“从零开始”,自己与自己对弈,通过更为优秀的算法,取得飞速进步。
开始学习围棋3天后,“阿尔法围棋-零”就以100比0的成绩战胜了“阿尔法围棋-李”;40天后,它又战胜了在所有人类高手看来已不可企及的“阿尔法围棋-大师”。
研究人员认为,从需要预先输入人类知识,到能完全依靠自己摸索,“阿尔法围棋”的进步标志着人工智能的巨大突破,因为这意味着人工智能可以更好地进入对它来说本是一片空白的领域。
“深度思维”公司首席执行官哈萨比斯说,他希望人工智能的这种进步能够被用于分析蛋白质结构、设计新材料等领域,为人们的生活带来积极有益的影响。