亚博每月vip规则

  Handol 是韩国 NHN 娱乐公司推出的一款围棋 AI,用以训练的数据来自 1999 年以来 NHN 公司在游戏业务方面的大量积累。与 AlphaGo 的进化路线 出世,当时已拥有人类职业棋手 9 段棋力,可以实现在人类棋谱及既定模式的基础上对棋局进行预测,到了 Handol 2.0 已经能够脱离棋谱,自己与自己下棋。在 NHN 看来,Handol2.1 的实力已经超越了当初对战李世石的 AlphaGo。

亚博每月vip规则

  当然,这样的 bug 不止存在于 AlphaGo。李世石曾说:「在腾讯『绝艺』中,这样的 bug 至今仍然会出现。即使现在的绝艺已经可以做到让人类两子胜利了,但它仍然会以奇怪的方式输掉比赛,这是因为一个 bug 所致。」

  和人类不同,AlphaGo 没有先入为主的概念,这恰恰也是所有围棋 AI 的优势所在:尽管有时 AI 的落子显得违反直觉,但确实是最合理的。

  当很多人都以为李世石的最后一战会选择与古力对决时,李世石却选了韩国围棋 AI「Handol」,理由是担心「最后和他下棋的人会有负担」。

  李世石面对 AlphaGo 的那一次胜利,曾经为人类战胜人工智能带来了一线希望,但后来李世石将胜利归功于 AlphaGo 程序的缺陷。「我的第 78 手并不应该用直接的方式应对。」

  在接受韩联社采访时,他表示自己之所以选择退役,是因为「AI 不可战胜」:「在围棋 AI 出现以后,我发觉即使自己成为第一名,也永远需要面对一个不可战胜的实体。」

  2019 年 1 月,Handol 连续战胜了申旻埈九段、李东勋九段、金智硕九段、朴正焕九段和申真瑞九段五位韩国顶级围棋选手,8 月在山东举行的「中信证券杯」世界智能围棋公开赛中,Handol 也捧回了季军奖杯。

  这场比赛仅用两小时就分出了胜负, 在 100 手以内即告结束。尽管李世石表示赛前曾连续练习了十天的被让两子棋,「几乎醒着的时候都在练棋」,但他也表示未能料到自己会在与 AI 的对决中获胜。

  原标题:《1:2,李世石最后一战被AI击败,唯一战胜过AlphaGo的人退役了》

  Handol 是韩国 NHN 娱乐公司推出的一款围棋 AI,用以训练的数据来自 1999 年以来 NHN 公司在游戏业务方面的大量积累。与 AlphaGo 的进化路线 出世,当时已拥有人类职业棋手 9 段棋力,可以实现在人类棋谱及既定模式的基础上对棋局进行预测,到了 Handol 2.0 已经能够脱离棋谱,自己与自己下棋。在 NHN 看来,Handol2.1 的实力已经超越了当初对战李世石的 AlphaGo。

  这是他自从 2016 年负于 AlphaGo 之后,再一次对战围棋 AI,也是人类棋手第一次与 AI 下升降三番棋。

  早期的 AlphaGo 使用「决策网络」选择下一步棋的位置,使用「价值网络」预测每一个位置上决定的胜者。这两个网络在 AlphaGo Zero 中被结合起来,从而使其更高效地训练和评估赛况。并且,AlphaGo Zero 版本只需 4 块 TPU 即可运行。

  「绝艺」的训练主要包括人类棋谱数据库和机器自对弈,它的算法基于策略网络与价值网络两大核心,并创新性地大幅提升了价值网络的精度,使其大局观表现更好。在 2018 腾讯世界人工智能围棋大赛中,「绝艺」在决赛中 7:0 大胜另一款围棋 AI「星阵」夺冠,半决赛五番棋和决赛七番棋不失一局,赛后「星阵」研发团队亦称赞「绝艺」已经「达到了 AlphaGo 的水准」。

  12 月 21 日,最后一局的赛场转移到了李世石的家乡全罗道新安郡。这一场李世石依然受两子执黑挑战 AI,黑棋贴目 7 目半。人类与 AI 在棋盘右下角展开激战。

  人类再次在围棋「人机大战」中取得了一场胜利。谷歌 DeepMind 资深研究员、ALphaGo 主要程序开发者黄士杰曾在看完前两盘对决之后表示,如果再有两年的算法更新和优化,AlphaGo Master 将会是最强的棋手。但 AI 要做到万无一失,仍需要解决 bug 问题。

  乌镇之后,DeepMind 宣布 AlphaGo 从此不会再参与比赛,但在几个月后推出了更强版本的围棋 AI「AlphaGo Zero」。如果说 AlphaGo 版本最初还需要观察数千场人类围棋比赛来训练如何学习围棋,AlphaGo Zero 则直接跳过这一步,从自己完全随机的下围棋开始来学习围棋,几天之内即超越人类棋手的水平,并且以 100:0 的比分打败了之前战胜世界冠军的 AlphaGo。

发表评论

电子邮件地址不会被公开。 必填项已用*标注