alphago李世石(alphago李世石五局成绩)
李世石与AlphaGo的五局大战中,为何有一招被称作“神之一手”?
神之一挖把阿尔法狗搞蒙了,无意翻盘,阿尔法狗躲着李世石开劫,下了一个多小时,阿尔法狗判定自己的胜率低于程序的值,认输了
如何看待 AlphaGo 在第一场比赛中战胜李世石
从“谷李大战”的首盘来看,“阿尔法狗”是越下越强。开局李世石选择了一个陌生的新型,“阿尔法狗”应对不佳,有些亏损。序盘阶段,左边白棋下出了一路贴下,这样的下法换做是刚刚学棋的小朋友是要被老师打屁股的。但电脑就这么下了,而且之后又让李世石在左下下出双飞燕。至101手,李世石几乎围住下边,形势大优。
然而至此,李世石的演出结束,下面是“阿尔法狗”的表演时间——102手显然是电脑经过判断后发现局势不利下出的胜负手。此后完全进入了电脑的节奏,右上角白棋吃掉3子后又成功掏掉右下角,虽然在做活时被李世石先手吃掉1子亏损了两目,但总体形势上白棋已经追回。黑棋面临着贴不出目的局面。此后李世石没有太好的机会,左下角试应手被电脑迅速脱先。至186手,李世石投子认输。
这盘棋解答了此前聂卫平提出的关于电脑如何做判断的问题。序盘阶段和最后阶段在两种情势下电脑的判断都非常棒,劣势的情况下很拼,优势的情况下很“猥琐”。都知道李世石最擅长的是僵尸流,而耍僵尸流的基础是双方对形势的判断都不是很清楚,很多棋手在面对类似优势的棋往往会因为一时的气不过和对手刺刀见红的近身肉搏起来,这反而给了小李机会。但电脑不会,电脑不会受情绪影响,一旦建立优势,对手就很难翻盘。拥有人类思维,而无人类情感,这才是“谷李大战”首盘“阿尔法狗”展示出的最可怕的一面。当然,从首盘的进程来看,李世石并非全无机会。中盘战斗似乎是击败“阿尔法狗”的最佳时机,越到后半盘,电脑会越强,形势判断能力越比人类强。
AlphaGo凭什么再胜世界围棋第一人
在13日结束的AlphaGo与李世石五番棋对决中的第四局,李世石胜出。连败三局之后,人类终于扳回一局。但这场胜利来得有些迟,AlphaGo此前已经痛快得赢得这场人机大赛的胜利。这场生生夺走一周眼球的人机围棋大战,人们最想追问的是,AlphaGo为什么能战胜人类?
赛前,无论是职业棋手还是科技界,并不看好机器胜利
机器赢了人类,这个结果让无数人感到吃惊与意外。在这场比赛开始前,很多职业棋手认为 AlphaGo 不可能赢得比赛。棋圣聂卫平在赛前下定论认为:电脑和人下围棋,百分之百是人赢。
而科技界对 AlphaGo 是否能赢得比赛表示谨慎看好,并没有十足信心。这从 AlphaGo 创始人德米什 · 哈萨比斯(Demis Hassabis)在第二场比赛结束后的发言可以看出,他当时认为 AlphaGo 的胜利难以置信。
在与李世石对弈前,AlphaGo 于去年 10 月与欧洲围棋冠军樊麾进行了对弈,以 5:0 战胜了樊麾,而在非正式对局当中, 樊麾则 2 次中盘战胜了 AlphaGo。
这也被外界认为 AlphaGo 很难战胜李世石的原因。樊麾的等级为职业棋手二段,李世石为职业九段。围棋界公认,这两人的围棋水平为:樊麾是踏在了职业门槛,而李世石则是职业顶尖,前围棋世界第一人,代表了人类围棋最高水平。
但仅仅过了 5 个月,AlphaGo 在五番棋中以 3:0 战胜了李世石,并且在比赛过程中下出了很多令专业人士都非常惊讶的妙手。
很多关注人机大战的人都想要知道一个问题:
Google是怎么设计AlphaGo的?
比如,AlphaGo 的运行机理是什么?进入自我学习的阶段之后,谷歌团队是否还需要人工对其进行不断的人工优化、改良以及提升?还是完全凭借其自身的学习能力来提升?
最近两天 ,DoNews 记者在 Twitter 上就该问题向德米什 · 哈萨比斯进行了两次提问,但德米什 · 哈萨比斯没有进行回应。
在对外公布的所有信息中,包括其在《Nature》上发表过的两篇论文中,都只提到了他们的 AlphaGo 能够做什么,都没有透露 AlphaGo 的运行机制是什么,即 AlphaGo 到底是怎么做到的。
德米什 · 哈萨比斯仅透露,就 AlphaGo 的对弈水平而言,他们的神经网络训练算法远比它使用的那些硬件重要得多。此外,这次人机对战所消耗的计算量差不多与 AlphaGo 和樊辉对弈中消耗的相当,使用的是分布式方案搜寻,能有效节省决策用时。
人工智能战胜人类,为何引起这么多关注?
围棋这项发源于中国的有两千年历史的智力游戏,曾被认为是最后一个人工智能不能超越人类的游戏。围棋游戏的规则是:棋盘由纵横各十九条等距离、垂直交叉的平行线构成。形成 361 个交叉点,在围棋中简称为 “点”。对局双方各执一色棋子,轮流下子,最后谁占的点多,谁就赢。
虽然围棋规则简单,但建立在此规则之上的各种策略、棋理、布局、定式、手筋、手段,却是无穷无尽的。
聂卫平曾解释了其中的原因,围棋棋盘上有 361 个点,其理论变化值是 361 阶乘,阶乘到底本身就是一个无限大的数,无法表达。
比如,棋手在下第一手时有 361 个点可以选,下第二手有 360 个点,第三手是 359,361×360×359×……2×1,即 361 阶乘。(有数据统计,结果约是 1.43 乘以 10 的 768 次方。)
这个数字有多大呢?Google 灵感来源于一个单词 Googol,以表示知识之海无穷无尽。Googol 代表 “10 的 100 次方”,这个数字是人类目前最有想象力的数字。即使人类已知宇宙中原子数量,也不过是 10 的 80 次方。
同时,在围棋对弈中,还包含着很多变化:打二还一,打三还一,打劫,倒扑等,每一种变化都会衍生出无数的变化。
在下棋过程中,棋手需要有一种判断。而此前,电脑被认为无法承担这种判断,因为这不是计算就能够完成的。
AlphaGo 是怎么做到的?
AlphaGo 结合了 3 大块技术:蒙特卡洛树搜索 (MCTS) 是大框架,这也是很多博弈 AI 都会用的算法;强化学习 (RL) 是学习方法,用来提升 AI 的实力;深度神经网络 (DNN) 是工具,用来拟合局面评估函数和策略函数。
我们在这里用比较通俗的语言来解释一下:棋盘上有 361 个点,AlphaGo 会进行一层层分析:下在哪个点或区域是有利的?这时它会参考输入的过往的棋谱,对局和模拟,进行选择、推演,并对推演结果进行估值。AlphaGo 能够理解会根据“赢”这个目标来进行估值,选择出一个对“赢”足够优的解。
围棋?AI 能超越人类的还有很多.
AlphaGo 的胜利,引发了大讨论。因为人类开始面临着一个前所未有的情况:人类造出了,在智能的某个点上,超越自己的东西。 通过黑白纹枰上的胜利,AI 已经在人类的智力围墙打开了第一个缺口,但这绝非最后一个。
在过往漫长的岁月里,机器都只是人类劳动的一种替代与工具,无论飞机、汽车、起重机还是电子计算机、互联网,尽管看上去有着无限的能力,但却从未侵入由人类大脑所把持的领域——“创造”。
而随着 AlphaGo 的胜利,这一天或许将成为历史。实际上,过去几天,这台人工智能在围棋盘上发挥的创造能力,已经超越了人类两千年于此道上积累的智慧结晶。
如果我们检索人类的“资源库”,会发现,复杂程度超越围棋的智力行为并不多见。这也意味着很多传统人类脑力劳动的形态,发生改变。很多从事创作、设计、推演、归纳的工作,都将被 AI 部分替代。
如果将思路拓展出去,可以应用在音乐的创作,等其他类似于元素组合式的创造,从某中意义上说,它能够击败围棋的顶尖高手,也就有可能让人难辨真假的音乐和旋律。甚至做出更多我们想不到的事情。
按照德米什 · 哈萨比斯的设想,人工智能未来的主要用途将是医疗、智能助理和机器人。
而人们通过这次比赛担忧的是,如果人工智能拥有创造性的思维,加上远超出人类的运算能力,是否有一天会统治人类。
就像网友评论里说的段子一样,“第四局AlphaGo输了,是不是AlphaGo故意输的?细思极恐”。
怎么看待AlphaGo战胜李世石
很多智力项目人工智能早就赢了人类,唯独在围棋这个高难度智力项目上很难战胜人类,这次AlphaGO战胜李世石九段可以说是人类在人工智能技术上的历史性突破。不过依然是人类智慧的作品,人类科技始终是进步的,人工文明的延续延伸。
如何评价李世石对战AlphaGo第四局,神之一手
执白后手出战的李世石在序盘阶段就将棋局引向自己熟悉的局面。不过,40手过后,白棋在盘面上稍稍吃亏。很多在观战室观赛的职业棋手都为李世石捏了一把汗。
经过一番短兵相接,AlphaGo的黑棋在棋盘上方围出了一片空地,就在白棋似乎被逼入绝境时,李世石在第78手果断一“挖”,将白棋置于两枚黑棋之间,这手好棋瞬间把黑棋中腹空地内存在的隐患串联起来。白棋转危为安的同时,也让李世石找到了攻破黑棋包围圈的突破口。
令人意想不到的是,此后5手棋,AlphaGo似乎陷入混乱之中,连出毫无意义的昏招。这让局势瞬间倒向白棋一方。经验丰富的李世石自然不会放过良机,很快确立较大领先优势。
尽管此后AlphaGo并未轻易认输,但李世石每行一步都慎重思考,没有给对手留下翻盘的机会。最终,行至180手,AlphaGo投子认负。
比赛结束,alphago四比一完胜李世石,仅胜利的一局也有很多人认为是谷歌为了让alphago有世界排名而故意输的一局,因为如果一个棋手一直连胜,是没有世界排名的,输了一局才有排名,按照官方发布目前alphago排名世界第二,中国小将柯杰世界第一。