您好, 访客   登录/注册

从AlphaGo看机器学习

来源:用户上传      作者:陈东焰 陆畅

  摘   要:2017年5月,AlphaGo以3:0战胜世界排名第一的柯洁九段,一时间引起了人们对人工智能的热议。AlphaGo主要工作原理是深度学习,它属于机器学习,机器学习又属于人工智能的范畴。可以说机器学习是近年来人工智能领域最热门的板块,吸引着诸多研究者投入了大量的研究,也有着丰富的产出。本文从AlphaGo谈起,介绍人工智能的发展,机器学习的概念理解、分类及应用,分析了模型训练中的常见问题,人工智能与伦理的关系。
  关键词:人工智能  机器学习  模型
  中图分类号:TP181                                  文献标识码:A                       文章编号:1674-098X(2020)05(a)-0146-02
  2017年5月,AlphaGo Master以3:0战胜了世界排名第一的柯洁九段,一时间引起了不小的轰动。
  AlphaGo是一款围棋程序,由Google的DeepMind公司开发。早在2015年10月,AlphaGo就以5:0战胜樊麾二段;2016年3月,AlphaGo以4:1战胜拥有18个世界冠军头衔的职业九段李世石;2016年12月29日—2017年1月4日,AlphaGo在网络围棋平台上以“Master”为注册号60:0战胜数十名中韩日职业围棋手;2017年10月18日,最终版本AlphaGo Zero问世,它经过3d的训练以100:0的战绩击败了AlphoGo Lee,经过40d的训练击败了AlphoGo Master 。
  AlphaGo前期版本,结合了数百万人类围棋专家的棋谱, AlphaGo Zero则有了质的提升,它不再需要人类数据和经验,研发团队让它进行自我博弈,3d的训练时间,自我对弈的棋局数量为490万盘。
  AlphaGo主要工作原理是“深度学习”,深度学习是指多层的人工神经网络和训练它的方法。它属于最近十年一个特别火的技术“机器学习”(ML),机器学习又属于人工智能(AI)的范畴。
  1  从机器学习的角度看人工智能的发展史
  1956年夏天,美国达特茅斯学院举行了人工智能研討会,被认为是人工智能诞生的标志。会上约翰·麦卡锡首次提出了“人工智能”这个概念。
  1959年,IBM公司的计算机专家阿瑟·塞缪尔创造了“机器学习”一词。
  1958年,机器人之父恩格尔伯格和发明家德沃尔合作创立一家生产机器人的公司,当年就产出了一个可以自动完成搬运的机械手臂。1961年,第一台工业机器人Unimation在通用汽车试运行,作用非常显著。
  1973年,世界第一个人形机器人Wabot-1在早稻田大学诞生,它可以进行简单日语对话,测量距离和方向,靠双脚行走,两手有触觉,可搬运物体行动。1980年,WABOT-2问世,可以用手脚灵活地演奏电子琴。
  20世纪70年代初,当时的计算机有限的内存和处理速度不足以解决实际的人工智能问题,加上数学模型和数学手段有一定的缺陷,对人工智能研究的资助逐渐停止,人工智能进入第1个低谷。
  直到1980年著名的专家系统XCON的研发,1982年霍普菲尔德神经网络被提出,1986年BP算法出现,使大规模神经网络的训练成为可能,将人工智能推向第2个黄金期。
  20世纪80年代晚期,美国国防高级研究计划局对AI的投资再次减少,1987—1993年,人工智能进入第2个低谷。
  1997年5月,IBM的“深蓝”计算机战胜国际象棋大师加里·卡斯帕罗夫,它存储了从18世纪起的200多万经典对局。
  2006年,杰弗里·辛顿提出“深度学习”神经网络,使得人工智能性能获得突破性进展。2013年,深度学习算法在语音和视觉识别上取得成功,人工智能进入感知智能时代。
  2006年,伊利诺伊大学香槟分校教授李飞飞发现,相对于更好的算法,数据也非常重要,她建立了数据集ImageNet。2017年的图像识别率提升到97.3%,超过了人类,证明了更庞大的数据可以带来更好的决策。
  2011年IBM的超级计算机Watson在美国著名智力节目《危机边缘》中战胜了人类,2015—2017年AlphaGo打败了人类。
  2  理解机器学习及应用
  机器学习的经典定义:利用经验来改善计算机系统的性能。
  传统上,如果我们想让计算机工作,会给它一串指令,一步步执行下去。但机器学习不接受输入的指令,它只接收数据,也就是说机器学习是一种让计算机利用数据而不是指令来进行工作的方法,是通过归纳思想得出的相关结论。简单来讲,“机器学习”的原理就是模仿人类学习的过程,通过经验来强化自己,所以说机器学习超越人类是完全有可能的。
  我们可以这样理解机器学习的过程:
  1+2=?机器:10;——太大了;
  5+7=?机器:6:——太小了;
  2+6=?机器:8;——答对了。
  机器知道了2+6=8,它会在不断的试误中找到正确的答案,在一步步地调整自己学习的方式方法和路径的同时,优化计算过程,保证尽可能少出错,当它能够完全一次性算出正确结果时,它的模型拟合成功,可以被投入使用了。
  机器学习的应用方向:有现存的解决方案,但是需要手写大量规则的问题;不存在较好的解决方案的复杂问题;不断发展的问题,机器学习可以适应新的数据;希望通过机器学习,对复杂问题和大量数据得到一些新的见解。   3  机器学习的分类
  机器学习有不同的分类方法,常见的按是否在人为监督下学习分为:监督学习、无监督学习、半监督学习、增强学习。
  监督机器学习:需要提供带有标签的数据。例如,要区分男孩和女孩的图片,那么男孩的照片打上“男孩”、女孩的照片打上“女孩”标签,训练模型,直到它能通过测试。
  半监督机器学习:只有少数图像被标记,计算机程序对未标记的图像进行最佳猜测,然后作为训练数据反馈给程序。比如,你有一个相片集,拿出部分相片,把自己的相片标识成“我”,把其他人的相片标识成“某人”,训练模型,直到它能够做出正确的分辨。
  无监督机器学习:这种类型的机器学习不涉及任何标签,任由机器深入到数据中去发现和体验,并寻找模式和联系,然后得出结论。
  强化学习:强化学习把学习看作试探评价过程,智能体选择一个动作用于环境,同时产生一个强化信号(奖或惩),智能体根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。
  4  训练模型时的常见问题
  为了训练出更好的机器学习模型,我们会先选择一个合适的机器学习算法,再准备好不同的参数,训练模型,得到合适的参数。
  例如我们现在要做一个分辨一个物体是否是苹果的模型,苹果有很多品种,它要学习苹果这些特征,把这学到的所有特征整合,也就是模型拟合。
  有时存在这样的问题:如果从一开始就界定苹果是红颜色的,那么,给一个青苹果时,机器会认为不是苹果,这就是过拟合。一般认为过拟合是由于网络过深,模型的构建关注到了本不是苹果的特征,导致学习有误。过拟合经常表现为训练时,得分很高,但在测试时正确率却很低。这时候就需要机器做及时的完善,学习成苹果是有颜色的即可。
  有时也会存在这样的情况:如果构建的模型,只认为苹果特征是圆的,那么给一个桔子,它也认为是苹果,这说明机器对苹果特征的学习还不够,这就是欠拟合。一般认为欠拟合是由于网络过小造成的,因此机器就还需要更多的学习来认识苹果。
  5  人工智能与伦理
  控制论之父维纳在《人有人的用处》中在谈到自动化技术和智能机器时,得出了一个危言耸听的结论:“这些机器的趋势是要在所有层面上取代人类,而非只是用机器能源和力量取代人类的能源和力量。”虽然维纳的话在今天还没有成为现实,但已经成为诸多文学和影视作品中的题材,人们也在讨论人工智能究竟在何时会形成属于自己的意识,超越人类,让人类沦为它的奴仆。目前人工智能相关的倫理和法律研究相对滞后,但可喜的是,我们看到有许多有识之士在呼吁大家共同遵循安全的理念和规则。相信机器学习能给人类带来美好的明天。
  参考文献
  [1] 周志华.机器学习[M].北京:清华大学出版社,2016.
  [2] 李德毅,于剑.人工智能导论[M].北京:中国科学技术出版社,2018.
  [3] Aurélien Géron.Hands-On Machine Learning with Scikit-Learn and Tensor Flow[M].CA:O'Reilly Media,Inc,2017.
转载注明来源:https://www.xzbu.com/1/view-15255045.htm