人工智能
到底什么是人工智能?
人工智能就在我们身边,但并不是所有人都能留意到它的存在。深蓝和AlphaGo,是我们大多人对人工智能的初步认知。
那么,究竟什么是人工智能?历史上,人工智能的定义历经多次转变,但直到今天,被广泛接受的定义仍有很多种。具体使用哪一种定义,通常取决于我们讨论问题的语境和关注的焦点。
定义三:Al就是与人类行为相似的计算机程序
和仿生学派强调对人脑的研究与模仿不同,实用主义者从不觉得人工智能的实现必须遵循什么规则或理论框架。“黑猫白猫,逮住耗子的就是好猫。”在人工智能的语境下,这句话可以被改成:“简单程序,复杂程序,聪明管用的就是好程序。”
也就是说,无论计算机以何种方式实现某一功能,只要该功能表现得与人在类似环境下的行为相似,就可以说,这个计算机程序拥有了在该领域内的人工智能。这一定义从近似于人类行为的最终结果出发,忽视达到这一结果的手段。另一种对人工智能的近似定义则更强调人工智能的实用色彩:A1:就是可以解决问题并获得最大收益的计算机程序。
略懂些编程的人都知道,几乎所有程序设计语言都提供了类似“if…else…”的分支结构,即,如果程序发现某个条件已满足,就执行if之后的指令,否则就执行else之后的指令。那么,与“if…else…”相关的一个哲学问题是,程序根据某个条件进行判断并完成相应操作的时候,这个“判断”以及随后的 “决定”是由计算机自己做出的,还是由编程序的人做出的?如果是由计算机自己做出的,那能不能说所有执行了“if…else…” 语句的计算机程序都是人工智能?如果相反,那计算机根据运行时的情况做决策时,人又在哪里呢?
哲学思辨容易陷入这样的两难境地,但实用主义者根本不把这当回事一一执行“if…else…”的程序是否有智能,完全要看那个程序是不是做了和人相似的有智能的事。像Dendral这样的专家系统就是靠大量“if…else…”来模仿人类专家的判定规则,这当然属于人工智能的范畴,而普通的数值计算程序即便用了“if…else…”也不能被称作智能。
实用主义者推崇备至的一个例子是麻省理工学院于1964年到1966年开发的“智能”聊天程序ELIZA。这个程序看上去就像一个有无穷耐心的心理医生,可以和无聊的人或需要谈话治疗的精神病人你一句我一句永不停歇地聊下去。当年,ELIZA的聊天记录让许多人不敢相信自己的眼睛。可事实上,ELIZA所做的,不过是在用户输入的句子里,找到一些预先定义好的关键词,然后根据关键词从预定的回答中选择一句,或者简单将用户的输入做了人称替换后,再次输出,就像心理医生重复病人的话那样。ELIZA心里只有词表和映射规则,它才不懂用户说的话是什么意思呢。
这种实用主义的思想在今天仍有很强的现实意义。比如今天的深度学习模型在处理机器翻译、语音识别、主题抽取等自然语言相关的问题时,基本上都是将输入的文句看成由音素、音节、字或词组成的信号序列,然后将这些信号一股脑塞进深度神经网络里进行训练。深度神经网络内部,每层神经元的输出信号可能相当复杂,复杂到编程者并不一定清楚这些中间信号在自然语言中的真实含义,但没有关系,只要整个模型的最终输出满足要求,这样的深度学习算法就可以工作得很好。在研究者看来,深度学习模型是不是真的跟人类大脑神经元理解自然语言的过程类似,这点儿都不重要,重要的是,整个模型可以聪明地工作,最终结果看起来就像人做得一样。
定义四:AI就是会学习的计算机程序
这一定义几乎将人工智能与机器学习等同了起来。但这的确是最近这拨人工智能热潮里,人工智能在许多人眼中的真实模样。谁让深度学习一枝独秀,几乎垄断了人工智能领域里所有流行的技术方向呢?
20世纪80年代到90年代,人们还在专家系统和统计模型之间摇摆不定,机器学习固守着自己在数据挖掘领域的牢固阵地远远观望。从2000年到2010年,短短十几年过去,机器学习开始逐渐爆发出惊人的威力,并最早在计算机视觉领域实现了惊人的突破。2010年至今,使用深度学习模型的图像算法在lmageNet竞赛中显著降低了对象识别、定位的错误率。2015年lmageNet竞赛中领先的算法已经达到了比人眼更高的识别准确率。就在同一年,语音识别依靠深度学习获得了大约49%的性能提升。机器翻译、机器写作等领域也在同一时期逐渐被深度学习渗透,并由此获得了大幅改进。
“无学习,不AI”,这几乎成了人工智能研究在今天的核心指导思想。许多研究者更愿意将自己称为机器学习专家,而非泛泛的人工智能专家。谷歌的AlphaGo因为学习了大量专业棋手棋谱,然后又从自我对弈中持续学习和提高,因此才有了战胜人类世界冠军的本钱。微软的小冰因为学习了大量互联网上的流行语料,才能用既时尚,又活泼的聊天方式与用户交流。媒体上,被宣传为人工智能的典型应用大多都拥有深度学习的技术基础,是计算机从大量数据资料中通过自我学习掌握经验模型的结果。
这一定义似乎也符合人类认知的特点—没有哪个人是不需要学习,从小就懂得所有事情的。人的智慧离不开长大成人过程里的不间断学习。因此,今天最典型的人工智能系统通过学习大量数据训练经验模型的方法,其实可以被看成是模拟了人类学习和成长的全过程。如果说人工智能未来可以突破到强人工智能甚至超人工智能的层次,那从逻辑上说,在所有人工智技术中,机器学习最有可能扮演核心推动者的角色。
当然,机器目前的主流学习方法和人类的学习还存在很大的差别。举个最简单的例子:目前的计算机视觉系统在看过数百万张或更多自行车的照片后,很容易辨别出什么是自行车,什么不是自行车,这种需要大量训练照片的学习方式看上去还比较笨拙。反观人类,给一个三四岁的小孩子看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩子也十有八九能做出那是一辆自行车的判断。也就是说,人类的学习过程往往不需要大规模的训练数据。这一差别给人类带来的优势是全方位的。面对繁纷复杂的世界,人类可以用自己卓越的抽象能力,仅凭少数个例,就归纳出可以举一反三的规则、原理,甚至更高层次上的思维模式、哲学内涵等。最近,尽管研究者提出了迁移学习等新的解决方案,但从总体上说,计算机的学习水平还远远达不到人类的境界。
如果人工智能是一种会学习的机器,那么需要着重提高的,就是让机器在学习时的抽象或归纳能力向人类看齐。
定义五-AI就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序
针对人工智能,不同的定义将人们导向不同的研究或认知方向,不同的理解分别适用于不同的人群和语境。如果非要调和所有看上去合理的定义我们得到的也许就只是一个全面但过于笼统、模糊的概念。
维基百科的人工智能词条采用的是斯图亚特 •罗素 ( Stuart Russell)与彼得 •诺维格(Peter Norvig ) 在《人工智能:一种现代的方法》'一书中的定义,他们认为:
人工智能是有关“智能主体 ( Intelligent agent)的研究与设计”的学问,而“智能主体是指一个可以观察周遭环境并作出行动以达致目标的系统”
基本上,这个定义将前面几个实用主义的定义都涵盖了进去,既强调人工智能可以根据环境感知作出主动反应,又强调人工智能所做出的反应必须达致目标,同时,不再强调人工智能对人类思维方式或人类总结的思维法则(逻辑学规律)的模仿。
以上,列举了五种常见的人工智能的定义。其中,第二种定义(与人类思考方式相似)特别不可取。人们对大脑工作机理的认识尚浅,而计算机走的几乎完全不同的技术道路。正如深度学习“三巨头”之一的扬.勒丘恩(Yann LeCun)所说,对深度神经网络,“我最不喜欢的描述是‘它像大脑一样工作’,我不喜欢人们这样说的原因是,虽然深度学习从生命的生物机理中获得灵感,但它与大脑的实际工作原理差别非常巨大。将它与大脑进行类比给它赋予了一些神奇的光环,这种描述是危险的。这将导致天花乱坠的宣传,大家在要求一些不切实际的事情。人工智能之前经历了几次寒冬就是因为人们要求了一些人工智能无法给予的东西”。国内著名机器学习专家、南京大学教授周志华则说:现在有很多媒体,常说深度学习是模拟人脑,其实这个说法不太对。我们可以说从最早的神经网络受到一点点启发,但完全不能说是‘模拟人脑’之类的。
第一种定义(让人觉得不可思议)揭示的是大众看待人工智能的视角,直观易懂,但主观性太强,不利于科学讨论。第三种定义(与人类行为相似)是计算机科学界的主流观点,也是一种从实用主义出发,简洁、明了的定义,但缺乏周密的逻辑。第四种定义(会学习)反映的是机器学习特别是深度学习流行后,人工智能世界的技术趋势,虽失之狭隘,但最有时代精神。第五种定义(维基百科使用的综合定义)是学术界的教科书式定义,全面均衡,偏重实证。
本文选自《人工智能》作者李开复 王咏刚
四川弘和集团,成立于2005年,主要经营业务包括人工智能产品研发、生产、销售, 大数据应用服务、定制软件开发、互联网和移动互联网、电信增值业务等。
通过ISO9001(国际标准质量体系)、CMMI5软件成熟度认证,具有系统集成、安防、建筑智能化、B类电信增值业务、信息安全、SP、ISP等专业资质。参与人工智能图像识别标准制定,在人工智能算法研究和应用领域处于行业领先地位。
企业定位为人工智能应用服务提供商,依托人脸识别、计算机视觉、语义识别和大数据核心技术,结合物联网、无人机、机器人、4G/5G通信和区块链技术,整物联网和移动互联网商业模式,全面打造人工智能2B和2C端应用产品,成为专业的人工智能技术产品创新型和应用服务型企业。
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !