hj: 人工智能简史-1

电影中《机械姬》《终结者》《黑客帝国》《机器人瓦利》《人工智能》《超验骇客》《超体》等等都是好莱坞对未来人工智能的愿景。现实生活中的搜索引擎、邮件过滤器、智能语音助手Siri、二维码扫描器、游戏中的NPC(非玩家扮演角色) 都是人工智能的应用。最近火热的人机大战，AlphaGo再次把人工智能的发展推向了一个高潮。学术届和各大公司(Google, Apple, Amazon, Facebook等等)对人工智能的发展充满了信心，也重拾起新一轮的学习研究热潮。可以肯定的说，未来的10年是人工智能的10年。

以下学习笔记摘自https://book.douban.com/reading/35613939/版权属于原作者

历史上，研究人工智能就像是在坐过山车，忽上忽下。梦想的肥皂泡一次次被冰冷的科学事实戳破，科学家们不得不一次次重新回到梦的起点。作为一个独立的学科，人工智能的发展非常奇葩。它不像其他学科那样从分散走向统一，而是从1956年创立以来就不断地分裂，形成了一系列大大小小的子领域。也许人工智能注定就是大杂烩，也许统一的时刻还未到来。然而，人们对人工智能的梦想却是永远不会磨灭的。

从早期的哥德尔、图灵等人的研究到“人工智能”一词的提出，再到后期的人工智能三大学派：符号学派、连接学派和行为学派，以及近年来的新进展：贝叶斯网络、深度学习、通用人工智能。

梦的开始（1900—1956）
人工智能之梦开始于一小撮20世纪初期的数学家。1900年，世纪之交的数学家大会在巴黎如期召开，德高望重的老数学家大卫•希尔伯特（David Hilbert）庄严地向全世界数学家们宣布了23个未解决的难题。这23道难题道道经典，而其中的第二问题和第十问题则与人工智能密切相关，并最终促成了计算机的发明。希尔伯特第二问题：证明数学系统中应同时具备一致性（数学真理不存在矛盾）和完备性（任意真理都可以被描述为数学定理）。希尔伯特第十问题的表述是：“是否存在着判定任意一个丢番图方程有解的机械化运算过程。”

捷克人库尔特•哥德尔（Kurt Godel）于1931年提出了被美国《时代周刊》评选为20世纪最有影响力的数学定理：哥德尔不完备性定理。根据哥德尔定理，必然存在着某种人类可以构造、但是机器无法求解的人工智能的“软肋”。所以，存在着人类可以求解但是机器却不能解的问题，人工智能不可能超过人类。

艾伦•图灵（Alan Turing）被希尔伯特的第十问题深深地吸引了，并决定为此奉献一生。他设想出了一个机器——图灵机，它是计算机的理论原型，圆满地刻画出了机械化运算过程的含义，并最终为计算机的发明铺平了道路。图灵在1950年发表了《机器能思考吗？》一文，提出了这样一个标准：如果一台机器通过了“图灵测试”，则我们必须接受这台机器具有智能。
2014年6月12日，一个名为“尤金”（Eugene Goostman）的聊天程序成功地在5分钟内蒙骗了30%的人类测试者，从而达到了图灵当年提出来的标准。很多人认为，这款程序具有划时代的意义，它是自图灵测试提出64年后第一个通过图灵测试的程序。

1945年，匈牙利天才少年约翰•冯•诺依曼（John von Neumann）凭借出众的才华，在火车上完成了早期的计算机EDVAC的设计，并提出了我们现在熟知的“冯•诺依曼体系结构”。冯•诺依曼的计算机与图灵机是一脉相承的，但最大的不同就在于，冯•诺依曼的读写头不再需要一格一格地读写纸带，而是根据指定的地址，随机地跳到相应的位置完成读写。这也就是我们今天所说的随机访问存储器（Random Access Memory，RAM）的前身。冯•诺依曼的计算机终于使得数学家们的研究结出了硕果，也最终推动着人类历史进入了信息时代，使得人工智能之梦成为了可能。

美国的天才神童诺伯特•维纳（Norbert Wiener）于1948年提出来的新兴学科“控制论”（Cybernetics），在控制论中，维纳深入探讨了机器与人的统一性——人或机器都是通过反馈完成某种目的的实现，因此他揭示了用机器模拟人的可能性，这为人工智能的提出奠定了重要基础。维纳也是最早注意到心理学、脑科学和工程学应相互交叉的人之一，这促使了后来认知科学的发展。

梦的延续（1956—1980）
1956年8月，在美国汉诺斯小镇宁静的达特茅斯学院中，约翰•麦卡锡（John McCarthy）、马文•闵斯基（Marvin Minsky，人工智能与认知学专家）、克劳德•香农（Claude Shannon，信息论的创始人）、艾伦•纽厄尔（Allen Newell，计算机科学家）、赫伯特•西蒙（Herbert Simon，诺贝尔经济学奖得主）等科学家正聚在一起，讨论着一个完全不食人间烟火的主题：用机器来模仿人类学习以及其他方面的智能。会议足足开了两个月的时间，虽然大家没有达成普遍的共识，但是却为会议讨论的内容起了一个名字：人工智能。因此，1956年也就成为了人工智能元年。

达特茅斯会议之后，人工智能获得了井喷式的发展。然而，历史似乎故意要作弄轻狂无知的人工智能科学家们。1965年，机器定理证明领域遇到了瓶颈，计算机推了数十万步也无法证明两个连续函数之和仍是连续函数。最糟糕的事情发生在机器翻译领域，对于人类自然语言的理解是人工智能中的硬骨头。越来越多的不利证据迫使政府和大学削减了人工智能的项目经费，这使得人工智能进入了寒冷的冬天。

经历了短暂的挫折之后，AI研究者们开始痛定思痛。爱德华•费根鲍姆（Edward A. Feigenbaum）就是新生力量的佼佼者，他举着“知识就是力量”的大旗，很快开辟了新的道路。在费根鲍姆的带领下，一个新的领域专家系统诞生了。所谓的专家系统就是利用计算机化的知识进行自动推理，从而模仿领域专家解决问题。第一个成功的专家系统DENDRAL于1968年问世，它可以根据质谱仪的数据推知物质的分子结构。在这个系统的影响下，各式各样的专家系统很快陆续涌现，形成了一种软件产业的全新分支：知识产业。1977年，在第五届国际人工智能大会上，费根鲍姆用知识工程概括了这个全新的领域。在知识工程的刺激下，日本的第五代计算机计划、英国的阿尔维计划、西欧的尤里卡计划、美国的星计划和中国的863计划陆续推出。

群龙问鼎（1980—2010）
专家系统、知识工程的运作需要从外界获得大量知识的输入，而这样的输入工作是极其费时费力的，这就是知识获取的瓶颈。于是，在20世纪80年代，机器学习这个原本处于人工智能边缘地区的分支一下子成为了人们关注的焦点。

事实上，在人工智能界，很早就有人提出过自下而上的涌现智能的方案，只不过它们从来没有引起大家的注意。一批人认为可以通过模拟大脑的结构（神经网络）来实现，而另一批人则认为可以从那些简单生物体与环境互动的模式中寻找答案。他们分别被称为连接学派和行为学派。与此相对，传统的人工智能则被统称为符号学派。自20世纪80年代开始，到20世纪90年代，这三大学派形成了三足鼎立的局面。

约翰•麦卡锡（John McCarthy） 作为符号学派的代表，人工智能的创始人之一约翰•麦卡锡在自己的网站上挂了一篇文章《什么是人工智能》，为大家阐明什么是人工智能（按照符号学派的理解）。计算机博弈（下棋）方面的成功就是符号学派名扬天下的资本。1989年5月11日，“深蓝”最终以3.5:2.5的成绩战胜了卡斯帕罗夫，成为了人工智能的一个里程碑。时隔14年后，另外一场在IBM超级计算机和人类之间的人机大战刷新了记录，也使得我们必须重新思考机器是否能战胜人类这个问题。场人机大战的游戏叫作《危险》（Jeopardy），是美国一款著名的电视节目。在2011年2月14日到2月16日期间的《危险》比赛中，IBM公司的超级计算机沃森（Watson）却战胜了人类选手。20世纪80年代以后，符号学派的发展势头已经远不如当年了，因为人工智能武林霸主的地位很快就属于其他学派了。

如果将智力活动比喻成一款软件，那么支撑这些活动的大脑神经网络就是相应的硬件。于是，主张神经网络研究的科学家实际上在强调硬件的作用，认为高级的智能行为是从大量神经网络的连接中自发出现的，因此，他们又被称为连接学派。

连接学派的研究成果代表就是神经网络。最早的神经网络研究可以追溯到1943年计算机发明之前。当时，沃伦•麦卡洛克（Warren McCulloch）和沃尔特•匹兹（Walter Pitts）二人提出了一个单个神经元的计算模型。1957年，弗兰克•罗森布拉特（Frank Rosenblatt）对麦卡洛克匹兹模型进行了扩充，即在麦卡洛克匹兹神经元上加入了学习算法，扩充的模型有一个响亮的名字：感知机。1969年，人工智能界的权威人士马文•闵斯基给连接学派带来了致命一击。他通过理论分析指出，感知机并不像它的创立者罗森布拉特宣称的那样可以学习任何问题。连一个最简单的问题：判断一个两位的二进制数是否仅包含0或者1（即所谓的XOR问题）都无法完成。这一打击是致命的，本来就不是很热的神经网络研究差点就被闵斯基这一棒子打死了。1974年，人工智能连接学派的救世主杰夫•辛顿（Geoffrey Hinton）终于出现了。他提出：只要把多个感知机连接成一个分层的网络，那么，它就可以圆满地解决闵斯基的问题。他还发现采用几年前阿瑟•布赖森（Arthur Bryson）等人提出来的反向传播算法（Back propagation algorithm，简称BP算法）就可以有效解决多层网络的训练问题。

2000年左右，弗拉基米尔•万普尼克（Vladimir Naumovich Vapnik）和亚历克塞•泽范兰杰斯（Alexey Yakovlevich Chervonenkis）这两位俄罗斯科学家提出了一整套新的理论：统计学习理论，受到连接学派的顶礼膜拜。然而，统计学习理论也有很大的局限性，因为理论的严格分析仅仅限于一类特殊的神经网络模型：支持向量机（Supporting Vector Machine）。而对于更一般的神经网络，人们还未找到统一的分析方法。所以说，连接学派的科学家们虽然会向大脑学习如何构造神经网络模型，但实际上他们自己也不清楚这些神经网络究竟是如何工作的。

行为学派的出发点与符号学派和连接学派完全不同，他们并没有把目光聚焦在具有高级智能的人类身上，而是关注比人类低级得多的昆虫。罗德尼•布鲁克斯（Rodney Brooks）是一名来自美国麻省理工学院的机器人专家。在他的实验室中有大量的机器昆虫。这些机器昆虫没有复杂的大脑，也不会按照传统的方式进行复杂的知识表示和推理。它们甚至不需要大脑的干预，仅凭四肢和关节的协调，就能很好地适应环境。当我们把这些机器昆虫放到复杂的地形中的时候，它们可以痛快地爬行，还能聪明地避开障碍物。它们看起来的智能事实上并不来源于自上而下的复杂设计，而是来源于自下而上的与环境的互动。这就是布鲁克斯所倡导的理念。

如果说符号学派模拟智能软件，连接学派模拟大脑硬件，那么行为学派就算是模拟身体了，而且是简单的、看起来没有什么智能的身体。例如，行为学派的一个非常成功的应用就是美国波士顿动力公司（Boston Dynamics）研制开发的机器人“大狗” 。

约翰•霍兰（John Holland）是美国密西根大学的心理学、电器工程以及计算机的三科教授。他在读博期间就对如何用计算机模拟生物进化异常着迷，并最终发表了他的遗传算法。遗传算法对大自然中的生物进化进行了大胆的抽象，最终提取出两个主要环节：变异（包括基因重组和突变）和选择。在计算机中，我们可以用一堆二进制串来模拟自然界中的生物体。而大自然的选择作用——生存竞争、优胜劣汰——则被抽象为一个简单的适应度函数。这样，一个超级浓缩版的大自然进化过程就可以搬到计算机中了，这就是遗传算法。遗传算法比神经网络具有更方便的表达性和简单性。

无论是机器昆虫还是进化计算，科学家们关注的焦点都是如何模仿生物来创造智能的机器或者算法。克里斯托弗•兰顿（Chirstopher Langton）进行了进一步提炼，提出了“人工生命”这一新兴学科。人工生命与人工智能非常接近，但是它的关注点在于如何用计算的手段来模拟生命这种更加“低等”的现象。“涌现”（emergence）这个词是人工生命研究中使用频率最高的词之一，它强调了一种只有在宏观具备但不能分解还原到微观层次的属性、特征或行为。单个的蛋白质分子不具备生命特征，但是大量的蛋白质分子组合在一起形成细胞的时候，整个系统就具备了“活”性，这就是典型的涌现。

三大学派间的关系
正如我们前面提到的，这三个学派大致是从软件、硬件和身体这三个角度来模拟和理解智能的。但是，这仅仅是一个粗糙的比喻。事实上，三大学派之间还存在着很多微妙的差异和联系。

首先，符号学派的思想和观点直接继承自图灵，他们是直接从功能的角度来理解智能的。他们把智能理解为一个黑箱，只关心这个黑箱的输入和输出，而不关心黑箱的内部构造。因此，符号学派利用知识表示和搜索来替代真实人脑的神经网络结构。符号学派假设知识是先验地存储于黑箱之中的，因此，它很擅长解决利用现有的知识做比较复杂的推理、规划、逻辑运算和判断等问题。

连接学派则显然要把智能系统的黑箱打开，从结构的角度来模拟智能系统的运作，而不单单重现功能。这样，连接学派看待智能会比符号学派更加底层。这样做的好处是可以很好地解决机器学习的问题，并自动获取知识；但是弱点是对于知识的表述是隐含而晦涩的，因为所有学习到的知识都变成了连接权重的数值。我们若要读出神经网络中存储的知识，就必须要让这个网络运作起来，而无法直接从模型中读出。连接学派擅长解决模式识别、聚类、联想等非结构化的问题，但却很难解决高层次的智能问题（如机器定理证明）。

行为学派则研究更低级的智能行为，它更擅长模拟身体的运作机制，而不是脑。同时，行为学派非常强调进化的作用，他们认为，人类的智慧也理应是从漫长的进化过程中逐渐演变而来的。行为学派擅长解决适应性、学习、快速行为反应等问题，也可以解决一定的识别、聚类、联想等问题，但在高级智能行为（如问题求解、逻辑演算）上则相形见绌。

有意思的是，连接学派和行为学派似乎更加接近，因为他们都相信智能是自下而上涌现出来的，而非自上而下的设计。但麻烦在于，怎么涌现？涌现的机制是什么？这些深层次问题无法在两大学派内部解决，而必须求助于复杂系统科学。

三大学派分别从高、中、低三个层次来模拟智能，但现实中的智能系统显然是一个完整的整体。我们应如何调解、综合这三大学派的观点呢？这是一个未解决的开放问题，而且似乎很难在短时间内解决。主要的原因在于，无论是在理论指导思想还是计算机模型等方面，三大学派都存在着太大的差异。

于是，就这样磕磕碰碰地，人工智能走入了新的世纪。到了2000年前后，人工智能的发展非但没有解决问题，反而引入了一个又一个新的问题，这些问题似乎变得越来越难以回答，而且所牵扯的理论也越来越深。于是，很多人工智能研究者干脆当起了“鸵鸟”，对理论问题不闻不问，而是一心向“应用”看齐。争什么争呀，实践是检验真理的唯一标准，无论是符号、连接、行为，能够解决实际问题的鸟就是好鸟。

hj

Tuesday, June 20, 2017

人工智能简史-1

No comments:

Post a Comment