从本专栏开始,作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章详细讲解了无监督学习Autoencoder的原理知识,然后用MNIST手写数字案例进行对比实验及聚类分析。本篇文章将分享《人工智能狂潮》书籍内容,包括人工智能的应用和什么是人工智能,结合作者的理解分享人工智能原理及基础知识,希望对您有所帮助!
本专栏主要结合作者之前的博客、AI经验和相关视频及书籍论文介绍,后面随着深入会讲解更多的Python人工智能案例及应用。基础性文章,希望对您有所帮助,如果文章中存在错误或不足之处,还请海涵~作者作为人工智能的菜鸟,希望大家能与我在这一笔一划的博客中成长起来。写了这么多年博客,尝试第一个付费专栏,但更多博客尤其基础性文章,还是会继续免费分享,但该专栏也会用心撰写,望对得起读者,共勉!
代码下载地址:https://github.com/eastmountyxz/AI-for-TensorFlow
同时推荐前面作者另外三个Python系列文章。从2014年开始,作者主要写了三个Python系列文章,分别是基础知识、网络爬虫和数据分析。2018年陆续增加了Python图像识别和Python人工智能专栏。
- Python基础知识系列:Python基础知识学习与提升
- Python网络爬虫系列:Python爬虫之Selenium+BeautifulSoup+Requests
- Python数据分析系列:知识图谱、web数据挖掘及NLP
- Python图像识别系列:Python图像处理及图像识别
- Python人工智能系列:Python人工智能及知识图谱实战
前文:
[Python人工智能] 一.TensorFlow2.0环境搭建及神经网络入门
[Python人工智能] 二.TensorFlow基础及一元直线预测案例
[Python人工智能] 三.TensorFlow基础之Session、变量、传入值和激励函数
[Python人工智能] 四.TensorFlow创建回归神经网络及Optimizer优化器
[Python人工智能] 五.Tensorboard可视化基本用法及绘制整个神经网络
[Python人工智能] 六.TensorFlow实现分类学习及MNIST手写体识别案例
[Python人工智能] 七.什么是过拟合及dropout解决神经网络中的过拟合问题
[Python人工智能] 八.卷积神经网络CNN原理详解及TensorFlow编写CNN
[Python人工智能] 九.gensim词向量Word2Vec安装及《庆余年》中文短文本相似度计算
[Python人工智能] 十.Tensorflow+Opencv实现CNN自定义图像分类案例及与机器学习KNN图像分类算法对比
[Python人工智能] 十一.Tensorflow如何保存神经网络参数
[Python人工智能] 十二.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例
[Python人工智能] 十三.如何评价神经网络、loss曲线图绘制、图像分类案例的F值计算
[Python人工智能] 十四.循环神经网络LSTM RNN回归案例之sin曲线预测
[Python人工智能] 十五.无监督学习Autoencoder原理及聚类可视化案例详解
1997年,国际象棋软件“深蓝”战胜世界冠军加里·卡斯帕罗夫。
2011年,IBM人工智能“沃森”在著名智力问答节目中战胜历代冠军。
2012年,将棋软件Bonkras战胜日本“永世棋圣”米长邦雄。
2013年,亚马逊自动无人驾驶飞机项目启动。
2014年,人工智能文学创作项目启动。
2015年,谷歌汽车自动驾驶技术开始实施试验。
2021年,“东大机器人”考上东京大学。
2045年,奇点到来,人工智能开始自我进化。
2050年,类人机器人战胜足球世界杯冠军。
…
人工智能正在飞速进化、超越人类。
它真的会彻底取代人类,称为“人类的最后一个发明”吗?
且看人工智能大师松尾丰如何揭破迷津,指点江山!
目录:
前沿 人工智能的春天
第一章 不断进化的人工智能——人工智能是否会毁灭人类?
第二章 什么是“人工智能”——专家与坊间的认识差距
第三章 “推理”与“搜索”的时代——第一次人工智能浪潮
第四章 知识,让计算机更聪明——第二次人工智能浪潮
第五章 “机器学习”悄然兴起——第三次人工智能浪潮之一
第六章 “深度学习”打破沉寂——第三次人工智能浪潮之二
第七章 人工智能会超越人类吗?——深度学习之后又将如何发展?
第八章 不断变化的世界——人工智能对产业与社会的影响及应对政策
前沿
人工智能是机遇,更是挑战
今天,智能家电、智慧城市、智能手机、导航、人脸识别、智能机器人…不知不觉,我们的生活已经进入智能时代,智能无处不在。可以说,离开了智能,我们的生活将不可想象。尽管如此,对于人工智能,我们普通人又知道多少呢?
什么是人工智能呢?人工智能源于何时?人工智能是否会超越人类智能甚至征服人类呢?其发展过程中经历了哪些起起落落?今天来势汹涌的人工智能又将对我们的工作和生活、对人类社会带来哪些影响?这些无疑也是我们普通人极为关注的话题。
日本顶级人工智能专家松尾丰先生撰写的这本《人工智能狂潮》,恰好对这些问题做出了较为全面的阐述和系统的回答。而且,该书用词浅显易懂,理论阐述深入浅出,真正称得上一本“外行人也能看懂”的书,是一本不可多得的人工智能普及性读物。
这四篇文章将带您学习有关人工智能的知识,了解人工智能将给我们带来的机遇与挑战,而且真切体会到人工智能对自己的生活、对自己今后的职业生涯以及对社会将带来的重要影响。互联网时代我们起步较晚而处处受制于人,唯有迎头赶上,我们不但要努力做好今天的“互联网+”,更需提前布局即将到来的“人工智能+”。
人工智能的春天
如今,我们随处都能听到“人工智能”(Artificial Intelligentce,简称AI)这个词。然而,十年前却并非如此。
在2002年,作者早先于他人开始从事网络信息的研究,并且拥有一系列先进的网络检索技术。即通过分析大量的主页信息,从中提取出大规模的具有相关关键词的网站。有些词语之间表面上看似毫无关联,但是通过该技术进行处理,能够很好地找到其关联性,最终为相关网站起到良好的广告和推广作用。
但面试总是碰壁,“你们这些人工智能研究者,总是谎话连篇”。那瞬间作者所受到的巨大打击,化作自己首次申请科研经费时的苦涩、惨痛记忆,至今仍深深地印记在心。如今,世间正在迎来一股滚烫的人工智能热潮。网络新闻、报纸、电视、杂志,“人工智能”这个词无处不在。研究者们通过自己坚韧不拔的努力,成功地熬过了那些阴冷的岁月,最终再次迎来属于自己的明媚春光。
在人工智能三次热潮中,最为关键的是一项崭新技术的出新——深度学习(Deep Learning)。三次浪潮分别是:
- 第一次人工智能浪潮:“推理”与“搜索”时代(起源、汉诺塔、博弈组合、国际象棋)
- 第二次人工智能浪潮:知识,让计算机更聪明(知识表示、专家系统、本体研究)
- 第三次人工智能浪潮之一:“机器学习”悄然兴起(监督学习、无监督学习、ANN)
- 第三次人工智能浪潮之二:“深度学习”打破沉寂(深度学习、深层次语义挖掘、猫脸识别)
深度学习将会带给我们怎样的研究突破?我们又该如何正确地看待这项技术的意义所在呢?要正确理解人工智能的现状,首先必须明确以下两点:
- 人工智能将飞速发展。如今,深度学习和特征表示学习两项技术都得到了很好的开发和发展,这两项技术意味着人工智能存在着极大的、飞跃性的可能性。
- 现实中,人工智能能做到的事情依然非常有限。机器人只能够机械性地完成一些规定工作,被称为“学习”也只能在规定的范围内完成有限的任务。它们不能随机应变,缺乏通用性和灵活性。
为了能够让更多的人了解和认识人工智能,本书从最为基础的内容写起,非常浅显易懂。为何人工智能会经历两次阴冷的冬天?为何我们可以相信其第三个春天?对于人类而言,此次春天到底是美好的希望还是巨大的危机?在读完本书之后,大家的这些疑问都会得到明确的解答。
第一章 不断进化的人工智能
本章主要讲解人工智能的应用,人工智能是否会毁灭人类呢?
开始超越人类的人工智能
如今,围绕人工智能的各种话题和猜测正在不断增多。例如,在不远的将来,人工智能是否会超越人类的能力?人类的工作是否会被机器所替代?事实上,人类与人工智能的对决,早已在各个领域上演。
1997年,国际象棋软件 “深蓝” 战胜世界冠军加里·卡斯帕罗夫。
2011年,IBM沃森(Watson) 在智力竞赛节目中击败人类冠军。当主持人问到“到目前为止,世界上尚有四个国家尚未与美国建交,请问四个国家中地理为止位于最北端的是哪个?”时,沃森会抢先、准确地给出答案——“朝鲜”。
同时,沃森技术被应用到医疗领域,通过自身内部庞大数据的分析,准确地给出对患者的治疗方案。例如在癌症治疗方面,沃森内部载入了42种专业医学杂志和大量的临床治疗数据,这些多达60万份的医疗根据和150万份的病例,都可以很好地帮助其为患者提供精准的治疗方案。与多年来从事癌症治疗的人类专家相比,沃森或许会显得更有经验、更加娴熟。
2012年,将棋软件Bonkras战胜日本“永世棋圣”米长邦雄。
2014年,沃森大厨通过对大量数据的分析,自动生成无数全新的食谱。同年11月,日本三井住友银行与瑞穗银行发表声明,决定将在呼叫中心服务中投入使用沃森技术。即当客人打来咨询电话时,沃森可以根据客人与话务员的对话内容,快捷、准确地为客人进行解答,从而大幅度缩减应答时间。
2014年,“全国中心考试模拟考试”中,“东大机器人君” 成功获得了其中472所大学的“A级判定”,即表示其考取该大学的可能性高达80%以上。也就是说“东大机器人君”已然具备了考取日本绝大多数私立大学的强大实力!
汽车会改变,机器人也会改变
近年,谷歌公司正在研发一项汽车的自动驾驶技术。他们将自动驾驶系统装在普通汽车上,通过对其的监测来提取各项研究数据。目前,该车已在美国加尼福尼亚等州的道路上行驶了100万英里。2015年,该公司将会使用期自主研发的自动驾驶车型进行实地道路试验。
从谷歌公司目前的监测结果来看,自动驾驶比人工驾驶更为安全、可靠。因此,如果今后自动驾驶能够全面实现的话,残疾人和老年人的出行问题就可以得到很好的解决。同时停车场短缺的问题也会得到解决。下图为谷歌无人驾驶汽车样车发布可自动观测红绿灯。
不仅是汽车,或许将来有朝一日,人工智能还有可能会驾驶飞机或直升机。亚马逊公司于2013年宣布开始研发一项全新的服务体系——Prime Air,即使用小型无人驾驶飞机进行货物派送,搭载人工智能技术将目标于30分钟内送至顾客手中。
在日本,软银公司于2014年宣布了一款名为“Pepper”的人工智能搭载机器人。该机器人搭载着一种名为“情感引擎”的人工智能 装置,可以很好地读取人内心的情感变化。当人难过时,机器人会极力去鼓励;当人心情极好时,它会与其一同分享喜悦。
超高速运算的威力
网络是人工智能技术的宝库。
网络的检索引擎大量使用一种名为“机器学习(Machine Learning)”的人工智能技术。当用户输入某个关键词时,电脑会学习如何通过对照网页内容来为该用户检索其所需信息。同时,电脑还需学习如何甄别关联性较小的网页以及一些有害内容。大家可能会疑问:为什么在输入关键词之后的短短一瞬间,电脑就会为我们提供所需的网页信息?其中玄机就在于“机器学习”的巨大功劳!
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 机器学习方法是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来的一种方法。
电子邮件服务中通常都会搭载垃圾邮件过滤的功能,其实这也是人工智能进行“机器学习”的典型表现。通过事前对大量邮件类型的学习,人工智能会自动识别各类垃圾邮件。同样,在新闻报道业务中,人工智能能够按照事先学习得的分类方法,瞬间将数量庞大的新闻报道进行准确归类。
基于机器学习和自然语言处理的文本挖掘技术包括:
- 垃圾评论:精准识别广告、不文明用语及低质量文本。
- 黄反识别:准确定位文本中所含涉黄、涉政及反动内容。
- 标签提取:提取文本中的核心词语生成标签。
- 文章分类:依据预设分类体系对文本进行自动归类。
- 情感分析:准确分析用户透过文本表达出的情感倾向。
- 主题模型:抽取出文章的隐含主题。
网络广告领域也在频繁地使用着人工智能技术。如今,网络界正在盛行一种名为“Ad Technology”的最新广告技术。对于广告主来说,他们希望将自己的广告显示在用户点击率最高的位置,而该技术就可以瞬间计算出不同位置上的广告点击率,从而将广告准确地安插在点击率最高的位置上。
在金融市场,由人工智能操作的交易量早已远远大于人类所操作的交易量。据相关报道,目前90%以上的交易都由电脑自动操作。在证券交易领域,有一种名为“高频交易”(HFT)的方法。该方法可以非常敏感地捕获股票价格的细微变动,从而瞬间完成自动买卖。比如,对于同一家公司的股票,当英国市场和美国市场之间发生哪怕一丁点的价格差异,人工智能就会将低价股买进、将高价股卖出,从而获得其中差价利润。在这样的高速交易世界里,人工智能的计算速度早已超越了千分之一毫秒即微秒的计时单位,人类已完全无法战胜人工智能!
在法律领域,人工智能的高速处理也在发挥着巨大的为例。从事大数据分析的日本UBIC公司,已经将人工智能技术应用在了法律诉讼时的证据阅览业务当中。通常,在进行诉讼时,律师会提前收集所有与案件有关的邮件和商务文书等作为证据。如果按照传统的做法,在需要提交关键证据的时候,律师或者其助理就必须大量阅读之前收集好的各类证据,这是一项非常繁杂而耗时的工作。而在使用“机器学习”技术之后,人工智能就可以自动完成这项工作,从而将律师助理从繁重的证据搜索工作中解放出来。总之,过去律师艰巨的任务,如今人工智能正在以人类完全无法实现的速度完成着。
人工智能能否成为科幻小说作家?
人工智能的神奇之处并非只在于其高速性。有些行业看似只有人类才能完成,但事实上人工智能正在悄悄地“入侵”。2014年,一个名为“反复无常的人工智能项目——我是作者喔!”的人工智能项目启动,旨在通过对科幻小说作家星新一作品的分析,让人工智能也学会文学创作。
计算机无法像人类那样在天才般灵感的触动下进行创作,但它却可以非常巧妙地将大量的素材进行各种搭配组合。只要人工智能对庞大的文学素材进行充分的解析和确认,创造出来的作品质量就会不断提高。如此一来,或许在不远的将来,它们就可以像星新一那样为读者呈现出一部绝美的文学作品。
之前 “[Python人工智能] 九.gensim词向量Word2Vec安装及《庆余年》中文短文本相似度计算” 文章分享了如何自动撰写诗歌,推荐读者们阅读,如下图所示。
在新闻稿件创作领域,2014年美国的联合通讯社宣布引进一种能够编写企业决算报告的人工智能。只要输入各个企业的销售额或者营业利润等重要的数字信息,该机器就能按照普通报道文章的体裁,快速、自动地生成一篇150~300字的报道。
在我们的日常生活周围,人工智能也在不断增多。机器人吸尘器——伦巴就是一个很好的例子。它可以自动读取、识别房间形状,然后在主人外出时聪明地将房间打扫干净。另外,新开发的智能洗衣机可以通过光感器自动识别洗涤剂的种类和衣物的不净程度,然后自动调节水量大小,以便进行适当的清洗。现如今,人工智能已经成为 “智能家电” 所不可或缺的核心技术。
“Siri” 实际上也是一款非常有名的人工智能软件。用户可以通过会话询问当天的天气预报、股市行情以及邮件内容等信息。除此之外,搭载着人工智能技术的应用软件还有很多。它们可以帮助用户查看喜欢的时尚信息,发送一些类似于新闻报道、日程安排以及就职信息等极为个性化信息。也就是说,人工智能会根据人们日常生活中的行动轨迹,准确地读取其兴趣爱好,然后适当地为其提供相应的信息服务。
全球对于人工智能研究的投资正在增加
如今,世界各国对于人工智能技术研究的投资力度正在不断加大。
2013年,谷歌公司成功收购由英国伦敦大学 Geoffrey Hinton 教授创立的风投企业——DNN-Research,该教授正是当今人工智能研究领域最为热门的新技术——深度学习的开创者。谷歌之所以收购DNN-Research,看中的就是Geoffrey Hinton教授和他的那些学生。下图展示了深度学习领域的“四大天王”。
Geoffrey Hinton,被称为“神经网络之父”、“深度学习鼻祖”,他曾获得爱丁堡大学人工智能的博士学位,并且为多伦多大学的特聘教授。在2012年,Hinton还获得了加拿大基廉奖(Killam Prizes,有“加拿大诺贝尔奖”之称的国家最高科学奖)。2013年,Hinton 加入谷歌并带领一个AI团队,他将神经网络带入到研究与应用的热潮,将“深度学习”从边缘课题变成了谷歌等互联网巨头仰赖的核心技术,并将HintonBack Propagation(反向传播)算法应用到神经网络与深度学习。
2014年,谷歌又将英国的DeepMind Technologies公司成功收购。虽然这只是一个拥有十几人的小公司,但却引起了谷歌与Facebook的激烈竞争。最终,谷歌以4亿美元的天价成功胜出,举世闻名的AlphaGo就是这家公司的成果。由此可见,谷歌公司对于人工智能技术的可能性是多么敏感和重视!
与此同时,世界最大规模的社交网站——Facebook也不甘落后。2013年,该公司专门设立人工智能研究所,并且特地聘请纽约大学的 Yann LeCun 教授担任所长。如今,该研究所分别将研究据点设在纽约、伦敦和加利福利亚等地区。
Yann LeCun,自称中文名“杨立昆”,计算机科学家,被誉为“卷积网络之父”,为卷积神经网络(CNN,Convolutional Neural Networks)和图像识别领域做出了重要贡献,以手写字体识别、图像压缩和人工智能硬件等主题发表过190多份论文,研发了很多关于深度学习的项目,并且拥有14项相关的美国专利。他同Léon Bottou和Patrick Haffner等人一起创建了DjVu图像压缩技术,同Léon Bottou一起开发了一种开源的Lush语言,比Matlab功能还要强大,并且也是一位Lisp高手。反向传播(Backpropagation,简称BP)这种现阶段常用来训练人工神经网络的算法,就是LeCun和其老师“神经网络之父”Geoffrey Hinton等科学家于20世纪80年代中期提出的,而后LeCun在贝尔实验室将BP应用于卷积神经网络中,并将其实用化,推广到各种图像相关任务中。
2014年,中国最大的搜索引擎提供商——百度成立了深度学习研究所。同时聘请在机器学习领域享誉全球的斯坦福大学副教授——吴恩达担任研究所所长。所有这些都表明,为了在深度学习技术领域跃居世界第一,百度已然开始全面出击。
为了全面开展对于沃森的研发和使用,IBM公司预计投入10亿美元的巨资。其中,该公司全新设立拥有2000人规模的专项部门,专门从事沃森的用途研发,最终使其得到更大程度的普及。
在日本,DWAN公司于2014年全新成立了DWANGO人工智能研究所。从事大数据相关开发的Preferred Infrastructure(PFI)于2014年成立了Preferred Networks,研究如何将最新的机器学习技术进行商业化。如今,该公司已经成功研发出一项技术,它可以通过行人的影像资料获取其性别和穿着等信息。
濒临失业的人们
面对人工智能如此迅速的发展,越来越多的人开始担心:人工智能是否会将人类的工作逐一夺去?或许有一天,人工智能的发展会导致大量的人失去工作。
可以用一个词语来概括人工智能对于人类的威胁,那就是“技术性奇点”,亦被称为“奇点(Singularity)”。其具体内容指的是:当人工智能进化到足够聪明并且它能够创造出比自己更为聪明的人工智能时,人工智能的智能就会无限扩大。奇点即表示人工智能能够自主制造出超越自身能力的人工智能的那个时点。
低一等级的人工智能创造比自己高一等级的人工智能——当该过程以惊人的速度被无限重复时,人工智能就会出现爆发性的进化。因此,这一瞬间的开始便是世界万物开始出现颠覆的“特异点”。实业家雷·库兹韦尔曾说过:“该技术性特异点将会在2045年这个不远的将来出现。”
对于人工智能可能会给人类带来的威胁,科学家霍金曾发出这样的警告:“完美人工智能的开发便意味着人类的终结!”对此,特斯拉汽车公司CEO马斯克也曾这样说道:“对于人工智能的研究,我们必须慎重!因为我们的研究最终或许会招来恶魔!”微软创始人比尔·盖茨也对此“人工智能威胁论”表示出赞成的观点。
对抗样本由Christian Szegedy等人提出,是指在数据集中通过故意添加细微的干扰所形成的输入样本,导致模型以高置信度给出一个错误的输出。如下图所示,熊猫图像会被深度学习错误地识别为“dog”,但如果无人驾驶汽车错误的将“STOP”标志理解为“直行通过”,其后果真是无法想象。
人工智能正在不断进化。它们到底会进化到何种地步?或许,留给人类的时间已然不多。
第二章 什么是“人工智能”
本章将从专家与坊间来讲解什么是“人工智能”。
人工智能尚未实现
虽然在现实生活中人工智能被炒得沸沸扬扬,然而实际上,即使到了2015年的今天,它仍然未能实现。真正意义上的人工智能,即“能够像我们人类一样进行思考的计算机”,的确尚未实现。
人工智能的历史是人们长期以来对人类智力活动进行模仿的历史。人脑的智能深奥无比、遥不可及,直至今天我们仍未探明其原理,利用计算机对其进行的模仿也未能实现。随着科学技术的不断进步,通过大到宇宙物理学小至基本粒子理论等各种研究,我们对自己所居住的这个世界的结构和原理已经有了想当深入的了解。然而尽管如此,我们对于自己大脑的结构和原理是怎样的,却仍然不得而知。
难道我们不能通过计算机来模拟和实现人类智能吗? 这个问题之所以被提出,是因为人的大脑与电路并无区别。在人的大脑里面分布着很多神经元,电信号在其间穿梭往来。在大脑神经元里面有一些叫作“突触”的地方,如果电压积累到一定水平,它们就会释放出神经递质,当这些神经递质被传递至下一个神经元后,电信号也随之得以传递。也就是说,无论从哪方面来看大脑本身就是一种电路。大脑通过电路来回传送电流这种方式进行工作,并且当进行了一定的学习之后,这个电路还会产生一些变化。
什么是电路呢?比较有代表性的例子是计算机的内置CPU(中央处理器),它们通常是被用来执行某些计算工作的装置。个人电脑软件也好,互联网网站、智能手机的应用程序也好,这些东西全部都由程序生成,并使用CPU来运行,最终通过流经电路的信号来进行计算。人类大脑的工作方式与此完全相同。
如果人类的思维也是某种“计算”的话,那么它就完全有理由通过计算机来模拟和实现。这其实已经不是什么超前的逻辑理论,著名科学家图灵展示了“能够计算的事物都可以通过计算机得到实现”,“图灵机”的概念大意也是只要备有无限长的纸带、往纸带上写入东西的装置以及读出装置,那么所有的程序便能够得到运行。
人类所有的大脑活动,包括思维、识别、记忆、感情,全部都可以通过计算机得到实现。或许,像人一样“拥有自我意识,在对周围事物进行识别的基础上采取行动”这种程序也能够制造出来。然而,对于通过计算机来实现人类思维这种想法,现实生活中很多人似乎难以接受。
确实,通过计算机程序来实现人类思维,这种想法很容易让人觉得冒犯某种神圣的东西。人这么尊贵的东西,通过计算就能得到置换和再现,这的确令人难以置信。人们自视特殊的心理不难理解,然而只要对大脑的功能及它与计算算法的对应关系等逐一进行冷静分析,我们就会得到结论“从原理上来讲,所有的人类智能是可以通过计算机来实现的”——这是科学和理性的预测。并且,这也正是人工智能领域长期以来苦苦探索的目标
什么是人工智能——专家定义梳理
在日本有很多研究人工智能的专家,他们对人工智能的看法如何呢?人工智能这个研究领域,比起一般人的想象来讲,有着更为浓厚的学术色彩,或者应该叫作追求真理的执著精神。例如,公立函馆未来大学校长中岛秀之对人工智能的定义是:人工智能是“采用人工方法制作的、具有智能的实体,或者是以创造智能为目的的、对智能本身进行研究的领域”。公立函馆未来大学堪称“日本人工智能的圣地”,中岛先生对20世纪80年代以后的人工智能研究也贡献颇丰。原人工智能学会会长、京都大学教授西田丰明将之定义为“具有智能的装置”。
作者本人定义是,人工智能是“用人工方法制作的类人智能”,类人智能指的是具有“发现和觉察功能”的计算机,即能够从数据中生成特征量,并对相关现象进行模型化处理的计算机。
很多人工智能专家希望通过研究对智能做出建构性阐释,“建构性”这个词语有些生僻难懂,它的意思是指“通过制作来进行理解”。与之相对应的词语是“分析性”。在研制人工智能的时候,我们常常拿飞机发明的例子来进行类比。人类自古以来就梦想有一天能够在天空翱翔。于是人们模仿鸟的飞行,无数次地尝试制作了试图靠“扇动翅膀”来实现飞行的飞行器,但最终均告失败。后来莱特兄弟终于首次取得成功,他们制作了一架搭载有引擎的、“不扇动翅膀”的飞机。也就是说,即便研究初衷是模仿生物,但其最终做法却未必与之相同。
在研制飞机这个问题上,只要发现了鸟儿飞行所需的“升力”这个概念,然后通过工程学方面的探索找到获得升力的方法(即先由引擎获得推力,再通过机翼将推力变为升力),那么就能获得成功。同理,只要我们能够找到智能的原理并通过计算机将其实现,那么我们就可以研制出人工智能。这也正是人工智能研究的出发点。
人工智能与机器人的区别
有不少人认为,人工智能研究与机器人的研究大致相同。但两者之间是有明显区别的。
- 人工智能相当于机器人的大脑部分。 在机器人研究领域,也有很多人在研究大脑以外的其他部分,因此在机器人研究者当中只有一部分是人工智能研究人员。
- 人工智能的研究对象也不仅仅限于机器人的大脑。 例如,在将棋或者围棋这类抽象性博弈的研究领域,就不需要机器人那样的物理性躯体。另外,像医疗诊断或律师咨询等专家系统,只需根据所输入信息进行判断即可,这方面功能的研究也不需要躯体。
- 人工智能是可以抛开人的要求,脱离人的控制,自主进行判断决定的,它不限制于外形一定要像人。 它可以仅是一个程序,一个算法。例如,与李世石对弈的阿尔法狗。阿尔法狗的每一步棋都是在程序的自主算法指导下实现的。当研究人员把这两者结合起来并加上其他学科的知识例如仿生学,于是就有了据有人工智能的机器人,以及真正拥有拟人身体、面部特征的机器人。
- 人工智能是一门学科,现在的大学已经开始设立人工智能专业;而机器人是人工智能研究的产物,它只是一个实体的东西。 人工智能可以研究出很多的东西,比如VR、AR,还比如苹果的Siri,也是人工智能的一种应用,但是Siri它并没有实体。而机器人是有实体的,就像现在的工业机器人、商用服务机器人、智能家居机器人,它们更多的是像一个容器,装着能让它们完成特定任务的人工智能成果。
人工智能研究的目的是为了实现“思维”,因此,我们可以把它理解成一门处理抽象的、“看不见”东西的学问。人工智能研究,可以说是一场以智能实现为终点的漫长旅行,该领域堪称是“前沿性领域”。
路漫漫,夜茫茫。尽管怀揣智能实现的梦想并长年埋头研究,然而梦想却一直未能实现——这就是人工智能研究者的真实写照。饱尝失败的人反而更懂得乐观与坚强。
在长期的历史进程中,人工智能历经坎坷与曲折。尽管人工智能本身尚未实现,但是它的尝试及试错性研究却创造出了无数副产品,为我们带来了各种各样的新事物。比如语音识别、文字识别、自然语言处理(汉字转换及翻译)、博弈游戏、搜索引擎等,这些东西为现实社会的发展带来了巨大影响,而且已经被广泛应用于我们的日常工作及生活当中。
这些领域在过去也曾经被称为“人工智能”,但是它们一旦进入实用化阶段、形成一个新领域之后,便不再被称为人工智能了——这个现象被称作“人工智能效应”。人工智能至今尚未实现,所以“智能的奥秘”应该还“藏在深闺人未识”。为了那个也许存在的尚未被发现的世界,我们需要继续这个探索之旅——这正是人工智能研究领域的青春活力所在,也是我们需要始终秉承前沿探索精神之理由。
什么是人工智能——坊间的看法
对于人工智能,专家们的定义尚未统一,那么坊间百姓的认识又如何呢?
近年来,人工智能这个词语在生活中几乎随处可见。比如“销售搭载人工智能的产品”、“开发使用人工智能的系统”等,相关宣传也乐此不疲。“某个产品具有智能”,这句话最容易让我们联想到的,大概是说“该产品看起来好像具有某种思维功能”。
比如,清扫机器人“伦巴”会根据房间形状及垃圾的具体分布情况调整自己的清扫动作;内置人工智能洗衣机,可以根据衣物数量及温度、湿度等自动调节洗涤方式。它们可以根据具体情况,思考应该如何动作,然后更为“聪明”地去执行动作。即与“输入”(由相当于人的五官的“传感器”所观测到的周围环境及状况)相对应,“输出”(由相当于人体运动器官的“传动器”所发出的动作)也会自动发生变化。
Stuart Russell将人工智能定位为能够根据输入来改变和调整输出的Agent(软件程序),并介绍了各种使用人工智能的行为变得更加聪明的方法。生物具有智能,人也具有智能,这些大概都是缘于“只要能够做出聪明的行动,生存概率就能得到提高”这个进化论原理。因此,用“根据输入产生恰当的输出”来定义从外部观测到的智能,应该还是很有说服力的。
如果把人工智能当做Agent,结合其输入与输出的关系来思考,那么在生活中所说的人工智能就很容易理解了。作者吧生活中称为“人工智能”的事物简单整理成四个级别。
- <级别1> 把单纯的控制程序称作“人工智能”
级别1是为了市场营销而将商品冠名“人工智能”或“AI”这一类,人们只是在家电产品上安装了极为单纯的控制程序,然后就宣称产品“搭载人工智能”。空调、扫地机、洗衣机,最近甚至还有电动剃须刀等,市场上被冠以“人工智能”之名的商品随处可见。
这类技术其实属于“控制工程学”或“系统工程学”领域,并且已经有较长的历史。因此,把它们叫作“人工智能”,对这些领域的研究人员及这些技术本身还有失公允。本书中我们暂且称作“级别1的人工智能”。 - <级别2> 传统人工智能——引入推理及搜索或者知识库
级别2这类其动作及行为模式极为丰富多彩。比如将棋的程序、清扫机器人,或者用于回答问题的人工智能等,都可以归入此类。它们是所谓的传统人工智能,输入与输出之间的关联方式极为严谨,且输入与输出的组合数目多得惊人。其原因是因为它们使用了推理及搜索(详见第三章),或者引入了知识库(详见第四章)等等。传统的智能问题求解程序、医疗诊断程序即属于此类。 - <级别3> 引入机器学习的人工智能
级别3是内置于搜索引擎里面,或者基于大数据可以进行自动判断的人工智能。其推理机制及知识库是以数据为基层通过学习获得的,常见的典型例子是对机器学习(详见第五章)算法的利用。机器学习是以样本数据为基础、对规则和知识的自学习。
这类技术以模式识别这种很早就有的研究为基础,在20世纪90年代开始取得进展,进入21世纪以后,因为大数据时代的到来而得到进一步升级。最近出现的人工智能,很多时候指的就是级别3的东西。今天,也有很多过去属于级别2的东西,通过引入机器学习而升级变成了级别3。 - <级别4> 引入深度学习的人工智能
级别4是指能够对机器学习时的数据表示所用变量(一般被称为“特征量”)本身进行学习的人工智能。第6章将要介绍的深度学习属于此类,本书称之为“特征表示学习”。在前面也有所提及,在美国,目前深度学习相关领域的投资大战、技术开发及人才争夺战正呈白热化状态。眼下,这是最为炙手可热的领域。
下图展示了人工智能、机器学习、表征学习和深度学习的所属关系。
深度学习和人工智能
在经历了两次寒冬之后,人工智能的浪潮终于伴随着深度学习再次回归。深度学习是机器学习的一种,而机器学习是实现人工智能的必经路径。深度学习是学习样本数据的内在规律和表示层次,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别数据。可以简单理解为训练机器,每天给机器喂海量的数据,让机器计算和学习,并且在学习这些数据的深层次的逻辑之后,它会模仿人脑的机制来解释数据。所以数据越多,深度学习就越能体现出它的优势。
下图为Doxel官网监工机器人全程自动扫描的演示视频。
临时工、一般职员、课长与经理人
以上四个级别的智能有何区别呢?我们举个管理货物堆放的流通仓库例子来说明。
- 级别1的人工智能 控制程序
长多少厘米、宽多少厘米、高多少厘米以上的货物需要搬到“大货物”处;多少厘米至多少厘米之间的搬到“中等货物”处;小于这个尺寸的则搬到“小货物”处。需要制定一套像这样能够覆盖所有对象的严密规则,然后按照这些规则去操作即可。 - 级别2的人工智能 搜索和推理及运用知识
虽然同样有按照长、宽、高、重量等信息对货物进行分类的指示,但是对应货物的不同种类,引入了很多知识。例如,如果挂有“易碎品注意”吊牌就需要小心轻放;如果标有“严禁倒置”,那么放置时就不能上下颠倒;高尔夫球包要竖着放;生鲜食品则需要冷藏等等。 - 级别3的人工智能 机器学习
从一开始就不提供严谨的规则或知识,但会提供一些样本,让员工通过学习掌握“这是大的”、“这是中等”、“这是小的”这类规则后,下次需要由他自己来进行判断“这个应该是大的吧”、“这个是中等的吧”、“这个与哪个都不相符”,这样就能够由员工自己来进行分类处理。 - 级别4的人工智能 特征表示学习
级别4是由员工自己找出特征量,例如,高尔夫球包需要几个捆绑在一起,而且“这个类型的货物,虽然从尺寸来讲属于‘大’的一类,但是因为形状与其他物品明显不同,因此还是单独处置更为稳妥”。员工能够觉察到这些,这样就有可能由他自己制定出“如何放置高尔夫球包等货物”的规则。随着时间推移,他就能够学会最有效率的区分方法,这是级别4的人工智能。
如果要向这四个级别的分类操作员工提供作业手册的话,级别1只能进行极为简单的分类作业,手册也只需有寥寥几页即可。而与之相比,级别2则需要覆盖所有对象的、内容还不能有重复的厚厚一本手册。级别3需要提供学习用货物样本及教他注意货物的什么地方。级别4呢?因为他是自己去学习要注意哪些地方,所以只需要提供学习用货物样本即可,员工自己就能在作业中发现新的特征量,进而规则也得以更新升级。
换句话说:级别1只能按照别人的指示来操作,相当于公司的临时工;级别2需要理解很多规则并作出判断,相当于一般职员;级别3是按照别人规定好的检查项目将业务切实往前推进,是课长级别;级别4需要自己去发现检查项目,是经理人级别。
强人工智能与弱人工智能
在人工智能的研究领域中,很早就出现了关于“强人工智能”与“弱人工智能”的争论。
这个概念最早是由哲学家约翰·瑟尔(John Searle)提出来的,他认为,“具备正确的输入与输出、被施予合理程序化的计算机,与拥有心智的人是没有任何区别的,即它也是有心智的。”他这种主张被称为“强人工智能”。这种理念认为,人的心智或者大脑活动就是一种信息处理,思维就是一种计算。本书认为今后人类将会探明人类智能的原理,并将其用工程学的方法来实现,因此也应该算是“强人工智能”派。
与之相对,“弱人工智能”则认为:计算机没有必要拥有心智,只要能够通过其有限的智能解决一些智力问题即可。在这方面经常被引用的一个证据是“中文屋”争论。一个人即使不懂中文,但只要他对根据大量规则输入的文字进行确认。然后输出固定的答案,也就是说只要他对中文对话的某些行为进行模拟,那么就能使其对话看起来自然顺畅,然而那个人其实依然是不懂中文的。
经常还有这样的争论:计算机是否拥有意识?假如人的思维全部是计算,那么是否还有自由意志的存在?这些争论很有意思,但在纵览人工智能全局的时候,作者认为没必要在上面花费太多时间。作者认为,在不断生成特征量的阶段有必要让其进行思考,在这个过程中,让它对自身状态进行回归性认识,也就是让它意识到自己在思考这件事情——这种“嵌套结构”无限持续下去,那时候,或许将产生那种可以称之为“意识”的状态吧!
不管怎样,随着技术的发展这些东西将来总能从工程学的角度被探明,在这里不再进行长篇大论的解释。总之,什么是人工智能,在本章我们已经对相关争论进行了简单的梳理。接下来,在人工智能领域究竟发生过什么、正在发生些什么呢?下一篇文章,我将结合自身AI经验、带领大家继续学习《人工智能狂潮》书籍,介绍人工智能的三次浪潮。
本文总结
写到这里,本文介绍就完了,希望这篇基础性文章对您有所帮助,如果文章中存在错误或不足之处,还请海涵~作为人工智能的菜鸟,我希望自己能不断进步并深入,后续将它应用于图像识别、网络安全、对抗样本等领域,指导大家撰写简单的学术论文,一起加油!
侠之为大,为国为民。向一线医护人员、军人、工人、科学家和所有工作者致敬。咱们中国人一生的最高追求,为天地立心,为生民立命,为往圣继绝学,为万世开太平,他们真的做到了。生活哪有什么岁月静好,只不过这些人替我们负重前行。希望每一个人都健康平安,戴口罩不出门,勤洗手多吃饭。武汉加油,湖北加油,中国加油。众志成城,加油必胜!!!
最后希望大家帮我CSDN博客之星投投票,每天可以投5票喔,谢谢大家!八年,在CSDN分享了410篇文章,65个专栏,400多万人次浏览,包括Python人工智能、数据挖掘、网络爬虫、图象处理、网络安全、JAVA网站、Android开发、LAMP/WAMP、C#网络编程、C++游戏、算法和数据结构、面试总结、人生感悟等。当然还有我和你的故事,感恩一路有你,感谢一路同行,希望通过编程分享帮助到更多人,也希望学成之后教更多学生。因为喜欢,所以分享,且看且珍惜,加油!我的学生们,等我学成归来~
投票地址:http://m234140.nofollow.ax.mvote.cn/opage/ed8141a0-ed19-774b-6b0d-39c3aaf89dde.html?from=singlemessage
(By:Eastmount 2020-02-10 晚上8点写于贵阳 http://blog.csdn.net/eastmount/ )
参考文献:
[1] 《人工智能狂潮》日本·松尾丰 翻译·赵函宏、高华彬
[2] 神经网络和机器学习基础入门分享 - 作者前文
[3] [Python人工智能] 一.TensorFlow环境搭建及神经网络入门 - 作者前文
[4] NLP概述和文本自动分类算法详解 - 果冻科技
[5] 深度学习领域“四大天王” - Bobby0322
[6] 行业观点:物联网和人工智能的工业落地是相辅相成的 - 观察者Aaron
转载:https://blog.csdn.net/Eastmount/article/details/104161047