当最强大脑遇上人工智能

http://www.gkong.com 2017-03-06 15:32 来源：中国自动化学会专家咨询工作委员会

QQ截图20170306153346

给你1张4岁小女孩的照片，再让你从电脑屏幕上看20个女孩跳舞唱歌，每个女孩只出现3秒钟。你能从中找出长大后画着浓妆、戴着美瞳，甚至可能整容过的她吗？

1月6日，江苏卫视《最强大脑》就以“匆匆那年”为主题，上演了中国版的首次人机对决：31.02秒就可记忆一副无规则扑克牌的人类代表王峰，迎战百度人工智能机器人“小度”。双方先比拼人脸识别——仅凭一张童年照认出十几年后的少女，包括一对双胞胎；第二局，则要从30张毕业照中，即约1500个花生米大小的头像中，根据长大后的男生照片找出儿时的他。

同“Master”横扫人类围棋大师一样，人工智能再一次战胜了人类。百度大脑如何分辨长大后的双胞胎？它和Master哪个更厉害？它还拥有哪些神奇的功能？《经济日报》记者就此采访了百度大脑的技术团队，得出迄今为止最靠谱的答案。

小度认出了长大后的双胞胎之一，人类没有

都说“女大十八变”，比赛中，选手王峰表示，自己主要看嘴角、耳朵的相似度。在他眼里，长幼两张人脸被分解成一个个相似的五官形状，此中除了运用人类的记忆力、推理能力，还有人类的本能。

“千百万年进化过程中，人脑进化出一个专门的区域负责人脸识别（简称FFA）。”百度首席科学家吴恩达被戏称为小度的“爸爸”，他举例说，“一个3岁的孩子看见妈妈时，不管妈妈是微笑、生气，睁着眼、闭着眼，长头发、短头发，穿什么衣服，孩子都可以轻易认出这是妈妈”。

但是，人脑为何一瞬间就能完成人脸识别，至今全世界的科学家也说不清背后的原理。因此，小度对人脸的识别不是模仿人脑，而是更多基于数据分析和深度学习。

在人工智能“眼里”，它看见的不是一个图形，而是一些按数字1和0记录的像素点。因此，机器会把人脸分为很多个小方块来识别。根据眼睛、眉毛、鼻子等器官的特征及其相互之间的几何位置关系，计算总结出这些点，最终构成了一张人脸。

如果要辨认这张人脸是谁，机器还要提取面部特征进行特征建模，与需要对比的人脸比较后，根据相似程度，对人脸的身份信息进行判断。一旦人的面貌发生任何变化，哪怕只是轻微仰头，灯光变换，机器都需要重新计算一遍。

据百度深度学习实验室主任林元庆介绍，“为做到尽量精确，在百度的技术中，我们会在人脸上取72个点，最后通过神经网络计算，得到128维特征，每一维特征是人脸上的某种特点，比如狮子鼻”。

至于如何从72个点的信息里总结出128种特征，并将每种特征与人脸的特点一一对应，这是由深度学习从海量数据里自动学到的。换句话说，工程师并不知道这种特征究竟是“狮子鼻”，还是别的某种甚至没有词汇形容的特征。

计算机辨认人脸原本就非常困难，但在《最强大脑》的舞台上，又增加了时间跨度。现场嘉宾、北京大学心理学系教授魏坤琳解释说，成长中的人脸变化极大，一个人一辈子连身份证都要换好几次。对于人类来说，可以依靠整体神态、气质等无法言说的因素去主观猜测，但机器不会猜，只能根据深度学习得来的规律计算。

据林元庆介绍，为了备战，团队2个月里让小度看了200万个人的2亿张照片，并辅以少量有时间跨度的照片。经过“训练”，小度自己总结出了一种不为人所知的人脸随年龄变化的规律。

在遇到蜜蜂少女队的双胞胎时，人类和人工智能的差别就显示出来了：姐妹花长大后外表几乎一模一样，连姐妹俩自己都分辨不出旧照片里的人是谁，王峰用肉眼也无法辨别她们的五官特征。但是，在人工智能的计算方式下，虽然她们的面部骨骼极其相似，差别特别细微，总还是有一点区别。最终，小度计算出，其中一位跟老照片里的小姑娘有72.98%的相似度，另一位有72.99%，差距仅为万分之一。

百度大脑认脸和Master下棋，哪个更难？

很巧合，在百度大脑参加最强大脑比赛的几乎同一时间，曾经横扫国际象棋界的阿尔法狗改名Master，重出江湖，以60场连胜顶尖围棋手的傲人成绩，震惊了全世界。

这也让不少人好奇：如果Master和百度大脑比赛，谁输谁赢？

“很遗憾，这很可能将是一个永远没有答案的问题。”林元庆解释说，因为百度大脑和Master学习的是两种完全不同的技能：小度的强项是生活服务，比如人脸识别和语音识别，从来没有学过下棋。Master目前似乎也只会下棋，不会辨别人脸。

那么，对人工智能来说，认脸和下棋，哪个更难？

从本质上说，百度大脑和Master都不是记忆和推理的高手，而是数学大师，只不过一个算棋局的概率，一个算人脸相似的概率。

国际象棋、围棋等棋类是计算每一步会带来的概率变化，计算能力和算法越强，越能照顾到后面局势的变化。魏坤琳认为，人类不擅长逻辑运算，因此，只有少数人精于下棋，顶尖高手更是凤毛麟角。而且，人类脑力有限，即使是聂卫平在巅峰时期，也只能在局部多计算几个回合，无法考虑每一步对全盘战局的影响。

但逻辑运算是电脑的强项，它每次落子，都可以考虑对全局的影响。这也是为什么聂卫平等围棋大师会觉得Master不按常理下棋的原因。因为在某些时候，计算全局和计算局部的结果是不同的。

反过来，感知和运动是人类擅长的，机器却不擅长。机器无法理解雨打芭蕉的美，爬个楼梯也很费力，特别是台阶的高度、坡度、光照条件等参数无法预知时，机器人很难像人一样流畅地爬楼梯。

“同样，推理辨识长大后的人脸，不是简单的信息匹配和分类问题，而是从模糊复杂的信息中抽象出规律的问题。”魏坤琳说，“基于极少非结构化的信息来学习推理，这恰恰是人脑擅长的。我们把这些要素都设计到了最强大脑舞台上的挑战当中”。

因此，《最强大脑》科学顾问团首席顾问、北京师范大学心理学院院长刘嘉在首次媒体看片会上，曾正面回应道，“小度从计算上的难度来讲，甚至可能会超过Master”。

但魏坤琳不完全赞同。他反复强调这种难易比较只是“可能”，“因为，人工智能对不同认知功能有自身的难易评判，我们不能用人的直觉去作这个评判。这就像苹果和橘子，不能比”。

我们不怕汽车比人跑得快，为什么要畏惧机器比人聪明？

这场比赛还有一个细节——面对小度，曾经展现出超强记忆力、辨识力的人类选手都不敢应战，场面一度尴尬。在评委们的鼓励下，有3位选手带着点悲壮的感觉主动请战，称“即使必输无疑，也要维护战队和个人尊严”。

选手们的畏惧折射出当下人们对人工智能的恐惧心理。最强大脑的选手在记忆力、识别能力等方面都极其出类拔萃。他们在人类最擅长的领域，被最不擅长此项活动的机器打败，其冲击大于当年的AlphaGo，再次引发了“人工智能威胁论”。

“恐惧未知，这是人的正常心理。”魏坤琳觉得，新技术出现时都会造成恐慌，汽车、火车、计算机刚问世都有人害怕。他认为，大多数人其实是担心自己被人工智能替代，“人工智能的出现，可能让很多一般智力活动甚至专业人员的工作受到威胁。但是，有些工作被取代了，新的工作又产生了，人类整体的失业率不一定会上升”。

实际上，从人类生活的质量来说，有了人工智能的辅助，大家的生活变得更“智能”了，自动驾驶、家居机器人、专业决策辅助，这都是前人无法想象的生活。

在比赛现场，嘉宾就提出，小度可以帮助父母寻找失散多年的孩子，帮助公安机关搜寻偶然被摄像头拍到的犯罪分子。从商业化的角度，百度的人脸识别已经在浙江乌镇景区闸机得到应用，可满足每年千万人次的游客使用。还有一些国产手机也在接洽，希望使用百度的人脸识别技术。

而且，人工智能还可以做很多事情。比如小度不仅会辨别人脸，对人类语音的辨别率也能达到97%；小度还可以声情并茂地输出语句，基本可以代替忙碌的妈妈给孩子们讲故事。在智慧医疗、文物挽救、在线个性化教育等方面，人工智能大有可为。因此，近年来，微软、Facebook、IBM、谷歌、亚马逊都投入巨资研发人工智能。在最近的消费电子展（CES 2017）上，各大厂商都带来了自己的人工智能。

但是，再强的人工智能都是人类智慧的结晶。机器只能做人教给它的东西，也无法理解人类的感情。比如小度判断出双胞胎的存在，给出了两个概率。因为两个数字太过接近，在它的系统中无法抉择，最终还是吴恩达帮它挑选了概率稍高的那一张。

人工智能要威胁到人类，还有很远的距离。也许就像王峰说的，人和机器不是敌对的关系，虽然这次他输给了人工智能，但这其实代表人类的科技又进了一步。

看待中国人工智能应理性自信

若瑜

《经济日报》，2017年1月16日

百度的人工智能机器人“小度”战胜了拥有超强记忆力、推理能力的人类选手，跟Master战胜人类棋手后得到的赞叹相比，它收获的主要礼物不是点赞，而是口水。

不能否认，百度公司近年来在商业模式上的争议连累了它。但另一种情绪更值得警惕：不少人毫无根据地认为，中国做不出这样的人工智能技术，只要谷歌的Master出马，就能秒杀小度。

这般妄自菲薄，完全忽视了中国在人工智能领域的进步，也伤害了那些默默付出的从业人员。在此必须郑重声明，中国的人工智能真的很强！

早在去年9月，美国《财富》杂志就发表文章，将百度与谷歌、微软、Facebook并列为全球四大AI巨头，介绍了他们在人工智能领域的布局以及深度学习技术的进展。

比如，在人脸识别技术两个最为权威的国际评测FDDB与LFW中，“小度”背后的百度大脑都获得了第一名的佳绩，并在LFW中得到99.77%的准确率。此外，百度的语音识别、无人车、百度翻译等技术也相当先进。

在语音识别方面，我国还有另一家世界顶尖企业——科大讯飞。他们的语音识别已经连续11年蝉联全球语音合成大赛的第一名。特别是2016年，在众多国际顶尖研究机构和产业界全部参加的前提下，科大讯飞不仅拿下全球第一，还是全球唯一把英语合成做到了超过普通人说话水平的技术。

科大讯飞的机器翻译也取得了突破性进展。2014年，他们首次参加国际口语机器翻译评测比赛（iwslt），即在汉英和英汉两个翻译方向中以显著优势获得第一。而此前的10届比赛，汉翻英都是日本研究机构全球第一，英译汉都是美国机构全球第一。讯飞终结了这一历史，并在2015年、2016年连续保持全球第一。

近年来，面对国家“一带一路”的重大战略，讯飞又推出了面向“一带一路”的多语种翻译，可以做到汉语、英语、维语、藏语、日语和韩语等10多个语种的同步翻译。

此外，阿里巴巴、腾讯也有人工智能平台。毫不夸张地说，在这一波人工智能浪潮中，中国首次跟世界巨头站在了同一起跑线，在某些领域甚至处于领先位置。

同时，百度、阿里、腾讯等国内企业发展多年，在国人大数据方面的积累，是海外企业无法比拟的。而大数据就是人工智能成长的“粮食”，没有海量数据，再好的算法也无用武之地。

无论从技术实力还是数据储备上看，中国在人工智能领域都已经处于全球第一梯队。去年，美国人工智能企业Spare5的CEO在给当选总统特朗普的信中就强调，人工智能是一场竞赛，中国已加入到这场角逐当中，其人工智能技术以及商业化产品落地愈发成熟，以此提醒特朗普要加大对人工智能领域的重视和投入。

看看，部分人还在质疑中国人工智能究竟有多少干货的时候，世界已经把中国放在了聚光灯下，仔细掂量着这个最具分量的对手。

当然，当前中国的人工智能距离完美还有漫漫长路，在技术突破、政策环境、平台支撑、人才培养上还有大量工作要做。

2016年5月，我国出台了《“互联网+”人工智能三年行动实施方案》，提出了加快建设文献、语音、图像、视频、地图等多种类数据的海量训练资源库和基础资源服务公共平台，建设支撑超大规模深度学习的新型计算集群，建立完善产业公共服务平台等具体措施。2016年12月出台的《“十三五”国家战略性新兴产业发展规划》，也提出加快人工智能支撑体系建设，推动人工智能技术在各领域应用。

可以预计，未来5到10年是全球新一轮科技革命和产业变革从蓄势待发到群体迸发的关键时期，人工智能将是其中改变人类生活方式的重要力量。希望国人对中国的人工智能多一点理性，多一点自信，多一点支持，让科技更好地服务生活。

当最强大脑遇上人工智能

相关新闻

编辑精选

工控原创