雷锋网按:他是中国留学生在硅谷创业的先驱,最早提出并开创了无线互联产业;他将移动互联网带回了中国,业内公认他为无线互联创始人与理论领袖。他就是信中利美国创投创始管理合伙人王维嘉,本文是王维嘉博士做客2月17日江湖沙龙的分享,谈及他对AI在传统行业中的应用发展的看法,由雷锋网整理编辑。
雷锋网对王维嘉博士的演讲整理如下:
谢谢大家,非常高兴,我是博物馆最早的志愿者,过去两三年我主要在硅谷,做的事情主要是投资,现在投资最热的就是AI,所以我主要投资方向是AI。王巍说今天晚上是讲故事,我就讲点故事。我去做博士的时候,导师正好是人工智能的鼻祖之一,所以有一些这方面的基础。
硅谷三次创新浪潮:人工智能是最新一次
我1985年去硅谷,在硅谷看到了三次创新浪潮。
创新浪潮有三个特点:第一是每10年一次,第二是每一个老的结束以后新的就启动。第三个特点是每次启动的时候,和中国的差距是最大的,但10年之内就可以追上,比如说移动互联网,2006年的时候苹果出来,中国的手机主要是诺基亚和山寨机,去年华为的P9M9出来以后就已经几乎做的和苹果一样好了。
人工智能这是一次新的浪潮,就是当移动互联走到了一个平台期的时候,一个新的创新浪潮就出来了。2016年可以说是人工智能的元年,我觉得人工智能相当于互联网1994年,1995年互联网是第一家上市公司,后来有雅虎、Google,今天还没有一家人工智能新创共识上市,今天的状态相当于1994年,人工智能对人类的影响应该不亚于互联网,或者是说会大于互联网,至少对今后20年会有这样一个影响。
AI产业生态:算法、芯片和软硬件平台
2015年的时候又出现了里程碑。AI的产业生态是什么呢,这是我总结出来的,最顶端的是算法,下面就是芯片,比如说特好的算法给别人了,别人学会了不跟我玩了,我也不知道该怎么收他钱,这是一个很大的问题。
今天的算法主要是大学在做,芯片在做什么呢,主要是目前我们今天的计算就是CPU,CPU就是有一个中心指令级,今天最适合的是用GPU,英美大去年股票涨了4倍,其实GPU并不是最适合做人工智能结算的体系。现在有一批公司在做,但做硬件研发成本是非常高的,假如说做10纳米芯片光流片一次就1000万美金,做这样的公司没有5000万到1亿是做不下来的。
再下一层就是做软硬件平台。一个软件的编程平台里面,现在最热闹的,就是最底下这一层做应用的,做应用的最大的一块就是自动驾驶,待会我会稍微讲一下自动驾驶,还有图象识别、语言文字、医疗制药。
医疗和制药怎么做呢?医疗主要是医疗图象的识别,最近已经有这样的实验,就是用机器和非常有经验的X光片医生比,机器的识别准确率,判断是否在癌症诊断上已经超过了最有经验的人。原因很简单,一个X光医生他一生当中最多看上万张图片,但是机器可以一次看几百万张图片。
为什么看算法?因为我要投芯片公司就要看算法公司,他如果今天做了一个芯片是用这个算法,但是如果明天这个算法就失效了,这公司就不行了,所以我一定要看既然要做一个芯片公司,至少顶用10年,之后5到10年有没有新的算法把这个芯片公司取代掉。今天的芯片还有一个很大的问题是功耗。今天如果做出一个像人脑这样强大的电脑的话,它的功耗基本上需要一个核电站,而人脑只有20瓦就够它的能量了。
今天大家会听到很多叫编程框架,其实它的背后东西也很简单。不懂线性代数怎么办?有一些人就把很复杂的东西,比如说矩阵的运算直接写好了。所谓的编程框架就是让不懂神经网络的人也可以做神经网络的编程。
很有意思的是,人工智能和原来(的技术革命)不一样,所有这些公司都把这些东西开放出来,把软件库全部开放出来。也就是说,今天完全不懂人工智能的公司,做应用只需要用Google的框架,两天就可以传出应用。所以今天很多公司都说我是人工智能公司,其实他都是用同样的东西,大家都是做应用。
“AI应用公司若不能垄断行业的数据,它是没有技术的”
那么,怎么看一个应用公司的竞争优势呢?核心就是他能不能垄断行业的数据。如果不能垄断数据,这公司是没有技术的,绝大部分应用公司是没有自己的核心技术。
比如说美国有一个VKP我一天上四五次,每个月要定期捐款,中国有几个百科做得非常烂,原因是没有社区贡献的文化,美国这个社会是从一个小镇五月花,联邦13州从底到上建立起来的,有一大批自己出钱处理搞公益的人,整个社会是这样的风气,开源这件事情一定要有这样的文化。
中国大部分人说,我又不赚钱,给别人写了别人用,对我有什么好?这个问题的出现,导致于这次人工智能的开源框架一定是美国领导。
值得注意的是,未来这些开源框架就像今天的安卓一样,会在上面长出很厚的生态系统,会做出各种各样的库,所以说最后你已经没法和它匹敌了。
今天开源这件事仍然是一个在竞争,各个大公司为什么要开元呢,都想把所有开发的资源聚集在自己的生态上面。
现在的情况仍然是Google,Google上面的开发人员加起来是其他所有人加起来的10倍——其他所有人是Facebook这几家公司。其实就在这几家竞争。开源领域除了这几家公司以外,百度也出了这样一个东西,每个大学都有一些开源的东西。
人工智能的开发和应用,中美有哪些差距?
很多人都关心中国和美国差距在哪里,差距有几个。
这三点是中国和美国最大的差别。
AI有哪些潜在的应用?
刚才说了图象识别、医疗诊断、制药。比如说一种癌症的药,癌症药主要是一种化学结构和蛋白质发生关系,过去制药是,生物科学家在想这种化学结构有可能有用,然后就去试,实际上和爱迪生发明电灯泡差不多。人工试错非常慢,现在就可以把大量成功药的结构输到机器学习模型里面,机器自己找到了其中的规律。机器去试速度就快非常多,现在硅谷有一些这样的公司。
其实语音识别,语言理解大家可以想象到,最让人类吃惊的就是机器学习能学那一些人类不擅长的。人类无法垄断知识,因为知识有两个特点,一个叫本地化,一个叫默会,比如说你学骑自行车,没有人看说明书学骑自行车的,你只能骑到车子上摔两脚就学会了。
机器学习神奇在哪?
机器学习特别擅长学这样的东西,还有一类就是叫群体学习。Google了这么一个事,就拿了一个机械手,机械手放一个盒子里放各种各样形状的东西,有圆的方的长的短的,他也不教机械手,机械手一开始抓空了,下一个动作就换一个姿势,这就是机器学习的一个过程。Google做了什么事呢?Google拿了20台机器一起来学,结果时间是原来的1/20。因为机器之间可以瞬间分享自己学到的东西。
特斯拉在大街上跑了10万辆车,每辆车都在学习,一天都能搜集几百万公里的数据。也就是说,学习一个超级复杂的东西,把10万台机器放在一起,人类可能要学很多很多年的,它们一分钟,甚至一秒钟就学会了,这是第一个可以超过人类的方面。
这种事情对我们造成什么样影响呢?也就是说,未来基础的科研有可能会取得飞速的突破。我们做研究分成几步,第一步要阅读历史文献。我们人去读文献,几百篇文章,一天读一篇文章得读一年。最近加拿大做了一个实验,关于医学问题的研究,他们让机器读了历史上所有的文献大概40万篇,关于这一个题目全部读完。然后,机器就自己总结出来了历史上所有的解决了哪一些问题,是用什么方法解决的,今天还有哪一些问题要解决,有哪一些可能的方法能解决这样的问题。过去人类做科研这样高度创新的活动,机器很轻松地就完成了。
更不用说军事。看美国空军的视频,看他们怎么打塔利班的:几个年轻人小孩坐在房间里面完全打游戏的概念,就和这一模一样的无人机飞到塔利班,可以看到塔利班的账篷,这边一个手杆导弹过去,那边一片苦海,在屏幕上像小蚂蚁一样,一按对准了那个人就没有了,基本上现在战争就这么操作。
最近有一个实验,美国一个空军王牌飞行员,他在模拟器上和机器连打了十几盘空战,打一盘输一盘,可以把人类空战所有的数据都飞给这个机器,而且它的反映速度比你的反映速度要快的多的多,他的反映速度是光的速度,你反映速度是几十毫秒的空战,你说不清楚的东西机器最有效的,艺术也是人类最具有创新的东西,这是一幅典型的北欧风景画,左边是梵高的《星空之夜》,就把机器让梵高的话都读一遍,机器就自动把北欧风景画变成了梵高的风格,它的线条比处学的惟妙惟肖。这是五首中国的诗,这里面有三首是机器做的,大家能看出来哪三首吗?其实你仔细看,还是能看出一点点痕迹的,比如说第一首和第三首就是每一句实际上都是有画面感的,但是比如说第二首孤耐凌节护,是读不懂的,但是根枝木落无是很有道理的,但是我觉得这个水平其实已经超过了绝大多数人的水平。他用多层学习的方法,把句式结构、风格,也就是说今天把鲁迅的著作给他喂一遍,你写一个故事,这个写出来一定是鲁迅风格的。
AI会影响几乎所有行业
AI会影响哪一些行业呢,几乎所有行业都会受到影响。
牛津做了一个报告,2033年很多行业会彻底消失,这里面概率比如说电话营销和保险业务员基本上这个行业就没有了。但是,我觉得厨师没有那么容易代替,最安全的职业是考古学家,替代这个行业的商业利益太小了,没有人去做这样的东西。
对“AI威胁论”、“AI消极论”的批判
当然,现在很多人在关心未来AI会不会有风险,如何解决AI的伦理问题,比如刚才说的开枪这个决定谁来做,一个没有同情心的法官可以吗?等等。
当AI和大数据出现的时候,大家觉得:现在可以完全预测整个社会的需求,是不是可以回到计划经济了呢?我和朋友都非常不客气的批判过提出这个观点的人,其实这不是一个人,这是一种有道理的想法,大家觉得市场经济有很多浪费,因为不知道市场需求多少,你也生产,我也生产,就浪费。
举个例子,如果说我要知道全中国的每一根火柴的需求量,我要做的第一件事是监控——任何地方都要放一个摄像头,因为只要抽烟我一定要监控到才知道,监控成本是非常高的成本,这是第一点。就算我知道中国人现在每天需要多少根火柴,我还遇到一个问题,我怎么分配谁来生产呢,是建一个国营火柴厂,还是分配到不同的火柴厂?计划经济有一个特点——必须决定销售价格和成本,这么多不同的火柴厂价格根据谁来定,根据最高的来定,一定是最没有效率的,根据最低定成本高的就会破产,这是一个很难决定的一件事情。
另外一个很重要的事情,比如即使知道今天这种需求,我怎么能知道其他,比如有人需要防潮火柴,有人需要包装很漂亮的女性用的火柴,谁来做这样的事情呢?所以一旦回到计划经济以后,所有的竞争就没有了。当竞争没有的时候,创新就没有了,没有创新就不会有人发明更新的东西,更有效率,也就不会有人发明打火机了。还有一点就是,当所有的机械都卖一样的价钱赚一样钱的时候,员工有什么积极性呢?
AI将加剧信息不对称带来的贫富差距
其实AI和大数据只会使得竞争更有效率,因为它仍然解决不了消灭竞争以后就消灭了创新最根本的问题。AI未来还有一个影响,其实这一次全世界黑天鹅,到处都是黑天鹅,为什么会有这样一个状态呢?其实就是全球化和信息化造成了贫富差别。现在没有人挡住贫富差距,AI来了以后会进一步加剧,未来有少数几个脑袋特别灵光的人造了一台机器,就不需要人了。写《未来简史》的作者把他叫无用阶级,我把他叫神人和闲人,闲人干什么是未来可能的问题。
人类和现代机器最大的差别就是没有求生本能,没有求生本能就没有情感,今天和人类主要的差别就是这样一个东西,没有求生本能和情感的东西能成为智慧生物吗?我们不知道。
另外,我为什么现在要在硅谷做人工智能投资呢?
因为现在技术的曲线中美的落差最大。我想投的东西技术落差一定要最大,否则拿到中国来没有意思。
第二中国一定要有市场,当20年前回到中国,美国的技术在中国很难找到应用,但今天已经不一样,所以投资另外一个要求一定在中国有市场。
中国由于外汇的管制,人民币的汇率是扭曲的,现在中国资本市场上的扭曲非常厉害,也就是说资产荒是未来5到10年一个长期的趋势。这就是为什么很多上市公司随便拿一个题材就可以炒作,二级市场就会影响到一级市场,我们看同样的项目,在中国同样项目的估值就比美国高很多,也就是说在硅谷可以拿到非常便宜的项目,技术非常好,这是两个非常大的差别。如果你能拿到世界上独家的技术,赚钱就比较容易。
总结:现在与泡沫
大部分应用公司是没有技术积累的,应用市场中,中国目前没有做算法的(有一家做芯片的,还是我们科学院的一些同事)。但是整体来讲,中国的公司主要做应用,做应用要看什么呢?其实就看对数据的独占,因为大家都没有技术的壁垒,所以如果能把一个行业的数据独占,比如这家医院肿瘤的图片只给你,你就有优势。你只要能拿到数据,我现在去找算法,找芯片都来得及。
目前哪一些有泡沫呢?
-
一个是自动驾驶的软件解决方案,泡沫都是不合理的收购造成的。自动驾驶前年GM花10亿美金买了一家公司,这家公司做了一个Demo能够自动驾驶了,GM觉得,自己这方面起动晚,就赌一把,所以说基本上这是大公司的想法。
-
另外一个就是机器人,中国有三千家机器人公司,大家说未来机器人可以有很多应用——给老人换尿布。但是,给老人换尿布是特别复杂的一件事,老人的需求不光是换尿布,还要吃饭还要喂奶,那要不要买12个机器人伺候老人呢?这些东西都是想象,根本就没有市场。
-
当然不是说未来服务机器人不可以做,比如巡逻保安等等。现在做得比较成功就是扫地机器人。
最后,如果总结一下,今天人工智能主要是能做什么?已经比较成熟的就是图象识别——对视频的理解。下一步做的是语音理解和机器翻译。这样的东西对人类是革命性的,所有的出国、商务谈判,没有语音障碍了。
人类很多活动都会被取代,明天影响我们行业的就是刚才说的这些人类今天可能还想不到的东西,比如说我说的默会知识学习,大规模集体学习这种无私的分享。机器完全没有自私心,因为他没有死亡,所以说他们的分享是完全无障碍的。
我感觉人工智能是会对人类今后20年一个非常深刻的甚至超过互联网影响的,将改变我们大脑的一个东西。我相信今天我们看到的AI只是冰山一角,今天AI能看到的图象识别、语音识别,都是我们能想象到的,未来更让我们吃惊的是我们今天看不到的应用,所以说我想人工智能作为一场影响人类历史的超级的创新和技术的巨浪已经向我们扑面袭来。
|