猎云网注:顺为基金副总裁孟醒在企鹅智酷Live第二期活动中,透露了大量能让创业者“大吃一惊”的有意思的讯息。他曾经创办过两家人工智能创业公司并被成功收购,目前,孟醒以投资人的身份继续深耕这个领域,他站在不同的两个视角,为我们展现了人工智能在创投圈最真实的一面。本文转自腾讯创业 (微信:qqchuangye)。
分享人:孟醒
编辑:腾讯科技 郑可君 龚鹏飞
孟醒:顺为基金副总裁以及入驻企业家,曾经作为创始人和CEO创办两家人工智能领域的明星创业公司,并在美国最大博彩娱乐公司CAESARS ENTERTAINMENT任职互动娱乐业务亚太区负责人。
顺为资本:由雷军及许达来先生联合创立,管理三支合计17.5亿美元的美元基金和一支10亿元人民币的人民币基金。重点关注互联网、移动互联网、高科技行业以及互联网与传统行业结合所带来的变革。
一
主持人:请先作自我介绍,并分享您的创业经历。
孟醒:我叫孟醒,目前在顺为资本负责泛人工智能以及大数据上下游相关的投资。在这之前我做过两家人工智能的创业公司,一家在硅谷,一家在国内。在美国的这家公司是我在2012年还在读MBA期间做的,叫Orbeus,后来被亚马逊收购,目前接管了亚马逊AWS里绝大多数跟视觉图像相关的服务。
第二家创业公司在北京,名字叫知图科技,是用图像识别和深度学习技术在广告行业进行深挖的一家技术公司。主要是做将图像相关的技术应用到媒体上,来挖掘图像信息的广告位。这家公司在去年的时候卖给了一家在美国上市的中国互联网公司公司。
在创业之前,我曾经在香港的摩根大通投行部负责TMT行业。当时,这个行业里还没有像今天这么多的并购和投资案,绝大多数都是中国公司到美国上市做IPO。我做了很多这方面的案子,也有幸参与了几家中国公司到NYSE敲钟的情景。
另外一段经历是我在美国最大博彩娱乐公司CAESARS ENTERTAINMENT任职互动娱乐业务亚太区负责人。这部分包括游戏方面的投资,游戏方面的合作开发以及世界上最大的德州扑克的竞赛品牌WSOP在亚洲落地的运营,这两块业务跟创业没有直接关系,但从资本的角度和管理的角度给了我很多启发。
目前在顺为资本,我的角色跟投资团队没有任何区别。2016年主要以投资为主,2017年我希望能够多花一些精力到我们顺为资本的被投项目中。毕竟作为一个创业者,我经历过被投公司所面临的所有问题,有一些经验可以和大家分享。同时,也有一些困惑可以和大家一起探讨,基于这样的思路,我在琢磨怎么样能够组织一些更有意义的投后,或帮助被投企业运作的一些活动。
二
主持人:第二个问题,您是如何理解人工智能行业的?
孟醒:人工智能是一个包罗万象的行业,我从人工智能创业或者投资两个角度来进行分享。
最近一年以来,资本市场转冷的现象比较明显,唯一没有受到影响的是人工智能以及其延伸领域。但这个领域的投资方向每个公司很不一样。我经历了大概四类公司的阶段,但这四个并不是严格先后次序,会有同时存在关系或者前后关系。
第一类是做感知层算法的公司,目前大家耳熟能详的或估值较高的创业公司,绝大多数在做感知层的算法。2012年出来一波比较优秀的公司,当然2012年也是一个在人工智能算法领域标志性的时间点(Alexnet在Imagenet上的突出成功使得Deep Learning成为主流)。感知层就是让机器具备人的五官的基础感知能力,从视觉到听觉的理解能力,这部分公司可以理解为做人工智能的基础设施工作。
第二类是算法向芯片层面延伸的创业公司。国内从2014年开始广泛普及这类公司,绝大多数是在算法优化的过程中又深入了一步,覆盖到上游芯片层面,无论从用模组设计,到用FPGA搭建自己的SoC,硬件层面矩阵运算的优化,甚至是指令集层面的优化,这些都有涉及。他们觉得仅仅在算法层面的优化不能弥补使用通用芯片所带来的效率的损失。
第三类是通过人工智能改善垂直行业效率的2B公司。这类大批公司是从2015年以后诞生的,这时候人工智能的基础设施已经有一定的规模。这些规模可能由创业公司来提供,也可能来自学术领域的突破,也可能是由大公司的基础设施来提供,到一定规模之后会在垂直应用领域找到结合点,比如在医疗、农业、金融这些领域,研究这些方向上用人工智能算法怎么能够提高效率,尤其是2B的效率。
最后一类公司是做2C的人机交互方向的。这类公司是在2014年以后出来的,比如人机交互的智能机器人,聊天机器人等这些方式。
很多时候,大家认为人工智能解决的是算法的问题,其实本质上人工智解决的是经济问题。经济问题可以理解为从整个算法端和数据端开始,数据的收集,涉及到人工怎么去做标定,用什么方式找到数据,或怎么用优秀产品来收集数据,人工的激励机制是怎么样的,怎么样使数据获取成本最低。到算法端,需要选择性价比最高的算法,怎么利用有限的计算能力和传输能力,所有这些问题其实都指向了我们能不能把经济成本优化,把人工智能做好的核心是把经济问题解决好。
在人工智能上的努力都是为了分别对应2B(优化效率)和2C(优化体验)这两个方向,能够在效率上改善经济成本。
所以,做人工智能方向的核心并不是要做出一个东西来逼近人的智能。
如果我们目的仅仅是要创造逼近人智能的产品,其实上帝已经给予我们这样的能力了。我们其实是可以造人的,成本其实也不算很高。人是多么复杂的精密仪器,每寸皮肤上都有压力传感器、温度传感器、湿度传感器,都有神经。我们具备视觉,可以自由做3D SLAM, 物体检测,人脸识别,行为识别。我们有听觉,有语音识别,有自动降噪,有远场语音增强,有自然语意理解。所有我们为人工智能所做的努力,都在人身上具备了。其实可以完全用生物的方式而不用信息电子的方式而把它实现。
反过来说,造人本身是有成本的,因为人本身不能大规模复制。同时还有伦理的成本,使我们不能把这种生物科学的方式作为我们去改善效率的最佳方式,所以我们才有了用科研的方式或者在信息电子层面去研究人工智能。
可以总结一下,我对人工智能的看法,其实是我们要去通过解决一件件改善经济成本的小事,使得在提供效率和提供体验上把经济成本赚回来,这是我们核心要做人工智能的目标。
三
主持人:第三个问题,从投资人和创业者角度,如何去判断一个公司的亮点会有哪些不同?
孟醒:我作为一个人工智能创业者,同时也作为投资人工智能方向的投资人,我觉得这个视野的转变和观点的转变很明显。我举两个例子。
第一个例子,是“技术的深度”和“技术深度能够打动别人的程度”两者的对比。
一般创业团队做一段时间后有了阶段性成果,就去进行商务谈判融资,拿着以前在学术领域所发表的paper、融资的PPT,还有自己的demo。
他想充分证明自己的技术能够领先,无论是从文章被引用的次数,还是demo能看到的实际样式,还是通过刷榜来跟Google等一线公司对比的结果,都希望能表现自己的技术能力。
这是包括我自己在内创业时的一个标志性的心态,造成的结果就是:就是很多创业者拿demo过来,我作为一个投资人去看的时候,发现很多人拿demo以后都不再多解释了,认为投资人看完后,理所应当就应该重视自己,表情上就是一副拿了已经金牌的脸。
这个时候其实很尴尬,绝大多数投资人对于demo的熟悉程度远远不如创业者自己的熟悉程度,不解释是投资人很难理解。
另外,你从投资人的角度来说,一种就是他完全没有听过你提到的刷榜和期刊,一种是都听过,但是有很多创业者都对他讲过,所以他们分不清榜的难度,你比到底强多少,这个很难分辨。
造成的结果就是投资人很难被你的demo所打动,但是创业者打动了自己。其实双方都应该有往对方的方向去拉近,但现在还是离得很远。
第二个例子就是对于产品思考的完整程度,尤其是算法。厉害的人出来做人工智能创业的时候会比较怕深入讨论产品,原因是本来改变世界的事儿,一旦把这个事情具体到产品方向来说,这个事听起来就变小了。
从投资人角度来讲,听创始人只讲算法和与算法相关的成绩是很可怕的,因为算法本身是不能拿来当饭吃的。投资人不一定追求你把产品和产业的思考都讲对,但是要有逻辑,有深度,表达了对深化产品的态度。看推理过程,根据过程倒推创业者的思维模式。
四
主持人:第四个问题,如何看待人工智能领域的明星创业团队?人工智能领域的理想团队应该是什么样子的?现在缺什么?
孟醒:我先说结论:这个行业里面非常缺人,缺的是AI的产品经理,就是既懂技术边界,又懂得需求边界的人,这两者结合起来,能把这两块融会贯通的人非常少。
行业里面不缺一般意义上的明星,特别牛X的算法达人,牛X的背景的BAT,很多从斯坦福,甚至于Google、Facebook出来的人,这些会越来越多。但是,方向性和定义产品这件事是特别难的。
研发明星其实有的时候会成为创业公司的成本和负担,我举一个例子:
看到最近Facebook的人工智能研究院FAIR的Director,他昨天发了一篇文章:《我们为什么能招到最好的人?》 其中一个最核心论点:Facebook除了给研发明星一个很有意思的工作去做以外,可以允许员工去在学术领域继续勇猛渐进,去想办法发更多的paper。同时,在Facebook这个平台上做东西可以进行大量延展,不为任何垂直领域去定制,而是为了10亿以上人群研发技术,扩大自身影响力。
越是明星的背景,越是对于扩大影响力和通用性这件事情有着强烈的追求。但在创业公司里,如果你的团队花费时间去想怎么写一篇能够在学术界有影响力的paper,那就很麻烦了。因为在学术领域寻求突破跟在创业里面把一个产品做好是非常不一样的事情。对学术的执着在科研领域是黄金品质,在创业却是成本。
第二,一个理想的团队应该包括一个非常核心的,能够同时懂得技术边界,又懂得应用场景的产品经理,可以是一个人也可以是两个人。但是两个人必须能很好地融合,一个会用虔诚的心态在垂直领域深挖技术,一个非常懂得行业同时非常聪明,愿意去理解一定算法边界的行业人士,这两个组合也可以算一个产品经理。由这两个人去形成组合慢慢去往下扩散的团队,如果对应的行业又非常对口,我觉得是非常理想的团队。
五
主持人:第五个问题,您认为人工智能在未来可预见的五年内,最主要的应用体现在哪些领域?
孟醒:五年内如果能看到的爆发可能在两年之后看的更清晰。今天比较明确的形势有这么几个:
第一,五年之内AR会赢得技术上比较大的突破,从产品化的程度和普及程度来讲,将有平台革命性的迭代。围绕AR所做的一系列AI功能会是一个非常有意义突破点,这里面包括图像识别,包括物体检测,包括跟踪,包括SLAM 三维重建等等一系列的技术。
第二,绝大多数的AI创业公司背景是偏技术的,这样的公司最适合在以下几个行业突破:
第一个是纯互联网行业。但问题是这些都由巨头把握着,造成创业公司很难突围,也就很难引领这些新的AI方向或者是创新性的AI方向能够带到不同互联网的方向。
其次,我比较看好的几个垂直领域:农业、医疗和金融。
先说农业,农业的渠道其实没有特别强的人在把控,也就是说使用新的服务或者使用新的决策是相对比较市场化的。
医疗行业,好处是一些细分的医疗领域里用人工智能去做一些明显能提高现有医疗行为的应用的时候所需要的训练数据没有想象中的做其他应用领域那么大。这一下子减低了很大障碍,同时医疗决策越来越市场化,同时客户非常分散,因为医院,医疗机构,医生都很多。
金融领域,创业公司已经出来一批,美国的Wealthfront, 国内有一系列的智能投资顾问,或者说用大数据或者用人工智能算法的方式授信等等。
从个人情感出发和产业结构出发,我其实更多在看农业方向,当然还有一些像现在炒得非常热的智能驾驶等这些方向。
六
主持人:第六个问题,人工智能领域2B和2C方向如何选择?为什么?
孟醒:我对着这个PPT来讲。大多数的人工智能方向,要么是改善体验,要么是改善效率;要么是一个2B,要么是一个2C的方向。刚才讲的绝大多数情况都是垂直领域,是2B的。
上个月我在美国待了很长时间,也拜访了美国一线的VC和投行,尤其是之前专注人工智能领域的投行。我发现在美国一些VC已经没有两三年前专门设立的人工智能部门。也就是说这个领域其实已经消失了,或者说正在消失。
消失是因为在绝大多数领域里,人工智能已经像互联网一样散落在每个垂直行业,成为行业本身的一部分。所以你公司的核心价值,看的不是它的算法,而是看人工智能作为一个核心壁垒,能为这个产业链增值多少。
有许多行业出现变革的机率非常大,而且他们每个行业的机动性都不太一样。比如说医疗行业、电力行业、电力巡线这些行业,因为政策或者采购方式的变化导致行业的变革,而变革是因为行业养不起这样低附加值的劳动力。
而做一个2C的事情最终要解决的是人的体验。但最终的目标是要获取足够多的流量,利用这些流量做增值服务。
人工智能直接去做2C相对来讲会非常难。因为在2C里面,对应的行业变革是平台的迭代,例如从PC到移动端就是一个平台迭代。假如我们没有从PC到移动端这个前提,直接从移动端切入到AI,把AI作为一个主流的流量入口,这是比较困难的。
当然,AI的发展不仅仅在于平台切换。我们现在智能家庭或者物联网本身是一个分布式或者离散式的平台,迭代可能会把这个平台本身去中心化,这也可能会给AI一个入口或者流量的机会。
从个人角度来看,在现在创业者找到一个合适的行业,充分了解这个行业的需求,能够看准这个行业在某个时间点产生变革,变革是什么,然后提供2B的服务,可能会比等待一个平台迭代的周期去突击2C的机会要更快或者更容易。
七
主持人:第七个问题,您自己创业的时候是怎么选择方向的?
孟醒:第一家公司我们是把人脸识别、物理检测和场景识别打包,通过获得API向第三方公司输出技术。这种模式可以理解为我们的商业模式是建立在别人商业模式的基础上,也可以理解为2B,我觉得更形象的应该是2D的商业模式。选择这个模式是因为第一次创业,没有考虑到这个模式的天花板在哪,当时觉得这个模式有价值,马上找人去把这个产品开发出来,第一次就是以这样的方式来做产品。
这个模式很快就遇到瓶颈。我们发现这个模式只能拿到没有资金或者付不了钱的小客户的生意。稍微大一点的客户对安全性有要求,因此我们不能用通用模式去做。而如果做定制,这件事情的周期又比较长。我可能需要再做一个demo去把一个客户谈下来,这跟传统的软件销售有点类似。
第二家公司的核心模式是在互联网上通过图像识别的方式去挖掘数据来变现广告费。这时候我们已经不再给其他公司提供图像识别服务和技术,而是想在互联网上所有存在图片的位置上去理解图片本身。就是不光知道图片里面有谁、有没有脸、有没有车、有什么背景,或者这些相对的位置在哪,而且还要知道他们对应的一些形态,通过这些我们想在图片里植入一些信息比如广告,我们考虑用什么样的方式、什么样的背景或者什么样的形态去植入,不会影响用户他们浏览图片本身的体验,同时使用户被这个广告影响到。
所以我个人经历也是一个迭代的过程。第一,如果我们以后再去做人工智能方向创业的时候,一定不能赌别人的业务是否能够跑起来。如果你做技术输出这件事,很大程度上是在赌你客户的业务能不能跑起来,跑起来也许你能够分到一杯羹。所以我觉得应该在更大程度上把商业模式掌握在自己手里,自己去做垂直领域的应用。同时,我觉得在国内不像在海外有那么好的退出环境,如果你长时间没有改善效率或者获得收入,长期经营很难支撑下去。所以提供技术服务总体来讲不如做自己的应用那么性感。
八
主持人:第八个问题,中国人工智能的核心科技研究发展与国际领先水准比较如何?
孟醒:先澄清一个概念,中国的研究发展其实可以从两个角度来理解:一个是说中国人本身在人工智能核心领域的研究发展,第二个是说国内的中国人在这个方向的研究发展。
如果把中国人作为一个整体来讲,从视觉领域去看,基本上已经占领了视觉领域相当大的份额。2015年在CVPR(计算机视觉三大会议里面的一个最大的会),我当时随便挑了一些论文,大概有20-30篇,作者里面没有中国人的paper也就不到4篇。这个会基本上是这个领域最顶级的会议,这里面所发表的学术论文90%都是由中国人参与,甚至都是中国人主导的项目。
同时在这些会场里看到的也都是中国人。近几年有这样一个趋势:以前绝大多数是海外华人(当然海外华人成长也是最近几年起来的),慢慢这几年你会看到国内越来越多的研究专家跟世界同步接轨,也参与到这些研究里来,在顶级期刊上发表文章。因为在国内的院校像清华、浙大的一些老研究员和教授培养了一批在这个行业里面非常顶尖的学生,这些学生在海外一线院校都做出了很不错的业绩。
反过来讲,纯粹在国内而没有海外经历的研究人员,在顶尖或者在非常前沿的算法上可能还是和国外专家有差别。我说的这些差别都是非常短期的,因为这个事情在改变。但是我们创业的时候,通常会把算法团队放在海外,哪怕贵一点,也会优先从海外招人。当然国内也存在着很厉害的人,但是我们招聘的成本可能要高很多,而且这些人会被更大更成熟的企业更早地招走。
九
主持人:第九个问题,现在大公司都在发力人工智能,创业公司还有机会吗?人工智能创业公司应该如何考虑退出?
孟醒:先回答退出的问题,国内的人工智能创业公司退出是一个非常大的问题。因为我们到现在为止还没有建立起一个像海外那样,为了得到优秀的技术团队而去收购一家公司的环境。这基本意味着我们的创业公司要么做出现金流,要么被海外公司投资或者收购。
在创业公司退出很严峻、同时大公司也在发力的双重考验下,我觉得如果创业公司坚决朝着2B这个方向去尝试,找到一两个比较合适的垂直行业深扎到里面,前景还是非常广阔的。垂直行业里面的需求多种多样,甚至有很多看起来非常简单的东西,经过算法的改造之后会有很大的提升空间。
很多公司上来就做终极挑战,去做开放式人机交互,做聊天机器人,或者去做陪伴机器人。其实合适的应用场景可以很简单,比如微软前天发布了一个应用,跟某家快餐连锁做drive through人机交互的自动化。
Drive through就是你开车经过麦当劳类似的快餐店时候不用下车,摇下车窗在一个话筒前面点餐,然后再在另一个窗口前面取餐,全程都是开车的,节省时间。原来这项工作需要两个人做,一个负责记录点餐,一个负责在窗口备餐和收费。现在微软这套系统把点餐这块完全替代了,难度相对并不是那么大因为输入场景很固定。这是一个标准的极大的存量市场,都没有用户教育成本,技术难度和执行难度都比较合理。
我觉得这种单个的想法不一定能支撑起一个特别大的公司,但是由于类似这样的点非常多,例如围绕快餐行业进行交互学习,因此从核心需求点这个角度切入,我觉得能够支撑起若干家比较大的公司。这就像以前我们做O2O的样子。
互联网大公司也都在发力,而且在流量上占有领导地位,但是它很难做到在每一个垂直领域做的非常深,因为这本身不是他的核心业务。同样,在人工智能领域,大的公司我觉得会在建设语音、语意等基础的识别上发力,之后可能会去开源,而且将来开源的算法会达到相当好的程度。
特别大的公司不可能针对每个垂直领域都开发出特别适应的方式和产品。
十
主持人:第十个问题:以下几个领域,您选择其中一个或两个具体分析一下吧。领域如下:聊天机器人+智能助手;人工智能在农业、医疗、工业的应用;3D场景重建;自动驾驶领域。
孟醒:那就聊聊最近非常火的聊天机器人这个领域。我们团队基本上体验过所有市面上的产品,中文的、英文的,大公司开发的如Google的和Facebook的各种机器人、到国内我们做的各种机器人,人工的、半人工的,以及完全机器去做的。
之前我说过,我觉得懂得AI的产品经理非常重要,因为他需要知道技术的边界在哪,才能定义这个产品。
我觉得如果你的定位是开发一个人工机器人助理,目前来看,绝大多数公司产品都在解决头部问题。因为头部问题有量,有量才能培养人的习惯,也能培养机器的习惯。所以现在都在解决量的需求,例如打车、订咖啡,还有一些相关的比较容易去解决或者频率非常高的需求。
我认为在头部需求中用聊天对话这种方式去解决不是最优的切入点。原因是所有这些头部需求早就已经有非常合适的垂直应用来解决了。
举个例子,打车这件事情,如果我的起点终点比较固定,比如永远是从公司到家,你用哪个App打开去做,可能没有太大区别。也许区别就在于对话节省一点时间,但是你稍微去控制一下定位就可以解决,比如我今天是从东门出来,而不是从西门出来,滴滴可能是把那个针扎到东门而不是西门。
为什么滴滴的App做成了这个样子,而不是你直接打开以后就可以有一个语音对话窗口,这是它本身产品思考决定的。所以我觉得头部需求既然量很大,就有值得去为它做优化的地方,而不应该是统一,所以它的UI更适合分别优化。
反过来讲,其实长尾需求反而是适合做AI的。什么是长尾需求,就是我非常少提到的东西,比如我突然想改一个戒指,我想知道在哪有可以改小一号的工匠。
解决长尾需求成本是非常高的,尤其用机器的方式解决。但是只有当你向机器人提出这样长尾的需求,他同时帮你解决的时候,你才能够获得足够大的价值。甚至于,我觉得真正成功的机器人服务是不应该用祈使句作为主要交互方式的。
这点跟搜索是一样的,搜索做的就是把长尾需求聚拢。这里的搜索肯定不是大众点评搜索出来餐馆或者机票,而是我们想搜出来某一个我们不知道的公司或者某一个人,我想看看它的背景,其实这些是非常低频的事情,但是攒的足够多就会造成一定的需求。
我觉得我们可以开发出像搜索引擎一样提任何需求或者长尾的问题都可以解决的机器人,这个技术难度过于大。人很难成为所有领域的专家,但是成为一个领域的专家相对是比较容易的。对应的,我们应该把助理升级为一个专家,把他聚焦在一个垂直领域的专家。从语意上来讲,我觉得他的输入和输出对应的范围是相对比较垂直的、固定的。
我在美国看过一家比较有意思的公司,公司不太知名,叫STATMUSE。这家公司主要做的是NBA体育数据库,他把整个NBA体育数据全都爬下来了。你可以向他提任何相关的数据问题,比如我想知道“在姚明的职业生涯中,第一次跟奥尼尔交锋时得到多少篮板”。这是一个长语句,而且它本身是一个非常开放的问题,你把他这句话扔到Google里面很少能够回答上来,因为很少有人去提这样的问题,这样的样本并不多。
公司在这个领域做的很好,它对应的人群是两种:第一个,是赌球的人,他们对数据的需求极其旺盛,尤其是做FANTASY体育的时候,完全是靠数据来判断输赢的方向,而且他们拍脑子就能想出我需要什么样的数据,但是很难用一个既定的UI或者用户交互界面来得到他们想要的那些通过复杂的筛选方式获得的数据,用自然语意就可以得到,这就是一个专家所带来的价值。
第二个方向,就是他们为体育解说做及时的反馈。例如我做解说的时候,看到一个球员投了一个球,我想说他已经连续三场比赛在第三节投的第一个球很准,这个数据怎么来,很难让一个人在现场搜索这个数据。而机器人能在我想到以后马上就搜,搜完之后能马上告诉我,这个是一个很有价值的方向,所以他跟ESPN签了一个很长的和约。
我觉得这两件事加一块,这个市场就足够大了。赌球那个市场很大,而且代表的是一个有规律的、足够垂直、足够深的市场。我觉得在这个垂直领域的公司其实比一个通用的公司更有价值。