本文转载自合作方:投中网,作者:刘燕秋。猎云网已获授权。
去年12月,我第一次关注到ChatGPT,当时它在不到一周内用户破百万,海内外一小撮科技爱好者开始热情地谈论这个对话机器人。我以为它会像元宇宙,像Clubhouse,像我追过的大多数热点一样,很快过期,消散在新闻尘烟中。未曾想到两个月后,国内掀起人人谈论ChatGPT的热潮。就在我开始写这篇文章的日子,ChatGPT概念股再掀涨停潮,三六零涨停,哪怕这家公司已经在前一周声明,目前的技术水准只能做到略强于GPT2.0。
股民在狂欢,业界在反思,“中国OpenAI”成了一面新旗帜。大厂之外,王慧文携顶级VC入局让沉寂许久的创投圈再度热闹了起来。带资入场的老王对人才提出了三条要求:业界公认顶级研发人才;狂热相信AI改变世界;坚定确保AI造福人类。几天后,一张流传的朋友圈截图上,智源副院长刘江宣布加入王慧文团队,感慨“此生有幸,能够参与这么伟大的事业”。
一位投资人朋友对我讲,VC去王慧文那里目前就是“拿号”,只能沟通希望投入的资金额度,但没有定价,也就是说钱要承诺投出去,能换多少股份?不知道。按照最新的消息,这位前美团高级副总裁筹集的承诺投资额度,已经超过了3亿美元。
他的即刻主页签名也换了,目前是“正在学习人工智能”。
追忆起来,上一波洋溢着这种“改变世界”热情并且不吝高举高打的,还是移动互联网时代的创业者和投资人。ChatGPT的火让共识迅速达成,对风口和趋势的敏感,已经让他们当中的一些人躬身入局。
“比起过去两年的元宇宙和Web3概念,这一波AI的概念更能够让大家感同身受,由此带来的是更加清晰、长远和深刻的变化。大语言模型是一个可能跟移动互联网相当级别的事情,中美大公司都在全力入场,我知道国内很多互联网大佬级人物也都在思考如何驱动自己的公司进行研究和变革。”真格基金管理合伙人戴雨森告诉我。
一些人更早看到了趋势。我想起去年9月,红杉美国的两位合伙人在一篇题为《Generative AI: A Creative New World》的文章里曾预判:“正如移动设备通过GPS、摄像头和网络连接等新功能释放了新类型的应用程序一样,我们预计这些大型模型将激发生成式AI应用程序的新浪潮。就像十年前移动互联网被一些杀手级应用打开了市场一样,生成式AI的杀手级应用程序也会出现,比赛开始了。”
比赛开始了。面对新浪潮,真格的态度是“All-in”。在不久前的内部会上,这位管理合伙人放言:“回到乔布斯刚刚发布iPhone的时刻,当年的任何一家VC基金,有多少投资人去看移动互联网项目都是不嫌多的。”但已经有人质疑王慧文入场的时间,为何早不做晚不做,刚好是在ChatGPT最火的时候站出来了。
当我把“时机”的问题抛给戴雨森,他尝试用移动互联网的时间尺度来界定这个问题。“你不会说苹果发布iPhone两个月后入场的人来晚了是吧?我觉得现在就是未来10年到20年的周期里刚开始的那两个月。”
真的,这种理由,这种热情,这种关于“时机”的问答套路,都和前几年我在互联网投资报道里见到的一模一样。甚至行家们也都在用“月活、流量、用户数”这套你我熟得不能再熟悉的框架在解构ChatGPT,我的同事曹玮钰同样提出了这样一个问题:ChatGPT能让TMT投资“借尸还魂”吗?
大模型的想象空间
ChatGPT的爆发节点,一定是和“问答”这个应用场景有关的,换句话说,是和它在C端流量的爆发紧密相关。毕竟,这是AI界第一次免费向公众提供如此强大,而使用界面又如此友好的工具。
在追逐潮流的人眼中,ChatGPT的吸引力在于,可以回答很多开放式问题,并以“高情商”的对话方式与你交互。比如,你可以和它聊聊人生哲学,探讨一下生命的意义,或是找它寻求追求真爱的建议。
在关心技术和行业的人看来,跟上一代自然语言处理(NLP)相比,ChatGPT背后则是AI技术范式的变化。和机器视觉、语音输入等专用人工智能相比,ChatGPT更让人看到通用人工智能(AGI)的曙光。
明势资本合伙人夏令告诉我,GPT系列里真正的标杆性变化其实是2020年的GPT-3,它代表着基于一个语言模型能实现众多不同任务的通用人工智能(AGI)雏形的诞生。后来在此基础上又引入人类反馈和安全性的对齐研究,人们的直观感受就是可以用自然语言与ChatGPT对话,而ChatGPT的回答“智商”和“情商”很高。
从产业的维度看,ChatGPT背后的大型语言模型(LLM)被视为新一代人工智能的基础设施,它通用能力强,可以完成多场景任务,提高脑力劳动效率。夏令告诉我,以前的AI公司需要根据不同的任务训练出不同的模型,AI公司越商业化越像一个项目型公司;而新一代AI公司可以一个统一的大模型直接应对不同的任务,模型开发门槛高,但后续实现不同任务的开发工程量大幅下降,AI公司的商业模式发生变化。加之用户在环、用户反馈对底层模型迭代异常重要,新一代AI公司有机会也需要直接面向用户提供产品和服务。
Magi 创始人季逸超开发过基于机器学习的搜索引擎,现在正参与一个名为Open Assistant的开源项目,其目标是让更多人有机会使用类似ChatGPT的对话式AI。谈及在国内AI创业的挑战,Peak告诉我,过往AI在一个行业能不能落地,往往要看这个行业有没有足够多的有标注的数据,而有标注的数据很贵,所以过去AI公司往往会盯着金融、医疗等少数几个“有钱有人有数据”的领域在做,很多细分市场没能享受到AI带来的数字化转型。
ChatGPT让他看到一种新的可能性:不需要为一项任务单独调整模型,利用静态的模型也可以达成一项全新的任务。“ChatGPT跨行业对话的效果是惊人的,在这套新范式之下,原来没被AI惠及的蓝海领域都有可能被惠及,ChatGPT可能成为一个新的底座,会有更多建立在它的生态之上的创业公司出现。”
戴雨森看到的商业价值则在于,跟之前的AI创业公司相比,ChatGPT为代表的AIGC可能应用的领域更加广阔,且对技术精确度要求低很多,存在很多技术做到80分就可以去做的空间,由此大大加速商业化进程。他以自动驾驶为例对比了这种不同。“每年国内外在自动驾驶上投资超过几百亿美元,但即使技术可以拓展,用户场景还是相对单一,必须做到非常高的准确度才可以用。相较而言,绘图、生成文字等内容生成领域对准确性的要求往没有那么高,现在就可以用起来,带来娱乐价值甚至是商业价值。”
此外,上一波AI创业中的典型场景如人脸识别还是更2B的场景,普通用户难以直接体验,但是现在的AIGC公司可以直接提供ChatGPT、MidJourney这样的用户端产品。“通俗来讲,它像其他成功的一些互联网产品一样,具有很低的使用门槛,让人耳目一新的效果,以及很强的传播性。”
换句话说,过去,我们经历了移动互联网的黄金十年,开掘了O2O、移动支付、短视频等典型场景。如今,以ChatGPT为底座,徐徐展开的是等待填充的AI时代的应用场景。“我觉得ChatGPT带来的这波变革可能比移动互联网时代的还要剧烈,互联网带来的只是效率的提升,AI是能提升生产力的。”中科创星创始合伙人米磊告诉我。
如此看来,想象空间已经有了。
“国内真有像样的企业吗?”
机构们已经闻风而动。按我一位朋友的观察,原来看消费、看出海的投资人,现在又都一股脑看AIGC了。
“国外已经跑通了这个方向,中国最擅长的就是追赶超越。”米磊说。
某美元基金合伙人表示,现在手里已经有产品的,靠大模型训练能立刻产品化并且有实际效率提升功能的团队,一开始会比较占优,他们有几个portfolio最近已经加码。
据我了解,多家美元基金最近在都关注一个叫Glow的AI社交产品。和AI聊天,这不算是新的应用方向了,但借着AIGC的风潮,已经有从业者戏称其为“本年度最卷赛道”。“随着ChatGPT的API即将开放,很多公司都会想成为它的应用层,不管是用在做聊天社交,还是客服、游戏、互动小说和营销,都会有它的应用空间,类似于Jasper的中间层公司会越来越多。”一位AIGC创业者告诉我。
真格过往投了不少AI公司,戴雨森透露,这些公司都在积极拥抱新技术。我们采访的这天下午,他计划见一个独角兽AI公司的创始人,对方正考虑彻底转型到大模型的路径。
第一波敏锐的创业者已经开始考虑第一波应用的理想场景。戴雨森认为,做能快速反应、各行各业都懂但又没有那么精确的个人助手,或许是一个很好的定位。海外,在Google准备应对ChatGPT带来的挑战时,一些初创公司已经推出了You.com、Perplexity AI等具有对话式AI或智能总结能力的搜索引擎。但在戴雨森看来,AI颠覆搜索引擎还为时尚早,ChatGPT目前无法进行数理计算,而且提供的很多信息存在错误。“所谓生成式AI,重点是在生成上,这和搜索引擎强调的信息取回是很不一样的任务。”
在他看来,当苹果刚发布iPhone和App Store的时候,最初推出的很多App并没有太多用处,只是让人觉得好玩,往往也不一定能够活到最后。但一方面,应用如果能够留存用户资产,数据资产,品牌资产等,是有可能做大的。比如,在移动互联网早期有很多人做滤镜工具,最后大部分都消失了,但Instagram成为最后的赢家。另一方面,在早期就入局的创业者会积累宝贵的经验,在后续的尝试中会更加有竞争优势。与此同,他关注到,像Jasper这样基于GPT-3在某个具体领域发展起来的应用层公司已经有超过1亿美金的ARR,初步验证了商业模式的可行性。
他认为,AI行业未来也许会出现类似互联网领域的平台加应用的生态。也许大模型不是语言模型的终局,但如果按照现在大家看到的最佳时间,大模型作为底层的基础设施,随着数据越来越大,参数越来越多,训练需要的算力和成本越来越高,它可能就会变得越来越类似于公有云的商业模式,具有非常高的天花板和很强的壁垒——它是一个底座,大家进行fine-tuning(微调),针对不同的细分领域开发应用场景,这就跟在公有云上做应用类似。
在ChatGPT引领的新浪潮之中,明势资本主要关注三类公司:一是像OpenAI一样专注于大模型的公司;二是既做大模型,又做直接应用垂直一体化的公司,如Midjourney;三是调用大模型API的公司,基于大模型重点开发具体场景的AI应用公司,如Jasper。
这三类公司过去两年在海外快速涌现,夏令相信在国内也会看到类似的局面。“创业公司和大厂里肯定都会有几家做大模型的公司出来。我相信大厂还会有自己的位置,但这并不意味着当中就没有创业公司的机会。”
在他看来,处于早期阶段的创业公司,要想获得投资人的垂青,以下核心能力至少要具备一项。要么,你的技术和工程化能力得特别强,比如能够更低的成本和更高效的迭代做出先进的大型语言模型和反馈模型。要么,你得对C端用户或者B端场景的需求有特别深刻的洞察,知道怎么把痛点跟AI技术结合,打造很强的产品力。
然而,今天国内业界的实际情况是,大多公司两者都不沾边。“有能力自研大模型的公司很少,大多数要么基于开源模型做二开,要么做prompt engineering(提示工程)。如果是能够应用好现有AI技术也是可以的,但需要想清楚可用的AI技术要解决的是何种场景之下的刚需问题。”
2022年曾短暂地涌起过一波AI绘画热。海外,这个赛道甚至已经跑出了独角兽。去年10月,AI绘画平台Stable Diffusion背后的Stability AI宣布获得1.01亿美元投资,投后估值攀升至10亿美元。Stable diffusion是一个开源模型,人们可以基于它进行快速二开,推出自己的模型产品。技术上的差距仿佛被拉平了,但夏令关注到,国内的优质的AI生成图片公司仍然很少。“技术远没有成熟,今天技术只是刚刚与商业化搭了个边。AI生成图片效果最好的Midjourney不开源。国内公司探索商业化的难度不小。”
夏令的观察在另一位来自某双币基金的投资人Jack那里也得到了验证。去年我写的一篇AIGC的报道吸引来Jack找我交流项目情况。最近我询问这位朋友的近况时,他告诉我已经很久没关注AIGC了。去年,他看了不少依托于Stable diffusion 和Disco diffusion起来的国内AI绘画企业,但看完感觉挺失望,一个都没投。他倒是觉得国内能投的点不在于模型是不是自研。按他的话说,开源了直接能用也行啊,还是得综合看后面的产品。
“但关键是产品也不行,国内企业的产品力距离Midjourney越来越远了。”这位投资人最近在忙着看新能源的项目,得知我的选题,他好奇道,ChatGPT这波,国内真有像样的企业吗?
“就像《三体》里质子把人类科技锁死一样”
“国内能做大模型的创业公司,一只手数得过来。”这是我最近听到的说法。
智谱华章是国内较早进行大模型研发的公司,其前身是清华大学知识工程实验室。今年,智谱华章提供近千张A100,联合清华几个实验室一起训练出了GLM-130B,这应该算是国内唯一一个可与GPT-3基座模型对标的开源双语模型。
“ChatGPT的横空出世和惊艳表现表明我们在大模型上的研究还存在代差。”智谱华章负责人在给我的文字回复中言辞诚恳。他提出:一方面,要静下心来,认真思考我们差距在哪里,另一方面,我们也留意到ChatGPT也存在一定的不足,例如常识缺失。
ChatGPT在回答一斤羽毛和一斤木头谁重的时候会出现逻辑错误。究其原因,OpenAI训练的每一次进步都是算法+数据巧妙设计的结果,但这些训练过程都没有考虑常识知识的加入。基于此,智谱AI在大模型中加入记忆模块、加入基于self-instruct的自我反思机制。
有从业者告诉我,智谱AI的技术水平相当于给国内盖了一个明确的时间戳——我们现在落后美国大概两到三年的节奏。在原创大模型开发方面,他更看好两类公司,一类是百度、字节等商业大公司,一类是智谱华章这样的国资背景的研究所。
若讨论追赶,首先不得不提的是高昂的训练成本。Peak告诉我,GPT-3时代进行一次完整训练的成本大概是400万美元,但一方面,大模型很难一次完成,另外,除了训练阶段,线上的推理阶段价格也非常昂贵。中美在语料质量上的差异也是需要解决的问题。
此外,当前OpenAI的GPT对中国禁用,英伟达的A100等高端芯片对中国禁售,是国内公司在做大模型过程中面临的两大挑战。
正是基于此,米磊认为,相较于大模型所代表的基础设施创新,AI芯片为代表的底层硬科技的突破更为关键。米磊用“乱拳打死老师傅”形容这波AI技术进展——它相当于在算法进展不大的情况下纯粹堆算力和数据的产物。事实上,在ChatGPT火爆之前,并没有太多人看好大模型这条路径,但按这一模式继续下去也可能会再度遭遇瓶颈。
“大模型当然值得关注,但没有AI芯片来训练,开发大模型就如同无本之源。这就像《三体》里质子把人类科技锁死了一样,你能怎么办?”
在此形势下,要想做出中国的ChatGPT,没有捷径可走。
ChatGPT的工程化能力也不应被忽视。一位AIGC从业者曾与我分享Meta首席人工智能科学家LeCun对ChatGPT的看法,认为那能代表业内很多人的观点。LeCun认为,与其说ChatGPT是一个科学突破,不如说它是一个像样的工程实例。当我把这个问题抛给Peak,他同样认为,ChatGPT的成功,算法跟技术方面的原因可能只占到40%左右,甚至60%的成功是在工程方面。
根据瑞银集团2月发布的未经证实的数据,截至今年1月,ChatGPT的月活跃用户数预计已达1亿。“ChatGPT的用户量呈爆炸式增长,而背后的模型能同时服务这么多用户。我不知道OpenAI跟微软之间的分工是怎么样的,但就从它服务用户的容量来说,这也是一个革命性的产品。”
夏令告诉我,真正的难点倒不是钱。以他掌握的信息来看,国内训练模型的成本方式远比openAI低,挑战在于,大模型从业者需要以工程化而不是学术的思维推进底层大模型研发。“学术思维往往着眼于单点最优,比如参数量最高,而工程的思维则要求你能基于场景需求在成本、规模和效率之间做成正确的权衡取舍,AI领域能做到这一点的人当下在国内很稀缺。”
ChatGPT当然是个风向标,但对于今天的投资人来说,如果不能理解从底层技术到工程落地到产品之间的巨大鸿沟,只简单复制过去TMT投资用密集资本推高项目估值的玩法,那无疑将是“中国Open AI”的遗憾。
泡沫和啤酒
最近我看到一位投资人在朋友圈感慨,资本对科技行业其实没那么重要,因为在真正的技术和商业天才面前,资本从来都是蹭蹭上车的。我同意后半句。但资本显然也很重要,毕竟上车容易,保持足够的定力和耐心很难,毕竟谁也不能保证一路都是顺风车。
早在2019年,中科创星投资了智谱华章的天使轮。按米磊的说法,大语言模型是最近两年才摸索出来的方向,但在当时还没有人能清晰地预判未来。
米磊也看到了国内资本市场的一些问题,期待能慢慢推动行业理念的变革。“国外可以花很长时间磨一个大招出来,国内相当于练两个小招就下山砍柴去了,中国需要愿意支持创业公司十年磨一剑的耐心资本。我们希望行业里能够有越来越多真正有耐心的长期资本,也呼吁大家多多关注真正的硬科技。”
“我相信咱们国内不缺厉害的科学家,会有跟海外AI领军人物水平、视野和品味相当的人,但怎么能让这些人拿到长期的资金支持,这一点是很难的。”在跟我谈及国内做AI公司面临的现实挑战时,Peak也提到资本。
另一个现实掣肘是,如果你是一家做2B的AI公司,那可能从成立第一天起,客户就会对你提出定制和私有化部署的要求,这会驱使公司走上销售主导的路子。“AI公司都不想变成项目制,但AI公司谁不是项目制呢?”由此导致的问题是,创业者可能很容易被锁死在一个项目上,从而丧失水平探索的机会,久而久之会导致视野狭窄,技术落后。要知道,在科研领域,很多技术突破并不是靠深耕就能获得的。比如,最近一年AI在图像领域的进展其实得益于NLP领域Transform模型在图像中的应用。
技术、商业和资本,这三者之间的关系并不总是相辅相成。即使是专注科研的OpenAI,在商业化面前也并非岿然不动。2019年,OpenAI宣布重组,YC总裁Sam Altman正式加入OpenAI担任CEO。Altman解决了融资问题,但他让技术研发聚焦在更具商业价值方面的主张也导致了团队价值观的分裂。结果是,2021年,OpenAI前研究副总裁Dario Amodei带着数名员工离开OpenAI,成立了自己的研究实验室Anthropic。
故事还在继续。当微软多次加注OpenAI,谷歌除了紧锣密鼓地开发自己的模型,也向初创公司伸出橄榄枝。2022年底,谷歌向Anthropic投资了约3亿美元,由此获得10%的股份,这家公司的最新估值已近50亿美元(折合人民币300多亿元),而它的一款ChatGPT竞品还在测试,尚未上线。
戴雨森认为,在被ChatGPT重燃的AI行业,现在看到很高的估值和很疯狂的故事,也都正常。“对于新技术,我们总是短期高估,长期低估。从互联网诞生到现在,蹭热度的人还少吗?任何科技热点都会进入一个泡沫周期,但我觉得这次泡沫周期过后留下来的啤酒会比之前多。毕竟,有的泡沫退去之后,人们会发现原来根本没有啤酒,只有一个巨大的泡沫。”
(文中Jack为化名)