携程Q3大“赚”,但还能更“赚”
携程Q3大“赚”,但还能更“赚”
无锡新晋独角兽吉姆西启动IPO
无锡新晋独角兽吉姆西启动IPO
较劲的Q3:乐观者李斌,“史上最强”何小鹏,李想开上法拉利
较劲的Q3:乐观者李斌,“史上最强”何小鹏,李想开上法拉利
捷豹重生改命,LOGO大变样,马斯克:你们还是卖车的吗
捷豹重生改命,LOGO大变样,马斯克:你们还是卖车的吗
立即打开APP
王非
私信
0
来源:科大讯飞

左手算力、右手星火,科大讯飞加速大模型落地应用

2024-01-31
行业研究 上市公司
不到100天,讯飞星火大模型再升级。

来源:猎云精选,文/王非

科大讯飞,又有新动作。

1月30日,科大讯飞的星火认知大模型V3.5升级发布会如约而至,发布了多个“首个”:国内首个全国产算力平台“飞星一号”完成首秀,首个基于“飞星一号”训练的全民开放大模型讯飞星火V3.5正式亮相;国内首个语音大模型“星火语音大模型”发布;深度适配国产算力的讯飞星火开源大模型“星火开源-13B”发布;昇思开源社区联合首发上线……

科大讯飞董事长刘庆峰在发布会上称,“2024年一定可以实现星火燎原,通用人工智能不仅能够在中国各大领域深度而广泛应用,而且我们在源头技术创新、在大模型的底层能力上也会站上全新台阶。”

科大讯飞董事长刘庆峰

事实上,凭借自身多年在人工智能领域的钻研经营和投资布局,科大讯飞早在大模型元年,就已摆出“先行者”的姿态,在去年5月发布讯飞星火大模型后,并不断优化迭代,在去年10月发布了星火大模型V3.0后,仅用90多天便完成了讯飞星火V3.5的重磅升级。

整个2023年,“百模大战”如火如荼。然而,技术的进步终究要落地到用户端、产业侧。业界的普遍共识即是,2024年将会进入大模型应用元年。

于是在展示最新技术的同时,对于先进技术产品如何在B端、C端、G端落地呈现,科大讯飞也通过一个个案例,预演了未来。

不难发现,科大讯飞已然以“领跑者”之姿,将2024年的发展蓝图清晰展现。

不走容易的路,携手华为杀出条血路

如果说大模型开源与闭源,各有优劣。那么,算力底座的选择,则攸关生死。

2023年10月17日,美国进一步收紧对尖端人工智能芯片的出口管制。另据路透社今年1月26日报道,美国商务部长吉娜·雷蒙多称,美国正在“尽全力阻止中国获得其想要用来训练本国人工智能模型的算力。”她还表示,拜登政府将提议要求美国云计算公司确定外国实体是否正在访问美国数据中心以训练人工智能模型。

不难看出,大模型的发展前路,注定坎坷崎岖。而早在2019年、2022年就两度被列入美国实体清单的科大讯飞,也早已开启了“B 计划”。

据刘庆峰透露,2023年以来,科大讯飞与华为成立认知大模型算力专项工作“联合特战队”,半年内即实现了基于华为昇腾的星火大模型训练和推理效率翻番,标志着大模型训练已经完全切换至国产算力平台,率先实现大模型核心技术底座自主可控。

在2023年10月24日的“科大讯飞全球开发者节”上,科大讯飞联合华为正式发布了基于昇腾生态的“飞星一号”平台,这是国内首个支撑万亿参数大模型训练的万卡国产算力平台。双方的通力合作,可以说硬生生杀出了一条血路,为大模型的发展提供第二种选择,艰辛但却意义重大。

凭借于此,在“科大讯飞全球开发者节”上发布星火大模型V3.0版本不到100天后,科大讯飞对标GPT-4的更大参数规模的讯飞星火V3.5正式升级发布。

据刘庆峰介绍,讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

随后,刘庆峰从全新赋能万物互联时代人机交互、全新赋能知识学习与内容创作、全新提升数智化生产力三个方面,展示了讯飞星火V3.5的能力提升。

以人机交互为例,讯飞星火V3.5不仅在语义理解、指令跟随和多轮对话的演示中,展现出优异的能力,更是在情绪感知和拟人合成方面表现出色。

在实操演示环节,科大讯飞研究院院长刘聪和讯飞星火V3.5进行了现场互动。在“尔滨旅游热”的背景下,讯飞星火V3.5不仅能说一口地道的东北话,还能快速定制旅游攻略,并在春运机票紧俏的当下,催促刘聪赶快买票。

科大讯飞研究院院长刘聪和讯飞星火V3.5现场互动

由此可见,讯飞星火V3.5不仅能够帮助用户带来解决方案,还能作为“知冷知热”的朋友,带入情绪互动,超高的拟人度让大模型更具人情味。

刘庆峰表示,“讯飞星火V3.5能力的提升,已经达到了量质齐飞的关键点。”2024年讯飞星火认知大模型的应用,一定会在越来越多的场景和领域中大放异彩。

更上一层楼,国内首个语音大模型来了

自1999年成立至今,智能语音起家的科大讯飞,创业25年持续走在世界前列:

2006-2019年,连续十四年荣获国际语音合成大赛冠军;2016-2023年,连续4届获得国际多通道语音分离和识别比赛CHiME冠军;2021-2023年,连续三年获得国际语音翻译比赛IWSLT冠军……

刘庆峰表示,“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们目标和梦想一天都没有变。”

大模型,不只是带来了语音技术发展的全新计划,也使得科大讯飞在语音领域的优势,“更上一层楼”。

刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”

伴随“飞星一号”完成首秀,发布讯飞星火V3.5,科大讯飞也正式发布了国内首个语音大模型——星火语音大模型。

据介绍,星火语音大模型在中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3。而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

刘庆峰介绍星火语音大模型

值得一提的是,星火语音大模型的能力升级也将应用于C端硬件产品。据介绍,搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷,增强式翻译技术让翻译机化身AI翻译助手。

据悉,此次讯飞翻译机多语自动识别升级,将支持35种语言,为跨语言沟通提质增效;增强式翻译提供中英双语服务,让跨语言交流更加省心。

不止助力国际沟通,星火语音大模型还将赋能更多场景,更多实际应用。

据刘庆峰介绍,在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互变革。

以汽车产业为例,智能驾舱、智能座舱、智能导航、音乐控制等交互体验将进一步优化。此外,陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业,亦是如此。

大模型应用元年,“应用才是硬道理”

刘庆峰强调,“大模型发展,应用才是硬道理。”面向2024年“大模型应用元年”,科大讯飞也通过实际案例的展示,向外界展示,自己已然积累了足够多的经验,做足了规模化落地的准备。

教育先行,让孩子站在人工智能肩膀上

大模型首先赋能的场景,就是教育领域。例如,科大讯飞此前发布的AI学习机,被誉为“让孩子站在人工智能肩膀上学习”,能够提高学习效率、激发学习兴趣、提升综合素养。凭借于此,该产品用户净推荐值(NPS)持续保持行业第一,并获得例2023年京东&天猫双11销售额冠军。

1月30日,科大讯飞最新推出的星火智慧黑板,更是具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享四大功能。例如,在立体几何等知识的教学中,它可以通过解构立方体,将枯燥的理论视觉化,教学课堂更加生动有趣。“黑板不再是简单的板书工具,而是跃迁成为教师的AI助手。”刘庆峰说道。

刘庆峰介绍星火智慧黑板

办公硬件与个人应用双管齐下,让工作更高效

其次,星火大模型也在持续赋能办公硬件。自去年5月讯飞星火正式发布起,有超过60万讯飞智能办公本、智能录音笔用户累计调用语篇规整、会议纪要、自动写稿等能力650万次,让工作更高效。

而在软件应用层面,目前讯飞听见、讯飞星火APP、讯飞输入法等应用,已累计赋能亿万用户。在星火大模型赋能下,越来越多的用户拥有专业AI助手。一位浙江的小学老师,使用智能问答高效完成教学方案设计,已累计使用APP262天、超2300篇;一位湖南的“情感咨询师”,通过大模型咨询人际关系等生活中的烦恼,现已累计使用161天、超9500次……

此外,在内容创作方面,星火大模型也在助力内容创作者高效生产:音视频创作工具“讯飞智作”自去年8月15日发布以来,新增了21万会员用户,生成了160万音视频内容;图文创作工具“星火内容运营大师”自去年10月24日发布以来,已服务了5000+企业,生成了超150万篇文章。

赋能千行百业,助力多个领域刚需应用提质增效

“一个人走得快,一群人走得远”,深谙此道的科大讯飞,也在1月30日正式发布星火开源大模型“星火开源-13B”,深度适配国产算力,助力开发者、高校、企业自主研发。

目前,在讯飞开放平台之上,大模型总开发者超35万,其中企业开发者超22万。“所以我非常自豪,讯飞星火大模型的开发者数量,在中国是最高的,而且用户口碑非常好。”刘庆峰说道。

开源只有更多的场景落地,才能更好地增进生态合作。据刘庆峰介绍,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。

在此基础上,科大讯飞也在加速赋能各个行业的头部企业客户,如汽车行业的奇瑞、金融行业的太平洋保险和交通银行、通信行业的中国移动等。

以科大讯飞与中国移动的合作为例,在赋能“5G新通话”方面,中国移动携手讯飞星火推出5G新通话创新应用“商务速记”,能够实现通话语音同步纪要,关键事项精准提炼,且无需下载APP,所有手机都支持。

此外,为加速企业大模型应用价值落地,讯飞星火V3.5还将提供全栈自主可控的优化套件。基于全国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。

2024年:星火相传,星火燎原

展望2024年讯飞星火大模型发展,刘庆峰指出三点:

“首先,一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。

“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”刘庆峰指出。

“第二,2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越。”

“第三,高楼大厦要建立在安全可控的平台之上,我们要实现自主可控平台上的生态繁荣。”刘庆峰表示,自己有信心,能够实现从算法、数据、应用场景到算力,构建一个完全自主可控的繁荣的人工智能生态。

刘庆峰认为,“通用人工智能大未来刚刚开启,它必将深刻改变世界的未来,需要顶天立地的长期主义精神。”顶天,指的是希望源头核心技术在底层大模型能力上向国际最先进的能力看齐;立地,指的是大规模实现产业化。而这也是科大讯飞自成立起就一以贯之的信仰,需要在长期主义精神指引下推进各方面工作。

或许,可以用八个字来简单概括:“星火相传,星火燎原”。

猎云网APP阅读全文

体验更加

猎云网

微信扫码关注猎云网

  1. 猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权;
  2. 转载时须在文章头部明确注明出处、保留官方微信、作者和原文链接,如:转自猎云网(微信号: lieyunjingxuan )字样;
  3. 猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
  4. 联系猎云,请加微信号:jinjilei
猜你喜欢
长按图片可以分享给好友
×