高开180%市值超130亿,“宁王”收获一个IPO
高开180%市值超130亿,“宁王”收获一个IPO
携程Q3大“赚”,但还能更“赚”
携程Q3大“赚”,但还能更“赚”
较劲的Q3:乐观者李斌,“史上最强”何小鹏,李想开上法拉利
较劲的Q3:乐观者李斌,“史上最强”何小鹏,李想开上法拉利
捷豹重生改命,LOGO大变样,马斯克:你们还是卖车的吗
捷豹重生改命,LOGO大变样,马斯克:你们还是卖车的吗
立即打开APP
韩文静
私信
0
来源:猎云网

腾讯正式发布向量数据库,用于大模型训练

2023-07-04
上市公司
向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

今日,腾讯云正式发布向量数据库Tencent Cloud VectorDB,预计8月上线腾讯云官网。

腾讯介绍道,该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

据了解,该数据库面向大模型训练,可以让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。

大模型的“黄金搭档”

什么是向量数据库?

向量数据库是一种专门用于存储、 管理、查询、检索向量的数据库,可以把复杂的非结构化数据通过向量化,处理统一成多维空间里的坐标值。

目前,向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

具体来看,向量数据库被广泛地用于大模型训练、推理和知识库补充等场景:支撑训练阶段海量数据的分类、去重和清洗,给大模型的训练降本增效;通过新数据的带入,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉;提供一种私有数据连接大模型的方式,解决私有数据注入大模型带来的安全和隐私问题,加速大模型在产业落地。

简而言之,向量数据库可以解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。

据第三方调研数据预测,全球向量数据库到2030年预计将迎来超过500亿美元的市场。国内也将以每年超过20%的速度在增长。目前全球已有的向量数据库产品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超过一半的向量数据库具有云化部署的能力。

提供10亿级向量检索能力

据介绍,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。

具体而言,腾讯发布的向量数据库有以下特点。

一是高性能向量存储、检索。腾讯云向量数据库具备高性能的向量存储和检索能力,单索引能够轻松支持10亿级别的向量规模。在分布式弹性扩展的架构下,单实例可支持百万级别QPS,AI场景下向量检索的P99响应延迟可控制在20ms以内,能够覆盖绝大多数AI场景对向量存储和检索的业务需求。

二是可视化数据管理。在向量存储、检索能力之上,腾讯云向量数据库还提供了可视化的数据管理界面,进一步降低向量数据库的接入和使用门槛。用户可以通过控制台进行数据库、集合层面的数据管理,还可以快速执行向量检索等常用操作。此外,腾讯云向量数据库还提供了可视化的数据上传能力,帮助用户快速构建专属知识库。

三是一站式向量检索方案。为了进一步提升产品的易用性,腾讯云向量数据库会提供一站式的向量检索方案,实现从文本输入到文本搜索的端到端检索能力,用户可以直接上传.pdf、.txt等原始文本文件,通过平台自动化地执行文本分割、embedding向量化,全托管地完成知识构建和检索任务。

腾讯官方信息称,使用腾讯云向量数据库后,企业接入大模型需要花费的时间,能从一个月降低至三天左右,极大降低企业的接入成本。

在具体落地应用层面,腾讯方面表示,该向量数据库目前已经应用在腾讯视频、QQ浏览器、QQ音乐等30多款腾讯内部产品之中。

数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。

腾讯方面表示,在未来“向量数据库+大模型+数据”将产生“飞轮效应”,共同助力企业步入AI Native(AI原生)时代。


猎云网APP阅读全文

体验更加

猎云网

微信扫码关注猎云网

  1. 猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权;
  2. 转载时须在文章头部明确注明出处、保留官方微信、作者和原文链接,如:转自猎云网(微信号: lieyunjingxuan )字样;
  3. 猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
  4. 联系猎云,请加微信号:jinjilei
猜你喜欢
长按图片可以分享给好友
×