腾讯云向量数据库接入外部企业超100家！-技术圈

10月24日，在第四届长沙·中国1024程序员节上，腾讯云数据库副总经理罗云透露，腾讯云向量数据库自7月份发布以来，已经服务腾讯集团内部40多个业务，日请求量达1600亿次，服务的外部客户数也已经超过100家。

罗云表示，作为国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库，腾讯云向量数据库最高支持10亿级向量检索规模，毫秒级延迟，相比传统单机插件式数据库检索规模提升10倍，同时具备百万级每秒查询（QPS）的峰值能力。

腾讯云数据库副总经理罗云

“因为提供了接入层、计算层、存储层的全面AI化解决方案，用户可以在使用向量数据库的全生命周期过程中，都能应用到AI能力。”罗云强调。

向量数据库是通过把数据向量化，然后进行存储和查询，可以极大地提升效率和降低成本。它能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题，突破大模型在时间和空间上的限制，加速大模型落地行业场景。

针对目前席卷全球的AI浪潮，罗云表示，如果AI 1.0时代，用户对于基础的关注重点是单机单卡的性能、标量数据的结构化精准检索，以及云原生带来的自动调度。那么，AI 2.0时代，由于服务重心变为AI企业及大模型，关注的重点已经转移到集群性能的提升、向量数据的存储与检索，以及自动容错能力上。因此AI 2.0时代，客户需要的是一个更加灵活、自由、高性能的云平台。

基于这样的背景而诞生的腾讯云AI超级底座，结合腾讯云在高性能计算集群、向量数据库、高性能网络和存储等能力，支撑着上层AI相关的PaaS、MaaS以及SaaS服务。

罗云表示：“向量数据库是支撑AI大模型的重要基础设施，这是腾讯云向量数据库和其他厂商最大的不同。正是基于这样的理念，腾讯云向量数据库在一开始就基于AI设计”。

在接入层，腾讯云向量数据库支持自然语言文本的输入，同时采用“标量+向量”的查询方式，支持全内存索引，最高支持每秒百万的查询量（QPS）；

在计算层，AI Native开发范式能实现全量数据AI计算，一站式解决企业在搭建私域知识库时的文本切分（segment）、向量化（embedding）等难题；

在存储层，腾讯云向量数据库支持数据智能存储分布，助力企业存储成本降低50%。

为了推进向量数据库在企业的大规模应用，腾讯云针对企业的普遍诉求，第一时间联合合作伙伴推出了一个端到端的向量数据库解决方案，从文本的智能化分割，帮助客户选择一个好的向量化模型，帮客户建立一个合适的索引，通过智能化排序产生端到端，通过开源等方法把端到端的召回率提高20%。通过这样的方式，大幅缩短数据介入AI的时间。

统计显示，将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现10倍效率的提升，如果将向量数据库作为外部知识库用于模型推理，则可以将成本降低2-4个数量级。

“对于开发者，未来五年或是十年，程序员不是消失了，而是每个人都是程序员，每个人都可以把自己的数据用向量数据库管理起来。”罗云表示。

﹀

-- 更多精彩 --

降低用户使用门槛，向量数据库与大模型联合开发产生“飞轮效应”

↓↓点击阅读原文，了解更多优惠