向量检索服务产品规格
本文介绍向量检索服务DashVector的产品标准,以协助用户挑选贴合本身事务场景的实例标准。
实例类型
向量检索服务DashVector当时支撑三种四种实例(Cluster)类型,以支撑不同的事务场景和需求:
-
功能型 :适用于查询QPS高、查询推迟低的场景,一起功能型也是写入功率最高的实例类型。关于高并发、大流量、低推迟场景,或对写入功率有较高的要求的场景,可挑选功能型实例。
-
存储型(引荐) :存储型相关于功能型有5倍的存储容量优势,可以存储和办理更多的向量数据,适用于大规模数据量的场景。存储型实例相同也具有优异的技术指标, 可满意大部分场景需求 ,一起也是 性价比最高 的实例类型,引荐用户挑选运用。
-
Serverless型: 不限数据容量,根据用户数据主动扩缩,按实践恳求收费,适用于低频QPS查询(QPS<2),推迟不灵敏等场景。总体功能与存储型实例挨近。
-
免费试用 :适用于测验、体会场景, 请勿用于线上出产环境 。免费试用实例有效期为1个月,到期后可再次请求试用。免费实例有部分试用束缚,概况可参阅束缚与束缚。
重要
免费试用实例有效期为1个月,到期后免费试用实例将主动开释,实例中的数据将被悉数删去并清空且不可恢复,为了确保实例可继续运用,请您于创立免费试用实例之后的30个天然日内将免费试用实例晋级为付费实例。免费试用实例因为到期且没有晋级为付费实例而导致的数据被删去的状况,阿里云将不承当相关职责。
实例标准
向量检索服务DashVector针对功能型和存储型实例供给不同档位的实例(Cluster)标准,不同标准的首要差异在于存储容量的不同。Serverless实例与已有功能型和存储型不同,无容量束缚。
阐明
若您有更高标准需求,或有任何反应、希望获取更多技术支撑,欢迎经过如下方法联络咱们:
-
官方钉钉群:25130022704
-
技术支撑邮箱:[email protected]
存储容量参阅
重要
-
以上数据均已经过实践测验验证,但仅供参阅!
-
上述用于容量测验的 Doc中不包括任何Fields,仅包括主键和向量数据 ,主键为从零开始自增正整数转字符串。大部分实践出产场景中,Fields是不可或缺的,Fields数据相同会占用存储空间,然后导致实践存储的Doc数低于上述表格。
检索功能参阅
重要
-
以上数据为根据Cohere数据集实测成果,但因为不同数据集的数据散布对功能有影响,上述数据仅供参阅。
-
上述用于功能测验的 Doc中不包括任何Fields,仅包括主键和向量数据 ,主键为从零开始自增正整数转字符串。
-
向量检索服务DashVector会守时在后台进行向量索引优化,通常在写入完结后4小时完结,到时功能到达最优状况。
-
不同标准在写满数据状况下,QPS与上述表格中保持一致或更高,不因数据量的添加而下降。如,P.2xlarge标准,在写满2百万768维FP32向量数据状况下,topk=100的QPS可到达600+。
副本数
向量检索服务DashVector支撑调整副本数,可选规模为1-5。副本之间数据完全相同,副本数越大,可支撑的QPS越高,呈线性关系。一起副本数越大,服务可用性越高, 主张对可用性有较高要求的出产环境挑选>=2的副本数 。{#4d1b3cb1c1c9m}
阐明
-
需求留意,副本数的添加和削减不会影响存储容量,仅影响QPS和可用性。
-
Serverless实例无副本概念,由系统办理。