SPTAG (Space Partition Tree And Graph)是分布式近似最近邻域搜索(ANN)库,为大规模矢量搜索场景提供高质量矢量索引构建,搜索和分布式在线服务工具包。
该库假定样本表示为向量,并且可以通过 L2 距离或余弦距离来比较向量。为查询向量返回的向量是与查询向量具有最小 L2 距离或余弦距离的向量。
SPTAG 提供两种方法:kd-tree 和相对邻域图(SPTAG-KDT),以及平衡 k-means 树和相对邻域图(SPTAG-BKT)。SPTAG-KDT 在指数构建成本方面是有利的,而 SPTAG-BKT 在非常高维数据中的搜索精度方面是有利的。