存储技术
作为首家通过LDBC SNB 1TB 官方审计的图数据库厂商,TigerGraph 今年发布了一项108TB的LDBC社交网络基准测试。据统计,这次基准测试的 108TB 数据量是 "之前世界纪录的 3 倍"。通过对包含 2179 亿个顶点和 1.6 万亿条边的图进行 OLAP 式查询处理,清楚地证明了,TigerGraph有强大的能力处理真实生产环境中的大图工作负载。
如今,数十TB的互联数据每小时或每天增量更新都是常态,图技术需要承担越来越大的数据量。因此,可扩展性是图数据库设计和实施的关键因素。在此背景下,TigerGraph在108TB 数据集上的LDBC SNB BI工作负载中的出色表现,充分说明TigerGraph有能力无缝扩展其图数据库以适应数据增长。
去年,TigerGraph在SF30000数据集上成功完成了LDBC SNB BI基准测试——完整的源数据集约为 36TB,包含726亿个顶点和5396亿条边。这次基准测试使用了TigerGraph 3.7.0版本,在加载和查询方面较之前使用的TigerGraph 企业版3.2.2都有明显改进, 并且结果得到了 SF-10 上的另一个图数据库的交叉验证。例如,加载时间从 35.5 小时缩短到 6.5 小时,提升了将近5倍;power batch 中所有query的的平均查询时间从上次的236.06 秒缩短到 99.90 秒,提升了1.4倍。您可以通过文末热门推荐,查看36TB基准测试报告。
在36TB的基础上,TigerGraph将数据集进一步扩展——通过将相关的动态顶点、边类型复制三次,加载到TigerGraph中的原始数据总量超过了108TB,包含 2179 亿个顶点和 1.6 万亿条边。
软件方面,和36TB一样,这次108TB基准测试,我们沿用了TigerGraph 3.7.0企业版本。硬件成本从$281.27/hr增加到$843/hr,使用了72台由第三代 AMD EPYC 处理器提供支持的AWS r6a.48xlarge 机器,磁盘容量为432TB。原始108TB数据集在加载到TigerGraph后,所消耗的磁盘空间减少了2.43倍。
在包含 2179 亿个顶点和 1.6 万亿条边的海量图上成功处理了复杂的深度链接 OLAP 式查询,值得注意的是,其中 11 个数据密集型读取查询在 1 分钟内返回了结果,而其余的则需要 1 到 10 分钟。这些结果清楚地证明了TigerGraph适用于各种关系数据处理场景,尤其在数据量大、经常有数据更新、需要快速实现复杂大数据量全图计算(OLAP)的场景。
与其他图数据库和关系数据库提供商相比,TigerGraph 以其跨 100 多台机器的大规模图分析和操作能力而独树一帜。结合 AWS 上 AMD EPYC 实例的性能和扩展能力,这为希望从数据中获取最大价值的客户提供了理想的解决方案。
此次108TB基准测试,清楚地证明了TigerGraph 能够对高达上百 TB 的图结构数据进行分析,这改变了大数据世界的游戏规则。因此,TigerGraph 现在已成为企业对错综复杂、相互关联的数据进行大规模分析的首选解决方案。
欢迎点击左下角的“阅读原文”,查看此次108TB基准测试的完整报告。该报告详细介绍了 TigerGraph 在 108TB 规模下全面执行 LDBC SNB BI 工作负载的情况。
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !