第三代AMD EPYC处理器扩展大数据性能领先地位

描述

企业每天都会产生大量互连的结构化、半结构化和非结构化数据。大数据分析是检查这些数据以发现信息(例如隐藏模式、相关性、市场趋势和客户偏好)的通常复杂的过程,这些信息可以帮助组织做出明智的业务决策。

AMD 一直与我们的合作伙伴生态系统合作,为大数据分析创建最佳基础架构解决方案。这包括流行的 Apache® Hadoop® 框架,该框架有助于对大型数据集进行分布式处理。我们有几个客户已经在基于 AMD EPYC™ 的服务器上实施了大数据分析部署,因为它们通过行业标准基准测试证明了其持续的性能、可扩展性和总拥有成本优势。 

TPC Express Benchmark™ HS (TPCx-HS) 是一种流行的行业标准,用于对基于 Hadoop 的大数据分析系统进行基准测试,以技术上严格、直接可比和供应商中立的方式进行性能和性价比比较。TPCx-HS 强调硬件和软件堆栈,包括执行引擎和 Hadoop 文件系统 API 兼容层。TPCx-HS 可以评估广泛的系统拓扑和实施方法,并产生与大数据和分析硬件和软件系统高度相关的结果。

今天,AMD EPYC(霄龙)7003 系列处理器在每个比例因子上都主导着性能世界纪录,如图 1 和AMD EPYC(霄龙)处理器世界纪录页面所示。图 1 中的结果是使用 Supermicro 集群获得的。

amd

图 1:第三代 AMD EPYC 处理器的性能和性价比排名

我还想展示这些结果如何与竞争对手相抗衡。图 2 显示基于 AMD EPYC 的系统在 1TB、3TB 和 100TB 时的性价比分别提高了 78%、70% 和 116%。需要注意的是,每个 AMD EPYC-基于服务器的服务器仅包含一个处理器,而其他服务器各包含两个处理器。这证明了单插槽服务器为您提供最佳解决方案的可行性。

amd

图 2:CDP 私有云上的 1 倍 AMD EPYC 75F3 TPCx-HS 性能与 2 倍英特尔® 至强® 6262V

TPC Express Benchmark BB (TPCx-BB) 是另一个流行的基于 Hadoop 的大数据系统的基准。该基准测试通过在实体店和在线店的零售商环境中执行 30 个经常执行的分析查询来衡量硬件和软件组件的性能。结构化数据的查询以 SQL 表示,半结构化和非结构化数据的查询以机器学习算法表示。SQL 查询可以使用 Hive 或 Spark,而机器学习算法使用机器学习库、用户定义的函数和过程程序。如图 3 所示,基于 AMD EPYC 的单插槽系统以 3000GB 的比例因子提供了最佳结果。 [6] 由 AMD EPYC 7763处理器驱动的 Dell EMC PowerEdge 7515 服务器集群以 487.5 美元/烧烤每分钟的价格提供了 1,533.13 次烧烤。

amd

图 3:TPCx-BB 基准测试中的单路 AMD EPYC 7763 性能

我还想提一下用于 IoT 网关系统的 TPC Express Benchmark IoT (TPCx-IOT)。随着越来越多的智能设备连接到互联网,该基准在当今的互联世界中非常重要。TPCx-IoT 是业界第一个允许直接比较物联网网关不同软件和硬件解决方案的基准。网关系统位于边缘架构和后端数据中心之间,它们在其中执行数据聚合、实时分析和持久存储等功能。TPCx-IoT 专门设计用于为商用系统提供可验证的性能、性价比和可用性指标,这些系统通常在运行实时分析查询时从大量设备中摄取大量数据。工作负载代表在商用硬件和软件平台上运行的典型 IoT 网关活动。我很高兴地说,基于 AMD EPYC 的系统提供了一流的性能和性价比,如图 4 所示。 

amd

图 4:基于 AMD EPYC 的系统在物联网工作负载上提供顶级性能和性价比

这些结果表明,基于 AMD EPYC 的服务器是您的大数据分析部署的理想选择。

审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分