概 述
程序化交易、量化交易的快速发展凸显了交易系统运行效率的重要性,通过运用先进的软硬件技术,最大限度地提升交易通道的速度,有助于帮助用户捕捉转瞬即逝的交易机会,在证券市场中获得更高的收益。但同时,证券业务的复杂性意味着,交易系统不仅需要考虑硬件选型与软件优化,以获得更高的性能,同时也需要统筹考虑总体拥有成本 (TCO)、服务质量 (QoS) 等因素,从而帮助客户提升在证券市场的投资收益。
为了实现上述目标,深圳市金证科技股份有限公司(以下简称:金证)与英特尔在过去几年中进行了密切合作,推出了基于英特尔 架构的金证极速交易系统,采用了英特尔 至强 可扩展处理器以及英特尔 oneAPI 等软件工具,显著提升了业务效率、降低了业 务时延。在双方新一轮的合作中,金证极速交易系统搭载了最新推出的第五代英特尔 至强 可扩展处理器,在 5000 TPS 场景下实现了低至 2.02 微秒的上行性能和 1.55 微秒的下行性能1 。同时,系统还采用了英特尔 Speed Select 技术(英特尔 SST),将系统的 P90 时延降低 32%,P99 时延降低 83%。
挑战:金证极速交易系统
旨在进一步提升性能与稳定性
在开展策略交易的高端客户中,以机构投资者为主,其中私募基金占了重要的比重。近年来,伴随着金融市场的活跃,私募基金迎来了爆发式的增长。中国证券投资基金业协会发布的私募基金管理人登记及产品备案月报显示,截至 2024 年 2 月,私募基金管理总规模为 20.33 万亿元,管理基金数量 153756 只2 。
同时,随着投资工具的丰富,私募基金的投资策略多样化起来,阿尔法策略、套利策略、相对价值策略、管理期货策略等借助于金融衍生品的策略受到欢迎,并且在当今市场环境下取得了不错的收益。要捕捉转瞬即逝的交易机遇,就需要通过证券交易系统,执行程序化、量化交易。因此,证券交易系统的交易速度在很大程度上影响了套利策略的实现能力。
作为证券行业核心交易 IT 供应商,金证自 2012 年起开始投身于新一代极速交易系统研发中。金证推出的极速交易系统是针对需要做高频率、极速交易的机构投资者而开发的一套极速交易系统。该系统基于交易与清算分离原则,采用全内存、低延时等核心技术,实现业务微秒级交易处理及交易查询,提供订单委托、委托撤单、成交回转、实时委托查询、实时成交查询等高实时性的交易相关功能。该系统能够支持程序化交易、算法交易、高频交易等新型、专业化投资交易手段的便利接入。
图 1. 金证极速交易系统架构
金证极速交易系统整体基于金证微架构技术平台开发,采用多活架构与组件化理念设计,可实现业务功能的灵活扩展;系统支持主备、多活等多种部署模式,基于 Raft 一致性算法,可实现主备、容灾之间的自动切换,实现业务连续和系统多活。系统在原有技术架构基础上,新增独立的新极速模块,新极速模块仅完成委托申报和成交回转功能,减少线程切换,性能实现突破性飞跃。
在金证与英特尔的既往合作中,双方成功通过版本迭代、硬件升级与软件调优,降低了委托业务的时延,并通过英特尔 oneAPI 库大幅提升了风控计算的效率。着眼于当前及未来的证券交易需求,双方开展了新一轮的优化工作,以达成如下目标:
进一步提升交易效率、降低交易时延
从金证极速交易系统的极速订单流程来看,其包含了接入、业务、报盘、内存库等主要进程,这些进程对于 CPU 的峰值性能非常敏感,因此,通过采用更高性能的 CPU,将有助于提升交易效率、降低时延。
提升交易系统的时延稳定性,提高服务质量
时延稳定性对于证券交易有着至关重要的影响,特别是在业务高峰期,CPU 利用率提升、资源竞争等会带来交易时延波动,时序图上出现 “毛刺”,可能导致交易效率降低,这就需要通过进一步的优化,来提升稳定性。
解决方案:采用第五代英特尔 至强 可扩展处理器与英特尔 SST 进行方案升级
在之前合作成果的基础上,金证将极速交易系统的 CPU 升级为第五代英特尔 至强 可扩展处理器。第五代英特尔 至强 可扩展处理器拥有更可靠的性能,更出色的能效。它在运行各种工作负载时均可实现显著的每瓦性能增益,在 AI、数据中心、网络和科学计算的性能和总体拥有成本 (TCO) 方面亦有更出色的表现。相较上一代产品,第五代英特尔 至强 可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存。由于 CPU 内部架构设计的优化,即使与相同规格参数(如核数、频率、缓存、 TDP 等)的上一代产品比较,CPU 性能也有可观的提升。此外,它与上一代产品的软件和平台兼容,因此部署新系统时可大大减少测试和验证工作。
图 2. 第五代英特尔 至强 可扩展处理器具备强大性能
在性能验证中,金证极速交易系统采用了英特尔 至强 金牌 6544Y 处理器。该处理器提供了多达 16 个核心、32 个线程,使其将部分核心与交易服务绑定之外,还能够有充足的核心分配给风控服务,保证性能的释放。
测试数据如图 3 所示,在 5000 TPS 的测试场景中,第五代英特尔 至强 可扩展处理器的订单提交时间(上行性能)中位数为 2.02 微秒,相较于第四代处理器的 2.54 微秒,交易时间降低约 20.5%;下发订单时间(下行性能)中位数为 1.55 微秒,相较于第四代处理器的 1.84 微秒降低约 15.8%;同时,上行性能相比第二代处理器的 2.98 微秒降低约 32.2%8 。
图 3. 金证极速交易系统在不同代英特尔 至强 可扩展处理器上的上行性能对比
针对委托交易时延不稳定的问题,金证尝试采用英特尔 SST 技术进行优化。金证采用了英特尔 SST 的 SST-Turbo Frequency (SST-TF)、SST-Core Powe (SST-CP) 两种模式。其中,英特尔 SST-TF 允许增加一定数量内核(高优先级内核)的最大 Turbo 频率,以降低 CPU 其余内核(低优先级内核)上的最大 Turbo 频率。在某些工作负载中,有少数内核会成为系统整体性能的瓶颈,通过使用英特尔 SST-TF 为这些核心分配更高的频率,可以在不改变软件的情况下实现显著的性能优化。
SST-CP 通过为每个 CPU 核分配优先级来提供 CPU 核功率/性能的动态优先级,从而按优先级顺序满足每个核的功率要求。这允许用户指定频率层以满足其工作负载的需要。SST-CP 可以与 P 状态、Turbo Boost 和其他速度选择技术等功能相结合,使平台能够在最关键的时间为最关键的工作负载通电并排定频率优先级。
图 4. 英特尔 SST-TF 功能示例
图 5. SST-CP 功能示例
由于英特尔 至强 金牌 6544Y 处理器可以支持全核运行最大 Turbo 频率,因此金证极速交易系统在 CPU 全核开启 SST,并测试了委托时延性能的变化。测试数据如图 6 所示,当开启 SST 之后,P90 时延(90% 的调用时延都在特定值以下)降低 32%,P99 时延(99% 的调用时延都在特定值以下)降低 83%,有效优化了低时延委托毛刺问题9 。
图 6. 关闭/开启 SST 委托时延性能对比(越低越好)
收 益
在升级为第五代英特尔 至强 可扩展处理器,并开启英特尔 SST 之后,金证极速交易系统的委托交易性能与时延稳定性有了显著的提升,这能够为用户带来以下收益:
提升了全链路的交易速度,在瞬息万变的证券市场环境中,帮助客户敏锐抓住转瞬即逝的市场机遇,推动获利的最大化。
提升了委托业务时延的稳定性,降低了低时延委托的毛刺问题,从而能够为客户提供“始终如一”的服务质量与体验。
释放了第五代英特尔 至强 可扩展处理器的硬件潜力,提升了性能密度,有助于控制服务器节点规模,实现更高的成本效益。
展 望
在如今的证券交易市场中,机构投资者要求更快的交易系统,支撑制定高频交易策略、实现高收益的投资目标。近年来,各大券商也纷纷加大 IT 投入,积极布局极速交易系统建设,全面赋能业务增长。在此背景下,金证紧抓机遇,持续夯实金融科技能力建设,不断实现极速交易技术迭代,并推出了金证极速交易系统 KFOS 3.7,进一步提升产品性能。
通过采用第五代英特尔 至强 可扩展处理器、英特尔 SST,金证极速交易系统在性能、时延稳定性等方面获得了进一步提升。在此基础上,双方将在未来进行深度合作,探索如何进一步利用第五代英特尔 至强 可扩展处理器搭载的创新技术,释放硬件潜能,助力打造更加卓越的极速交易系统,帮助用户获得更高收益。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !