PCIe Gen 4协议分析仪的竟然那么强大!

描述

 PCIe协议分析仪作为PCIe总线分析的基本工具,不仅仅用于主机,网络,存储系统等各种IT和通讯设备针对PCIe插卡的问题分析,同时也是PCIe/NVMe SSD分析的必备工具。

作为PCIe协议分析革命性创新的领导者,SerialTek公司的PCIe Gen 4和Gen 5协议分析仪不仅颠覆了传统的PCIe协议分析仪架构设计,大大提高了协议分析仪的性能以及用户的测试效率,改变了用户使用PCIe协议分析仪的习惯,同时,它也提供了超高的灵活性和业内最高的性价比,让更多的公司买得起PCIe Gen 4 和Gen 5协议分析仪。下面我们简要介绍一下这些创新功能。

SerialTek PCIe Gen 4协议分析仪创新功能

“秒”级解码

在开发/测试的不同阶段使用分析仪的时候可能存在不同的应用场景。例如,非常早期的阶段可能在使用分析仪的时候需要设置触发条件抓取少量的数据分析即可,但是在产品的后期测试阶段,AE支持,客户方案支持,或者产品发布以后的技术支持阶段,很多不容易复现的问题往往需要抓取大量数据,例如,NVMe SSD运行很长时间以后出现读/写不匹配(Read/Write Miscompare),这种情况下往往采用大压力并发读/写, Write和Read同一个Sector的时间会间隔几秒有时甚至更长,这个时候需要抓取所有读/写数据然后进行对比分析。SeriaTek支持最大配置144G Buffer,但是这么大的Buffer抓到以后解码就成为影响测试效率多个一个严重问题。SerialTek的创新设计使得抓取144G Buffer以后可以在1秒钟之内全部解码所有的PCIe层(DLLP, TLP)以及NVMe层命令。如果工程师简单分析解码后如果发现不是所需要的Trace可以立即重新开始抓取。

对比:传统分析仪抓取数据以后必须经过两个步骤解码:1)将Trace从分析仪Buffer读取到电脑;2)通过电脑的CPU/内存进行解码。不考虑电脑是否在传输和解码过程中是否会死机,那么传统分析仪读取144G buffer大概需要10 – 12小时;解码大概需要另外10 – 12 小时。即,传统分析仪需要20 – 24小时以后工程师才能看到第一行解码。有兴趣的朋友可以亲自测试一下。

“极速”存储

抓到144G buffer分析解码以后如果觉得需要保存下来供其他部门或者同事协同分析,那么需要多少时间呢?SerialTek提供多种方式保存Trace文件:

保存到分析仪内置的闪存盘

SerialTek PCIe Gen 4协议分析仪内置最大2TB Gen 3 x4 NVMe SSD(Samsung EVO970),写入速度大概在350MB/S,保存144G大概需要6.5分钟。这是目前使用SerialTek最推荐的方式。

保存到用户电脑(通过网络传输)

SerialTek提供1个千兆,外加2个万兆10GE端口用于管理和导出数据,工程师通过千兆端口导出Trace的速度大概在90MB/s (千兆理论速度是1.25Gbps);单端口10GE提供1GB/s速度,双端口10GE提供2GB/s速度。如果需要使用10GE,建议使用台式机或者服务器配置Intel 双10GE端口网卡。

保存到外置PCIe闪存盘或者阵列

SerialTek支持2个Oculink,可以通过Oculink to U.2线缆接入NVMe SSD或者直接接入Oculink的盘柜。

保存到USB 3.0移动硬盘

SerialTek支持2个USB 3.0端口,可以直接将U盘插入,然后直接将trace文件保存到U盘。

对比:SerialTek分析仪采用高性能服务器设计,内置标准Linux系统,大大提高了Trace文件保存的速度和保存方式的多样性。传统的PCIe分析仪架构可以认为类似一台终端“打印机”,本身仅提供抓包功能,不提供处理和分析,所有操作全部依靠工程师的电脑。所以,电脑性能配置强一些可能体验稍好一些。但是,传统分析仪内部非常“弱鸡”的CPU及其精简的Linux系统严重束缚了USB或者千兆以太网导出数据的速度,平均导出速度在5MB/s。

信号“高保真”设计

SerialTek的所有AIC, U.2/U.3, M.2的Interposer分析板卡采用其专利技术的SIFI信号高保真(Signal Fidelity)设计,Interposer除了两端接插件部分有大概合计约2 %左右的信号衰减外,板内几乎没有信号衰减,主要原因在于其设计采用了高成本的“宇航级”分路器件将PCIe Upstream和Downstream双向数据导出到协议分析仪主机,进/出Interposer的信号眼图几乎一样。

对比:传统分析仪在处理Gen 4的信号的时候为了减少Interposer带来的衰减,全部采用对于信号进行增强的方式进行处理,导致Interposer入口的信号和出口的信号的眼图差距较大。这就是导致很多看到很奇怪的现象:1)接入分析仪Interposer以后“原来的问题不见了”;或者2)接入分析仪Interposer以后“出现了新问题”。

无需抓取“上电过程”

SerialTek分析仪设计采用其专利技术,无需抓取PCIe上电初始化过程即可实现正确解码。这一点非常重要,因为很多问题的复现需要反复重启电脑或者插拔NVMe SSD,SerialTek PCIe 分析仪只要处于加电状态,不论工程师打开/连接协议分析软件与否,分析仪内部都会时刻监控每次上电PCIe初始化过程中任何config space, controller register, 协商的速度和位宽(如:Gen 4 x4),以及admin和I/O队列的创建和拆除时间等等,所以任何时候连接分析仪开始抓取数据(即便已经错过了上电初始化过程),然后分析仪都会按照正确的信息进行解码。

对比:传统PCIe分析仪由于设计的缺陷,必须严格按照如下顺序抓取数据:1)协议分析仪上电;打开软件,锁定协议分析;2)设置分析仪参数,开始抓取数据;3)待测主机上电。如果主机上电以后再连接分析仪抓取数据很可能会解码错误。这样设计的原因在于分析仪必须先“经历”PCIe初始话过程学习到这些参数,作为后面解码的依据。但是这在工程师需要反复重启复现问题的时候成为严重缺陷,即,某一次重启可能导致PCIe协商的某些参数变化,结果导致解码全部错误。该问题在传统分析仪上无法解决,反复重启解码错误的问题100%会出现。

“灵活”的多盘测试场景下的“过滤和触发”

现在大部分的测试场景都是同时测试很多块盘,例如:Gen 4 x16 host card外连4块Gen 4 x4 NVMe SSD,或者Gen 4 x16 host card连接一个8盘位 Gen 4 x4 JBOF盘柜。如果将AIC Interposer串接在host card和主机PCIe slot之间,希望仅抓取某个NVMe SSD的流量(不记录其它盘的流量),或者希望设置一个trigger condition仅针对某个特定的NVMe SSD进行触发(而不是误触发其它SSD),SerialTek可以自动扫描到每个SSD的BDF信息,允许工程师根据下面的条件设置过滤或者触发:

BDF – Bus, Device, Function,可以具体定位到某块NVMe SSD

Control Registers

Queues

对比:传统分析仪无此功能,无法有效利用buffer或者正确触发某个具体的NVMe SSD的流量。

“完美”M.2低功耗支持

SerialTek的PCIe Gen 4协议分析仪在Asus Z390,以及Thinkpad, Dell, Huawei等笔记本电脑,以及Gen 4 M.2 (例如:目前在研的最新微软Surface Book)的ASPM L1.2低功耗模式下工作非常良好,进出TS1/TS2,抓取数据,解码非常完美。

对比:传统分析仪由于Interposer以及内部芯片设计问题,可能在M.2 SSD进/出低功耗的过程中出现错包,丢包等一些异常问题。

“四盘”分析合一

SerialTek PCIe分析仪提供的U.X Interposer实现了Single Port/Dual Port, U.2/U.3 SSD四种组合的NVMe SSD通过一个Interposer即可实现支持,大大方便了企业级客户分析当前以及未来2.5’ NVMe SSD的需要,也降低了采用第三方外接卡转换对于Gen 4 信号带来的风险,同时也间接降低了产品的拥有成本。而且,SerialTek支持在一个软件界面上同时显示Dual Port两个端口的解码(支持在界面上显示/隐藏某一个端口)。

对比:传统分析仪无法作到下面两点中的至少一点:1)无法通过一台设备分析Dual Port,需要购买两台PCIe Gen 4 分析仪通过复杂的堆叠技术实现每台分析仪抓取其中一个Port;2)不支持U.3,需要外配第三方U.2/U.3转换卡。

Gen 5 Ready

SerialTek Gen 4 分析仪支持Gen 5,可以通过购买相应升级服务包直接升级到Gen 5。

对比:市场上有些Gen 4分析仪产品不支持升级到Gen 5。

“远程分析”和“远程协作”

SerialTek分析仪通过内部的CPU进行解码分析,用户可以认为客户端协议分析软件只是接收分析仪传过来的画面,类似于使用Teamviewer或者微软的远程桌面一样。当前,美国受“疫情”影响下的员工远程使用SerialTek PCIe Gen 4 分析仪已经成为常态,只要让实验室的同事搭建好测试环境,测试工程师在家通过Cisco VPN或者其它类似软件登陆公司内网后,可以直接在家里电脑上连接,锁定,配置分析仪,然后抓取数据,解码分析的速度和在办公室本地操作一样,几乎没有任何影响。

另外,抓取到数据后,工程师可以邀请其它站点的同事直接连接到该分析仪打开buffer或者存储在分析仪内部的Trace文件系统分析,该功能对于跨国公司分析PCIe问题非常便利,无需再在不同站点之间来回搬运Trace文件。

对比:传统的PCIe协议分析仪必须在本地使用,因为它必须通过USB/ETH将Trace文件导出到本地电脑进行分析,效率非常低下。

“随时断网”

由于SerialTek采用高性能主机设计,里面使用标准Linux系统而不是精简Linux,所以可以完整保持网络连接的状态。工程师在使用SerialTek Gen 4分析仪的时候再也不用担心万一网线碰掉导致抓取的数据无法读取的问题了。工程师可以随时断开网线,然后接上网线。这对于很多负责客户支持的工程师非常有帮助,在客户现场设置好分析仪开始抓取数据以后,即可合上笔记本离开而不用担心第二天过来无法连接分析仪。

对比:传统的PCIe分析仪通过USB/ETH不能断开连接,一旦断开(例如笔记本休眠后重启打开),那么即便分析仪已经抓到需要的数据了,该数据再也无法读取。工程师必须重新启动分析仪重新连接电脑进行抓取,这个抓取过程必须保证电脑和分析仪实时在线。

“超高”性价比

SerialTek提供的PCIe Gen 4分析仪在提供上述强大功能的基础上,比传统的PCIe Gen 4协议分析仪在价格上低出许多,成为大部分公司都可以“买得起”的PCIe Gen 4分析仪。

SerialTek PCIe Gen 4分析仪之所以提供上述这些创新功能和高性能,在于该分析仪在研发指出已经考虑到了Gen 4协议分析面临的技术挑战。

Gen 4协议分析面临的技术挑战

我们知道,Gen 4 NVMe SSD一般为Gen 4 x4,即16G x4 = 64G,如果双向都打满流量(RW: 50/50)测试暴露问题的话那么速度为64G * 2 = 128Gbps(约12GB/S)。由于协议分析仪抓包后要加上时间戳以及很多其它格式化信息(例如标识Packet是否有CRC Error),所以实际占用的buffer远比我们链路上传输的数据要大,基本上读/写压力同时加上的话,几秒钟几十个GB字节。所以PCIe Gen 4 协议分析仪需要具备非常快的Trace解码分析和文件保存速度。

传统上市场上见到的协议分析仪,包括现在的Gen 4和Gen 5分析仪的架构,都是一种嵌入式架构,可以简单理解成和一台“打印机”架构类似,分析仪硬件的主要目的是抓到数据,然后通过内部非常低速的嵌入式CPU(一般都是几百Mhz)将数据搬运到电脑,然后通过电脑进行解码分析。所以,用户的体验很不好。举例:如果搬运4GB数据大概需要20~30分钟,然后解码还需要20~30分钟。所以说,需要将近1个小时才能看到解码。如果解决一些读/写不一致的问题,那么可能要抓取100GB数据,那么如果电脑可以处理不崩溃的话,基本上需要24小时以上才能看到第一行解码。这样对于复现问题,分析问题来讲,效率非常低。

对于未来的PCIe Gen 5 x16而言,双向打满数据,大概为32Gbps * 16 lane *2 = 1TBbps(约100GB/s),所以,100GB的分析仪buffer还无法抓到1秒钟数据。Gen 5 x16的分析仪buffer要远大于100GB,所以处理这些大的数据的能力就成为考虑协议分析仪的一个非常重要的方面。

SerialTek Gen 4 协议分析仪的革命性设计

SerialTek的母公司为位于瑞士的Ellisys公司,但是PCIe Gen 4协议分析仪硬件(包括分析仪主机,以及所有的Interposer)的研发,设计以及测试在英国完成。

SerialTek PCIe/NVMe Gen 4 分析仪采用业内首创的全新架构设计,采用高端服务器架构,内置12核高性能CPU,区别于传统的协议分析仪软件的“胖客户端”模式(该模式下,所有的分析等功能全部依赖工程师的电脑的性能),该Gen 4分析仪采用Client/Server架构,即“瘦客户端”+高性能server的架构,客户端协议分析软件只是负责产品设置,管理以及显示,所有的需要处理的内容都放在server端进行处理,这样工程师的电脑将获得很大的解放,也不会成为协议分析时的瓶颈。

SerialTek Gen 4分析仪提供千兆以太网管理端口,以及2 x 10GE管理端口,提供36/72/144G Trace Buffer用于抓取PCIe/NVMe流量,内置2TB本地闪存用于快速保存Trace 文件,同时也可以直接保存到连接在分析仪前面板的USB盘或者PCIe盘柜,是全球目前最快的Gen 4 分析仪。   

Saniffer公司位于上海张江高科技园区,是国内唯一专注于存储测试工具领域的综合服务提供商,涉及测试工具覆盖了存储生态的各个环节,从芯片开发,底层固件和驱动开发/验证,测试工程,应用工程,RDT可靠性测试,一直到生产测试。测试的产品涉及存储控制器IP,芯片,HDD/SSD,存储系统,服务器,网络设备研发,设计,生产和制造。Saniffer提供的测试方案包括并不限下面涉及的技术:

PCIe/NVMe Gen 4/5

SAS 12/24G / SATA 6G

UFS 3.0/3.1

NAND 400MT/800MT/1.6GT

LPDDR/DDR 4/5

FC 32G

FCoE

iSCSI

NVMoF (NVMe over Fabric)

FC-NVMe (NVMe over FC)

随着近几年PCIe Gen 3/4技术及NVMe SSD在国内的快速发展,Saniffer迅速成为国内在该领域的知名供应商,成为UNH IOL认证的SerialTek, SanBlaze, Quarch在中国的独家合作伙伴。

原文标题:没想到PCIe Gen 4协议分析仪原来功能这么强大!

文章出处:【微信公众号:ssdfans】欢迎添加关注!文章转载请注明出处。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分