作者:Jessica Isquith,Aaron Pop,David Wise
用于管理嵌入式系统平台的COM-HPC接口规范。目标是帮助边缘服务器工程师远程管理系统。例如,如果系统挂起,IT 管理员可以按重置键,其效果与前往工厂车间或其他站点的效果相同。该规范针对基于 COM-HPC 计算机模块的边缘计算机设计,旨在简化维护和提高服务质量。
远程管理功能(包括带外管理)是 IT 管理员的标准功能。这些功能包括监控系统功能、安装新的更新和补丁以及排除故障,而无需实际存在于服务器机房中。
许多 IT 服务提供商的标准做法是远程访问客户的本地服务器或将其托管在云中的某个位置。随着新的 PICMG COM-HPC 接口规范的出现,支持这种久经考验的真实实践的远程管理功能将扩展到边缘服务器和网关层技术(图 1)。实现数字化和 IIoT、边缘服务器和网关层技术需要远程管理功能,以克服企业级 IT 和工业级运营技术 (OT) 之间的差距。
图 1.COM-HPC 标准是为分布式的新边缘计算层设计的。因此,这个新IT层的服务提供商需要类似于分布式本地或云设备的全面远程管理功能。
基于计算机模块设计边缘层平台的工程师通常希望以可根据特定需求定制的方式实现这些功能。为了满足这一需求,PICMG 引入了用于系统管理的 COM-HPC 子规范。为了不重新发明轮子,COM-HPC子规范的某些部分将借鉴智能平台管理接口(IPMI)规范。
让我们更深入地了解专用于系统管理接口的 COM-HPC 子规范,以了解它如何使 COM-HPC 设计受益。
长寿和稳定性至关重要
改进边缘服务器 QoS 的工作落在了 IPMI 上,因为它自 1998 年以来一直存在,在 2001 年和 2004 年发布其他修订版后已达到稳健状态,并得到普遍接受。PICMG小组委员会还使用了红鱼规范,该规范基于表征状态转移(RESTful)API,并继续发布新功能。
IPMI 规范定义了用于监视和管理计算机子系统的协议、接口和体系结构(图 2)。IPMI 标准化了用于描述低级硬件的格式以及用于从电路板管理控制器 (BMC) 发送和接收消息的格式。
图 2.IPMI 呼叫可以通过网络发送到远程系统或本地子系统。在大多数情况下,系统的模块化是将IPMI功能扩展到子系统(例如模块上的计算机)的原因。
IPMI 消息可以通过网络发送到远程系统的 BMC,也可以从 BMC 发送到本地子系统,如电源。这种在发送IPMI消息方面的多功能性使得将复杂的管理任务划分为几个子区域成为可能。
这些消息可以查询硬件的当前状态或指示 BMC 执行操作 – 例如,指示 BMC 增加系统冷却、告诉系统重新启动或读取传感器。将管理任务卸载到专用的物理硬件组件可减轻主机硬件和操作系统的负担。IPMI规范还将系统管理与目标平台分离,以便即使在目标平台关闭时也可以启动系统管理功能。
所有这些功能使IPMI规范成为管理服务器硬件的事实标准。规范的寿命得到了保证,因为规范的开发人员故意保持所需的命令非常简单,没有留下误解的余地。
IPMI规范的灵活框架允许在原始规范的强制和可选命令之外添加新的网络功能(NetFn)和指令。各种行业工作组已经从这种自由中受益,并定义了他们自己的特定网络功能和命令,以处理在规范创建过程中未被考虑的技术和功能。
许多远程管理选项
对于计算机模块系统,灵活的框架简化了添加远程管理所需的调整。一项调整涉及通信与高性能计算嵌入式电子工程网(EEEP)有关。EEEP 包含有关供应商、内存插槽、网络功能等的信息。其中大部分信息与存储在 IPMI 现场可替换单元 (FRU) 中的信息相同。为避免重复此数据,COM-HPC 远程管理功能包括有关 IPMI 设备应如何使用 EEEP 设备中包含的信息填充 FRU 的建议。
鉴于 COM-HPC 模块的市场范围很广,包括远程数据中心、雾/边缘服务器和远程安装,拥有一系列灵活的远程管理选项非常重要。开发人员还必须考虑到,该标准指定了对模块和载板的IPMI支持的非常不同的成熟度级别。
模块的 IPMI 成熟度级别从非托管模块 (M.U) 和基本托管模块 (M.B) 到完全托管模块 (M.F)不等。载板级别从非托管 (C.U) 到托管载板 (C.M)不等。规范中详细解释了这些差异,但在此阶段最重要的是要知道所有这些模块和载板仍然可互操作。
COM-HPC IPMI 规范允许所有类型的载板与所有类型的模块一起正常工作。
灵活的平台管理和控制
PICMG COM-HPC IPMI小组委员会意识到,一刀切的解决方案无法满足需要基本管理功能的各种方案。因此,多种模块和载波设计组合可用于诸如打开和关闭系统电源或告诉系统获取网络信息之类的任务。
例如,当使用具有多达四个模块的单个载板时,每个模块具有独立的全管理功能会更有效率。但是,不同的场景可以从载板上完全成熟的IPMI实现中受益,无论模块是托管还是非托管,都可以定制特定功能(图3)。
图 3.模块和载板可以具有不同的 IPMI 支持成熟度,但彼此之间仍可互操作,从而实现各种系统设置 - 从具有四个受管模块的单个非托管载波到具有非托管模块的托管载波。
总会有系统设计人员不想要任何管理功能。总会有系统设计人员想要最少的管理功能。因此,优先考虑所有模块管理层之间的互操作性非常重要。但同样重要的是,设计师能够获得尽可能多的资源。
授予对系统资源的访问权限越多,IPMI 就越强大。访问和电源之间的这种关系是新的 COM-HPC 规范具有一些特定接口的原因,这些接口提供最全面的系统管理功能。首先是智能平台管理总线(IPMB)接口,它允许载板BMC访问模块管理控制器(MMC)。
但规格不仅限于此总线。专门用于载板 BMC 的一个新接口是专用的独立 PCI 快速通道,它包括并驱动图形控制器。
专用于 IPMI 的其他接口包括 I2C 接口、USB 端口和电源按钮控件。通过这些专用的 IPMI 通道(也可通过 BMC 远程访问),系统管理员可以控制几乎整个平台行为,以实现最佳 QoS、最短停机时间和最高效的远程维护。
举几个例子:
I2C 接口可用于访问模块上的 EEEP 数据。
USB 端口可用于模拟 USB 设备,如键盘和鼠标或 DVD 驱动器。
电源控制可用于远程打开/关闭系统。
电源控制可用于在 BMC 执行其他平台初始化时延迟系统启动。
因此,新的 PICMG COM-HPC 子规范为全面的 IPMI 平台管理功能铺平了道路。工程师可以开始考虑实施IPMI的硬件设计原理图。同时,模块供应商及其合作伙伴可以处理 BMC 和 MMC 实现,例如利用 SP-X 和/或开放标准固件(如 OpenBMC)(图 4)。
图 4.市场上首批康佳特COM-HPC客户端模块配备了11种英特尔至强、酷睿和赛扬处理器(代号为虎湖优和虎湖H)。康佳特入门套件带有eval载板和冷却解决方案,已经过功能验证。按需支持客户特定的 COM-HPC PMI 实施变体。
OpenBMC 是用于服务器、机架顶部交换机、RAID 装置和其他设备中使用的管理控制器的 Linux 发行版。OpenBMC 使用约克托、开放嵌入式、系统化和 D 型总线来轻松定制平台。它完全符合 DCMI 的 IPMI 2.0 标准,并具有电源、冷却、LED、库存、事件和看门狗等主机管理功能。
OpenBMC 还提供广泛的接口选择,从远程 KVM、基于固态混合的 SOL 和基于网络的用户界面,到基于 REST 和 D 总线的接口。工程师受益于硬件仿真以及自动化测试功能。对多个 BMC/BIOS 映像的代码更新支持完善了最近的功能集。
结论
对于系统构建商来说,一个主要的好处是,尽管PICMG COM-HPC模块上的计算机规范是全新的,但它包括经过验证的IPMI和红鱼管理技术,可以在此基础上进行创新。
这肯定会为PICMG新的COM-HPC计算机模块规范的接受提供动力。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !