远程管理功能(包括带外管理)是 IT 管理员的标准功能。这些功能包括监控系统功能、安装新的更新和补丁以及解决问题,而无需实际出现在服务器机房中。
许多 IT 服务提供商远程访问客户的本地服务器或将它们托管在云中的某个位置是标准做法。随着新的 PICMG COM-HPC 接口规范(图 1)的到来,支持这种久经考验的实践的远程管理能力将扩展到边缘服务器和网关层技术。实现数字化和 IIoT、边缘服务器和网关层技术需要远程管理能力来克服企业级 IT 和工业级运营技术 (OT) 之间的差距。COM-HPC 标准是为新的分布式边缘计算层设计的。因此,这一新 IT 层的服务提供商需要类似于分布式本地或云设备的全面远程管理功能。
基于计算机模块设计边缘层平台的工程师通常希望以可以根据特定需求定制的方式实现这些功能。针对这一需求,PICMG 引入了用于系统管理的 COM-HPC 子规范。为了不重新发明轮子,COM-HPC 子规范的部分内容将借鉴智能平台管理接口 (IPMI) 规范。
让我们深入研究专用于系统管理接口的 COM-HPC 子规范,以了解它如何使 COM-HPC 设计受益。
寿命和稳定性很重要
改进边缘服务器 QoS 的工作落到了 IPMI 身上,因为它自 1998 年以来一直存在,在 2001 年和 2004 年发布的附加修订后达到了稳健的状态,并得到普遍接受。PICMG 小组委员会还使用了 Redfish 规范,该规范基于 Representational State Transfer (RESTful) API 并继续发布新功能。
IPMI 规范定义了用于监视和管理计算机子系统的协议、接口和体系结构(图 2)。IPMI 标准化了描述低级硬件的格式以及从板管理控制器 (BMC) 发送和接收消息的格式。
图 2. IPMI 调用可以通过网络发送到远程系统或本地子系统。在大多数情况下,系统的模块化是将 IPMI 功能扩展到子系统(例如计算机模块)的原因。
IPMI 消息可以通过网络发送到远程系统的 BMC,也可以从 BMC 发送到本地子系统,例如电源。这种关于发送 IPMI 消息的多功能性使得可以将复杂的管理任务划分为几个子区域。
这些消息可以查询硬件的当前状态或指示 BMC 采取行动——例如,指示 BMC 增加系统冷却、告诉系统重新启动或读取传感器。将管理任务卸载到专用的物理硬件组件可以减轻主机硬件和操作系统的负担。IPMI 规范还将系统管理与目标平台分离,以便即使在目标平台关闭时也可以启动系统管理功能。
所有这些功能使 IPMI 规范成为管理服务器硬件的事实标准。规范的寿命得到了保证,因为规范的开发者故意使所需的命令非常简单,不留任何误解的余地。
IPMI 规范的灵活框架支持在原始规范的强制和可选命令之外添加新的网络功能 (NetFn) 和指令。各种行业工作组已经从这种自由中受益,并定义了自己的特定网络功能和命令来处理规范创建期间未考虑的技术和特性。
许多远程管理选项
对于模块化计算机系统,灵活的框架简化了添加远程管理所需的调整。一项调整涉及 COM-HPC 嵌入式 EEPROM (EEEP)。EEEP 包含有关供应商、内存插槽、网络功能等的信息。其中大部分信息与存储在 IPMI 现场可更换单元 (FRU) 中的信息相同。为避免重复此数据,COM-HPC 远程管理功能包括有关 IPMI 设备应如何使用 EEEP 设备中包含的信息填充 FRU 的建议。
鉴于 COM-HPC 模块的市场范围很广,包括远程数据中心、雾/边缘服务器和远程安装,拥有灵活的远程管理选项范围很重要。开发人员还必须考虑到该标准为模块和载板指定了非常不同的 IPMI 支持成熟度级别。
模块的 IPMI 成熟度级别从非托管模块 (MU) 和基本托管模块 (MB) 到完全托管模块 (MF)。载板级别范围从非托管 (CU) 到托管载板 (CM)。规范中详细解释了这些差异,但在这个阶段最重要的是要知道所有这些模块和载板仍然可以互操作。
COM-HPC IPMI 规范允许所有类型的载板与所有类型的模块一起正确运行。
平台灵活管控
PICMG COM-HPC IPMI 小组委员会意识到,需要基本管理功能的各种场景无法通过一刀切的解决方案提供服务。因此,多种模块和载体设计组合可用于诸如打开和关闭系统电源或告诉系统获取网络信息等任务。
例如,当使用最多四个模块的单个载板时,每个模块具有独立的完整管理能力会更有效。然而,不同的场景可能会受益于载板上成熟的 IPMI 实施,无论模块是托管还是非托管,都可以针对特定功能进行定制(图 3)。
图 3. 模块和载板可以具有不同的 IPMI 支持成熟度级别,但仍可相互操作,从而实现各种系统设置——从具有四个托管模块的单个非托管载体到具有非托管模块的托管载体。
总会有系统设计者不想要管理功能。并且总会有系统设计人员需要最少的管理功能。因此,重要的是优先考虑所有模块管理层之间的互操作性。但设计师能够访问尽可能多的资源也很重要。
授予对系统资源的访问权限越多,IPMI 就越强大。访问和权力之间的这种关系就是为什么新的 COM-HPC 规范有一些特定的接口来提供最全面的系统管理功能。其中首先是智能平台管理总线 (IPMB) 接口,它允许载板 BMC 访问模块管理控制器 (MMC)。
但规范不限于此总线。一种专门用于载板 BMC 的新接口是专用的独立 PCI Express 通道,它包括并驱动一个图形控制器。
IPMI 专用的其他接口是 I2C 接口、USB 端口和电源按钮控件。通过这些专用 IPMI 通道(也可通过 BMC 远程访问),系统管理员可以控制几乎整个平台行为,以实现最佳 QoS、最短停机时间和最有效的远程维护。
举几个例子:
I2C 接口可用于访问模块上的 EEEP 数据。
USB 端口可用于模拟 USB 设备,例如键盘和鼠标或 DVD 驱动器。
电源控制可用于远程打开/关闭系统。
电源控制可用于延迟系统启动,同时 BMC 执行额外的平台初始化。
因此,新的 PICMG COM-HPC 子规范为全面的 IPMI 平台管理功能铺平了道路。工程师可以开始考虑实施 IPMI 的硬件设计原理图。同时,模块供应商及其合作伙伴可以开展 BMC 和 MMC 实施,例如利用 SP-X 和/或 OpenBMC 等开放标准固件(图 4)。
图 4. 市场上第一款康佳特 COM-HPC 客户端模块配备了 11 种 Intel Xeon、Core 和 Celeron 处理器(代号为 Tiger Lake U 和 Tiger Lake H)。带有评估载板和冷却解决方案的康佳特入门套件已经过功能验证。按需支持客户特定的 COM-HPC PMI 实施变体。
OpenBMC 是用于服务器、架顶式交换机、RAID 设备和其他设备的管理控制器的 Linux 发行版。OpenBMC 使用 Yocto、OpenEmbedded、systemd 和 D-Bus 来轻松定制平台。它完全符合 DCMI 的 IPMI 2.0 标准,并具有主机管理功能,例如电源、冷却、LED、库存、事件和看门狗。
OpenBMC 还提供广泛的界面选择,从远程 KVM、基于 SSH 的 SOL 和基于 Web 的用户界面,到基于 REST 和 D-Bus 的界面。工程师受益于硬件模拟以及自动化测试功能。对多个 BMC/BIOS 映像的代码更新支持完善了最近的功能集。
结论
系统构建者的一个主要好处是,尽管 PICMG COM-HPC 计算机模块规范是全新的,但它包含了经过验证的 IPMI 和 Redfish 管理技术,可以在此基础上进行创新。
作者:Jessica Isquith,Aaron Pop,David Wise
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !