电子说
如今,在我们所有人都学着如何在家生活、办公、学习的时候,作为支持我们新常态的工具,视频流的重要性日益凸现。具体而言,使用视频直播平台将帮助我们与亲友保持联系,确保我们的子女能够继续完成既定学业,必要时我们还可以与自己的医生进行面对面交流。作为一种新兴技术,视频直播将继续在我们的生活中发挥重要作用。
这个领域将发生爆发式增长。到 2026 年,视频直播的市场规模预计将接近 940 亿美元。此外,与 Netflix 和 HBO 等非视频直播平台相比,诸如 Twitch 和 YouTube 游戏这样的视频直播平台将吸引更大批的观众。
思科的视觉网络指数表明,到 2022 年,仅视频一项就将占据全部网络流量的 82%。该流量中的“直播”部分毫无疑义地在增长,并即将成为网络流量中比重不断增大的组成部分。实时视频转码与处理所需的计算强度极大。赛灵思已帮助其客户解决了这个问题,同时提高了计算效率并降低了总体拥有成本 (TCO)。
视频直播提供商面临的最大问题是,他们必须为支持其网络而支付出口带宽成本。例如,如果带宽成本能够降低 30%,就能给运营费用带来实质性影响。如果一个流媒体平台有大约 10 万个并发流媒体,那么额定带宽成本大约为每年 7,300 万美元。在这种假设情况下,如果平台运营方能够在保持视频画质不变的前提下将成本降低 30%,那么每年就能够节省 2,200 万美元的成本。
这种情况实际上并非假设,而是切实影响当今实时视频流平台的紧急状况。以中国最大的游戏直播平台虎牙直播 (Huya.com) 为例。从该公司近期向美国证券交易委员会备案的财报来看,因为用户数量增加以及该公司企图通过改进平台上的视频画质来提升用户体验,虎牙直播 2019 年第四季度(日历季度)的带宽成本上涨 40%。不断增长的带宽成本和运营成本是真实存在的问题,正在对这些提供商的业务模式提出挑战。
下图准确表现了大多数视频直播平台运营商正在面临的境况。正如生活中的大部分事物一样,帕累托原理也同样适用于网络中的流量模式。在这个示例中,大约 20% 的主播占用了约 80% 的流量,因此对推高带宽成本应承担大部分责任。网络的首端显然是运营商关注的焦点区域,但网络也有另一端,那就是尾端。在这里,运营商关心的是如何以尽可能低的成本实现所有基础设施,从而为面对较小受众群体的所有其他主播提供支持。这里的目标不在于对运营费用的管理,而是关注于如何才能更有力地管理资本开支,从而在尽可能增大通道密度的前提下尽量降低单通道成本。如何在网络中平衡这两项要求持续成为运营商面临的挑战。
为解决视频直播平台运营商面临的挑战,赛灵思近期推出了一系列专用的视频转码一体机,它基于赛灵思新型的实时(RT)服务器参考架构(围绕赛灵思 Alveo 系列数据中心加速器卡构建)开发而成。最初的赛灵思 RT 服务器参考架构可支持两种视频转码版本:一个注重在最低比特率下提供最高视频画质;另一个注重在最低的单通道成本下提供极高的通道密度。基于这两种参考架构的服务器一体机由赛灵思经销商和 OEM 厂商实施,将预先配置最多 8 块 Alveo U50 卡或新的 Alveo U30 加速器卡。U30 加速器于近期推出,是一款专门的媒体加速器,最多可支持两个 4KP30 通道。分辨率可进一步细分,每卡可支持 16 个 1080p30 通道。在集成到 1RU 外形尺寸的 RT 服务器后,该应用能支持 128 通道 1080p 视频。针对为受众群体极小的这些尾端主播提供支持这一方面来说,这算是密度极大的实现方案。Alveo U30 采用赛灵思 Zynq UltraScale+ MPSoC 全可编程 SoC,同时基于该系列的 EV 版,即内置硬化视频编解码器单元(VCU)的版本。由于 Alveo U30 主要使用 VCU,大量 FPGA 架构可用于支持更多功能。赛灵思正在准备移植其深度学习处理单元 (DPU),以支持视频分析领域中的更多用例。HEVC 编解码器的 Alveo U50 实现方案基于由 NGCodec 开发的广受推崇的 NGCodec HEVC 算法。赛灵思在大约一年前收购了 NGCodec,这是该 HEVC 编解码器在收购后首次实现商业化。
赛灵思准备使用这些一体机解决视频直播市场中的多个现有的和新涌现的用例。其中一个主要的应用重点是电子竞技。类似于 Twitch 这样的平台已经受到很大的追捧,不仅是针对游戏内容而言,更是作为直播平台而言。在中国和美国以外的其他市场有众多平台提供类似的服务。企业协作是另一个重点领域。新冠疫情期间涌现出大量用例,如远程医疗、远程教育和社交视频协作网站,都需要可靠性高、可扩展的视频直播平台。
RT 服务器一体机基于业经验证的赛灵思软件协议栈。系统采用异构形式,最多能够搭载 8 块 Alveo U50 或 Alveo U30 加速器。与 Alveo 硬件配套的是 X86 处理器。虽然视频转码被卸载到 FPGA 或 VCU,像 AMD“Rome”Epyc 这样的高性能 CPU 能解决其他复杂的工作负载,如音频处理、广告插入,或者也可托管用于转码通道管理的 Wowza Streaming Engine 服务器等 GUI 应用。在硬件层之上,赛灵思为运行在 FPGA 上的特定算法功能开发了加速器二进制文件。赛灵思运行时 (XRT) 运行在这些二进制文件的上方,负责向软件层提供硬件内核。赛灵思媒体加速 (XMA) API 负责提供实现转码微服务所需的硬件加速解码、视频处理和编码功能。用户通过 FFmpeg 命令行就能寻址赛灵思 API。FFmpeg 广泛应用于视频转码领域。大多数用户熟悉也乐于使用这个 CLI。对于非 CLI 的用途,赛灵思正在与经销商和 Wowza 合作,共同将 Wowza Streaming Engine 媒体服务器整合到由赛灵思经销商提供的 RT 服务器一体机中。Wowza 集成的工作预计将在 2020 年夏季完成。
相对于基于软件的传统实现方案而言,RT 服务器参考架构的比特率优化版拥有显著的竞争优势。在下图中,搭载 8 块 Alveo U50 的单个 HP ProLiant DL385 Gen 10 Plus 服务器(可通过访问 hpe.com 配置),等同于 5 个搭载 10 块英特尔 8275CL 3.0GHz CPU 的 HPE ProLiant DL380 Gen 10 服务器。与替代实现方案相比,赛灵思参考架构每节点吞吐量是它的 5 倍,硬件成本降低 6 倍,功耗降低 3 倍。详细了解如何使用 HPE 提供的 COTS 设备构建功能强大的转码一体机,请点击此处观看视频。
RT 服务器的高密度版搭载 8 块 Alveo U30,集成在 1RU 机柜中,目前赛灵思经销商已开始供货。要在相当于 NVENC“中等”质量的条件下处理同等 1080p480 HEVC,需要搭载 32 块 Nvidia Tesla T4 加速器的四个 HPE ProLiant DL380 Gen 10 服务器。与等效 Nvidia 实现方案相比,赛灵思一体机吞吐量是其 4 倍,硬件成本降低 6 倍,功耗仅相当于它的 20%。
赛灵思 RT 服务器视频一体机目前已提供评估,可通过 hpe.com 购买比特率优化型 Alveo U50 版本,或通过授权赛灵思增值经销商购买。
全部0条评论
快来发表一下你的评论吧 !