企业每年产生数百 ZB (Zettabyte) 的数据,并在争相将这些信息转化为洞察。NVIDIA cuDF 和 cuVS 作为基于 NVIDIA CUDA-X 构建的加速数据库,正在被各行业的数据平台所应用,带来至高 5 倍性能提升的同时,可降低结构化和非结构化数据处理成本。
这些库已与全球广泛使用的开源数据引擎集成 (开发者月度下载量超过 2 亿次),并在企业数据平台、数据库和数据湖中得到广泛应用。这有助于企业组织加速创新、开发更准确的模型,并在处理更多数据的同时有效控制成本。
针对结构化数据,NVIDIA cuDF 可加速 Apache Spark、Presto、DuckDB、Polars 和 Velox 等开源数据处理引擎。与仅使用 CPU 的部署方式相比,处理速度可提升高达 5 倍。
对于非结构化数据 (目前占企业数据总量的 80%,并且正迅速增长),NVIDIA cuVS 可加速 FAISS、Amazon OpenSearch Service 和 Milvus 等领先引擎,有助于智能体和应用在极短的时间内从海量文本、图像和视频中提取上下文、事实和建议。
为企业数据处理平台提供支持
谷歌云集成了 NVIDIA cuDF,以加速 Dataproc 中的 Apache Spark。此外 cuDF 可轻松在 Google Kubernetes Engine (GKE) 中使用,将大规模 ETL 任务的处理时间从数小时缩短至数秒,同时降低计算成本。
Snap 为超过 9.46 亿活跃用户服务,基于 GKE 的 NVIDIA cuDF 将日常数据处理成本降低了 76%,能够在 3 小时内分析 10 PB 数据,节省数百万美元。
Snap 首席信息官 Saral Jain 表示:“与 NVIDIA 和谷歌云的合作帮助我们更快地为全球超过 10 亿 Snapchat 用户提供创新服务。通过降低数据处理成本,并实现对 PB 级数据的跨规模实验,我们能够更快且更高效地提供 AI 驱动的体验。”
IBM watsonx.data 是一个混合型开放数据平台,包括像 Apache Spark 和 Presto 引擎这样的开源分析引擎,用于结构化数据处理,此外还包括基于 OpenSearch 的向量引擎。在与雀巢的 Order-to-Cash 市场早期实验中,结合 NVIDIA cuDF 加速的 watsonx.data 工作负载运行速度提升了五倍,同时节省了 83% 的成本。
雀巢首席信息和数字官 Chris Wright 表示:“对于一家为数十亿人服务的公司来说,数据是支撑我们全球运营决策的基石。通过与 IBM 和 NVIDIA 合作,我们开展了一项有针对性的概念验证,成功实现了在几分钟内刷新全球运营数据,同时节省成本。我们现在的重点是将这一能力转化为切实的业务影响,进一步提升制造和仓储等领域的决策速度,并将这些能力在整个企业范围内扩展。”
基于 NVIDIA 技术的 Dell AI Data Platform 提供加速数据引擎,使企业能够快速、安全地利用 AI 就绪型数据启动其 Dell AI Factory。该平台采用基于 Apache Spark 的处理引擎,并借助 NVIDIA cuDF 加速,实现高达 3 倍的性能提升,并配备 NVIDIA cuVS 加速的企业级向量数据库,在向量索引处理方面相较于 CPU 至高提升 12 倍吞吐量。
戴尔科技集团董事长兼首席执行官 Michael Dell 表示:“专为代理式 AI 打造的 Dell AI Data Platform 搭载 NVIDIA 技术,采用加速数据处理引擎,可在数小时内 (而非数天内) 将多模态数据转换为 AI 就绪数据。”
Oracle 宣布,Oracle Private AI Services Container 使用 NVIDIA cuVS 大幅加速 Oracle AI Database 中的向量索引创建,帮助企业利用最新信息加速 AI 决策。
Oracle 首席执行官 Clay Magouyrk 表示:“企业 AI 正从实验阶段转向生产阶段。Oracle AI Database 结合 NVIDIA 技术,可在数分钟内提供 AI 就绪数据,使得以前无法实现的应用成为现实。”
NVIDIA cuDF 和 cuVS 获得了领先企业数据平台的支持,包括 EDB Postgres AI、NetApp、Snowflake、Starburst 和 VAST Data,为 AI 驱动的数据处理的未来奠定基础。
全部0条评论
快来发表一下你的评论吧 !