电子说
2026 COMPUTEX 主题演讲上,黄仁勋讲了将近两个小时。媒体头条几乎都被同一句话占据: Windows 终于迎来真正的 AI PC 。这次不是 PPT,不是路线图——NVIDIA 联手微软,把 RTX Spark 同时推出笔记本、桌面、工作站三种形态,规格、伙伴 OEM、Adobe / Rhino / Blender 的适配演示一次性摆齐。
也就是说,过去一年自媒体反复讲的"NVIDIA 要做 AI PC",到这次发布会变成了 有具体芯片、具体厚度、具体生态合作的产品线 。先把核心规格放上来:
这是这一代 PC 真正的拐点: 不只是性能升级,而是 PC 的角色从"打开应用、点击、输入"变成"给目标、Agent 调度工具完成" 。黄仁勋把它类比成"手机变智能手机"——10 年后的 PC,打开应用可能不再是主要交互方式。
这篇调研想搞清楚三件事:
NVIDIA 的"本地 AI 工作站"路线,按时间线看是这样走过来的:
RTX Spark 这一代产品的核心设计:
三种产品形态,对应不同人群:
| 形态 | 关键规格 | 面向人群 |
|---|---|---|
| RTX Spark 笔记本 | 14mm 厚、约 3 磅、14–16 英寸、tandem OLED、铝合金机身 | 移动办公 + 游戏 + 创作 |
| RTX Spark 桌面 | mini 主机形态,24×7 常驻 Agent,连接家电、安防、摄像头 | 家庭 AI 主机 |
| DGX Station for Windows | 748GB 内存、20 PFLOPS、8 TB/s 内存带宽 | 模型开发者、Agent 开发者,本地跑万亿参数 |
它的同类还包括:
需要说明的是, RTX Spark 笔记本的 OEM 整机价格、上市时间、续航与满载降频曲线,发布会上并没有完整给出 。下文价格调研里涉及笔记本的部分按"区间估算"处理,等首批 ASUS / Dell / Lenovo 整机正式开卖再校准。
要理解这件事的份量,得回到 PC 行业过去三十年的底层规则。
Wintel 时代的竞争规则 :CPU 跑分、x86 指令集兼容性、主板生态、OEM 渠道。所有人盯着 CPU,Intel Inside 是品质标签,AMD 在同一套规则里追赶。GPU 是配件,不是主角。
Apple Silicon 时代的局部颠覆(2020 起) :M 系列证明了 ARM + 统一内存 + 自研 GPU 在能效比上的优势,但苹果把 CUDA 拦在门外,整个故事只在自家围墙里讲,PC 阵营没动。
NVIDIA 的切入则同时换了两个东西:
换句话说,NVIDIA 不是在原有的 PC 跑分赛道里赢,而是 把赛道整个换掉 :以后比的是单位功耗的 AI 算力 + 开发者生态深度。
这件事真正的颠覆性,不在于跑分多高,而在于三件事同时发生:
这一仗的真正看点,是四家厂商各自被点到的位置不同,反击姿态也不同。
cuda:0,不是 xpu:0传统消费级 GPU 的瓶颈不是算力,而是显存。RTX 4090 24GB 显存,跑 70B FP16 模型直接放不下。本地大模型用户被迫走两条路:要么大幅量化(精度损失),要么靠 CPU offload(速度暴跌)。
统一内存架构(苹果 M 系列、AMD APU、NVIDIA Grace Blackwell)把这道墙拆掉:CPU 和 GPU 共享同一个 128GB 物理池子。
RTX Spark 这一代关键带宽参数:
所以判断仍然成立: 笔记本 / 桌面形态主要为推理和小规模微调优化,不替代 H200 / B200 ;DGX Station for Windows 才是首次把"接近数据中心带宽"装进个人桌面的产品。
发布会上黄仁勋单独花时间讲了 Vera CPU(数据中心侧的下一代 CPU),其中一个核心观点对理解 RTX Spark 也很关键:
过去 CPU 为人服务,响应时间以秒为单位;现在 CPU 要为 Agent 服务,Agent 频繁调用工具、访问数据库、运行代码、检索记忆,每一步都要求更低延迟。
Vera CPU 关键参数:88 个 Olympus 核心、单片网格连接(不分 chiplet)、PCIe Gen 6、内部互联 3.6 TB/s、内存带宽 1.2 TB/s,相比 x86 在 Agent sandbox 场景下性能 1.8 倍,SQL 性能 3 倍,实时流处理 6 倍。
这条逻辑映射到 RTX Spark 上是: 它不只是给推理用,还要给 Agent 频繁的工具调用、文件 I/O、浏览器编排服务 。这是和苹果 M 系列、AMD Strix Halo 路线的隐性分歧——后者主要为"端侧推理快"优化,NVIDIA 这次明确为"Agent 工作流"优化。
CUDA 的护城河不在于 API 设计,而在于:
任何对手要追,不是写一个 ROCm / MLX / oneAPI 就够,而是要让这套存量从 CUDA 迁移出去。这件事 AMD 和 Intel 努力了好几年,进度仍然慢。
RTX Spark 笔记本用的是与联发科合作的 20 核 Grace ARM CPU,跑的是 Windows,必然继承高通 Snapdragon X 路线踩过的坑:
黄仁勋说这台电脑要"运行所有东西"——传统 Windows 应用 + CUDA 全栈 + 图形工作流 + AI 应用 + 数字生物 / 地震处理 / 基因组学等专业软件。这件事 演示视频上能跑通,不等于上市后买家在自家机器上每天都顺 。Prism 翻译层成熟度、第三方驱动适配速度、ARM 原生版本的覆盖率,是首批用户实测时最该盯的指标。
即使硬件齐了,要把"7×24 小时本地大模型"用起来,还要解决:
很多人会发现, 买盒子简单,用好难 。这和 NAS 早期一样——能跑不等于能融入日常工作流。
发布会数据漂亮,但真要决定"装不装一台",得把硬件、电费、API 单价摆到一张表上算。下面价格按 2026 年 6 月公开行情整理, RTX Spark 新品 OEM 笔记本与桌面定价未完全公布,标记为"预估区间" ,等首批整机上市后再校准。
| 产品 | 配置要点 | 起售价(约) | 适合场景 |
|---|---|---|---|
| NVIDIA DGX Spark Founders Edition (已售) | GB10 + 128GB 统一内存 + 4TB NVMe | $3,999 | AI 开发者首选;CUDA 全栈 |
| DGX Spark OEM 版 (ASUS / Dell / HP / Lenovo / MSI) | 同芯片,不同外壳与配件 | $2,999 起 | 价格更友好,同性能 |
| RTX Spark 笔记本 (COMPUTEX 2026 发布,预估) | Blackwell RTX + 20 核 Grace + 128GB + tandem OLED | $2,800–4,500(预估) | AI PC 旗舰本,Agent 工作流 |
| RTX Spark 桌面 mini (预估) | 同芯片,桌面散热,24×7 常驻 Agent | $2,500–3,500(预估) | 家庭 AI 主机 |
| DGX Station for Windows (旗舰) | 748GB 内存 + 20 PFLOPS + 8 TB/s 内存带宽 | 预计 $15,000+ | 本地跑万亿参数,开发者旗舰 |
| Apple Mac Studio M3 Ultra(基础) | 96GB 统一内存 | $3,999 | macOS 生态、MLX 推理 |
| Apple Mac Studio M3 Ultra(顶配) | 512GB 统一内存 + 16TB SSD | $9,499–14,099 | 本地跑超大模型上限最高 |
| AMD Ryzen AI Max+ 395 迷你主机 (GMKtec EVO-X2、Beelink GTR9 Pro 等) | 128GB 共享内存,96GB 可分配给 GPU | $1,800–2,400 | 性价比最高的 Windows/Linux 路线 |
| Framework Desktop (Strix Halo) | 128GB 配置 | $1,999 起 | 可维修、模块化 |
| RTX 5090 自组工作站 | 32GB GDDR7 单卡 + Ryzen 9 + 64GB DDR5 | $3,500–4,500 | 单卡上限受 32GB 显存限制 |
| 双 RTX 5090 工作站 | 2×32GB + 服务器主板 | $6,500–8,500 | 64GB 显存,能跑 70B FP8 |
| Snapdragon X Elite 笔记本 | 32–64GB 统一内存 | $1,000–2,000 | 端侧小模型,跑不了大模型 |
注:DGX Spark 桌面盒子和 RTX Spark 笔记本是 两条不同的产品线 ——前者是 2025 年已经在卖的 AI 开发者桌面机,后者是 2026 COMPUTEX 上发布的 AI PC 笔记本/桌面/工作站新阵列。价格上 RTX Spark 笔记本预估比 DGX Spark 桌面再贵一档,因为多了屏幕、电池、铝合金机身和移动散热。
电费 (以中国大陆居民电价 ¥0.6/kWh 估算;美国家庭电价 ~$0.16/kWh 可对应换算):
| 设备 | 满载功耗 | 24×7 月电费(¥) | 24×7 月电费($) |
|---|---|---|---|
| DGX Spark | ~170W | ¥73 | $19 |
| Mac Studio M3 Ultra | ~480W(峰值) | ¥207(满载) /¥60(典型混合负载) | $54 / $16 |
| Ryzen AI Max+ 迷你主机 | ~120W | ¥52 | $14 |
| RTX 5090 单卡工作站 | ~600W(满载) | ¥259(满载) /¥90(典型) | $68 / $24 |
| 双 5090 工作站 | ~1200W(满载) | ¥518(满载) | $135 |
实际负载远低于满载(生成时高、待机低)。 单卡桌面方案月电费现实区间约 ¥50–150 ,对家庭用户不构成主要成本。
附加成本 :
按 2026 年 6 月公开定价整理,常用旗舰模型:
| 模型 | 输入(**/百万 token) | 输出(**/百万 token) |
|---|---|---|
| Claude Opus 4.x | $15 | $75 | |
| Claude Sonnet 4.x | $3 | $15 | |
| Claude Haiku 4.5 | $1 | $5 | |
| GPT-5 旗舰档 | $10–15 | $40–60 | |
| GPT-5 mini | $0.25 | $2 | |
| Gemini 2.5 Pro | $1.25–2.5 | $10–15 | |
| Qwen-Max(阿里云) | ¥20 / 百万 token | ¥60 / 百万 token |
| DeepSeek-V3 | ¥2 | ¥8 |
Token 消耗参考 :
把 DGX Spark $3,000 OEM 价 + 3 年折旧 + 月电费 ¥73 摊到月度:
月度自养成本 ≈ $83(硬件折旧)+ $19(电费)≈ $102 / 月
这意味着只要你 在云端 API 上每月花超过 $100 ,DGX Spark 就开始有账面优势。
但有两个隐藏前提:
不同用户画像下的盈亏判断 :
| 用户画像 | 月均 token 用量 | 月度云端成本 | 建议 |
|---|---|---|---|
| 轻度用户(每天几次问答) | < 50 万 | < $30 | 租云,本地不划算 |
| 中度知识工作者(重度笔记 + 写作) | 50–300 万 | $30–150 | 临界,看是否在乎数据隐私 |
| 重度开发者(Cursor / Claude Code 日常使用) | 300 万–2000 万 | $150–1500 | 混合:本地跑日常补全 + 云端调旗舰 |
| 内容批量处理 / Agent 跑任务 | > 2000 万 | > $1500 | 本地优势明显,但仍需云端处理峰值 |
| 隐私 / 合规强约束(法律 / 医疗 / 政务) | 任意 | 任意 | 本地是唯一选项,账算不算得过都得装 |
只看月度账单会漏算几件事:
把这五条加进去, 真正纯粹的"本地划算"场景,比账面看起来窄 。
第一类:发布会与真实体验之间的鸿沟
黄仁勋擅长讲叙事,但参数 PPT 和真实日常使用差距常常很大。RTX Spark 笔记本"14mm 厚 + tandem OLED + 1 PFLOPS FP4"看起来很漂亮,但需要重点观察:
这些数据要等首批买家实测才能算数。
第二类:本地常驻 AI 的隐性成本被低估
不少人把"本地跑大模型"和"省 API 钱"画等号,但忽略:
对 90% 的轻度用户,"自己养"算不过账。它真正服务的是:高频重度用户、隐私敏感场景、长上下文 / 大批量处理、需要自定义微调的开发者。
第三类:API 路线不会输
云端模型(Claude、GPT、Gemini、Qwen-Max)在能力前沿、上下文长度、工具调用集成、多模态能力上仍持续领先。本地大模型即使能跑 200B,也通常落后云端旗舰 6-12 个月。"本地能用"不等于"本地够用"。
真实未来可能是 混合 :日常重复任务跑本地(隐私、便宜、低延迟),关键复杂任务调云端(强模型、最新能力)。Cursor / Cline / Claude Code 这类工具未来大概率都会支持本地后端 + 云端旗舰的灵活切换。
第四类:地缘与供应链
一句话定性 :2026 COMPUTEX 上 NVIDIA + Microsoft 联手推出的 RTX Spark 产品线,真正的意义不是参数跑分,而是 第一次把"本地常驻大模型 + Agent 工作流"做成一条从笔记本到工作站的完整产品线 ,并借势把 CUDA 全栈搬上 Windows,重新定义"AI PC"这个品类。
是否跟进 :观望偏跟进。
具体分场景:
下一步行动 :
附上几个我自己想到的方向,供讨论起点:
但说到底, 真正决定这台机器有没有价值的,不是它能跑多大模型,而是你能不能为它设计出一个值得 7×24 小时常驻的工作流 。硬件已经在 NVIDIA、Apple、AMD、高通手里推到这个位置了,剩下的题,得我们自己解。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !