苹果 M3 Ultra + 双英伟达 DGX Spark 并联,AI 性能提升 2.8 倍
IT之家 10 月 17 日消息,苹果EXO Labs 昨日展示了其“分布式推理”新成果,双英解决了被部分网友戏称为“世纪难题”的伟达漳州市某某电气运营部选择问题 —— 买 AI 小主机究竟是买苹果 Mac Studio 还是买英伟达 DGX Spark?
如图所示,EXO Labs 同时使用了两台 NVIDIA DGX Spark 与一台搭载 M3 Ultra 芯片的并联倍 Mac Studio,在 AI 大语言模型推理测试中取得 2.8 倍性能提升。提升
![]()
该成果基于 EXO Labs 的苹果开源项目 EXO,该框架旨在让大语言模型(LLM)能够高效运行于不同硬件的双英混合环境中。
与传统仅依赖单一 GPU 或加速器的伟达推理方式不同,EXO 可将工作负载自动分配到多种设备上,并联倍使台式机、提升笔记本、苹果漳州市某某电气运营部服务器甚至平板电脑与智能手机组成类似 WiFi Mesh 网络的双英“AI Mesh”。
DGX Spark 与 M3 Ultra 的伟达互补组合
正如 EXO 所述,3999 美元(IT之家注:现汇率约合 28505 元人民币)的并联倍 DGX Spark 侧重计算性能,而 5599 美元(现汇率约合 39910 元人民币) Mac Studio 则在数据带宽上更具优势。提升在这里,EXO 直接将两台 DGX Spark 与一台 Mac Studio 组合成统一的 AI 系统。
![]()
大型语言模型的推理过程通常分为两个阶段:
- 预填充(prefill)阶段:模型读取和处理输入提示,这一阶段主要受计算性能限制;
- 解码(decode)阶段:模型逐个生成新词元(token),此过程更依赖内存带宽。
![]()
EXO 的方案是将两阶段分配给不同设备执行:
DGX Spark 负责计算密集的预填充任务,而 M3 Ultra 负责带宽敏感的解码任务。系统通过逐层传输模型的内部数据(称为 KV 缓存),实现两台设备的同时工作,而非依次等待。
在使用 Meta Llama-3.1 8B 模型进行的基准测试中,该混合架构相较单独使用 Mac Studio,推理性能提升 2.8 倍。测试中 DGX Spark 的预填充速度比 Mac Studio 快 3.8 倍,而 Mac Studio 的生成速度又比 DGX Spark 快 3.4 倍,实现了性能互补。
![]()
“分布式推理”助力低成本扩展 AI 算力
EXO 的实验展示了一种不同于传统单机加速的 AI 扩展思路。未来 AI 性能的提升,或不再依赖单一大型加速器,而是通过更智能的硬件协同实现整体算力的提升。
类似的理念也出现在 NVIDIA 自家的新一代 Rubin CPX 平台设计中:计算密集型的上下文构建由 Rubin CPX 处理器完成,而具有高带宽 HBM3e 内存的标准 Rubin 芯片负责解码阶段,与 EXO 在现成硬件上实现的原理一致。
EXO 1.0 仍处早期阶段
EXO 当前的早期访问版本 1.0 仍属实验性质,尚未全面公开。现有的开源版本 0.0.15-alpha 发布于 2025 年 3 月,后续版本计划引入自动调度、KV 流式传输和异构硬件优化功能。
目前 EXO 仍是研究级工具,尚不适合普通消费者直接使用,但其演示结果表明:通过智能调度不同硬件资源,分布式推理架构能在无需大型数据中心的前提下显著提升 AI 性能。
(责任编辑:焦点)
-
鞋履和衣服一样,不是款式越独特越时髦,却是越经典越迷人。的确,岁月给我们带来的,不再是繁华若目的审美,我们开始对长期主义有了更深刻的认同。尤其在冬季,大衣、夹克、羽绒等外套虽能带来温暖,但那双经典的鞋
...[详细]
-
资料图当地时间11月12日,新成立的俄罗斯武装部队无人系统部队副司令谢尔盖·伊什图加诺夫表示,该部队已正式组建。伊什图加诺夫称,无人系统部队已经组建了正规的团、营和其他单位,其作战行动是按照统一计划进
...[详细]
-
原标题:2025年10月份CPI由降转涨 PPI降幅收窄 ——国家统计局城市司首席统计师董莉娟解读2025年10月份CPI和PPI数据) 10月份,扩内需
...[详细]
-
当地时间14日,俄罗斯国防部称,俄军当天继续在红军城地区打击被包围的乌军部队,俄军成功击退了7次乌军从红军城西北方向解救被包围乌军的行动,俄军还完成了对红军城以东、罗格定居点乌军人员的清理。另外,
...[详细]
-
近期,李雪琴在综艺节目中自曝胃部健康问题,称其在2025年7月30岁生日期间),接受了胃肠镜检查,一次性切除胃部8个较大息肉,但因数量过多,部分小息肉未处理。一次切除8个息肉,听起来吓人,但实际上这可
...[详细]
-
面对AI热潮带来的持续强劲需求,全球市值最高的公司英伟达正全力确保其芯片供应。其首席执行官黄仁勋亲赴中国台湾,向关键合作伙伴台积电寻求更多产能,凸显了这家台湾芯片制造商在当前AI供应链中的核心地位。据
...[详细]
-
IPO前的舆论战或许能短期吸引资本某种关注,但最终决定其市场地位的,仍是产品落地能力与服务用户的水平。商场如战场,智驾IPO前夜的资本赛道近来不太平静。 10月30日晚,文远知行CFO李璇一纸公开声明
...[详细]
-
来源:环球时报-环球网11月14日凌晨2时56分,外交部官网发布一条关于“外交部副部长孙卫东奉示召见日本驻华大使金杉宪治”的消息,全文529个字,铿锵有力、掷地有声。日本首相高市早苗发表涉台露骨挑衅言
...[详细]
-
男人一生要闯的“前列腺关”:20岁怕炎症、40岁防癌症、70岁抗增生
供稿:北京大学人民医院泌尿外科 杨喻兰编辑:北京大学人民医院宣传中心 钟艳宇在北京大学人民医院的泌尿外科诊室里,每天都在上演着不同年龄层男性的“前列腺烦恼”:23岁的小张因为尿频、尿急而坐立不安;45
...[详细]
-
流感季来袭 易感人群如何防治2025-11-19 13:23:26 来源:扬子晚报 作者:于晓
...[详细]

美共和党高官批乌克兰和平计划:对俄过于有利