NVIDIA DGX Spark来了,与AMD Strix Halo相比,端侧AI推理谁更香?
2025-11-06 17:31 发布 3 阅读

文中内容转载/部分修改权威媒体——微型计算机

在AI大模型的风潮之下,如今端侧AI已经成为行业的发展主流之一。2025年的CES上,NVIDIA首次推出个人AI超级计算机Project DIGITS,搭载Grace Blackwell的小型化集成版本GB10,最高可提供达1 PFLOPS的AI性能,用于AI大模型的原型设计、微调及运行,旨在使全球的AI研究员、数据科学家和学生都可获取NVIDIA Grace Blackwell平台的强大功能。

今年3月18日,NVIDIA正式宣布将Project DIGITS命名为NVIDIA DGX Spark推出,意在进军端侧AI市场。经过近一年的等待,2025年10月13日,NVIDIA DGX Spark终于正式向全球AI开发者交付。

▲2025年10月13日,NVIDIA首席执行官黄仁勋向马斯克交付一台NVIDIA DGX Spark,其只有迷你PC般大小。

或许不久前大家都被上面这张图片刷屏了,随着NVIDIA DGX Spark的正式交付和上市,最近这款设备正引发广泛关注。不过,先不说前Oculus VR首席技术官约翰·卡马克的吐槽,称其性能未达标,功耗、性能双双腰斩不到官方宣称的一半。目前同样面向端侧AI开发和部署,市场上已经有了三个先行者,分别是苹果的Mac Studio、英特尔的桌面AI超算中心(极摩客EVO-T1)和AMD的Strix Halo迷你AI工作站解决方案。

不过,苹果的生态过于封闭,英特尔的桌面AI超算中心产品基本算是消费级的配置和性能,无法与其它产品相提并论,多数中小规模团体和个人开发者能选择的除了NVIDIA DGX Spark,也就是现在生态业非常成熟的AMD Strix Halo了。

▲AMD董事会主席及首席执行官Lisa Su博士在一场活动中为锐龙AI Max+ 395迷你AI 工作站签名。


▲AMD官网微博推荐极摩客EVO-X2


▲纪朝晖,现任AMD大中华区市场营销副总裁推荐

作为同样配备128GB统一内存、同样瞄准AI开发者与初创团队的产品,NVIDIA DGX Spark和锐龙AI Max+ 395平台代表两种不同的技术路径与市场策略。对于AI爱好者、AI开发者以及初创团队而言,它们之中谁才是更好的选择呢?我们从软件生态、推理性能以及价格等多个方面来进行一番详细分析。

生态兼容性

x86/Windows的强大优势,用途更广泛

对于迷你AI工作站产品,软件生态的成熟度往往比硬件规格更为关键。这恰恰是AMD锐龙AI Max+ 395平台相较于NVIDIA DGX Spark最显著的优势。

▲NVIDIA DGX Spark主要参数规格

NVIDIA DGX Spark基于ARM架构,搭载NVIDIA GB10 Grace Blackwell GPU以及20核心的CPU,运行基于Ubuntu 24.04的DGX OS Linux系统。虽然ARM架构在移动设备和嵌入式系统中表现出色,但在桌面与工作站市场,其软件生态远不如x86成熟。

首先,ARM/Linux平台的应用软件数量相对有限。许多专业软件、商业工具并未提供ARM版本,即使有Linux版本,也主要针对x86架构。用户如果想运行x86应用程序,往往需要借助转译层或虚拟化技术,这不仅增加了性能开销,还可能导致兼容性问题甚至程序崩溃。

▲以Ubuntu为代表的Linux系统在消费级市场中并不常见,普通用户使用的门槛高。

另外,Linux操作系统虽然在服务器和开发环境中广受欢迎,但对普通用户而言学习曲线较为陡峭。命令行操作、软件包管理和驱动配置等都需要一定的技术背景。对于非技术出身的内容创作者、小型企业主、大学生或者AI爱好者来说,这道门槛可能直接阻碍他们接触AI技术。

更重要的是,NVIDIA DGX Spark的定位单一。NVIDIA将其设计为主要用于AI模型的开发、测试与微调,而非通用计算平台。这意味着当设备不执行AI任务时,其价值将大打折扣,普通用户难以将其用作日常办公或娱乐设备。对初创团队、中小企业来讲,很可能还需要另外配置一台日常使用的PC来办公,这增加了总体拥有成本。

反观AMD锐龙AI Max+ 395 迷你AI工作站,它采用x86架构,搭载Windows 11操作系统,这一组合为其带来了无可比拟的生态优势。x86架构自20世纪80年代以来便是PC市场的主流选择,经过数十年的发展已经构建起极为成熟的软件生态系统。无论是开发工具、办公软件、游戏娱乐还是专业应用,x86平台都拥有广泛的应用支持。

此外,作为全球市场占有率最高的桌面操作系统,Windows的用户界面友好、操作逻辑清晰,即便是非技术背景的小白用户也能快速上手。更重要的是,x86/Windows平台的软件兼容性很好,大多数开发者不用为应用程序进行特殊适配,几乎所有主流的AI开发框架、数据分析工具、IDE都能在该平台上运行。

▲AMD锐龙AI Max+ 395平台不仅是桌面Mini AI工作站,更是功能完整的高性能PC,除了AI开发,用户还可以将其用于日常办公、内容创作、游戏娱乐等多种场景,一机多用,更适合预算有限的中小规模团队和个人开发者。

这种生态优势带来的直接好处是PC设备的用途更广,比如AMD锐龙AI Max+ 395平台不仅可以用于AI大模型推理,在不运行AI任务时,它完全可以作为一台高性能的办公电脑、游戏主机或多媒体工作站来使用。

毕竟AMD锐龙AI Max+ 395处理器本身的性能强悍,其内置的Radeon 8060S集显在性能上与RTX 4060笔记本电脑GPU相当,能够轻松应对3A大作和视频剪辑、3D渲染等专业工作负载。这种“一机多用”的特性极大提升了设备的利用率与投资回报率,这对于预算有限的个人开发者、初创团队或者中小企业而言尤为重要。

大模型推理性能

AMD锐龙AI Max+ 395平台胜出

在AI推理性能方面,可能大家一直有一个偏差:NVIDIA的解决方案硬件规格亮眼,认为其必然在性能上占据优势。然而实际情况有点让人大跌眼镜。除了前Oculus VR首席技术官约翰·卡马克的吐槽,目前国外众多媒体已经对NVIDIA DGX Spark进行了详细的评测,我们引用YouTube科技博主Bijan Bowen的测试数据来具体分析。

▲YouTube科技博主Bijan Bowen对NVIDIA DGX Spark和AMD锐龙AI Max+ 395(极摩客EVO X2进行对比)平台进行了详细测试。

Bijan Bowen不久前对NVIDIA DGX Spark和AMD锐龙AI Max+ 395平台做了详尽的对比测试。测试环境严格控制变量,两台机器均配备128GB统一内存,运行相同的模型和提示词。在本地大模型测试中(Llama 3.3 70B),AMD锐龙AI Max+ 395平台的推理速度为4.9 tokens/s,而NVIDIA DGX Spark的推理速度仅4.67 tokens/s,相比之下AMD平台领先大约5%。

在GPT-OSS 20B模型测试中,这两个平台的性能差距更加明显。AMD锐龙AI Max+ 395平台的推理速度达到64.69 tokens/s,而NVIDIA DGX Spark只有60.33 tokens/s,相比之下AMD平台领先大约7%。在Qwen3 Coder 30B模型测试中,NVIDIA DGX Spark扳回一城,以38.03 tokens/s的速度略微领先于AMD锐龙AI Max+ 395平台的35.13 tokens/s。

从以上测试成绩能够看出,在本地部署大模型时,AMD锐龙AI Max+ 395平台相比NVIDIA DGX Spark拥有更快的响应速度和更流畅的用户体验。AMD锐龙AI Max+ 395平台采用独特的统一内存架构,支持高达128GB LPDDR5x 8000内存,其中最高96GB可分配给GPU作为专属显存。在实际的大模型推理场景中,AMD平台的显存分配策略也让其在应对不同参数规模的模型时具有更高的灵活性。

▲NVIDIA DGX Spark

实际上NVIDIA DGX Spark搭载NVIDIA GB10 Grace Blackwell GPU和128GB内存,NVIDIA官方宣称其能提供高达1 PFLOP(1000 TOPS)的AI算力,但是它在大模型上的表现却与宣称的AI算力不符,背后的原因可能是与其大型产品GB200和GB300不同,GB10没有使用超高速HBM内存,并且受功耗和成本限制,NVIDIA选择了时钟频率为9400MT/s的LPDDR5X内存。与CPU芯片的256位内存总线连接后,GB10最高可提供273GB/s至301GB/s的带宽。而内存带宽是推理性能的关键指标——内存速度越快,芯片输出Token的速度就越快。使用LPDDR的决定表明英伟达在内存容量和带宽之间做出了明显的妥协。

价格与总拥有成本

AMD锐龙AI Max+ 395平台优势更大

在AI硬件市场,性能固然重要,但价格与总拥有成本(TCO)往往是决定产品能否普及的关键因素。在这方面,AMD锐龙AI Max+ 395平台的优势更大。


▲国内大部分在售的NVIDIA DGX Spark(4TB版本))标价都在32999元及以上

NVIDIA DGX Spark的官方售价为3999美元起,折算成人民币大约2.84万元。如果再加上进口关税、运输费用,实际价格更高。目前在电商平台上,NVIDIA DGX Spark(4TB版本))的标价都要从32999元起,部分品牌高配置的则报价近5万元。

▲极摩客Evo-X2桌面迷你AI 工作站的64GB+1TB版本的促销价低至9999元

相比之下,AMD锐龙AI Max+ 395桌面迷你AI 工作站的价格要亲民得多,它的价格普遍在15000元左右。比如极摩客Evo-X2的64GB+1TB版本的促销价低至9999元,128GB+2TB版本的促销价低至14999元。这意味着,在配备相同128GB内存容量的情况下,AMD平台的价格仅为NVIDIA平台的40%左右。换句话说,购买一台NVIDIA DGX Spark的预算可以购买两台性能相当的AMD锐龙AI Max+ 395平台,而且还有余款用于购买其他配件。

此外,对于独立开发者、AI初创团队以及中小企业来讲,为工作添置AI硬件还要考虑总拥有成本(TCO)。AMD锐龙AI Max+ 395平台的入手门槛低,性能表现出色,既能够“一机多用”,在AMD与产业链的紧密合作下,也能“开箱即用”,对独立开发者、AI初创团队以及中小企业来说没有太高的负担,能够帮助他们快速开始投入工作。

实际应用场景

AMD锐龙AI Max+ 395走在前面

在应用场景与生态落地方面,虽说NVIDIA也有自己的生态“护城河”,但是NVIDIA DGX Spark作为新产品才上市不久,相关的应用场景和生态落地仍处于逐步探索阶段。而目前搭载AMD锐龙AI Max+ 395处理器的桌面迷你AI 工作站已经大量上市,AMD展现出更强的适应性与灵活性——目前已经有丰富的实际应用场景和生态落地实例。

对于个人或“超级个体”而言,AMD锐龙AI Max+ 395平台扮演着个人AI动力源的角色。比如我们通过Qwen3-30B Coder这样的模型来实现端侧AI辅助编码,可以让没有编程背景的用户仅通过自然语言描述就能结合自己的个人数据构建简单的应用程序,结合桌面Mini AI工作站的优势,用户可以在本地快速验证和迭代MVP。

对于团队/中小企业,锐龙AI Max+ 395平台可以化身为部门或团队级AI服务器。有AI应用团队已经将其数据分析智能体解决方案适配到395平台,允许非技术背景的用户仅通过自然语言提问完成从数据准备/处理/分析到可视化和预测性分析的整个数据分析流程。

此外也有医疗行业应用解决方案团队,基于AMD AI MAX+ 395 平台,结合专业医疗算法和RAG技术构建专属于医生的诊疗辅助智能体,融合诊疗/会诊和科研等功能,为医生提供AI助力。

总结

通过从兼容性、推理性能、成本和生态等多个维度的深入分析,我们可以得出结论:对于绝大多数AI开发者、初创团队和中小企业用户而言,AMD锐龙AI Max+ 395平台相对NVIDIA DGX Spark是更优的选择。

在生态兼容性方面,AMD平台基于成熟的x86/Windows架构,拥有广泛的软件生态和工具链支持,学习门槛低,可以无缝集成到现有的IT基础设施中。而NVIDIA DGX Spark的ARM架构在桌面应用领域仍面临生态不成熟的挑战。在AI推理性能方面,根据第三方的测评数据,AMD平台在多数模型上的性能表现超越NVIDIA平台。在成本效益方面,AMD平台具有很大优势,价格仅为NVIDIA平台的40%左右。

总体来看,AMD锐龙AI Max+ 395平台凭借其成熟的生态、出色的性价比和丰富的应用场景,在端侧AI市场展现出强大的竞争力。对于希望在本地部署大模型的AI开发者、AI爱好者、初创团队或者中小企业用户而言,它无疑是当前市场上最值得推荐的桌面Mini AI工作站的解决方案。

极摩客品牌介绍

深圳市极摩客科技有限公司,是专注于桌面AI超算中心,迷你电脑产品等智能终端的研、产、销的国家高新技术企业,专精特新企业、新质生产力企业。“GMKtec/极摩客”品牌,荣膺“深圳知名品牌”称号!与华为,大疆深圳知名品牌一起,夯实深圳科创品牌基因。2025年斩获美国好设计奖(American Design Award)最高荣誉铂金奖,这是中国桌面 AI 超算首次获此殊荣。现在已经形成自主研发,自主生产,自有品牌,全球销售的品牌格局,在全球迷你电脑行业中奠定领跑者地位,并率先提出桌面AI超算中心概念,引领行业新发展。团队由有20年电子产品经验的高精尖专业人士组成,拥有丰富的的设计、生产、品牌营销经验。与英特尔、微软、AMD等知名企业战略合作,推动技术创新和产业升级,为用户提供优质的产品和服务。极摩客龙华产业基地于2019年投入使用,具备智能终端产品的研发,运营,实验,仓储物流全产业链能力。为提升全球消费者体验,奠定坚实基础。极摩客产品已经行销 全球 70 多个国家,并在多达 35 个国家有代理商及销售服务网点,提供高品质的桌面AI超算中心,迷你电脑,便携式显卡,家用及商用NAS等一系列产品。