2025年12月1日至12月4日,AWS在拉斯维加斯举行了一年一度的re:Invent。

在这次活动期间,AWS方面将绝大多数时间都用在了介绍他们新的AI智能体服务上。相比之下,用于讲述新一代基础设施、特别是芯片相关话题的篇幅明显就少了很多。

但相比“专业向”的各种云计算和智能体相关业务,今年AWS的新芯片依旧给我们留下了深刻的印象。在此前的相关内容里,我们三易生活已经详细解读了Graviton 5、Trainium 4等最新款AWS自研芯片的性能指标。
不过除了单纯的性能之外,在详细剖析AWS的这些自研芯片、参观re:Invent 2025的展区,并与AWS方面相关人士进行了深入的沟通后,我们认为还有必要来聊聊AWS的“芯片观”。
自研的意义是什么?不是荣誉而是责任
纵观AWS目前的整个自研芯片产品线,它们基本可以分为三个类别,即通用处理器Graviton、AI训练芯片Trainium,以及网络、存储和虚拟化加速系统Nitro。

为什么是这三个类别?关于这一点,AWS过去其实也有过多次表述。简单总结一下,就是他们一开始觉得早期的数据库网络架构不合理,于是就自己设计了一套新的芯片来改善性能;后来觉得外部处理器和AI加速器性价比不高,所以干脆也自己研发了对应的方案。

毫无疑问,“务实”就是AWS在自研芯片业务上最为显著的特征。一方面,日前我们与AWS副总裁暨杰出工程师Ali Saidi进行了深入的沟通,并在《再次自研新处理器,AWS的硬件思路有些与众不同》中提及,AWS对于和ARM的长期合作毫不“避讳”。因为在他们的认知中,纠结处理器IP是否“自研”并无意义,能够让芯片更好地服务于客户需求,让客户少花钱、多办事,它才更有价值。
另一方面,AWS高级副总裁Peter Desantis在他的演讲中更是明确提及,AWS从不会在研发芯片时考虑“跑分好看”这样的因素,因为他们一切的芯片设计都只为改善具体的业务需求。

比如在最新的Graviton 5通用处理器上可以看到,它单颗芯片将核心数量提高到了192核,同时缓存达到了前代的5倍。AWS为什么要把处理器的规模造这么“大”呢?根据官方给出的理由,这主要是为了让客户在部署大规模算力时,尽可能地减少跨处理器的数据传输场景。这样一来,一是可以用更少的机架提供更高的性能,从而降低系统的总功耗;其次也意味着核间延迟大幅下降,更适合对DPC敏感的计算需求。

除此之外,Peter Desantis还提到了“自研芯片”一个有趣的优势。他指出,传统的第三方处理器通常会在硅晶片上额外覆盖一层金属顶盖,这不只是为了保护处理器,同时也是为了改善处理器的“卖相”。但这就意味着这些处理器的热量实际上变得不易散出,既增加了散热消耗、还会降低性能。

相比之下,AWS的自研芯片从一开始就是“自产自用”,既然不需要考虑外销,自然也就可以大胆地采用“开盖”设计。当然,有些朋友可能会觉得,这样的处理器“造型不好看”,但如果你这么想,很显然是没能真正意识到AWS芯片“自产自用”的意义。
正是因为有自研的底气,所以才能更加开放包容
相比来自第三方供应商的处理器实例,AWS自研的Graviton、Trainium能够提供低得多的算力价格。所以它们确实就受到了大量客户的欢迎。特别是在模型训练方面,目前AWS几乎有一半的训练负载都是运行在自研的Trainium设备上。

但不难发现,在re:Invent 2025期间,AWS同样接连发布了基于新款AMD处理器、英特尔处理器、英伟达计算卡,甚至是苹果M系列芯片的多款实例。

这是为什么呢?一方面,在发布这些新的实例时,AWS方面并不避讳介绍它们(在某些特定方面)相比于Graviton的实例,依然会有性能优势。也就是说,尽管“性价比”已经是AWS最为知名的优势之一,但这并不意味着他们就会因此忽视那些更追求高频率,追求特定架构或指令集客户的需求。

而且关于AWS未来的算力业务,此次活动中还有两个特别小的细节值得关注。一是AWS已经明确预告,下一代的Trainium芯片将支持NVLink通信,或将支持与英伟达算力卡组成“协同架构”。二是AMD今年将他们的MI350加速器也带到了re:Invent 2025的展示环节。经过我们三易生活在现场的确认,AWS方面确实正打算引入更多厂商的AI算力方案。
换句话说,就算AWS的自研处理器很强大、性价比又很高,但他们绝不会强迫客户“只能用我们的自研芯片”。相反,充分尊重和满足客户的多样性需求,反而更能让人体会到他们在自研芯片已经足够强大之后,才有的那种从容。
尊重市场、尊重客观规律,客户才会尊重你
说到“自研芯片”的生态建设,目前业内有两种截然不同的思路。其中一种认为,那些先行者已经有了太多年的技术和口碑积累、在软件生态上已经形成了巨大的技术壁垒。所以新入局者要想有所突破,就应该不按照前人的经验,做一套与竞争对手完全互不兼容的生态。因为只有这样,才能避免陷入“总是追赶”的窘境。而且只要生态不兼容,自然也就变得无法被直接(拿来和竞争对手)进行比较,在市场宣传上也能占到一些便宜。

但从我们三易生活与AWS相关团队的沟通结果来看,AWS方面显然并不同意这样的做法。用他们的话来说,他们不可能去要求开发者、要求客户为了他们的自研芯片,就放弃过去的编程习惯,或者是放弃对那些先行者竞品芯片的兼容性。
在这样的前提下,是不是就意味着AWS的自研芯片就永远都追不上先行者了呢?从目前的市场表现来看,答案显然是否定的。AWS不仅“追了上来”,而且得到了越来越多客户以及软件生态的认可。

AWS的诀窍是什么?其实我们在前面已经说到。一是比强大的竞争对手更加尊重客户。因为竞品的芯片或许总体性能很强,但当面对具体的某个使用场景时,未必就一定是“完全无法超越”。AWS靠的就是他们庞大的客户群体,通过在芯片设计阶段就瞄准了具体的客户需求,放弃那些“单纯为了好看”、“单纯对跑分有利”的指标,造出更贴近实际需求的芯片。

另一点则更加朴素,那就是更有诚意的价格。的确,某些竞争对手的硬件或许非常强大,但那些“大而全”的产品往往也就意味着难以降低的整体成本。相比之下,AWS一直坚持自研芯片业务的低价格策略。这不只是令他们在早期芯片性能不那么有竞争力的阶段成功“挺了过来”,而且也使得AWS的芯片近年越来越显现出被行业所认可的规模和口碑优势。
