接下来,我们进入更复杂一些的生产力测试项目。首先是100GB素材的PR视频合成渲染测试,我们也选择仅用CPU进行软编码。锐龙9 9900X用时14分41秒80就完成了100GB素材向4K视频的合成渲染,生成了大约12分钟的视频内容。
不过这种“使用方式”,实际上是浪费了9900X的架构潜力。因为在它的核心里除了CPU、缓存和内存控制器之外,同样也包含一颗2CU配置的RDNA2核显。
原则上来说,这个核显可以作为“亮机卡”使用,但如果将它与AMD自家的Radeon独显搭配,那么核显与独显将能够激活名为“Smart Access Video”的协同编码功能,通过同时使用两个GPU的视频单元,来实现更高速的视频编解码。
从我们的实测来看,在换用GPU硬件加速、并激活双GPU协同编码后,同样的100GB素材就只需要9分58秒就能完成导出。
有的朋友可能会说,怎么能够证明锐龙9 9900X里的核显就能起到协同编码加速的作用呢?很简单,因为我们还准备了一套酷睿i9 14900K平台,并配备完全相同的内存和Radeon RX7900 XT独显,进行了相同素材和分辨率设定下的视频导出。结果显示用时11分17秒85,明显速度慢了一些。由此可知,对于多媒体生产力用户来说,锐龙9 9900X的这颗2CU核显还真可以起到一些作用。
我们前面其实已经提及,锐龙9000系列这次最大的架构改进之一,是其大幅提升了AVX512指令集的执行效率。那么对于生产力用户来说,这一优势到底又要如何体现呢?
很简单,本地AI推理就能用到AVX512指令集,同时也是非常典型的重负载场景。为此我们也搭建了一个340亿参数量的本地离线GPT-4对话场景。在这个场景中,锐龙9 9900X实测可以保持在2.9-3.2Tokens每秒的推理速率,实现流畅的“人机对话”并没有什么问题。
综合上面基准和生产力测试来看,锐龙9 9900X此次的架构改进绝对可以说是“针对性十足”。一方面在竞争对手受困于制程短板和架构缺陷,不得不先后放弃AVX-512和超线程时,AMD反而在先进工艺和优秀市场表现的双重助推下,“迎难而上”地强化AVX-512指令集的效率,并大幅提升了Zen5架构的超线程和指令预测性能。
以结果来说,这就使得以9900X为代表的这一代锐龙9系列桌面CPU,获得了在重负载多媒体编辑、AI推理等高度专业场景下的大幅性能增长。很显然,这会有利于他们在专业领域抢占更多的市场份额,而且考虑到这类用户往往有着更高的黏性,因此甚至可能会对AMD的长期财务状况带来潜移默化的良好影响。