玩家们在对比GM204、GK104和GK110后,有没有一种Maxwell依旧意犹未尽的感觉?至少MC有一种预感,GTX 980并不是Maxwell的终形态,或者说GM204核心并不是“完整”规格的顶级Maxwell显卡,想想一个显存位宽仅256bit的核心会是顶级的核心吗?实际上在旧金山的技术沟通会上,NVIDIA老拿GM204跟GK104做对比讲解,测试成绩也是GTX 980和GTX 680的对比居多,这是否具有极强的暗示性?因此在现场,MC记者就此疑问询问过NVIDIA的高级技术经理。得到的答案也很特别“GM204是个完整规格的核心,绝对没有任何未开启的隐藏CUDA Core,至少就当前来说,它绝对是规格完整,性能强的Maxwell核心。”这意思是说不会在GM204上出现如GTX Titan到GTX Titan BE这样通过GK110“开核”升级情况。但这并没正面回答我们的疑问,让我们有理由相信在未来还会有规格更庞大的“GM210”(按照以往习惯猜测的代号)核心来完成新一轮显卡性能王的交接。因为x04在NVIDIA内部通常都是中端核心的代号,只有x10才是当前架构下强核心的带指,类似GTX Titan/780Ti的GK110核心相对于GTX 680的GK104核心。而这种同一架构,挑起两代显卡产品换代的市场布局,也很可能会成为未来显示核心厂商的策略常态。就当下来说,这留给玩家一个美好的期待,不久的将来我们还能看见规格更大的Maxwell架构核心,用上更出色的显卡。
通过显存压缩,GM204可省下约25%的显存带宽,相当于使用了9300MHz的超高频显存。
在GM107的基础上进一步优化了底层逻辑结构,让Maxwell架构在GM204上显得更成熟、更具魅力,相比Kepler的众多核心来说完全是一次彻底的转变。但NVIDIA为我们带来的惊喜还远不止于此,为了让玩家体验到更真实的画面,伴随GTX 980而来的还有诸如:
全面强化的显存体系;
更强的视频编码;
高效的VXGI光线追踪;
事倍功半的MFAA;
巧妙提升画质的DSR;
第三代虚拟现实VR Direct等一系列可以明显提升游戏画质,提高玩家体验的技术……
当前单芯旗舰显卡的显存带宽多在300GB/s左右,对应位宽384bit~512bit之间。而GTX 980的设计目标是要在性能上超过当前的所有单芯显卡,所以理论上GTX 980的显存带宽至少也应该有300GB/s左右的水平,否则很可能成为瓶颈。然而GM204的显存位宽并不高,只有256bit,与之匹配的倒是当前速度快的7000MHz高速显存,这一定程度地弥补了位宽的不足,让总带宽达到224GB/s,但离300GB/s的标准依旧不够。实际上除了依靠高显存频率来弥补位宽不足这种常规方式,GM204还引入了全新的无损显存压缩技术。这项技术可以在某些情况下大幅度节省显存带宽的占用。
VXGI体素渲染示意图,单位是立方体,有利于保持真实性的同时降低运算量。
启用VXGI特效渲染出的阿波罗11号登月“照片”(左)和真实照片的对比,是不是已经有点以假乱真的感觉?
NVIDIA举出了好几个显存带宽压缩的例子。比如一个4×2像素的区域中色彩是常数时,可以实现大的8:1的压缩,压缩前每种色彩都有8个像素,总计32Bit×8=2568Bit,压缩后色彩只占据1个像素位置(其余的数据用数学方法统计),这样总共只需要32Bit的数据空间,显存带宽和空间需求量节省至原来的八分之一。此外,如果遇到2×2像素的区域色彩是常数,通过压缩可以节省至原来的四分之一。当然,压缩不是万能的,差的一种情况是所有的像素都是独立色彩,这样的数据就无法压缩,带宽不足的问题还是会原形毕露,虽说这样的情况不多,但知晓此关键,玩家们就可以心中有数了。
除了上述压缩外,GM204还配备了第三代“Delta Color Compression”,这种方式可以计算相邻像素之间的色彩差,然后尝试将这些不同的值用算法存储在一起。比如A像素和B像素相邻,A像素的色彩值是红色253(8bit),B像素的色彩值是红色250(8bit),差距只有3,因此终压缩后,只记录差值,数据就被缩减至2bit。Maxwell目前使用的是第三代压缩方式,NVIDIA宣称其有效性更高,压缩效率更出色。由于显存数据压缩所带来的优势,因此Maxwell的实际显存带宽在很多应用场景中被变相增大了。在NVIDIA的测试中,GM204的内存带宽少节约了17%,多节约了29%,综合来看有相25%左右的带宽节约。这相当于高拥有290GB/s的显存带宽,平均水平为280GB/s,即等效拥有320bit的显存位宽,达到了预期的设计目标。