如今,很多厂商都热衷以“具备高速GDDR5显存”为卖点来宣传产品。那么GDDR5显存真的能显著提升显卡的性能吗?和主流的GDDR3显存相比,GDDR5显存又有何特点?微型计算机搜集了十款有代表性的GDDR5显卡,我们将通过测试给大家一个满意的答案。
如果说过去采用GDDR5显存的显卡还屈指可数的话,那么如今采用
GDDR5显存的显卡已经呈现遍地开花的局面—从AMD高端的双核心旗舰
Radeon HD 4870X2,到主流的高端型号Radeon HD 4870,再到新近上市的中高端显卡Radeon HD 4860,甚至主流的Radeon HD 4750都采用了GDDR5显存。下面我们就带大家一起来认识GDDR5显存。
频率是存储器为显著的特征。目前GDDR3的数据传输频率高可以达到2600MHz,相比之下,目前GDDR5可以达到5000MHz。不过这依旧不是终点,GDDR5高数据传输频率将达到6000MHz。和之前几代GDDR显存一样,GDDR5也是建立在多倍数据预取技术上的产品。根据显存发展的历史来看,GDDR1显存采用2bit数据预取技术,GDDR2、GDDR3和GDDR4都采用了4bit数据预取技术,GDDR5正是新一代8bit数据取技术的产物,达到了令人惊异的高性能。
相比GDDR3采用的4bit预取数据而言,GDDR5的优势在于将预取数据增加到了8bit,因此GDDR5就能够在同样的物理时钟频率下达到更高的数据传输速度。不仅如此,GDDR5显存采用了双数据总线,能够同时在数据总线的上升和下降阶段传输数据。同时,每条总线都独立配备了完整的DBI,可以独立传输、校验数据,是完整的双总线规格。以往单数据总线的GDDR2、GDDR3等显存标称频率是等效工作频率的1/2(比如标称频率为900MHz的GDDR3显存,等效工作频率为1800MHz),而GDDR5显存由于双总线技术的存在,每条总线都可以在上升和下降阶段传输数据,因此标称频率是等效工作频率的1/4。以4000MHz等效工作频率的GDDR5显存为例,它的标称频率为1000MHz。由于采用了8bit的预取技术,因此它的实际物理运行频率为125MHz。
物理运行频率:是指GDDR显存实际运行的物理频率,这个频率可以在主板上用仪器实际测得。在通常的使用中,物理运行频率是极少被提及的。
标称频率:由于采用了多倍预取技术,因此GDDR显存的标称频率远远高于物理运行频率。以GDDR3为例,它采用4bit预取,因此物理运行频率为250MHz的GDDR3显存,标称频率就为1000MHz。在GPU-Z、Rivatuner等软件的截图中,看到的显存频率就是标称频率。
等效工作频率:等效工作频率是GDDR显存衡量实际传输数据能力的频率。一般GDDR2、GDDR3、GDDR4等单总线显存的等效工作频率是标称频率的2倍。而GDDR5采用了双总线技术,因此等效工作频率是标称频率的4倍。我们经常看到厂商和大部分媒体宣传的显存频率实际就是等效工作频率,这也是大家使用广泛、认知度高的GDDR显存频率。另外,等效工作频率可以直接和显存位宽相乘进行计算。比如等效工作频率为2000MHz的GDDR3显存,如果显存的位宽为128bit,那么总显存带宽就是2000MHz×128bit÷8=32GB/s。
对于数据的优化是存储器为重要的方面,GDDR5重点采用了四项技术来保证数据的稳定性和安全性。Data/address bit inversion,即数据/地址位反演是指在传输过程中,数据或者地址位内的信息被按照一定的规则做了反演处理。数据/地址位反演技术的作用在于有效地改善了噪音对数据信号的影响,保证了数据在传输和存储过程中的稳定性。不难看出,数据/地址位反演技术是GDDR5在传输中重要的处理技术,也是降低功耗和提高数据稳定性的首要法宝。
除了数据/地址位反演技术外,三项动态调节技术:adjustable driver strengths、adjustable voltages和adjustable terminations也是GDDR5数据核心优化的重要组成部分。它们分别针对驱动器、电压和终止装置进行自动调节。在传统的显存数据传输过程中,由于显存并行传输的特性,对线长和外界干扰有着严格的规定。因此我们常常在显存周围看到大量的密密麻麻的终结电阻(减少反射损耗)等元件,显卡不得不在显存周围采用蛇形走线来尽可能做到信号线等长。但在GDDR5上这些严格的要求被弱化了,GDDR5自带的调节系统可以在一定范围内保证数据信号在高速运行时不出错,甚至信号线都可以不用严格等长。除了更宽松的信号传输空间外,GDDR5对电压和温度的动态调节和实时监控,也使得整个信号在传输过程中的安全性更高。另外,工程人员可以在BIOS中写入设定好的调整信息,避免在PCB已经正式出样(layout)之后由于信号稳定性问题导致返工。
目前已经上市的GDDR5显存拥有两种速度规格和两种容量规格,可选择余地并不多。以市场常见的奇梦达GDDR5显存为例,分为-40X和-50X两种,分别对应4.0Gbps和5.0Gbps的传输速率,即理论上它们的等效工作频率为4000MHz和5000MHz。尚未上市的现代和三星GDDR5显存分类则更细,拥有3500MHz、4000MHz、4500MHz和5000MHz等多种频率规格。
编号为奇梦达IDGV51-05A1F1C-40X的GDDR5显存
奇梦达GDDR5显存规格列表
信号线和时钟稳定性是高速显存设计中重要的部分。GDDR5显存拥有多达5条需要校准的时钟信号,分别是Clock、Command Clock、ADDR、Write Clock、DATA Clock时钟信号。在高速运行的情况下(诸如高达2GHz),任何一点微小的差距都会带来整个系统的数据错误、崩溃。因此,GDDR5在时序自动校准、自适应技术上已经有了一套非常完整的方案,能够带来非常高的数据运行效率。
首先,GDDR5会要求地址时钟和总线时钟(ADDR和CK#)进行对照并对齐。实际上这是在进行一次芯片的初始化,在此阶段控制器可以找到佳的相位设置。接下来就需要校准Write Clock(WCK)和基准Clock(CK#)之间的数据,这个过程被称为“WCK-to-CK”。在这个过程中,控制器可以找出WCK和CK#之间相位的差距,是“早”还是“迟”,然后为每一个DRAM给出相应的调节数据。后,控制器会调整数据总线(DATA和WCK)。由于数据总线DATA的频率是WCK写入时钟的2倍,因此每次校准会涉及到两个字节。
GDDR5的这种校准方法,使得整个数据线环环相扣,降低了由于时钟不同步带来的数据错误或系统延迟,也在很大程度上降低了PCB设计的难度。由于有内部校准机制的存在,工程师们在PCB布线的一致性方面就有了更宽松的空间,这让整个PCB的布线更为自由和宽松。
另外,更为自由的数据预取技术也让GDDR5在图形应用中充满了优势。在图形计算中存在大量密集而微小的数据,这些数据甚至会小于GDDR5每次预取的低数据。如果采用固定的预取值的设计方法,即每次无论数据大小(甚至使用空位)都一定要完全占据传输总线,无疑会耗费很多能量。因此,GDDR5允许小于预取数量的数据传输,即采用低预取方式。这种灵活的设计,让GDDR5在传输大量小数据量运作时,功耗有明显的降低。
大多数的单颗GDDR显存位宽均为32bit,GPU如果是128bit的显存位宽,就需要4颗显存就可以使位宽相互匹配。但如果显卡要使用8颗显存形成更大容量的话,就需要相应的GPU显存控制器支持双BANK读写才可完成,灵活度不够高。而GDDR5显存内置双数据总线,32bit的显存可以轻松拆分为16bit颗粒使用,不需要GPU的额外支持也可以使显存容量翻倍。这种设计简化了GPU的显存控制器,增加了用户选择的自由度。
由于电磁环境或者传输中温度、电压等复杂因素的影响,显存在数据传输和存储过程中可能会产生少量的错误——一个简单的显存数据错误除了导致渲染失败以外,还可能导致显卡彻底失去响应、蓝屏和系统崩溃等严重问题。因此对错误数据的校验和补偿,成为GDDR5瞄准的又一个重要目标。
GDDR5的数据校验采用了CRC(Cycle Redundancy Check循环冗余校验)方式。CRC校验是建立在GDDR5的DATA I/O和DBI的基础上,如 果出现错误,则触发数据传输总线,然后快速重新读取数据,或者利用如Data Mask(数据掩蔽)等功能修改数据并重新传输。这种校验方式的优势在于能够100%检测出所有单、双数据误差。
Data Mask(数据掩蔽)是这样一项技术:GDDR5显存在每次读写数据时,并不是改写所有的数据,大部分数据都不需要修改。因此GDDR5利用地址总线对一部分数据进行掩蔽,在下一次数据读写到来时,仅仅对没有掩蔽的数据进行更改。这样就能在快的时间内完成数据读写。
为了进一步验证GDDR5显存究竟能为显卡带来多大的性能提升,我们将通过测试得出结论。由于Radeon HD 4870和Radeon HD 4850采用的都是RV770核心,在诸如流处理器、纹理单元等主要硬件规格上都是一致的。它们的主要区别是核心频率和搭载的显存类型——Radeon HD 4870的核心频率更高,搭载GDDR5显存,显存频率也很高;而Radeon HD 4850的核心频率较低,搭载GDDR3显存,显存频率也较低。因此我们利用第三方软件统一将Radeon HD 4870和Radeon HD 4850的核心频率调到一致,以便通过游戏测试来检验GDDR5显存究竟能帮助Radeon HD 4870提升多少性能。具体的领先幅度可以通过Radeon HD 4870领先Radeon HD 4850的百分比得出。此时,Radeon HD 4870和Radeon HD 4850不同之处就是显存频率和显存带宽,前者的显存带宽为3600MHz×256bit÷8=115.2GB/s,后者的显存带宽为1986MHz×256bit÷8=63.5GB/s,几乎相差一倍。为了不使CPU成为测试瓶颈,我们使用英特尔Core i7 920平台。具体测试软件使用3DMarkVantage以及主流的3D游戏。
采用GDDR3和GDDR5的同核心显卡测试对比 | ||
|
Radeon HD 4870 512MB |
Radeon HD 4850 512MB |
3DMarkVantage Performance |
P8672 |
P8051 |
《孤岛惊魂》 | ||
1920×1080 Ultra |
41 |
38 |
1920×1080 Ultra 4AA |
39 |
25 |
《孤岛危机》 | ||
1680×1050 High |
37 |
34 |
1680×1050 High 4AA |
26 |
24 |
《汤姆克兰西之鹰击长空》 | ||
1920×1080 Ultra |
47 |
43 |
1920×1080 Ultra 4AA |
40 |
36 |
《冲突世界》 | ||
1920×1080 Ultra |
48 |
45 |
1920×1080 Ultra 4AA |
41 |
35 |
从测试来看,搭载了GDDR5显存的Radeon HD 4870的3D性能在3DMarkVantage的测试中领先Radeon HD 4850 8%左右,而在孤岛危机等游戏的测试中,领先幅度更是达到了10%以上。值得一提的是,在高分辨率、开启了全屏抗锯齿后,Radeon HD 4870的高显存带宽优势进一步发挥了作用,3D性能领先Radeon HD 4850 15%以上。这也进一步说明了显存带宽在高分辨率、开启全屏抗锯齿后的重要性。
景钛HD 4750采用2相核心供电、1相显存供电的分离式供电设计,每相核心供电搭配了2个英飞凌的低阻抗MOSFET。该卡的PCB上存在空焊的情况,很明显该卡使用了更高级别显卡的PCB,并做了优化,去掉了部分元器件。
待机温度 |
41℃ |
满载温度 |
52℃ |
超频后的频率 |
925MHz/4400MHz |
核心频率 |
750MHz |
显存频率 |
3200MHz |
显存类型 |
GDDR5/512MB/128-bit |
接口类型 |
双DVI |
3DMarkVantage Performance | |
基准测试得分 |
P6840 |
景钛HD 4750使用了侧吹式的公版散热器,噪音非常低,GPU的待机温度和满载温度也只有41℃和52℃。值得一提的是,该卡的超频性能非常出色,我们成功将其超频至925MHz/4400MHz,性能提升幅度在15%以上。
超频能力和静音效果出色。
用料一般。
699元
景钛HD 4860采用了4+1相核心与显存分别供电的设计,每相核心供电搭配了3个“一上两下”的MOSFET。由于采用的是55nm制程工艺,因此该卡使用了4热管、直吹式的散热器,GPU的待机温度和满载温度分别为47℃和68℃,温度控制得不错。并且散热器风扇的默认转速只有34%,静音效果很好。
待机温度 |
47℃ |
满载温度 |
68℃ |
超频后的频率 |
710MHz/3040MHz |
核心频率 |
750MHz |
显存频率 |
3000MHz |
显存类型 |
GDDR5/512MB/256-bit |
接口类型 |
DVI+HDMI |
3DMarkVantage Performance | |
基准测试得分 |
P8436 |
另外该卡的BIOS设定了超频上限,如果仅使用驱动控制面板调节的话,只能超频至710MHz/3040MHz。而目前Radeon HD 4860尚未被Rivatuner等软件识别,无法通过第三方软件进行超频,因此在这种情况下该卡的超频幅度有限——这并不代表该卡的超频极限。
静音效果出色。
BIOS有超频限制。
799元
近,双敏频繁推出基于AMD图形芯片的新品,无极HD4860 DDR5 V1024小牛版(以下简称“无极HD4860”)就是一款搭载了GDDR5显存的新品显卡。无极HD4860采用非公版设计,具备3+1相分离式供电设计,每相核心供电搭配了4个MOSFET,属于较好的供电方案。
待机温度 |
44℃ |
满载温度 |
64℃ |
超频后的频率 |
830MHz/4400MHz |
核心频率 |
750MHz |
显存频率 |
3600MHz |
显存类型 |
GDDR5/512MB/256-bit |
接口类型 |
DVI+VGA+HDMI |
3DMarkVantage Performance | |
基准测试得分 |
P8966 |
无极HD4860的接口为DVI+VGA+HDMI,设计比较丰富,针对了不同的用户需求。由于预设显存频率高于同类型产品,因此该卡的默认3D性能较好。同时,还可以将它超频至830MHz/4400MHz,性能提升比较明显。
性价比和3D性能较高,散热能力较好。
附件较少。
799元
双敏无极HD4750 DDR5 V1024小牛版(以下简称“无极HD4750”)采用3+1相核心与显存分别供电的设计,每相核心供电搭配3个MOSFET,核心频率与显存频率分别为750MHz和3200MHz。该卡依旧采用了奇梦达IDGV51-05A1F1C-40X显存,显存数量为8颗,组成512MB/128-bit规格。
待机温度 |
42℃ |
满载温度 |
54℃ |
超频后的频率 |
830MHz/4000MHz |
核心频率 |
750MHz |
显存频率 |
3200MHz |
显存类型 |
GDDR5/512MB/256-bit |
接口类型 |
双DVI+HDMI |
3DMarkVantage Performance | |
基准测试得分 |
P6808 |
尽管没有采用热管散热器,但得益于40nm制程工艺,该卡的GPU发热量很低,GPU待机温度和满载温度只有42℃和54℃。而且散热器的默认转速只有全速的32%,静音效果很好。
功耗控制出色,GPU发热量低,静音效果不错。
超频能力较差。
699元
作为核心AIB,迪兰恒进也在第一时间推出了名为HD4750 星钻512M、针对国内用户的Radeon HD 4750显卡。HD4750 星钻512M采用了3+1相分离式供电设计,使用了全封闭电感+英飞凌低阻抗MOSFET+日本化工固态电容,进一步保障了稳定性。
待机温度 |
35℃ |
满载温度 |
48℃ |
超频后的频率 |
880MHz/4400MHz |
核心频率 |
750MHz |
显存频率 |
3200MHz |
显存类型 |
GDDR5/512MB/128-bit |
接口类型 |
DVI+HDMI |
3DMarkVantage Performance | |
基准测试得分 |
P6828 |
相比其它显卡使用3个甚至更多的接口,该卡只具备DVI+HDMI接口,这避免了接口过多、容易“打架”的情况发生。该卡散热器的风扇尺寸达到了9cm,默认转速也只有全速的37%,静音效果很好。该卡的超频能力也不容小觑,我们将它超频至880MHz/4400MHz,性能有明显的提升。
静音效果和超频能力较好。
产品附件不够丰富。
699元
迪兰恒进HD4860 星钻512M(以下简称“HD4860”)使用了迪兰恒进HD4890 星钻512M的PCB,并在PCB上做了一定简化——主要省略了一个外接6Pin接口和一相核心供电,并使用了非热管散热器,因此性价比很高。HD4860采用了3+2相核心与显存分别供电的设计,并搭配日本化工固态电容+三洋SEPC电容。
待机温度 |
45℃ |
满载温度 |
68℃ |
超频后的频率 |
710MHz/3040MHz |
核心频率 |
700MHz |
显存频率 |
3000MHz |
显存类型 |
GDDR5/512MB/256-bit |
接口类型 |
DVI+HDMI |
3DMarkVantage Performance | |
基准测试得分 |
P8159 |
此外,该卡核心供电部分的MOSFET还使用了金黄色的铝制散热鳍片,在提升稳定性的同时还颇显美观。非热管散热器的散热能力并不差,该卡的GPU满载温度只有68℃,而且散热器的噪音很低。该卡的BIOS也锁定了超频上限,只能超频至710MHz/3040MHz。
使用高规格的PCB,用料较好,静音效果优秀,性价比高。
BIOS有超频限制。
799元
蓝宝石HD4890 1GB GDDR5白金版(以下简称“HD4890”)采用5+2相核心与显存分别供电的设计,每相供电搭配了2个MOSFET。稍感遗憾的是,该卡为了控制成本,全部使用的是半封闭电感。散热方面,该卡使用了四热管的直吹式散热器,散热器几乎将将整个PCB覆盖,可以有效照顾GPU之外的电路散热。8cm的PWM风扇丝毫不显吵闹,静音效果很出色。
待机温度 |
53℃ |
满载温度 |
72℃ |
超频后的频率 |
950MHz/4000MHz |
核心频率 |
850MHz |
显存频率 |
3900MHz |
显存类型 |
GDDR5/1GB/256-bit |
接口类型 |
DVI+HDMI+DisplayPort |
3DMarkVantage High | |
基准测试得分 |
H6944 |
虽然核心频率已经高达850MHz,但我们仍然将该卡的核心频率提升至950MHz,超频性能不错。值得一提的是,该卡使用了DisplayPort接口,方便了具有DisplayPort接口设备的用户,这种设计在同类产品中并不多见。
供电设计较出色,使用了DisplayPort接口。
如果使用全封闭电感会更好。
1499元
和其它Radeon HD 4750一样,蓝宝石HD4750白金版使用的也是非热管散热器。不过40nm制程工艺显著降低了GPU发热量,该卡的满载温度也只有57℃。HD4750白金版采用3+1相供电设计,搭配英飞凌MOSFET,能较好地保证显卡的稳定。
待机温度 |
34℃ |
满载温度 |
57℃ |
超频后的频率 |
900MHz/3440MHz |
核心频率 |
750MHz |
显存频率 |
3200MHz |
显存类型 |
GDDR5/512MB/128-bit |
接口类型 |
DVI+HDMI+VGA |
3DMarkVantage Performance | |
基准测试得分 |
P6823 |
从不同用户的需求出发,HD4750白金版具备了DVI+VGA+HDMI。该卡的核心超频能力不错,我们将其它的核心频率超频至900MHz,并通过稳定性测试。不过该卡的显存超频幅度有限,一旦超过3440MHz,就会立刻花屏。
核心超频能力较强,静音效果不错。
显存超频幅度有限。
699元
华硕EAH4890 FML是华硕Formula系列显卡中的高端型号,特点是用料豪华,散热能力出色。Formula系列显卡大的特点是采用了仿赛车造型设计而成的Formula散热器。Formula散热器遵循了空气动力学的原理,可以及时将风量吹向GPU以外的部分,例如显存和供电部分。该散热器还具备防尘设计,延长了使用寿命。
待机温度 |
41℃ |
满载温度 |
63℃ |
超频后的频率 |
975MHz/4800MHz |
核心频率 |
900MHz |
显存频率 |
4000MHz |
显存类型 |
GDDR5/1GB/256-bit |
接口类型 |
双DVI |
3DMarkVantage High | |
基准测试得分 |
H7288 |
该卡使用了Radeon HD 4890公版的数字供电方案,并在PCB背部安置了一颗Super ML电容,提升了稳定性。由于3热管的Formula散热器的散热性能很好,因此GPU满载温度只有63℃,这个成绩对Radeon HD 4890来说比较难得。该卡的默认频率已经达到900MHz/4000MHz,但仍然可以被超频至975MHz/4800MHz,还有一定的超频空间。
使用Formula散热器和Super ML电容,用料豪华,超频能力不错。
价格较高。
1999元
采用SPT超标量镀银工艺是七彩虹iGame4890-GD5冰封骑士5F大的特点之一,这也是七彩虹首度将SPT超标量镀银工艺引入到AMD显卡上,好处是可以进一步提升显卡的稳定性。该卡使用了iGame260/275显卡的PCB,并做了一定优化,具备6+1相分离式供电设计,是很优秀的非公版Radeon HD 4890供电方案。
待机温度 |
42℃ |
满载温度 |
64℃ |
超频后的频率 |
940MHz/4800MHz |
核心频率 |
850MHz |
显存频率 |
4000MHz |
显存类型 |
GDDR5/1GB/256-bit |
接口类型 |
双DVI+HDMI |
3DMarkVantage High | |
基准测试得分 |
H7108 |
此外,该卡还针对核心和显存设计了GVC/VVC增压开关,玩家可以分别对核心和显存增压进行超频。在增压状态下,我们将该卡超频至940MHz/4800MHz,性能提升较明显。由于使用的是3热管、双风扇设计,因此GPU的满载温度只有64℃。
SPT镀银工艺、做工出色。
加压后超频能力没有显著提高。
1499元
和GDDR3显存相比,GDDR5显存在数据传输频率以及带宽上有无可比拟的优势。更高的数据传输频率,可以有效降低显卡在数据传输时的瓶颈,提升显卡性能,甚至降低PCB布线难度。如果用简单的数据来表述的话,256bit显存位宽的Radeon HD 4850显卡,采用1986MHz的GDDR3显存,显存带宽为63.5GB/s;而采用GDDR5显存的Radeon HD 4870显卡,在256bit位宽下,Radeon HD 4870利用数据传输频率高达3600MHz的GDDR5显存,显存带宽轻松突破115.2GB/s,远远超过Radeon HD 4850。
除了高数据带宽带来的诱惑外,GDDR5的强大性能可以让采用128bit显存位宽的中端显卡焕发活力,比如Radeon HD 4770和Radeon HD 4860。它们都采用GDDR5显存来达到以往中高端甚至高端显卡才可企及的显存带宽。Radeon HD 4770在128bit显存位宽下采用数据传输频率为3600MHz的GDDR5显存,显存带宽为57.6GB/s—这也是256bit位宽下1800MHz GDDR3显存的带宽成绩。因此我们看到Radeon HD 4770甚至Radeon HD 4750在大部分测试环境下的3D性能比采用256-bit/GDDR3显存的Radeon HD 4830还要好,足见GDDR5显存带来的性能提升。同时,更低的显存位宽会让显存布线更容易,降低了PCB设计的难度,甚至仅仅需要四层PCB就可以完成制造—这无疑对降低显卡整体售价和提升产品竞争力有明显帮助。
另一方面,GDDR5显存还有不错的超频性能。以主流的奇梦达“-40X”GDDR5显存为例,它的额定频率为4000MHz。但在不少环境中,它可以被超频至4800MHz,超频幅度达到了20%。
不过,我们也必须清醒地意识到高显存带宽对显卡3D性能的影响是有限的。例如本文Radeon HD 4870和Radeon HD 4850的测试,前者的显存带宽几乎是后者的一倍,但终带来的性能提升也只有15%左右。可以这么认为,高显存带宽是让显卡3D性能更上一层楼的助推剂,但如果要让3D性能翻番,仍然需要借助全新的GPU和更先进的核心架构。